在AI大模型行业日益激烈的竞争中,DeepSeek再次以实际行动展示了其前瞻性的战略布局和强大的技术实力。近日,该公司不仅宣布推出一系列开源项目,还创新性地实施了错峰定价策略,引发了业界的广泛关注。
DeepSeek的开源周活动自启动以来,便持续受到业界的瞩目。在连续五天的时间里,DeepSeek相继开源了FlashMLA、DeepEP、DeepGEMM、DualPipe和EPLB等多个技术项目,以及配套的3FS分布式文件系统和Smallpond数据处理工具。这些项目覆盖了AI大模型训练和推理的多个关键环节,旨在提升计算效率、优化资源利用,并促进AI技术的广泛应用。据统计,这些开源项目在GitHub上累计获得了近2.8万颗星星,彰显了业界的认可和支持。
其中,FlashMLA能够针对不同长度的token动态调配计算资源,从而提升H800等GPU的硬件性能利用效率。DeepEP则专为专家混合(MoE)和专家并行(EP)设计,通过高效协同专家模型之间的通信,实现高吞吐量和低延迟的兼顾。DeepGEMM是一个可用于FP8精度的通用矩阵乘法(GEMM)加速库,其轻量化设计和无需编译的安装方式为用户提供了极大的便利。DualPipe和EPLB则构成了优化并行策略,分别通过双向并行算法和专家并行负载均衡器,提升了大模型的训练和推理效率。
除了开源项目外,DeepSeek还推出了错峰定价策略,进一步降低了用户的使用成本。该公司宣布,在北京时间每日00:30至08:30的夜间空闲时段,DeepSeek开放平台将提供优惠的API调用价格。DeepSeek-R1和V3版本在海外也同步推出了类似的运营策略,优惠时段的API调用价格分别降低了50%和75%,且优惠时段直接对应北京时间00:30至08:30。这意味着,伦敦时间16:30至次日00:30、纽约时间11:30至19:30的用户,都可以享受到DeepSeek官方的优惠时段价格。
这一策略不仅有助于充分利用服务器资源,还鼓励用户在非高峰时段使用服务,从而享受更经济、更流畅的服务体验。值得注意的是,此次优惠活动并没有设定明确的期限,而是作为一种长期的运营策略。
DeepSeek的错峰定价策略迅速引发了业界的热议。一方面,这一策略被视为DeepSeek在价格竞争上的又一有力举措,有可能引发其他大模型厂商的跟进和价格战。另一方面,错峰定价也被认为是一种创新的运营策略,有助于推动AI技术的广泛应用和普及。通过降低使用成本,更多的用户将有机会接触和使用AI大模型服务,从而加速AI技术的商业化和产业化进程。
事实上,DeepSeek的开源和降价策略并非孤立存在。在AI大模型行业日益成熟的背景下,越来越多的企业开始注重技术创新和生态建设。通过开源共享技术成果、降低使用成本等方式,这些企业正在共同推动AI技术的快速发展和广泛应用。而DeepSeek作为其中的佼佼者之一,其开源周和错峰定价等活动无疑为行业树立了新的标杆。
值得一提的是,尽管GPT-4.5等新一代大模型的发布引发了业界的广泛关注,但DeepSeek的开源和降价策略似乎更加贴近用户的需求和市场的发展趋势。GPT-4.5虽然在基准测试和准确度等方面有所提升,但其高昂的价格却让用户望而却步。相比之下,DeepSeek通过开源和降价策略降低了用户的使用门槛和成本,更加符合市场的实际需求和发展趋势。