
2月28日,国内AI明星企业深度求索(DeepSeek)为期五天的“开源周”活动正式收官。
“开源周”都发布了什么?
自2月24日启动以来,DeepSeek“开源周”发布的五个项目涵盖了从计算、通信到存储的各个方面。
2月24日:首个开源的代码库为Flash MLA,这是针对Hopper GPU优化的高效MLA解码内核,针对可变长度序列作了优化,目前已投入生产。
2月25日:宣布将DeepEP向公众开放。DeepEP是用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。
2月26日:宣布开源DeepGEMM。DeepGEMM 是一个专为简洁高效的 FP8 通用矩阵乘法(GEMM)设计的库,具有细粒度缩放功能,如 DeepSeek-V3 中所提出。它支持普通和混合专家(MoE)分组的 GEMM。该库采用 CUDA 编写,在安装过程中无需编译,通过使用轻量级的即时编译(JIT)模块在运行时编译所有内核。FP8GEMM库,为V3/R1训练和推理提供支持。
2月27日:一次性开源了两个工具和一个数据集,分别是DualPipe、EPLB(专家并行负载均衡器)以及训练和推理框架的性能分析数据。此外,DeepSeek还在Github上详细讲解了DeepSeek-V3和R1模型背后的并行计算优化技术。
2月28日:在官方X账号宣布开源3FS,它是所有Deepseek数据访问的助推器。
中信证券研报指出,DeepSeek“开源周”有望进一步催化AI+主题。DeepSeek陆续开源5个代码库,以完全透明的方式与全球开发者社区分享他们在探索通用人工智能(AGI)领域的进展。DeepSeek的低成本、高性能特性带动AI渗透率全社会加速,随着开源代码的逐步发布,有望进一步带动各个行业应用的加速发展,以及算力端需求的增长。
Deepseek API重新开放充值,并下调价格
在经历长达19天的暂停充值后,DeepSeek于2月25日正式恢复API开放平台的充值功能。此次重启伴随着价格体系的结构性调整:
deepseek-chat基于的V3模型调用价格为每百万输入tokens 2元,每百万输出tokens 8元;
deepseek-reasoner基于的R1模型调用价格为每百万输入tokens 4元,每百万输出tokens 16元。
2月26日,DeepSeek进一步推出错峰优惠定价策略。DeepSeek宣布,每日优惠时段为北京时间00:30-08:30,其余时间按照标准价格计费。在此期间,API调用价格大幅下调:DeepSeek-V3降至原价的50%,DeepSeek-R1更是低至25%。
来源丨21世纪经济报道、每日经济新闻、财联社、DeepSeek微信公众号
SFC
本期编辑 黎雨桐

相关文章:
DeepSeek宣布:活动正式收官03-01
上海成立“十五五”规划专家咨询委员会,龚正市长与8位专家座谈交流02-28
从配角到“C位”,2元产品能否助涪陵榨菜扭转业绩颓势?02-28
我国冬小麦春季田间管理大面积展开02-28
GPT-4.5发布了,主打“情商”高02-28
国家医保局印发《口腔类医疗服务价格项目立项指南(试行)》02-28
AI医疗攻坚深水区:万亿诊疗场景突破“不可能三角”02-28
GPT-4.5发布了,最突出的是情商02-28