- N +

DeepSeek第五弹炸裂收官!开源并行文件系统,榨干SSD全部带宽

DeepSeek第五弹炸裂收官!开源并行文件系统,榨干SSD全部带宽原标题:DeepSeek第五弹炸裂收官!开源并行文件系统,榨干SSD全部带宽

导读:

直播吧月日讯据西媒报道阿劳霍对续约问题态度暧昧他在巴萨的未来不确定阿劳霍与巴萨的合同年夏天到期他在年美洲杯的比赛中受伤最近才刚刚复出克雷西发自凹非寺量子位公众号开源周今日正式收...

直播吧1月8日讯据西媒relevo报道,阿劳霍对续约问题态度暧昧,他在巴萨的未来不确定。阿劳霍与巴萨的合同2026年夏天到期,他在2024年美洲杯的比赛中受伤,最近才刚刚复出。

克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

DeepSeek开源周,今日正式收官!

内容依旧惊喜且重磅,直接公开了V3和R1训练推理过程中用到的文件系统

DeepSeek第五弹炸裂收官!开源并行文件系统,榨干SSD全部带宽

具体来说,包括以下两项内容:

  • Fire-Flyer文件系统(简称3FS,第三个F代表File),一种利用现代SSD和RDMA网络的全部带宽的;
  • Smallpond,基于3FS和DuckDB构建的轻量级数据处理框架。

划重点就是,3FS可以把固态硬盘的带宽性能利用到极致,表现出了惊人的速度:

  • 180节点集群中的聚合读取吞吐量为6.6TiB/s;
  • 25节点集群中GraySort基准 的吞吐量为3.66TiB/分钟;
  • 每个客户端节点的K ache查找峰值吞吐量超过40GiB/s。

V3和R1中训练数据预处理、数据集加载、嵌入向量搜索和KV Cache查找等工作,3FS都立下了汗马功劳。

网友们表示,3FS和Smallpond为AI数据处理设定了新基准,将改变数据处理的游戏规则。

对于AI来说,这就像从自行车升级到了高铁。

返回列表
上一篇:
下一篇: