新闻动态

你的位置:欧宝综合体育官网 > 新闻动态 > 中国工程院院士点评DeepSeek

中国工程院院士点评DeepSeek

发布日期:2025-02-04 10:22    点击次数:137

1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。

DeepSeek究竟厉害在哪里?今日,中国工程院院士、清华大学计算机系教授郑纬民及多位AI圈人士在与新浪科技沟通中,指出了DeepSeek其成功出圈的关键所在。

在郑纬民看来,DeepSeek通过自研的MLA架构和DeepSeekMOE架构,为其自身的模型训练成本下降,起到了关键作用。他指出,“MLA主要通过改造注意力算子压缩了KVCache大小,实现了在同样容量下可以存储更多的KVCache,该架构和DeepSeek-V3模型中FFN层的改造相配合,打造了目前公开最大的稀疏MoE层,这成为DeepSeek训练成本低最关键的原因。”

对此,你怎么看?(新浪科技)



上一篇:没有了