DeepSeek 作为中国人工智能领域的后起之秀,其技术进展引发了广泛关注和讨论。然而,DeepSeek 是否被过度吹捧仍然值得客观分析。
DeepSeek 的确取得了不错的成果,不过可能没有媒体宣传和人们想象中那么重大。它的轰动性主要在于以低廉的成本达到了前沿模型相近的效果,但是并没有显著超越其它前沿模型,而它的低廉成本也是存在争议的,可能是因为进行了蒸馏训练等原因导致成本被低估了。
DeepSeek 之所以被广泛宣传有以下两点原因:
一、在 ChatGPT 等国外大型语言模型领先国内的情况下,我国急需一个突破性成果来建立信心和民族自豪感。
二、国内民众由于众所周知的原因无法访问国外前沿模型,导致民众误认为 DeepSeek 遥遥领先于国外的模型,也就是说大多数民众存在信息滞后的情况。
总体而言,DeepSeek 的技术创新值得肯定。然而,由于一些技术以外的因素,围绕其的宣传可能存在夸大成分。因此,业界应保持理性,客观评估其技术实力和市场影响。