一、前言
2025年乙巳蛇年,DeekSeek彻底网络爆火,为更多国人熟知,在国外更是早先几月就引起Ai界轩然大波,对Ai界硬件显卡厂商英伟达和一众外国Ai资本和科技公司造成很大冲击。Deepseek公司同产品名,早在2023年7月已成立,由知名私募巨头幻方量化孕育而生 ,专注于开发先进的大语言模型(LLM)和相关技术。
于2024年1月5日,发布第一代大模型DeepSeek LLM(包含670亿参数);5月7日,发布DeepSeek-V2;9月5日,合并 DeepSeek Coder V2 和 DeepSeek V2 Chat ,推出 DeepSeek V2.5;24年12月26日晚,正式上线DeepSeek-V3首个版本并同步开源;全部开源DeepSeek LLM 7B/67B Base和DeepSeek LLM 7B/67B Chat,供研究社区使用。DeepSeek LLM 67B Base在推理、编码、数学和中文理解等方面超越了Llama2 70B Base。DeepSeek LLM 67B Chat在编码和数学方面表现出色,尤其展现了显著的泛化能力;另外它还精通中文:DeepSeek LLM 67B Chat在中文表现上超越了GPT-3.5。上线后一举追平主流大模型甚至闭源AI跑分,引爆外网AI界;25年1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费