欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 文旅 > 游戏 > 【AI资讯汇总】2025年01月第二周

【AI资讯汇总】2025年01月第二周

2025/4/4 2:36:33 来源:https://blog.csdn.net/LHW0621/article/details/145092206  浏览:    关键词:【AI资讯汇总】2025年01月第二周

目录

开源推理AI模型Sky-T1横空出世,训练成本不到 450 美元

​NVIDIA 与联发科联手推出迷你 AI 超级计算机

智谱GLM-4-9B模型幻觉率仅1.3%,在全球大模型评测中夺魁

谷歌AI平台再升级,AI Studio和Gemini团队转入DeepMind加速研发


开源推理AI模型Sky-T1横空出世,训练成本不到 450 美元

关键看点

  1. Sky-T1-32B-Preview发布: 加州大学伯克利分校天空计算实验室的研究团队NovaSky发布了开源推理AI模型Sky-T1-32B-Preview。
  2. 低成本训练: 该模型的训练成本不到450美元,显著低于以往同等性能模型的数百万美元训练成本。
  3. 开源数据和代码: NovaSky团队不仅发布了模型,还公开了用于训练的数据集及必要的训练代码,使模型可从头开始复制。
  4. 性能表现: Sky-T1在多个关键基准测试中表现优异,与OpenAI的o1早期版本相媲美。
  5. 未来展望: NovaSky团队计划继续开发更高效的模型,保持强大的推理性能,并探索先进技术。

详情

  • 模型特点: Sky-T1-32B-Preview是首个真正的开源推理模型,能够有效进行自我事实核查,避免常见陷阱,但在得出解决方案时可能需要更长时间。
  • 训练成本降低: 训练成本的大幅降低主要得益于合成训练数据或由其他模型生成的训练数据的应用。
  • 初始训练数据来源: NovaSky团队借助阿里巴巴的QwQ-32B-Preview推理模型生成Sky-T1的初始训练数据,之后对数据进行“整理”,并利用OpenAI的GPT-4o-mini将数据重构为更易用的格式。
  • 训练资源: 使用8个Nvidia H100 GPU机架训练320亿参数的Sky-T1大约需要19个小时,参数数量大致对应模型解决问题的能力。
  • 性能测试: Sky-T1在MATH500(一组“竞赛级”数学挑战)上的表现优于o1的早期预览版本,还在一组来自LiveCodeBench(一种编码评估)的难题上击败了o1的预览版本。然而,Sky-T1在GPQA-Diamond上的表现不如o1预览版,后者包含博士毕业生应掌握的物理、生物和化学相关问题。
  • 未来计划: NovaSky团队表示,Sky-T1仅是他们开发具有高级推理能力的开源模型的起点,未来将专注于开发更高效的模型,保持强大的推理性能,并探索先进技术,进一步提高模型在测试时的效率和准确性。

链接

开源推理AI模型Sky-T1横空出世,训练成本不到 450 美元


​NVIDIA 与联发科联手推出迷你 AI 超级计算机

关键看点

  1. Project DIGITS发布: NVIDIA 在2025年国际消费电子展(CES)上推出了名为 “Project DIGITS” 的新型个人 AI 超级计算机。
  2. 高性能与小体积: 该设备体型仅有迷你机的大小,但性能高达千万亿次,售价约为3000美元,计划于2025年5月开始发售。
  3. 目标用户: 主要针对从事机器学习研究的小型企业、研究机构以及教育机构,帮助他们降低 AI 开发成本。
  4. 市场战略: 可能是 NVIDIA 进军500亿美元 PC 和笔记本芯片市场的重要一步。

详情

  • 设备规格: Project DIGITS 搭载了一颗与联发科共同设计的超级芯片 “GB10”,集成了 Blackwell GPU、20核心 Arm 架构的 Grace CPU、128GB 的高带宽内存(HBM)以及4TB 的固态硬盘(SSD)。
  • 性能与成本: 该设备的性能高达千万亿次,但售价相对较低,仅为3000美元(约合21998元人民币),计划于2025年5月开始发售。
  • 目标市场: 该设备主要面向那些从事机器学习研究的小型企业、研究机构以及教育机构,这些用户通常没有足够的资金来建设数据中心或购买云计算资源,而这款机器能够满足他们的基础需求。
  • 市场分析: Melius Research 的分析师 Ben Reitzes 在研究报告中指出,NVIDIA 推出如此高性能却价格相对低廉的产品,确实让人感到震惊。他认为,Project DIGITS 可能是 NVIDIA 进军500亿美元 PC 和笔记本芯片市场的重要一步,未来或许能够整合更多资源,甚至实现自有 Windows 系统的可能。

链接

​NVIDIA 与联发科联手推出迷你 AI 超级计算机


智谱GLM-4-9B模型幻觉率仅1.3%,在全球大模型评测中夺魁

关键看点

  1. 智谱GLM-4-9B模型在全球评测中表现卓越:在基于HHEM-2.1-Open评估体系的测试中,智谱AI的GLM-4-9B模型以98.7%的事实一致性率和100%的回答率在全球85个大语言模型中脱颖而出。
  2. 极低的幻觉率:GLM-4-9B模型的幻觉率仅为1.3%,显著低于行业巨头OpenAI的GPT系列和Google的Gemini系列模型。
  3. 技术突破:这一成果标志着中国大语言模型在降低幻觉率方面取得重要进展,提升了AI应用的可靠性和准确性。
  4. 国际影响力:GLM-4-9B模型的出色表现不仅体现了智谱AI在模型研发上的技术实力,也为中国AI企业在国际舞台上赢得了更多话语权。

详情

  • 测试背景:大语言模型的“幻觉问题”一直是人工智能领域的关键挑战。幻觉问题指的是模型生成的内容与事实不符,影响了模型的可靠性和实用性。
  • 评估体系:测试基于HHEM-2.1-Open评估体系,该体系对大语言模型的事实一致性和幻觉率进行了严格的评估。
  • 测试结果:在参与评估的85个大语言模型中,智谱AI的GLM-4-9B模型以98.7%的事实一致性率和100%的回答率获得最高分,幻觉率仅为1.3%。
  • 行业影响:这一突破性成果不仅体现了智谱AI在模型研发上的技术实力,也为全球AI领域树立了新的标杆,提升了中国AI企业在国际舞台上的话语权。
  • 未来展望:GLM-4-9B模型的出色表现将为智谱AI赢得更多关注,推动AI技术的进一步发展,特别是在提升模型可靠性和准确性方面。

链接

智谱GLM-4-9B模型幻觉率仅1.3%,在全球大模型评测中夺魁


谷歌AI平台再升级,AI Studio和Gemini团队转入DeepMind加速研发

关键看点

  1. 团队整合:谷歌宣布将AI Studio团队和Gemini系列模型开发API的团队整合进DeepMind部门。
  2. 加速研发:这一变动旨在通过加深团队间的合作,加速人工智能产品从研究到实际开发的转化过程。
  3. 战略调整:Google DeepMind由谷歌的DeepMind团队和谷歌研究院(Google Brain)团队合并而成,成为谷歌许多AI产品(包括Gemini系列模型)的核心研发部门。
  4. 未来展望:谷歌期望通过优化团队结构,提升人工智能研发的效率,并推动新的工具和API的开放和创新。

详情

  • 背景:谷歌为了进一步加速人工智能的发展,宣布将进一步精简其构建人工智能服务、平台和工具的团队。
  • 宣布时间:2025年1月9日,谷歌AI Studio开发者平台产品负责人Logan Kilpatrick在社交平台X上发布帖子,透露这一变动。
  • 团队整合:AI Studio团队和Gemini系列模型开发API的团队将正式转投谷歌DeepMind旗下。
  • 目的:这一变动旨在通过加深团队间的合作,加速人工智能产品从研究到实际开发的转化过程。
  • DeepMind背景:Google DeepMind成立于2023年,是谷歌为推动人工智能领域创新而进行的战略调整的一部分。DeepMind由谷歌的DeepMind团队和谷歌研究院(Google Brain)团队合并而成,成为谷歌许多AI产品(包括Gemini系列模型)的核心研发部门。
  • 使命不变:尽管团队的结构发生了变化,但他们的使命将保持不变,依然致力于推动人工智能技术的发展与创新。
  • 支持声音:谷歌DeepMind团队工程师Jaana Dogan在X文章中强调,这一调整将有助于DeepMind以“以前无法实现的方式”向公众开放更多资源,包括更好的API、更丰富的开源资源和更多的工具。
  • 预期效果:谷歌的这一调整意味着AI Studio和Gemini团队将能更加紧密地与DeepMind合作,提升人工智能研发的效率,并推动新的工具和API的开放和创新。
  • 未来展望:随着这一战略调整的深入,谷歌的人工智能平台将更加注重用户需求,提供更多功能、更便捷的开发工具和更开放的资源,预计将为全球开发者带来更多创新机会,进一步推动人工智能技术的普及和应用。

文章链接

  • 谷歌AI平台再升级,AI Studio和Gemini团队转入DeepMind加速研发

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词