价格战凶猛 AI小模型狂飙

1.jpeg

小模型一定是更容易实现价值的。

  AI小模型大爆发,成为AI巨头的新角力赛场。

  大模型价格战“卷生卷死”,投入了巨额资金的AI企业,亟需在商业故事上再进一步,最近纷纷祭出了自家低成本、易部署的小模型,新一轮较量拉开。

  先是HuggingFace发布了SmolLM - 135M、360M和1.7B,仅使用650B个token进行训练,性能却超过了Qwen 1.5B、Phi 1.5B。

  隔日,Mistral AI和英伟达联合发布Mistral NeMo,被称为“Mistral AI最佳小型模型”,易于使用,可以直接替代任何使用Mistral 7B的系统。

  就在同一天,OpenAI下场“血拼”,推出了GPT-4o的迷你版——GPT-4o Mini,称这款新模型是“功能最强、性价比最高的小参数模型”,并将其作为展示模型,替换了GPT-3.5的网页版“台前”位置。

  苹果也不甘示弱,与OpenAI同日发布了DCLM小模型,并且发布即开源。苹果ML小组研究科学家Vaishaal Shankar说“这是迄今为止性能最好的真正开源的模型”。

  这些模型参数小、占内存少,在特定场景中,经过精调后使用效果可以媲美大模型,成为性价比之选。

  “小模型一定是更容易实现价值的。”IBM中国数据与人工智能首席架构师徐孝天在接受21世纪经济报道记者采访时表示:“一批专业小模型配合agents实现业务流的整合,功能和经济性上都会更加可行。”

  在AI生成式模型战场上,迭代速度极快,可能今天的“最好”,马上就会被明天的新版本打败,“历史纪录”不断被颠覆重写。“模型更新太快,都不好评判,前脚有厂商说自家是‘最大最好的’,后脚就有另外一家说自己是‘最小最好的’。”人工智能行业资深观察人士告诉21世纪经济报道记者,人工智能模型眼花缭乱,AI企业要想跑通商业故事,必须十倍、百倍努力。


产品图.jpg

赞 (0)
上一篇 2024年11月25日 09:22
下一篇 2024年11月25日 09:22