价格战凶猛 AI小模型狂飙_数字科技

　　AI小模型大爆发，成为AI巨头的新角力赛场。

　　大模型价格战“卷生卷死”，投入了巨额资金的AI企业，亟需在商业故事上再进一步，最近纷纷祭出了自家低成本、易部署的小模型，新一轮较量拉开。

　　先是HuggingFace发布了SmolLM - 135M、360M和1.7B，仅使用650B个token进行训练，性能却超过了Qwen 1.5B、Phi 1.5B。

　　隔日，Mistral AI和英伟达联合发布Mistral NeMo，被称为“Mistral AI最佳小型模型”，易于使用，可以直接替代任何使用Mistral 7B的系统。

　　就在同一天，OpenAI下场“血拼”，推出了GPT-4o的迷你版——GPT-4o Mini，称这款新模型是“功能最强、性价比最高的小参数模型”，并将其作为展示模型，替换了GPT-3.5的网页版“台前”位置。

　　苹果也不甘示弱，与OpenAI同日发布了DCLM小模型，并且发布即开源。苹果ML小组研究科学家Vaishaal Shankar说“这是迄今为止性能最好的真正开源的模型”。

　　这些模型参数小、占内存少，在特定场景中，经过精调后使用效果可以媲美大模型，成为性价比之选。

　　“小模型一定是更容易实现价值的。”IBM中国数据与人工智能首席架构师徐孝天在接受21世纪经济报道记者采访时表示：“一批专业小模型配合agents实现业务流的整合，功能和经济性上都会更加可行。”

　　在AI生成式模型战场上，迭代速度极快，可能今天的“最好”，马上就会被明天的新版本打败，“历史纪录”不断被颠覆重写。“模型更新太快，都不好评判，前脚有厂商说自家是‘最大最好的’，后脚就有另外一家说自己是‘最小最好的’。”人工智能行业资深观察人士告诉21世纪经济报道记者，人工智能模型眼花缭乱，AI企业要想跑通商业故事，必须十倍、百倍努力。