首页 独家 > 正文

首批国产大模型“飞入寻常百姓家”,“多模之战”从拼参数走向拼应用

2023-09-01 07:28:49 文汇

▲用户可通过 SenseChat 官网注册使用 " 商量 " 大模型。


(资料图)

大模型的落地应用迎来关键节点。首批国产大模型产品昨天获批面向全社会公众开放服务,其中上海 3 家、北京 5 家率先上线,这意味着国产大模型从上一阶段的 " 出生潮 " 向新一阶段的 " 应用潮 " 迈出重要一步。

大模型 " 飞入寻常百姓家 ",对用户意味着什么?对国产大模型企业又意味着什么?多位专家表示," 多模之战 " 正从拼参数走向拼应用,能建立起真实用户调用和模型迭代之间的 " 飞轮效应 ",有利于真正服务国人。

首批 8 家获批,上海占据 3 席

昨天,首批国产大模型产品获批面向用户开放服务,包括商汤科技 " 商量 "、百度 " 文心一言 "、智谱 AI" 智谱清言 " 等。

百度最早于昨天凌晨宣布 " 文心一言 " 向全社会开放的消息,意味着用户无需内测邀请码,就能直接体验相关服务。与 3 月 16 日最早开启的内测版本相比,目前 " 文心一言 " 已迭代到 3.5 版本。" 即使与 3.0 版本相比,新版本的训练速度提升了 2 倍,推理速度提升了 17 倍,模型效果累计提升超过 50%。" 一位百度内部人士透露。

▲百度昨天凌晨宣布 " 文心一言 " 向全社会开放的消息

在首批 8 家通过《生成式人工智能服务管理暂行办法》备案的大模型公司中,记者注意到,上海地区占据 3 席,分别是 MiniMax 的 "ABAB"、上海人工智能实验室的书生通用大模型、商汤的 " 商量 "。其中," 商量 " 于今年 4 月推出,是国内最早的基于千亿参数大语言模型之一,在向 C 端开放之前,其已在金融、医疗、汽车、地产、能源、传媒、工业制造等 B 端行业有了不同程度的落地应用。另两家大模型公司也都具备极强的技术实力。书生通用大模型体系由上海人工智能实验室发布,其中 " 书生 · 浦语 " 同样是千亿级参数的大语言模型。而 MiniMax 则是 " 新面孔 ",是 2021 年 12 月在沪成立的一家大模型初创公司,今年 6 月刚刚获得超 2.5 亿美元的 A 轮融资,此次其自研的通用大模型 "ABAB" 获批面世。

北京地区除了百度外,抖音的 " 云雀 "、百川智能的 " 百川 "、智谱华章旗下的 " 智谱清言 " 以及中科院旗下的 " 紫东太初 " 也同样获批。有消息称,广东、安徽等省市的 3 家大模型公司也将很快面世。

" 多模大战 " 将迎来应用层竞争

国产大模型 " 批量上市 ",意味着 " 多模大战 " 正从上一阶段的 " 生出来 ",走向 " 用起来 " 的新阶段。

步子迈得快一点的百度、抖音、商汤等企业,短短一天内已实现了手机端、网页端都可体验的 " 速度感 "," 文心一言 " 甚至已迅速登顶苹果商店的免费 App 排行榜,从中可以窥见用户的热情。而 " 智谱清言 " 则在网页端和 App 端的基础上搭建了小程序,还给出了赛程设计、写作文等不同语境下的案例以及广告撰写、短报编写等不同对话参考。

▲ " 智谱清言 "8 月 31 日全面开放。

在多位专家看来,除了商用之外,大模型面向普通人开放是一个重要的里程碑。数字商业分析师郝智伟认为,大模型在 C 端的应用可以被认为是赋能工具、生活助手,是 " 重要的效率提升工具 ",可帮助用户更快速处理各类文本和信息、做 Excel 表格、进行简单的编程等,让生活和工作变得更便利。

而对于企业来说,大模型 " 飞入寻常百姓家 ",则意味着更庞大规模的中文语料投喂和更丰富的原生应用场景。C 端是大模型普及的基础,大模型只有走向全社会开放,才能完成大数据意义上的语料累积,达成深度学习并实现个体赋能。百度创始人、董事长兼首席执行官李彦宏就表示,当 " 文心一言 " 向数以亿计的互联网用户大规模开放服务后,就能够获得大量真实世界中的人工反馈,这将进一步改进基础模型,并以更快速度迭代,创造更好的用户体验。据悉,百度还将开放一批经过全新重构的 AI 原生应用,让用户充分体验生成式 AI 的理解、生成、逻辑、记忆四大核心能力。

郝智伟认为,面向全社会应用后,也意味着 AI 大模型开始从拼参数发展到拼应用,进入大规模可复制的产业落地阶段,下一阶段或将迎来应用层竞争。

备案制帮助大模型在实践中解决问题

大模型从出生到迅速在 C 端落地,也体现出监管的思维之变——从过去的 " 事后监管 " 变成了现在的 " 边跑边管 "。

根据国家网信办 4 月 11 日发布的《生成式人工智能服务管理办法(征求意见稿)》,企业利用生成式人工智能产品向公众提供服务前,应当向国家网信部门申报安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。7 月,国家网信办联合国家发展改革委、教育部、科技部等 7 部门公布《生成式人工智能服务管理暂行办法》,并从 8 月 15 日起实施。从一众大模型公司获批的时间来看,这离《办法》实施只隔了半个月。

有分析人士认为,采用 " 备案制 " 而非 " 审核制 ",为技术和产业可持续发展创造了良好的土壤,有助于大模型先行落地应用,在实践中发现问题、解决问题。

据不完全统计,目前中国 10 亿以上参数规模的大模型已有近 80 个,大模型备案机制的建立和首批开放,从一定程度上建立起真实用户调用和模型迭代之间的 " 飞轮效应 "。在复旦大学管理学院信息管理与商业智能系讲师李文文看来,开放公众服务后,企业下一阶段需要更加关注解决大模型的局限性问题,包括幻觉、生成内容的时效性、数据安全隐患等,从而以更合规的方式健康成长。

中经传媒智库专家张书乐认为,在政策扶持和产业加快升级的背景下,强大的中文语境和针对中文语境研发的大模型,有利于真正服务国人,并建立起自己的护城河。

作者:徐晶卉

编辑:施薇

* 文汇独家稿件,转载请注明出处。

关键词:

责任编辑:宋璟

返回首页
相关新闻
返回顶部