前一天在极越车内直播,第二天又为大模型工具“打call”,百度CEO李彦宏无缝衔接。4月16日,他花了约一个小时讲解百度最新发布的AI开发工具,再度吐槽开源模型落后。像往年一样,百度众高管在Create大会上秀数据、讲功能、谈未来,但行业格局已大不一样。
2023年3月,百度抢先发布文心大模型及产品文心一言,同年10月拿出最新版文心大模型4.0,一年时间文心一言用户超2亿。竞争对手的动作也不慢,月之暗面异军突起,Sora表现震撼,文心一言AI应用老大的位置则遭到威胁。李彦宏说这一年百度开发AI原生应用踩了坑,交了学费。而当日百度以95港元在港交所开盘,收盘时股价94.15港元。
三个工具
上午9点多,李彦宏开讲,《人人都是开发者》的题目和台下的开发者和科技爱好者的适配度很高。
“过去,开发者用代码改变世界;未来,自然语言将成为新的通用编程语言,你只要会说话,就可以成为一名开发者,”李彦宏强调,“未来开发应用就像拍个短视频一样简单。”
基于上述判断,百度上新了“开发工具”:针对智能体开发的AgentBuilder、针对AI原生应用开发的AppBuilder,以及各种尺寸的模型定制工具ModelBuilder。
李彦宏认为,智能体可能是未来每一个人最近、最主流的大模型使用方式。百度升级的文心智能体平台上有3万多个智能体被创建、5万多名开发者和上万家企业入驻。
智能体方面的进展也是瑞达恒研究院经理王清霖关注的内容,“具有更广泛的发展前景,可以应用于C端的各种场景进行内容生成。由于这种模式的使用门槛低、场景多,可以兼顾工作与日常、个人与企业,并且可以涉及到很多业态的多个环节,看起来是更具有发展潜力的,只是如何商业变现是挑战”。
AppBuilder是用来开发AI应用的,开发需要三步:给应用起名、在角色指令中描述具体要求、到工具组建中把代码解释器加进来,帮助运算。ModelBuilder可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调SFT。
演示这个功能时,李彦宏向小度询问了一系列问题,包括新闻、日程安排等,“看起来是跟同一个在交流,其实背后调用了不同的模型”,有的是文心大模型4.0,有的是基于ERNIE Lite的精调模型。
看不上开源
“我们可以根据需要,兼顾效果、响应速度、推理成本等各种考虑,裁剪出适合各种场景的更小尺寸模型,并且支持精调和post pretrain(一种预训练模型的迁移学习方法)。这样通过降维裁剪出来的模型,比直接拿开源调出来的模型,同等尺寸下,效果明显更好,同等效果下,成本明显更低。”李彦宏进一步说,“大家以前用开源觉得便宜,其实在大模型场景下,开源是最贵的。所以开源模型会越来越落后。”
这不是他第一次吐槽开源大模型。据报道,李彦宏近日在内部讲话中表示,大模型闭源是有真正的商业模式的,是能够赚到钱的,最终才能聚集算力、聚集人才。
巧合的是,本月阿里云通义千问披露了最新开源进展,开源320亿参数模型Qwen1.5-32B,此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数6款大语言模型。阿里云相关人士告诉北京商报记者,上述大模型均已升级至1.5版本。此次开源的320亿参数模型相比通义千问14B开源模型,在智能体场景下能力更强,相比通义千问72B开源模型,推理成本更低。
李彦宏也强调了成本,“通过这种大小模型的组合调度方式,小度完成了‘换脑行动’,装上AI原生操作系统DuerOS X,相比全部使用文心大模型的旗舰版,响应速度提升2倍,成本下降99%”。
其实,大小模型组合不是百度独有。“今天很多开源的软件给的是百亿(级别的)模型,跟ChatGPT不能比,但是在企业内部够用的情况下,它的部署成本可以从原来的千万美元降到千万元甚至百万元的级别。我觉得,这就真正达到了‘把大模型拉下神坛’的目标。”360创始人周鸿祎在2023年8月说。
认知和落地
另一个总会占据百度Create大会不小篇幅的业务是出行。李彦宏是在谈及多模态大模型上提到驾驶的。在他看来,“多模态大模型,或者说文字、图片、语音、视频等多模态的融合,是基础模型非常重要的长期发展方向,是通往AGI(人工通用智能)的必经之路。视觉大模型最大的应用场景是自动驾驶”。
“李彦宏的认知没有问题,但认知正确不代表能顺利落地,”文渊智库创始人王超告诉北京商报记者,“百度在人工智能的积累和开局不错,但目前大规模商业化的能力欠缺。”
2023年百度营收1345.98亿元,较2022年增长9%,非公认会计准则下净利润287亿元,较2022年增长39%。根据百度电话会议透露的信息,受益于通用人工智能和基础模型,百度2023年四季度云业务产生6.56亿元收入,这个数字在2024年全年将增长到数十亿元。
换一个角度看数据。2023年12月百度App月活6.67亿,该数字在2023年6月是6.77亿。
来自QuestMobile的数据显示,在AIGC(人工智能生成内容)领域,2024年1月,抖音的豆包、百度的文心一言、昆仑万维的天工是国内月活跃用户规模排名前三的App,当月月活分别是1756.9万、1212.5万、801.4万。用户超2亿,那月活数据呢?北京商报记者就文心一言用户数据采访百度相关人士,其表示“未对外公布”。
2023年3月,百度抢先发布文心大模型及产品文心一言,同年10月拿出最新版文心大模型4.0,一年时间文心一言用户超2亿。竞争对手的动作也不慢,月之暗面异军突起,Sora表现震撼,文心一言AI应用...[详细]
4月16日,中亦科技公布2023年年度报告,报告期内,公司实现营业收入14.01亿元,同比增长5.78%;归母净利润1.46亿元,同比增长3.34%;扣非净利润1.43亿元,同比增长1.36%;基本每股收益1.46元...[详细]
4月16日,川大智胜披露了深交所就公司2023年年报发送的问询函。此次年报问询函向川大智胜提出了十多个问题,包括要求公司说明连续多年营业收入及净利润下滑、2023年主要产品毛利率下滑的具体...[详细]