有中国“AI教父”之称的百度创始人、董事长兼首席执行官李彦宏,4月16日出席了在深圳召开的Create 2024百度AI开发者大会,并作了《人人都是开发者》的主题演讲。
在演讲中,李彦宏不单预测说,“未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者”,还分享了百度基于大模型开发AI原生应用的具体思路,指出MoE、小模型和智能体是值得关注的三个方向,“这是我们百度根据过去一年的实践,踩了无数的坑,交了高昂的学费换来的。”
在大会上,李彦宏正式发布了文心大模型4.0的工具版。他还透露,截至目前文心一言用户数已经突破2亿。“文心大模型已成为中国最领先、应用最广泛的AI基础模型。”
得益于文心大模型的强大,开发者通过文心4.0降维裁剪出来的更小尺寸模型,要比直接拿开源模型调出来的模型,同等尺寸下效果明显更好;同等效果下,成本明显更低。“大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。所以开源模型会越来越落后。”
“只要会说话,就可以成为一名开发者”
李彦宏在主题演讲中表示,过去一年中,跟很多创业者、开发者交流后,感觉大家都处在一种“FOMO”状态,“也就是Fear of Missing Out,既兴奋,又害怕错过”。
他理解大家的这种情绪,同时也相信,大模型和生成式AI,将彻底改变开发者这个群体。
“过去,开发者用代码改变世界;未来,自然语言将成为新的通用编程语言,你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。”
因为有了强大的基础大模型,有了很多低门槛,甚至零门槛的开发工具,开发者的生产力大大提高了。
比如,基于文心大模型的智能代码助手Comate,不仅支持100多种语言和所有主流IDE平台,可以推荐代码、生成代码注释、查找代码缺陷、给出优化方案,还可以深度解读代码库、关联私域知识生成新的代码。上岗一年多,Comate已经走入了喜马拉雅、三菱电梯、软通动力等上万家企业,生成的代码采纳率达到了46%,百度每天新增的代码中,已经有27%是由Comate生成的。
“今天,你不会写代码,也可以做出一个AI应用;不用编程,也可以做出一个智能体。AI正在掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。”
“文心大模型已经成为中国最领先、应用最广泛的AI基础模型”
百度自主研发的大模型文心一言自去年3月16日首发,到今天是一年零一个月的时间。从现场一段真人真事的视频中可以看到,文心一言正在改变更多人的工作和生活。
据李彦宏透露,“文心一言的用户数突破了2亿,每天API的调用量也突破了2亿,服务客户数或者说企业达到了8.5万,利用千帆平台开发的AI原生应用数超过了19万。”
支撑文心一言的基座模型,就是文心大模型。过去一年,它经历了从3.0版本到3.5,再到4.0版本的进化。文心4.0在理解、生成、逻辑、记忆四大能力方面,均达到了业界领军水平。近几个月来,文心大模型在代码生成、代码解释、代码优化等通用能力方面实现了进一步的显著提升,达到国际领先水平。
“文心大模型已经成为了中国最领先、应用最广泛的AI基础模型。不仅如此,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。也就是说,客户原来一天调用1万次,同样成本之下,现在一天可以调用100万次。”
“开源模型会越来越落后”
李彦宏表示,因为有了最强大的基础模型文心4.0,“我们可以根据需要,兼顾效果、相应速度、推理成本等各种考虑,剪裁出适合各种场景的更小尺寸模型,并且支持精调和post pretrain。这样通过降维剪裁出来的模型,比直接用开源模型调出来的模型,同等尺寸下,效果明显更好;同等效果下,成本明显更低。”
“大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。所以开源模型会越来越落后。”他说。
“视觉大模型最大的应用场景是自动驾驶”
面向未来,李彦宏认为,多模态大模型(文字、图片、语音、视频等多模态的融合),是基础模型非常重要的长期发展方向,是通往AGI的必经之路。百度在这些领域有着长期投入,并将及时更新大模型的最新进展。
另外,对于视觉大模型,李彦宏有一个“非常不一样的判断”:视觉大模型最大的应用场景是自动驾驶。
“百度在这个方向上是最好的,是自动驾驶的全球领导者,我们不只训练AI如何生成视频,更训练AI理解真实世界发生的事情并预测未来。”
“基于超过1亿公里的、中国复杂城市道路测试里程数据,百度训练出来了Apollo视觉感知大模型。它具备检测、跟踪、理解、建图四大基础能力。这让百度拥有了更智能、适应性更强、更安全的自动驾驶方案。”
“开箱即用”三大工具:AgentBuilder、AppBuilder、ModelBuilder
大语言模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。
李彦宏在现场分享了一些基于大模型开发AI原生应用的具体思路和工具。他笑言,这是百度根据过去一年的实践,“踩了无数的坑,交了高昂的学费换来的”。
“首先是智能体开发工具AgentBuilder。”李彦宏说,智能体可能是未来离每个人最近、最主流的大模型使用方式,基于强大的基础模型,智能体可以批量生成,应用在各种各样的场景。
今天,每一个商家、每一个客户,都能在百度拥有专属的智能体。整个过程完全不需要编程,通过类似提示词的信息输入,和简单的几步操作调优,就能迅速生成一个智能体,成为“7X24小时在线的金牌业务员。”
“索菲亚商家智能体上线以来,有效线索成本下降了30%。也就是说,它获得一个有效客户,如果过去的成本是100块,现在只需要70块了。”
“AppBuilder是目前最好用的AI原生应用开发工具”。在AppBuilder上面,百度提前封装和预置了开发AI原生应用所需的各种组件和框架,大幅降低开发门槛。
“最快只需三步,开发者就可以用自然语言开发出一个AI原生应用,并且能够便捷地发布、集成到各种各样的业务环境中。”李彦宏说。
各种尺寸的模型定制工具ModelBuilder则是更适合专业开发者使用的工具,“它可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调,这样就能达到更好的效果。”
李彦宏现场展示了教育行业作文批改的案例,经过数据处理、模型精调后的“作文批改助手”,不仅可以拥有更专业的老师点评思维、做到格式遵循,而且相比未精调模型,精调后的模型打分与真实的老师点评分数更为接近。
“这三个工具,都代表了先进生产力。”李彦宏最后不无自豪地说道。
采写:新快报记者 郑志辉
编辑:乐丹娜
校对:蔡佳