文/周雄飞
几座城镇,一些河流,外加7个岛屿,组成一个七角星图案。
这些描述,是世界已知最古老的地图之一——古巴比伦地图的内容。早在公元前6世纪,人们已经开始制作简易地图,来记录和展示住处周边的地理和位置信息。
历史车轮滚滚向前,地图逐渐成为人类文明发展中最重要的工具之一,其功能和形态也多次转变。作为国内用户常用的地图软件——百度地图,在过去18年中,也经历了非常大的迭代和升级。
随着AI时代的到来,以百度为头雁的大厂,正在推动地图行业进行又一次的进化。
2023年百度世界大会上,百度发布了一系列AI原生应用,包括新搜索、文库、网盘、GBI、新地图等多款产品。按照百度创始人、董事长兼首席执行官李彦宏的介绍,这些AI原生应用,都基于文心大模型进行了全面的重构,真正用AI原生思维“重想、重做”,希望能拓展大家的想象力。
其中,重构后的百度地图成为全球首个AI原生地图应用,全新推出“AI向导”,能与用户进行“真人交流”,并在理解需求的基础上,智能调用众多地图功能及服务,快捷准确地给出解决方案,比如帮助用户规划路线、提供地点决策建议,以及服务预定等等。
这些也正符合李彦宏对于AI原生应用的定义——能用自然语言交互、能充分理解、生成、逻辑、记忆,并且每个应用的交互都不超过两级菜单,一步到位。
除了交互升级之外,在导航基本功方面,百度地图近期全新升级的城市车道级导航3.0,可以提供更加清晰和立体的导航指引,提升驾驶安全和体验。
同时,百度地图还落地了行业首个地图生成大模型,显著加速车道级地图规模量产,既让更多用户可以体验升级版的导航服务,也能帮助车企降低自动驾驶研发过程中的成本,实现“低成本用好图”。
在大模型行业如此内卷、谁都不知道“标准答案”的当下,百度地图是如何实现这些创新的?这个问题与“大模型行业会走向何处”,同样值得思考。
1、离不开的地图,能变得更“聪明”吗?
方涵是一位自驾游爱好者,地图导航是他最常用的手机应用之一。作为深度用户,他对地图无疑有着更高的期待,比如当他要开车去某个新发现的露营地,再顺路接个朋友,并且不想走高速时,只要对着地图说出需求,就可以帮他规划好最佳的出行方案。
有类似需求的用户,还有很多。地图里那么多的产品能力,有时甚至需要用户点个六、七次,才能准确满足像方涵这种相对精细化的出行需求。
这些功能,之所以容易被用户忽略,主要是因为它们一般不会出现在地图的首页,而是被隐藏到二级,乃至更深的菜单层级中。换句话说,地图软件拥有丰富的功能,但用户并不知道这些功能被“藏”在哪里,真到用时“找不着”。
“在过去十八年中,百度地图开发了几千个功能,包括导航、公交、打车、订酒店和足迹等等。如何让我们的用户需求和这些丰富的功能联动起来,打造更加便捷的交互体验,是我们一直在思考的问题。”百度副总裁尚国斌对连线Insight表示。
虽然如此,但对于广大用户来说,地图服务毫无疑问是生活出行的刚需。那么,如何解决以上这些问题,在业内看来或许会成为地图行业下半场的新机遇。对此,以百度为代表的大厂已经行动起来。
2、融合大模型,让地图真正变成“AI向导”
大模型,已成为千行百业追逐的技术热潮。
随着OpenAI发布ChatGPT、引发一声惊雷后,国内科技及互联网行业随即展开了一场有关大模型的竞逐赛。就目前来看,百度、腾讯、阿里巴巴和华为都已入局,国内已经发布的大模型也已超过120个,10亿参数规模以上的大模型就已经有79个,真可谓是“百模大战”。
但百模大战中,究竟什么才是获胜关键?谁更有机会?李彦宏曾表示,模型本身是不直接产生价值的,基于基础大模型开发出来的应用才是模型存在的意义。
作为国内较早布局大模型之一的大厂,百度也凭借在地图领域的多年积累,率先打响了应用的“第一枪”。
据李彦宏介绍,重构的百度地图之所以被称为AI原生地图,最明显的特点,就是具备多轮自然语言交互能力,能提供更接近“真人交流”的体验。
举个例子,当连线Insight对百度地图AI向导说出“我要去杭州大厦,还要去杭州运河大剧院接个人,顺便在路上给车充个电”的要求后,百度地图不仅能快速理解这些口语化的表达,给到精确的路线方案,甚至主动推荐附近适合停车的地方。如果描述不清楚也没关系,AI向导也会主动追问,确保理解和满足用户的真实需求。
另一方面,以往地图上很多需求,用户要么很难找到入口,或是操作起来步骤太多,AI重构的百度地图,也已尝试解决。
正如百度世界2023现场李彦宏演示的那样,当问到百度地图“帮我推荐离百度大厦、中国美术馆和望京SOHO距离都差不多的餐厅,要适合安静聚会”时,AI向导就会根据需求,智能推荐符合需求的一些餐馆。
紧接着,李彦宏又给出新的需求“帮我换个西餐厅,并且对比下前两家的环境”,AI向导又快捷地给出结果,并且用更直观的图片来对比餐馆的环境。当他选择其中一家餐厅,并要求给出能在指定时间到达目的地的行程规划,以及打车需求后,AI向导也精确地满足了这些需求。
此外,据百度官方介绍,基于大模型深度学习的能力,这个“AI向导”不仅具备人格化的数字人形象,还拥有自主学习的能力,会越用越聪明, 越用越懂你。连线Insight也抢先体验了下,只要上传五张图片,就可生成自己的专属数字人形象。
在业内看来,基于这些交互形态的进化,不仅可以让百度地图成为理解用户所思所想的“AI向导”,提升出行和决策效率,同时随着AI向导的广泛使用,源源不断的真实反馈也会帮助百度地图构建起更好的问答数据飞轮,以便在不断的学习中,越来越聪明好用。
更为重要的是,作为国民地图,百度地图率先行业实现了以上这些能力,也让大众对AI大模型助力下的原生应用有了更深的了解和信任,进而推动整个地图行业的更快发展。
毫无疑问,这与百度对行业的深度观察,以及持续不断的底层技术积累密不可分。
3、“AI向导”是如何“炼”成的?
大模型落地,不是一蹴而就的。
众所周知,通用大模型虽然具备推理和涌现的能力,但如果知识库中没有太多的行业数据,硬是通过简单训练来当行业大模型使用,很有可能闹出笑话。比如企业如果仅是通过接入通用大模型API来做自身的大模型,最后的验证结果,往往会与行业真实情况差距甚大。
更为保险的做法,就是基于通用大模型和特定行业的知识库数据,来构建预训练大模型,以便更好地对行业问题进行推理和预测。但在这个过程中,行业大模型也有可能给出不够精确的结果,从而无法实现真正的降本增效。
与所有行业大模型一样,这些问题,同样不可避免会出现在地图AI原生应用中。
首先,嘈杂环境下语音识别和语义理解的难度,尤其是难以过滤无效语义,已成为行业公认难题。打个比方,如果用户说话断断续续的,或者一个字说了很多遍,又或者问询的用户不止一人、中途有人打断等等,这些都对“AI向导”的理解能力提出了更高的要求。
对于地图软件来说,首先需要解决用户自然语言开放式输入的理解难题。 为此,百度地图在重构过程中,基于文心大模型的强化学习与训练方式,使得其“AI向导”的理解和推理能力实现了显著提升。据百度介绍,AI向导可以在理解复杂语句语义,甚至局部出现输入错误或者错乱时,依然能给出较为理想的答案。
其次,在地图出行决策中,给出答案并不够,还需要避免出现不准确的答案。
由于地图行业的特殊性,无论是过去还是现在,都需要精准满足用户需求,像路线、POI 点这些信息,“失之毫厘”可能就会“差之千里”。这也意味着大模型给出的任何结果,都需要建立在准确的前提上。反之,如果给出不准确,或者模棱两可的答案,就会直接影响到用户的使用体验。
对此,百度通过把地图领域知识进行整理和清洗,再转化为供大模型训练的行业知识库数据,可以让其学会地图领域的专有知识。同时,百度地图还通过构建大模型插件,来保证像实时交通计算等专业问题的准确解答。
按照百度官方的介绍,这些大模型插件就像一个个专业领域的知识“仓库”,大模型在处理专业领域的问题时,就可以基于对用户问题的理解,灵活判断需要借助哪些插件的能力,从而针对性解决用户的问题。
这个过程,就像人们要用手机解决点餐、计算等问题时,打开App Store选择一个个特定应用软件一样。在这些插件和文心大模型的支持下,百度地图就好比长出了眼睛、嘴巴和手臂,能看、能说、能听和能行动,成为百度口中的“AI原生地图智能体”。
就目前来看,这场有关大模型的技术革命还在继续,行业中的众多玩家们都还在探索落地应用的更多可能性。这其中,也可以看到百度正通过自身的行动,持续给整个大模型乃至人工智能等多行业,带来一些新的思考和启发。
正如李彦宏说的那样“我们即将进入一个AI原生的时代,进入一个人机通过Prompt来交互的时代,未来将由你生成!未来由我们一起生成!”
(应受访者要求,文中方涵为化名。)