2023年,大模型技术在全球科技界掀起了一场风暴,引发了科技巨头们的激烈角逐。这一年,大模型不仅重新定义了人工智能的边界,还催生了跨行业技术革新。
根据IDC的预测,全球AI计算市场规模将从2022年的195亿美元急剧增长至2026年的346.6亿美元,其中生成式AI市场预计增至109.9亿美元。尤其在中国市场,人工智能市场规模预计将超264亿美元。
其实大模型并非诞生于2023,只不过在这一年开始为大众所熟知。一方面得益于其理解能力、推理能力和表达能力的迭代推进,使得大众对大模型的智能涌现表现出惊喜。比如OpenAI旗下的ChatGPT大模型,一经推出,就捕获了全球AI创业者的目光,以至于很多人开始憧憬通用人工智能时代的来临。另一方面得益于资本和创业者的疯狂跟进,导致了大模型创业热,各类产品层出不穷,用户对AI大模型的认知理解又进化了一步。
国内外大模型纷纷入局 全球从未如此共振
2023年3月15日凌晨,OpenAI发布了GPT模型的最新成果——GPT-4。与前代相比,GPT-4在性能上的显著提升,尤其是在处理文本和图像混合输入方面,让业界惊呼OpenAI的领先优势实在太大,其高级性能和多模态输入能力可以说加速了全球大模型竞争的热循环。
太平洋的AI大模型之风吹到了国内,国内科技圈可以说掀起了一场人工智能海啸,众多科技巨头和创业公司竞相涌入到这场技术革命浪潮里。BAT、360、科大讯飞、商汤等公司纷纷推出自家的大模型产品,他们的目标很明确:AI奇点时刻来临,这是一个大的技术变革时代,必须得抓住。
2023年3月16日,耕耘AI多年的百度带头推出了国内首个大语言模型“文心一言”,谁知道发布会一开始股价就应声而跌,可能在OpenAI的新产品冲击下,资本对百度不太看好,但第二天百度股价迅速反弹,也算是给国内AI大模型创业者打了一针强心剂。紧接着,3月29日,360集团发布了360智脑大模型1.0版本,展示了其在搜索应用场景中的实用性。
4月份见证了国内多个重要大模型的发布:王小川的“百川智能”、商汤科技的“SenseNova”、以及昆仑万维的“天工”3.5、阿里巴巴“通义千问”……5月6日,科大讯飞推出星火大模型,其董事长刘庆峰更是公开承诺要在年底之前实现对ChatGPT的超越。
随后,腾讯等其它科技公司也纷纷展示了各自的大模型。在这里作者得植入个插曲,即腾讯虽然是后续才对外推出自家混元大模型的,但其在助力大模型商业应用场景方面几乎是走在各大公司前列。比如在前年举行的腾讯Light技术公益创造营活动中,腾讯是最早支持创业者利用AI大模型构建公益项目的互联网大厂。
在这场AI大模型创业热中,不仅传统科技巨头积极布局,一众“明星创业者”也陆续加入战局。年初,美团联合创始人王慧文带来“AI英雄榜”,在资本寒冬中拿到了热乎乎的融资。随后,创新工场的CEO李开复、前搜狗掌门人王小川、京东前AI大佬周伯文等业界大咖也相继加入这场AI创新竞赛。
就连国内三大电信运营商,以及诸如印象笔记、医联科技等非上市公司,也应时加入。此外,国内的顶尖高等教育机构和科研院所,如复旦大学、清华大学、哈工大、中科院等,也陆续发布了自己的大模型。
然而,随着时间推移,特别是到了五月,市场对大模型的热情似乎有所降温。ChatGPT的流量增速出现下滑,引发了业界对大模型前景不太明朗的热议。在笔者看来,其实并非如此,一方面一些尝鲜的流量确实到顶了,另一方面更重要的是ChatGPT开始开放API接口,允许外部应用的接入,也使得流量分流。不过这可以看作星星之火,已经燎原了。
模型进化 巨头致力场景扩张抢占护城河
面对雨后春笋般出现的大模型热现象,站在AI大模型良性发展的角度上来考虑,百度CEO李彦宏直言觉得纯属资源浪费,他认为:“专注于大模型本身并没有太大意义,真正的机会在于应用层面。”
这一观点也得到了市场数据的支持。SensorTower的数据显示,2023年上半年全球AI应用的下载量同比增长了114%,突破了3亿次,而收入更是同比增长了175%。
全球科技巨头也正在加速扩展应用场景,让AI大模型的能力从云端转化成为各种毛细血管的生产力,辐射消费生活的各个方面。
根据Valuates Reports的数据,2022年大型语言模型(LLM)市场规模达到105亿美元,预计到2029年将增长至408亿美元,期间的复合年增长率预计为21.4%。这一显著增长背后,是科技巨头们在不断拓展AI应用的场景和实际使用。
目前,无论是国际还是国内市场,各方均在积极探索AI技术的实际应用,人工智能的潮流正以前所未有的速度涌现。
2023年12月20日微软在音乐创作领域迈出了重要一步。微软通过将Suno集成到Copilot AI中,现在能够将文本提示转换为完整的AI生成音乐曲目,这包括歌词、乐器和人声。这一进展不仅为非专业音乐人开辟了创作音乐的新途径,还可以为专业音乐制作人提供灵感和辅助工具,推动音乐创作的边界。
苹果公司也不甘落后,其最新的Human Gaussian Splats技术(简称’Hugs’)展现了如何从简短的2D视频中提取3D头像。这一技术预示着视频会议真实感的提升、虚拟现实体验的丰富以及电影和游戏中创建更为逼真角色。想象一下,你的数字化身不再僵硬无情,而是可以传递情感和个性的数字化存在。
Runway的Gen-2最近新增为内容创作者带来了新的文本转语音功能,这一功能能够生成逼真的旁白和对话,同时其视频比例调整功能为视频编辑带来前所未有的灵活性,适应各种播放平台和观看设备。例如,一位旅游博主现在可以用这个工具把文字快速转换成逼真的旁白,省时省力。
而Airbnb利用AI技术提升服务质量,通过AI系统识别和阻止可能的高风险租赁,确保住宿安全和社区稳定。想象一下,一个年轻人想在新年夜通过Airbnb租房,但因为AI系统的精准分析,高风险的派对计划被提前识别并阻止。
同样,TomTom和微软合作开发的AI驱动车辆语音助手,利用Azure OpenAI实现自然对话,为驾驶者提供更直观、智能的交互体验。司机只需简单发出指令,AI助手就能提供准确的导航服务,让驾驶变得更加轻松安全。
这些例子再次证明了AI技术在不同行业中的广泛应用和转型潜力。而这些只是AI技术在不同行业中广泛应用的冰山一角。AI正以令人惊叹的速度推动多模态应用的发展,催生着AI的无界商业化浪潮。全球科技巨头们在这场激烈的竞合中共同塑造着一个全球化的AI发展图谱。
国内企业也在利用AI大模型积极融入到全球AI商圈,希望通过构建AI场景化满足其国际化的降本增效拓景能力。
例如,字节跳动新成立的AI部门Flow标志着其从“APP工厂”转型为“AI工厂”进一步加强其在人工智能领域的发展。其在海外上线了一款基于大模型的App ChitChop,相当于一个私人AI助理,包括AI创作、AI绘画、娱乐、AI学习、工作、生活等6大使用场景。
华为云的AI海外部署计划,据悉其在海外节点先行推出盘古大模型,覆盖自然语言处理、视觉识别、多模态交互、科学计算和预测分析等领域。同时,还将在计划海外节点逐步推出超过100个经过调优适配的开源大模型,涵盖自然语言处理、视频图像处理和多模态等多个类别。
阿里巴巴正在利用AI工具拓展跨境电商领域,通过提供AI制图、AI客服和AI文案等功能,支持外贸和跨境电商业务。旗下的外贸SaaS服务商小满科技,已经将AI技术融入其“OKKI”产品,实现营销获取客户、客户管理和业务数据分析的自动化和智能化。
以及百度在海外市场推出了AI社交产品“SynClub”。这款产品允许用户与专属的AI朋友进行互动,提供丰富的信息内容,涵盖娱乐和情感支持,使用户的聊天体验更加多元和深入,覆盖个人生活、感受和私密话题。
这些进展不仅显示了国内企业的国际化视野,也突显了大模型技术在商业领域的巨大应用潜力。
然而,随着AI技术的深入普及,对数据、版权和隐私安全的关注和讨论也愈发热烈。大模型技术的未来之路,在充满机遇的同时也伴随着挑战。
重大效益和巨大风险并存 AI数字治理需要全球共治
人工智能就像一把双刃剑,既带来创新和便利,也隐藏着不容忽视的风险。这些风险分布在技术层面和法律伦理层面,它们对我们的工作和生活产生深远影响。
AI技术虽然高效,但并非万能。它的决策过程有时像个“黑盒子”,我们看不清里面到底发生了什么,这在一些对错误容忍度极低的领域,比如医疗、金融、交通、制造业等领域,可能带来安全隐患。同时,存在“对抗攻击”的威胁,就像是给AI灌输错误的信息,让它做出错误的判断。
同时,随着AI技术的深入渗透,法律和伦理领域也面临着前所未有的挑战。
AI技术的泛滥应用正在挑战我们的法律和伦理边界。一方面,AI可能制造虚假身份,威胁个人金融安全;另一方面,在处理海量数据时,它可能无意中泄露隐私,甚至导致数据篡改。这种技术还可能陷我们于“信息茧房”,只接收与个人观点一致的信息,加剧社会分歧。在无人驾驶和医疗诊断等领域,AI的错误决策引发了谁来承担责任的复杂问题。此外,AI在文本挖掘时可能触发的知识产权纠纷也是法律和伦理问题的典型案例。面对这些挑战,我们需要深入理解并有效管理AI带来的各种法律和伦理问题。
正是这些风险促使了各国政府、相关研究机构等对AI安全性的广泛讨论。在AI领域,安全问题的讨论正如烈火烹油般升温。埃隆·马斯克的声音代表了一种警钟:“在我们完全理解并制定出应对高级AI的策略之前,我们需要放慢脚步。”而OpenAI内部的权力斗争,不只是一场简单的内斗,它揭示了一个更深层次的困境——商业利益与非盈利理念的拉锯战。
并且AI的风险像一个错综复杂的网络,涵盖了技术、伦理、社会等多个层面,这些挑战突显了需要全球协作和统一行动的紧迫性。
2023年7月,上海举行的世界人工智能大会汇集了逾1400位杰出人士,包括图灵奖与诺贝尔奖得主、国际知名学者及企业领袖。他们共同探索了AI的创新动向及其对产业升级的影响。特别在法治论坛上,生成式人工智能(AIGC)引发的诸多问题成为热点议题,如虚假信息处理、算法的商业机密属性、AI在法律领域的应用等。与会专家强调,面对这些挑战,全球共治AI变得尤为重要。我们需要在全球范围内合作,共同制定有效的治理策略,以确保AI技术的健康发展。
大会上的激烈讨论反映了全球范围内日益增长的对AI监管的关注度,这在全球各国的政策制定中已开始显现。
据斯坦福大学的《2023年人工智能指数报告》显示,包含“人工智能”的法案从2016年的1个增长至2022年的37个,涵盖了127个国家。今年6月,欧洲议会通过了一部专注于AI的重要法案,尤其关注生成式人工智能,标志着全球对AI的监管趋严。
国家层面的监管政策也在加强。在2023年4月28日和7月13日分别提出了促进AI创新和风险防范的措施,并发布了《生成式人工智能服务管理暂行办法》,实行包容审慎和分类分级监管。
随着全球对AI的强监管和相关政策法规的完善,大模型技术在AI领域的发展将进一步正向加速。未来几年,大模型将不再是科技圈的独家秀,它们将成为驱动各个行业深度变革的核心力量。而那些敢于接受挑战、善于利用大模型深挖用户需求和商业场景的公司,将引领这波潮流,成为AI大模型产业链最先尝到市场红利的机构。
2023年,我们已经看到了AI大模型带来的巨大生产力变革,且目睹了其应用场景在开发者的共振下正在全球各大商业领域持续拓展。向前看,2024年将是大模型技术更加璀璨的一年。
混沌时代,应用为王,劈开赛道,坚意孤行——站在AI时代的门槛上,我们是否已经准备好迎接未知,拥抱变化,共同书写人类与机器共生的全新篇章?