作者|陶然 编辑|魏晓
坐在电脑前,蓝媒君又想起之前跟同事那些“过于乐观”的讨论。
大模型刚出现时,这届打工人常常担忧“AI会不会取代人类”,一方面对AI的潜力充满期待,希望它能带来效率的革命,减轻工作负担;另一方面也担心AI的崛起可能会威胁到人类的工作机会,引发失业之类的社会问题。
待到产业高速发展一年之后,蓝媒君却依然坐在工位上,时不时抱怨“AI怎么还不能替我上班”、“为啥一天天的我还这么累”,如此如此。
无奈,但就是现实。
去年,大模型技术刚刚崭露头角,打工人害怕AI的高效能会取代他们的位置,让人类在职场上变得可有可无。这种担忧并非无的放矢,AI确实在某些领域展现出了超越人类的能力,比如数据分析、图像识别和信息检索。
然而,一年过去了,AI产业的高速发展并没有带来预期中的大规模失业潮,反而轮到打工人开始抱怨AI的进展速度不够快,希望能有更多的智能工具来分担工作压力,好让人从中抽出更多时间去生活。
尽管AI技术取得了可观的进步,但显然还没有达到完全替代人类工作的水平。AI在某些特定任务上可能比人类做得更好,但在理解复杂的人类情感、处理模糊不清的指令以及进行创造性思维等方面,仍然有很大局限性。
什么样的AI是真正被需要的?比起过于超前的担忧,这届打工人更期待出现一套即插即用的“生产力工具”,在AI能替人类上班之前,先在日常工作中帮上忙。
纵览一众抢抓应用的AI公司,商汤率先抓住了这个需求,把大模型的AI能力快速转化为更贴近场景化的应用工具。2024年开年,一套自然语言理解+代码+办公大模型的生产力工具组合产品迅速落地。
打工人的福音,要来了?
AI上班搭子
几乎是专门为这届打工人需求定制的,商汤推出了一套名为“小浣熊家族”(Raccoon:
)的大模型应用。
注意,别被这个听起来不够“行业黑话”的名字误导,小浣熊家族的全称是Raccoon-Another comprehensive co-pilot Navigator,直译为“全面协作导航系统”,带入到人工智能语境,自然指向基于 AI 的应用助手。
商汤自家的大模型,给这个名字提供了一份更全面细致的解答:
“comprehensive” 强调了其全面性,意味着这个工具或服务覆盖了广泛的功能或领域;”co-pilot” 暗示了辅助或合作的意味,表明这个工具或服务旨在与人类用户协作,提供帮助或增强能力;”Navigator” 则表明了其导航或指导的功能,特别是在复杂或未知的环境中引导用户到达目标。
目前,这套AI应用已经上线了两项具体功能:代码小浣熊和办公小浣熊。
和打工人关系最密切的,自然是后者。比起上班GPT、打工大模型,Raccoon这个名字无疑更具新意和设计感。
既然是AI工具,想必很懂AI。蓝媒君这次当一回甲方,直接把需求抛给办公小浣熊:先整理一下过去一年中,全球曝光度较高的十家AI公司,然后做详细的多维对比。
小浣熊很快生成了回复,并附上了公司对应简介。细看名单,OpenAI、谷歌、微软、亚马逊等海外明星公司悉数入围,国内BAT三家大厂也挤进了榜单之中。
当然,仅仅是信息汇总显然不够看,任何统计都需要一套完整的评判标准做支撑。由于可能涉及隐私问题,小浣熊并不会与云端服务器共享实时数据,但它依然从五个维度给出了评判大模型公司的标准:
从技术研发到产品应用,再到商业化成果甚至合作伙伴和员工状况,评价体系相当周全。
而后,用户甚至还可以要求小浣熊可以将先前对话中所有的公司信息、打分和评价汇总,自动制作成统计表输出。
对于已有的数据,办公小浣熊则可以一键读表,按需处理数据后自动生成统计图。
蓝媒汇这里同样上传一份有模拟数据的文档,办公小浣熊在正确读取并分析数据后,直接将表格转化为了26款APP在一季度内平均使用时长的箱型统计图。
值得一提的是,除了能够与用户进行自然语言交流,整理数据、生成文档等功能外,“办公小浣熊”还具备学习用户使用习惯的能力,它能够根据用户的偏好进行自我调优,打造个性化的私人办公助理。
半自动上班的时代已经出现,打工人接下来可以期待一下全自动AI了。
在“商量”中进化
如果说办公小浣熊的推出,让商汤用增量在AI办公场景中抢占先机,那同期更新的商汤日日新大模型4.0版本(SenseNova 4.0),则可被视作公司在原有大模型能力的存量中进一步升级,朝着AI变现的方向继续探索。
而其中最具代表性的,自然是商量大语言模型(
)。作为国内最早推出的几款通用大模型之一,商量目前已经进化到了可以比肩GPT-4的水准,并实现了对GPT-3.5的全面超越。
比起垂直领域的生产力工具,商量大模型更为全知全能,不管是春日里的百卉含英还是城市间的车水马龙,有问必答。
最近北方的天气阴晴不定,蓝媒君的同事看着楼下绿意迟迟的树丛抛出一个问题:都四月了,天津今年啥时候能看看花?
很好,问到理工男的知识盲区了,正好商量就在手边,把工作和生活中各类零碎的问题抛给它,已经成了蓝媒君办公时的一种习惯。
时间确实是现在这个时间,但今年比较低的气温或许影响了天津的花期。
对于这种问题,大模型显然比人更愿意“较真”,充分调用知识库给出了一份相当全面、专业的解答,回答稍显用力过猛。
看起来,在三次元赏花确实还需等些时日,但商汤日日新大模型的另一项AI功能“秒画”(
),却可以让用户提前过一过眼瘾。
再来一张意式风情街:
尽管风格上还是较为传统的油画质感,但在文字理解和生成图片速度、质量上,秒画已经完全达到了主流AI生图软件及大模型的应有水准。
公开资料显示,商汤日日新大模型目前已经覆盖了面向办公场景的商量语言大模型-数据分析版本、面向医疗场景的医疗版本“大医”、 面向自动驾驶及工业场景的商量多模态大模型,和面向创作创意场景的秒画文生图大模型等一众热门场景应用。
整体上看,拥有更全面的知识覆盖、更可靠的推理能力,更优越的长文本理解力及更稳定的数字推理能力,还支持跨模态交互的日日新大模型4.0版本,已足够让商汤跻身国产大模型赛道的前排。
结语
同过去一年先造概念再推技术的模式相比,2024年的大模型赛道明显进入了一段更为务实的周期。
风向由概念转向应用,信奉实用主义并推动技术落地,靠AI应用谋求变现,成为今年的行业主流。
而商汤大模型体系的整体升级,值得关注的点也并非参数层面的跨越,而是升级后大模型技术,有了更为务实的AI应用场景、产品需求,比如办公、比如医疗,比如日常中的泛知识库问答。
跑通从技术到应用的路径后,更为务实的AI显然有了更为可期的创新可能。
来源|AI蓝媒汇 作者|陶然