原点上的失败:十倍执行力提升,可以换来一个成功的AI产品吗?

原点上的失败

干事都会失败,但根因不同,求解的方式也就不同。

如果单是智能音箱,这事已经过去了,再提起来意义不大,但问题是不单过去,现在我们很多时候仍然可能在重复这种原点上的失败,比如具身机器人、垂域大模型等。

最近和中关村智用人工智能研究院一起做了一场公开课,课上我把这种差异概括为:

这是跑马探地和打呆仗的区别。

这是两个完全不同的维度。

前几天写了篇文章《为什么说这些倒腾AI的方式会把自己搞死》,陆续收到一些反馈,从反馈中最直观的感受是大家快速把AI导入产品或项目的迫切心情。这种心情加上某些推波助澜的文章可能是坏事的前奏,因此这里再做一点提炼和总结。

原点上的失败

干事都会失败,但根因不同,求解的方式也就不同。

AI里面的很多失败是原点上的失败。

原点上的失败是说,除非天下掉奇迹,否则打开始那天就不可能成功,和努力没关系。

前两天琢磨事发起了一个AI碰撞局,当时我提了个问题:如果执行力提高10倍,那改变智能音箱所需要面对的局面么?

大家想了想基本都认为,完全不影响,还是现在这样。

确实,执行力提高10倍,天气这类技能的数目可能膨胀10倍,但根本不可能改变产品自身的用户价值和市场空间,也就不可能改善使用深度。

这很像一条无限接近限定值(比如6分)的曲线,可以无限提升,但永远不可能及格。

为什么会这样呢?

因为约束了语音交互新价值空间的关键因素早早就在那里了。

反倒是当事人没那么愿意看、懒得看或者就上头了。

这些要素在原点上确实是可以列出来并且做判断的。

比如使用情景、物理空间、智能程度、市场空间、后端变现可能性、投入回报周期等确实预先定义了一个可能边界。

除非AI突变,否则在一个限定周期,投入越多,执行力越强,死得越快。

池子就那么大,投喂,然后缺氧,鱼就死很大一批。

不是智能音箱没用,而是过渡的预期后就会变成原点上的失败,比如期望它迅速成为普遍入口。(池子小,少几条鱼一样活挺好)

产品要基于成熟技术,毕竟苹果都基于成熟技术。

当年做智能音箱拔高预期相当于预期AI会迅速无限提高,这种用未来的预期做产品规划的方式,就会导致产品总是快一步。

这一步往往就是生死界限。

如果单是智能音箱,这事已经过去了,再提起来意义不大,但问题是不单过去,现在我们很多时候仍然可能在重复这种原点上的失败,比如具身机器人、垂域大模型等。

为什么在AI领域原点上的失败变得普遍?

一个可能的原因是互联网对我们影响过深,而AI与互联网迥异,要求我们重塑认知价值的思维模式。

过去30年的是互联网的30年。

企业家、KOL、媒体共同构建了一套互联网的价值认知体系,这深刻地影响了每一个人。

现在主导的驱动力及其特征变了(从互联网到AI),但思维惯性之下就很容易沿用过去的判断方法。

比如美国和日本就是很不一样的两种环境,用同一种行为模式可能就危险。

最近和中关村智用人工智能研究院一起做了一场公开课,课上我把这种差异概括为:

这是跑马探地和打呆仗的区别。

试错成本不同衍生的方法论就不同。

一种需要快速试错,另一种就必须深掘场景才能见水。

单点、极致、口碑、快、一针捅破天等在AI这儿似乎完全颠倒了,看起来要调过来。

而如果追究为什么这样的底层逻辑,那需要回到新技术的基本特征。

互联网关键的是链接,是网络效应,所以就容易迅速铺开,每个点上并不带来特别大的改变。这就催生对快的追求。

人工智能关键的是智能,是理解概念和自主判断的能力。这种能力显然对场景的改变越多价值越大。

新技术领域必然是技术自身的特征决定了匹配它的方法论,而非相反。

从这个视角再回看智能音箱大战就会更理解这为什么是原点上的失败。

在你本来应该创造价值的点上,没有深挖(深挖也有其它问题,但是两回事),而是迅速谋求不存在的网络效应或者后端价值,那钱可不就打了水漂。

一个地儿2米没出水,你挖八百口井该没有水还是没有水。

再延伸一点就是和互联网匹配的干就完了的情绪非常值得警惕。

试错成本低的时候确实谋定后动的重要度会被淡化,勇猛点快跑没准就碰上了。

但打井这事,有水没水是不可能碰出来的。

如果说互联网可以只用20%的精神头思考,然后一路狂奔即可,没准也能干成社交网络。

那人工智能则至少需要百分之五十,否则大概率十死无生,大概率沙漠打井。

混沌状态下的底层逻辑

混沌状态下没有手册性的方法论。

挖铜矿手册很关键,因为大致被研究明白了,按手册干好就是专业。

AI应用的魅力就在于没人明白,这时候宣称有手册性方法论的大概率是骗子。

正因为没人明白,所以才有机会。

很多人现在可能比2000年的马云还懂互联网,但你绝不可能再做出大的互联网产品了。

这时候必须探求底层逻辑,它们可能不严密但自洽,能勾画出一个轮廓,辅助避免原点上的错误。

很巧的是琢磨事的AI碰撞局上正好有这么个例子(周伟明同学提供的)

假如你想做一个法律的大模型,那为了看看这地儿能不能挖出水,预先的判断是什么呢?

1.  场景上是你预想完整覆盖什么样的场景,这个场景本身的价值是什么样?

a.  是能完整取代一个初级律师,还是初级律师的辅助工具;

b.  如果变成信息提供的辅助工具,那和现有产品有多大差分,是不是就提高个10%~20%?

2.  技术上是模型到底能干到什么程度?什么样的人能干到什么程度?你的人能干到什么程度?你有多少资源(数据资金等)做这事?

3.  出错的概率是多少?出错的效果是否能承担?

4.  ……

不列全了,核心是AI用在这个场景下会弄死你的并且短期不可能改变的点有么?这是要预先列的,也是可以预先列出来的。

这种分解是产品定义之前要琢磨的,每个都比较生死攸关。

列出来后反倒是寻找答案不难。很多时候一手体验和公开信息也能有个大致的答案。

尤其是现在的智能在你设定场景的新体验的程度是很容易测试出来的。

这时候需要注意的是:AI使用成本极低,不能被某些新词绕进去比如RAG这类,要整一手的体验。

大家可以仔细想想,RAG其实更大可能是提高你效率,而不是具体某个场景的体验。

形象讲是如果你自己一次构建足够全的prompt,然后大模型的智能程度不够,加了RAG一样不够。

从外往里看,和模型与参数保持距离

做产品其实很忌讳把技术的希望当成可以构建产品特征的现实。

写售前方案倒是可以,至少可以看着比较高大上。

产品方要关注技术(大模型等)的智能高度,但要关注的不是细节。

在智用研究院的公开课上,我打了一个比方:

英国人发明了坦克,实际上则是德国人在闪电战里把坦克威力发挥到极致,用得最好。(陈春花老师聊天的时候提到的,特别适合这个情景)

构想闪电战的人是要了解坦克的,但肯定不能和坦克的工程师学习怎么设计闪电战。

坦克的工程师是看不见闪电战的。

这是两个完全不同的维度。

媒体可以把新技术名词、新模型谁大谁参数多作为一种噱头来制造热点。

做产品的时候就是回到一手体验,回到场景,整清楚它现在可以干什么,不可以干什么。

概念性技术不适合用来构建产品,除非你特别特别有钱。

但考虑智能的拔高还是会有个过程,所以机会敞口会有个次序。

大致是先从纯粹数字、幻觉破坏作用小的领域扩展到具身的、幻觉作用大的领域。

这里尺度的判断非常关键,不要忘了Google Glass、自动驾驶干多少年了!

打深井的模式下,原点已经是决胜点。

小结

一个完整可供参考的,也还算自洽的底层逻辑框架在:AI的脉络,非共识时刻的认知价值,这里不重复了。

最后想说的是这类框架对于混沌状态下做应用是有帮助的,但作用也有限的。可以帮助避免原点上的错误,也可以在挖井的时候,对最初十米有点帮助。但既然是挖井,后面90米必然需要在现场的泥土里摸爬滚打,和现场的持续反复。给个手册照着做,产品就成功了,人就发财了,在这个时间点这么宣称的真的是骗子。


参照文章:

从1到10:AI产品和互联网产品的核心差异

第九生命:从文明限度的角度看AI

AI上国内团队好像被甩开了?差钱?差人?

AI的进化:从间断平衡到终极复制

本文来自微信公众号:琢磨事(ID:zuomoshi),作者:老李话一三

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年4月29日
下一篇 2024年4月30日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日