未来科技
-
有了它,断网也能“纵享丝滑”
以下为嘉宾的部分观点摘要:
应用驱动发展,端侧AI逐步刚需
● 目前来看,不论国内国外端侧AI都还没有形成一个固定的生态和框架,现在所看到的这些所谓开源和推理,都还没有统一的集大成者出现。
● 云端有云端的优势,它可以快速的去做模型迭代和收敛,而且它的算力强,数据收集和训练都很方便,但云端也有一些劣势,比如云端识别要依赖于网络,如果网络不稳定,信号覆盖不到或者信号质量差,服务器处理能力不行的情况下,它的识别会非常不稳定。其次就是云端无法保证用户的隐私安全,存在泄漏风险。再就是云端的运行成本非常高,因为它要搭建,涉及到搭建服务器、升级、维护,包括便利和传输数据的传输,这无形当中都会带来非常大的成本,虽然现在互联网厂商在承担这个成本,但长期来看,会转嫁到用户身上去。 -
谷歌大模型一出闹剧,揭开中文数据荒
一、中文语料成全球数据荒重灾区
一项来自国外团队的研究结果表明,高质量的语言数据存量将在2026年耗尽,低质量的语言数据和图像数据的存量则分别在2030年至2050年、2030年至2060年枯竭。
国家基础学科公共科学数据中心主任胡良霖表示,合成数据或许能在训练大模型的过程中起到一定作用,但并不能解决中文语料训练数据匮乏的问题。
-
大模型套壳祛魅
刚刚过去的 2023 年是大模型元年,在国产大模型数量狂飙突进的同时——已经超过 200 个,“套壳”一直是萦绕在大模型头上的舆论阴云。 从年初到年末,从百度文心一言到零一万物,从…
-
用AI预测地震,靠谱吗?
科学家通过机器学习来研究断层线的“慢地震”(预示地震到来的有用指标)信号,有望能作为准确预测地震的科学依据。
与其他断层沿线的地震相比,该地区发生的六次地震的间隔时间异常规律,因此美国地质调查局的科学家非常有信心地预测,下一次类似震级的地震将在1993年之前发生。
发现第二种奇怪的地质运动的科学家们,在日本西南部进一步发现了一种被称为“慢地震”的信号。
-
苹果遭遇“开门黑”,市值一夜蒸发7660亿元
(ID:wowjiemian),作者:于浩,题图来自:视觉中国
在2024年的首个交易日,苹果股价即遭遇“开门黑”。Long为首的巴克莱银行分析师给予苹果公司减持评级,并将目标股价下调1美元至160美元,与当前的185.64美元相差不小。
苹果去年三季度营收为894.98亿美元,除iPhone实现收入增长之外,其他硬件业务均呈现同比下滑的态势。
-
“GPT-4变傻”,不只是OpenAI的苦恼
”
eLLM训练数据收集日期之前和之后发布的数据集,对零样本(蓝色)和少样本(绿色)任务的准确率对比
也就是说,大模型在它们之前“见过”的任务上表现优秀,在新任务上则相对拉垮。
最终结论
在所有实验过后,论文给出如下关键结论:
由于任务污染,闭源模型在零样本或少样本评估中的性能表现被夸大了,特别是那些经过人类反馈的强化学习(RLHF)或指令微调的模型。
-
二手半导体设备江湖
二手半导体设备市场的起源与发展
中国的二手半导体设备市场的初步形成可追溯到2010年之前。
2023年二手设备迎来劲敌
在半导体行业的快速变化中,二手设备市场经历了一系列显著的起伏。”
陈真进一步指出,当下,国产设备厂商在成熟设备领域也很卷,例如在套刻设备和湿法设备等方面,同质化竞争也很严重,这就也顺带把二手设备市场卷进去。
-
帮初中生写作业的写字机器人,被网友捧上了神坛
“手写教案就是形式主义。”唐唐说,“因为人们都不会按照手写的教案讲,都有自己的教案,电子教案,从各个地方找模课之类的。领导说是有人看,但是基本上我们推测的是没人看,因为我都是瞎划拉。”
除了学生和老师,其实还有很多群体对于手写文字有工作要求,例如需要书写会议记录和报告的公职人员、负责处理文件的文秘职员等,不是每个人都在依靠电脑打字就可以完成所有日常工作的。
-
寻找外星人:关键不在于有什么,而是缺什么
在广泛查阅了从生物学到化学,甚至是气候变化背景下的碳固存等许多领域的文献后,研究人员推断,如果一颗类地行星大气中的二氧化碳含量比同一系统中的其他行星少得多,那么这颗行星表面就有可能存在液态水,甚至有可能存在生命。
一旦天文学家确定某个系统中有多颗行星拥有大气,他们就可以继续测量这些大气中的二氧化碳含量,看看其中某颗行星的二氧化碳含量是否会明显低于其他行星。
-
AI绘画侵权国内第一案宣判,罚了500块
但是稳定扩散模型不是人类,也不是法人,不是著作权法条上的主体,因此不能享有著作权,著作权就归“告诉。”
法院认定,由腾讯写作机器人在技术上“生成”的创作过程满足著作权法对文字作品的保护条件,属于我国著作权法所保护的文字作品,因此判定被告赔偿原告经济损失及合理的维权费用人民币。
AI学习模型潜在的作品版权问题
稳定扩散模型这样的人工智能模型需要大量的原始数据或图片用于训练,这些案件中的原告输出的图片均是数量巨大的原始图片用于训练的结果。