本文来自微信公众号:APPSO (ID:appsolution),作者:时刻在线的APPSO,原文标题:《刚刚,这个全面超越 GPT-4 的大模型,正式推出了 iOS 应用 | 附下载链接》,题图来自:视觉中国
两个月前,Anthropic 发布了 Claude 3 大模型,它在推理、数学、编码、多语言理解和视觉等维度几乎全面超越了 GPT-4,一夜晋升为全球最强大模型。
5月2日凌晨, Anthropic 正式在 App Store 推出了 Claude 的 iOS app。
先给大家总结 Claude iOS 应用的几个功能亮点:
-
跨设备同步历史记录:无论切换到哪个设备,都能接着聊;
-
视觉识别功能:相册照片、上传的文件等,都支持实时的图像分析,做到看图说话;
-
免费可用:任何用户都支持下载使用。
遗憾的是,除了上述功能,目前 Claude app 还略显“粗糙”,比如它尚不支持 ChatGPT 里备受欢迎的语音对话功能。
Anthropic 表示本月还将推出 Team(团队)计划,详情如下:
-
支持使用 Pro 版的所有功能,以及提供更多聊天次数;
-
允许访问完整的 Claude 3 模型系列,提供量身定制的 AI 模型;
-
支持 200K 上下文窗口,能够处理长文档,保持复杂的来回对话;
-
推出便捷的管理工具,简化新成员加入流程、降低运营成本;
-
至少 5 名成员才能开启 Team 计划,每人每月 30 美元。
作为对比,ChatGPT 今年 1 月面向员工数量少于 150 人的小型企业团队,推出了全新的 Team(团队)计划。
ChatGPT Team 计划不仅提供如 GPT-4、DALL·E 3 的访问、高级数据分析工具以及更高的消息上限,而且还提供专用的协作空间、团队管理的管理员工具,以及针对业务数据和对话的安全保障。
用户可以凭借纯自然语言创建和共享自定义的 GPTs,以适应特定的工作流程和需求。并且,该计划的费用为每人每月 25 美元(按年计费)或每人每月 30 美元(按月计费)。
在未来几周,Anthropic 还将带来更多协作功能,比如引用可靠来源验证 AI 生成内容,与代码库、客户关系管理系统(CRM)等数据平台集成,以及与同事共同编辑和完善 AI 生成的文档或项目。
据 The Verge 报道,Anthropic 产品经理斯科特・怀特表示,很多 Claude 用户都是通过移动网络访问网页端,这促使他们决定推出 app。
另外,他还表示 Anthropic 将很快推出 Android 版本。
@androiddevnotes 玩梗图
Anthropic 于今年 3 月推出了 Claude 3 系列模型,这三款模型在推理、数学、编码、多语言理解和视觉处理等方面相当扎眼。
其中超大杯 Claude 3 Opus 甚至将 GPT-4 Turbo 拉下神坛。
-
中杯 Haiku,轻量级的选择;
-
大杯 Sonnet,平衡性能与速度;
-
超大杯 Opus,AI 模型的巅峰之作。
Anthropic 官方宣称,作为旗舰级别的超大杯 Opus 模型,其智能程度堪比人类,能够游刃有余地应对开放式问题,并巧妙解决各种复杂挑战。
从官方发布的成绩单来看,在知识测试 MMLU、推理测试 GPQA、基础数学测试 GSM8K 等一系列基准测试中,超大杯 Claude 3 Opus 模型的每一项得分都全面超越了 GPT-4 以及 Gemini 1.0 Ultra。
在 Claude 3 发布之后,网友 @op7418 第一时间尝试了 Claude 3 Opus,并做了三个测试。
网友首先对 Claude 3 Opus 的翻译能力进行了测试,挑战了一段复杂的英文文本。结果显示,Opus 的翻译不仅条理分明,而且分段和排版得当,使得阅读体验大幅提升。但若论翻译的流畅度与准确性,GPT-4 依旧略占上风。
紧接着,网友又用一张风格复杂的设计稿截图考验 Opus 的细节还原能力。在网友明确指出需要还原样式后,Opus 精准把握设计元素,整体表现要比 GPT-4 好。
多模态能力也是 Opus 值得考察的重点。它不仅能读懂学术论文的精髓,还能把分析结果呈现得一清二楚。不过,跟 GPT-4 比起来,Opus 在信息的丰富度上似乎还有点“成长空间”。
另一位网友 @mlpowered 向 API 提供了长达两小时的视频讲稿以及精选的关键画面截图,成功制作出一篇内容丰富、图文并茂的 HTML 格式博客文章。
本文来自微信公众号:APPSO (ID:appsolution),作者:时刻在线的APPSO