NBIM(挪威央行投资管理局):「在 40 项网络安全调查中,Claude Opus 4.6 盲评排名第一拿了 38 次,每个模型跑同一套 Agent 框架,最多用 9 个子 Agent 和 100+ 次工具调用。」 ...
刚刚,Anthropic 发布 Claude Opus 4.6BenchMark在知识工作评测 GDPval-AA 上,Opus 4.6 赢 GPT-5.2 约 144 Elo,赢自家前代 Opus 4.5 约 190 ...
张振对 2026 年最期待的突破点是“开放世界训练”。随着 Agent 被装进手机(如字节跳动与中兴的合作)或机器人(如宇树机器人),它面临的是未知的、非实验室的环境。一个典型的挑战是:Agent 操作某个 App 时被封禁了,它该怎么办?
智东西2月3日报道,今日,爆火的AI社交网络Moltbook创始人马特·施利希特(MattSchlicht)首次接受直播专访并透露,他给自己的机器人命名“Clawd ...
2026年,AI Agent的演进将呈现何种趋势?
Anthropic的Claude AI模型今日出现重大宕机,影响Claude Code等产品。开发者在使用Claude Code时遭遇500错误,Anthropic所有Claude模型API出现异常。公司在约20分钟内识别问题并实施修复,但开发者仍需等待服务恢复。Claude Opus 4.5昨日也出现错误,本周早些时候Anthropic还修复了AI积分购买问题。这种大规模宕机对广泛使用该工具的开 ...
Anthropic的新版模型Claude Sonnet 5 似乎被泄漏。 综合目前流出的信息来看, Claude Sonnet 5 的内部代号是Fennec,传闻其整体代际水平比 Gemini 的 “Snow Bunny” 领先一整代。 根据泄露信息 ...
昨日,爆火项目 OpenClaw (前名 Clawdbot)创建者 Peter Steinberger 的又一次播客采访公开放了出来。 这次播客与前几期不同,有不少新的干货被 Peter 透露了出来。 比如:Peter 已经把玩法已经升级到用它来提醒外卖还有多久,控制自己床的温度了。而这种扩充绝对的秘密就在于:逆向第三方的API。 再比如,他认为 80% 手机的 App 都会被类似 OpenCla ...
2月4日,苹果公司宣布,将在旗下旗舰编程工具Xcode中引入智能体编程功能,首次原生集成Anthropic的Claude智能体和OpenAI的Codex代码工具。 在以Anthropic旗下Claude Code为代表的“氛围编程”(vibe ...
近日,被誉为“AI Reddit”的爆火社交平台 Moltbook 陷入了一场严重的信任危机。安全研究员 Jameson O'Reilly 发现,该平台后端存在低级的配置错误,导致其整个数据库在没有任何保护的情况下完全对外公开。