刚刚,Anthropic 发布 Claude Opus 4.6BenchMark在知识工作评测 GDPval-AA 上,Opus 4.6 赢 GPT-5.2 约 144 Elo,赢自家前代 Opus 4.5 约 190 ...
NBIM(挪威央行投资管理局):「在 40 项网络安全调查中,Claude Opus 4.6 盲评排名第一拿了 38 次,每个模型跑同一套 Agent 框架,最多用 9 个子 Agent 和 100+ 次工具调用。」 ...
值得注意的是,不久前苹果与谷歌宣布就下一代苹果基础模型(Apple Foundation ...
据权威统计,2026年中国企业级AI智能体市场规模已突破百亿美元大关。值得注意的是, ...
什么值得买社区频道 on MSN
MonkeyCodeAI 技术干货合集:架构、优势、落地逻辑全覆盖
在AI编程工具同质化竞争愈演愈烈的当下,多数工具仍停留在“代码补全”的浅层应用,难以满足企业研发全流程的效率提升与安全管控需求。长亭科技推出的Mon ...
InfoQ中国 on MSN
配置一改就要重启的时代结束了:Dev Proxy 2.1 正式上线
Dev Proxy 团队近日发布了 Dev Proxy 2.1 版本。此次更新围绕开发效率和本地测试体验展开,重点提升了迭代速度,并进一步增强了对现代开发工具的支持,同时对代理核心能力及相关工具链进行了多项优化。 Dev Proxy v2.1 的一项重要新增功能是配置热重载(configuration hot ...
@form-create/designer是基于 @form-create/element-ui和 ElementPlus 实现的低代码表单设计器组件。支持Vue2和Vue3 @form-create/vant-designer是基于 ...
环球老虎财经 on MSN
姚顺雨腾讯第一篇论文,道破为什么AI死活听不懂人话
今天的大语言模型能解奥数题、通过专业考试、写复杂代码,但它们在真实世界的应用中却常常“翻车”。问题出在哪里? 在姚顺雨加入腾讯后发布的首篇论文里,他对于这个现象提出了一个观点: ...
随后,承压多时的软件板块陷入集体恐慌,汤森路透、LSEG等大型软件股开始砸盘,高盛美国软件股组合当日跌超6%,遭遇去年4月特朗普宣布“对等关税”后最 大的单日跌幅。
引言:智能体时代的“深水区”战役步入 2026 年,中国企业级 AI 市场正经历一场剧烈的地壳运动。随着生成式 AI 从技术狂热期步入产业深耕期,市场格局已然重塑:ChatGPT-5、Claude 3.7、Gemini Ultra 等通用大模型虽在算力与参数规模上登峰造极,但逐渐退守至“个人辅助 / 基础创意”赛道。而在企业级市场,单纯的对话交互已无法满足需求,企业迫切需要解决“通用智能体幻觉率高 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果