这项由上海AI实验室的赵诗田、张浩泉、林绍亨、李明等研究人员领导的研究发表于2025年1月,论文标题为"PyVision: Agentic Vision with Dynamic Tooling"。有兴趣深入了解的读者可以通过arXiv:2507.07998v1访问完整论文。 当我们面对一幅复杂的图像时,比如一张包含视觉错觉的 ...
上海AI实验室的研究团队意识到了这个问题,他们开发了一个名为PyVision的框架,让AI系统能够像人类一样,根据遇到的视觉问题动态地"发明"和使用工具。这就像给AI配备了一个无限的工具箱,而且AI还能根据需要现场制造新工具。