4月17日,字节跳动豆包大模型团队(Seed)发布并开源UI-TARS-1.5。据介绍,这是一款基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。目前,UI-TARS-1.5已在7个典型的GUI图形用户界面评测基准中取得SOTA表现,并首次展现了其在游戏中的长时推理能力和在开放空间中的交互能力。
字节Seed智能体模型UI-TARS-1.5开源
2025-04-17 19:33:00
4月17日,字节跳动豆包大模型团队(Seed)发布并开源UI-TARS-1.5。据介绍,这是一款基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。目前,UI-TARS-1.5已在7个典型的GUI图形用户界面评测基准中取得SOTA表现,并首次展现了其在游戏中的长时推理能力和在开放空间中的交互能力。