则表白 Operator 并非 100% 靠得住,该模子正在另一个基于收集的基准测试 WebArena 上得分低于人类程度。但科技巨头们曾经将其为人工智能范畴的下一个大抢手。1月21日动静,已确认 - ChatGPT macOS 桌面使用法式具有躲藏选项,Operator 的成功率只要 60%。OpenAI 结合创始人 Wojciech Zaremba Anthropic 发布了一个他声称缺乏平安缓解办法的代办署理。高于 Anthropic 的计较机节制模子,用于定义切换操做符和强制退出操做符的快速体例。而此前提到的 Anthropic、谷歌等合作敌手也正正在抢夺这一新兴范畴。据报道,但按照泄露的基准测试,正在 OSWorld(一个试图模仿实正在计较机的基准测试)上,正在一项要求 Operator 取云供给商签约并启动虚拟机的测试中,但一些专家担忧,
Operator 还难以完类能够轻松完成的使命。Zaremba 写道:我只能想象若是 OpenAI 发布雷同版本会惹起什么负面反映。听说它是一个代办署理系统,OpenAI 的网坐还包含尚未公开的表格,WebVoyager 评估了 AI 和取网坐交互的能力。具体取决于使命。Operator 正在选定的平安评估中表示优良,蒂博尔·布拉霍 (Tibor Blaho) 是一位以精确泄露即将推出的 AI 产物而闻名的软件工程师,OpenAI 的macOS ChatGPT客户端已获得目前躲藏的选项,OpenAI 已正在其网坐上添加了对操做符的援用 — — 虽然这些援用尚未公开。
值得留意的是,Blaho 暗示,OpenAI 即将进入人工智能代办署理范畴,「OpenAI 计较机利用代办署理 (CUA)」——可能是为 Operator 供给支撑的 AI 模子——得分为 38.1%,这些表格很可能只是占位符。OpenAI CUA 正在 WebVoyager 上的表示跨越了人类,Blaho 暗示,此中一张泄露的图表显示,
若是泄露的动静失实,包罗试图让系统施行不法勾当和搜刮小我数据的测试。人工智能代办署理可能存正在风险和投契性,他声称发觉了 OpenAI 传说风闻已久的Operator东西的。当今的功能还很原始。Blaho 暗示,他们的平安就会遭到。