OpenAI日前推出名為 「Operator」的AI代理服務,它能夠像人類一樣操作網頁瀏覽器,執行包括預訂旅行、訂購外賣、填寫表單等在內的各種線上任務,甚至可以同時處理多項任務。
Operator建立在OpenAI的多模態大型語言模型GPT-4o之上,並結合了名為 ?Computer-Using Agent (CUA)?的全新模型。CUA模型賦予Operator與圖形用戶界面(例如按鈕、文字框、菜單)互動的能力,使其能夠像人類一樣瀏覽網頁、點擊按鈕、輸入文字等,從而完成各種線上任務。
OpenAI聲稱Operator的性能超越了Anthropic的Computer Use和Google DeepMind的Mariner等競爭對手的類似工具。在一系列業界基準測試中,CUA 在完成線上任務方面的得分均高於 Computer Use 和 Mariner。
OpenAI 計劃在未來利用API向開發者開放CUA的功能,以便他們構建自己的應用程式,進一步擴展Operator的應用範圍,並推動AI代理技術的發展。
雖然Operator目前仍處於實驗階段,但它展現了AI技術的巨大潛力。可以預見未來將會有更多像Operator這樣的AI代理出現,影響人們的生活和工作方式。