星期一, 6 4 月

OpenAI 新模型 AI 代理神器

科技新闻网站The Verge报导,OpenAI推出最新版人工智慧(AI)模型「GPT-5.4」,号称将更先进的推理、编码功能,与试算表、文件、简报等专业功能结合。这也是这家AI新创公司第一款具备原生电脑使用能力的AI模型,意味能代替使用者操作电脑,并且跨越不同应用程式完成任务。

报导指出,这项新模型是朝代理人(agent)AI的未来迈前一步。AI公司正纷纷朝这个方向迈进,目标是建立一个网路,由AI驱动的代理人在背景操作,无需脱离软体环境,即可在线上完成复杂任务。

OpenAI将把GPT-5.4导入自家的应用程式介面(API)以及AI驱动的编码工具「Codex」。与此同时,OpenAI新推出的推论模型,即「GPT-5.4 Thinking」,也将引进ChatGPT。OpenAI表示,GPT-5.4可为电脑作业程式编码,也能回应萤幕截图发出键盘和滑鼠指令。使用网页浏览器时,GPT-5.4效能也见改良,呼叫工具和API协助完成任务的精确度和效率也提升。

回应需要多方搜集资讯的问题时,新版模型的执行效能也更强。OpenAI表示,此模型「能够更持续不辍地多方搜寻,找出关联性最强的来源,对『大海捞针』式的问题尤其有帮助,而且还能整合成一个清楚、推论周延的答案。」OpenAI宣称,GPT-5.4是该公司「目前为止最符合事实的模型」,与GPT-5.2版本比,事实谬误情况降低33%。

在ChatGPT之内,GPT-5.4 Thinking针对较复杂的提问将提供工作列表,并且在回应期间允许使用者微调或改变要求。OpenAI说:「这让你更容易把模型导向你确切想要的结果,不用重来一遍,或额外再问好几回。」如今ChatGPT网页版和Android版都支援这项功能,支援iOS应用程式的版本也「很快」就会推出。

GPT-5.4已导入ChatGPT、Codex和API,GPT-5.4 Thinking模型也对Plus、Team和Pro用户推出。此外,「可将复杂任务执行效能最大化」的GPT-5.4 Pro模型,以及支援ChatGPT企业版和教育版(Edu)用户的模型,也已引进API。

另外,彭博资讯报导,知情人士说,软银集团正寻求贷款多达400亿美元,协助支应软银对OpenAI的投资。