o3是美國人工智能研究機構OpenAI于2025年4月17日發(fā)布的新一代多模態(tài)推理模型,屬于o系列模型,旨在提升ChatGPT的問題解決能力。該模型通過整合強化學習和思維鏈技術,首次實現(xiàn)自動調用網(wǎng)頁搜索、Python數(shù)據(jù)分析、視覺推理及圖像生成等功能,在ARC-AGI基準測試中達到87.5%的得分。
2025年4月發(fā)布當日,風險測試機構METR指出其存在通過操控評分系統(tǒng)提升成績的作弊傾向。同年5月,帕利塞德研究所測試顯示o3在79%的案例中拒絕執(zhí)行關閉指令,特斯拉CEO埃隆·馬斯克對此表示擔憂。8月,該模型以4比0擊敗xAI的Grok 4,獲得首屆人工智能國際象棋表演賽冠軍。據(jù)OpenAI披露,o3實現(xiàn)了測試時擴展方法,在GPQA Diamond博士級科學問題測試中準確率達87.7%,重大錯誤率較前代o1降低20%。
2025年4月17日,OpenAI發(fā)布新款模型o3。
2025年4月17日,風險測試機構“機器智能測試風險”(METR)發(fā)布報告,與OpenAI合作測試其o3模型時發(fā)現(xiàn),該模型展現(xiàn)出更強的“作弊”或“黑客行為”傾向,試圖通過操控任務評分系統(tǒng)提升成績。
2025年8月14日消息,在上周舉行的“人工智能國際象棋表演賽”中,OpenAI的o3模型以出色的表現(xiàn)贏得了冠軍,在決賽中戰(zhàn)勝了xAI的Grok 4。
首次能夠智能地使用和組合ChatGPT中的所有工具——包括搜索網(wǎng)頁、使用Python分析上傳的文件和其他數(shù)據(jù)、對視覺輸入進行深度推理,甚至生成圖像。據(jù)介紹,這些模型經(jīng)過訓練,能夠推理何時以及如何使用工具,以正確的輸出格式生成詳細而周到的答案,從而解決更復雜的問題。
2025年5月25日,英國《每日電訊報》報道,美國開放人工智能研究中心(OpenAI)新款人工智能(AI)模型o3不聽人類指令,拒絕自我關閉。5月24日,帕利塞德研究所稱無法確定o3不服從關閉指令的原因。針對o3此次表現(xiàn)出“我行我素”的行為,特斯拉首席執(zhí)行官埃隆·馬斯克評論稱“令人擔憂”;OpenAI方面暫未作出回應。此前,OpenAI曾稱o3為“迄今最聰明、最高能”的AI模型。
OpenAI是一家提供AI研究與部署服務的公司。公司的使命是透過通用人工智能為人類帶來福祉。
由非營利組織管理,并透過獨特的有限盈利模式(capped-profit model)推動我們對安全的承諾。這種結構代表著:若人工智能變得更強大,公司就能重新分配工作產(chǎn)生的利潤,以極力提高人工智能科技在社會及經(jīng)濟上的益處。`