新版ChatGPT用人類思維推理 OpenAI o1上線可解答逾8成IMO題

更新時間:11:37 2024-09-13
發佈時間:11:37 2024-09-13

人工智能新創公司OpenAI推出能夠解決複雜推理的新版ChatGPT,定名OpenAI o1。這款新模型能以人類思考方式回答問題,專門應付需要邏輯推理的任務,像是數學和科學。

專門應付邏輯推理任務

OpenAI指出,OpenAI o1在國際數學奧林匹亞(IMO)競賽中能正確解答83%的題目,相較之下,今年5月上線的GPT-4o僅能正確解答13%的題目。

GPT-4o在資訊檢索方面的表現較為出色,而OpenAI o1則是專門應付需要邏輯推理的任務,而且在回答問題前會花更多時間思考題目,「就像人類一樣」。

助醫療研究及電腦開發

OpenAI表示,新的推理功能可用於醫療保健研究人員註釋細胞測序數據,物理學家生成複雜公式,或電腦開發人員構建和執行多步驟設計。

OpenAI首席科學家帕喬基和技術研究人員席多在一次展示中,示範用OpenAI o1技術解決一個博士級的化學問題,並根據患者的症狀和病史詳細報告,診斷出一種疾病。

回答需要時間

帕喬基進一步闡述:「使用像是ChatGPT這種早期模型時,你問它一個問題,它會立即開始回答。但推理模型OpenAI o1需要時間,它能夠用英文思考問題,嘗試將問題拆解,並尋找解決角度,努力提供最佳解答。」

OpenAI的ChatGPT在2022年底問世,此款對答機械人會出現幻覺和捏造事實的情況,OpenAI一直在嘗試解決缺陷;不過席多仍表示,OpenAI o1並不是完美的,這款新的推理模型只是更有可能產生正確答案。

OpenAI在內部使用代號Strawberry(草莓)來指稱這個項目,同時將今次宣布的新模型命名為o1和o1-mini。

自周四起,用戶可以透過ChatGPT、付費版ChatGPT Plus、Team都能夠使用OpenAI o1的預覽版本。