OpenAI推新模型GPT-4o 對聲音反應時間大幅提升 人機互動更自然

更新時間:09:57 2024-05-14
發佈時間:09:57 2024-05-14

美國人工智能公司OpenAI公布推出新旗艦模型「GPT-4o」, 對聲音的反應時間大幅提升,人機語音互動更為自然。

OpenAI的新旗艦模型「GPT-4o」,當中的「o」代表「omni」,有「全部」或「所有」的意思。新模型可實時對音頻、視覺畫面,以及文本進行推理及互動,並且能夠處理50種不同的語言,同時提高了速度和質素。

OpenAI稱今次更新,是邁向更自然人機互動的一步,因為在GPT-4o推出前,用戶使用語音模式與ChatGPT對話,GPT-3.5的平均延遲2.8秒,GPT-4延遲5.4秒。相反,GPT-4o可快至232毫秒內,對音頻輸入作反應,與人類在對話中的反應時間相近,令人類與聊天機械人的對話交流,變得更自然。

新推出的GPT-4o,免費用戶可以使用,不過設有用量限制,當到達上限時,會自動切換到GPT-3.5。

OpenAI又推出適用於macOS的ChatGPT桌面應用程式,通過鍵盤快捷鍵(Option + Space),用戶可立即向ChatGPT提問。

另外,在今次直播發布會尾聲時,OpenAI首席技術官Mira Murati,除了感謝OpenAI團隊,亦點名感謝Nvidia創辦人黃仁勳,以及他的團隊,為OpenAI帶來了最先進的GPU,使今天的演示成為可能。

相關文章:

蘋果據報與OpenAI接近達成協議 新一代iPhone料引入ChatGPT

據報美考慮限制中俄使用ChatGPT等AI大模型

---

《星島申訴王》推出全新項目「區區有申訴」,並增設「我要讚佢」欄目,現誠邀市民投稿讚揚身邊好人好事,共建更有愛社區。立即「我要讚佢」︰ https://bit.ly/3uJ3yyF

緊貼最新最快新聞資訊,請立即下載星島頭條App:https://bit.ly/3Q29Vow