商湯推「日日新5.0」揚言部份功能已超GPT-4 Turbo

更新時間：17:32 2024-04-23 HKT
發佈時間：17:32 2024-04-23 HKT

內地AI龍頭企業商湯科技（020）年初推出「日日新4.0」大模型，稱其代碼編寫等功能已與GPT-4相當，最新該公司發表「日日新5.0」大模型，董事長兼首席執行官徐立介紹，新產品全面對標GPT-4 Turbo，考試及推理等部分功能甚至超越該大模型。

智能理解能力更適合中國

商湯周二於上海舉辦「商湯技術交流日」，徐立介紹，日日新5.0有五大重點，包括採用MOE混合專家架構，基於超過10TB tokens訓練，推理上下文窗口增至200K，於知識推理代碼等場景全面對標GPT-4 Turbo。

徐立更即場演示日日新5.0的各項應用，並與ChatGPT等市面上的熱門大模型工具對比，例如在中國高考作文寫作一項，徐立介紹，日日新擁有更適合中國實際情況的智能理解能力，且中文能力較強，相信其差異化能力較強。

生成人物方面有較大進步

日日新5.0延續上代大模型的文生圖等能力，徐立亦即場發出生成亞洲女子面孔等指令，並與midjourney等同類產品對比，稱自家產品生成人物方面有較大進步，且較其他幾款同類產品更接近現實人物形象。與此同時，日日新旗下「商量」大語言模型，也可用於從圖片提取、分析文字及數據並歸納總結，甚至從圖片中分析圖中食物熱量等功能。

徐立指今年是端側應用爆發元年，日日新5.0現也可於手機等移動終端上使用，他於發布會現場與員工連線，展示新一代日日新總結工作紀要、擴圖、撰寫請假信等功能。此外，新一代大模型也令用戶能用語音召喚、調用手機不同功能，完成各種生活工作需求。