商湯推「日日新5.0」 揚言部份功能已超GPT-4 Turbo
發佈時間:17:32 2024-04-23
內地AI龍頭企業商湯科技(020)年初推出「日日新4.0」大模型,稱其代碼編寫等功能已與GPT-4相當,最新該公司發表「日日新5.0」大模型,董事長兼首席執行官徐立介紹,新產品全面對標GPT-4 Turbo,考試及推理等部分功能甚至超越該大模型。
智能理解能力更適合中國
商湯周二於上海舉辦「商湯技術交流日」,徐立介紹,日日新5.0有五大重點,包括採用MOE混合專家架構,基於超過10TB tokens訓練,推理上下文窗口增至200K,於知識推理代碼等場景全面對標GPT-4 Turbo。
徐立更即場演示日日新5.0的各項應用,並與ChatGPT等市面上的熱門大模型工具對比,例如在中國高考作文寫作一項,徐立介紹,日日新擁有更適合中國實際情況的智能理解能力,且中文能力較強,相信其差異化能力較強。
生成人物方面有較大進步
日日新5.0延續上代大模型的文生圖等能力,徐立亦即場發出生成亞洲女子面孔等指令,並與midjourney等同類產品對比,稱自家產品生成人物方面有較大進步,且較其他幾款同類產品更接近現實人物形象。與此同時,日日新旗下「商量」大語言模型,也可用於從圖片提取、分析文字及數據並歸納總結,甚至從圖片中分析圖中食物熱量等功能。
徐立指今年是端側應用爆發元年,日日新5.0現也可於手機等移動終端上使用,他於發布會現場與員工連線,展示新一代日日新總結工作紀要、擴圖、撰寫請假信等功能。此外,新一代大模型也令用戶能用語音召喚、調用手機不同功能,完成各種生活工作需求。
正開發文生影片相關工具
ChatGPT開發者OpenAI早前推出文生影片工具Sora,震撼市場。徐立表示,公司正開發相關工具,不久後將發布。此外,商湯宣布與華為合作,發布金融、醫療、政務及代碼領域的商湯行業大模型「昇騰」。
To B商業化層面,針對金融、醫療、政務、代碼四大領域,商湯推出「2-42」架構的企業大模型一體機等產品,主打開箱即用、全國產化。其中代碼大模型一體機輕量版售價35萬元人民幣,每部一體機可供100人規模的研發團體使用,使用成本最低可達每人每日4.5元人民幣。
---
《星島申訴王》推出全新項目「區區有申訴」,並增設「我要讚佢」欄目,現誠邀市民投稿讚揚身邊好人好事,共建更有愛社區。立即「我要讚佢」︰ https://bit.ly/3uJ3yyF
緊貼最新最快新聞資訊,請立即下載星島頭條App:https://bit.ly/3Q29Vow