DeepSeek是甚麼?與ChatGPT有何分別?一文睇清DeepSeek爆紅原因、創辦人梁文鋒來頭
發佈時間:16:02 2025-01-28
DeepSeek上周推出最新人工智能推理模型「DeepSeek R1」,表示其性能對標美國OpenAI去年底才發布的「OpenAI o1」,而且成本相比下極低,引起全球關注,DeepSeek在香港、內地,甚至美國的App Store及Play Store都登上熱門下載榜榜首。
《星島頭條》整合各方資訊,讓讀者一文看清究竟DeepSeek是甚麼;甚麼是OpenSource以及其優劣;DeepSeek與OpenAI的ChatGPT有何分別;DeepSeek創始人梁文鋒有甚麼來頭;以及DeepSeek對於未來AI發展,以及市場影響等。
DeepSeek是甚麼?
中國AI初創公司「深度求索」(DeepSeek)成立於2023年7月17日,是一家創新型科技公司,專注於開發先進的大語言模型(LLM)和相關技術。
DeepSeek在今年1月20日推出開源(OpenSource)推理模型DeepSeek R1,以低成本、高效能趕超美國OpenAI最新推出的模型「o1」。
相關新聞:AI爭霸︱DeepSeek登中國區App Store首位 科技大老讚:國運級成果
OpenSource是甚麼?
DeepSeek R1發布時表示會同步開源模型權重,為推動和鼓勵開源社群以及產業生態的發展,DeepSeek表示此次的開源倉庫(包括模型權重)統一採用標準化、寬鬆的MIT License,完全開源,不限制商用,毋須申請。
香港大學商學院兼職教授梅力恆表示,與OpenAI不同,由於DeepSeek-R1採用「Open Source」開源設計,即開放程式碼,讓人們可隨意取用、開發。
不過梅力恆指Open Source也有壞處,因開源設計代表任何人都可隨便使用,無論政府、企業,甚至不法之徒如「KK園」的不法分子,也可拿來做他們想做的事。
相關新聞:DeepSeek AI模型爆紅 開源設計「雙面刃」? 學者憂KK園不法分子用作犯罪
DeepSeek與ChatGPT有何分別?
DeepSeek表示,DeepSeek-R1效能對標OpenAI-o1 正式版,指DeepSeek-R1在後訓練階段大規模使用了強化學習技術,在僅有極少標註資料的情況下,大幅提升了模型推理能力。在數學、程式碼、自然語言推理等任務上,效能比肩OpenAI o1 正式版。
DeepSeek R1成本比OpenAI o1 便宜96%
DeepSeek-R1 API 服務定價為每百萬輸入tokens 0.14美元(緩存命中)/ 0.55美元(緩存未命中),每百萬輸出tokens 2.19美元。相比之下,OpenAI o1 API 服務定價為每百萬輸入tokens 7.5美元(緩存命中)/ 15美元(緩存未命中),每百萬輸出tokens 60美元。
以輸出API價格計算,DeepSeek R1的成本定價為每100萬個輸出為2.19美元,OpenAI o1則為60美元,即DeepSeek R1比OpenAI o1 便宜了96%。
DeepSeek官網新聞稿:DeepSeek-R1發布 性能對標OpenAI o1 正式版
DeepSeek創始人梁文鋒是誰?
梁文鋒既是深度求索(DeepSeek)創始人,也是頭部量化私募幻方的創始人,創業範疇橫跨金融和人工智能領域。幻方量化基金目前的管理資金規模超過百億,2021年還一度突破千億元規模;而他的DeepSeek公司正式成立至今僅1.5年,也是國內少有的擁有萬卡集群算力的AI大模型公司,研發實力和成果在最近也震驚了許多國外AI同行。
高考狀元考入浙江大學 碩士畢業
梁文鋒1985年生於湛江吳川,曾以當地高考狀元身分考入浙江大學,對人工智能興趣濃厚,攻讀碩士期間將技術應用在量化交易上,畢業後創立的「幻方量化」成為內地量化私募基金龍頭。據內媒報道,梁文鋒從小是尖子生,特別擅長數學。
梁文鋒曾表示,人做投資決策是藝術,程序做決策是科學。梁文鋒又表示,中國AI不可能永遠處在跟隨的位置。「我們經常說中國 AI 和美國有一兩年差距,但真實的gap是原創和模仿之差。如果這個不改變,中國永遠只能是追隨者,所以有些探索也是逃不掉的。」
相關新聞:DeepSeek|起底創始人梁文鋒 17歲考入浙大 36歲管理千億私募基金
DeepSeek對未來AI及對市場影響?
馮驥:可能是「國運等級」科技成果
1月26日,遊戲科學創始人兼CEO、《黑神話:悟空》製作人馮驥評價DeepSeek:可能是個國運等級的科技成果。馮驥表示:「希望DeepSeek R1會讓你對當前最先進的AI祛魅,讓AI逐漸變成你生活中的水和電。太幸運了!太開心了!這樣震撼的突破,來自一個純粹的中國公司。知識與資訊平權,至此又往前邁出了堅實的一步。」
Nvidia讚揚:是一項出色的人工智能進步
DeepSeek震散美股,英偉達(Nvidia、NVDA)股價周一收市暴跌16.86%,單日蒸發5888.62億美元市值,為美股史上最大。英偉達周一發表回應,讚揚DeepSeek的模型是「一項出色的人工智能進步」。英偉達發言人指,「DeepSeek的成果展示了如何使用測試時擴展(Test Time Scaling)技術創建新模型,充分利用廣泛可用的模型並進行計算完全符合出口管制規定。」
公告表明,英偉達認為DeepSeek在開發技術時,並未違反華府限制獲取美國先進晶片的規定;又認為DeepSeek的突破將為英偉達帶來更多需求,「推理需要大量的英偉達GPU和高性能網絡」。
相關新聞:英偉達讚DeepSeek為人工智能進步 符合美國出口管制
港大學者:預計AI會在2025年超越全人類智慧
至於開源設計的DeepSeek對於世界的影響力,港大商學院兼職教授梅力恆認為,現時AI發展確實有些「失控」,因為人類已不能再追蹤AI的思考模式,加上AI的智力已與人類相若,現時智商已達100多,即使是愛因斯坦智商也是約150,所以人工智慧肯定會在2025年超越地球上所有人的智慧,質疑「到時AI超越所有人而我哋又控制唔到時,咁又點呢?」
相關新聞:AI之戰︱小米雷軍傳年薪千萬挖角 95後「天才少女」領導大模型團隊