DeepSeek︱梁文鋒實習時人工曝光 未畢業已當經理領高薪

更新時間:16:36 2025-02-19 HKT
發佈時間:16:36 2025-02-19 HKT

中國AI初創DeepSeek再發表新技術論文,可令處理長文的速度提高11倍,創辦人梁文鋒更親自參與該論文研究。另外,梁文鋒2009年讀研期間曾到上海一科技公司實習,直接擔任新技術部經理,月薪達1.6萬人民幣,屬高薪一族。

推新技術處理長文快11倍  

據內媒報道,DeepSeek昨公布一項由梁文鋒親自參與的研究論文成果——原生稀疏注意力(Native Sparse Attention, NSA)機制,結合算法創新和硬件優化,解決長文建模中的計算瓶頸。

相關新聞:DeepSeek︱各地產業現AI「聯姻結對」 公務員憂「鐵飯碗」不保

報道指,論文顯示,NSA仍未用於訓練DeepSeek V3模型。論文指出,NSA處理長文的速度可提升11.6倍,在通用基準測試中,實現性能反超傳統的「全注意力模型」。

此外,梁文鋒成為舉世矚目的科技紅人後,他出道前的經歷也成為關注焦點。快科技報道,梁文鋒在2009年曾在上海閔行的艾麒信息科技實習,負責人工智能有關的內容。

相關新聞:DeepSeek|深圳學生用AI趕寒假功課?有數學教師調查結果......

專注研究半天不出辦公室

艾麒信息創辦人周朝恩透露,梁文鋒是他的浙大校友,讀研期間就以實習生身分加入艾麒,後經推薦直接擔任新技術部經理,給予月薪人民幣1.6萬元,算是高薪特別聘請。

周朝恩憶述稱,「初見梁文鋒時,他戴著一副眼鏡,斯文有禮,身材清瘦,給人一種文靜內斂的印象。入職後,就全身心投入到人工智能視頻與圖像技術的研究中,常常一整天都待在辦公室裡,專注地鑽研技術難題,甚至半天都不出來一次。」。

不善言辭典型技術男

周朝恩形容,梁文鋒不善言辭,但交流技術時則能清晰表達觀點,展現強大邏輯思維能力,指他「為人沉著冷靜,性格簡單直接,對產品和技術有極高的追求,堪稱典型的技術男風格」。

相關新聞:DeepSeek︱復工首日公司婉拒所有採訪 杭州辦公大樓成打卡點

梁文鋒也曾管理過多位演算法工程師,採用扁平化管理方式,給團隊成員充分的自由和信任,發揮每個人的特長,並帶領團隊攻克了多項技術難題,優化影像處理演算法。

豐富的管理經驗在梁文鋒創業後得到了延續。周朝恩指出,梁文鋒招聘的團隊成員大多是數學競賽一等獎、拿過國際金牌的演算法人才,這種對高端人才的管理和激勵方式,使得梁文鋒在管理量化投資和深度求索時,能夠迅速組織一支高效專業的技術團隊。