張家輝 - AI Agent又火了 | Alex聊AI

  中國人工智能(AI)模型DeepSeek自今年推出以來,才剛開始火熱起來不足3個月,國內的另一AI初創公司Monica又冒起來,向全球發佈並把通用型AI助理Manus帶火了。筆者早前身邊已有朋友開始用大模型工具,突然又出現新一個模型,許多人都搞不清楚兩者有何區別。其實筆者已經關注了AI助理發展良久,而業界亦非常期待今年在這方面能有所突破。

  現時廣獲市場應用的ChatGPT、DeepSeek,以及內地市場較常用的Kimi、通義等均屬於大語言模型(Large Language Model — LLM)。簡而言之,其主要功能就是「對話」,並理解我們所輸入的內容和提出的問題。至於像GPT-4等更複雜一些的「多模態模型」,則整合了文本、圖像和音訊處理能力,使LLM能夠以更接近人類的「聽」、「說」、「看」等能力。因此,人們在日常使用中,就是打開大模型的App或者網站,並輸入其問題,AI便會調用算力,加上互聯網搜索,從而給予用戶分析和答案。

  猶記得電影《鐵甲奇俠(Iron Man)》內的AI助手Jarvis就很有智慧,「主人」Tony只需給它一個指令,便能直接執行。現有的AI Agent就像Jarvis,是懂得「執行」的助手,更確切而言,其更像AI智能體。在Manus的發布短片中,AI可以根據指令進行程式設計,甚至能直接封裝成安裝檔案,這無疑比LLM更具有實用性。事實上,目前幾乎所有AI大廠都在全力推進AI Agent的開發,其中OpenAI、Google、Microsoft等AI Agent也具備可用性。

  另一方面,今年同樣火起來的「人形機械人」,在解決了硬體難點後,需搭配AI Agent等軟件,方能使機械人根據人的指令,並靈活調用多種工具解決現實問題。這些工具甚至可以包括大語言模型、視覺模型等等,有了AI Agent加持,機械人走進人們日常生活的願景才能真正實現,以節省辦公和前端開發成本和時間。

INTL GENIUS
行政總裁
張家輝

更多文章