張家輝 - AI Agent又火了 | Alex聊AI

張家輝

2025-03-24 02:00 HKT

內容

　　中國人工智能（AI）模型DeepSeek自今年推出以來，才剛開始火熱起來不足3個月，國內的另一AI初創公司Monica又冒起來，向全球發佈並把通用型AI助理Manus帶火了。筆者早前身邊已有朋友開始用大模型工具，突然又出現新一個模型，許多人都搞不清楚兩者有何區別。其實筆者已經關注了AI助理發展良久，而業界亦非常期待今年在這方面能有所突破。

　　現時廣獲市場應用的ChatGPT、DeepSeek，以及內地市場較常用的Kimi、通義等均屬於大語言模型（Large Language Model — LLM）。簡而言之，其主要功能就是「對話」，並理解我們所輸入的內容和提出的問題。至於像GPT-4等更複雜一些的「多模態模型」，則整合了文本、圖像和音訊處理能力，使LLM能夠以更接近人類的「聽」、「說」、「看」等能力。因此，人們在日常使用中，就是打開大模型的App或者網站，並輸入其問題，AI便會調用算力，加上互聯網搜索，從而給予用戶分析和答案。

　　猶記得電影《鐵甲奇俠（Iron Man）》內的AI助手Jarvis就很有智慧，「主人」Tony只需給它一個指令，便能直接執行。現有的AI Agent就像Jarvis，是懂得「執行」的助手，更確切而言，其更像AI智能體。在Manus的發布短片中，AI可以根據指令進行程式設計，甚至能直接封裝成安裝檔案，這無疑比LLM更具有實用性。事實上，目前幾乎所有AI大廠都在全力推進AI Agent的開發，其中OpenAI、Google、Microsoft等AI Agent也具備可用性。

　　另一方面，今年同樣火起來的「人形機械人」，在解決了硬體難點後，需搭配AI Agent等軟件，方能使機械人根據人的指令，並靈活調用多種工具解決現實問題。這些工具甚至可以包括大語言模型、視覺模型等等，有了AI Agent加持，機械人走進人們日常生活的願景才能真正實現，以節省辦公和前端開發成本和時間。

INTL GENIUS
行政總裁
張家輝