大型語言模型的侷限與發展省思

Nicholas
Nicholas

Table of Contents

人工智慧(AI)是過去三年全世界最熱門的議題。不管是從科技、經濟、社會、創作...等等面象,在個人、職場、區域的生存或競爭場域,都成為最新且最容易被誤解的概念、事件或趨勢。

自從去年我個人認真地花了很多時間、功夫重新徹底地檢視、查閱人工智慧的發展,我心裡一直存在幾個疑問,經常性地在盤旋於腦中:

  • 為何 Transformer Model(造成這一波AI突破性發展的關鍵因素之一,是一個在模擬神經網路運算下處理注意力/attention的演算模型)是大型語言模型(LLM,Large Language Modle)的關鍵?
  • 在以「文本」描述事件的世界中,基於 Token 為基礎的運算模式,真能描繪人類所面對、觀想的真實世界?進而發展出所謂的智慧能力?
  • 若文本/語言的模型有其侷限,是否應該發展出另一套模型,以符合人類對自然世界的理解,包括物理、化學、心理、醫學...等領域,進而發展出所謂的智慧能力(即推論/inference,至少包含了理解、推演、判斷...甚至到決策)?

快速進化下遺落的路徑

過去三年裡,人工智慧的相關產業、領域,包括演算與模型(以頂尖大學和科技巨頭為主)、計算力(包括晶片、系統、資料中心等公司)、專業應用(大多為科技敏感的競爭產業,例如醫療、藥學、自駕車、製造、電信...等等)、普及應用(包括程式工程、行銷、內容產製等),都以超乎想像的速度在發展中。

但在這樣令人不斷驚喜、眼花撩亂的「盛世」光景下,這一切的基礎是否有其侷限?最關鍵的基礎問題是:

  • 何謂智慧?
  • 如何以人工複製智慧?

人腦內的神經元能夠運作,不會僅是物理性的反應(如電波傳導),還有化學性的反應(元素、介質...等),必然有生物性的結構與組織(腦細胞、中樞神經,必然與皮膚表層細胞不同),更奧祕的還有遺傳、基因...等變項。

若僅以語言、文字形式的文本,就能描繪、解讀這個自然世界,那麼人類這樣高智能生物數百萬年集體演化的能力就太單一了。

專家們也有同樣的想法

在今年(2025)三月份的Nnvida年度活動(GTC)中,Meta的首席AI科學家楊立昆(Yann LeCun)在對談中論及與我前述類似的想法。

他提到對大型語言模型(LLM)已不再感興趣。也舉例大型語言模型在許多領域的侷限,並提到人類對世界的基本理解能力,在嬰兒時期就能夠建立完成。

人工智慧真的很聰明嗎?

你會認為自己夠聰明嗎?當然,這個世界一定存在著許多比我們更聰明的人!但是,我們並不笨吧!?每一個能自我思考、獨立判斷的我們,應該有自信自己有一定的「智慧」能力。

現在的 AI 真的聰明了嗎?它具有智慧能力嗎?

若不要跟隨著大眾或媒體的浮面認知和討論,請認真地想想:現在的 AI 會比你聰明嗎?我們不會認為一台計算機會比我們聰明吧?是的,計算機可以快速運算各種位數的加、減、乘、除,還包括各種中、高級的數學運算,如開根號、次方、三角函數......等等。若是透過一個設計良好的前端介面形式,例如excel表或電腦程式,電腦甚至可以按我們的需要進行極為龐大、複雜的運算。

但是,我們會認為一台計算機或是電腦會比人還要聰明或具有智慧能力?

重點是:何謂聰明?什麼是智慧能力?

楊立昆認為我們都被現在的 大型語言系統(LLM) 愚弄了,以為 AI 很聰明!事實上,除去對於自然語言的操控,現在的 AI (1)無法理解物理世界(2)沒有系統化對理解的記憶(3)無法真具有理解與規劃的能力,因此稱不上有智能的行為能力。

事實上(我認為),人類自古以來就會善用工具於狩獵、農耕、建設。我們不會拿刀剪、鋤頭來與人類直接比較,因為工具是為人所用。同理,計算機或電腦是人類「腦力勞動」時的工具,所以我們不會認為這些工具比人聰明。

在這樣的經驗基礎下,AI 或許是一種更厲害、好用的「腦力勞動」工具,協助人類更有生產力,比起真實的人類,它(AI)必然很「笨」的,但是以後的 AI 會不會真變成聰明的樣子?

通用人工智慧的可能樣貌

通用人工智慧 (AGI)指的是具有完整人類智慧的能力。在目前而言,雖然還僅是個方向、目標,但許多專家都推估不久之後就有可能實現(10年之內?)。

大型語言模型(LLM)是一個很關鍵性的發展,在人腦神經元的初步模擬下,在文本/語言的架構中,成功地透過數學化的計算(標示、向量、機率...等),建構了一個能夠接收需求並產出答案的系統。

這樣的經驗理論上有可能觸發許多不同的新型態模型發展,去描繪物理、化學、遺傳、生物、經濟、文化...等等場域、空間,並能組合、連結成一個完整的人工智慧系統。我想,這樣才能真能算是個 AGI 吧!

捷徑或是唯一路徑?

我常在思索一個自然人,如何看待一個「專業領域」,並從中持續不斷地學習、成長、演化、創新?例如我熟知相對擅長的音樂、內容、行銷、策略領域。

我的經驗是,不同的專業領域理解或能力,會觸發我在另一個專業領域的快速進入和學習的過程,甚至更可能協助在更高層度的精進與創造。

每個自然人的遺傳、基因或許多少有所不同。不同人的智力(IQ)或在不同領域(如數理、文學、藝術...)的能力、興趣有差異。是否這些成年後的表現,其實在一出生時就已被決定或建立了重要的基礎?

就像一個資優的小孩的學習、成長歷程一樣,只要不去限制、阻絕他/她,通常會自然地成長出最後的樣子(能力與生涯選擇)。

除了針對前述不同領域(物理、化學、生物、藝術...)建構出可輸入、描述、運算、推論的數學化模型與演算法,更基礎的是建構一個如真人一般的學習、邏輯、想像、推論能力的模型。讓不同模型之間能夠連結,就能夠訓練(或說是自主學習)一個「資優」的人工腦(Artificial Brain),成為真正具有智慧能力(Intellegence Capability)的系統。這或許就是唯一、必然的路徑,也是最有效的捷徑。

反道德與反自然的未來

以上的推論是科學性、邏輯化的產物。但在浩瀚的宇宙中,在目前已知(推估)全宇宙的2萬億個星系(即2 × 10¹²個)中,銀河系僅是一個中等的星系。而在我的銀行系大約1,000-4,000億顆恆星裡,行星的總數遠大於恆星的數量,而我們地球所在的太陽系僅是個中等的恆星系統。在如此難以想像巨大的宇宙裡,人類的智慧與知識仍非常非常的有限,而且是孤獨地存在著。

將科技應用於模擬、學習人類的智慧能力,是否有一天會侵害人類自身的群體?就像透過生物科技進行試管生殖,去培育出數萬年前已滅絕的生物,是否會帶來不好的影響?

反自然與反道德,該會是我們對的選擇嗎?

NotebooKLM的整理

我將本篇以上的內容輸入至 Google 的 Notebooklm ,AI 將本篇內容整理成兩人對談的 Podcast 如下:

audio-thumbnail
0:00
/400.690958
策略