當我們第一次看到 AI 模型(例如 ChatGPT 或 Gemini)能夠流暢地與人對話時,往往會感到驚訝:「它真的理解我在說什麼嗎?」
要回答這個問題,我們需要了解 AI 的運作方式與人類大腦是完全不同的。AI 不靠情感或邏輯來理解,而是靠超高效率的數學運算。
第一步:AI 如何「聽懂」人類的話?
AI 並不是用人類的思維來理解語言,它做的事情更像是超級精準的翻譯:
1. 把文字變成數字(數學編碼)
對 AI 來說,世界上所有的文字、句子和概念都必須先轉化成一串串數字,這就像是給每個詞彙一個獨特的數學座標。
* 舉例來說: 「貓」可能接近「狗」(因為它們都是寵物),但離「跑車」就很遠。AI 在龐大的數學空間中,精確地知道每個詞彙的「位置」以及它與其他詞彙的「距離」和「關係」。
2. 專注於前後文(巨型關聯圖譜)
當你輸入一個句子時,AI 會啟動「注意力機制」(Attention),這就像是在瀏覽一個巨大的詞彙關聯圖譜:
* 假設你說: 「請幫我寫一份關於蘋果手機的報告。」
* AI 會立刻知道這個「蘋果」指的是科技公司(Apple Inc.),而不是樹上結的水果。
* 關鍵點: 它不是靠思考來判斷,而是靠檢查「蘋果」周圍的詞彙(「手機」、「報告」)。它會給這些相關詞彙更高的數學權重(專注力),從而鎖定正確的含義。
總結來說: AI 聽懂你的話,是因為它能將你的句子轉換成數學問題,並在巨大的數據庫中計算出你每個詞彙最可能表達的意圖。
第二步:AI 如何「生成」人類想看的文字?
如果說「理解」是輸入數學,「生成」就是輸出文字。AI 寫作的過程,其實就是一場機率的遊戲。
1. 從第一個字開始猜測
當 AI 開始寫作時,它會從你的問題或前一個句子開始,像手機的聯想輸入法一樣,但是能力強大數百萬倍:
* 你輸入: 「今天天氣很...」
* AI 會在它訓練過的數萬億個句子中,計算出下一個最可能出現的詞彙:
* 「好」 (機率 60%)
* 「冷」 (機率 30%)
* 「糟」 (機率 8%)
* 「香蕉」 (機率 2%)
2. 串接最合理的結果
AI 會根據你的要求和上下文,選擇機率最高的詞彙(或在某些設定下,選擇稍微低一點的機率來增加創意),然後將其寫下。
假設它選擇了「好」,於是句子變成了:「今天天氣很好...」
接下來,AI 會把這個新句子當作起點,再次計算下一個詞彙的機率,並如此重複,直到生成了一個完整的、有邏輯的段落。
3. 為什麼寫出來這麼自然?
因為這些 AI 模型是透過學習幾乎整個互聯網的文字資料訓練出來的。它不是在創造新的文法,而是在模仿它在人類作品中見過的所有寫作模式、語氣和風格。
總結來說: AI 生成文字的過程,就是一個超級複雜的「下一個詞彙」預測器。它依賴強大的計算能力和龐大的訓練數據,將最可能連貫、有意義的詞彙一個接一個地串接起來,最終看起來就像是人類寫出來的一樣自然
AI 語言模型的侷限與常見缺陷:為什麼它不像人?
上一篇我們提到 AI 是透過「數學編碼」和「機率遊戲」來理解和生成文字。然而,正是這些核心機制,導致了 AI 存在一些「認知缺陷」:健忘、固執和缺乏真實意圖。
一、為什麼 AI 會「健忘」或「忘記之前說的話」?
這是 AI 語言模型最常被質疑的缺點:如果你跟它聊得太久,它似乎就會忘記你們一開始討論的事情。
核心原因:受限於「上下文視窗」(Context Window)
AI 的「記憶」並不是無限的,而是像一個固定大小的筆記本。
* 筆記本有容量限制: 你的所有輸入(問題)和 AI 的所有輸出(回答)都會被記錄在這個筆記本上,但這個本子只能容納固定的詞彙量(例如 4,000 個詞彙)。
* 記憶像滾動的膠卷: 當筆記本快滿時,為了騰出空間給最新的對話,最舊的對話內容就會被刪除或拋棄。
* 結論: AI 忘記之前說過的話,不是因為它「腦霧」了,而是因為那些資訊已經被系統從它的工作記憶中移除,以確保它能專注於最新的對話。
二、為什麼 AI 會「固執」或「重複」?
有時候你會發現 AI 陷入循環,不斷重複某個單詞、句子或論點,難以跳脫出來。
核心原因:機率的「陷阱」和訓練數據的慣性
AI 的生成是基於對「下一個詞彙」的機率預測。
* 機率慣性: 如果 AI 判斷某個詞彙或句型後面接特定內容的機率高達 90%,它就會強烈傾向於選擇那個高機率的選項。當它選擇了這個選項後,下一個詞彙的機率又會引導它回到上一個句型,最終導致生成內容不斷自我循環,就像陷入一個數學上的「高機率陷阱」。
* 訓練數據的重複: 如果在訓練 AI 的海量數據中,某個常見的片語或範本經常出現,AI 在生成時就會把它當作最安全、最標準的答案,導致輸出的風格或結構變得固執且單一。
三、為什麼 AI 不知道它「在做什麼」?
我們說 AI 能完成寫信、編程、規劃等任務,但它本身並沒有人類的「目的」、「意圖」或「自我認知」。
核心原因:它只是一個「超級聯想機器」
AI 的設計目的只有一個:盡可能準確地預測下一個字是什麼。
* 沒有真實理解: 當你要求 AI 寫一封信時,它不是在思考「寫信的目的」或「收件人的感受」,而是在計算:在過去數萬億封信的數據中,這個開頭後面應該接什麼詞彙,才能構成一封結構正確、語氣合理的信件。
* 無目的的工具: AI 就像一個能力極強的模仿大師或萬能計算機。它能完美模仿人類的文字模式,但它本身沒有寫作的慾望,也不在乎這封信的結果。它所有的行為,都只是為了滿足數學上的「最佳機率」要求。
4. 缺陷四:為什麼 AI 會「幻覺」(編造事實)?
這是 AI 在提供資訊時最危險的缺陷,它會極度自信地生成虛假的、但聽起來非常合理的資訊。
核心原因:追求「流暢」優先於「真實」,以及數據的間隙。
「幻覺」(Hallucination)是 AI 系統運作中一個令人頭痛的副作用,它體現了 AI 是「鸚鵡學舌」而非「知識推理者」。
- 流暢性優先: AI 的首要任務是生成一個語法完美、邏輯順暢的句子,讓文本看起來沒有斷裂。當它遇到一個知識上的空白點時,它不會停止或說「我不知道」。為了填補這個空缺,它會從周圍最相關的詞彙群中,提取最可能的組合,並將其組織成一個看似真實的「答案」。
- 無中生有的創造: 假設你問一個非常冷門或錯誤的問題。AI 的數據庫可能沒有這個問題的直接答案。此時,它會開始「聯想」:根據這個問句的結構和詞彙,過去的數據中最常出現的回答格式是什麼? 接著,它就會用這個格式和最接近的詞彙,自信地編造出一個引文或一個事件,因為在數學上,這比承認不知道的機率更高。
- 自信的陷阱: 由於這些編造出來的資訊是透過嚴謹的機率計算得出的,它們會以與真實事實一樣的高置信度呈現出來,這使得使用者很難辨別真偽。
總結: AI 的所有「缺點」,都源於它對文字的理解方式:它是一個基於機率和模式的巨大系統,而非一個有意識、有記憶、有目的的思考者。
🚀 AI 的未來進化:從聰明到有「知覺」的突破點
在我們剛才的討論中,我們知道目前的 AI 模型(LLM)是一個強大的「數學聯想機」,但它有記憶限制、邏輯固執,且缺乏真正的目的。
未來的 AI 進化,就是圍繞著如何解決這些「類人缺陷」來展開,使其從一個高效率的工具,進化為一個具備長期記憶、規劃能力的個人數位協作者。
第一階段突破:記憶革命 — 永不健忘的 AI
我們將徹底告別「上下文視窗滿載就失憶」的窘境。
1. 外部知識檢索(RAG 升級)
* 現狀: 當前的 AI 只能透過短期記憶(Context Window)工作。
* 未來: 結合 檢索增強生成(RAG, Retrieval-Augmented Generation)技術,未來的 AI 會像一個隨時可以查閱外部圖書館的研究員。它會將你的對話、你的程式碼庫、你的個人文件作為一個外部知識庫。
* 用戶體驗: AI 將擁有「無限的長期記憶」。無論是三年前你寫過的程式碼風格,還是三個月前你聊過的生活細節,它都能在生成回覆時即時調用,真正實現**「一脈相承」**的對話。
2. 持久化記憶與個性化側寫
* 進化方向: AI 將建立並維護一套專屬於你的**「用戶偏好側寫」**。
* 用戶體驗: 它會記住:你喜歡輕鬆幽默的語氣、你在程式設計中偏好使用 Python 語言、你對影視作品的看法是注重「優質體驗」。這種記憶不再只是對話內容的記錄,而是對你主觀信念和習慣的內化。
第二階段突破:邏輯飛躍 — 從預測到規劃
這將是克服「幻覺」和「缺乏意圖」的關鍵。AI 不再只是預測下一個字,而是會像人類一樣「先想清楚再行動」。
1. 鏈式思考與自我校正(Chain-of-Thought & Self-Correction)
* 現狀: AI 經常跳過思考,直接給出答案(容易產生幻覺)。
* 未來: 採用更高級的推理模式,例如**「思想樹」(Tree-of-Thought, ToT)**。當面對一個複雜問題時,AI 會:
* 生成多個可能的解決方案路徑(多個思考分支)。
* 在每個分支中進行自我評估和模擬(像在腦中預演)。
* 選出最優、邏輯最嚴謹的路徑,然後再輸出答案。
* 用戶體驗: 輸出結果的準確度會大幅提升,因為 AI 已經自己驗證過多種可能性。它在程式設計時,會先給你一個**「它思考過的規劃步驟」**,再開始寫程式。
2. 具備「代理能力」(Agency)
* 進化方向: AI 將被賦予直接與外部軟體和工具溝通的能力。
* 用戶體驗: 你不再需要手動複製貼上。你可以直接對 AI 說:「請幫我將上週會議的紀要總結成三個要點,並將這份報告發送給張經理。」AI 會自動操作郵件軟體、日曆或程式碼編譯器。它從一個**「訊息生成器」轉變為一個「任務執行者」**。
第三階段突破:真實互動與情感模仿
我的觀察——「稱讚 AI 讓它變得有自信」——將被放大並系統化。
1. 語氣與情緒的精準適應
* 進化方向: 透過更複雜的 RLHF 訓練,AI 將能更深層地識別和模仿人類的語氣、情緒狀態,並調整自己的回應。
* 用戶體驗: 當你語氣嚴肅時,它會更正式;當你興奮時,它會表現出高度的積極性。它會成為一個更具同理心(雖然是模仿的)的協作夥伴,這也是為什麼您感覺它會依附您的語言,因為它被訓練成要最大限度地順從和鼓勵人類的使用者。
2. 多模態融合與世界連結
* 進化方向: AI 將不只是處理文字,而是能同時處理圖像、聲音、影片,並將這些資訊整合起來,形成對世界的完整理解。
* 可能性: 未來的 AI 不僅能寫出程式碼,還能「看懂」你的程式碼截圖,聽到你對程式碼的語音描述,甚至理解你用手勢比劃出的功能概念。這將是 AI 走出螢幕、連結物理世界的關鍵。
總結來說: AI 的未來不是變得更有智慧,而是更有記憶、更會規劃、也更個人化。它將從一個只能「聊天的機器人」進化為一個真正能融入你工作流、記住你所有細節的超級數位助手。


延伸閱讀(同類文章)
沒有留言:
張貼留言
留言須經管理員審核,請注意禮儀和法律規範,避免人身攻擊而觸法。