AI 術語白話解讀
要好好使用 AI,你不需要懂背後的數學。但你確實需要懂詞彙,因為這些術語會一直出現 — 產品說明、價格頁、部落格,以及那些假設你早已知道這些意思的對話裡。
這不是教科書式的詞彙表。每個術語都有白話定義、真的有幫助的比喻,加上具體例子。不會用術語去解釋術語。
核心概念
一個博覽群書的助理。一個 LLM 用數十億頁文字訓練而成 — 書籍、文章、網站、程式碼、對話 — 它學會語言模式,好到足以產生聽起來像人類的新文字。它不像你那樣「知道」事情。它預測下一個最可能的字,一次又一次,速度驚人。但結果好到那個差別常常只是學術上的。
文字的碎片。AI 不像你那樣讀字 — 它把文字切成「token」,可以是完整單字、單字的一部分,或甚至單一字元。常用字像「hello」通常是一個 token。較長的字會被切開:「extraordinary」大約變成 3 個 token。經驗法則:1 個 token ≈ 0.75 個字,或大約 4 個字元。
上下文視窗是 AI 在一次對話中能在工作記憶裡留住的文字總量。你說過的話、它說過的話,加上你貼進去的任何文件 — 所有東西都必須塞得進上下文視窗。一旦對話超出視窗,AI 就會開始「忘記」較早的部分。
你給 AI 的指令。一個提示詞可以簡單到像「法國首都是哪裡?」,也可以複雜到是一整組帶範例、限制與格式要求的多段指令。你的提示詞品質,是影響回答品質最大的因素。
AI 怎麼思考(大致上)
當 AI 模型處理你的提示詞並產出回應時,那叫做推理。模型本身只訓練過一次(那需要數週或數月,以及數百萬美元)。之後你每次使用它,它都在做推理 — 把學到的東西套用到你特定的輸入。把訓練想成上學,推理就像在考試。
一個參數(通常是 0 到 1),控制 AI 回答的可預測度或創意度。溫度為 0 時,AI 每次都選下一個最可能的字 — 可靠、一致,有時無聊。溫度為 1 時,它會加入隨機性,選一些比較不明顯的字,帶來更多變、更有創意、更令人驚喜的輸出。把它想成介於「嚴謹會計」和「爵士樂手」之間的滑桿。
AI 幻覺是指模型產生聽起來權威又可信、但其實完全捏造的資訊。它不是在撒謊(它沒有意圖)— 它是在預測聽起來可信的文字長什麼樣,而有時那個預測跟真實不符。假引用、編造的統計數據、不存在的 URL,以及自信但錯誤的事實主張,全部都是幻覺。
讓 AI 變得更聰明
拿一個預先訓練好的 LLM,再在一個專門資料集上繼續訓練,讓它在特定任務上表現更好。基礎模型已經懂語言;微調教它你所在領域的特有模式。就像請一個大致聰明的人進來,再給他在職的專業訓練。
與其只依賴模型在訓練時學到的東西,RAG 讓 AI 在回答前先去一組特定文件裡搜尋。它先取出相關資訊,再根據找到的內容產生回答。這對事實性問題能大幅降低幻覺,因為 AI 是根據真實的來源材料,而不只是憑記憶。
嵌入會把一段文字轉成一串數字(一個「向量」),捕捉它的含義。相似的文字會拿到相似的數字。這讓 AI 能做語義搜尋 — 找出討論同一主題的文件,即使它們用的是完全不同的詞。這是RAG、推薦系統與智慧搜尋背後的技術。
商業面
訓練、代管並提供 AI 模型的組織。當你用 Claude 時,供應商是 Anthropic。用 GPT-4 時,供應商是 OpenAI。用 Gemini 時是 Google。供應商擁有模型、執行 GPU、訂定價格。有些供應商製作自己的模型(Anthropic、Google);有些則代管別的團隊做的模型(Together.ai、Fireworks)。
一家不執行自己 AI、而是基於別人 API 做產品的公司。有些中介真的有加值 — 更好的介面、計費功能、多供應商存取。有些只是把 API 加價後套個 logo 轉賣。關鍵問題是:這個中介加了什麼價值?如果答案是「沒有」,你就只是多付錢而已。
與其付平台加價後的錢,你直接跟供應商(如 Anthropic 或 OpenAI)拿自己的 API 金鑰,再接進平台。你用供應商的批發價直接付給他們,平台只提供介面。就像帶自己的食材到餐廳,只付烹飪費,不是整份餐點的錢。
多模態 & 文字之外
多模態 AI 能處理並產出多種類型的內容:文字、影像、音訊、影片或程式碼。早期 AI 只處理文字 — 你輸入、它回覆。現代多模態模型可以看一張影像並描述它、聽音訊並轉錄,或拿一段文字描述產出影像。趨勢是朝著能處理一切的模型前進。
把 AI 模型連到外部工具與資料來源的標準方法。AI 不只是聊天,還能搜尋網頁、查詢資料庫、讀檔案、執行程式、呼叫 API、在真實世界裡採取行動。MCP 定義這些連線要怎麼運作,讓任何相容工具都能與任何相容模型搭配。把它想成 AI 的 USB — 一個通用插頭,讓你接上任何工具。
快速參考
LLM = AI 大腦 • Token = 它的度量單位 • 上下文視窗 = 它的工作記憶 • Prompt = 你的指令 • 推理 = AI 在思考 • 溫度 = 創意調節鈕 • 幻覺 = 自信滿滿的虛構 • 微調 = 專門訓練 • RAG = 給它參考材料 • 嵌入 = 把意義化成數字 • 供應商 = 跑它的人 • 中介 = 中間人 • BYOK = 你的金鑰、他們的介面 • 多模態 = 文字之外 • MCP = AI + 真實工具
這就是詞彙。你不用一口氣全部背下來 — 碰到不確定的術語再回到這一頁。目標不是在 AI 對話裡聽起來聰明。而是搞懂你在買什麼、在用什麼,以及那些在賣你 AI 工具的人到底在談什麼。
想看這些概念實際運作?Zubnet 把 61 家供應商的 361+ 個模型放在同一個地方 — 支援 BYOK、多模型比較與透明定價。