AI 术语通俗解读
你不需要理解 AI 背后的数学才能把 AI 用好。但你确实需要理解词汇,因为这些术语不断出现 — 产品描述、定价页、博客,以及那些假设你已经知道这些意思的对话中。
这不是教科书式的词汇表。每个术语都有通俗定义、真正有帮助的类比,以及具体的例子。不用术语解释术语。
核心概念
一个博学的助手。一个 LLM 在数十亿页文本上训练过 — 书籍、文章、网站、代码、对话 — 并学会了语言模式,足以生成听起来像人类的新文本。它不像你一样 “知道” 事情。它预测下一个最可能的词,一次又一次,速度惊人。但结果好到这种区别常常只是学术问题。
词的一个片段。AI 不像你那样读词 — 它把文本切分成 “token”,可以是完整单词、单词的一部分,甚至单个字符。像 “hello” 这样的常用词通常是一个 token。较长的词会被拆分:“extraordinary” 会变成约 3 个 token。经验法则:1 个 token ≈ 0.75 个词,或约 4 个字符。
上下文窗口 是 AI 在对话期间能保留在工作记忆中的文本总量。你说过的话、它说过的话,加上你粘贴过的任何文档 — 所有内容都必须装进 上下文窗口。一旦对话超出窗口,AI 就开始 “忘记” 早期部分。
你对 AI 的指令。提示词可以简单到 “法国的首都是什么?”,也可以复杂到一组多段落的指令,包含示例、约束和格式要求。你的提示词质量是影响回答质量的最大因素。
AI 如何思考(大致)
当 AI 模型处理你的提示词并生成输出时,这叫做 推理。模型本身训练过一次(那需要数周或数月和数百万美元)。之后你每次使用它,它都在做 推理 — 把学到的东西应用到你的具体输入。把训练想成上学,推理 就像参加考试。
一个参数(通常 0 到 1),控制 AI 回答的可预测性或创造性。温度 为 0 时,AI 总是选下一个最可能的词 — 可靠、一致,有时乏味。温度为 1 时,它引入随机性,选不那么显而易见的词,带来更有创意、更多样化的输出。把它想成介于 “严谨的会计” 和 “爵士乐手” 之间的滑杆。
AI 幻觉 是指模型生成听起来权威、看起来合理但完全虚构的信息。它不是在撒谎(它没有意图)— 它在预测听起来合理的文本应该是什么样的,而有时这个预测不符合现实。虚假引用、编造的统计数据、不存在的 URL 和自信但错误的事实主张,都是 幻觉。
让 AI 变得更聪明
拿一个预训练过的 LLM,在专门的数据集上进一步训练,让它在特定任务上变得更好。基础模型已经懂语言;微调 教它你所在领域的特定模式。就像雇用一个总体聪明的人,然后给他做在职专业培训。
不再只依赖模型训练时学到的东西,RAG 让 AI 在回答前先在一组特定的文档中搜索。它先检索相关信息,然后基于找到的内容生成答案。这大幅减少了事实性问题的 幻觉,因为 AI 基于真实的源材料工作,而不只是凭记忆。
嵌入 把一段文本转换成一串数字(一个 “向量”),捕捉它的含义。相似的文本得到相似的数字。这让 AI 能做语义搜索 — 找到关于同一主题的文档,即使它们用完全不同的词。这是支撑 RAG、推荐系统和智能搜索的技术。
商业面
训练、托管和提供 AI 模型的组织。当你使用 Claude 时,提供商是 Anthropic。使用 GPT-4 时,提供商是 OpenAI。使用 Gemini 时是 Google。提供商拥有模型,运行 GPU,设定价格。有些提供商构建自己的模型(Anthropic、Google);其他则托管由不同团队制作的模型(Together.ai、Fireworks)。
一家不运行自己 AI 的公司,而是在别人的 API 上构建产品。有些中间件增加真正的价值 — 更好的界面、计费功能、多提供商访问。另一些只是转售 API 访问加上溢价和一个 logo。关键问题是:这个中间件增加了什么价值?如果答案是 “没有”,那你只是在多付钱。
不必付平台的加价,你直接从提供商那里获取自己的 API 密钥(如 Anthropic 或 OpenAI),并把它接入平台。你以提供商的批发价直接付费给他们,平台只提供界面。就像带自己的食材去一家餐厅,只付烹饪费,而不是全餐价格。
多模态 & 文本之外
多模态 AI 可以处理和生成多种类型的内容:文本、图像、音频、视频或代码。早期的 AI 只处理文本 — 你输入,它回复。现代多模态模型可以看图并描述、听音频并转录,或接受文本描述并生成图像。趋势是向能处理一切的模型发展。
一种把 AI 模型连接到外部工具和数据源的标准方式。不仅是聊天,AI 还能搜索网页、查询数据库、读文件、运行代码、调用 API、在现实世界中采取行动。MCP 定义这些连接如何工作,从而任何兼容的工具都能与任何兼容的模型协作。把它想成 AI 的 USB — 一个通用插头,让你连接任何工具。
快速参考
LLM = AI 大脑 • Token = 其度量单位 • 上下文窗口 = 其工作记忆 • Prompt = 你的指令 • 推理 = AI 在思考 • 温度 = 创意度调节 • 幻觉 = 自信地编造 • 微调 = 专门训练 • RAG = 提供参考材料 • 嵌入 = 用数字表达含义 • 提供商 = 运行者 • 中间件 = 中间人 • BYOK = 你的密钥、他们的界面 • 多模态 = 超越文本 • MCP = AI + 真实工具
这就是词汇。你不必一次全部记住 — 遇到不确定的术语时回到本页。目标不是在 AI 对话中听起来聪明。目标是理解你在买什么、在用什么,以及向你卖 AI 工具的人到底在说什么。
想看这些概念付诸实践?Zubnet 把 61 个提供商的 361+ 个模型汇聚在一起 — 支持 BYOK、多模型对比和透明定价。