Les termes d'IA expliqués sans jargon

Tu n'as pas besoin de comprendre les maths derrière l'IA pour bien l'utiliser. Mais tu dois comprendre le vocabulaire, parce que les termes reviennent sans cesse — dans les descriptions de produits, sur les pages de prix, dans les articles de blog et dans les conversations avec des gens qui supposent que tu sais déjà ce qu'ils veulent dire.

Ce n'est pas un glossaire de manuel. Chaque terme a une définition en langage clair, une analogie qui aide vraiment, et un exemple concret. Pas de jargon pour expliquer le jargon.

Les concepts fondamentaux

LLM — Large Language Model

Ce que les gens veulent dire quand ils disent “IA” dans la plupart des conversations

Un assistant vraiment bien lu. Un LLM a été entraîné sur des milliards de pages de texte — livres, articles, sites web, code, conversations — et a appris les schémas du langage assez bien pour générer du nouveau texte qui sonne humain. Il ne “sait” pas les choses comme toi. Il prédit le mot suivant le plus probable, encore et encore, incroyablement vite. Mais le résultat est tellement bon que la différence est souvent académique.

Exemple : Claude, GPT-4, Gemini, DeepSeek et Llama sont tous des LLM. Quand tu discutes avec une IA, tu parles à un LLM.

Token

L'unité que l'IA utilise pour mesurer le texte — pas tout à fait un mot, pas tout à fait une lettre

Un morceau de mot. L'IA ne lit pas les mots comme toi — elle découpe le texte en “tokens”, qui sont des morceaux qui peuvent être un mot entier, une partie d'un mot, ou même un seul caractère. Les mots courants comme “bonjour” sont généralement un token. Les mots plus longs sont divisés : “extraordinaire” devient environ 3 tokens. Règle approximative : 1 token ≈ 0,75 mot, ou environ 4 caractères.

Pourquoi c'est important : le prix de l'IA est par token. Quand un modèle coûte “3 $ par million de tokens d'entrée”, c'est environ 3 $ pour 750 000 mots — à peu près la longueur de 5 romans. Les fenêtres de contexte sont aussi mesurées en tokens.

Fenêtre de contexte

Combien l'IA peut “voir” à la fois

La fenêtre de contexte est la quantité totale de texte que l'IA peut garder dans sa mémoire de travail pendant une conversation. Tout ce que tu as dit, tout ce qu'elle a dit, plus tous les documents que tu as collés — tout doit tenir dans la fenêtre de contexte. Une fois que la conversation dépasse la fenêtre, l'IA commence à “oublier” les premières parties.

Échelle : 8K tokens ≈ un long article de blog. 32K ≈ un court roman. 128K ≈ un livre de 300 pages. 1M tokens (disponible sur certains modèles Gemini et Claude) ≈ environ 5 gros romans. Plus de contexte signifie que l'IA peut travailler avec de plus longs documents sans perdre le fil.

Prompt

Ce que tu tapes dans l'IA

Tes instructions à l'IA. Un prompt peut être aussi simple que “Quelle est la capitale de la France ?” ou aussi complexe qu'un ensemble d'instructions sur plusieurs paragraphes avec des exemples, des contraintes et des exigences de formatage. La qualité de ton prompt est le plus grand facteur de la qualité de la réponse.

Exemple : “Écris un courriel professionnel refusant une réunion” est un prompt. Tout comme “Tu es un nutritionniste expert. Basé sur les résultats sanguins suivants, suggère des changements alimentaires. Sois précis et cite ton raisonnement.”

Comment l'IA pense (plus ou moins)

Inférence

L'IA qui pense et génère une réponse

Quand un modèle d'IA traite ton prompt et génère une sortie, ça s'appelle l'inférence. Le modèle lui-même a été entraîné une fois (ce qui prend des semaines ou des mois et des millions de dollars). Chaque fois que tu l'utilises après ça, il fait de l'inférence — appliquant ce qu'il a appris à ton entrée spécifique. Pense à l'entraînement comme aller à l'école, et à l'inférence comme passer l'examen.

Pourquoi c'est important : l'inférence est ce pour quoi tu paies. Une inférence plus rapide signifie des réponses plus rapides. Les “coûts d'inférence” sont la dépense continue de faire tourner l'IA, par opposition au coût d'entraînement unique.

Température

Le cadran de créativité

Un paramètre (généralement de 0 à 1) qui contrôle à quel point les réponses de l'IA sont prévisibles ou créatives. À température 0, l'IA choisit toujours le mot suivant le plus probable — fiable, cohérent, parfois ennuyeux. À température 1, elle introduit du hasard, choisissant des mots moins évidents, menant à une sortie plus créative et variée. Pense à ça comme un curseur entre “comptable strict” et “musicien de jazz”.

Guide pratique : utilise une température basse (0 à 0,3) pour le code, l'extraction de données et les questions-réponses factuelles. Utilise une température plus élevée (0,7 à 1,0) pour l'écriture créative, le remue-méninges et la génération d'options variées.

Hallucination

Quand l'IA invente des choses avec assurance

Une hallucination d'IA, c'est quand le modèle génère une information qui sonne autoritaire et plausible mais qui est complètement inventée. Il ne ment pas (il n'a pas d'intention) — il prédit à quoi ressemble un texte qui sonne plausible, et parfois cette prédiction ne correspond pas à la réalité. Fausses citations, statistiques inventées, URL inexistantes et affirmations factuelles confiantes-mais-fausses sont toutes des hallucinations.

Exemple : tu demandes l'auteur d'un article spécifique. L'IA répond avec un nom d'auteur, un journal et une année qui sonnent réels — mais l'article n'existe pas. Ça arrive avec chaque modèle. Vérifie toujours les affirmations qui comptent.

Rendre l'IA plus intelligente

Fine-tuning

Apprendre de nouveaux tours à un modèle existant

Prendre un LLM pré-entraîné et l'entraîner davantage sur un jeu de données spécialisé pour qu'il devienne meilleur à une tâche spécifique. Le modèle de base connaît déjà le langage ; le fine-tuning lui enseigne les schémas particuliers de ton domaine. C'est comme engager quelqu'un de généralement intelligent puis lui donner une formation spécialisée en entreprise.

Exemple : un cabinet d'avocats fine-tune un modèle sur des milliers de mémoires juridiques pour qu'il écrive dans le bon style juridique et comprenne les conventions de la jurisprudence. Le modèle n'apprend pas le droit à partir de zéro — il adapte ce qu'il connaît déjà.

RAG — Retrieval-Augmented Generation

Donner à l'IA un livre de référence à consulter

Au lieu de se fier uniquement à ce que le modèle a appris pendant l'entraînement, le RAG permet à l'IA de chercher dans un ensemble spécifique de documents avant de répondre. Il récupère d'abord les infos pertinentes, puis génère une réponse basée sur ce qu'il a trouvé. Ça réduit dramatiquement les hallucinations pour les questions factuelles parce que l'IA travaille à partir de matériel source réel, pas juste de sa mémoire.

Exemple : tu téléverses le manuel RH de ton entreprise. Quand tu demandes “quelle est notre politique de congé parental ?”, l'IA cherche dans le manuel, trouve la section pertinente et répond à partir du document réel — pas d'une supposition.

Embedding

Convertir le texte en nombres pour que l'IA puisse chercher et comparer

Un embedding convertit un morceau de texte en une liste de nombres (un “vecteur”) qui capture son sens. Des textes similaires obtiennent des nombres similaires. Ça permet à l'IA de faire une recherche sémantique — trouver des documents qui portent sur le même sujet, même s'ils utilisent des mots complètement différents. C'est la technologie qui propulse le RAG, les systèmes de recommandation et la recherche intelligente.

Exemple : les phrases “comment retourner un produit ?” et “quelle est ta politique de remboursement ?” utilisent des mots différents mais ont des embeddings similaires, parce qu'elles veulent dire presque la même chose. Un système de recherche utilisant des embeddings les associerait.

Le côté business

Fournisseur

L'entreprise qui fait tourner l'IA

L'organisation qui entraîne, héberge et sert le modèle d'IA. Quand tu utilises Claude, le fournisseur est Anthropic. Quand tu utilises GPT-4, le fournisseur est OpenAI. Quand tu utilises Gemini, c'est Google. Les fournisseurs possèdent le modèle, font tourner les GPU et fixent les prix. Certains fournisseurs font leurs propres modèles (Anthropic, Google) ; d'autres hébergent des modèles faits par différentes équipes (Together.ai, Fireworks).

Sur Zubnet : on te connecte à 61 fournisseurs. Tu choisis le modèle ; on gère la connexion. Si un fournisseur tombe, tu passes à un autre sans rien changer.

Wrapper

Un intermédiaire entre toi et le fournisseur d'IA

Une entreprise qui ne fait pas tourner sa propre IA mais construit un produit par-dessus l'API de quelqu'un d'autre. Certains wrappers ajoutent une vraie valeur — meilleures interfaces, fonctions de facturation, accès multi-fournisseur. D'autres ne font que revendre l'accès à l'API avec une marge et un logo. La question clé est : quelle valeur ajoute le wrapper ? Si la réponse est “aucune”, tu ne fais que payer en plus.

Exemple : des centaines d'“outils d'écriture IA” sont des wrappers autour de la même API OpenAI. Tu pourrais obtenir la même sortie en utilisant directement ChatGPT. Un bon wrapper, par contre, te donne des fonctions que l'API brute n'a pas — comme comparer des modèles, gérer des coûts ou changer de fournisseur en un clic.

BYOK — Bring Your Own Key

Utiliser tes propres identifiants API sur la plateforme de quelqu'un d'autre

Au lieu de payer le prix majoré d'une plateforme, tu obtiens ta propre clé API directement du fournisseur (comme Anthropic ou OpenAI) et tu la branches dans la plateforme. Tu paies le fournisseur directement à ses tarifs de gros, et la plateforme ne fait que fournir l'interface. C'est comme apporter tes propres ingrédients à un restaurant qui facture des frais de cuisine au lieu du prix complet du repas.

Pourquoi c'est important : sur Zubnet, BYOK signifie que tu peux utiliser tes propres clés API et payer les fournisseurs directement, sans majoration sur les coûts d'IA eux-mêmes.

Multimodal & au-delà du texte

Multimodal

IA qui gère plus que juste du texte

Une IA multimodale peut traiter et générer plusieurs types de contenu : texte, images, audio, vidéo ou code. L'IA des premiers jours était uniquement texte — tu tapais, elle répondait. Les modèles multimodaux modernes peuvent regarder une image et la décrire, écouter un audio et le transcrire, ou prendre une description textuelle et générer une image. La tendance est vers des modèles qui gèrent tout.

Exemple : tu téléverses une photo d'une recette et demandes “de quels ingrédients ai-je besoin pour faire ça ?” Un modèle multimodal lit l'image, identifie le plat et liste les ingrédients — tout à partir d'une photo.

MCP — Model Context Protocol

Des outils qui permettent à l'IA de faire des choses au-delà de générer du texte

Une façon standard de connecter les modèles d'IA à des outils et sources de données externes. Au lieu de juste discuter, l'IA peut chercher sur le web, interroger des bases de données, lire des fichiers, exécuter du code, appeler des API et prendre des actions dans le monde réel. MCP définit comment ces connexions fonctionnent pour que n'importe quel outil compatible fonctionne avec n'importe quel modèle compatible. Pense à ça comme USB pour l'IA — une prise universelle qui te permet de connecter n'importe quel outil.

Exemple : avec MCP, un assistant IA pourrait vérifier ton calendrier, rédiger un courriel, chercher un vol et ajouter la réservation à ton tableur de voyages — tout en une conversation, utilisant de vrais outils, pas juste en générant du texte qui a l'air d'avoir fait ces choses.

Référence rapide

LLM = le cerveau IA • Token = son unité de mesure • Fenêtre de contexte = sa mémoire de travail • Prompt = tes instructions • Inférence = l'IA qui pense • Température = cadran de créativité • Hallucination = fiction confiante • Fine-tuning = entraînement spécialisé • RAG = lui donner du matériel de référence • Embedding = le sens en nombres • Fournisseur = qui le fait tourner • Wrapper = intermédiaire • BYOK = tes clés, leur interface • Multimodal = au-delà du texte • MCP = IA + vrais outils

Voilà le vocabulaire. Tu n'as pas besoin de tout mémoriser d'un coup — reviens sur cette page quand tu rencontres un terme dont tu n'es pas sûr. Le but n'est pas de paraître intelligent dans les conversations sur l'IA. C'est de comprendre ce que tu achètes, ce que tu utilises et de quoi parlent vraiment les gens qui te vendent des outils d'IA.

Tu veux voir ces concepts en action ? Zubnet met 361+ modèles de 61 fournisseurs au même endroit — avec le support BYOK, la comparaison multi-modèle et une tarification transparente.