AI terms बिना jargon के समझाए

AI को अच्छे से use करने के लिए आपको उसके पीछे की math समझने की जरूरत नहीं है। लेकिन आपको vocabulary समझने की जरूरत है, क्योंकि terms हर जगह आते रहते हैं — product descriptions, pricing pages, blogs, और उन लोगों के साथ conversations में जो assume करते हैं कि आप पहले से जानते हैं कि उनका क्या मतलब है।

यह कोई textbook glossary नहीं है। हर term को plain language definition, एक analogy जो वाकई help करती है, और एक concrete example मिलता है। Jargon को explain करने के लिए कोई jargon नहीं।

Core concepts

LLM — Large Language Model

ज्यादातर conversations में जब लोग “AI” कहते हैं तो उनका मतलब क्या होता है

एक बहुत पढ़ा-लिखा assistant। एक LLM billions of pages of text पर trained है — books, articles, websites, code, conversations — और उसने language के patterns इतनी अच्छी तरह सीख लिए हैं कि human-sounding new text generate कर सकता है। यह चीजों को आपकी तरह “जानता” नहीं है। यह next most likely word predict करता है, बार-बार, incredibly तेज़ी से। लेकिन result इतना अच्छा है कि difference अक्सर academic होता है।

Example: Claude, GPT-4, Gemini, DeepSeek और Llama सब LLMs हैं। जब आप AI के साथ chat करते हैं, तो आप एक LLM से बात कर रहे हैं।

Token

AI जिस unit में text measure करती है — न ठीक word, न ठीक letter

एक word का टुकड़ा। AI आपकी तरह words नहीं पढ़ती — वो text को “tokens” में break करती है, जो chunks होते हैं जो एक whole word, word का part, या एक single character भी हो सकते हैं। “Hello” जैसे common words usually एक token होते हैं। Longer words split हो जाते हैं: “extraordinary” लगभग 3 tokens बन जाता है। Rule of thumb: 1 token ≈ 0.75 words, या लगभग 4 characters।

क्यों matter करता है: AI pricing per token होती है। जब एक model “3 $ per million input tokens” cost करता है, वह लगभग 3 $ per 750,000 words है — लगभग 5 novels के length के बराबर। Context windows भी tokens में measure होती हैं।

Context window

AI एक बार में कितना “देख” सकती है

Context window conversation के दौरान AI अपनी working memory में कितना total text hold कर सकती है उसकी total amount है। आपने जो कुछ कहा, जो कुछ उसने कहा, plus कोई भी document जो आपने paste किया — सब कुछ context window में fit होना चाहिए। एक बार conversation window से exceed करती है, AI earlier parts को “भूलना” शुरू कर देती है।

Scale: 8K tokens ≈ एक long blog post। 32K ≈ एक short novel। 128K ≈ एक 300-page book। 1M tokens (कुछ Gemini और Claude models पर available) ≈ लगभग 5 thick novels of text एक single conversation में। ज्यादा context मतलब AI thread खोए बिना longer documents पर काम कर सकती है।

Prompt

जो आप AI को type करते हैं

AI के लिए आपके instructions। एक prompt इतना simple हो सकता है जितना “France की capital क्या है?” या इतना complex जितना examples, constraints और formatting requirements के साथ multi-paragraph instructions का एक set। आपके prompt की quality response की quality में सबसे बड़ा factor है।

Example: “Meeting decline करते हुए एक professional email लिखो” एक prompt है। “तुम एक expert nutritionist हो। निम्नलिखित blood results के आधार पर, dietary changes suggest करो। Specific बनो और अपनी reasoning cite करो।” भी।

AI कैसे सोचती है (kind of)

Inference

AI सोच रही है और response generate कर रही है

जब एक AI model आपके prompt को process करता है और output generate करता है, उसे inference कहते हैं। Model खुद एक बार train हुआ था (जिसमें weeks या months लगे और millions of dollars)। उसके बाद जब भी आप इसे use करते हैं, यह inference कर रहा है — जो सीखा उसे आपके specific input पर apply कर रहा है। Training को school जाने जैसा और inference को exam देने जैसा सोचें।

क्यों matter करता है: inference वो है जिसका आप pay करते हैं। Faster inference मतलब faster responses। “Inference costs” AI को चलाने का ongoing expense है, एक बार के training cost से अलग।

Temperature

Creativity dial

एक parameter (usually 0 से 1) जो control करता है कि AI के responses कितने predictable या creative हैं। Temperature 0 पर AI हमेशा next most likely word choose करती है — reliable, consistent, कभी-कभी boring। Temperature 1 पर यह randomness introduce करती है, less obvious words choose करती है, जो more creative और varied output की तरफ ले जाता है। इसे “strict accountant” और “jazz musician” के बीच एक slider के रूप में सोचें।

Practical guide: code, data extraction और factual Q&A के लिए low temperature (0-0.3) use करें। Creative writing, brainstorming और diverse options generation के लिए higher temperature (0.7-1.0) use करें।

Hallucination

जब AI confidently चीजें बना देती है

AI hallucination तब होती है जब model ऐसी information generate करता है जो authoritative और plausible sound करती है लेकिन completely fabricated होती है। यह झूठ नहीं बोल रहा (intention नहीं है) — यह predict कर रहा है कि plausible-sounding text कैसा दिखता है, और कभी-कभी वो prediction reality से match नहीं करती। Fake citations, invented statistics, non-existent URLs और confident-but-wrong factual claims सब hallucinations हैं।

Example: आप एक specific paper के author के लिए पूछते हैं। AI एक real-sounding author name, journal और year से respond करती है — लेकिन paper exist नहीं करता। यह हर model के साथ होता है। हमेशा matter करने वाले claims verify करें।

AI को smarter बनाना

Fine-tuning

मौजूदा model को नए tricks सिखाना

एक pre-trained LLM लेना और उसे specialized dataset पर आगे train करना ताकि वो specific task पर बेहतर हो जाए। Base model पहले से language जानता है; fine-tuning उसे आपके domain के particular patterns सिखाता है। यह generally smart किसी को hire करके फिर job-specific training देने जैसा है।

Example: एक law firm एक model को thousands of legal briefs पर fine-tune करती है ताकि यह appropriate legal style में लिखे और case law conventions समझे। Model scratch से law नहीं सीखता — यह जो पहले से जानता है उसे adapt करता है।

RAG — Retrieval-Augmented Generation

AI को reference book देना consult करने के लिए

Model ने training के दौरान जो सीखा सिर्फ उस पर depend करने के बजाय, RAG AI को answer देने से पहले specific documents के set में search करने देता है। यह पहले relevant information retrieve करता है, फिर जो मिला उसके आधार पर answer generate करता है। यह factual questions के लिए hallucinations को dramatically reduce करता है क्योंकि AI real source material से काम कर रही है, सिर्फ memory से नहीं।

Example: आप अपनी company का HR manual upload करते हैं। जब आप पूछते हैं “हमारी parental leave policy क्या है?”, तो AI manual में search करती है, relevant section find करती है, और actual document के आधार पर answer देती है — guess से नहीं।

Embedding

Text को numbers में convert करना ताकि AI search और compare कर सके

एक embedding text के एक piece को numbers की list (एक “vector”) में convert करता है जो उसका meaning capture करता है। Similar texts को similar numbers मिलते हैं। यह AI को semantic search करने देता है — documents find करना जो same topic के बारे में हैं, भले ही वो completely different words use करते हों। यह वो technology है जो RAG, recommendation systems और smart search को power करती है।

Example: sentences “मैं product कैसे return करूँ?” और “आपकी refund policy क्या है?” different words use करती हैं लेकिन similar embeddings रखती हैं, क्योंकि उनका almost same मतलब है। Embeddings use करने वाला search system इन्हें match करेगा।

Business side

Provider

AI चलाने वाली company

वो organization जो AI model को train, host और serve करती है। जब आप Claude use करते हैं, provider Anthropic है। जब आप GPT-4 use करते हैं, provider OpenAI है। जब आप Gemini use करते हैं, Google है। Providers model के owner हैं, GPUs चलाते हैं और pricing set करते हैं। कुछ providers अपने खुद के models बनाते हैं (Anthropic, Google); दूसरे अलग teams द्वारा बनाए गए models host करते हैं (Together.ai, Fireworks)।

Zubnet पर: हम आपको 61 providers से connect करते हैं। आप model choose करते हैं; हम connection handle करते हैं। अगर एक provider down होता है, तो आप कुछ भी बदले बिना दूसरे पर switch कर जाते हैं।

Wrapper

आपके और AI provider के बीच एक middleman

एक company जो अपनी खुद की AI नहीं चलाती बल्कि किसी और की API पर एक product build करती है। कुछ wrappers genuine value add करते हैं — better interfaces, billing features, multi-provider access। दूसरे बस markup और एक logo के साथ API access resell करते हैं। Key question है: wrapper क्या value add करता है? अगर answer “कुछ नहीं” है, तो आप बस extra pay कर रहे हैं।

Example: hundreds of “AI writing tools” same OpenAI API के around wrappers हैं। आप directly ChatGPT use करके same output पा सकते हैं। एक अच्छा wrapper, उलटे, आपको ऐसी features देता है जो raw API में नहीं होतीं — जैसे models compare करना, costs manage करना या एक click से providers switch करना।

BYOK — Bring Your Own Key

किसी और के platform पर अपनी खुद की API credentials use करना

एक platform की markup पricing pay करने के बजाय, आप provider से directly अपनी खुद की API key लेते हैं (जैसे Anthropic या OpenAI) और उसे platform में plug करते हैं। आप provider को उनकी wholesale rates पर directly pay करते हैं, और platform सिर्फ interface provide करता है। यह अपनी ingredients एक restaurant में लाने जैसा है जो full meal price के बजाय cooking fee charge करती है।

क्यों matter करता है: Zubnet पर, BYOK का मतलब है आप अपनी खुद की API keys use कर सकते हैं और providers को directly pay कर सकते हैं, AI costs खुद पर कोई markup नहीं।

Multimodal & text से परे

Multimodal

AI जो सिर्फ text से ज्यादा handle करती है

एक multimodal AI multiple types of content process और generate कर सकती है: text, images, audio, video या code। Early AI text-only थी — आप type करते थे, वो type करती थी। Modern multimodal models एक image को देख और describe कर सकते हैं, audio सुन और transcribe कर सकते हैं, या text description लेकर image generate कर सकते हैं। Trend ऐसे models की तरफ है जो सब कुछ handle करें।

Example: आप एक recipe की photo upload करते हैं और पूछते हैं “इसे बनाने के लिए मुझे कौनसी ingredients चाहिए?” एक multimodal model image पढ़ता है, dish identify करता है, और ingredients list करता है — सब एक photo से।

MCP — Model Context Protocol

Tools जो AI को text generate करने से परे चीजें करने देते हैं

AI models को external tools और data sources से connect करने का एक standard way। बस chat करने के बजाय, AI web search कर सकती है, databases query कर सकती है, files पढ़ सकती है, code execute कर सकती है, APIs call कर सकती है और real world में actions ले सकती है। MCP define करता है ये connections कैसे काम करते हैं ताकि कोई भी compatible tool किसी भी compatible model के साथ काम करे। इसे AI के लिए USB के रूप में सोचें — एक universal plug जो आपको कोई भी tool connect करने देता है।

Example: MCP के साथ, एक AI assistant आपका calendar check कर सकता है, एक email draft कर सकता है, एक flight search कर सकता है और booking आपकी travel spreadsheet में add कर सकता है — सब एक conversation में, real tools use करके, सिर्फ text generate नहीं करके जो ऐसा लगे कि उसने ये चीजें कीं।

Quick reference

LLM = AI brain • Token = उसकी measurement unit • Context window = उसकी working memory • Prompt = आपके instructions • Inference = AI सोच रही है • Temperature = creativity dial • Hallucination = confident fiction • Fine-tuning = specialized training • RAG = reference material देना • Embedding = numbers में meaning • Provider = जो इसे चलाता है • Wrapper = middleman • BYOK = आपकी keys, उनका interface • Multimodal = text से परे • MCP = AI + real tools

वो रही vocabulary। आपको यह सब एक बार में याद करने की जरूरत नहीं — जब कोई term मिले जिसके बारे में sure न हों तो इस page पर वापस आएँ। Goal AI conversations में smart sound करना नहीं है। Goal यह समझना है कि आप क्या खरीद रहे हैं, क्या use कर रहे हैं, और AI tools बेचने वाले लोग वाकई किस बारे में बात कर रहे हैं।

इन concepts को action में देखना चाहते हैं? Zubnet 361+ models को 61 providers से एक जगह रखता है — BYOK support, multi-model comparison और transparent pricing के साथ।