← לכל המאמרים בינה מלאכותית למתחילים

מה זה RAG ולמה כולם מדברים על זה?

תרשים של ארכיטקטורת RAG — שליפת מידע מוקטור-DB ושילוב במודל שפה

הסבר פשוט על RAG — שיטה לחבר מודלי שפה לידע פנימי של ארגון או אדם, ולקבל תשובות מדויקות יותר.

RAG הוא ראשי תיבות של Retrieval-Augmented Generation. במילים פשוטות: לתת למודל שפה גישה לידע ספציפי שלכם, לפני שהוא עונה. זו אחת השיטות החזקות ביותר לקבל תשובות מדויקות מ-AI על תכנים שהוא לא ראה בזמן האימון.

הבעיה ש-RAG פותר

מודלי שפה כמו Claude, ChatGPT או Gemini אומנו על המון טקסט פתוח באינטרנט. הם יודעים המון על העולם, אבל הם לא יודעים את:

אם תשאלו אותם שאלה על משהו פנימי — הם יענו תשובה משכנעת, אבל לא תמיד נכונה. זו תופעה שנקראת “הזיה” (hallucination), והיא הסיבה שאי אפשר להסתמך עליהם לעבודה רצינית בלי טיפול.

איך RAG עובד

הרעיון פשוט בעיקרון:

  1. לוקחים את הידע (מסמכים, FAQ, מאמרים, נהלים, מה שיש) ומפרקים אותו לקטעים קטנים
  2. ממירים כל קטע ל-Embedding — וקטור מספרי שמייצג את המשמעות
  3. שומרים את הוקטורים במסד נתונים מיוחד (Vector DB)
  4. כשמשתמש שואל שאלה, ממירים את השאלה ל-Embedding באותו אופן
  5. מחפשים את הקטעים הקרובים ביותר במסד הנתונים
  6. שולחים למודל את השאלה + הקטעים הרלוונטיים ומבקשים תשובה מבוססת רק עליהם

התוצאה: המודל עונה על השאלה שלכם, מבוסס על המידע שלכם, ועם אפשרות לציין מאיפה כל פיסת מידע הגיעה.

איפה RAG מבריק

הוא חזק במיוחד לתרחישים כמו:

מתי RAG לא הפתרון הנכון

RAG הוא לא קסם. הוא ארכיטקטורה מאוד שימושית, שעובדת מצוין כשמיישמים אותה נכון — ופחות טוב כשמנסים לדחוף אותה לכל בעיה. כמו רוב הדברים בעולם ה-AI: הכלי הנכון למקום הנכון.