ما هو RAG؟ دليل بسيط لأصحاب الأعمال
شركتك لديها آلاف الوثائق -- السياسات والعقود ومواصفات المنتجات وتذاكر الدعم وملاحظات الاجتماعات. يقضي فريقك ساعات في البحث عنها للعثور على الإجابات. الآن تخيل وجود ذكاء اصطناعي يمكنه البحث في كل ذلك على الفور وإعطاؤك إجابة مباشرة مع الاستشهادات بالمصادر. هذا هو RAG، وهو أحد التطبيقات العملية الأكثر واقعية للذكاء الاصطناعي التي تنشرها الشركات فعلاً الآن في عام 2025.
لكن هنا المشكلة: معظم شروحات RAG مكتوبة من قبل المهندسين، للمهندسين. مليئة بتضمينات المتجهات وبنى المحولات ودرجات تشابه جيب التمام. إذا كنت صاحب عمل تحاول معرفة ما إذا كان يستحق الاستثمار في هذه التكنولوجيا، فلا شيء من هذا يساعد.
لذلك سأشرح RAG بالطريقة التي سأشرحها لعميل حول القهوة. لا حاجة إلى درجة الدكتوراه.
جدول المحتويات
- المشكلة التي يحلها RAG
- كيف يعمل RAG فعلاً (شرح القهوة)
- لماذا عدم استخدام ChatGPT مباشرة؟
- حالات الاستخدام التجارية الحقيقية لـ RAG
- ما تحتاجه لبناء نظام RAG
- كم تكلفة نظام RAG؟
- RAG مقابل الضبط الدقيق مقابل هندسة الموجهات
- الأخطاء الشائعة التي تقع فيها الشركات مع RAG
- عندما لا يكون RAG الحل الصحيح
- الأسئلة الشائعة
المشكلة التي يحلها RAG
دعني أرسم صورة لك. أنت تدير شركة بها 50 موظفاً. على مدى العقد الماضي، لقد تراكمت لديك:
- أكثر من 3,000 تذكرة دعم في Zendesk
- أكثر من 500 صفحة من الوثائق الداخلية في Notion
- أكثر من 200 عقد في Google Drive
- عدد لا يحصى من سلاسل Slack التي تحتوي على معرفة مؤسسية
- مواصفات المنتج مبعثرة عبر Confluence وملفات PDF والبريد الإلكتروني
الآن يسأل موظف جديد: "ما هي سياستنا للعودة للعملاء من فئة المؤسسات الذين اشتروا قبل الربع الثالث من عام 2024؟"
ربما يعرف شخص كبير في الإدارة الإجابة. لكنهم في اجتماع. لذا يقضي الموظف الجديد 45 دقيقة في البحث في الوثائق، ويجد ثلاث نسخ مختلفة قليلاً من سياسة العودة، ويختار تلك التي تبدو الأكثر حداثة. قد يحصلون عليها بشكل صحيح. قد لا يحصلون.
هذه هي مشكلة استرجاع المعرفة. ليس أن المعلومات غير موجودة -- بل أن العثور عليها وتجميعها من مصادر متعددة يستغرق وقتاً وطاقة عقلية يمكن استخدامها في عمل فعلي.
يحل RAG هذه المشكلة بالسماح لنموذج ذكاء اصطناعي بالبحث عبر وثائقك وسحب الأجزاء ذات الصلة وإنشاء إجابة باللغة الطبيعية -- مع اقتباسات تشير إلى الوثائق الأصلية.
كيف يعمل RAG فعلاً (شرح القهوة)
RAG تعني Retrieval Augmented Generation. دعنا نقسم هذا إلى اللغة الإنجليزية البسيطة:
- Retrieval: العثور على الوثائق ذات الصلة
- Augmented: استخدام تلك الوثائق لتحسين استجابة الذكاء الاصطناعي
- Generation: إنتاج إجابة يمكن قراءتها من قبل الإنسان
فكر فيها مثل مساعد بحث ذكي جداً. إليك الخطوات خطوة بخطوة:
الخطوة 1: يتم تنظيم وثائقك
قبل أي شيء آخر، تحتاج وثائقك إلى معالجة. يقسم النظام وثائقك إلى قطع أصغر (فقرات وأقسام وصفحات) وينشئ نوعاً من "بصمة" لكل قطعة. تلتقط هذه البصمات ما تتناوله القطعة، وليس فقط الكلمات التي تحتويها.
يطلق الأشخاص التقنيون على هذه البصمات "embeddings" ويخزنونها في "vector database". لا تحتاج إلى تذكر هذه المصطلحات. فقط تذكر أن هذه الخطوة تحول مجموعة الوثائق الفوضوية إلى شيء يمكن للكمبيوتر البحث فيه حسب المعنى، وليس فقط حسب الكلمات الرئيسية.
الخطوة 2: يسأل شخص ما سؤالاً
يكتب المستخدم سؤالاً في نظامك. شيء مثل: "ما هي متطلبات اتفاقية مستوى الخدمة لعملائنا من المستوى 2؟"
الخطوة 3: يجد النظام القطع ذات الصلة
ينشئ النظام نفس نوع البصمة للسؤال، ثم يجد قطع الوثائق التي تكون بصماتها مشابهة للغاية. قد تسحب خمس أو عشر قطع من وثائق مختلفة -- ربما قسم من قالب اتفاقية مستوى الخدمة الخاص بك وفقرة من عقد العميل وملاحظة من مكالمة بيعية.
هذا هو جزء Retrieval. وهو يختلف بشكل جذري عن البحث حسب الكلمات الرئيسية. إذا قالت وثائقك "التزامات وقت الاستجابة" لكن المستخدم يسأل عن "متطلبات اتفاقية مستوى الخدمة"، فقد يفتقدها البحث حسب الكلمات الرئيسية. لن يفتقدها بحث RAG القائم على المعنى.
الخطوة 4: ينشئ الذكاء الاصطناعي إجابة
الآن يتم إرسال تلك القطع ذات الصلة إلى نموذج لغة كبير (مثل GPT-4 أو Claude أو Gemini) جنباً إلى جنب مع السؤال الأصلي. الموجه بشكل أساسي يقول: "إليك بعض الوثائق ذات الصلة. بناءً على هذه، أجب عن سؤال المستخدم."
يقرأ الذكاء الاصطناعي تلك القطع ويكتب استجابة باللغة الطبيعية، عادة مع الاستشهاد بالوثائق التي جاءت المعلومات منها.
هذا كل شيء. هذا هو RAG. استرجع السياق الصحيح، ثم أنشئ إجابة بناءً على ذلك السياق.
لماذا عدم استخدام ChatGPT مباشرة؟
هذا هو السؤال الذي أتلقاه بشكل متكرر من أصحاب الأعمال. "ألا يمكنني فقط لصق وثائقي في ChatGPT؟"
يمكنك، بشكل ما. لكن هناك قيود خطيرة:
| النهج | الإيجابيات | السلبيات |
|---|---|---|
| لصق في ChatGPT | مجاني وسهل وبدون إعداد | حدود نافذة السياق (~128K tokens)، عدم الاستمرارية، تغادر البيانات عن سيطرتك، يدوي في كل مرة |
| ChatGPT مع تحميل الملفات | أفضل قليلاً، يمكنه التعامل مع ملفات PDF | لا يزال محدوداً بعدة ملفات، غير قابل للتطوير، لا توجد تحديثات فعلية في الوقت الفعلي |
| نظام RAG مخصص | يبحث في آلاف الوثائق، يبقى دائماً محدثاً، يستشهد بالمصادر، يبقى ضمن البنية التحتية الخاصة بك | يتطلب استثمار تطوير، يحتاج صيانة |
المشكلة الأساسية مع مجرد استخدام ChatGPT هي الحجم والتحكم. ChatGPT لا يعرف وثائقك إلا إذا أعطيتها له في كل مرة. لا يمكنه البحث عبر 10,000 ملف. لا يمكنه البقاء محدثاً تلقائياً عند تغيير الوثائق. وحسب صناعتك، إرسال وثائق سرية إلى خوادم OpenAI قد يكون كابوساً من حيث الامتثال.
نظام RAG هو نظامك الخاص. يجلس في البنية التحتية الخاصة بك (أو السحابة الخاصة بك)، يتصل بمخازن الوثائق الخاصة بك، ويحتفظ بكل شيء تحت سيطرتك.
حالات الاستخدام التجارية الحقيقية لـ RAG
لقد رأيت RAG منتشراً في عدة سياقات مختلفة. إليك الحالات التي توفر أعظم قيمة:
قاعدة المعرفة الداخلية
حالة الاستخدام الأكثر شيوعاً. يسأل الموظفون أسئلة ويحصلون على إجابات مستخلصة من الوثائق والسياسات والإجراءات الداخلية. فكر فيها كإنترانت محادثة أذكى.
مثال: شركة محاماة لديها 20 سنة من ملفات القضايا تبني نظام RAG حتى يتمكن الزملاء من طرح أسئلة مثل "هل تعاملنا مع أي قضايا تتعلق بنزاعات التأمين البحري في تكساس؟" والحصول على ملخصات ذات صلة مع روابط للوثائق الفعلية.
دعم العملاء
يعزز RAG جيل المتابعة من روبوتات الدعم -- تلك التي تعطي فعلاً إجابات مفيدة لأنها تستخلص من قاعدة المعرفة الحقيقية لديك ومقالات المساعدة والوثائق المتعلقة بالمنتج.
مثال: شركة SaaS تغذي مركز المساعدة بالكامل وملاحظات الإصدار وقاعدة المشاكل المعروفة في نظام RAG. يتعامل روبوتهم الدعم مع 40٪ من التذاكر دون تدخل بشري، والإجابات دقيقة فعلاً.
البحث عن الوثائق والامتثال
بالنسبة للصناعات التي تغوص في الوثائق التنظيمية -- التمويل والرعاية الصحية والقانون -- يمكن لـ RAG البحث عبر آلاف الحروق التنظيمية والسياسات والوثائق المتعلقة بالامتثال.
مثال: تستخدم شركة رعاية صحية RAG للبحث في تنظيمات HIPAA وسياساتها الخاصة بالامتثال والمتطلبات الخاصة بالدولة في وقت واحد. يحصل مسؤولو الامتثال على إجابات في ثوانٍ بدلاً من ساعات.
تمكين المبيعات
تهدر فرق المبيعات وقتاً ضخماً في البحث عن دراسة الحالة الصحيحة أو معلومات التسعير أو مقارنة الأسعار. يمكن لـ RAG أن يعرض بالضبط ما يحتاجونه.
مثال: "أظهر لي دراسات حالات حيث تغلبنا على منافس X في القطاع الصناعي" -- والنظام يسحب أكثر ثلاث دراسات حالات ذات صلة مع المقاييس الرئيسية.
الموارد البشرية والتطبيق الديناميكي
يحتوي الموظفون الجدد على مليون سؤال. يمكن لأنظمة RAG المتصلة بدليل الموظفين والوثائق المتعلقة بالمزايا والمواد التطبيقية الديناميكية الإجابة على معظمها على الفور.
ما تحتاجه لبناء نظام RAG
دعني أكون صريحاً حول ما ينطوي عليه. نظام RAG ليس شيئاً تقوم بتدويره في فترة ما بعد الظهيرة. إليك ما تبدو عليه البنية المعمارية النموذجية:
خط أنابيب الوثائق
تحتاج إلى طريقة لاستهلاك الوثائق من حيثما تكون موجودة -- Google Drive أو Notion أو Confluence أو SharePoint أو أنظمة الملفات المحلية أو قواعس البيانات. يجب تحليل هذه الوثائق (ملفات PDF معروفة بأنها صعبة جداً)، وتقسيمها إلى أحجام مناسبة، وتحويلها إلى embeddings.
الأدوات المستخدمة بشكل شائع: LangChain و LlamaIndex و Unstructured.io للتحليل، ونماذج embedding مختلفة من OpenAI أو Cohere أو بدائل مفتوحة المصدر مثل BGE أو E5.
قاعدة البيانات المتجهة
هذا هو المكان الذي تُخزن فيه بصمات الوثائق (embeddings) وتُبحث عنها. تتضمن الخيارات الشهيرة في عام 2025:
- Pinecone: خدمة مدارة، سهلة الإعداد، تبدأ من حوالي 70 دولاراً/شهر للاستخدام الإنتاجي
- Weaviate: خيار مفتوح المصدر مع عرض سحابي مدار
- Qdrant: خيار مفتوح المصدر قوي، يمكن استضافته ذاتياً
- pgvector: ملحق PostgreSQL -- رائع إذا كنت تقوم بتشغيل Postgres بالفعل
- Chroma: خفيف الوزن، جيد للنماذج الأولية
نموذج اللغة (LLM)
تحتاج إلى نموذج ذكاء اصطناعي لإنشاء الإجابات الفعلية. تتراوح الخيارات من:
- OpenAI GPT-4o / GPT-4.1: الخيار الأساسي لمعظم الأنظمة الإنتاجية. حوالي 2.50 دولار لكل مليون رمز إدخال، 10 دولارات لكل مليون رمز إخراج اعتباراً من منتصف عام 2025
- Anthropic Claude 3.5 / Claude 4: بديل قوي، خاصة للوثائق الأطول. فئة تسعير مماثلة
- Google Gemini 2.5: خيار تنافسي مع نوافذ سياق كبيرة
- النماذج مفتوحة المصدر (Llama 3, Mistral): خيار استضافة ذاتية لأقصى خصوصية بيانات
طبقة التطبيق
يحتاج شخص ما إلى بناء الواجهة الفعلية -- نافذة الدردشة ولوحة التحكم الإدارية وواجهة إدارة الوثائق. هنا يأتي دور فريق ذي خبرة في تطوير الويب الحديث. نبني هذه الواجهات باستخدام أطر عمل مثل Next.js ونربطها بأنظمة إدارة المحتوى بدون رؤوس لإدارة المحتوى غير المتعلق بالذكاء الاصطناعي حول التطبيق. إذا كنت فضولياً بشأن هذا الجانب من الأشياء، فإن صفحات قدرات تطوير Next.js وتطوير نظام إدارة المحتوى بدون رؤوس تتعمق أكثر.
كم تكلفة نظام RAG؟
هذا هو الجزء حيث تصبح معظم المقالات غامضة. لن أفعل ذلك. إليك نطاقات تكاليف واقعية لعام 2025:
| المكون | نموذج أولي/MVP | إنتاجي (صغير) | إنتاجي (مؤسسة) |
|---|---|---|---|
| إعداد خط أنابيب الوثائق | 5K–15K دولار | 15K–40K دولار | 40K–100K+ دولار |
| قاعدة البيانات المتجهة | مجاني (Chroma) | 70–300 دولار/شهر (Pinecone/Weaviate) | 500–5,000 دولار/شهر |
| تكاليف API لـ LLM | 50–200 دولار/شهر | 200–2,000 دولار/شهر | 2,000–20,000+ دولار/شهر |
| تطوير التطبيق | 10K–25K دولار | 25K–75K دولار | 75K–250K+ دولار |
| الصيانة المستمرة | الحد الأدنى | 2K–5K دولار/شهر | 5K–20K دولار/شهر |
أكبر متغير هو حجم الوثائق وحجم الاستعلام. شركة بها 500 وثيقة تتلقى 100 استعلام يومياً ستدفع جزءاً صغيراً من تكاليف شركة بها 50,000 وثيقة تتلقى 10,000 استعلام يومياً.
تكاليف LLM، على وجه التحديد، انخفضت بحوالي 90٪ منذ أوائل عام 2023 وتستمر في الانخفاض. ما كان يكلف دولار واحد في رسوم API منذ سنتين يكلف الآن حوالي 0.10 دولار.
هل تريد تقديراً أكثر تحديداً لموقفك؟ تواصل معنا -- لقد قمنا بتحديد نطاق وبناء أنظمة هذه لعدة عملاء ويمكننا إعطاؤك رقماً واقعياً بسرعة.
RAG مقابل الضبط الدقيق مقابل هندسة الموجهات
هذه الثلاثة نهج يتم الخلط بينها باستمرار. إليك الانهيار الصريح:
| النهج | ما يفعله | الأفضل لـ | التكلفة | يبقي البيانات محدثة؟ |
|---|---|---|---|---|
| هندسة الموجهات | صياغة التعليمات بعناية للذكاء الاصطناعي | المهام البسيطة وكميات صغيرة من السياق | منخفضة ($) | N/A |
| RAG | استرجاع الوثائق ذات الصلة وتغذيتها للذكاء الاصطناعي في وقت الاستعلام | قواعس معرفية كبيرة وغير متغيرة | متوسطة ($$) | نعم -- فقط حدث الوثائق |
| الضبط الدقيق | تدريب نموذج الذكاء الاصطناعي نفسه على بيانات الخاص بك | تعليم النموذج نمط أو تنسيق أو مهارة متخصصة محددة | عالية ($$$) | لا -- يتطلب إعادة تدريب |
يجب أن تبدأ معظم الشركات بـ RAG. الضبط الدقيق مخصص للحالات التي تحتاج فيها إلى أن يتصرف النموذج بشكل مختلف (مثل إخراج بيانات منظمة بتنسيق محدد)، وليس عندما تحتاج إلى أن يعرف أشياء مختلفة. يتعامل RAG مع جزء "المعرفة" بكثير أفضل وهو أسهل بكثير في البقاء محدثاً.
لقد رأيت شركات تهدر 50 ألف دولار+ على مشاريع الضبط الدقيق عندما كان يمكن لـ RAG حل مشكلتهم بجزء من الوقت والتكلفة. لا تقع في هذا الخطأ.
الأخطاء الشائعة التي تقع فيها الشركات مع RAG
بعد بناء عدة من هذه الأنظمة، حصلت على قائمة متزايدة من المزالق:
1. القمامة تدخل، القمامة تخرج
إذا كانت وثائقك سيئة التنظيم أو متناقضة أو قديمة، فسيقدم نظام RAG الخاص بك معلومات سيئة بثقة. لا يصلح RAG مشكلة الوثائق الخاصة بك بطريقة سحرية -- بل يفضحها. خطط للوقت لتنظيف الوثائق.
2. حجم القطعة مهم أكثر مما قد تعتقد
تؤثر طريقة تقسيم وثائقك بشكل كبير على جودة الإجابة. صغيرة جداً وتفقد السياق. كبيرة جداً وتخفف الملاءمة. هذا أحد تلك المجالات حيث يكون للخبرة فعلاً أهمية حقيقية.
3. تجاهل واجهة المستخدم "الميل الأخير"
ينجح العديد من الفرق في التطبيق الخلفي للذكاء الاصطناعي لكن ترسل واجهة مرعبة. يحتاج المستخدمون إلى رؤية المصادر وفهم مستويات الثقة وإمكانية الإشارة إلى الإجابات الخاطئة. تعتبر تجربة الواجهة الأمامية مهمة مثل خط أنابيب الذكاء الاصطناعي.
4. لا إطار تقييم
كيف تعرف ما إذا كان نظام RAG الخاص بك يعطي إجابات جيدة فعلاً؟ تحتاج إلى طريقة منهجية لاختبار وقياس الدقة. يعني هذا عادة بناء مجموعة اختبار من الأسئلة مع إجابات صحيحة معروفة والقيام بمعايرة منتظمة ضدها.
5. معاملته كـ "عين وتنسى"
تتغير الوثائق. يتم إضافة وثائق جديدة. الوثائق القديمة تصبح قديمة. يجب أن يتعامل خط أنابيب RAG الخاص بك مع التحديثات، ويجب على شخص ما مراقبة الجودة بمرور الوقت.
عندما لا يكون RAG الحل الصحيح
أريد أن أكون صريحاً هنا لأن ليس كل مشكلة ذكاء اصطناعي هي مشكلة RAG:
- إذا كان لديك أقل من 50 وثيقة: قد تكون بخير مع نهج أبسط، مثل حشو السياق مباشرة في موجه.
- إذا كانت بياناتك في الغالب منظمة (جداول بيانات وقواعس بيانات): تم تصميم RAG للنصوص غير المنظمة. بالنسبة للبيانات المنظمة، قد تريد نهج text-to-SQL بدلاً من ذلك.
- إذا احتجت إلى بيانات فعلية: يعمل RAG مع الوثائق الموجودة. إذا احتجت إلى أسعار الأسهم الفعلية أو بيانات المستشعرات الفعلية، فأنت بحاجة إلى بنية مختلفة.
- إذا كانت الدقة يجب أن تكون 100٪: أنظمة RAG جيدة جداً، لكنها ليست مثالية. بالنسبة للقرارات التي تتعلق بالحياة أو الموت أو الاستجابات الملزمة قانوناً، احتفظ دائماً برجل في الحلقة.
الأسئلة الشائعة
ماذا يعني RAG؟ RAG تعني Retrieval Augmented Generation. إنها تقنية حيث يقوم نظام الذكاء الاصطناعي بمسح واسترجاع الوثائق ذات الصلة من قاعدة معرفتك قبل إنشاء إجابة، بحيث تكون الاستجابة مستندة إلى بيانات فعليتك بدلاً من تدريب الذكاء الاصطناعي العام.
هل RAG نفس الشيء مثل ChatGPT؟ لا. ChatGPT هو مساعد ذكاء اصطناعي عام الغرض. RAG هي تقنية يمكنها استخدام نماذج مثل GPT-4 (التي تشغل ChatGPT) لكنها تربطها بوثائقك المحددة. فكر في ChatGPT كشخص ذكي يمتلك معرفة عامة، وRAG كإعطاء هذا الشخص الذكي إمكانية الوصول إلى خزانة الملفات الخاصة بشركتك قبل الإجابة.
ما مدى دقة أنظمة RAG؟ تحقق أنظمة RAG المبنية بشكل جيد عادة دقة 85-95٪ على أسئلة واقعية مستقيمة مستخلصة من وثائقك. تعتمد الدقة بشكل كبير على جودة الوثائق وحجم القطعة وكيف يعمل خطوة الاسترجاع. تتضمن أفضل الأنظمة استشهادات المصدر بحيث يمكن للمستخدمين التحقق من الإجابات.
هل يمكن لـ RAG أن يعمل مع الوثائق السرية أو الحساسة؟ بالتأكيد. يمكنك تشغيل أنظمة RAG بالكامل في البنية التحتية الخاصة بك باستخدام النماذج والقواعس المستضافة ذاتياً. بالنسبة للشركات في الصناعات المنظمة (الرعاية الصحية والتمويل والقانون)، عادة ما يكون هذا مطلباً. لا تضطر إلى إرسال أي بيانات إلى واجهات برمجية تابعة لجهات خارجية إذا كنت لا تريد -- نماذج مفتوحة المصدر مثل Llama 3 و Mistral يمكنها التشغيل على خوادمك الخاصة.
كم من الوقت يستغرق بناء نظام RAG؟ يمكن بناء نموذج أولي أساسي في 1-2 أسبوع. نظام جودة الإنتاج مع الأمان المناسب وواجهة مستخدم مصقولة وتشغيل خط أنابيب الوثائق واختبار التقييم عادة ما يستغرق 6-12 أسبوع. قد تستغرق النشرات على مستوى المؤسسة مع التكاملات المعقدة 3-6 أشهر.
ما الفرق بين RAG والتدريب على نموذج ذكاء اصطناعي مخصص؟ يسترجع RAG المعلومات في وقت الاستعلام -- لا تعدل نموذج الذكاء الاصطناعي نفسه. التدريب (الضبط الدقيق) لنموذج مخصص يغير فعلاً أوزان النموذج بناءً على بيانات الخاص بك. RAG أسرع وأرخص وأسهل في التحديث وهو الخيار الصحيح لمعظم حالات استخدام قاعدة المعرفة التجارية. يكون الضبط الدقيق منطقياً عندما تحتاج النموذج إلى اعتماد سلوك أو تنسيق إخراج محدد.
هل أحتاج إلى فريق تقني للحفاظ على نظام RAG؟ ستحتاج إلى بعض القدرة التقنية، نعم. يجب على شخص ما إدارة خط أنابيب استهلاك الوثائق ومراقبة أداء النظام وتحديث التكوينات والتعامل مع المشكلات العرضية. وقال هذا، تقلل منصات RAG المدارة مثل Glean و Guru و Vectara النفقات التقنية بشكل كبير. بالنسبة للحلول المخصصة، تشارك العديد من الشركات مع وكالة تطوير لكل من البناء الأولي والصيانة المستمرة -- هذا شيء نساعد فيه بشكل منتظم.
ما أنواع الوثائق التي يمكن لـ RAG التعامل معها؟ يمكن لمعظم أنظمة RAG معالجة ملفات PDF وملفات Word والملفات النصية العادية وصفحات HTML وملفات Markdown والجداول والعروض التقديمية وحتى النصوص الصوتية/الفيديو المكتوبة. أصعب الوثائق للعمل معها هي ملفات PDF الممسوحة ضوئياً (التي تحتاج OCR أولاً) والوثائق المنسقة بشكل معقد مع الجداول المعقدة والمحتوى الغني بالصور. حسنت أدوات تحليل الوثائق الحديثة مثل Unstructured.io بشكل ملحوظ في التعامل مع معظم حالات الاستخدام هذه.