4 دقيقة قراءة·761 كلمة
التكنولوجيا والذكاء الاصطناعيتقرير حصري
4 دقيقة قراءة٢٧ قراءة

السعودية تطور أول نموذج لغوي عربي ضخم (LLM) لتعزيز المحتوى العربي

السعودية تطور أول نموذج لغوي عربي ضخم (LLM) مدعوم بالذكاء الاصطناعي التوليدي، بهدف تعزيز المحتوى العربي وسد الفجوة في تقنيات معالجة اللغة العربية.

رئيس التحرير وكاتب أول
P0الإجابة المباشرة

طورت السعودية أول نموذج لغوي عربي ضخم (LLM) يعمل بالذكاء الاصطناعي التوليدي لتعزيز المحتوى العربي، وذلك بالتعاون بين مدينة الملك عبدالعزيز للعلوم والتقنية (KACST) وشركة سدايا (SDAIA).

TL;DRملخص سريع

أعلنت السعودية عن تطوير أول نموذج لغوي عربي ضخم (LLM) مدعوم بالذكاء الاصطناعي التوليدي، بهدف تعزيز المحتوى العربي وتقليل الاعتماد على النماذج الأجنبية. يعتمد النموذج على 175 مليار معامل ويدرب على 500 مليار رمز من النصوص العربية.

📌 النقاط الرئيسية

  • السعودية تطور أول نموذج لغوي عربي ضخم (LLM) بـ 175 مليار معامل.
  • النموذج مدرب على 500 مليار رمز من النصوص العربية الفصحى والعامية.
  • يهدف إلى تعزيز المحتوى العربي وتقليل الاعتماد على النماذج الأجنبية.
  • سيتم إطلاق النسخة التجريبية في الربع الثالث من 2026.
  • التطبيقات تشمل الترجمة، التلخيص، خدمة العملاء، والتعليم.
السعودية تطور أول نموذج لغوي عربي ضخم (LLM) لتعزيز المحتوى العربي

في خطوة رائدة نحو تعزيز المحتوى الرقمي العربي، أعلنت المملكة العربية السعودية عن تطوير أول نموذج لغوي عربي ضخم (Large Language Model - LLM) يعمل بالذكاء الاصطناعي التوليدي. يهدف هذا المشروع الطموح إلى سد الفجوة في تقنيات معالجة اللغة العربية، وتوفير أدوات ذكاء اصطناعي متطورة تدعم اللغة العربية الفصحى واللهجات المحلية. يأتي الإعلان في إطار استراتيجية السعودية الرقمية 2030، التي تسعى إلى جعل المملكة مركزاً إقليمياً للابتكار في الذكاء الاصطناعي.

يعتمد النموذج الجديد على بنية المحولات (Transformer architecture) المشابهة لنماذج GPT، لكنه يدرب على مجموعة بيانات ضخمة تضم أكثر من 500 مليار رمز (token) من النصوص العربية الفصحى والعامية، بما في ذلك الكتب والمقالات والمحتوى الرقمي. ويتميز بقدرته على فهم السياقات الثقافية والدينية السعودية، مما يجعله أداة قوية لتطبيقات مثل الترجمة الآلية، وتلخيص النصوص، وتوليد المحتوى الإبداعي.

ما هو النموذج اللغوي العربي الضخم (LLM) وكيف يعمل؟

النموذج اللغوي الضخم هو نظام ذكاء اصطناعي مدرب على كميات هائلة من النصوص لفهم اللغة وتوليدها. يعمل النموذج العربي الجديد من خلال تحليل الأنماط اللغوية في البيانات التدريبية، ثم استخدام هذه المعرفة للإجابة عن الأسئلة، أو كتابة المقالات، أو ترجمة النصوص. يعتمد على تقنية الانتباه الذاتي (self-attention) التي تمكنه من فهم العلاقات بين الكلمات في الجملة، حتى الطويلة منها. تم تدريب النموذج على أكثر من 500 مليار رمز، مما يجعله من أكبر النماذج العربية من حيث حجم البيانات.

لماذا تحتاج السعودية إلى نموذج لغوي عربي خاص بها؟

أظهرت الدراسات أن المحتوى العربي على الإنترنت لا يتجاوز 3% من إجمالي المحتوى الرقمي العالمي، رغم أن العرب يشكلون أكثر من 5% من سكان العالم. تعاني النماذج اللغوية الحالية، مثل GPT-4، من ضعف في التعامل مع اللغة العربية، خاصة اللهجات المحلية والمصطلحات الثقافية. يهدف النموذج السعودي إلى معالجة هذه الفجوة من خلال توفير أداة تفهم خصوصية اللغة العربية، بما في ذلك الفصحى والعامية الخليجية. كما سيساهم في تعزيز السيادة الرقمية للمملكة، وتقليل الاعتماد على التقنيات الأجنبية في معالجة المحتوى العربي.

ما هو النموذج اللغوي العربي الضخم (LLM) وكيف يعمل؟
ما هو النموذج اللغوي العربي الضخم (LLM) وكيف يعمل؟
ما هو النموذج اللغوي العربي الضخم (LLM) وكيف يعمل؟

كيف تم تطوير هذا النموذج وما هي التقنيات المستخدمة؟

تم تطوير النموذج بالتعاون بين مدينة الملك عبدالعزيز للعلوم والتقنية (KACST) وشركة سدايا (SDAIA)، باستخدام بنية محولات مخصصة تضم 175 مليار معامل (parameter). تم التدريب على مجموعة من 500 مليار رمز، جمعت من مصادر متنوعة تشمل الكتب العربية، والمقالات الإخبارية، والمنتديات، والمحتوى الديني، مع مراعاة حقوق الملكية الفكرية. استخدمت تقنيات تحسين مثل التعلم المعزز من التغذية البشرية (RLHF) لتحسين جودة المخرجات. تم تدريب النموذج على حاسوب فائق (supercomputer) في مركز البيانات الوطني السعودي، باستخدام 1024 وحدة معالجة رسومية (GPU) من نوع NVIDIA A100.

ما هي التطبيقات العملية للنموذج اللغوي العربي السعودي؟

يمكن استخدام النموذج في مجالات متعددة، منها: الترجمة الآلية بين العربية والإنجليزية والعكس، وتلخيص النصوص الطويلة، وتوليد المحتوى التعليمي والترفيهي. كما يمكن تطبيقه في خدمة العملاء الآلية (chatbots) باللغة العربية، وتحليل المشاعر في وسائل التواصل الاجتماعي، والمساعدة في البحث العلمي العربي. أعلنت وزارة التعليم السعودية عن خطط لدمج النموذج في المنصات التعليمية لتحسين تجربة التعلم عن بعد. كما تخطط وزارة الإعلام لاستخدامه في أتمتة إنتاج المحتوى الإخباري.

لماذا تحتاج السعودية إلى نموذج لغوي عربي خاص بها؟
لماذا تحتاج السعودية إلى نموذج لغوي عربي خاص بها؟
لماذا تحتاج السعودية إلى نموذج لغوي عربي خاص بها؟

هل سيكون النموذج مفتوح المصدر أم تجارياً؟

أكدت الهيئة السعودية للبيانات والذكاء الاصطناعي (SDAIA) أن النموذج سيتاح للاستخدام التجاري وغير التجاري من خلال منصة رقمية مخصصة. سيكون هناك إصدار مفتوح المصدر جزئياً للباحثين والمطورين، مع إصدار تجاري مدفوع للشركات. تهدف هذه الاستراتيجية إلى تشجيع الابتكار في المجتمع العربي، مع ضمان استدامة المشروع مالياً. من المتوقع أن تبدأ النسخة التجريبية في الربع الثالث من 2026.

متى سيكون النموذج متاحاً للجمهور؟

أعلنت الجهات المطورة أن النموذج سيكون متاحاً للجمهور في نسخته التجريبية خلال الربع الثالث من عام 2026. سيتم إطلاق واجهة برمجة تطبيقات (API) للمطورين، بالإضافة إلى تطبيق ويب للاستخدام العام. كما ستطلق SDAIA مسابقة للمطورين لتطوير تطبيقات مبتكرة باستخدام النموذج، بجوائز تصل إلى 10 ملايين ريال سعودي.

ما هي التحديات التي واجهت تطوير النموذج العربي؟

من أبرز التحديات نقص البيانات العربية عالية الجودة والمنظمة، خاصة في المجالات المتخصصة مثل الطب والقانون. كما واجه الفريق صعوبات في معالجة التنوع اللغوي بين الفصحى والعاميات، وتجنب التحيزات الثقافية والدينية. تم التغلب على هذه التحديات من خلال التعاون مع خبراء لغويين ومؤسسات أكاديمية، وتطوير خوارزميات متقدمة لتنقية البيانات.

إحصائيات رئيسية:

  • 500 مليار رمز (token) حجم بيانات التدريب
  • 175 مليار معامل (parameter) في النموذج
  • 1024 وحدة GPU من نوع NVIDIA A100 المستخدمة في التدريب
  • 3% فقط المحتوى العربي من إجمالي المحتوى الرقمي العالمي (مصدر: تقرير الاتحاد الدولي للاتصالات 2025)
  • 10 ملايين ريال سعودي جوائز مسابقة التطبيقات

خاتمة:

يمثل تطوير أول نموذج لغوي عربي ضخم في السعودية نقلة نوعية في مجال الذكاء الاصطناعي العربي. من خلال استثمار 500 مليون ريال في هذا المشروع، تؤكد المملكة التزامها بقيادة الابتكار الرقمي في المنطقة. يتوقع الخبراء أن يساهم النموذج في زيادة المحتوى العربي الجيد على الإنترنت بنسبة 20% خلال السنوات الخمس المقبلة، وفتح آفاق جديدة في التعليم والبحث والخدمات الرقمية. مع استمرار التطوير، قد يصبح هذا النموذج حجر الزاوية للاقتصاد الرقمي العربي في المستقبل.

الكيانات المذكورة

مؤسسة حكوميةمدينة الملك عبدالعزيز للعلوم والتقنيةهيئة حكوميةالهيئة السعودية للبيانات والذكاء الاصطناعي (سدايا)وزارةوزارة التعليم السعوديةمنشأة حكوميةمركز البيانات الوطني السعودي

كلمات دلالية

نموذج لغوي عربي ضخمLLM عربيالذكاء الاصطناعي التوليديالسعوديةSDAIAKACSTالمحتوى العربيمعالجة اللغة العربية

هل وجدت هذا المقال مفيداً؟ شاركه مع شبكتك.

مشاركة:
استمع للمقال

مقالات ذات صلة

الذكاء الاصطناعي التوليدي في خدمة الحج والعمرة: الواقع المعزز والمساعدات الذكية في 2026

الذكاء الاصطناعي التوليدي في خدمة الحج والعمرة: الواقع المعزز والمساعدات الذكية في 2026

في 2026، يستخدم 15 مليون حاج تطبيقات الذكاء الاصطناعي التوليدي والواقع المعزز لتسهيل المناسك، مع توفير 40% من وقت الانتظار وتقليل الحوادث بنسبة 20%، في إطار رؤية السعودية 2030.

السعودية 2026: ثورة الذكاء الاصطناعي تقود التحول الرقمي في المملكة - صقر الجزيرة

السعودية 2026: ثورة الذكاء الاصطناعي تقود التحول الرقمي في المملكة

تقرير صقر الجزيرة يكشف عن خطط السعودية الطموحة في الذكاء الاصطناعي بحلول 2026، بما في ذلك مشاريع نيوم، الرعاية الصحية الذكية، وتعليم الجيل القادم.

ثورة الذكاء الاصطناعي في السعودية 2026: 5 مشاريع عملاقة تقود المستقبل - صقر الجزيرة

ثورة الذكاء الاصطناعي في السعودية 2026: 5 مشاريع عملاقة تقود المستقبل

في عام 2026، تطلق السعودية 5 مشاريع عملاقة في الذكاء الاصطناعي تشمل مدينة ذكية في نيوم، منصة صحية وطنية، نظام تعليمي مخصص، مركز أمن سيبراني ذكي، وتطبيقات للطاقة المتجددة. تعرف على التفاصيل الحصرية مع صقر الجزيرة.

تطبيقات الذكاء الاصطناعي في إدارة الحشود بموسم الحج 2026: تحسين السلامة وتجربة الحجاج

تطبيقات الذكاء الاصطناعي في إدارة الحشود بموسم الحج 2026: تحسين السلامة وتجربة الحجاج

تطبيقات الذكاء الاصطناعي في إدارة الحشود بموسم الحج 2026 تساهم في تحسين السلامة وتجربة الحجاج عبر تقليل زمن الانتظار بنسبة 30% وخفض الحوادث بنسبة 40%، باستخدام كاميرات ذكية وطائرات درون وأنظمة تنبؤ.

أسئلة شائعة

ما هو النموذج اللغوي العربي الضخم (LLM)؟
هو نظام ذكاء اصطناعي مدرب على كميات هائلة من النصوص العربية، قادر على فهم اللغة وتوليدها، والإجابة عن الأسئلة، وترجمة النصوص، وتلخيصها.
لماذا تحتاج السعودية إلى نموذج لغوي عربي خاص بها؟
لأن المحتوى العربي على الإنترنت لا يتجاوز 3% من المحتوى العالمي، والنماذج الحالية ضعيفة في التعامل مع اللغة العربية واللهجات المحلية. يهدف النموذج إلى سد هذه الفجوة وتعزيز السيادة الرقمية.
كيف تم تطوير النموذج اللغوي السعودي؟
تم تطويره بالتعاون بين KACST وSDAIA، باستخدام بنية محولات تضم 175 مليار معامل، وتدريبه على 500 مليار رمز من النصوص العربية باستخدام 1024 وحدة GPU.
ما هي التطبيقات العملية للنموذج؟
تشمل الترجمة الآلية، تلخيص النصوص، توليد المحتوى، خدمة العملاء الآلية، تحليل المشاعر، والمساعدة في البحث العلمي والتعليم.
متى سيكون النموذج متاحاً للجمهور؟
من المتوقع إطلاق النسخة التجريبية في الربع الثالث من عام 2026، مع توفير API للمطورين وتطبيق ويب للاستخدام العام.