تسعى الإمارات العربية المتحدة إلى أن تكون رائدة في مجال الذكاء الاصطناعي باللغة العربية، من خلال مشروع “جيس” الذي يهدف إلى تطوير نموذج لغوي ضخم مفتوح المصدر للغة العربية.
الذكاء الاصطناعي خطوة مهمة نحو التميز في الإمارات
يعد الذكاء الاصطناعي اليوم واحدًا من أكثر المجالات إثارة للاهتمام في عالم التكنولوجيا، حيث يعتمد على تدريب النماذج الكبيرة على مجموعات ضخمة من البيانات من الإنترنت للرد على أوامر النص، ولكن رغم الاهتمام المتزايد بالذكاء الاصطناعي في الشرق الأوسط، فإن النماذج اللغوية باللغة العربية قد تأخرت كثيرًا عن باقي اللغات الأخرى، ولكن مؤخرًا قدم فريق من الأكاديميين والباحثين والمهندسين في دولة الإمارات العربية المتحدة أداة قوية مصممة خصيصًا لمتحدثي اللغة العربية في جميع أنحاء العالم، يعتقد مبتكروها أنها ستفتح الباب أمام نماذج لغوية كبيرة في لغات أخرى.
تم تسمية هذه الأداة باسم “جيس” تيمنًا بأكبر جبل في دولة الإمارات العربية المتحدة، وتم إنشاؤها بالتعاون بين مجموعة “جي 42” الإماراتية المتخصصة في الذكاء الاصطناعي والحوسبة السحابية، وجامعة الشيخ محمد بن زايد للذكاء الاصطناعي، وشركة “سيربيراس سيستمز” الأميركية.
وعلى الرغم من أن نماذج مثل ChatGPT وMeta’s LLaMA وغيرها لديها إمكانيات للتعامل باللغة العربية، إلا أنه تم تدريبها في الغالب على بيانات باللغة الإنجليزية من الإنترنت، وفقًا لتيموثي بالدوين، عميد الدراسات وأستاذ معالجة اللغة الطبيعية في جامعة محمد بن زايد للذكاء الاصطناعي، وعلى العكس من ذلك استخدم في أداة “جيس” مجموعات بيانات باللغتين الإنجليزية والعربية، مع التركيز على محتوى الشرق الأوسط، مما سمح لها بالذهاب إلى ما هو أبعد عما قام به أي شخص آخر للوصول إلى اللغة العربية.
وبينما تهيمن اللغات التي تستخدم الأبجدية اللاتينية على الإنترنت، وتكون اللغة الإنجليزية بشكل كبير الأكثر استخدامًا، إلا أن ذلك يعني أن مجموعات البيانات هي الأكبر في تلك اللغات، وفقًا لمحمد سليمان، مدير التكنولوجيا الاستراتيجية وبرنامج الأمان السيبراني في معهد الشرق الأوسط في واشنطن، مضيفا أن جعل الوصول إلى أدوات الذكاء الاصطناعي حصريًا لأولئك الذين يستطيعون التحدث بلغات معينة يمكن أن يمنع الشرائح المحرومة في المجتمع من الاستفادة بفوائد الذكاء الاصطناعي، وعادةً ما تكون نماذج اللغة المدربة باللغة الإنجليزية تحتوي على مجموعات بيانات تركز على الثقافة الغربية، مما يؤثر سلبًا على تجربة المستخدمين من خلفيات متنوعة.
ويهدف المشروع إلى تطوير نموذج لغوي ضخم مفتوح المصدر للغة العربية، يحتوي على 13 مليار عنصر أُنشئت من مجموعة كبيرة من البيانات التي تجمع اللغتين العربية والإنكليزية، ومثل النماذج الأخرى للذكاء الاصطناعي الإبداعي، يستخدم “جيس” عملية ضبط التعليم لمنعه من إنشاء إجابات ضارة أو مؤذية، فهي لن تنشئ أي شيء يمكن أن يؤدي إلى الضرر الذاتي أو الضرر للآخرين، أو ما يشير إلى الإدمان، ويلتزم في الإجابات التي يقدمها بالقوانين والعادات المحلية في مواضيع مثل الشذوذ الجنسي والمخدرات.
ويرى الخبراء أن مشروع جيس يعد خطوة مهمة في تطوير الذكاء الاصطناعي باللغة العربية، والذي يواجه تحديات كبيرة بسبب محدودية البيانات المتاحة باللغة العربية.
يمكن أن تفتح تطبيقات الذكاء الاصطناعي باللغة العربية آفاقًا جديدة في العديد من المجالات بما في ذلك ما يلي:
- الترجمة: يمكن استخدام الذكاء الاصطناعي لتحسين جودة الترجمة بين اللغات بما في ذلك اللغة العربية.
- التعلم الآلي: يمكن استخدام الذكاء الاصطناعي لتدريب نماذج تعلم آلي محلية يمكنها أداء مهام محددة باللغة العربية، مثل تصنيف النصوص أو تحليلها.
- التفاعل مع المستخدمين: يمكن استخدام الذكاء الاصطناعي لإنشاء تطبيقات تتفاعل باللغة العربية مع المستخدمين بطريقة أكثر طبيعية وسلاسة.
مشروع جيس في الإمارات
تستثمر الإمارات العربية المتحدة بشكل كبير في مجال الذكاء الاصطناعي، وقد أطلقت العديد من المبادرات لتعزيز هذا المجال بما فيها مشروع جيس، الذي ويعد مشروع أحد أبرز مشاريع الذكاء الاصطناعي في الإمارات، وقد حظي باهتمام كبير من قبل المجتمع العلمي والمؤسسات الحكومية والخاصة.
وتسعى الإمارات العربية المتحدة إلى أن تكون رائدة في مجال الذكاء الاصطناعي باللغة العربية، من خلال مشروع جيس الذي يهدف إلى تطوير نموذج لغوي ضخم مفتوح المصدر للغة العربية.