ما المقصود بنماذج اللغات الكبيرة؟

جوزيف تسيدولكو | كاتب أول | 29 يوليو 2025

تعد نماذج اللغات الكبيرة، أو نماذج LLM باختصار نوعًا شائعًا بشكل مُتزايد من الذكاء الاصطناعي المصمم بشكل أساس لإنشاء استجابات شبيهة بالإنسان لمدخلات المستخدم التي يوفرها النص أو الصوت أو وسائل أخرى. مع تدريب نماذج LLM على كميات كبيرة من النص، تتعلم التنبؤ بالكلمة التالية، أو تسلسل الكلمات، بناءً على السياق المُقدم من خلال مطالبة—يمكنها حتى محاكاة نمط الكتابة لمؤلف أو نوع معين.

تندفع نماذج LLM من المختبرات نحو الوعي العام في أوائل العشرينيات. منذ ذلك الحين، وبفضل قدرتها المذهلة على تفسير الطلبات وإنتاج الاستجابات ذات الصلة، أصبحت منتجات مستقلة وإمكانات ذات قيمة مُضافة مُضمنة في برامج الأعمال، لتوفر بذلك معالجة اللغة الطبيعية والترجمة الآلية وإنشاء المحتوى وروبوتات المحادثة وتلخيص المستندات والمزيد.

تستمر هذه التكنولوجيا في التطور بسرعة، ليشمل ذلك مجموعات بيانات أكبر مع إضافة طبقات من التدريب والضبط لجعل النماذج تؤدي عملها بشكل أفضل. يؤدي التدريب الأوسع والأعمق، الذي أصبح ممكنًا من خلال البنية التحتية للحوسبة الأقوى إلى إمكانات استدلالية مُتطورة بشكل متزايد يمكن وضعها في العمل على إنشاء خطط لتحقيق الأهداف التنظيمية. تدعم الإمكانات الاستدلالية هذه أيضًا وظائف وكلاء الذكاء الاصطناعي، التي تستخدم نماذج LLM المُتقدمة لإكمال المهام التي يحددها المشغلون البشريون لها.

ما المقصود بنماذج اللغات الكبيرة؟

تُعد نماذج اللغات الكبيرة أنظمة ذكاء اصطناعي تم تدريبها على مجموعات بيانات واسعة، وتتكون غالبًا من مليارات الكلمات المأخوذة من الكتب والويب ومصادر أخرى، لإنشاء استجابات شبيهة بالإنسان وذات صلة بالسياق للاستعلامات. نظرًا إلى تصميم نماذج LLM لفهم الأسئلة—أو "المطالبات" في مصطلحات LLM—وإنشاء استجابات باللغة الطبيعية، يمكنها تنفيذ مهام مثل الإجابة على أسئلة العملاء، وتلخيص المعلومات في تقارير، والترجمة بين اللغات، وصياغة الشعر، والتعليمات البرميجة للكمبيوتر، والمسودات الأولى لرسائل البريد الإلكتروني. يكون لدى نماذج LLM عادةً فهم مُتطور لقواعد ودلالات اللغات التي يتم تدريبها عليها. يمكن تهيئتها لاستخدام البيانات الخاصة بالمؤسسة لتقديم استجابات فريدة للمؤسسة.

على الرغم من هذه الإمكانات المثيرة للإعجاب، يجب على المستخدمين أن يضعوا في اعتبارهم القيود التي على LLM. يمكن أن تؤدي البيانات القديمة والمطالبات سيئة الصياغة إلى أخطاء، مثل روبوت محادثة يقدم إجابة خاطئة حول منتجات الشركة. قد يتسبب نقص البيانات الكافية في اختلاق نماذج LLM للإجابات، أو "الهذي". على الرغم من أن نماذج LLM رائعة في التنبؤ، إلا أنها قامت في السابق بعمل سيء يوضح كيف توصلت إلى استنتاج معين. هذه بعض المجالات التي تسعى نماذج LLM الأحدث إلى تحسينها.

مع ذلك، تمثل نماذج LLM تقدمًا كبيرًا في مجال معالجة اللغة الطبيعية. استخدامات الأعمال كثيرة—يتم تطوير التطبيقات الجديدة واعتمادها بسرعة.

النقاط الرئيسة

  • تعد نماذج اللغات الكبيرة حديثة في مجال معالجة اللغة الطبيعية، كما يتم تطبيقها لتطوير الذكاء الاصطناعي متعدد الوسائط الذي يمكنه إنشاء الصوت والصور.
  • يُعد "كبير" مصطلح نسبي يشير إلى عدد المعلمات التي يقيِّمها النموذج عند تحديد المخرجات لأي مطالبة محددة.
  • ظهرت نماذج LLM عام 2022 مع إصدار ChatGPT، وهو تطبيق أتاح نموذج GPT-3.5 من OpenAI للجمهور العام. تشمل النماذج الشائعة الأخرى Llama وGemini وCohere Command R.

شرح نماذج اللغة الكبيرة

كانت معالجة اللغة الطبيعية مجالاً نشطًا في أبحاث الذكاء الاصطناعي منذ الستينات، وتعود نماذج اللغة المبكرة إلى عقود. دفعت نماذج اللغات الكبيرة المجال نحو الأمام من خلال توظيف التعلم العميق، الذي يضع التعلم الآلي على الشبكات العصبية لإنتاج نماذج أكثر تطورًا. تأتي سمة أخرى من نماذج LLM في أن تدريب نموذج الأساس يتم دون تدخل بشري وفي شكل تصنيف البيانات، وهي عملية تسمى التعلم الخاضع إلى الإشراف الذاتي.

وُلد المفهوم الحديث لـ LLM عام 2017 مع ورقة بحثية من Google وصفت بنية جديدة قوية تسمى شبكات المحولات. طبقت المحولات آلية الانتباه الذاتي التي مكنت المعالجة المتوازية، مما سرَّع العملية وخفَّض تكلفة كل من التدريب ونشر النماذج. طبقت OpenAI هذه البنية لإنشاء GPT-1، والتي يعتبرها الكثيرون أول نموذج LLM حديث.

لاحظت المؤسسات—اكتشافهم بسرعة أن نماذج LLM يمكن أن تدعم عددًا لا يحصى من حالات الاستخدام وتوفر إمكانات هائلة للمساعدة في جعل أعمالها أكثر إنتاجية وكفاءة واستجابة إلى العملاء.

نماذج LLM مقابل نماذج الذكاء الاصطناعي الأخرى: الكفاءة وقابلية التوسُّع

تُعد نماذج LLM واحدة من العديد من أنواع الذكاء الاصطناعي التي تم تطويرها من خلال عملية التعلم الآلي. مع ذلك، توجد بعض العناصر التي تحدد هذه النماذج وتميِّزها. يأتي في المقام الأول حجمها. تشير كلمة "كبير" في LLM إلى عدد المعلمات التي تحسب إخراج نهائي، بالإضافة إلى كمية البيانات التي تدخل في تدريب النموذج عن طريق تعديل تلك المعلمات.

  • الحجم والأداء: يتم تحديد نماذج LLM حسب حجم النموذج، مما يعكس عدد المعلمات التي تحدد مخرجاتها. أصبحت النماذج الرائدة أكبر بشكل كبير في بضع سنوات فحسب: كان لدى GPT-1 ما يزيد قليلاً عن 100 مليون معلمة؛ وأحدث خليفة هو GPT-4، مع أكثر من 1.75 تريليون معلمة، على الرغم من أن OpenAI لم يكشف عن حجمه الحقيقي.

    كلما زاد حجم النموذج عادةً، زاد اتساع نطاق مجموعة التدريب الخاصة به، وكان أداؤه أفضل في إنشاء استجابات فريدة وذات صلة تحاكي ببراعة الفهم البشري وإمكانات توليد اللغة. يمكن قياس الأداء حسب perplexity، وهو مقياس يحدد مدى ثقة النموذج عندما يتوقع الكلمة التالية في تسلسل مخرجاته.

    تحقق النماذج الأكبر أداءً فائقًا بشكل عام، لكن ليس بكل الطرق. يمكن أن تتضمن عيوبها المحتملة زمن انتقال أعلى—وهو الوقت الذي يستغرقه النموذج للتوصل إلى إجابة على الفور—والصعوبة في التوسع بسبب البنية التحتية للحوسبة التي تتطلبها. كما أنها أصعب في التخصيص لحالات استخدام مؤسسية محددة. لهذا السبب، توجد جهود ملحوظة لتطوير نماذج LLM أصغر وأكثر اقتصادًا للنشر مع الاستمرار في الأداء الجيد، على الأقل ضمن مجالات وحالات استخدام محدودة.
  • قابلية التوسع والنشر: يمكن نشر نماذج LLM ببضع طرق مختلفة. يوفِّر المورِّدون التجاريون، مثل OpenAI وGoogle وCohere نماذجهم من خلال الخدمات المُستضافة عبر متصفح أو تطبيق أو استدعاءات واجهة برمجة التطبيقات. مع ذلك، تفضل العديد من المؤسسات استضافة نماذج LLM الخاصة بها، عادةً نماذج الأساس التي تم ضبطها بدقة أو تعزيزها ببيانات الأعمال الخاصة بها، أو كليهما على الخوادم المحلية أو في بيئات السحابة العامة، إذ تدير مرحلة الاستدلال لتنفيذ النماذج. ثم يتفاعل الأفراد والبرامج معهم عن طريق الاستدعاءات المباشرة أو من خلال نقاط انتهاء واجهة برمجة التطبيقات.

    بغض النظر عن طريقة النشر، تحتاج نماذج LLM—وخاصةً تلك التي يمكن الوصول إليها من عامة الجمهور أو القوى العاملة الكبيرة—إلى أن تكون قادرة على التوسع لتلبية الطلب المتوقع دون خرق الموازنة المؤسسية. تنطوي اقتصاديات هذا التوسع على مفاضلات. تأتي جميع التدابير التي يمكن أن تحسن قابلية التوسع، مثل البنية التحتية للاستدلال الأقوى والحوسبة الموزَّعة وموازنة الأحمال والتخزين المؤقت مصحوبة بتكلفة. يمكن أن تؤدي حالات الفشل في تحقيق التوازن الصحيح بين التكلفة والفائدة إلى تأخير يضر بالقدرة على تشغيل التطبيقات على الفور، والأداء غير المُتسق، وبطء استيعاب القوى العاملة، وعدم كفاية إجراءات خصوصية البيانات وأمانها.
  • قابلية التكيف مع المجال: يمكن لأفضل نماذج الأساس دمج البيانات المجردة وعالية المستوى وإظهار الإبداع في مخرجاتها. بمجرد اختيار نموذج أساس يتمتع بالقدرة والوظائف المناسبة، يمكن للضبط الدقيق تعزيز الأداء في المجالات المُتخصصة وحالات الاستخدام. تعمل مرحلة التعلم الخاضع إلى الإشراف هذه على تكييف LLM مع المجال المطلوب دون إعادة تدريب نموذج الأساس بشكل أساس.

    تعد مواءمة توزيعات الميزات من خلال التأكيد على البيانات التي تتمتع بخصائص مشتركة بين المجالات في كل من مرحلتي التدريب الأولي والضبط الدقيق للتطوير طريقة فعَّالة أيضًا لتعزيز القدرة على التكيف مع المجال.

    مخطط لنموذج اللغة الكبير
    يوضح المخطط طريقة تعلم نماذج اللغات الكبيرة ثم تقديم التنبؤات. في مرحلة التدريب، يتعلم النموذج الأنماط. ثم ينتقل إلى مرحلة الاستدلال، إذ يعالج بيانات جديدة لإنشاء رؤى أو تنبؤات.
    تُعد نماذج LLM نوعًا من الذكاء الاصطناعي الذي يولد اللغة والذي يطبِّق الشبكات العصبية المُدربة على نطاق واسع لتقييم المطالبات والاستجابة إليها. لا يحتوي "كبير" على حد مُحدد—وما يؤهل لهذه السمة يستمر في النمو مع زيادة تطور النماذج وقوة الحوسبة، خاصةً الوصول إلى مجموعات وحدة معالجة الرسومات، ومع وفرة أكثر.

    قبل بدء التدريب، يتم تحويل اللغة إلى رموز مميزة، وهي تمثيلات رقمية للكلمات أو أجزاء من الحروف الأبجدية والكلام يمكن لأجهزة الكمبيوتر فهمها.

    ثم يتم اختيار خوارزمية—تتضمن شبكة عصبية واسعة للكمبيوتر—ومجموعة بيانات للتعلم الخاضع إلى الإشراف الذاتي. أثناء مرحلة التدريب، تعدِّل الخوارزمية مليارات المعلمات أو حتى تريليونات المعلمات للتنبؤ بدقة بالرمز المميز التالي في تسلسل حتى يستجيب النموذج بشكل مناسب إلى المطالبات. على هذا النحو، تحتوي معلمات النموذج على التعلم المُكتسب في مرحلة التدريب.
  • بنية المحولات الرئيسة: كانت المحولات القفزة المفاهيمية التي استهلت الموجة الحالية من الحماس حول نماذج LLM والذكاء الاصطناعي التوليدي. اقترح باحثون في Google عام 2017 في ورقة بحثية رائدة، انحرفت بنية المحولات عن الأساليب السابقة لإنشاء نماذج اللغة. بدلاً من الاعتماد بشكل تام على عملية تسمى التكرار، والتي تنطوي على سلسلة مُتسلسلة من المدخلات والمخرجات، تنفّذ المحولات آلية تسمى "الانتباه الذاتي" تنظر في الوقت نفسه في العلاقة بين عدة كلمات—حتى تلك البعيدة عن بعضها بعضًا في تدفق النص—أثناء معالجتها الجُمل. تفعل ذلك من خلال إنشاء ثلاثة متجهات مُختلفة: واحد للكلمة قيد النظر، وآخر للكلمات المحيطة لتحديد أهميتها في فهم الكلمة، وثالث يمثل المعلومات التي تحتوي عليها الكلمة. يكون لدى هذا المتجه الثالث قيمة مُختلفة اعتمادًا على سياق الكلمة. على سبيل المثال، قد يعني الأزرق اللون، أو قد يشير إلى مزاج الشخص، أو قد يعني مساحة كبيرة من الاعتبار، كما هو الحال في "طرأت الفكرة إليها بشكل غير مُتوقع".

    على سبيل المثال، قد تكون السلسلة النصية كما يلي: سألت
    "كيف تشعر؟".

    أجاب "لست متأكدًا". "لا يمكنني حقًا الاندماج في العمل اليوم، وهذه هي الحالة منذ فترة من الوقت. أنا مكتئب فحسب".

    قبل أن يصبح الانتباه الذاتي جزءًا من العملية، لم يكن لدى الخوارزميات أي طريقة للوصول إلى العلاقة بين "الشعور" و"أزرق"، لذلك؛ كان من المحتمل أن يحدث سوء تفسير. يوفر الانتباه الذاتي وسيلة لإثبات أهمية العلاقة بين الكلمتين، على الرغم من أنهما ليسا قريبين من بعضها بعضًا في تسلسل الكلمات.

    علاوة على ذلك، من خلال استخدام الانتباه الذاتي، يمكن تدريب النماذج على كميات هائلة من البيانات بالتوازي، مع معالجة الجمل بشكل أساس في كل مرة بدلاً من استخدام الكلمات. يستفيد ذلك بشكل أكبر من إمكانات وحدات معالجة الرسومات (GPU). يمكن للمحولين أيضًا تحليل الرموز المميزة من مطالبة بصورة متزامنة لتقديم الإجابات بشكل أسرع والكشف عن أوجه الغموض بشكل أفضل.
  • التدريب والضبط الدقيق: يتم تدريب نماذج الأساس، نماذج LLM القوية الحالية على مجموعة من البيانات التي يتم سحبها غالبًا من الإنترنت ومستودعات أخرى للمعلومات المكتوبة. تميل النماذج الناجحة الناتجة عن هذه الفترة التعليمية الخاضعة إلى الإشراف الذاتي، والتي يتم فيها تعديل مليارات المعلمات بشكل متكرر إلى أن تكون جيدة في تقديم مخرجات عامة: إنشاء نص عبر السياقات، وفهم المعنى من أنماط مُختلفة من الكلام، وتقديم أفكار مُعقدة أو حتى مجردة.

    يمكن ضبط نموذج الأساس لتحسين دقته وتحسين أدائه في نطاق معين، مثل الرعاية الصحية أو الإدارة المالية، أو حالة الاستخدام، مثل الترجمة أو التلخيص. تبدأ عملية الضبط الدقيق بنموذج الأساس، ثم تدرِّب نموذج LLM النهائي على مجموعات أصغر وأدق من البيانات المُصنفة لصقل قدرته على معالجة مهام محددة مُفيدة لقطاع الأعمال أو التطبيق.
  • أهمية النموذج وقابلية التوسع: يقرر مطورو نموذج LLM في نهاية المطاف عدد المعلمات المطلوب تدريبها باستخدام خوارزمياتهم ومقدار البيانات التي يحتاجون إليها للقيام بذلك بفعالية. كلما زاد العدد، زاد تعقيد النموذج الناتج، وتصبح المخرجات عادةً فريدة ودقيقة وذات صلة أكثر. لكن مع ذلك الأداء الفائق، يأتي ارتفاع في تكاليف التدريب والتشغيل—والتحديات في التوسُّع لخدمة المزيد من المستخدمين بمجرد تدريب النموذج.

    يتم تحديد قابلية توسع أي نشر لنموذج LLM جزئيًا حسب جودة النموذج. تؤثر خوارزمية التدريب وبنية النموذج ومجموعة البيانات التي يختارها مطورو الذكاء الاصطناعي على مدى تحسُّن نماذج الأساس لديهم لاستهلاك الموارد، مثل الذاكرة والمعالجات والطاقة لأداء وظائفهم المطلوبة.

    تظهر أيضًا تقنيات جديدة تهدف إلى تقليل حجم النموذج ومجموعة بيانات التدريب، مما يخفف من تكلفة التوسُّع وصعوبته، دون التأثير بشكل كبير على أداء LLM، خاصةً عندما يتم استخدام LLM لحالات استخدام أقل.

مزايا نماذج اللغة الكبيرة وتطبيقاتها

تمثل LLM العناصر الخفية للعديد من أنواع التطبيقات المُتطورة. اكتشف عامة الناس إلى حد كبير إمكاناتهم المذهلة مع ظهور ChatGPT، والإصدار المستند إلى متصفح OpenAI لنموذج GPT-3.5 والنُسخ الأحدث، بما في ذلك GPT-4o وGPT-4. لكن تمتد المزايا إلى المؤسسة وعبرها، إذ تعرض نماذج LLM مهاراتها في الصناعات وأقسام الأعمال التي تشمل الخدمات المالية والموارد البشرية والبيع بالتجزئة والتسويق والمبيعات وتطوير البرامج ودعم العملاء والرعاية الصحية.

تتضمن تطبيقات الأعمال الشائعة لنماذج LLM روبوتات محادثة خدمة العملاء وتحليل مشاعر العملاء وخدمات الترجمة السياقية والعامية والطبيعية. كما تقوم نماذج LLM بمهام أكثر تخصصًا وراء الكواليس، مثل التنبؤ ببُنى البروتين أثناء البحث الصيدلي، وكتابة تعليمات برمجية، وتشغيل الوكلاء الذين تنشرهم المؤسسات بشكل مُتزايد لأتمتة عمليات الأعمال.

  • تعدد استخدامات عبر التطبيقات: تُعد نماذج LLM التكنولوجيا الرئيسة التي تدعم عددًا مُتنوعًا ومتوسعًا من التطبيقات المؤسسية وتطبيقات المستهلكين. ينبع تعدد استخدامات هذا من عملية التدريب الذاتي للنماذج على مجموعات البيانات الكبيرة، مما ينتج عنه ذكاء اصطناعي بارع للغاية في تحليل الأنماط المُعقدة داخل البيانات لإنشاء مخرجات سياقية ذات صلة.

    تستفيد التطبيقات المُتطورة من هذه السمة للقيام بمهام مثل كتابة نسخ وتقارير تسويقية فريدة، وقياس مشاعر العملاء، وتلخيص المستندات، وحتى إنشاء مخرجات لا علاقة لها باللغة، مثل الصور والصوت. يجسد وكلاء الذكاء الاصطناعي بشكل خاص تعدد استخدامات نماذج LLM في قدرتها على التفاعل مع البيئة وتنفيذ المهام عبر المجالات دون معرفة مُتخصصة.

    تزيد عملية ضبط النماذج من خلال التعلم الخاضع إلى الإشراف من توسيع نطاق تطبيقات الأعمال التي يمكن إنشاؤها على الذكاء الاصطناعي التوليدي. يمكن لـ RAG جعل نماذج LLM أكثر فعالية في البيئات المؤسسية لأنه يحسِّن دقة مخرجاتها وأهميتها من خلال دمج بيانات الأعمال الخاصة التي يمكن تحديثها باستمرار دون تغيير النموذج الأساس.
  • تعزيز تفاعلات العملاء: أثبتت نماذج LLM بسرعة قوتها في مجال خدمة العملاء. إن هذه حالة استخدام واضحة لأي شخص جرّب قدرة نموذج LLM على إجراء حوار من خلال الإجابة على سؤال دقيق تلو الآخر بمخرجات واضحة ومُفصَّلة ومُفيدة.

    مع ذلك، يمكن لنماذج LLM تحسين تفاعلات العملاء بطرق عديدة تتجاوز روبوتات المحادثة. تستخدم بعض المؤسسات هذه الرسائل لإنشاء رسائل بريد إلكتروني أو رسائل نصية أو منشورات وسائط اجتماعية للعملاء الذين يعالجون الأسئلة المتعلقة بالمنتج أو الأسئلة التقنية أو المبيعات. وضع آخرون نماذج LLM للعمل على ترجمة الاستفسارات من العملاء الذين يتحدثون اللغات الأجنبية. يمكن أيضًا تهيئة نماذج LLM لمساعدة وكلاء المبيعات والدعم—البشرية والخاصة بالذكاء الاصطناعي—من خلال تزويدهم بمعلومات قابلة للتنفيذ ووثائق ذات صلة، وتلخيص التفاعلات السابقة، والمتابعة مع العملاء، وتوثيق التفاعلات.

    زادت إحدى أكبر شركات الخدمات المهنية في العالم التي تقوم بأعمال تجارية في أكثر من 100 دولة مؤخرًا تركيزها على إدارة علاقات العملاء من خلال اعتماد تطبيقات الذكاء الاصطناعي التوليدي المدعومة بنماذج LLM. بالنظر إلى جمع المزيد من الرؤى من استطلاعات آراء العملاء، نشرت الشركة نماذج اللغة الكبيرة لتحليل المشاعر في تلك الاستجابات. يمكن للذكاء الاصطناعي الآن تسليط الضوء على الاتجاهات وتوفير رؤى واسعة حول طريقة استلام المنتجات والخدمات وطريقة تحسينها.
  • الأتمتة والإنتاجية: تثبت نماذج LLM فعاليتها للغاية في أتمتة المهام المُتكررة، بما في ذلك تلك التي تنطوي على قرارات مُعقدة للغاية حتى تتمكن نماذج الذكاء الاصطناعي السابقة من التعامل معها. يمكن أن تساعد هذه الأتمتة في تعزيز إنتاجية الموظفين من خلال تحرير وقت العمال من التركيز على المساعي عاية المستوى التي تتطلب تفكيرًا إبداعيًا ونقدًا.

    يُعد الوكلاء تقنية ناشئة في طليعة الاستفادة من إمكانات التفكير المُتطورة لنماذج LLM لتوجيه عمليات سير العمل بأقل تدخل بشري. تم تصميم هذه التطبيقات، المبنية على نماذج لغة الأساس لاتخاذ قرارات أثناء تفاعلها مع البشر والبرامج الأخرى داخل البيئات المؤسسية، ويمكنها تنفيذ المهام بشكل مُستقل في مُختلف المجالات، وإنشاء إشعارات بالإجراءات التي تحتاج إلى مراجعة أو تفويض للمساعدة في ضمان مراقبتها.

    تُحسِّن نماذج LLM أيضًا من الإنتاجية بطرق أخرى، بما في ذلك الظهور السريع للمعلومات ذات الصلة لقادة الأعمال وصُناع القرار الآخرين، وإنشاء مسودات لنسخ عمل المسوقين، وكتابة تعليمات برمجية بجانب المطورين.

أمثلة وحالات استخدام نماذج اللغة الكبيرة

يتم تطبيق نماذج اللغة الكبيرة على عدد ضخم باستمرار من حالات استخدام الأعمال. تستخدم العديد من الشركات الآن روبوتات المحادثة باعتبارها جزء من إستراتيجيات خدمة العملاء الخاصة بها، على سبيل المثال. لكن بفضل تعدد استخدامات هذه النماذج، يطبق مطورو البرامج المؤسسية الإبداعية التكنولوجيا الأساسية للتعامل مع مجموعة واسعة من المهام التي تتجاوز مجرد توليد استجابات لغوية.

1. أتمتة دعم العملاء

يمثل دعم العملاء التطبيق الأوضح لنماذج LLM في إعدادات المؤسسة—خاصةً للعملاء. يمكن لواجهات المستخدم المحادثية، أو روبوتات المحادثة المدعومة بنماذج اللغة تقديم عدد غير محدود تقريبًا من الاستفسارات في جميع الساعات. يمكن أن يساعد هذا في تقليل أوقات الاستجابة بشكل كبير بسبب زيادة أعباء موظفي مركز الاتصال، وهو مصدر رئيس لإحباط العملاء.

يمكن أن يؤدي دمج روبوتات المحادثة مع التطبيقات الأخرى التي تدعم نماذج LLM إلى أتمتة إجراءات المتابعة بعد مكالمة دعم، مثل إرسال قطعة غيار جهاز بديل أو مستند أو استبيان. يمكن لنماذج LLM أيضًا مساعدة الوكلاء البشريين بشكل مباشر، وتزويدهم بالمعلومات وتحليل المشاعر والترجمة وملخصات التفاعلات في الوقت المناسب.

استفاد مدير الصندوق الذي يعمل في أكثر من 50 دولة وعلى 80 لغة من هذه الإمكانات لتسهيل اكتشاف الأدوات المالية واختيارها التي تناسب احتياجاتهم بشكل أفضل. حدَّث مُتخصص إدارة حسابات التقاعد دعم العملاء من خلال روبوت محادثة مُخصص حقق زيادة بنسبة 150% في مستويات الخدمة وانخفاض بنسبة 30% في التكاليف التشغيلية. يمكن للعملاء الآن زيارة صفحة الويب الخاصة بالشركة وطرح أسئلة على روبوت المحادثة حول حساباتهم في أي وقت من اليوم وبعِدة لغات.

2. إنشاء المحتوى وتلخيصه

يمكن أن تنشئ نماذج LLM محتوى أصلي أو تلخِّص محتوى موجود. تُعد كلتا حالتي الاستخدام مُفيدتين للغاية للشركات الكبيرة والصغيرة، التي تضع الذكاء الاصطناعي التوليدي ليعمل على تقارير الكتابة ورسائل البريد الإلكتروني والمدونات والمواد التسويقية ومنشورات الوسائط الاجتماعية مع الاستفادة من قدرة نماذج LLM على تخصيص المحتوى الذي أُنشئ لمجموعات مُحددة أو عملاء فرديين.

يكثِّف التلخيص كميات كبيرة من المعلومات، مع حساسية للمجال، في شكل أسهل للبشر لمراجعة واستيعاب بسرعة. تقوم نماذج LLM بذلك إما من خلال تقييم أهمية الأفكار المختلفة داخل النص ثم استخراج الأقسام الرئيسة أو من خلال إنشاء نظرة عامة موجزة حول ما يعتبرونه المعلومات الأكثر صلة وأهمية من النص الأصلي.

يتم انتقاد نماذج LLM في بعض الأحيان على أنها "تلخص إلى المتوسط"، مما يعني أن ملخصاتها عامةً بشكل مفرط وتفوتها التفاصيل الرئيسة أو نقاط مهمة من التركيز على المادة الأصلية. من الصعب أيضًا قياس موثوقية الملخصات وتصنيف أداء النماذج المُختلفة وفقًا إلى ذلك. مع ذلك، تعتمد الشركات هذه الإمكانية بحماس.

نشرت إحدى شركات الاتصالات السحابية الرائدة نماذج LLM لتلخيص النصوص تلقائيًا لمئات تذاكر الدعم ونصوص المحادثات التي تحدث يوميًا بنحو عشرين لغة. تساعد هذه الملخصات الآن المهندسين في مواجهة تحديات العملاء أسرع والارتقاء بالتجربة الشاملة.

3. ترجمة اللغات

كانت نية Google الأولية لتطوير المحولات في جعل الآلات أفضل في الترجمة بين اللغات؛ أثار النموذج في وقت لاحق فحسب إعجاب المطورين بإمكاناته الأوسع. حققت عمليات التنفيذ الأولى لهؤلاء المطورين لهذه البنية هذا الهدف، إذ قدمت أداءً لا مثيل له في الترجمة من الإنجليزية إلى الألمانية مع نموذج استغرق وقتًا أقل بكثير وموارد حوسبة للتدريب عن سابقاتها.

تجاوزت نماذج LLM الحديثة حالة الاستخدام المحدودة هذه. على الرغم من أن معظم نماذج LLM لم يتم تدريبها على وجه التحديد لتصبح أدوات ترجمة، إلا أنها لا تزال تتفوق في ترجمة النص بلغة واحدة وتعيد صياغته بوضوح في لغة أخرى عندما يتم تدريبها على نطاق واسع على مجموعات البيانات باللغتين. يحمل هذا التقدُّم في كسر الحواجز اللغوية قيمة كبيرة بالنسبة إلى المؤسسات التي تعمل عبر الحدود. تستخدم الشركات متعددة الجنسيات خدمات لغوية مُتقدمة، على سبيل المثال في تطوير دعم متعدد اللغات لمنتجاتها وخدماتها؛ وترجمة الأدلة والبرامج التعليمية وأصول التسويق؛ واستخدام الأصول التعليمية الحالية لتدريب العمال عند التوسُّع في بلدان جديدة.

الطريق نحو مستقبل نماذج LLM

التطورات في النماذج متعددة الوسائط

يستخدم مجال البحث النشط نماذج LLM باعتبارها نماذج أساس للذكاء الاصطناعي الذي ينشئ مخرجات بطرق أخرى غير اللغة. إن تعدد استخدامات نماذج LLM المثير للإعجاب، يجعل من الممكن من خلال عملية الضبط الدقيق باستخدام البيانات المصنفة تفسير وإنشاء الصوت والصور وحتى الفيديو. تسمى هذه النماذج التي تتلقى مطالبات أو تنشئ مخرجات بأساليب أخرى غير اللغة أحيانًا نماذج كبيرة متعددة الوسائط أو نماذج LMM.

الاعتبارات البيئية

تتطلب نماذج LLM عادةً كميات هائلة من قوة الحوسبة لتطويرها وتشغيلها على نطاق واسع. يمكن لتدريب نموذج واحد على مجموعة من مئات من وحدات معالجة الرسومات أو في بعض الأحيان الآلاف منها على مدى أسابيع عديدة أن يستهلك كميات هائلة من الطاقة. بمجرد نشر نموذج ناجح، تستمر البنية التحتية التي تعمل على الاستدلال في طلب كهرباء كبيرة لتقديم استفسارات المستخدمين المستمرة.

يتطلب تدريب نموذج GPT-4 ما يقدر بـ 50 جيجاوات ساعة من الطاقة. بالمقارنة، يمكن نظريًا أن تعمل 50 جيجاوات ساعة من الطاقة على تشغيل ما متوسطه 4,500 إلى 5,000 منزل أمريكي لمدة عام. تشير التقديرات حاليًا إلى أن ChatGPT يستهلك مئات الساعات من الميجاوات كل يوم للرد على ملايين الاستفسارات. مع تزايد نماذج اللغات، قد تزداد المخاوف بشأن استهلاك الطاقة والاستدامة إلحاحًا. لذلك السبب، تتصدر شركات الذكاء الاصطناعي البحث عن مصادر طاقة بديلة للحد من بصماتها الكربونية.

إنشاء تطبيقات LLM باستخدام الذكاء الاصطناعي التوليدي لـ OCI

تضع Oracle قوة نماذج LLM في أيدي المؤسسات دون مطالبتها بالتعامل مع أساسيات الأمور—أو متطلبات الطاقة—لهذه التكنولوجيا المُثيرة. تُعد الذكاء الاصطناعي التوليدي للبنية التحتية من Oracle Cloud (OCI) خدمة مُدارة بالكامل تبسِّط من نشر أحدث نماذج LLM بطريقة مُخصصة وفعَّالة للغاية وفعَّالة من جانب التكلفة مع تجنب إدارة البنية التحتية المُعقدة. يمكن للمؤسسات الاختيار من بين العديد من نماذج الأساس، ثم ضبطها على مجموعات GPU المُخصصة ببياناتها الخاصة، مما يوفر نماذج مُخصصة تلبي احتياجات أعمالها على أفضل وجه.

تتحول المؤسسات التي تسعى إلى إجراء المزيد من التفاعل مع التكنولوجيا الأساسية إلى التعلم الآلي في Oracle Database. تُمكِّن المنصة علماء البيانات من إنشاء النماذج بسرعة من خلال تبسيط العناصر الرئيسة لدورة حياة التعلم الآلي وأتمتتها دون الحاجة إلى ترحيل البيانات الحساسة من قواعد بيانات Oracle لديها. تتضمن الميزات أُطر عمل التعلم الآلي الشائعة وواجهات برمجة التطبيقات والتعلم الآلي المؤتمت (AutoML) والواجهات دون تعليمات برمجية، بالإضافة إلى أكثر من 30 خوارزمية عالية الأداء في قاعدة البيانات لإنتاج نماذج تُستخدم في التطبيقات.

تستفيد العديد من المؤسسات الرائدة أيضًا من البنية التحتية لـ Oracle AI لإنشاء نماذج LLM الخاصة بها. تمثل البنية التحتية للذكاء الاصطناعي الأساس لخدمات الذكاء الاصطناعي عالية المستوى، مثل الذكاء الاصطناعي التوليدي لـ OCI، ويمكن استخدامها لنماذج LLM الأكثر طلبًا مع الحوسبة المُتسارعة والشبكات والتخزين.

إن إمكانات نماذج LLM في تحويل طريقة عمل الشركات والتفاعل مع عملائها كبيرة للغاية، بحيث يمكن للتطورات والاستثمارات الجديدة في التكنولوجيا نقل الأسواق العالمية وتغيير الإستراتيجيات المؤسسية. لكن من المهم للشركات الرائدة في الأعمال وتكنولوجيا المعلومات النظر إلى ما هو أبعد من الضجيج—فهم أساسيات طريقة عمل نماذج LLM، بالإضافة إلى القيود عليها والتحديات في اعتمادها—حتى في الوقت التي تسعى فيه إلى تحديد المزايا الملموسة العديدة التي قد تكتسبها من التكنولوجيا.

تتخلف نماذج LLM عن العديد من التقنيات التي تغيِّر قواعد اللعبة والتي تحوّل الطريقة التي نعمل بها.

الأسئلة الشائعة حول نموذج اللغة الكبير

كيف يتم ضبط نماذج اللغة الكبيرة لتطبيقات محددة؟

يتم ضبط نماذج LLM لتطبيقات مُحددة من خلال اتباع مرحلة ما قبل التدريب الأولية التي توظِّف التعلم الذاتي لتطوير نموذج أساس مع مرحلة تعلم خاضعة إلى الإشراف على كمية أصغر من البيانات المُصنفة الخاصة بالمجال.

ما هي الصناعات التي تستفيد أكثر من استخدام نماذج اللغة الكبيرة؟

تكتشف كل صناعة تقريبًا مزايا نماذج LLM. تعد الرعاية الصحية والخدمات المالية والبيع بالتجزئة من بين تلك الصناعات التي تستكشف مجموعة مُتنوعة من حالات الاستخدام بشأن تحسين دعم العملاء وأتمتة عمليات الأعمال.

هل يمكن دمج نماذج اللغات الكبيرة مع الأنظمة المؤسسية؟

يتم غالبًا دمج نماذج اللغات الكبيرة مع الأنظمة المؤسسية من خلال ضبط نماذج الأساس مع البيانات المؤسسية وتعزيز تلك النماذج ببيانات خاصة من خلال التوليد المعزز بالاسترجاع.