جوزيف تسيدولكو | كاتب أول | 29 يوليو 2025
تعد نماذج اللغات الكبيرة، أو نماذج LLM باختصار نوعًا شائعًا بشكل مُتزايد من الذكاء الاصطناعي المصمم بشكل أساس لإنشاء استجابات شبيهة بالإنسان لمدخلات المستخدم التي يوفرها النص أو الصوت أو وسائل أخرى. مع تدريب نماذج LLM على كميات كبيرة من النص، تتعلم التنبؤ بالكلمة التالية، أو تسلسل الكلمات، بناءً على السياق المُقدم من خلال مطالبة—يمكنها حتى محاكاة نمط الكتابة لمؤلف أو نوع معين.
تندفع نماذج LLM من المختبرات نحو الوعي العام في أوائل العشرينيات. منذ ذلك الحين، وبفضل قدرتها المذهلة على تفسير الطلبات وإنتاج الاستجابات ذات الصلة، أصبحت منتجات مستقلة وإمكانات ذات قيمة مُضافة مُضمنة في برامج الأعمال، لتوفر بذلك معالجة اللغة الطبيعية والترجمة الآلية وإنشاء المحتوى وروبوتات المحادثة وتلخيص المستندات والمزيد.
تستمر هذه التكنولوجيا في التطور بسرعة، ليشمل ذلك مجموعات بيانات أكبر مع إضافة طبقات من التدريب والضبط لجعل النماذج تؤدي عملها بشكل أفضل. يؤدي التدريب الأوسع والأعمق، الذي أصبح ممكنًا من خلال البنية التحتية للحوسبة الأقوى إلى إمكانات استدلالية مُتطورة بشكل متزايد يمكن وضعها في العمل على إنشاء خطط لتحقيق الأهداف التنظيمية. تدعم الإمكانات الاستدلالية هذه أيضًا وظائف وكلاء الذكاء الاصطناعي، التي تستخدم نماذج LLM المُتقدمة لإكمال المهام التي يحددها المشغلون البشريون لها.
تُعد نماذج اللغات الكبيرة أنظمة ذكاء اصطناعي تم تدريبها على مجموعات بيانات واسعة، وتتكون غالبًا من مليارات الكلمات المأخوذة من الكتب والويب ومصادر أخرى، لإنشاء استجابات شبيهة بالإنسان وذات صلة بالسياق للاستعلامات. نظرًا إلى تصميم نماذج LLM لفهم الأسئلة—أو "المطالبات" في مصطلحات LLM—وإنشاء استجابات باللغة الطبيعية، يمكنها تنفيذ مهام مثل الإجابة على أسئلة العملاء، وتلخيص المعلومات في تقارير، والترجمة بين اللغات، وصياغة الشعر، والتعليمات البرميجة للكمبيوتر، والمسودات الأولى لرسائل البريد الإلكتروني. يكون لدى نماذج LLM عادةً فهم مُتطور لقواعد ودلالات اللغات التي يتم تدريبها عليها. يمكن تهيئتها لاستخدام البيانات الخاصة بالمؤسسة لتقديم استجابات فريدة للمؤسسة.
على الرغم من هذه الإمكانات المثيرة للإعجاب، يجب على المستخدمين أن يضعوا في اعتبارهم القيود التي على LLM. يمكن أن تؤدي البيانات القديمة والمطالبات سيئة الصياغة إلى أخطاء، مثل روبوت محادثة يقدم إجابة خاطئة حول منتجات الشركة. قد يتسبب نقص البيانات الكافية في اختلاق نماذج LLM للإجابات، أو "الهذي". على الرغم من أن نماذج LLM رائعة في التنبؤ، إلا أنها قامت في السابق بعمل سيء يوضح كيف توصلت إلى استنتاج معين. هذه بعض المجالات التي تسعى نماذج LLM الأحدث إلى تحسينها.
مع ذلك، تمثل نماذج LLM تقدمًا كبيرًا في مجال معالجة اللغة الطبيعية. استخدامات الأعمال كثيرة—يتم تطوير التطبيقات الجديدة واعتمادها بسرعة.
النقاط الرئيسة
كانت معالجة اللغة الطبيعية مجالاً نشطًا في أبحاث الذكاء الاصطناعي منذ الستينات، وتعود نماذج اللغة المبكرة إلى عقود. دفعت نماذج اللغات الكبيرة المجال نحو الأمام من خلال توظيف التعلم العميق، الذي يضع التعلم الآلي على الشبكات العصبية لإنتاج نماذج أكثر تطورًا. تأتي سمة أخرى من نماذج LLM في أن تدريب نموذج الأساس يتم دون تدخل بشري وفي شكل تصنيف البيانات، وهي عملية تسمى التعلم الخاضع إلى الإشراف الذاتي.
وُلد المفهوم الحديث لـ LLM عام 2017 مع ورقة بحثية من Google وصفت بنية جديدة قوية تسمى شبكات المحولات. طبقت المحولات آلية الانتباه الذاتي التي مكنت المعالجة المتوازية، مما سرَّع العملية وخفَّض تكلفة كل من التدريب ونشر النماذج. طبقت OpenAI هذه البنية لإنشاء GPT-1، والتي يعتبرها الكثيرون أول نموذج LLM حديث.
لاحظت المؤسسات—اكتشافهم بسرعة أن نماذج LLM يمكن أن تدعم عددًا لا يحصى من حالات الاستخدام وتوفر إمكانات هائلة للمساعدة في جعل أعمالها أكثر إنتاجية وكفاءة واستجابة إلى العملاء.
تُعد نماذج LLM واحدة من العديد من أنواع الذكاء الاصطناعي التي تم تطويرها من خلال عملية التعلم الآلي. مع ذلك، توجد بعض العناصر التي تحدد هذه النماذج وتميِّزها. يأتي في المقام الأول حجمها. تشير كلمة "كبير" في LLM إلى عدد المعلمات التي تحسب إخراج نهائي، بالإضافة إلى كمية البيانات التي تدخل في تدريب النموذج عن طريق تعديل تلك المعلمات.
تمثل LLM العناصر الخفية للعديد من أنواع التطبيقات المُتطورة. اكتشف عامة الناس إلى حد كبير إمكاناتهم المذهلة مع ظهور ChatGPT، والإصدار المستند إلى متصفح OpenAI لنموذج GPT-3.5 والنُسخ الأحدث، بما في ذلك GPT-4o وGPT-4. لكن تمتد المزايا إلى المؤسسة وعبرها، إذ تعرض نماذج LLM مهاراتها في الصناعات وأقسام الأعمال التي تشمل الخدمات المالية والموارد البشرية والبيع بالتجزئة والتسويق والمبيعات وتطوير البرامج ودعم العملاء والرعاية الصحية.
تتضمن تطبيقات الأعمال الشائعة لنماذج LLM روبوتات محادثة خدمة العملاء وتحليل مشاعر العملاء وخدمات الترجمة السياقية والعامية والطبيعية. كما تقوم نماذج LLM بمهام أكثر تخصصًا وراء الكواليس، مثل التنبؤ ببُنى البروتين أثناء البحث الصيدلي، وكتابة تعليمات برمجية، وتشغيل الوكلاء الذين تنشرهم المؤسسات بشكل مُتزايد لأتمتة عمليات الأعمال.
يتم تطبيق نماذج اللغة الكبيرة على عدد ضخم باستمرار من حالات استخدام الأعمال. تستخدم العديد من الشركات الآن روبوتات المحادثة باعتبارها جزء من إستراتيجيات خدمة العملاء الخاصة بها، على سبيل المثال. لكن بفضل تعدد استخدامات هذه النماذج، يطبق مطورو البرامج المؤسسية الإبداعية التكنولوجيا الأساسية للتعامل مع مجموعة واسعة من المهام التي تتجاوز مجرد توليد استجابات لغوية.
1. أتمتة دعم العملاء
يمثل دعم العملاء التطبيق الأوضح لنماذج LLM في إعدادات المؤسسة—خاصةً للعملاء. يمكن لواجهات المستخدم المحادثية، أو روبوتات المحادثة المدعومة بنماذج اللغة تقديم عدد غير محدود تقريبًا من الاستفسارات في جميع الساعات. يمكن أن يساعد هذا في تقليل أوقات الاستجابة بشكل كبير بسبب زيادة أعباء موظفي مركز الاتصال، وهو مصدر رئيس لإحباط العملاء.
يمكن أن يؤدي دمج روبوتات المحادثة مع التطبيقات الأخرى التي تدعم نماذج LLM إلى أتمتة إجراءات المتابعة بعد مكالمة دعم، مثل إرسال قطعة غيار جهاز بديل أو مستند أو استبيان. يمكن لنماذج LLM أيضًا مساعدة الوكلاء البشريين بشكل مباشر، وتزويدهم بالمعلومات وتحليل المشاعر والترجمة وملخصات التفاعلات في الوقت المناسب.
استفاد مدير الصندوق الذي يعمل في أكثر من 50 دولة وعلى 80 لغة من هذه الإمكانات لتسهيل اكتشاف الأدوات المالية واختيارها التي تناسب احتياجاتهم بشكل أفضل. حدَّث مُتخصص إدارة حسابات التقاعد دعم العملاء من خلال روبوت محادثة مُخصص حقق زيادة بنسبة 150% في مستويات الخدمة وانخفاض بنسبة 30% في التكاليف التشغيلية. يمكن للعملاء الآن زيارة صفحة الويب الخاصة بالشركة وطرح أسئلة على روبوت المحادثة حول حساباتهم في أي وقت من اليوم وبعِدة لغات.
2. إنشاء المحتوى وتلخيصه
يمكن أن تنشئ نماذج LLM محتوى أصلي أو تلخِّص محتوى موجود. تُعد كلتا حالتي الاستخدام مُفيدتين للغاية للشركات الكبيرة والصغيرة، التي تضع الذكاء الاصطناعي التوليدي ليعمل على تقارير الكتابة ورسائل البريد الإلكتروني والمدونات والمواد التسويقية ومنشورات الوسائط الاجتماعية مع الاستفادة من قدرة نماذج LLM على تخصيص المحتوى الذي أُنشئ لمجموعات مُحددة أو عملاء فرديين.
يكثِّف التلخيص كميات كبيرة من المعلومات، مع حساسية للمجال، في شكل أسهل للبشر لمراجعة واستيعاب بسرعة. تقوم نماذج LLM بذلك إما من خلال تقييم أهمية الأفكار المختلفة داخل النص ثم استخراج الأقسام الرئيسة أو من خلال إنشاء نظرة عامة موجزة حول ما يعتبرونه المعلومات الأكثر صلة وأهمية من النص الأصلي.
يتم انتقاد نماذج LLM في بعض الأحيان على أنها "تلخص إلى المتوسط"، مما يعني أن ملخصاتها عامةً بشكل مفرط وتفوتها التفاصيل الرئيسة أو نقاط مهمة من التركيز على المادة الأصلية. من الصعب أيضًا قياس موثوقية الملخصات وتصنيف أداء النماذج المُختلفة وفقًا إلى ذلك. مع ذلك، تعتمد الشركات هذه الإمكانية بحماس.
نشرت إحدى شركات الاتصالات السحابية الرائدة نماذج LLM لتلخيص النصوص تلقائيًا لمئات تذاكر الدعم ونصوص المحادثات التي تحدث يوميًا بنحو عشرين لغة. تساعد هذه الملخصات الآن المهندسين في مواجهة تحديات العملاء أسرع والارتقاء بالتجربة الشاملة.
3. ترجمة اللغات
كانت نية Google الأولية لتطوير المحولات في جعل الآلات أفضل في الترجمة بين اللغات؛ أثار النموذج في وقت لاحق فحسب إعجاب المطورين بإمكاناته الأوسع. حققت عمليات التنفيذ الأولى لهؤلاء المطورين لهذه البنية هذا الهدف، إذ قدمت أداءً لا مثيل له في الترجمة من الإنجليزية إلى الألمانية مع نموذج استغرق وقتًا أقل بكثير وموارد حوسبة للتدريب عن سابقاتها.
تجاوزت نماذج LLM الحديثة حالة الاستخدام المحدودة هذه. على الرغم من أن معظم نماذج LLM لم يتم تدريبها على وجه التحديد لتصبح أدوات ترجمة، إلا أنها لا تزال تتفوق في ترجمة النص بلغة واحدة وتعيد صياغته بوضوح في لغة أخرى عندما يتم تدريبها على نطاق واسع على مجموعات البيانات باللغتين. يحمل هذا التقدُّم في كسر الحواجز اللغوية قيمة كبيرة بالنسبة إلى المؤسسات التي تعمل عبر الحدود. تستخدم الشركات متعددة الجنسيات خدمات لغوية مُتقدمة، على سبيل المثال في تطوير دعم متعدد اللغات لمنتجاتها وخدماتها؛ وترجمة الأدلة والبرامج التعليمية وأصول التسويق؛ واستخدام الأصول التعليمية الحالية لتدريب العمال عند التوسُّع في بلدان جديدة.
التطورات في النماذج متعددة الوسائط
يستخدم مجال البحث النشط نماذج LLM باعتبارها نماذج أساس للذكاء الاصطناعي الذي ينشئ مخرجات بطرق أخرى غير اللغة. إن تعدد استخدامات نماذج LLM المثير للإعجاب، يجعل من الممكن من خلال عملية الضبط الدقيق باستخدام البيانات المصنفة تفسير وإنشاء الصوت والصور وحتى الفيديو. تسمى هذه النماذج التي تتلقى مطالبات أو تنشئ مخرجات بأساليب أخرى غير اللغة أحيانًا نماذج كبيرة متعددة الوسائط أو نماذج LMM.
الاعتبارات البيئية
تتطلب نماذج LLM عادةً كميات هائلة من قوة الحوسبة لتطويرها وتشغيلها على نطاق واسع. يمكن لتدريب نموذج واحد على مجموعة من مئات من وحدات معالجة الرسومات أو في بعض الأحيان الآلاف منها على مدى أسابيع عديدة أن يستهلك كميات هائلة من الطاقة. بمجرد نشر نموذج ناجح، تستمر البنية التحتية التي تعمل على الاستدلال في طلب كهرباء كبيرة لتقديم استفسارات المستخدمين المستمرة.
يتطلب تدريب نموذج GPT-4 ما يقدر بـ 50 جيجاوات ساعة من الطاقة. بالمقارنة، يمكن نظريًا أن تعمل 50 جيجاوات ساعة من الطاقة على تشغيل ما متوسطه 4,500 إلى 5,000 منزل أمريكي لمدة عام. تشير التقديرات حاليًا إلى أن ChatGPT يستهلك مئات الساعات من الميجاوات كل يوم للرد على ملايين الاستفسارات. مع تزايد نماذج اللغات، قد تزداد المخاوف بشأن استهلاك الطاقة والاستدامة إلحاحًا. لذلك السبب، تتصدر شركات الذكاء الاصطناعي البحث عن مصادر طاقة بديلة للحد من بصماتها الكربونية.
تضع Oracle قوة نماذج LLM في أيدي المؤسسات دون مطالبتها بالتعامل مع أساسيات الأمور—أو متطلبات الطاقة—لهذه التكنولوجيا المُثيرة. تُعد الذكاء الاصطناعي التوليدي للبنية التحتية من Oracle Cloud (OCI) خدمة مُدارة بالكامل تبسِّط من نشر أحدث نماذج LLM بطريقة مُخصصة وفعَّالة للغاية وفعَّالة من جانب التكلفة مع تجنب إدارة البنية التحتية المُعقدة. يمكن للمؤسسات الاختيار من بين العديد من نماذج الأساس، ثم ضبطها على مجموعات GPU المُخصصة ببياناتها الخاصة، مما يوفر نماذج مُخصصة تلبي احتياجات أعمالها على أفضل وجه.
تتحول المؤسسات التي تسعى إلى إجراء المزيد من التفاعل مع التكنولوجيا الأساسية إلى التعلم الآلي في Oracle Database. تُمكِّن المنصة علماء البيانات من إنشاء النماذج بسرعة من خلال تبسيط العناصر الرئيسة لدورة حياة التعلم الآلي وأتمتتها دون الحاجة إلى ترحيل البيانات الحساسة من قواعد بيانات Oracle لديها. تتضمن الميزات أُطر عمل التعلم الآلي الشائعة وواجهات برمجة التطبيقات والتعلم الآلي المؤتمت (AutoML) والواجهات دون تعليمات برمجية، بالإضافة إلى أكثر من 30 خوارزمية عالية الأداء في قاعدة البيانات لإنتاج نماذج تُستخدم في التطبيقات.
تستفيد العديد من المؤسسات الرائدة أيضًا من البنية التحتية لـ Oracle AI لإنشاء نماذج LLM الخاصة بها. تمثل البنية التحتية للذكاء الاصطناعي الأساس لخدمات الذكاء الاصطناعي عالية المستوى، مثل الذكاء الاصطناعي التوليدي لـ OCI، ويمكن استخدامها لنماذج LLM الأكثر طلبًا مع الحوسبة المُتسارعة والشبكات والتخزين.
إن إمكانات نماذج LLM في تحويل طريقة عمل الشركات والتفاعل مع عملائها كبيرة للغاية، بحيث يمكن للتطورات والاستثمارات الجديدة في التكنولوجيا نقل الأسواق العالمية وتغيير الإستراتيجيات المؤسسية. لكن من المهم للشركات الرائدة في الأعمال وتكنولوجيا المعلومات النظر إلى ما هو أبعد من الضجيج—فهم أساسيات طريقة عمل نماذج LLM، بالإضافة إلى القيود عليها والتحديات في اعتمادها—حتى في الوقت التي تسعى فيه إلى تحديد المزايا الملموسة العديدة التي قد تكتسبها من التكنولوجيا.
تتخلف نماذج LLM عن العديد من التقنيات التي تغيِّر قواعد اللعبة والتي تحوّل الطريقة التي نعمل بها.
كيف يتم ضبط نماذج اللغة الكبيرة لتطبيقات محددة؟
يتم ضبط نماذج LLM لتطبيقات مُحددة من خلال اتباع مرحلة ما قبل التدريب الأولية التي توظِّف التعلم الذاتي لتطوير نموذج أساس مع مرحلة تعلم خاضعة إلى الإشراف على كمية أصغر من البيانات المُصنفة الخاصة بالمجال.
ما هي الصناعات التي تستفيد أكثر من استخدام نماذج اللغة الكبيرة؟
تكتشف كل صناعة تقريبًا مزايا نماذج LLM. تعد الرعاية الصحية والخدمات المالية والبيع بالتجزئة من بين تلك الصناعات التي تستكشف مجموعة مُتنوعة من حالات الاستخدام بشأن تحسين دعم العملاء وأتمتة عمليات الأعمال.
هل يمكن دمج نماذج اللغات الكبيرة مع الأنظمة المؤسسية؟
يتم غالبًا دمج نماذج اللغات الكبيرة مع الأنظمة المؤسسية من خلال ضبط نماذج الأساس مع البيانات المؤسسية وتعزيز تلك النماذج ببيانات خاصة من خلال التوليد المعزز بالاسترجاع.