موضوعات الأسئلة الشائعة

أسئلة عامة

ما المقصود بالموجه؟

المتجه هو تمثيل رياضي للنصوص أو الصور أو الصوتيات أو الفيديوهات يرمِّز الميزات أو المعاني الدلالية للبيانات، بدلاً من المحتوى الفعلي مثل الكلمات أو وحدات البكسل الأساسية. يتكون المتجه من قائمة بالقيم الرقمية، والمعروفة باسم الأبعاد، ويمكن استخدامه لعمليات الذكاء الاصطناعي (AI).

كيف يتم إنشاء المتجهات؟

يتم إنشاء المتجهات من أنواع مختلفة من بيانات الإدخال (النص، والصور، والصوت، والفيديو، وبيانات أخرى) بواسطة نماذج التعلم العميق المعروفة باسم نماذج التضمين. يمكنك إنشاء متجهات خارج قاعدة البيانات باستخدام نماذج التضمين أو خدمة التضمين أو تكوينها داخل قاعدة البيانات باستخدام نماذج تضمين ONNX عبر دالة SQL VECTOR_EMBEDDING().

ما تنسيقات الأبعاد المدعومة للمتجهات؟

يدعم بحث متجهات الذكاء الاصطناعي من Oracle تنسيقات BINARY وINT8 وFLOAT32 وFLOAT64.

كم عدد أبعاد المتجهات المدعومة؟

تدعم ميزة Oracle AI Vector Search المتجهات مع ما يصل إلى 65,535 بُعدًا.

ما حجم المتجهات؟

حجم المتجه هو نتاج عدد الأبعاد وحجم كل بُعد.

على سبيل المثال، المتجه الذي يحتوي على 2048 بُعدًا وصيغة INT8 (بايت واحد) هو 2 كيلوبايت في الحجم، والمتجه الذي يحتوي على 1024 بُعدًا وصيغة FLOAT32 (4 بايت) هو 4 كيلوبايت في الحجم.

هل يدعم بحث متجهات الذكاء الاصطناعي المتجهات المتفرقة؟

يدعم بحص متجهات الذكاء الاصطناعي من Oracle المتجهات المتفرقة، والتي تحتوي عادةً على العديد من الأبعاد، لكن تحتوي بعض الأبعاد فحسب على قيم غير صفرية. بالنسبة إلى مستند معين، تتطابق قيم الأبعاد غير الصفرية في المتجه مع الكلمات الرئيسة (والتغيرات الخاصة بها) التي تظهر في هذا المستند.

ما هي نماذج التضمين التي يعمل بها AI Vector Search؟

من المفترض أن تعمل ميزة AI Vector Search مع أي نموذج تضمين صالح ينشئ متجهات بأحد تنسيقات الأبعاد المدعومة وبأبعاد تبلغ 65,535 بُعدًا أو أقل.

ما نماذج التضمين التي يجب أن أفكر في استخدامها وأين يمكنني الحصول عليها؟

يعتمد اختيار نموذج التضمين على العديد من العوامل، مثل طبيعة بياناتك ومقاييس الأداء التي تحددها حسب الأولوية والتكلفة التي ترغب في دفعها. يمكن العثور على نماذج تضمين مجانية ومفتوحة المصدر، بما في ذلك محولات الجملة المختلفة، على Hugging Face والمواقع المماثلة. يمكن تحويل هذه النماذج إلى ONNX لإنشاء تضمينات في قاعدة البيانات باستخدام ميزة بحث متجهات الذكاء الاصطناعي. تعد منصة MTEB Leaderboard التي يستضيفها Hugging Face مصدرًا شائعًا لأفضل نماذج تضمين النصوص. يمكنك أيضًا التوجه إلى مقدمي النماذج المعروفين مثل OpenAI وCohere.

هل يدعم بحث متجهات بالذكاء الاصطناعي نماذج تضمين الصور؟

يدعم بحث متجهات بالذكاء الاصطناعي المتجهات التي تم إنشاؤها من جميع نماذج التضمين، بغض النظر عما إذا كانت النماذج مُخصصة للنصوص أو الصور أو الصوت أو الفيديو أو البيانات الأخرى. تتضمن قاعدة البيانات Oracle AI Database أيضًا نماذج تضمين ONNX مُجمعة مُسبقًا لتنفيذ عمليات عن بُعد قائمة على الصور باستخدام AI Vector Search.

ما العمليات المدعومة على المتجهات؟

توجد عمليات رياضية متعددة مدعومة في المتجهات. تُعد العملية الأهم دالة SQL VECTOR_DISTANCE() التي تصل إلى المسافة الحسابية بين المتجهين على أساس معادلة المسافة المحددة. توجد العديد من معادلات المسافة التي يدعمها Oracle AI Vector Search، بما في ذلك Euclidean وEuclidean Squared وCosine Similarity وDot Product وManhattan وJaccard وHamming. يتم تشغيل اختيار دالة المسافة عادةً بواسطة نموذج التضمين المستخدم لإنشاء المتجهات، مع ذلك، فإن قياس المسافة الافتراضي في Oracle AI Database 26ai هو تشابه-جيب التمام.

كيف يتم استخدام المتجهات في البحث عن التشابه؟

تشترك جميع المتجهات في نفس الخاصية: كلما كان الكيانان أكثر تشابهًا، كانت المسافة الرياضية بينهما أصغر. على سبيل المثال، المتجهات "تفاحة" و"برتقالة" أقرب إلى بعضهما من المتجهات "تفاحة" و"كلب." تتيح خاصية المتجهات هذه استخدامها للبحث عن البيانات حسب التشابه الدلالي.

كيف يتم إجراء AI Vector Search (بحث عن المتجهات بالذكاء الاصطناعي) باستخدام SQL؟

هناك امتدادات SQL بسيطة وبديهية تسمح بدمج AI Vector Search بسهولة في تطبيقاتك. بما أن مسافة المتجه هي مقياس للتشابه، فإن ميزة AI Vector Search تتضمن ترتيب مجموعة المتجهات المحتملة بناءً على مسافتها من متجه بحث وإرجاع أفضل وأقرب تطابقات K. على سبيل المثال، يؤدي الاستعلام أدناه إلى العثور على أفضل 10 منتجات تتطابق صورها بشكل وثيق مع صورة بحث المستخدم:

SELECT product_name, product_photo
FROM product
ORDER BY VECTOR_DISTANCE(product_photo_vector, :search_photo_vector)
FETCH FIRST 10 ROWS ONLY;

كيف يمكنني استخدام AI Vector Search في الاستعلامات المعقدة التي تتضمن بيانات العمل؟

يمكن استخدام بحث متجهات الذكاء الاصطناعي في استعلامات متطورة تتضمن عوامل التصفية والروابط والتجميعات والتجميع حسب العناصر الأخرى. على سبيل المثال، يمكن استخدام الاستعلام التالي للعثور على أفضل 10 منتجات مطابقة تم تصنيعها في كاليفورنيا بناءً على صورة تم تحميلها بواسطة مستخدم.

SELECT p.name, p.photo, m.name
FROM product p
JOIN manufacturer m ON (p.mfr_id = m.id)
WHERE m.state = 'CA'
ORDER BY VECTOR_DISTANCE(product_photo_vector, :search_photo_vector)
FETCH FIRST 10 ROWS ONLY;

ما فهارس المتجهات وكيف تختلف عن فهارس قواعد البيانات التقليدية؟

تُستخدم فهارس قواعد البيانات التقليدية لتسريع عمليات البحث استنادًا إلى القيم المطابقة. على سبيل المثال، يسرِّع فهرس B-tree من عمليات البحث القائمة على القيمة ومسح النطاق المستند إلى القيمة. من ناحية أخرى، تم تصميم فهارس المتجهات للعثور على أفضل K تطابقًا والأكثر تشابهًا بناءً على التشابه الدلالي بدلاً من مطابقة القيم بدقة. يمكن استخدام فهرس متجهات للعثور على أفضل كلمات بحرف ك الأكثر تشابهًا في المعنى مع "تفاحة" في مجموعة من الكلمات الموجودة. يؤدي استخدام فهرس متجهات إلى بحث تقريبي يضحي ببعض الدقة في البحث مقابل أداء يصل إلى 100 ضعف، إذ يتجنب فحص كل إدخال متجه داخل العمود.

ما المقصود بفهارس متجهات الرسم البياني المجاورة المُضمنة بالذاكرة؟

تمثل فهارس متجهات الرسم البياني المجاورة في الذاكرة فهارس متواجدة للذاكرة تستند إلى الرسم البياني. تمثل رؤوس الرسم البياني المتجهات، وتمثل الحواف بين الرؤوس التشابه بين المتجهات. يدعم بحث متجهات الذكاء الاصطناعي من Oracle فهارس متجات الرسوم البيانية المجاورة القابلة للتنقل (HNSW) وهي من نوع عالمي صغيرة قابل للتنقل ومتدرجة (HNSW) بالذاكرة. يتم تنظيم فهارس HNSW باستخدام مبادئ من شبكات العالم الصغير والتنظيم الهرمي الطبقي، مما يجعلها سريعة ودقيقة للغاية للبحث عن التشابه.

ما هي فهارس المتجهات المقسمة المجاورة؟

يدعم بحث متجهات الذكاء الاصطناعي من Oracle فهارس المتجهات المقسمة إلى مقاطع من نوع الملف غير المنسق (IVF). تمثل فهارس المتجهات المقسمة المجاورة فهارس متجهات قائمة على القرص، إذ يتم تجميع المتجهات في أقسام الجدول بناءً على التشابه. إنه فهرس فعَّال للتوسع مع دعم سريع وسلس للمعاملات، مما يسمح لك بموازنة البحث عالي الجودة مع سرعة معقولة. إنها مُصممة لاستيعاب أحجام بيانات غير محدودة، بحكم حقيقة أنها لا تعتمد على الذاكرة.

ما فهارس المتجهات المختلطة وكيف تختلف عن فهارس قواعد البيانات التقليدية؟

تمثل فهارس المتجهات المختلطة نوع جديد من فهارس المتجهات التي تسمح للمستخدمين بفهرسة مستنداتهم والاستعلام عنها بسهولة باستخدام مزيج من البحث بالنص الكامل والبحث المتجه الدلالي لتحقيق نتائج بحث ذات جودة أعلى. تدعم واجهة برمجة تطبيقات الاستعلام الموحدة التي تسمح للمستخدمين بتشغيل الاستعلامات النصية أو استعلامات تشابه المتجهات أو الاستعلامات المختلطة التي تستفيد من كلا النهجين.

ما لغات البرمجة التي يمكن استخدامها لتطوير تطبيقات AI Vector Search؟

بالإضافة إلى SQL وPL/SQL، يمكن إنشاء تطبيقات بحث متجهات الذكاء الاصطناعي بلغات برمجة متعددة. تتضمن ميزة AI Vector Search دعم برامج التشغيل الأصلية للمتجهات بلغات شائعة، مثل Java وPython وJavaScript و#C.

ما الدور الذي تلعبه ميزة AI Vector Search في الذكاء الاصطناعي التوليدي؟

يكون بحث متجهات الذكاء الاصطناعي غالبًا جزءًا من سير عمل الإنشاء المعزز بالاسترجاع (RAG). إذ يوفر مدخلات إضافية مطلوبة لضبط الاستجابة من نموذج لغة كبير (LLM) من GenAI.

عند الدمج مع سير العمل RAG، يتم تحويل سؤال المستخدم أولاً إلى متجه ومن ثم يُطابق مع المستندات الأكثر صلة داخل قاعدة البيانات عبر بحث متجهات الذكاء الاصطناعي. ثم يتم تمرير سؤال المستخدم والمستندات ذات الصلة الداعمة إلى نموذج LLM، الذي ينشئ إجابة مستنيرة بناءً على معرفته العامة والمعرفة المُتخصصة من قاعدة البيانات.

ما هي نماذج LLM التي يعمل بها AI Vector Search؟

يمكن استخدام بحث متجهات الذكاء الاصطناعي لـ RAG مع أي نموذج LLM، بما في ذلك النماذج مفتوحة المصدر، مثل Llama3 وMistral، بالإضافة إلى النماذج الخاصة من موفري الخدمات مثل OpenAI وCohere. بالإضافة إلى ذلك، تتوفر واجهات برمجة تطبيقات PL/SQL المُتخصصة للتكامل السلس بين بحث متجهات الذكاء الاصطناعي ونماذج LLM لـ RAG.

هل يدعم بحث متجهات الذكاء الاصطناعي أطر عمل تكامل الذكاء الاصطناعي وسلاسله؟

يتكامل بحث متجهات الذكاء الاصطناعي مع LangChain وLlamaIndex. يمكن أن تساعد أطر العمل هذه على دمج البيانات الخاصة والعامة لتطبيقات نماذج اللغات الكبيرة.

ما هي مزايا الإنشاء المعزز بالاسترجاع (RAG)؟

يلعب الإنشاء المعزز بالاسترجاع (RAG) دورًا محوريًا في الذكاء الاصطناعي التوليدي (GenAI)، مما يوفر مزايا كبيرة لتطبيقات GenAI. فيما يلي ثلاثة أسباب مقنعة فقط حول سبب ضرورة دمج RAG في إعداد GenAI:

  1. تقليل الهلوسة: قد تنشئ نماذج اللغات الكبيرة (LLM) ردودًا غير دقيقة أو غير ذات صلة إذا كانت تفتقر إلى تدريب كبير بشأن المطالبات. تؤدي إعادة تدريب نماذج اللغة الكبيرة غالبًا للتوافق مع الاستجابات المطلوبة إلى تكاليف كبيرة.
  2. حماية السرية: يتم تدريب نماذج LLM على المعلومات المتاحة للجمهور من الإنترنت—لا تعرف عن البيانات الخاصة بشركتك. قد لا ترغب في إرسال معلومات خاصة بشركتك عبر الإنترنت، لأنك تقدم معلوماتك الخاصة إلى طرف ثالث. بدلاً من ذلك، ضع في اعتبارك الاحتفاظ ببيانات مؤسستك داخل منطقتك باستخدام نماذج LLM المحلية داخل مركز بياناتك أو مستأجرة السحابة.
  3. معلومات مُحدثة: يتم تدريب نماذج LLM حتى تاريخ محدد؛ بأحداث أو حقائق أحدث غير معروفة. باستخدام RAG، يمكن لنموذج LLM تقديم استجابات على أساس معلومات محدثة من قاعدة بيانات متجهة مقدمة عبر المطالبة. يعني هذا أن نموذج LLM يتمتع بميزة أحدث البيانات من شركتك دون الحاجة إلى تدريب نموذج LLM على بياناتك.

كيف يمكنني توسيع نطاق AI Vector Search لتلبية الاحتياجات المتزايدة لتطبيقي؟

يمكن لآليات قابلية التوسع الشاملة من Oracle—مثل التنفيذ المتوازي والتقسيم ومجموعات التطبيقات الحقيقية (Oracle RAC) والتقسيم وExadata—توسيع نطاق بحث متجهات الذكاء الاصطناعي إلى أي حجم بيانات وعدد المستخدمين تقريبًا.

هل توجد أي مزايا في تشغيل بحث متجهات الذكاء الاصطناعي على Oracle Exadata؟

يمكن لآليات قابلية التوسع الشاملة من Oracle—مثل التنفيذ المتوازي والتقسيم وOracle Real Application Clusters (Oracle RAC) والتقسيم وExadata—توسيع نطاق بحث متجهات الذكاء الاصطناعي إلى أي حجم بيانات وعدد المستخدمين تقريبًا. تتضمن Oracle Exadata أيضًا المسح الذكي للذكاء الاصطناعي، الذي يفرغ عمليات استعلام بحث متجهات الذكاء الاصطناعي إلى خوادم تخزين Exadata للحصول على أداء استعلام لا مثيل له.

كيف توفر Oracle أمان البيانات للمتجهات؟

يتكامل بحث Oracle AI Vector بسلاسة مع ميزات أمان قاعدة البيانات الرائدة في المجال من Oracle لتقليل المخاطر وتبسيط الامتثال. يمكن للمؤسسات تأمين بيانات المتجهات الخاصة بها من خلال الاستفادة من الأدوات القوية، مثل التشفير وإخفاء البيانات الحساسة وعناصر التحكم في وصول المستخدم المتميزة ومراقبة النشاط والتدقيق مع الاستفادة الكاملة من إمكانات بحث الذكاء الاصطناعي المتقدمة. تساعد الميزات داخل قاعدة البيانات، مثل مخزن قاعدة البيانات وقاعدة البيانات الخاصة الافتراضية في تأمين بيانات المتجهات والتأكد من أن المستخدمين الذين يتمتعون بالامتيازات المناسبة فحسب هم الذين يمكنهم الوصول إليها.

يعني هذا أن Oracle AI Vector Search يمكن أن يقلل بشكل كبير من بصمة البنية التحتية للمتجهات لدى الشركة. يمكن لقاعدة البيانات Oracle AI Database واحدة تلبية احتياجات العديد من المستخدمين المختلفين بأذونات وصول مختلفة واعتماد دون الحاجة إلى تكرار البيانات أو تحمل أي تكاليف إضافية على الإدارة، كما هو الحال غالبًا مع قواعد بيانات المتجهات الأخرى.

كيف توفر Oracle إمكانات عالية التوافر وإجراءات التعافي من الكوارث للمتجهات؟

المتجهات في قاعدة البيانات Oracle AI Database هي أنواع بيانات قاعدة بيانات من الدرجة الأولى. يعني هذا أن المتجهات تكتسب ضمنيًا جميع الميزات والإمكانات المُبتكرة التي تجعل Oracle قاعدة بيانات المؤسسة الرائدة في العالم. يتم تقديم التوافر العالي (HA) عن طريق تشغيل عمليات البحث عن التشابه على Oracle RAC أو Oracle Globally Distributed Database (التقسيم). يمكن لكل من Data Guard وActive Data Guard وOracle GoldenGate توفير التعافي من الكوارث تلقائيًا.