خوارزمية آلة المتجه الداعم من أهم خوارزميات التصنيف والتنبؤ, تبرز في حل مشاكل التصنيف غير الخطي من خلال وظيفة النواة Kernel Function, المزيد في المقال.
انتشر مؤخرا الذكاء الاصطناعي وفرعيه التعلم العميق والتعلم الآلي, حيث لكل منهما خوارزمياته المحددة, ولكن عندما يأتي الأمر لاختيار الخوارزمية المناسبة لنموذج الذكاء الاصطناعي فإننا نتوه قليلا, إذ نبقى حائرين أي الخوارزميات نستخدم, بالطبع اختيار الخوارزمية المناسبة يعتمد على نوع المهمة, مثلا إذا أردت بناء نموذج يقوم بمهمة التصنيف ستظهر أمامك العديد من الخوارزميات المستخدمة لهذا الغرض, وإحدى أهم هذه الخوارزميات هي خوارزمية آلة المتجه الداعم Support Vector Machine وهي من الخوارزميات البارزة في مجال تعلم الآلة، والتي تستخدم بشكل رئيسي في المهام التصنيف والتنبؤ, كما أنها تمثل نهجا فعالا لحل مشكلة فصل الفئات في الفضاء الرياضي و تتميز بقدرتها على التعامل مع بيانات غير خطية وفصلها بشكل فعال.
تم ابتكار خوارزمية آلة المتجه الداعم أو SVM أول مرة من قبل فيل فابنيك في عام 1992، ومن ثم تطورت لتصبح أحد الأساليب الأكثر استخداما في ميدان تعلم الآلة والذكاء الاصطناعي, ما هي خوارزمية آلة المتجه الداعم تحديدا سيكون هذا موضوع مقالنا, حيث سنوضح فيه أبرز مكوناتها وكيفية عملها وأهم التطبيقات عليها, اقرأ المقال لتكتسب المعرفة حول هذه الخوارزمية.
خوارزمية آلة المتجه الداعم هي إحدى خوارزميات تعلم الآلة الخاضع للإشراف المستخدمة في مهام التصنيف والتنبؤ, وبالأخص في مهمة التصنيف الثنائي التي تعتمد تصنيف البيانات الى مجموعتين فقط.
تعتمد فكرة فصل البيانات في آلة المتجه الداعم على ما يعرف بالمستوى الفائق HyperPlane وهو عبارة عن حد أو خط يفصل بين نقاط البيانات في فئات مختلفة, بحيث يكون الهدف هو إيجاد أفضل خط أو أفضل مستوى فائق يفصل بينها على أن يحقق هذا المستوى الفائق أقصى هامش Max-Margin, و يقصد بالهامش المسافة بين المستوى الفائق وأقرب نقاط البيانات لكل فئة مما يجعل من السهل التمييز بين فئات البيانات.
لا ينحصر استخدام خوارزمية آلة المتجه الداعم على التصنيف الخطي فحسب, بل أيضا تعمل بشكل فعال في التصنيف غير الخطي عند التعامل مع البيانات المعقدة من خلال خدعة رياضية تسمى خدعة النواة Kernel Trick, وهي تقوم على تحويل البيانات المعقدة الى فضاء ذو أبعاد أعلى حتى يتيح إيجاد حد فاصل أو المستوى الفائق بشكل أسهل وفعال, بالإضافة إلى ذلك، يمكن استخدام آلة المتجه الداعم لمهام الانحدار، حيث يصبح الهدف هو تقدير قيمة مستمرة بدلا من فصل البيانات إلى فئات.
يتم الاستفادة من هذه الخوارزمية في حالات مثل: تصنيف النصوص، تصنيف الصور، الكشف عن البريد العشوائي، التعرف على الخط اليدوي، تحليل تعبير الجينات، كشف الوجوه، واكتشاف الشذوذ وغيرها. [1]
يوجد عدة مصطلحات مرتبط بهذه الخوارزمية ينبغي توضيحها وفهمها, وهي: [2]
إذا الهدف من آلة المتجه الداعم هو إيجاد أفضل مستوى فائق يفصل بين نقاط البيانات, ويصعب ذلك في حالة كانت البيانات معقدة أو تمثيلها غير خطي, لذلك يتم استخدام أداة رياضية تسمى وظيفة النواة Kernel Function , تقوم على تحويل البيانات الى فضاء ذو أبعاد عالية ولكن بدلا من حساب إحداثيات كل نقطة في الفضاء المحول يتم استخدام النواة لحساب المنتجات النقطية. [3]
المنتج النقطي هو عملية رياضية تقوم بضرب المكونات المقابلة لكل نقطة في المتجه المحول بالمكونات المقابلة للنقاط في الفضاء الأصلي. الفائدة الرئيسية هنا هي أن هذه العملية يتم تنفيذها بشكل ضمني دون الحاجة إلى حساب الإحداثيات الفعلية لكل نقطة, هذا يقلل من العبء الحسابي خاصة عند التعامل مع مجموعات كبيرة من البيانات أو عند التحويل إلى فضاء ذو أبعاد عالية.
بعد تحويل نقاط البيانات الى فضاء ذي أبعاد عالية, وأثناء مرحلة التدريب باستخدام صيغ رياضية مختلفة يكون الهدف هو العثور على المستوى الفائق المثالي Hyperplane في الفضاء عالي الأبعاد, يطلق على هذا الفضاء اسم "فضاء النواة" Kernel Space, يعد المستوى الفائق ذو أهمية قصوى لأنه يحقق توازنا بين تكبير الهامش بهدف فصل أفضل بين البيانات وزيادة قدرة النموذج على التعامل مع بيانات جديدة وبين تقليل الأخطاء في التصنيف عبر تحديد موقع يمثل الفئات بشكل فعال مما يقلل من احتمال حدوث أخطاء في تصنيف البيانات ويعزز دقة النموذج.
تتعامل خوارزمية آلة المتجه الداعم مع البيانات القابلة للفصل بشكل خطي والبيانات غير القابلة للفصل الخطي بفعالية من خلال استخدام وظيفة النواة Kernel Function المناسبة, حيث أن نوع وظيفة النواة يؤثر بشكل كبير على أداء الخوارزمية, لذلك لابد من توخي الحذر عند اختيار النوع المناسب.
يعتمد اختيار الوظيفة المناسبة على خصائص البيانات والمشكلة الخاصة التي يحاول حلها النموذج, من أبرز وأشهر أنواع وظيفة النواة المستخدمة في آلة المتجه الداعم:
لابد من مراعاة التوازن بين الدقة والتعقيد عند اختيار نوع وظيفة النواة, فمثلا وظيفة RBF صحيح أنها أكثر قوة لأنها تتمتع بدقة أعلى في التصنيف, إلا أنها تحتاج الى كمية أكبر من البيانات ووقت أطول أثناء التدريب, ومع ذلك، هذه القضية تصبح أقل مشكلة مع تقدم التكنولوجيا، مما يعني أن القدرة على استخدام وظائف النواة القوية لا تعتمد بشكل كبير على كمية البيانات أو وقت التحسين، بفضل التقدم في التكنولوجيا.
عندما يتم تدريب الخوارزمية، يتم إنشاء حد قرار يفصل بين مجموعتين من البيانات في الفضاء الرياضي. بمجرد أن يتم تدريب الخوارزمية على البيانات المعروفة، يمكنها تصنيف نقاط بيانات جديدة وغير معروفة عن طريق تحديد جانب الحد القراري الذي تقع فيه هذه النقاط, الناتج الذي تقدمه الخوارزمية هو تصنيف الفئة المرتبطة بالجانب الذي تنتمي إليه النقطة فيما يتعلق بحد القرار.
قد تكون البيانات ذات الأبعاد العالية مشكلة لبعض الخوارزميات على عكس هذه الخوارزمية, لذلك لابد من تقليل أبعادها, لمعرفة المزيد عن ما أتحدث عنه, تصفح المقال الآتي:
تقليل الأبعاد: تقنية للتعامل مع البيانات الضخمة
فيما يلي ذكر بعض الإيجابيات والسلبيات المتعلقة بخوارزمية آلة المتجه الداعم: [4]
الإيجابيات
السلبيات
انظر أيضا: خوارزمية محاكاة التلدين في الذكاء الاصطناعي Simulated Annealing: مقتبسة من المعادن!
بعض الاستخدامات من الحياة الواقعية على هذه الخوارزمية: [5]
الخاتمة
ختاما, تعد خوارزمية آلة المتجه الداعم من الخوارزميات المهمة والفعالة في عمليات التصنيف والتنبؤ, وخصوصا في حالة التنصيف غير الخطي للبيانات, تعتمد على مبدأ الهامش الأقصى حيث تهدف الى الوصول الى أفضل خط فاصل يسمى بالمستوى الفائق يفصل بين البيانات على أن يحقق الهامش الأكبر.
تستخدم وظيفة النواة لتصنيف البيانات غير القابلة للفصل بشكل خطي من خلال تحويلها الى فضاء ذي أبعاد عالية, يختلف نوع وظيفة النواة باختلاف خصائص البيانات والمهمة المطلوبة, لذا لا بد من الاختيار الصحيح للوظيفة المناسبة.
من مميزاتها أنها أقل عرضة لمشكلة فرط التجهيز مقارنة بالخوارزميات الأخرى ولكنها في المقابل تعد مكلفة حسابيا وغير مناسبة للكميات الكبيرة من البيانات, أخيرا تظل خوارزمية آلة المتجه الداعم حجر الزاوية في تطور تقنيات التعلم الآلي وتحليل البيانات.
المصادر