مدونتنا

Blog Thumbnail

خوارزمية آلة المتجه الداعم-حل مشاكل التصنيف الخطي وغير الخطي|SHAI

خوارزمية آلة المتجه الداعم من أهم خوارزميات التصنيف والتنبؤ, تبرز في حل مشاكل التصنيف غير الخطي من خلال وظيفة النواة Kernel Function, المزيد في المقال.

3/4/2025 - 11 دقيقة

ما هي خوارزمية آلة المتجه الداعم وكيف تعمل؟ 

انتشر مؤخرا الذكاء الاصطناعي وفرعيه التعلم العميق والتعلم الآلي, حيث لكل منهما خوارزمياته المحددة, ولكن عندما يأتي الأمر لاختيار الخوارزمية المناسبة لنموذج الذكاء الاصطناعي فإننا نتوه قليلا, إذ نبقى حائرين أي الخوارزميات نستخدم, بالطبع اختيار الخوارزمية المناسبة يعتمد على نوع المهمة, مثلا إذا أردت بناء نموذج يقوم بمهمة التصنيف ستظهر أمامك العديد من الخوارزميات المستخدمة لهذا الغرض, وإحدى أهم هذه الخوارزميات هي خوارزمية آلة المتجه الداعم Support Vector Machine وهي من الخوارزميات البارزة في مجال تعلم الآلة، والتي تستخدم بشكل رئيسي في المهام التصنيف والتنبؤ, كما أنها تمثل نهجا فعالا لحل مشكلة فصل الفئات في الفضاء الرياضي و تتميز بقدرتها على التعامل مع بيانات غير خطية وفصلها بشكل فعال.


تم ابتكار خوارزمية آلة المتجه الداعم أو SVM أول مرة من قبل فيل فابنيك في عام 1992، ومن ثم تطورت لتصبح أحد الأساليب الأكثر استخداما في ميدان تعلم الآلة والذكاء الاصطناعي, ما هي خوارزمية آلة المتجه الداعم تحديدا سيكون هذا موضوع مقالنا, حيث سنوضح فيه أبرز مكوناتها وكيفية عملها وأهم التطبيقات عليها, اقرأ المقال لتكتسب المعرفة حول هذه الخوارزمية. 


مفهوم خوارزمية آلة المتجه الداعم SVM

خوارزمية آلة المتجه الداعم هي إحدى خوارزميات تعلم الآلة الخاضع للإشراف المستخدمة في مهام التصنيف والتنبؤ, وبالأخص في مهمة التصنيف الثنائي التي تعتمد تصنيف البيانات الى مجموعتين فقط. 

تعتمد فكرة فصل البيانات في آلة المتجه الداعم على ما يعرف بالمستوى الفائق HyperPlane وهو عبارة عن حد أو خط يفصل بين نقاط البيانات في فئات مختلفة, بحيث يكون الهدف هو إيجاد أفضل خط أو أفضل مستوى فائق يفصل بينها على أن يحقق هذا المستوى الفائق أقصى هامش Max-Margin, و يقصد بالهامش المسافة بين المستوى الفائق وأقرب نقاط البيانات لكل فئة مما يجعل من السهل التمييز بين فئات البيانات.


لا ينحصر استخدام خوارزمية آلة المتجه الداعم على التصنيف الخطي فحسب, بل أيضا تعمل بشكل فعال في التصنيف غير الخطي عند التعامل مع البيانات المعقدة من خلال خدعة رياضية تسمى خدعة النواة Kernel Trick, وهي تقوم على تحويل البيانات المعقدة الى فضاء ذو أبعاد أعلى حتى يتيح إيجاد  حد فاصل أو المستوى الفائق بشكل أسهل وفعال, بالإضافة إلى ذلك، يمكن استخدام آلة المتجه الداعم  لمهام الانحدار، حيث يصبح الهدف هو تقدير قيمة مستمرة بدلا من فصل البيانات إلى فئات.

يتم الاستفادة من هذه الخوارزمية في حالات مثل:  تصنيف النصوص، تصنيف الصور، الكشف عن البريد العشوائي، التعرف على الخط اليدوي، تحليل تعبير الجينات، كشف الوجوه، واكتشاف الشذوذ وغيرها. [1]


أساسيات خوارزمية آلة المتجه الدعم 

يوجد عدة مصطلحات مرتبط بهذه الخوارزمية ينبغي توضيحها وفهمها, وهي: [2]


  • المستوى الفائق HyperPlane: هو الحد القراري أو الخط الذي يفصل نقاط البيانات عن بعضها التي تنتمي الى فئات مختلفة في مساحة السمات- المقصود فيها البيئة التي تمثل فيها البيانات- في حالة التصنيف الخطي تكون المعادلة خطية وتمثل بالقانون الآتي: wx+b=0, عندما تكون قيمة التعبير wx + b تساوي صفر، يتم اعتبار النقطة المقابلة على المستوى الفائق, أما إذا كانت القيمة أكبر من صفر يتم تصنيف النقطة في فئة واحدة، وإذا كانت أقل من صفر يتم تصنيفها في فئة أخرى.


  • متجهات الدعم Support Vectors: وهي نقاط البيانات الأقرب على المستوى الفائق ولها دور مهم في تحديد المستوى الفائق والهامش.


  • الهامش Margin: هو المسافة بين متجه الدعم والمستوى الفائق, حيث تهدف الخوارزمية الى تكبير هذه المسافة قدر الإمكان أو ما يسمى بتكبير الهامش, حيث يدل الهامش الأكبر على أداء تصنيف أفضل. 


  • النواة Kernel: هي دالة رياضية تستخدم لتحويل نقاط البيانات الى مساحة سمات ذات أبعاد عالية, لتسهيل إيجاد المستوى الفائق عندما لا يمكن فصل البيانات خطيا, من الأمثلة عليها: Linear خطية , Polynomial متعددة الحدود, وظيفة أساسية شعاعية Radial Basis Function و السيغميود Sigmoid.


  • الهامش الصلب Hard Margin: يعرف كذلك بالمستوى الفائق ذو الهامش الأقصى, وهو المستوى الفائق الذي يفصل نقاط البيانات التابعة لفئات مختلفة بشكل صحيح دون وجود خطأ في تصنيفها. 


  • الهامش المرن Soft Margin: يستخدم عندما تكون البيانات غير قابلة للفصل بشكل مثالي أو عند وجود قيم فردية. يسمح الهامش اللين بتقديم مرونة للنموذج حيث يسمح بتصنيفات غير صحيحة أو انتهاكات للهامش، مما يساعد في التوازن بين زيادة الهامش وتقليل التصنيفات الخاطئة، خاصة في حالة البيانات التي تكون صعبة الفصل بشكل دقيق.


  •  معامل C: هو معامل يتم من خلاله تحديد العقوبة عند تجاوز الهامش, فكلما كانت قيمة C أكبر يتم فرض عقوبة أكثر صرامة مما يؤدي الى  هامش أصغر وربما أقل عدد من التصنيفات الخاطئة. 


  • فاقد الفصل Hinge Loss: هي وظيفة خسارة تعاقب على التصنيفات غير الصحيحة أو انتهاكات الهامش, يتم تحديد الدالة الهدف التي يسعى النموذج إلى تحسينها خلال عملية التدريب, حيث تكون هذه الدالة الهدف عبارة عن مزيج بين دالة فاقد الفصل Hinge Loss وبين مصطلح التنظيم.


  • المشكلة المزدوجة Dual Problem: المشكلة المزدوجة هي تحول لمشكلة الأمثلية الرئيسية، حيث يتم البحث عن مضاعفات لاجرانج  Lagrange المتعلقين بنقاط الدعم. هذا التحول يسهل استخدام تقنيات النواة ويعزز فعالية الحسابات في الخوارزمية. 


كيفية عمل خوارزمية آلة المتجه الداعم

إذا الهدف من آلة المتجه الداعم هو إيجاد أفضل مستوى فائق يفصل بين نقاط البيانات, ويصعب ذلك في حالة كانت البيانات معقدة أو تمثيلها غير خطي, لذلك يتم استخدام أداة رياضية تسمى وظيفة النواة Kernel Function , تقوم على تحويل البيانات الى فضاء ذو أبعاد عالية ولكن بدلا من حساب إحداثيات كل نقطة في الفضاء المحول يتم استخدام النواة لحساب المنتجات النقطية. [3]


المنتج النقطي هو عملية رياضية تقوم بضرب المكونات المقابلة لكل نقطة في المتجه المحول بالمكونات المقابلة للنقاط في الفضاء الأصلي. الفائدة الرئيسية هنا هي أن هذه العملية يتم تنفيذها بشكل ضمني دون الحاجة إلى حساب الإحداثيات الفعلية لكل نقطة, هذا يقلل من العبء الحسابي خاصة عند التعامل مع مجموعات كبيرة من البيانات أو عند التحويل إلى فضاء ذو أبعاد عالية.


بعد تحويل نقاط البيانات الى فضاء ذي أبعاد عالية, وأثناء مرحلة التدريب باستخدام صيغ رياضية مختلفة يكون الهدف هو العثور على المستوى الفائق المثالي Hyperplane في الفضاء عالي الأبعاد, يطلق على هذا الفضاء اسم "فضاء النواة" Kernel Space, يعد المستوى الفائق ذو أهمية قصوى لأنه يحقق توازنا بين تكبير الهامش بهدف فصل أفضل بين البيانات وزيادة قدرة النموذج على التعامل مع بيانات جديدة وبين تقليل الأخطاء في التصنيف عبر تحديد موقع يمثل الفئات بشكل فعال مما يقلل من احتمال حدوث أخطاء في تصنيف البيانات ويعزز دقة النموذج. 


تتعامل خوارزمية آلة المتجه الداعم مع البيانات القابلة للفصل بشكل خطي والبيانات غير القابلة للفصل الخطي بفعالية من خلال استخدام وظيفة النواة Kernel Function المناسبة, حيث أن نوع وظيفة النواة يؤثر بشكل كبير على أداء الخوارزمية, لذلك لابد من توخي الحذر عند اختيار النوع المناسب.

 

يعتمد اختيار الوظيفة المناسبة على خصائص البيانات والمشكلة الخاصة التي يحاول حلها النموذج, من أبرز وأشهر أنواع وظيفة النواة المستخدمة في آلة المتجه الداعم: 

  • وظيفة نواة خطية Linear Kernel: وهي النوع الأبسط, تقوم بتحويل البيانات الى فضاء ذي أبعاد عالية حتى يتم فصلها بشكل خطي.
  • وظيفة نواة متعددة الحدود Polynomial kernel: وهي نوع أقوى من الوظيفة الخطية, وتستخدم كذلك لتحويل البيانات الى فضاء ذي أبعاد أعلى, ولكن تفصل البيانات بشكل غير خطي.
  • وظيفة RBF kernel: أكثر الأنواع شيوعا لأنها فعالة في مجموعات واسعة من مشاكل التصنيف.
  • وظيفة سيغمويد Sigmoid kernel: تشبه وظيفة RBF, إلا أنها تختلف في الشكل مما يجعلها مفيدة في مشكلات تصنيف محددة.


لابد من مراعاة التوازن بين الدقة والتعقيد عند اختيار نوع وظيفة النواة, فمثلا وظيفة RBF صحيح أنها أكثر قوة لأنها تتمتع بدقة أعلى في التصنيف, إلا أنها تحتاج الى كمية أكبر من البيانات ووقت أطول أثناء التدريب, ومع ذلك،  هذه القضية تصبح أقل مشكلة مع تقدم التكنولوجيا، مما يعني أن القدرة على استخدام وظائف النواة القوية لا تعتمد بشكل كبير على كمية البيانات أو وقت التحسين، بفضل التقدم في التكنولوجيا.



عندما يتم تدريب الخوارزمية، يتم إنشاء حد قرار يفصل بين مجموعتين من البيانات في الفضاء الرياضي. بمجرد أن يتم تدريب الخوارزمية على البيانات المعروفة، يمكنها تصنيف نقاط بيانات جديدة وغير معروفة عن طريق تحديد جانب الحد القراري الذي تقع فيه هذه النقاط, الناتج الذي تقدمه الخوارزمية هو تصنيف الفئة المرتبطة بالجانب الذي تنتمي إليه النقطة فيما يتعلق بحد القرار.



قد تكون البيانات ذات الأبعاد العالية مشكلة لبعض الخوارزميات على عكس هذه الخوارزمية, لذلك لابد من تقليل أبعادها, لمعرفة المزيد عن ما أتحدث عنه, تصفح المقال الآتي: 

تقليل الأبعاد: تقنية للتعامل مع البيانات الضخمة


إيجابيات وسلبيات الخوارزمية 

فيما يلي ذكر بعض الإيجابيات والسلبيات المتعلقة بخوارزمية آلة المتجه الداعم: [4]

الإيجابيات 

  • خوارزمية آلة المتجه الداعم فعالة أكثر في الفضاءات ذات الأبعاد العالية وهو عندما يكون عدد السمات أو الميزات أكبر من عدد نقاط البيانات الإجمالي. 
  •  تظهر أداء جيدا عندما يكون هناك حد واضح أو فرق واضح بين الفئات المختلفة في البيانات, أي يكون من السهل تمييز أو تفصيل الفئات المختلفة في مجموعة البيانات
  • لا تستهلك كميات كبيرة من الذاكرة مقارنة بالخوارزميات الاخرى مما يجعلها خيارا جيدا في حالات التشغيل التي قد تكون فيها الذاكرة محدودة، مثل بيئات الحوسبة ذات الموارد المحدودة
  • أقل عرضة لمشكلة فرط التجهيز Overfitting مقارنة بخوارزميات مثل أشجار القرار Decision Trees
  • تعمل خوارزمية آلة المتجه الداعم بفعالية حتى بوجود كمية قليلة من بيانات التدريب 


السلبيات

  • غير مناسبة لمجموعات البيانات الكبيرة, لأنها قد تكون مكلفة حسابيا, حيث يزداد وقت التدريب ومتطلبات الذاكرة
  • يتدهور أداء الخوارزمية عندما يكون هناك الكثير من الضوضاء في مجموعة البيانات, أي وجود اختلاط في البيانات أو تداخل في الفئات 
  • لا يمكن الحصول على توقعات احتمالية لمدى تأكيد التصنيف النهائي لنقطة معينة، بل يتم فقط تصنيفها إما إلى جهة واحدة أو الجهة الأخرى من المستوى الفائق وذلك دون إعطاء إشارة عن الثقة أو الاحتمالية لهذا التصنيف
  • تقوم الخوارزمية بتصنيف البيانات أما فوق أو أسفل المستوى الفائق مما يعني عدم وجود مخرجات احتمالية أي لا تقوم بتقدير مباشر لاحتمالية الفئات
  • تعتبر حساسة لمعاملات مثل معامل التنظيم Regularization Parameter ووظيفة النواة, إذ يجب ضبط هذه المعاملات بشكل دقيق لأن اختيار قيم غير صحيحة لها يؤثر بشكل سلبي على أداء الخوارزمية من حيث دقة النتائج بالإضافة الى أنها سوف تستغرق وقت أطول في التدريب



انظر أيضا: خوارزمية محاكاة التلدين في الذكاء الاصطناعي Simulated Annealing: مقتبسة من المعادن!




استخدامات آلة المتجه الداعم

بعض الاستخدامات من الحياة الواقعية على هذه الخوارزمية: [5]

  • يمكن باستخدام هذه الخوارزمية للكشف عن التلاعب والتزوير بالصور الرقمية, من خلال تحليل هذه الصور لمعرفة ما إذا تم التلاعب أم لا, يكون هذا مفيدا في قضايا الأمان مثل تأمين معلومات المؤسسات أو الوكالات الحكومية.


  • كما هو الحال في اكتشاف تزييف الصور, يمكن استخدامها كذلك للكشف عن خط اليد للتحقق من صحة التواقيع.


  • هناك تطبيق آخر لآلة المتجه الداعم, ألا وهو تصنيف الأسطح حيث يتم التقاط صور للأسطح ثم تقوم الخوارزمية بتحديد نوعية السطح بناعم أو خشن 


  • لهذه الخوارزمية أهمية كبيرة في مجال علم الأحياء الحاسوبي, حيث يمكن باستخدامها كشف التشابه البعيد في البروتينات, أي تحديد التشابه بين بروتينين على الرغم من وجود اختلافات بينهما, حيث تعتمد على نمذجة تسلسلات البروتين وكيفية حساب وظيفة النواة بينها


  • خوارزمية آلة المتجه الداعم تستخدم في تصنيف الوجوه وغير الوجوه في الصور, حيث يتم جمع بيانات التدريب التي تحتوي على وجوه وهياكل غير وجهية، وتسمى الوجوه بفئة إيجابية وهياكل غير الوجه بفئة سلبية, يتم استخدام الخوارزمية لاستخراج ميزات من الصور، مثل سطوع البكسل وزوايا الحواف 


الخاتمة

ختاما, تعد خوارزمية آلة المتجه الداعم من الخوارزميات المهمة والفعالة في عمليات التصنيف والتنبؤ, وخصوصا في حالة التنصيف غير الخطي للبيانات, تعتمد على مبدأ الهامش الأقصى حيث تهدف الى الوصول الى أفضل خط فاصل يسمى بالمستوى الفائق يفصل بين البيانات على أن يحقق الهامش الأكبر. 

تستخدم وظيفة النواة لتصنيف البيانات غير القابلة للفصل بشكل خطي من خلال تحويلها الى فضاء ذي أبعاد عالية, يختلف نوع وظيفة النواة باختلاف خصائص البيانات والمهمة المطلوبة, لذا لا بد من الاختيار الصحيح للوظيفة المناسبة.

من مميزاتها أنها أقل عرضة لمشكلة فرط التجهيز مقارنة بالخوارزميات الأخرى ولكنها في المقابل تعد مكلفة حسابيا وغير مناسبة للكميات الكبيرة من البيانات, أخيرا تظل خوارزمية آلة المتجه الداعم حجر الزاوية في تطور تقنيات التعلم الآلي وتحليل البيانات.

 



المصادر

  1. Support vector machine - Wikipedia
  2. Support Vector Machine (SVM) Algorithm - GeeksforGeeks
  3. What is a support vector machine? | Definition from WhatIs
  4. Top 4 advantages and disadvantages of Support Vector Machine or SVM | by Dhiraj K
  5. What Is a Support Vector Machine? Working, Types, and Examples


لايوجد تعليقات بعد!

سجل الدخول ﻹضافة تعليق

العلامات
خوارزميات