عندما يتعلق الأمر بالذكاء الاصطناعي، يُنظر إلى التعلم الآلي كجزء منه. التعلم الآلي هو دراسة خوارزمية الكمبيوتر التي تتحسن تلقائيًا من خلال استخدام البيانات والخبرة. تقوم الخوارزمية الخاصة بها ببناء نموذج يعتمد على بيانات العينة أو بيانات التدريب.
تُستخدم خوارزميات التعلم الآلي في تطبيقات مختلفة ، على سبيل المثال ، تصفية البريد الإلكتروني ، ورؤية الكمبيوتر ، والطب ، والتعرف على الكلام.
التعلم العميق والمعزز هما خوارزميتان تندرجان تحت التعلم الآلي. في هذه المقالة، ينصب التركيز الرئيسي على التمييز بين التعلم العميق والتعلم المعزز.
الوجبات السريعة الرئيسية
- التعلم العميق هو مجموعة فرعية من التعلم الآلي تركز على الشبكات العصبية الاصطناعية. في المقابل ، التعلم المعزز هو نوع من التعلم الآلي حيث يتعلم الوكيل اتخاذ القرارات بناءً على المكافآت والعقوبات.
- يتفوق التعلم العميق في مهام مثل التعرف على الصور والكلام ، بينما يناسب التعلم المعزز تطبيقات مثل الروبوتات والأنظمة المستقلة.
- تتطلب خوارزميات التعلم العميق كميات كبيرة من البيانات المصنفة للتدريب ، بينما تتعلم خوارزميات التعلم المعزز من التجربة والخطأ ، دون الحاجة إلى البيانات المصنفة.
التعلم العميق مقابل التعلم المعزز
التعلم العميق هو مجموعة فرعية من التعلم الآلي الذي يستخدم الشبكات العصبية الاصطناعية لمعالجة كميات كبيرة من البيانات. يستخدم التعلم المعزز لاتخاذ القرار في البيئات المعقدة. يعتمد على مفهوم الوكيل الذي يتفاعل مع الخلفية ويتعلم من المكافآت أو العقوبات.

يعلم التعلم العميق أجهزة الكمبيوتر القيام بما يأتي للبشر بشكل طبيعي: التعلم بالقدوة. إنها تقنية بالغة الأهمية في الجزء الخلفي من السيارات ذاتية القيادة، بدءًا من عمود الإنارة وحتى تمييز المشاة أو تمكينهم من اكتشاف إشارة التوقف.
إنه المفتاح في أجهزة المستهلكين للتحكم الصوتي، مثل الأجهزة اللوحية ومكبرات الصوت وأجهزة التلفزيون والهواتف.
التعلم المعزز هو اتخاذ الإجراءات المناسبة في موقف معين لتعظيم المكافأة. تستخدمه العديد من الأجهزة والبرامج للعثور على أفضل مسار أو سلوك ممكن يجب أن يسلكه في حالة معينة.
القرار مستقل في التعلم المعزز ، لذلك يتم إعطاء الملصقات لتسلسل الخيارات التابعة.
جدول المقارنة
معلمات المقارنة | تعلم عميق | تعزيز التعلم |
---|---|---|
المنشأ | في 1986 | في أواخر شنومكس |
التعريف | رينا ديشتر | ريتشارد بيلمان |
أيضا يسمى | التعلم المنظم العميق أو التعلم الهرمي | بدون سلوفان |
وجود البيانات | مجموعة البيانات الموجودة بالفعل مطلوبة للتعلم | في مجال الاتصالات والروبوتات وألعاب الكمبيوتر وجدولة المصاعد والذكاء الاصطناعي للرعاية الصحية. |
الاستخدام | في التعرف على الكلام والصورة ، ومهمة تقليل الأبعاد ، والتدريب المسبق العميق على الشبكات. | في مجال الاتصالات والروبوتات وألعاب الكمبيوتر وجدولة المصعد والرعاية الصحية AI. |
ما هو التعلم العميق؟
التعلم العميق هو نوع من الذكاء الاصطناعي والتعلم الآلي الذي يحاكي كيفية اكتساب البشر لأنواع معينة من المعرفة. في علم البيانات، يعد التعلم العميق عنصرًا حيويًا يتكون من النمذجة والإحصاءات التنبؤية.
بالنسبة لعلماء البيانات ، يعد التعلم العميق مفيدًا للغاية حيث يتم تكليفهم بتفسير البيانات وجمعها وتحليلها.
من خلال مدخلات البيانات والتحيز والأوزان، تحاول الشبكات العصبية الاصطناعية للتعلم العميق، أو الشبكات العصبية، محاكاة الدماغ البشري.
الخوارزميات في التعلم الآلي التقليدي خطية، في حين أن الفهم العميق للخوارزميات مكدس في تسلسل هرمي من التجريد والتعقيد المتزايد.
يمر التعلم العميق باستخدام برامج الكمبيوتر بنفس العملية التي يمر بها الطفل الصغير في تعلم التعرف على القطة. في التسلسل الهرمي، تطبق كل خوارزمية تحويلاً غير خطي على مدخلاتها.
ثم يستخدم ما يتعلمه لإنشاء نموذج إحصائي كمخرجات ما لم يصل الإنتاج إلى مستوى من الدقة المقبولة حتى تستمر التكرارات.
تسمح الطبقات في التعلم العميق بأن تكون غير متجانسة وتنحرف على نطاق واسع عن نماذج الاتصال المستنير بيولوجيًا من أجل قابلية التدريب والكفاءة والفهم.

ما هو التعلم المعزز؟
يؤدي التعلم المعزز إلى تنفيذ إجراءات لتحقيق أقصى قدر من المكافآت. ببساطة، التعلم يتم من خلال القيام بالشيء للحصول على النتائج في أفضل الأوقات.
وهذا مثل تعلم أشياء مثل ركوب الدراجة، والتي نعرفها بالسقوط في البداية.
من خلال ملاحظات المستخدم ، ما الذي فشل وما الذي نجح في العمل الإضافي لضبط الإجراءات والاستيعاب لركوب الدراجة.
تمامًا مثل هذه ، تستخدم أجهزة الكمبيوتر تعلم التعزيز ومحاولة إجراءات محددة ؛ من خلال التعليقات ، يتعلمون ، وفي النهاية ، يعززون الجهود المبذولة.
على سبيل المثال ، يتم تعديل الخوارزمية الخاصة بها وإعادة صياغتها بشكل مستقل عبر العديد من التكرارات ما لم يتم اتخاذ قرارات يتم من خلالها تقديم أفضل النتائج.
يعد تعلم الروبوت للمشي أحد أمثلة الخوارزمية ، وبالتحديد التعلم المعزز. في البداية ، يتم تجربة خطوة إلى الأمام بواسطة روبوت كبير بما يكفي ويسقط.
نتيجة الخريف هي نقطة بيانات ، وهي خطوة كبيرة في استجابة النظام للتعلم المعزز لأن السقوط هو نتيجة عملت كتعليقات سلبية تستخدم لضبط النظام لمحاولة الحصول على درجة ثانوية.
أخيرًا ، الروبوت قادر على المضي قدمًا.
الاختلافات الرئيسية بين التعلم العميق والتعلم المعزز
- فيما يتعلق بتعاليم الخوارزمية، يستخدم التعلم العميق المعلومات الحالية للأنماط ذات الصلة. على العكس من ذلك، فإن التعلم المعزز يتوصل إلى التنبؤات عن طريق الخطأ والتجربة.
- تطبيق التعلم العميق يركز أكثر على التعرف والمهام مع تقليل المساحة. وعلى الجانب الآخر، يرتبط التعلم المعزز بتفاعل البيئة مع التحكم الأمثل.
- من حيث الأمثلة، يعد نظام الاحتيال على بطاقات الائتمان من أمازون مثالًا للتعلم العميق الذي يتم فيه إنشاء الشبكات العصبية باستخدام البيانات التي تم الحصول عليها من عمليات شراء بطاقات الائتمان عبر الإنترنت. على العكس من ذلك، يعد روبوت المشي مثالًا على التعلم المعزز حيث يتم تحديد الإجراءات من خلال الارتفاع الذي يجب أن يرفع به الساق.
- التعلم العميق أقل ارتباطًا بالتفاعل. وبالمقارنة، فإن التعلم المعزز أقرب إلى قدرات الدماغ البشري، حيث يمكن تحسين هذا النوع من الذكاء من خلال ردود الفعل.
- تعمل تقنيات التعلم المضمنة في التعلم العميق على تحليل البيانات الموجودة والتعلم المطبق على مجموعة بيانات جديدة. في المقابل ، تتضمن تقنيات التعلم المعزز التعلم من الأخطاء بالإضافة إلى تعظيم المكافآت.