Когда дело доходит до искусственного интеллекта, машинное обучение рассматривается как его часть. Машинное обучение — это изучение компьютерных алгоритмов, которые автоматически улучшаются за счет использования данных и опыта. Его алгоритм строит модель на основе выборочных данных или обучающих данных.
Алгоритмы машинного обучения используются в различных приложениях, например, для фильтрации электронной почты, компьютерного зрения, медицины и распознавания речи.
Глубокое обучение и обучение с подкреплением — это два алгоритма, которые относятся к машинному обучению. В этой статье основное внимание уделяется разграничению глубокого обучения и обучения с подкреплением.
Основные выводы
- Глубокое обучение — это подмножество машинного обучения, ориентированное на искусственные нейронные сети. Напротив, обучение с подкреплением — это тип машинного обучения, при котором агент учится принимать решения на основе вознаграждений и штрафов.
- Глубокое обучение отлично справляется с такими задачами, как распознавание изображений и речи, тогда как обучение с подкреплением подходит для таких приложений, как робототехника и автономные системы.
- Алгоритмы глубокого обучения требуют больших объемов размеченных данных для обучения, в то время как алгоритмы обучения с подкреплением учатся методом проб и ошибок, не нуждаясь в размеченных данных.
Глубокое обучение против обучения с подкреплением
Глубокое обучение — это разновидность машинного обучения, которая использует искусственные нейронные сети для обработки больших объемов данных. Обучение с подкреплением используется для принятия решений в сложных средах. Он основан на концепции агента, который взаимодействует с фоном и учится на вознаграждениях или наказаниях.
Глубокое обучение учит компьютеры делать то, что естественно для людей: учиться на примерах. Это важнейшая технология в задней части беспилотных автомобилей, от фонарного столба до распознавания пешеходов или предоставления им возможности вычислить знак остановки.
Это ключ к голосовому управлению в потребительских устройствах, таких как планшеты, громкоговорители, телевизоры и телефоны.
Обучение с подкреплением — это принятие подходящих действий в конкретной ситуации, чтобы максимизировать вознаграждение. Несколько машин и программ используют его, чтобы найти наилучший возможный путь или поведение, которое следует предпринять в конкретном случае.
Решение является независимым в обучении с подкреплением, поэтому метки присваиваются последовательностям зависимого выбора.
Сравнительная таблица
Параметры сравнения | Глубокое обучение | Усиление обучения |
---|---|---|
Origin | В | В конце 1980s |
Интродьюсер | Рина Дехтер | Ричард Беллман |
Также называемый | Глубокое структурированное обучение или иерархическое обучение | Ничто |
Наличие данных | Уже существующий набор данных, необходимый для изучения | В телекоммуникациях, робототехнике, компьютерных играх, расписании лифтов и искусственном интеллекте в здравоохранении. |
использование | В распознавании речи и изображений, задаче уменьшения размера и предварительном обучении глубокой сети. | В телекоммуникациях, робототехнике, компьютерных играх, расписании лифтов и ИИ в здравоохранении. |
Что такое глубокое обучение?
Глубокое обучение — это тип искусственного интеллекта и машинного обучения, который имитирует то, как люди получают определенные виды знаний. В науке о данных глубокое обучение является жизненно важным элементом, состоящим из прогнозного моделирования и статистики.
Для ученых, занимающихся данными, глубокое обучение очень полезно для тех, кто занимается интерпретацией, сбором и анализом данных.
Посредством ввода данных, смещения и весов искусственные нейронные сети глубокого обучения или нейронные сети пытаются имитировать человеческий мозг.
Алгоритмы традиционного машинного обучения линейны, а глубокое понимание алгоритмов выстроено в иерархию возрастающей абстракции и сложности.
Глубокое обучение с использованием компьютерных программ происходит примерно так же, как процесс обучения малыша распознаванию кошки. В иерархии каждый алгоритм применяет к своим входным данным нелинейное преобразование.
Затем использует то, что он узнал, для создания статистической модели в качестве вывода, если производство не достигло уровня приемлемой точности, пока итерации не продолжатся.
Слои в глубоком обучении позволяют ему быть гетерогенным и сильно отклоняться от моделей биологически информированных коннекционистов ради обучаемости, эффективности и понятности.
Что такое обучение с подкреплением?
Обучение с подкреплением выполняет действия для максимизации вознаграждения. Проще говоря, обучение осуществляется путем совершения каких-либо действий для достижения результатов в лучшие времена.
Это похоже на обучение таким вещам, как езда на велосипеде, в которой мы понимаем, что вначале падаем.
Благодаря отзывам пользователей, что не удалось, а что сработало сверхурочно, чтобы отрегулировать действие и понять, как ездить на велосипеде.
Точно так же компьютеры используют обучение подкреплению и пробуют определенные действия; благодаря обратной связи они учатся и, наконец, подкрепляют проделанную работу.
Например, его алгоритм модифицируется и перерабатывается автономно в течение многих итераций, если только не принимаются решения, с помощью которых достигаются наилучшие результаты.
Обучение робота ходьбе — это один из примеров алгоритма, а именно обучения с подкреплением. Сначала шаг вперед пытается сделать достаточно большой робот и падает.
Результат падения — это точка данных, большой шаг в ответной реакции системы на обучение с подкреплением, потому что падение — это результат, который работал как отрицательная обратная связь, используемая для настройки системы, чтобы попытаться снизить степень.
Наконец, робот способен двигаться вперед.
Основные различия между глубоким обучением и обучением с подкреплением
- Что касается обучения алгоритмам, глубокое обучение использует текущую информацию для соответствующих шаблонов. Напротив, обучение с подкреплением вычисляет прогнозы путем ошибок и проб.
- Приложение глубокого обучения больше ориентировано на распознавание и задачи с уменьшением площади. С другой стороны, обучение с подкреплением связано с взаимодействием окружающей среды с оптимальным контролем.
- В качестве примера можно привести систему мошенничества с кредитными картами Amazon, которая представляет собой пример глубокого обучения, в котором нейронные сети создаются с использованием данных, полученных при покупках кредитных карт в Интернете. И наоборот, шагающий робот — это пример обучения с подкреплением, в котором действия определяются тем, насколько высоко он должен поднять ногу.
- Глубокое обучение меньше связано с взаимодействием. Для сравнения, обучение с подкреплением ближе к возможностям человеческого мозга, поскольку с помощью обратной связи этот тип интеллекта можно улучшить.
- Методы обучения, включенные в глубокое обучение, включают анализ существующих данных и обучение, применяемое к новому набору данных. Напротив, методы обучения с подкреплением включают обучение на ошибках, а также получение максимального вознаграждения.
Я считаю, что содержание поста слишком поверхностное и недостаточно глубокое.
Статья, заставляющая задуматься, в которой эффективно подчеркиваются различия между глубоким обучением и обучением с подкреплением.
Автор предоставляет углубленный анализ глубокого обучения и обучения с подкреплением, что делает его ценным чтением для тех, кто интересуется искусственным интеллектом и машинным обучением.
В статье хорошо и ясно объясняются различия между глубоким обучением и обучением с подкреплением.
Я подумал, что это слишком упрощенно. Я читал более подробное описание этой темы в другом месте.
Я категорически не согласен с вашей точкой зрения. В статье блестяще представлено краткое изложение отличительных характеристик глубокого обучения и обучения с подкреплением.
Информативный и проницательный, обеспечивающий тщательное сравнение глубокого обучения и обучения с подкреплением.
Отличный обзор сравнения глубокого обучения и обучения с подкреплением. В статье рассматриваются основные концепции обоих, обеспечивая ясность и понимание.