当谈到人工智能时,机器学习被视为其中的一部分。机器学习是通过数据使用和经验自动改进的计算机算法研究。其算法基于样本数据或训练数据构建模型。
机器学习算法用于各种应用,例如电子邮件过滤、计算机视觉、医学和语音识别。
深和 强化学习 是属于机器学习的两种算法。 在本文中,主要重点是区分 深入学习 和强化学习。
关键精华
- 深度学习是机器学习的一个子集,专注于人工神经网络。 相比之下,强化学习是一种机器学习,其中代理学习根据奖励和惩罚做出决策。
- 深度学习在图像和语音识别等任务中表现出色,而强化学习则适合机器人和自主系统等应用。
- 深度学习算法需要大量标记数据进行训练,而强化学习算法通过反复试验进行学习,不需要标记数据。
深度学习与强化学习
深入学习 是机器学习的一个子集,它使用人工神经网络来处理大量数据。 强化学习用于复杂环境中的决策。 它基于一个概念 代理人 与背景互动并从奖励或惩罚中学习。
深度学习教计算机做该做的事 人类 自然地:以身作则。 它是无人驾驶汽车后部的一项关键技术,从路灯柱到区分行人或使他们能够找出停车标志。
它是消费者设备中的关键 语音控制,例如平板电脑、免提扬声器、电视和电话。
强化学习是在特定情况下采取适当的行动来最大化奖励。 一些机器和软件使用它来找到它在特定情况下应该采取的最佳可能路径或行为。
决策在强化学习中是独立的,因此标签被赋予相关选择的序列。
对比表
比较参数 | 深度学习 | 强化学习 |
---|---|---|
起始地 | 1986年 | 在1980后期 |
介绍人 | 丽娜德克特 | 理查德·贝尔曼 |
也被称为 | 深度结构化学习或分层学习 | 不包含 |
数据存在 | 需要学习的已有数据集 | 在电信、机器人技术、电脑游戏、电梯调度和医疗保健 AI 领域。 |
采用 | 在语音和图像识别、降维任务和深度网络预训练方面。 | 在电信、机器人技术、电脑游戏、电梯调度和医疗保健 AI 领域。 |
什么是深度学习?
深度学习是一种 AI 以及模仿人类如何获得某些知识的机器学习。 在 数据科学,深度学习是包含预测建模和统计的重要元素。
对于负责解释、收集和分析数据的数据科学家来说,深度学习非常有益。
通过数据输入、偏差和权重,深度学习人工神经网络或神经网络试图模仿人类 脑.
传统机器学习中的算法是线性的,而深度算法的理解是递增的层次结构 抽象化 和复杂性。
使用计算机程序进行深度学习的过程与蹒跚学步的幼儿学习识别事物的过程大致相同。 猫. 在层次结构中,每个 算法 对其输入应用非线性变换。
然后使用它学到的东西创建一个统计模型作为输出,除非在迭代继续之前生产已经达到可接受的精度水平。
为了可训练性、效率和可理解性,深度学习中的层允许它是异构的,并且与具有生物学知识的联结模型大相径庭。
什么是强化学习?
强化学习执行行动以最大化奖励。简单地说,学习就是通过在最好的时机做某事以获得结果来完成。
这就像学习诸如 自行车 骑马,我们从一开始就摔倒了。
随着用户的反馈,什么失败了,什么加班了,以微调动作和掌握骑自行车。
就像这些一样,计算机使用强化学习并尝试特定动作; 通过反馈,他们学习并最终加强所做的努力。
例如,它的算法会在多次迭代中自动修改和返工,除非做出能够交付最佳结果的决策。
机器人 学习走路是算法的实例之一,即强化学习。 首先,一个足够大的机器人尝试向前迈出一步,然后跌倒。
跌倒的结果是一个数据点,是系统对强化学习反应的一大步,因为跌倒是一种作为负反馈的结果,用于调整系统以尝试更小的程度。
最后,机器人能够向前移动。
深度学习和强化学习的主要区别
- 关于算法教学,深度学习使用当前信息来获取相关模式。 相反,强化学习通过错误和试验来得出预测。
- 深度学习的应用更多的是识别和面积缩小的任务。另一方面,强化学习与具有最优控制的环境交互相关。
- 在示例方面, Amazon 信用卡欺诈系统是深度学习的一个实例,其中神经网络是通过使用从在线信用卡购买中获得的数据来构建的。 相反,步行机器人是强化学习的一个实例,其中的动作由它应该将腿抬起多高来定义。
- 深度学习与交互的关系较少。相比之下,强化学习更接近人脑的能力,因为通过反馈这种类型 智能化 可以改善。
- 深度学习中包含的学习技术正在分析现有数据并将学习应用于新数据集。 相比之下,强化学习技术包括从错误中学习以及最大化奖励。
参考资料
- https://books.google.com/books?hl=en&lr=&id=omivDQAAQBAJ&oi=fnd&pg=PR5&dq=deep+learning+&ots=MNQ_ipnCSR&sig=yeqmpT4zod7fgti0YqbcLj7nmik
- https://books.google.com/books?hl=en&lr=&id=uWV0DwAAQBAJ&oi=fnd&pg=PR7&dq=reinforcement+learning+&ots=mirEv1Z4o6&sig=zsp-E9V5ghtGvtAhaGwlCkbqJCM
最后更新时间:30 年 2023 月 XNUMX 日
Sandeep Bhandari 拥有塔帕尔大学计算机工程学士学位(2006 年)。 他在技术领域拥有 20 年的经验。 他对各种技术领域都有浓厚的兴趣,包括数据库系统、计算机网络和编程。 你可以在他的网站上阅读更多关于他的信息 生物页面.
我觉得这篇文章的内容过于肤浅,缺乏深度。
一篇发人深省的文章有效地强调了深度学习和强化学习之间的区别。
作者对深度学习和强化学习进行了深入分析,对于那些对人工智能和机器学习感兴趣的人来说是一本有价值的读物。
这篇文章很好地以清晰简洁的方式解释了深度学习和强化学习之间的差异。
我认为这太简单了。我在其他地方读过该主题的更好的细分。
我强烈不同意你的观点。文章精彩地总结了深度学习和强化学习的区别特征。
内容丰富、富有洞察力,对深度学习和强化学习进行了彻底的比较。
对深度学习和强化学习之间的比较的精彩概述。本文阐述了两者的核心概念,提供了清晰度和见解。