解决计算问题的特定过程称为算法。 有各种类型的算法。
在编程中,算法的开发具有不同于任何其他技术的价值。 一个程序需要一堆最好的算法才能有效运行。
套袋 和随机森林也是两种算法。
关键精华
- Bagging 或 bootstrap 聚合是一种使用多个模型来减少预测方差的技术。 同时,随机森林是一种集成学习方法,通过为每棵决策树添加随机特征选择来扩展bagging的概念。
- Bagging 侧重于通过平均多个决策树的预测来减少过度拟合,而随机森林旨在通过将随机性引入树构建来提高预测准确性。
- 这两种技术都利用了多个学习器的力量,但随机森林由于在树构建过程中增加了随机性层而优于装袋。
装袋与随机森林
Bagging(Bootstrap Aggregating)是一种在训练数据的随机子集上构建多个模型(决策树),然后通过平均或投票来组合它们的预测的方法。随机森林是 Bagging 的扩展,它将多个决策树组合起来形成森林。
Bagging 是一种元算法,旨在提高和改进机器学习算法的准确性和稳定性,这些算法用于术语统计和分类 回归.
bagging 的另一个名字是 bootstrap aggregating。 这是改进计算机程序的一种非常有用的技术。
随机森林也是一种称为监督机器学习算法的算法,它也旨在提高术语回归的准确性和稳定性。 程序员广泛使用该算法来解决回归问题。
该技术通过为不同样本构建决策树来发挥作用。 它还处理包含连续变量的数据集。
对比表
比较参数 | 套袋 | 随机森林 |
---|---|---|
年 | Bagging 是在大约 1996 年前的 2 年引入的。 引入了随机森林。 | 随机森林算法于 2001 年推出。 |
发明家 | 装袋算法是由一个名叫 Leo Breiman 的人创建的。 | 在 bagging 成功之后,Leo Breiman 创建了增强版的 bootstrap 聚合,即随机森林。 |
用法 | 为了增加程序的稳定性,决策树使用装袋。 | 随机森林技术用于解决与分类和回归相关的问题。 |
宗旨 | bagging 的主要目的是训练属于不同日落的未修剪决策树。 | 随机森林的主要目的是创建多个随机树。 |
结果 | bagging 算法给出了一个准确稳定的机器学习模型的结果。 | 随机森林给出的结果是对程序中过拟合问题的鲁棒性。 |
什么是装袋?
Bagging 是许多程序员在机器学习中使用的一种算法。 bagging 的另一个名字是 bootstrap 聚合.
它基于集成,是一种元算法。 装袋用于计算机程序以提高其准确性和稳定性。
决策树方法也适应了装袋。
Bagging 可以被视为特殊情况下的模型平均方法。 当程序出现过拟合和方差数量增加时,bagging 用于为解决这些问题提供必要的帮助。
bagging 中找到的数据集数量为三个,分别是 bootstrap、original 和 out-to-bag 数据集。 当程序从数据集中挑选随机对象时,这个过程会导致创建引导数据库。
在 out-to-bag 数据集中,程序表示留在 Bootstrap 中的剩余对象。
bootstrap 数据集和 out-to-bag 数据集用于测试程序或 bagging 算法的准确性,因此在创建时应格外小心。
装袋算法会生成多个决策树和多个数据集,并且有可能遗漏一个对象。 制作一棵树用于检查已引导的样本集。
什么是随机森林?
随机森林是一种广泛用于机器学习程序的技术。 它也被称为监督机器学习算法。
随机森林采用多个不同的样本并构建决策树,以解决与回归和分类案例相关的问题。 从决策树中抽取的多数用于投票。
当分类案例中存在连续变量时,随机森林可以帮助处理数据集。 众所周知,随机森林是一种基于集成的算法。
通过集成,可以理解在同一位置组合的多个模型。 Ensembles 使用两种方法,bagging 就是其中之一。
第二个是提升。 决策树的集合形成随机森林。
当程序员制作决策树时,他必须以不同的方式制作每棵树以保持树之间的多样性。
在随机森林中,特征的空间减少了,因为每棵树都不考虑它们。 用于形成每个决策树的数据或属性彼此不同。
随机森林的制作完全使用CPU。 在通过随机森林操作时,始终有 30% 的可能性不会使用或测试整个数据。
结果或输出取决于决策树提供的多数。
Bagging 和随机森林之间的主要区别
- 当在机器学习程序中发现稳定性不佳时,将使用 Bagging。 而随机森林用于解决有关回归的问题。
- Bagging 会查看决策树以检查必要的更改并进行改进。 另一方面,随机森林首先创建决策树。
- Bagging 诞生于 1996 年,当时机器学习还处于发展阶段,而随机森林算法则于 2001 年问世。
- Bagging 是由 Leo Breiman 开发和改进的,目的是使机器学习更容易,一年后,随机森林作为升级版推出,也是由 Leo 开发的。
- Bagging 是一种基于集成技术的元算法,而随机森林是 bagging 的增强形式。
- https://projecteuclid.org/journals/annals-of-statistics/volume-30/issue-4/Analyzing-bagging/10.1214/aos/1031689014.short
- https://link.springer.com/chapter/10.1007/978-3-642-31537-4_13
最后更新时间:11 年 2023 月 XNUMX 日
Sandeep Bhandari 拥有塔帕尔大学计算机工程学士学位(2006 年)。 他在技术领域拥有 20 年的经验。 他对各种技术领域都有浓厚的兴趣,包括数据库系统、计算机网络和编程。 你可以在他的网站上阅读更多关于他的信息 生物页面.
这篇文章内容非常丰富,并提供了该主题的全面概述。
同意,我觉得我从那本书中学到了很多东西。
是的,我对这些算法有很多误解,现在我觉得我对它们有了更好的理解。
提供的信息确实很有帮助
是的,我认为数据确实整理得很好,一切都得到了很好的解释
比较表确实突出了两种技术的显着特征。做得好!
我发现解释不够清楚。人们很容易迷失在所有这些技术细节中。
这篇文章描述 Bagging 和随机森林之间差异的方式简直令人惊叹。
这篇文章提供了有价值的信息,但阅读所有这些细节很乏味。
我同意,就像读教科书一样。