Bagging vs Random Forest:差异与比较

解决计算问题的特定过程称为算法。 有各种类型的算法。

在编程中,算法的开发具有不同于任何其他技术的价值。 一个程序需要一堆最好的算法才能有效运行。

套袋 和随机森林也是两种算法。

关键精华

  1. Bagging 或 bootstrap 聚合是一种使用多个模型来减少预测方差的技术。 同时,随机森林是一种集成学习方法,通过为每棵决策树添加随机特征选择来扩展bagging的概念。
  2. Bagging 侧重于通过平均多个决策树的预测来减少过度拟合,而随机森林旨在通过将随机性引入树构建来提高预测准确性。
  3. 这两种技术都利用了多个学习器的力量,但随机森林由于在树构建过程中增加了随机性层而优于装袋。

装袋与随机森林

Bagging(Bootstrap Aggregating)是一种在训练数据的随机子集上构建多个模型(决策树),然后通过平均或投票来组合它们的预测的方法。随机森林是 Bagging 的扩展,它将多个决策树组合起来形成森林。

装袋与随机森林

Bagging 是一种元算法,旨在提高和改进机器学习算法的准确性和稳定性,这些算法用于术语统计和分类 回归.

bagging 的另一个名字是 bootstrap aggregating。 这是改进计算机程序的一种非常有用的技术。

随机森林也是一种称为监督机器学习算法的算法,它也旨在提高术语回归的准确性和稳定性。 程序员广泛使用该算法来解决回归问题。

该技术通过为不同样本构建决策树来发挥作用。 它还处理包含连续变量的数据集。

对比表

比较参数套袋随机森林
Bagging 是在大约 1996 年前的 2 年引入的。 引入了随机森林。 随机森林算法于 2001 年推出。
发明家装袋算法是由一个名叫 Leo Breiman 的人创建的。在 bagging 成功之后,Leo Breiman 创建了增强版的 bootstrap 聚合,即随机森林。
用法为了增加程序的稳定性,决策树使用装袋。随机森林技术用于解决与分类和回归相关的问题。
宗旨bagging 的主要目的是训练属于不同日落的未修剪决策树。 随机森林的主要目的是创建多个随机树。
结果bagging 算法给出了一个准确稳定的机器学习模型的结果。随机森林给出的结果是对程序中过拟合问题的鲁棒性。

什么是装袋?

Bagging 是许多程序员在机器学习中使用的一种算法。 bagging 的另一个名字是 bootstrap 聚合.

另请参阅:  Coinbase vs Metamask:差异与比较

它基于集成,是一种元算法。 装袋用于计算机程序以提高其准确性和稳定性。

决策树方法也适应了装袋。

Bagging 可以被视为特殊情况下的模型平均方法。 当程序出现过拟合和方差数量增加时,bagging 用于为解决这些问题提供必要的帮助。

bagging 中找到的数据集数量为三个,分别是 bootstrap、original 和 out-to-bag 数据集。 当程序从数据集中挑选随机对象时,这个过程会导致创建引导数据库。

在 out-to-bag 数据集中,程序表示留在 Bootstrap 中的剩余对象。

bootstrap 数据集和 out-to-bag 数据集用于测试程序或 bagging 算法的准确性,因此在创建时应格外小心。

装袋算法会生成多个决策树和多个数据集,并且有可能遗漏一个对象。 制作一棵树用于检查已引导的样本集。

什么是随机森林?

随机森林是一种广泛用于机器学习程序的技术。 它也被称为监督机器学习算法。

随机森林采用多个不同的样本并构建决策树,以解决与回归和分类案例相关的问题。 从决策树中抽取的多数用于投票。

当分类案例中存在连续变量时,随机森林可以帮助处理数据集。 众所周知,随机森林是一种基于集成的算法。

通过集成,可以理解在同一位置组合的多个模型。 Ensembles 使用两种方法,bagging 就是其中之一。

另请参阅:  修复:Plex 不使用 GPU 进行转码 - 快速解决方案指南

第二个是提升。 决策树的集合形成随机森林。

当程序员制作决策树时,他必须以不同的方式制作每棵树以保持树之间的多样性。

在随机森林中,特征的空间减少了,因为每棵树都不考虑它们。 用于形成每个决策树的数据或属性彼此不同。

随机森林的制作完全使用CPU。 在通过随机森林操作时,始终有 30% 的可能性不会使用或测试整个数据。

结果或输出取决于决策树提供的多数。

Bagging 和随机森林之间的主要区别

  1. 当在机器学习程序中发现稳定性不佳时,将使用 Bagging。 而随机森林用于解决有关回归的问题。
  2. Bagging 会查看决策树以检查必要的更改并进行改进。 另一方面,随机森林首先创建决策树。
  3. Bagging 诞生于 1996 年,当时机器学习还处于发展阶段,而随机森林算法则于 2001 年问世。
  4. Bagging 是由 Leo Breiman 开发和改进的,目的是使机器学习更容易,一年后,随机森林作为升级版推出,也是由 Leo 开发的。
  5. Bagging 是一种基于集成技术的元算法,而随机森林是 bagging 的增强形式。
参考资料
  1. https://projecteuclid.org/journals/annals-of-statistics/volume-30/issue-4/Analyzing-bagging/10.1214/aos/1031689014.short
  2. https://link.springer.com/chapter/10.1007/978-3-642-31537-4_13

最后更新时间:11 年 2023 月 XNUMX 日

点1
一个请求?

我付出了很多努力来写这篇博文,为您提供价值。 如果您考虑在社交媒体上或与您的朋友/家人分享,这对我很有帮助。 分享是♥️

关于“套袋与随机森林:差异与比较”的 10 个思考

发表评论

想保存这篇文章以备后用? 点击右下角的心形收藏到你自己的文章箱!