Mengantongi vs Hutan Acak: Perbedaan dan Perbandingan

Prosedur tertentu untuk memecahkan masalah komputasi dikenal sebagai algoritma. Ada berbagai jenis algoritma.

Dalam pemrograman, pengembangan algoritma memiliki nilai yang berbeda dari teknik lainnya. Suatu program membutuhkan banyak algoritma terbaik untuk berjalan secara efektif.

Bagging dan Random Forest juga merupakan dua jenis algoritma.

Pengambilan Kunci

  1. Bagging, atau bootstrap aggregating, adalah teknik yang menggunakan banyak model untuk mengurangi variasi prediksi. Sementara itu, random forest merupakan metode pembelajaran ensemble yang memperluas konsep bagging dengan menambahkan seleksi fitur secara acak untuk setiap pohon keputusan.
  2. Bagging berfokus pada pengurangan overfitting dengan merata-ratakan beberapa prediksi pohon keputusan, sementara hutan acak bertujuan untuk meningkatkan akurasi prediksi dengan memasukkan keacakan ke dalam konstruksi pohon.
  3. Kedua teknik ini memanfaatkan kekuatan banyak pembelajar, namun hutan acak mengungguli bagging karena adanya lapisan keacakan tambahan selama konstruksi pohon.

Mengantongi vs Hutan Acak

Bagging (Bootstrap Aggregating) adalah metode membangun beberapa model (pohon keputusan) pada subset acak dari data pelatihan dan kemudian menggabungkan prediksinya melalui rata-rata atau pemungutan suara. Random Forest adalah perpanjangan dari Bagging yang menggabungkan beberapa pohon keputusan untuk membentuk hutan.

Mengantongi vs Hutan Acak

Bagging adalah meta-algoritma yang dirancang untuk meningkatkan dan meningkatkan akurasi dan stabilitas algoritma pembelajaran mesin yang digunakan dalam klasifikasi istilah statistik dan regresi.

Nama lain untuk mengantongi adalah bootstrap aggregating. Ini adalah teknik yang sangat berguna untuk meningkatkan program komputer.

Hutan acak juga merupakan algoritma yang dikenal sebagai Algoritma Pembelajaran Mesin Terawasi yang juga dirancang untuk meningkatkan akurasi dan stabilitas dalam istilah regresi. Pemrogram menggunakan algoritma ini secara luas untuk menyelesaikan masalah regresi.

Teknik ini bekerja dengan membangun pohon keputusan untuk sampel yang berbeda. Itu juga menangani kumpulan data yang menyertakan variabel kontinu.

Tabel perbandingan

Parameter PerbandinganBaggingHutan Acak
TahunBagging diperkenalkan pada tahun 1996 hampir 2 dekade yang lalu. Hutan acak diperkenalkan. Algoritma, hutan acak diperkenalkan pada tahun 2001.
PenemuAlgoritme bagging diciptakan oleh seorang pria bernama Leo Breiman.Setelah berhasil mengantongi, Leo Breiman membuat versi agregasi bootstrap yang disempurnakan, hutan acak.
penggunaanUntuk meningkatkan kestabilan program, bagging digunakan oleh pohon keputusan.Teknik random forest digunakan untuk menyelesaikan permasalahan yang berkaitan dengan klasifikasi dan regresi.
TujuanTujuan utama dari bagging adalah untuk melatih pohon keputusan yang belum dipangkas dari matahari terbenam yang berbeda. Tujuan utama hutan acak adalah untuk membuat banyak pohon acak.
HasilAlgoritma bagging memberikan hasil model pembelajaran mesin dengan stabilitas yang akurat.Hasil yang diberikan oleh random forest adalah ketahanan terhadap masalah overfitting pada program.

Apa itu Mengantongi?

Bagging adalah algoritma yang digunakan oleh banyak programmer dalam pembelajaran mesin. Nama lain yang dikenal dengan mengantongi adalah bootstrap pengumpulan.

Baca Juga:  Gumroad vs Stripe: Perbedaan dan Perbandingan

Ini didasarkan pada ansambel dan merupakan meta-algoritma. Bagging digunakan dalam program komputer untuk meningkatkan akurasi dan stabilitasnya.

Metode pohon keputusan juga mengadaptasi bagging.

Bagging dapat dianggap sebagai pendekatan rata-rata model untuk kasus-kasus khusus. Ketika ada overfitting dalam sebuah program dan peningkatan jumlah varians, bagging digunakan untuk memberikan bantuan yang diperlukan untuk memecahkan masalah ini.

Jumlah dataset yang ditemukan pada bagging adalah tiga, yaitu dataset bootstrap, original, dan out-to-bag. Saat program mengambil objek acak dari kumpulan data, proses ini mengarah pada pembuatan database bootstrap.

Dalam dataset out-to-bag, program mewakili sisa objek yang tersisa di Bootstrap.

Dataset bootstrap dan out-to-bag harus dibuat dengan sangat hati-hati karena digunakan untuk menguji keakuratan program atau algoritme bagging.

Algoritme bagging menghasilkan beberapa pohon keputusan dan beberapa kumpulan data, dan kemungkinan sebuah objek akan ditinggalkan. Untuk membuat pohon digunakan untuk memeriksa kumpulan sampel yang telah di-bootstrap.

Apa itu Hutan Acak?

Hutan acak adalah teknik yang banyak digunakan dalam program pembelajaran mesin. Ia juga dikenal sebagai Algoritma Pembelajaran Mesin Terawasi.

Hutan acak mengambil banyak sampel berbeda dan membangun pohon keputusan untuk memecahkan masalah yang terkait dengan kasus regresi dan klasifikasi. Mayoritas yang ditarik dari pohon keputusan digunakan untuk memilih.

Ketika ada variabel kontinu dalam kasus klasifikasi, hutan acak menyediakan bantuan untuk menangani kumpulan data. Hutan acak dikenal sebagai algoritma berbasis ansambel.

Dengan ansambel, seseorang dapat memahami beberapa model yang digabungkan di tempat yang sama. Ensemble menggunakan dua metode, dan mengantongi adalah salah satunya.

Baca Juga:  Hypertext vs Hyperlink: Perbedaan dan Perbandingan

Yang kedua adalah meningkatkan. Kumpulan pohon keputusan membentuk hutan acak.

Ketika seorang programmer membuat pohon keputusan, dia harus membuat setiap pohon berbeda untuk menjaga keragaman antar pohon.

Di hutan acak, ruang untuk fitur berkurang karena setiap pohon tidak mempertimbangkannya. Data atau atribut yang digunakan untuk membentuk setiap pohon keputusan berbeda satu sama lain.

Pembuatan hutan acak menggunakan CPU secara menyeluruh. Selalu ada kemungkinan 30% bahwa seluruh data tidak akan digunakan atau diuji saat beroperasi melalui hutan acak.

Hasil atau output tergantung pada mayoritas yang disediakan oleh pohon keputusan.

Perbedaan Utama Antara Mengantongi dan Hutan Acak

  1. Bagging digunakan ketika tidak ada stabilitas yang ditemukan dalam program pembelajaran mesin. Sedangkan hutan acak digunakan untuk mengatasi masalah terkait regresi.
  2. Bagging melihat melalui pohon keputusan untuk memeriksa perubahan yang diperlukan dan memperbaikinya. Di sisi lain, hutan acak membuat pohon keputusan di tempat pertama.
  3. Bagging dibuat pada tahun 1996 ketika pembelajaran mesin masih berkembang, sedangkan algoritma random forest diperkenalkan pada tahun 2001.
  4. Bagging dikembangkan dan diperbaiki oleh Leo Breiman untuk mempermudah pembelajaran mesin, dan setelah setahun, hutan acak diperkenalkan sebagai versi yang ditingkatkan yang juga dikembangkan oleh Leo.
  5. Bagging adalah meta-algoritma yang didasarkan pada teknik ansambel, sedangkan hutan acak adalah bentuk bagging yang disempurnakan.
Referensi
  1. https://projecteuclid.org/journals/annals-of-statistics/volume-30/issue-4/Analyzing-bagging/10.1214/aos/1031689014.short
  2. https://link.springer.com/chapter/10.1007/978-3-642-31537-4_13

Terakhir Diperbarui : 11 Juni 2023

dot 1
Satu permintaan?

Saya telah berusaha keras menulis posting blog ini untuk memberikan nilai kepada Anda. Ini akan sangat membantu saya, jika Anda mempertimbangkan untuk membagikannya di media sosial atau dengan teman/keluarga Anda. BERBAGI ADALAH ️

10 pemikiran tentang “Bagging vs Random Forest: Perbedaan dan Perbandingan”

Tinggalkan Komentar

Ingin menyimpan artikel ini untuk nanti? Klik hati di pojok kanan bawah untuk menyimpan ke kotak artikel Anda sendiri!