Kad je u pitanju AI, strojno učenje se smatra njegovim dijelom. Strojno učenje je studija računalnog algoritma koja se automatski poboljšava upotrebom podataka i iskustvom. Njegov algoritam gradi model na temelju podataka uzorka ili podataka o obuci.
Algoritmi strojnog učenja koriste se u raznim aplikacijama, na primjer, filtriranje e-pošte, računalni vid, medicina i prepoznavanje govora.
Duboko i učenje učvršćivanja su dva algoritma koja spadaju pod strojno učenje. U ovom je članku glavni fokus na diferencijaciji duboko učenje i učenje s potkrepljenjem.
Ključni za poneti
- Duboko učenje podskup je strojnog učenja usmjerenog na umjetne neuronske mreže. Nasuprot tome, učenje s pojačanjem je vrsta strojnog učenja gdje agent uči donositi odluke na temelju nagrada i kazni.
- Duboko učenje ističe se u zadacima poput prepoznavanja slike i govora, dok učenje s pojačanjem odgovara aplikacijama poput robotike i autonomnih sustava.
- Algoritmi dubokog učenja zahtijevaju velike količine označenih podataka za obuku, dok algoritmi učenja s pojačanjem uče na temelju pokušaja i pogrešaka, bez potrebe za označenim podacima.
Duboko učenje nasuprot učenju s pojačanjem
Duboko učenje je podskup strojnog učenja koji koristi umjetne neuronske mreže za obradu velikih količina podataka. Učenje s potkrepljenjem koristi se za donošenje odluka u složenim okruženjima. Temelji se na konceptu an agent koji je u interakciji s pozadinom i uči iz nagrada ili kazni.
Duboko učenje uči računala da rade ono što im padne na pamet ljudi prirodno: učite na primjeru. To je ključna tehnologija na pozadini automobila bez vozača, od rasvjetnih stupova do razlikovanja pješaka ili omogućavanja da shvate znak stop.
To je ključ u potrošačkim uređajima za glas kontrola, poput tableta, hands-free zvučnika, televizora i telefona.
Učenje s potkrepljenjem je poduzimanje odgovarajućih radnji u određenoj situaciji kako bi se maksimizirala nagrada. Nekoliko strojeva i softvera koristi ga kako bi pronašli najbolji mogući put ili ponašanje koje bi trebalo poduzeti u određenom slučaju.
Odluka je neovisna u učenju s potkrepljenjem, pa se oznake daju sekvencama zavisnih izbora.
Tabela za usporedbu
Parametri usporedbe | Duboko učenje | Učenje ojačanja |
---|---|---|
Podrijetlo | U 1986 | Krajem 1980-ih |
Uvoditelj | Rina Dechter | Richard Bellman |
Također se zove | Duboko strukturirano učenje ili hijerarhijsko učenje | nijedan |
Postojanje podataka | Već postojeći skup podataka potreban za učenje | U telekomunikacijama, robotici, računalnim igrama, rasporedu dizala i AI u zdravstvu. |
Iskorištenje | U prepoznavanju govora i slike, zadatku smanjenja dimenzija i prethodnoj obuci za duboko umrežavanje. | U telekomunikacijama, robotici, računalnim igrama, rasporedu dizala i AI u zdravstvu. |
Što je duboko učenje?
Duboko učenje je vrsta AI i strojno učenje koje oponaša kako ljudi stječu određene vrste znanja. U znanost o podacima, duboko učenje vitalni je element koji se sastoji od prediktivnog modeliranja i statistike.
Znanstvenicima koji se bave podacima duboko je učenje vrlo korisno jer imaju zadatak tumačenja, prikupljanja i analize podataka.
Unosom podataka, pristranošću i težinama, umjetne neuronske mreže dubokog učenja ili neuronske mreže pokušavaju oponašati ljudsku mozak.
Algoritmi u tradicionalnom strojnom učenju su linearni, dok je duboko razumijevanje algoritama naslagano u hijerarhiji rastućih apstrakcija i složenost.
Duboko učenje pomoću računalnih programa prolazi otprilike kroz isti proces kao i učenje malog djeteta prepoznati a kako. U hijerarhiji svaki algoritam primjenjuje nelinearnu transformaciju na svoj ulaz.
Zatim koristi ono što nauči za stvaranje statističkog modela kao izlaza osim ako proizvodnja nije dosegla razinu prihvatljive točnosti dok se iteracije ne nastave.
Slojevi u dubokom učenju dopuštaju mu da bude heterogeno i uvelike odstupa od modela biološki informiranih konekcionista radi mogućnosti obuke, učinkovitosti i razumljivosti.
Što je učenje s potkrepljenjem?
Učenje s pojačanjem izvodi radnje kako bi se maksimizirale nagrade. Jednostavno, uči se radeći nešto da bi se postigle posljedice u najboljim vremenima.
Ovo je poput učenja stvari kao što su bicikl jahanje, u kojemu poznajemo po padu u početku.
S povratnim informacijama korisnika, što nije uspjelo, a što je radilo prekovremeno za fino podešavanje radnje i hvatanja za vožnju bicikla.
Baš poput ovih, računala koriste učenje potkrepljenja i pokušavaju određene radnje; kroz povratnu informaciju, oni uče i, konačno, pojačavaju uložene napore.
Na primjer, njegov se algoritam modificira i prerađuje autonomno tijekom mnogih ponavljanja osim ako se ne donesu odluke putem kojih se postižu najbolji rezultati.
Robot učenje hodanja jedna je od instanci algoritma, naime učenje s potkrepljenjem. Isprva, dovoljno velik robot pokušava napraviti korak naprijed i pada.
Ishod pada je podatkovna točka, veliki korak u odgovoru sustava na učenje s potkrepljenjem jer je pad ishod koji je djelovao kao negativna povratna informacija koja se koristi za prilagodbu sustava za pokušaj manjeg stupnja.
Konačno, robot se može kretati naprijed.
Glavne razlike između dubokog učenja i učenja s potkrepljenjem
- Što se tiče učenja algoritama, duboko učenje koristi trenutne informacije za relevantne obrasce. Naprotiv, učenje s potkrepljenjem utvrđuje predviđanja greškama i pokušajima.
- Primjena dubokog učenja više je usmjerena na prepoznavanje i zadatke sa smanjenjem površine. S druge strane, učenje s potkrepljenjem povezano je s interakcijom okoline s optimalnom kontrolom.
- Što se tiče primjera, Amazon sustav za prijevare s kreditnim karticama je instanca za dubinsko učenje u kojoj se neuronske mreže grade korištenjem podataka dobivenih od kupnje online kreditnim karticama. Nasuprot tome, hodajući robot je primjer učenja potkrepljenja u kojem su radnje definirane prema tome koliko visoko treba podići nogu.
- Duboko učenje manje je povezano s interakcijom. Za usporedbu, učenje s potkrepljenjem bliže je sposobnostima ljudskog mozga putem ove vrste povratne informacije inteligencija može se poboljšati.
- Tehnike učenja uključene u duboko učenje su analiza postojećih podataka i učenje primijenjeno na novi skup podataka. Nasuprot tome, tehnike učenja s potkrepljenjem uključuju učenje na pogreškama kao i maksimiziranje nagrada.
Reference
- https://books.google.com/books?hl=en&lr=&id=omivDQAAQBAJ&oi=fnd&pg=PR5&dq=deep+learning+&ots=MNQ_ipnCSR&sig=yeqmpT4zod7fgti0YqbcLj7nmik
- https://books.google.com/books?hl=en&lr=&id=uWV0DwAAQBAJ&oi=fnd&pg=PR7&dq=reinforcement+learning+&ots=mirEv1Z4o6&sig=zsp-E9V5ghtGvtAhaGwlCkbqJCM
Zadnje ažuriranje: 30. lipnja 2023
Sandeep Bhandari ima diplomu inženjera računala na Sveučilištu Thapar (2006.). Ima 20 godina iskustva u području tehnologije. Ima veliki interes za razna tehnička područja, uključujući sustave baza podataka, računalne mreže i programiranje. Više o njemu možete pročitati na njegovom bio stranica.
Smatram da je sadržaj posta previše površan i nedovoljno dubinski.
Članak koji potiče na razmišljanje i koji učinkovito naglašava razlike između dubokog učenja i učenja s potkrepljenjem.
Autor daje detaljnu analizu dubinskog učenja i učenja s pojačanjem, što ga čini vrijednim štivom za one koje zanima AI i strojno učenje.
Članak dobro objašnjava razlike između dubinskog učenja i učenja s potkrepljenjem na jasan i koncizan način.
Mislio sam da je previše jednostavno. Pročitao sam bolje analize ove teme drugdje.
Uopće se ne slažem s vašim stavom. Članak briljantno predstavlja sažetak razlikovnih karakteristika dubokog učenja i učenja s potkrepljenjem.
Informativno i pronicljivo, pruža temeljitu usporedbu između dubokog učenja i učenja s potkrepljenjem.
Izvrstan pregled usporedbe dubinskog učenja i učenja s potkrepljenjem. Članak se bavi ključnim konceptima oba, pružajući jasnoću i uvid.