Daļēji uzraudzīta un pastiprinoša apmācība: atšķirība un salīdzinājums

Mūsdienās visā pasaulē iegūto datu apjoms ir milzīgs. Šo informāciju rada ne tikai cilvēki, bet arī viedtālruņi, datori un citas elektroniskas ierīces.

Programmētājs neapšaubāmi izvēlētos, kā apmācīt algoritmu, kas izmanto konkrētu mācību modeli, pamatojoties uz pieejamo datu veidu un piedāvāto stimulu.

Atslēgas

Daļēji uzraudzīta mācīšanās ir mašīnmācīšanās veids, kurā modelis tiek apmācīts, izmantojot marķētus un nemarķētus datus. Turpretim pastiprināšanas mācīšanās ir mašīnmācīšanās veids, kurā modelis mācās pieņemt lēmumus, pamatojoties uz atlīdzību un sodiem.

Daļēji uzraudzīta mācīšanās ir vairāk piemērota uzdevumiem, kur marķētie dati ir maz vai dārgi, savukārt pastiprināšanas mācības ir vairāk piemērotas uzdevumiem, kuru optimālais risinājums nav zināms iepriekš.

Daļēji uzraudzīta mācīšanās tiek izmantota dabiskās valodas apstrādē un attēlu klasifikācijā, savukārt pastiprināšanas mācības tiek izmantotas robotikā un spēļu spēlēšanā.

Daļēji uzraudzīta un pastiprinoša apmācība

Daļēji uzraudzīta mācīšanās ir a mašīna mācīšanās metodi. Šajā metodē iezīmētie un nemarķētie dati tiek apvienoti kopā. Šajā kombinācijā marķēto datu apjoms ir mazs, bet nemarķēto datu apjoms ir liels. Pastiprināšanas mācīšanās ir mācīšanās algoritms, kura pamatā ir atlīdzības sistēma. Pastiprināšana var būt pozitīva vai negatīva.

Daļēji uzraudzīta vs pastiprināšanas apmācība

Daļēji uzraudzītā mācīšanās atrodas kaut kur starp uzraudzīto un Nepārraudzīta mācīšanās algoritmi. Tas izmanto marķētu un nemarķētu datu kopu kombināciju.

Tas darbojas ar datiem, kuriem ir tikai dažas etiķetes; tas darbojas ar nemarķētiem datiem. Etiķetes ir dārgas, taču korporatīvajiem nolūkiem var pietikt ar dažām etiķetēm.

Mācību pastiprināšana ir tikai mašīnmācīšanās pieeja, kas atalgo pozitīvu uzvedību, vienlaikus sodot par sliktu uzvedību.

Kopumā pastiprinošais mācību aģents spēj uztvert un interpretēt savu vidi, rīkoties un mācīties, izmantojot izmēģinājumus un kļūdas.

Pastiprināšanas mācību izstrādātāji piedāvā veidu, kā atalgot vēlamo uzvedību un sodīt par negatīvu uzvedību.

Salīdzināšanas tabula

Salīdzināšanas parametri	Daļēji uzraudzīta apmācība	Pastiprināšanas mācības
Definīcija	Izmanto nelielu daudzumu marķētu datu, kas pastiprina lielāku nemarķētu datu kopu	Algoritms ar atlīdzības sistēmu
Mērķis	Lai novērstu uzraudzītas un bez uzraudzības mācīšanās trūkumus.	Lai apgūtu darbību sēriju
Aģenta mijiedarbība	Nesadarbojas	Mijiedarbojas
Praktisks pielietojums	Runas analīze, interneta satura klasifikācija	Trajektorijas optimizācija, kustību plānošana
Etiķetes	Tam ir etiķetes.	Tam nav etiķešu.

Kas ir daļēji uzraudzīta mācīšanās?

Daļēji uzraudzīta mācīšanās ir mašīnmācīšanās metode, kurā apmācības laikā neliels daudzums marķētu datu tiek apvienots ar neiezīmētu datu kopu.

Arī lasīt: Nedefinēts pret nulles slīpumu: atšķirība un salīdzinājums

Tas ir mācīšanās veids, kas pastāv starp nekontrolētu mācīšanos un uzraudzītu mācīšanos. Tas ir ārkārtējs sliktas uzraudzības gadījums.

Mašīnmācīšanās inženierim vai datu zinātniekam datu kopa vēlreiz manuāli jāanotē, kas ir vissvarīgākais jebkuras uzraudzītās mācīšanās tehnikas trūkums.

Šī ir ļoti dārga darbība, īpaši, ja tiek apstrādāts liels datu apjoms. Jebkuras neuzraudzītas mācīšanās metodes būtiskākais trūkums ir tās šaurā pielietojamības joma.

Teksta dokumentu klasifikators ir bieži izmantota daļēji uzraudzīta apmācība. Tā kā šādos apstākļos būtu praktiski neiespējami atrast lielu skaitu marķētu teksta dokumentu, daļēji uzraudzīta mācīšanās ir ideāla.

Tas ir vienkārši tāpēc, ka kādam nav jālasa pilna teksta dokumenti, lai tikai piešķirtu vienkāršu klasifikāciju.

Būtiskākais jebkuras uzraudzītās mācīšanās tehnikas trūkums ir tas, ka mašīnmācībajiem datu kopa ir manuāli jāmarķē.

Šī ir ārkārtīgi dārga darbība, īpaši strādājot ar lielu datu apjomu. Gandrīz jebkuras neuzraudzītas mācīšanās galvenais trūkums ir tās šaurais pielietojuma diapazons.

Cilvēku atbildes uz formāliem daļēji uzraudzītiem mācību uzdevumiem ir devušas dažādus rezultātus attiecībā uz nemarķēta materiāla ietekmes pakāpi.

Daļēji uzraudzītu mācīšanos var izmantot arī dabiskākiem mācīšanās jautājumiem. Ievērojama daļa cilvēku ideju apguves apvieno ierobežotu daļu tiešas mācīšanas kopā ar milzīgu daudzumu neapzīmētas pieredzes.

Šāda veida mācību problēmas ir grūti atrisināt. Rezultātā ir nepieciešami daļēji uzraudzīti mācību algoritmi ar īpašām funkcijām.

Kas ir pastiprināšanas mācības?

Lai gan pastiprināšanas mācības ir izraisījušas daudzu zinātkāri mākslīgā intelekta jomā, tās plaši izplatītā, reālā pasaulē pieņemtā un izmantošana joprojām ir ierobežota. Neskatoties uz to, ir daudz pētījumu par teorētiskajiem lietojumiem, un ir bijuši daži veiksmīgi lietošanas gadījumi.

Lai iegūtu ideālu risinājumu, aģents ir ieprogrammēts meklēt ilgtermiņa un vislielāko kopējo atdevi.

Šie ilgtermiņa mērķi neļauj aģentam apstāties uz īsāka termiņa mērķiem. Aģents pamazām iemācās izvairīties no negatīvā un meklēt pozitīvo. Šī mācīšanās stratēģija ir izmantota mākslīgajā intelektā, lai vadītu neuzraudzītu mašīnmācīšanos, izmantojot atlīdzību un sodus.

Arī lasīt: Aktīvā mācīšanās vs pasīvā mācīšanās: atšķirība un salīdzinājums

Secīga lēmumu pieņemšana ir būtiska, lai stiprinātu mācīšanos. Vārdu sakot, izvadi nosaka pašreizējās ievades stāvoklis, un nākamo ievadi nosaka iepriekšējās ievades izeja.

Tā kā spriedumi pastiprināšanas mācībās joprojām ir atkarīgi, mēs nosaucam atkarīgās lēmumu secības.

Ir divu veidu pastiprinājumi, proti, pozitīvs un negatīvs pastiprinājums. Pozitīvs pastiprinājums notiek, ja notikums, kas notiek noteiktas uzvedības rezultātā, uzlabo uzvedības spēku un biežumu. Citiem vārdiem sakot, tas pozitīvi ietekmē uzvedību. Negatīvs pastiprinājums ir definēts kā uzvedības pastiprināšanās negatīva apstākļa izbeigšanas vai izvairīšanās rezultātā.

Pastiprināšanas mācībās mākslīgais intelekts tiek ievietots spēlei līdzīgā vidē. Dators izmanto izmēģinājumus un kļūdas, lai atrastu problēmas risinājumu. Lai pārliecinātu datoru darīt to, ko vēlas programmētājs, mākslīgais intelekts tiek atalgots vai sodīts par tā darbībām. Tās mērķis ir maksimāli palielināt visu atdevi.

Galvenās atšķirības starp daļēji uzraudzītu un pastiprinošu mācīšanos

Daļēji uzraudzītā mācībā tiek izmantoti marķēti dati, lai nostiprinātu nemarķētus datus, turpretim pastiprinošā apmācībā jūs izveidojat atlīdzības sistēmu par algoritmu.
Daļēji uzraudzītās mācīšanās galvenais mērķis ir novērst visus citu mācību procesu trūkumus, un pastiprināšanas mācīšanās galvenais mērķis ir efektīvāk apgūt darbības.
Daļēji uzraudzīta mācīšanās nesadarbojas ar aģentu. Pastiprināšanas mācīšanās mijiedarbojas ar aģentu.
Pastiprināšanas tehnikā aģenta veiktās darbības ietekmē stāvokļu sadalījumu, ko tas ievēros nākotnē. Standarta (daļēji) uzraudzītās mācīšanās problēmas gadījumā tas tā nav.
Pastiprināšanas mācībās nav etiķešu, savukārt daļēji uzraudzītās mācībās ir.

Atšķirība starp daļēji uzraudzītu un pastiprinošu mācīšanos

Atsauces

https://arxiv.org/abs/1612.00429

Pēdējo reizi atjaunināts: 25. gada 2023. novembrī

Viens pieprasījums?

Esmu pielicis tik daudz pūļu, rakstot šo emuāra ierakstu, lai sniegtu jums vērtību. Tas man ļoti noderēs, ja apsverat iespēju to kopīgot sociālajos medijos vai ar draugiem/ģimeni. DALĪŠANĀS IR ♥️

Facebook Tweet tapa LinkedIn drukāt E-pasts

Emma Smita

Emma Smita ir ieguvusi maģistra grādu angļu valodā no Irvine Valley College. Kopš 2002. gada viņa ir žurnāliste, rakstot rakstus par angļu valodu, sportu un tiesībām. Lasiet vairāk par mani par viņu bio lapa.