Semi-Supervised vs Reinforcement Learning: Forskel og sammenligning

De data, der produceres over hele kloden i dag, er enorme. Denne information er ikke kun skabt af mennesker, men også af smartphones, computere og andre elektroniske enheder.

En programmør ville utvivlsomt vælge, hvordan man træner en algoritme, der bruger en specifik læringsmodel baseret på den type tilgængelige data og det tilbudte incitament.

Nøgleforsøg

Semi-supervised learning er en type maskinlæring, hvor en model trænes på mærkede og umærkede data. I modsætning hertil er forstærkningslæring en type maskinlæring, hvor en model lærer at træffe beslutninger baseret på belønninger og straffe.

Semi-superviseret læring er mere velegnet til opgaver, hvor mærkede data er knappe eller dyre, mens forstærkende læring er mere velegnet til opgaver, hvor den optimale løsning ikke er kendt på forhånd.

Semi-superviseret læring bruges i naturlig sprogbehandling og billedklassificering, mens forstærkningslæring bruges i robotteknologi og spil.

Semi-Supervised vs Reinforcement Learning

Semi-superviseret læring er en machine learning metode. I denne metode kombineres mærkede og umærkede data sammen. I denne kombination er mængden af mærkede data lille, og mængden af umærkede data er stor. Forstærkning læring er en læringsalgoritme baseret på et belønningssystem. Forstærkning kan være positiv eller negativ.

Semi-superviseret læring sidder et sted mellem Superviseret og Uovervåget læring algoritmer. Den anvender en blanding af mærkede og umærkede datasæt.

Det fungerer med data, der kun har nogle få etiketter; det fungerer med umærkede data. Etiketter er dyre, men til virksomhedsformål kan nogle få etiketter være tilstrækkelige.

Forstærkningslæring er blot en maskinlæringstilgang, der belønner positiv adfærd, mens den straffer dårlig adfærd.

Generelt er en forstærkningslæringsagent i stand til at sanse og fortolke sit miljø, handle og lære via forsøg og fejl.

Udviklere af forstærkende læring foreslår en måde at belønne ønsket adfærd og straffe negativ adfærd.

Sammenligningstabel

Parametre for sammenligning	Semi-superviseret læring	Forstærkningslæring
Definition	Bruger en lille mængde mærkede data, der understøtter et større sæt umærkede data	En algoritme med et belønningssystem
Sigt	At imødegå ulemperne ved superviseret og uovervåget læring.	At lære en række handlinger
Agentens interaktion	Interagerer ikke	Interagerer
Praktisk ansøgning	Taleanalyse, internetindholdsklassificering	Baneoptimering, bevægelsesplanlægning
Etiketter	Den har etiketter.	Den har ingen etiketter.

Hvad er semi-superviseret læring?

Semi-overvåget læring er en metode til maskinlæring, hvor en lille mængde mærkede data kombineres med et sæt umærkede under træning.

Læs også: GED vs High School Diploma: Forskel og sammenligning

Det er en form for læring, der eksisterer mellem uovervåget læring og overvåget læring. Det er et ekstremt tilfælde af dårligt tilsyn.

Datasættet skal igen annoteres manuelt af en maskinlæringsingeniør eller en dataforsker, hvilket er den vigtigste ulempe ved enhver overvåget læringsteknik.

Dette er en meget bekostelig operation, især når der er tale om store mængder data. Den mest grundlæggende ulempe ved enhver uovervåget læringsmetode er dens snævre anvendelsesområde.

En tekstdokumentklassificering er en hyppig anvendelse af semi-overvåget læring. Fordi det ville være praktisk talt umuligt at finde et stort antal mærkede tekstdokumenter i denne situation, er semi-superviseret læring ideel.

Dette skyldes simpelthen ineffektiviteten i at få nogen til at læse fuldtekstdokumenter blot for at tildele en simpel klassifikation.

Den mest grundlæggende ulempe ved enhver Supervised Learning-teknik er, at datasættet skal mærkes manuelt af maskinlærere.

Dette er en ekstremt dyr operation, især når man arbejder med store mængder data. Den mest grundlæggende ulempe ved næsten enhver uovervåget læring har været dens smalle anvendelsesområde.

Menneskelige svar på formelle semi-superviserede læringsopgaver har givet en række resultater med hensyn til graden af effekt af umærket materiale.

Semi-superviseret læring kan også bruges til mere naturlige læringsproblemer. En væsentlig del af menneskelig idéerhvervelse kombinerer en begrænset smule direkte undervisning parret med en enorm mængde umærket erfaring.

Læringsproblemer af denne art er svære at løse. Som følge heraf kræves semi-overvågede læringsalgoritmer med særlige funktioner.

Hvad er forstærkende læring?

Mens forstærkende læring har vakt nysgerrighed hos mange inden for kunstig intelligens, er dens udbredte accept og anvendelse i den virkelige verden stadig begrænset. På trods af dette florerer forskningsartikler om teoretiske anvendelser, og der har været nogle vellykkede use cases.

For at opnå en ideel løsning er agenten programmeret til at søge langsigtet og størst samlet afkast.

Disse langsigtede mål forhindrer agenten i at gå i stå med kortsigtede mål. Agenten lærer gradvist at undgå det negative og søge det positive. Denne læringsstrategi er blevet brugt i kunstig intelligens til at dirigere uovervåget maskinlæring ved hjælp af belønninger og straf.

Læs også: Aestivation vs Hibernation: Forskel og sammenligning

Det er vigtigt at træffe beslutninger i rækkefølge for at styrke læringen. Med grundlæggende ord bestemmes output af det aktuelle inputs tilstand, og det næste input bestemmes af det forrige inputs output.

Da vurderinger i forstærkningslæring forbliver afhængige, navngiver vi afhængige beslutningssekvenser.

Der er to slags forstærkning, nemlig positiv og negativ forstærkning. Positiv forstærkning sker, når en begivenhed, der opstår som følge af en bestemt adfærd, forbedrer styrken og hyppigheden af adfærden. Det påvirker med andre ord adfærd positivt. Negativ forstærkning defineres som adfærdsstyrkende som følge af, at en negativ omstændighed afsluttes eller undgås.

Kunstig intelligens sættes i et spillignende miljø i forstærkningslæring. Computeren bruger trial and error til at finde en løsning på problemet. For at overtale computeren til at gøre, hvad programmøren ønsker, bliver den kunstige intelligens belønnet eller straffet for de handlinger, den udfører. Dens mål er at maksimere hele afkastet.

Vigtigste forskelle mellem semi-overvåget og forstærkende læring

Semi-superviseret læring bruger mærkede data til at understøtte umærkede data, hvorimod du i forstærkningslæring opsætter et belønningssystem for en algoritme.
Hovedformålet med semi-superviseret læring er at modvirke alle ulemperne ved andre læreprocesser, og hovedformålet med forstærkende læring er at lære handlinger mere effektivt.
Semi-superviseret læring interagerer ikke med agenten. Forstærkningslæring interagerer med agenten.
I forstærkningsteknikken blev handlingerne truffet af agenten og påvirkede fordelingen af tilstande, den vil observere i fremtiden. Dette er ikke tilfældet i standard (semi-)overvåget læringsproblem.
Der er ingen etiketter i forstærkende læring, mens der er i semi-superviseret læring.

Forskellen mellem semi-overvåget og forstærkende læring

Referencer

https://arxiv.org/abs/1612.00429

Sidst opdateret: 25. november 2023

En anmodning?

Jeg har brugt så meget på at skrive dette blogindlæg for at give dig værdi. Det vil være meget nyttigt for mig, hvis du overvejer at dele det på sociale medier eller med dine venner/familie. DELING ER ♥️

Facebook Tweet Pin (Binding)LinkedIn Print E-mail

Emma Smith

Emma Smith har en MA-grad i engelsk fra Irvine Valley College. Hun har været journalist siden 2002 og har skrevet artikler om engelsk, sport og jura. Læs mere om mig på hende bio side.