types machine learning
Denna handledning förklarar typerna av maskininlärning, dvs övervakad, utan tillsyn, förstärkning och halvövervakad inlärning med enkla exempel. Du kommer också att lära dig skillnader mellan övervakad och icke-övervakad inlärning:
I Föregående handledning , vi har lärt oss om maskininlärning, dess arbete och applikationer. Vi har också sett en jämförelse av maskininlärning mot artificiell intelligens.
Maskininlärning är ett vetenskapligt fält som behandlar datorprogram som lär sig genom erfarenhet och förutsäger utdata.
Huvuddragen i ML är att lära av erfarenhet. Lärandet sker när systemet matas med träningsingångsdata gör ändringar i sina parametrar och justerar sig för att ge önskad effekt. Resultatet är det målvärde som definieras i träningsdata.
=> Läs igenom hela serien för maskininlärning
Vad du kommer att lära dig:
- Typer av maskininlärning
- Verkligt exempel på övervakat och övervakat lärande
- Skillnaden mellan övervakad vs övervakad inlärning
- Semiövervakat lärande
- Slutsats
Typer av maskininlärning
Program för maskininlärning klassificeras i tre typer enligt nedan.
- Övervakad
- Oövervakad
- Förstärkning lärande
Låt oss förstå var och en av dessa i detalj !!
# 1) Övervakat lärande
Övervakat lärande sker i närvaro av en handledare precis som lärande som utförs av ett litet barn med hjälp av sin lärare. När ett barn utbildas för att känna igen frukter, färger, siffror under överinseende av en lärare övervakas denna metod för lärande.
I den här metoden kontrolleras varje steg i barnet av läraren och barnet lär sig av den produktion som det måste producera.
Hur fungerar övervakat lärande?
I den övervakade ML-algoritmen är utdata redan kända. Det finns en kartläggning av ingången med utgången. Följaktligen, för att skapa en modell, matas maskinen med massor av träningsingångsdata (med inmatning och motsvarande utdata kända).
Utbildningsdata hjälper till att uppnå en noggrannhet för den skapade datamodellen. Den inbyggda modellen är nu redo att matas med ny ingångsdata och förutsäga resultaten.
Vad är en märkt datamängd?
Datauppsättningen med utgångar som är kända för en given ingång kallas en märkt datauppsättning. Till exempel, en bild av frukt tillsammans med fruktnamnet är känd. Så när en ny bild av frukt visas jämför den med träningssatsen för att förutsäga svaret.
Övervakat lärande är en snabbinlärningsmekanism med hög noggrannhet. De övervakade inlärningsproblemen inkluderar regression och klassificeringsproblem.
Några av de övervakade inlärningsalgoritmerna är:
- Beslutsträd,
- K-närmaste granne,
- Linjär regression,
- Support Vector Machine och
- Neurala nätverk.
Exempel på övervakat lärande
- I det första steget matas en träningsdatauppsättning till maskininlärningsalgoritmen.
- Med utbildningsdataset justerar maskinen sig själv genom att ändra parametrarna för att bygga en logisk modell.
- Den inbyggda modellen används sedan för en ny uppsättning data för att förutsäga resultatet.
Typer av övervakade inlärningsalgoritmer
- Klassificering: I dessa typer av problem förutsäger vi svaret som specifika klasser, till exempel ”ja” eller ”nej”. När bara två klasser är närvarande kallas det en binär klassificering. För mer än två klassvärden kallas det en Multi-class Classification. De förutsagda svarsvärdena är diskreta värden. Till exempel, Är det bilden av solen eller månen? Klassificeringsalgoritmen separerar data i klasser.
- Regression: Regressionsproblem förutsäger svaret som kontinuerliga värden som att förutsäga ett värde som sträcker sig från-oändlighet till oändlighet. Det kan ta många värden. Till exempel, den linjära regressionsalgoritmen som tillämpas förutspår husets kostnad baserat på många parametrar som läge, närliggande flygplats, husets storlek etc.
# 2) Oövervakat lärande
Oövervakat lärande sker utan hjälp av en handledare precis som en fisk lär sig att simma av sig själv. Det är en oberoende inlärningsprocess.
Eftersom det inte finns någon utdata mappad med ingången i den här modellen är målvärdena okända / omärkta. Systemet måste lära sig själv från datainmatningen till det och upptäcka dolda mönster.
Vad är omärkt datauppsättning?
En dataset med okända utdatavärden för alla inmatningsvärden kallas en omärkt dataset.
Hur fungerar övervakat lärande?
Eftersom det inte finns några kända utgångsvärden som kan användas för att bygga en logisk modell mellan ingång och utgång, används vissa tekniker för att bryta dataregler, mönster och datagrupper med liknande typer. Dessa grupper hjälper slutanvändarna att förstå data bättre samt hitta en meningsfull utdata.
Matade ingångar är inte i form av en korrekt struktur precis som träningsdata är (i övervakat lärande). Det kan innehålla outliers, bullriga data etc. Dessa ingångar matas tillsammans till systemet. Under utbildningen av modellen är ingångarna organiserade för att bilda kluster.
Oövervakade inlärningsalgoritmer inkluderar kluster- och associeringsalgoritmer som:
- Apriori,
- K-betyder kluster och andra associeringsregelbrytningsalgoritmer.
När ny data matas till modellen kommer den att förutsäga resultatet som en klassetikett som ingången tillhör. Om klassetiketten inte finns genereras en ny klass.
Medan man genomgår processen att upptäcka mönster i datan, justerar modellen sina parametrar i sig, därför kallas den också självorganiserande. Klusterna kommer att bildas genom att ta reda på likheterna mellan ingångarna.
Till exempel, när man köper produkter online, om smör läggs i vagnen, föreslår det att man köper bröd, ost etc. Den utan tillsynen modellen tittar på datapunkterna och förutsäger de andra attributen som är associerade med produkten.
Exempel på icke-övervakat lärande
Typer av övervakade algoritmer
- Klusteralgoritm : Metoderna för att hitta likheterna mellan dataobjekt som samma form, storlek, färg, pris etc. och gruppera dem för att bilda ett kluster är klusteranalys.
- Avvikande upptäckt : I den här metoden är datasetet sökandet efter alla slags olikheter och avvikelser i data. Till exempel, en högvärdig transaktion på kreditkort detekteras av systemet för upptäckt av bedrägerier.
- Association Rule Mining : I denna typ av gruvdrift får den reda på de vanligaste artiklarna eller föreningarna mellan element. Föreningar som ”produkter som ofta köps tillsammans”, etc.
- Autokodare: Ingången komprimeras till en kodad form och återskapas för att ta bort bullriga data. Denna teknik används för att förbättra bild- och videokvaliteten.
# 3) Inlärning av förstärkning
I denna typ av lärande lär sig algoritmen genom återkopplingsmekanism och tidigare erfarenheter. Det är alltid önskvärt att varje steg i algoritmen tas för att nå ett mål.
Så när nästa steg ska tas, får det feedback från föregående steg, tillsammans med lärandet från upplevelsen för att förutsäga vad som kan vara nästa bästa steg. Denna process kallas också en försök och felprocess för att nå målet.
Förstärkningslärande är en långsiktig iterativ process. Ju fler återkopplingar, desto mer exakt blir systemet. Grundläggande förstärkning lärande kallas också Markov Decision Process.
Exempel på förstärkningslärande
Exempel på förstärkningslärande är videospel där spelarna slutför vissa nivåer i ett spel och tjänar belöningspoäng. Spelet ger feedback till spelaren genom bonusrörelser för att förbättra hans / hennes prestanda.
Förstärkningslärande används vid utbildning av robotar, självdrivna bilar, automatisk hantering av lager etc.
Några populära algoritmer för förstärkning lärande inkluderar:
- Q-lärande,
- Djupa kontroversiella nätverk
- Temporal skillnad
Figuren nedan beskriver återkopplingsmekanismen för förstärkningslärande.
- Ingången observeras av agenten som är AI-elementet.
- Denna AI-agent agerar på miljön enligt beslutet.
- Miljöns svar skickas till AI i form av en belöning tillbaka som feedback.
- Tillstånd och åtgärder som utförs på miljön sparas också.
(bild källa )
Verkligt exempel på övervakat och övervakat lärande
För övervakat lärande:
# 1) Låt oss ta ett exempel på en korg med grönsaker med lök, morot, rädisa, tomat, etc., så kan vi ordna dem i form av grupper.
#två) Vi skapar en träningstabell för att förstå Supervised Learning.
Träningsdatatabellen karakteriserar grönsakerna baserat på:
- Form
- Färg
- Storlek
Form | Färg | Storlek | Vegetabiliska |
---|---|---|---|
Det är mer exakt än inlärning utan tillsyn eftersom indata och motsvarande utdata är välkända, och maskinen behöver bara ge förutsägelser. | Det har mindre noggrannhet eftersom indata är omärkta. Således måste maskinen först förstå och märka data och sedan ge förutsägelser. | ||
Runda | Brun | Stor | Lök |
Runda | Netto | Medium | Tomat |
Cylindrisk | Vit | Stor | Rädisa |
Cylindrisk | Netto | Medium | Morot |
När denna träningsdatatabell matas till maskinen kommer den att bygga en logisk modell som använder formen, färgen, storleken på grönsaken etc. för att förutsäga resultatet (grönsaken).
När en ny ingång matas till denna modell analyserar algoritmen parametrarna och matar ut namnet på frukten.
För icke-övervakat lärande:
Vid inlärning utan tillsyn skapar den grupper eller kluster baserat på attribut. I ovanstående exempeluppsättning är parametern för grönsaker:
# 1) Form
Grönsakerna är grupperade baserat på form.
- Runda: Lök och tomat.
- Cylindrisk: Rädisa och morot.
Ta en annan parameter som storlek.
# 2) Storlek
Grönsakerna grupperas baserat på storlek och form:
- Medium storlek och rund form: Tomat
- Stor storlek och rund form: Lök
I icke-övervakat lärande har vi ingen träningsdataset och resultatvariabel när vi är under övervakat lärande, träningsdata är kända och används för att träna algoritmen.
Skillnaden mellan övervakad vs övervakad inlärning
Övervakad | Oövervakad |
---|---|
I övervakade inlärningsalgoritmer är utgången för den angivna ingången känd. | I oövervakade inlärningsalgoritmer är utdata för den angivna ingången okänd. |
Algoritmerna lär sig av märkt uppsättning data. Dessa data hjälper till att utvärdera noggrannheten i träningsdata. | Algoritmen är försedd med omärkt data där den försöker hitta mönster och associering mellan dataobjekten. |
Det är en prediktiv modelleringsteknik som förutsäger framtida resultat exakt. | Det är en beskrivande modelleringsteknik som förklarar det verkliga sambandet mellan elementen och elementens historia. |
Det inkluderar klassificerings- och regressionsalgoritmer. | Det inkluderar kluster och inlärningsalgoritmer för föreningsregler. |
Några algoritmer för övervakat lärande är Linear Regression, Naïve Bayes och Neural Networks. | Vissa algoritmer för icke-övervakat lärande är k- betyder kluster, Apriori, etc. |
Denna typ av inlärning är relativt komplex eftersom den kräver märkta data. | Det är mindre komplicerat eftersom det inte finns något behov av att förstå och märka data. |
Det är en onlineprocess för dataanalys och kräver inte mänsklig interaktion. | Detta är en realtidsanalys av data. |
Semiövervakat lärande
Den semi-övervakade inlärningsmetoden tar både märkt och omärkt inmatning av träningsdata. Denna typ av inlärning är användbar när det är svårt att extrahera användbara funktioner från omärkt data (övervakad metod) och dataexperter har svårt att märka ingångsdata (utan tillsyn).
Endast en liten mängd märkta data i dessa algoritmer kan leda till noggrannhet i modellen.
Exempel av halvövervakat lärande inkluderar CT-skanningar och MR-undersökningar där en medicinsk expert kan märka några punkter i genomsökningarna för någon sjukdom medan det är svårt att märka alla skanningar.
Slutsats
Maskininlärningsuppgifterna klassificeras i stort sett i övervakade, oövervakade, halvövervakade och förstärkande inlärningsuppgifter.
Övervakat lärande är lärande med hjälp av märkta data. ML-algoritmerna matas med ett träningsdataset för vilket varje ingångsdata är känd för att förutsäga framtida resultat.
Denna modell är mycket exakt och snabb, men den kräver hög kompetens och tid att bygga. Dessa modeller kräver också ombyggnad om data ändras. ML-uppgifter som regression och klassificering utförs under en övervakad inlärningsmiljö.
.net intervju frågor och svar
Oövervakat lärande sker utan hjälp av en handledare. Ingångsdata som matas till ML-algoritmerna är omärkta, dvs. för varje ingång är ingen utgång känd. Algoritmen i sig får reda på trenderna och mönstret i indata och skapar en koppling mellan ingångens olika attribut.
Denna typ av inlärning är användbar för att hitta mönster i data, skapa kluster av data och analys i realtid. Uppgifter som Clustering, KNN-algoritmer, etc., omfattas av inlärning utan tillsyn.
Semiövervakade inlärningsuppgifter fördelen med både övervakade och oövervakade algoritmer genom att förutsäga resultaten med både märkta och omärkta data. Förstärkningslärande är en typ av återkopplingsmekanism där maskinen lär sig av konstant återkoppling från miljön för att uppnå sitt mål.
I denna typ av inlärning utför AI-agenterna några åtgärder på data och miljön ger en belöning. Förstärkningsinlärning används av multiplayer-spel för barn, självkörande bilar etc.
Håll dig uppdaterad om vår kommande handledning för att lära dig mer om maskininlärning och artificiellt neuralt nätverk!
=> Besök här för den exklusiva maskininlärningsserien
Rekommenderad läsning
- Data Mining Vs Machine Learning Vs Artificial Intelligence Vs Deep Learning
- 11 mest populära maskininlärningsverktyg 2021
- Maskininlärningshandledning: Introduktion till ML och dess tillämpningar
- Python-datatyper
- C ++ datatyper
- Typer av risker i programvaruprojekt
- Typer av migreringstest: Med testscenarier för varje typ
- De 15 bästa systemen för lärande (årets LMS 2021)