weka tutorial how download
Denna WEKA-handledning förklarar vad som är Weka Machine Learning-verktyg, dess funktioner och hur man laddar ner, installerar och använder Weka Machine Learning Software:
I Föregående handledning , vi lärde oss om Support Vector Machine i ML och tillhörande koncept som Hyperplane, Support Vectors & Applications of SVM.
Machine Learning är ett vetenskapligt fält där maskiner fungerar som ett konstgjort intelligent system. Maskinerna kan lära sig själva utan att kräva någon uttrycklig kodning. Det är en iterativ process som får åtkomst till data, lär sig av sig själv och förutsäger resultatet. För att utföra maskininlärningsuppgifter krävs många verktyg och skript.
WEKA är en maskininlärningsplattform som består av många verktyg som underlättar många maskininlärningsaktiviteter.
=> Läs igenom hela serien för maskininlärning
microsoft dynamics ax 2012 tutorial för nybörjare
Vad du kommer att lära dig:
- Vad är WEKA
- Slutsats
Vad är WEKA
Weka är ett open source-verktyg som är designat och utvecklat av forskarna / forskarna vid University of Waikato, Nya Zeeland. WEKA står för Waikato Environment for Knowledge Analysis. Den är utvecklad av det internationella vetenskapssamhället och distribueras under gratis GNU GPL-licens.
WEKA är fullt utvecklat i Java. Det ger integration med SQL-databasen med Java-databasanslutning. Det ger många maskininlärningsalgoritmer för att implementera data mining-uppgifter. Dessa algoritmer kan antingen användas direkt med hjälp av WEKA-verktyget eller kan användas med andra applikationer som använder Java-programmeringsspråk.
Det ger många verktyg för förbehandling av data, klassificering, klustring, regressionsanalys, skapande av associeringsregler, extraktion av funktioner och visualisering av data. Det är ett kraftfullt verktyg som stöder utvecklingen av nya algoritmer inom maskininlärning.
Varför använda WEKA Machine Learning Tool
Med WEKA är maskininlärningsalgoritmerna lätt tillgängliga för användarna. ML-specialisterna kan använda dessa metoder för att extrahera användbar information från stora datamängder. Här kan specialisterna skapa en miljö för att utveckla nya maskininlärningsmetoder och implementera dem på verkliga data.
WEKA används av maskininlärning och forskare inom tillämpad vetenskap för lärande. Det är ett effektivt verktyg för att utföra många uppgifter mining.
WEKA nedladdning och installation
# 1) Ladda ner programvaran från här .
Kontrollera datorsystemets konfiguration och ladda ner den stabila versionen av WEKA (för närvarande 3.8) från den här sidan.
#två) Efter lyckad nedladdning, öppna filplatsen och dubbelklicka på den nedladdade filen. Step Up-guiden visas. Klicka på Nästa.
# 3) Licensavtalets villkor öppnas. Läs det noggrant och klicka på “Jag håller med”.
# 4) Välj de komponenter som ska installeras enligt dina krav. Fullständig installation av komponenter rekommenderas. Klicka på Nästa.
# 5) Välj målmapp och klicka på Nästa.
# 6) Sedan startar installationen.
# 7) Om Java inte är installerat i systemet installeras Java först.
# 8) När installationen är klar visas följande fönster. Klicka på Nästa.
# 9) Markera kryssrutan Starta Weka. Klicka på Slutför.
# 10) Fönstret WEKA Tool och Explorer öppnas.
#elva) WEKA-handboken kan laddas ner från här.
Grafiskt användargränssnitt för WEKA
GUI för WEKA ger fem alternativ: Explorer, Experimenter, Knowledge flow, Workbench och Simple CLI. Låt oss förstå var och en av dessa individuellt.
# 1) Enkel CLI
Enkel CLI är Weka Shell med kommandorad och utdata. Med hjälp kan du se översikten över alla kommandon. Enkel CLI ger tillgång till alla klasser som klassificerare, kluster och filter etc.
Några av de enkla CLI-kommandona är:
- Ha sönder: För att stoppa den aktuella tråden
- Utgång: Avsluta CLI
- Hjälp() : Matar ut hjälp för det angivna kommandot
- -java weka.classifiers.trees.J48 -t c: /temp/iris.arff: För att åberopa en WEKA-klass, prefixa den med Java. Detta kommando leder WEKA att ladda klassen och köra den med givna parametrar. I det här kommandot anropas J48-klassificeraren i IRIS-datasetet.
# 2) Utforskare
WEKA Explorer-fönstren visar olika flikar som börjar med förbehandling. Initialt är förbehandlingsfliken aktiv, eftersom datauppsättningen förbehandlas först innan algoritmer tillämpas på den och undersöktes datamängden.
Flikarna är som följer:
- Förprocess: Välj och modifiera laddad data.
- Klassificera: Tillämpa tränings- och testalgoritmer på data som klassificerar och regresserar data.
- Klunga: Forma kluster från data.
- Associera: Mina ut associeringsregel för data.
- Välj attribut: Åtgärder för att välja attribut tillämpas.
- Visualisera: 2D-representation av data ses.
- Statusfältet: Den nedre delen av fönstret visar statusfältet. Detta avsnitt visar vad som händer just nu i form av ett meddelande, till exempel en fil laddas. Högerklicka på det här, Minne information kan ses, och också Springa sopor samlare för att frigöra utrymme kan köras.
- Loggknapp: Den lagrar en logg över alla åtgärder i Weka med tidsstämpeln. Loggar visas i ett separat fönster när du klickar på Logg-knappen.
- WEKA fågelikon: I det nedre högra hörnet visas WEKA-fågeln med representerar antalet processer som körs samtidigt (med x.). När processen pågår flyttar fågeln sig.
# 3) Experimentator
Med WEKA-experimenteringsknappen kan användarna skapa, köra och ändra olika scheman i ett experiment i en dataset. Experimentören har två typer av konfigurationer: Enkelt och avancerat. Båda konfigurationerna tillåter användare att köra experiment lokalt och på fjärrdatorer.
- Knappen 'Öppna' och 'Ny' öppnar ett nytt experimentfönster som användarna kan göra.
- Resultat: Ställ in målmålfilen från ARFF-, JDFC- och CSV-filen.
- Experimenttyp: Användaren kan välja mellan korsvalidering och tåg- / testprocentdelning. Användaren kan välja mellan Klassificering och Regression baserat på den dataset och klassificering som används.
- Datamängder: Användaren kan bläddra och välja datauppsättningar härifrån. Kryssrutan för den relativa sökvägen markeras om du arbetar på olika maskiner. Formatet för datauppsättningar som stöds är ARFF, C4.5, CSV, libsvm, bsi och XRFF.
- Iteration: Standard iterationsnumret är inställt på 10. Datamängder först och algoritmer hjälper först till att växla mellan dataset och algoritmer så att algoritmer kan köras på alla datamängder.
- Algoritmer: Nya algoritmer läggs till med “Ny knapp”. Användaren kan välja en klassificerare.
- Spara experimentet med Spara-knappen.
- Kör experimentet med knappen Kör.
# 4) Kunskapsflöde
Kunskapsflödet visar en grafisk representation av WEKA-algoritmer. Användaren kan välja komponenter och skapa ett arbetsflöde för att analysera datauppsättningarna. Uppgifterna kan hanteras batchvis eller stegvis. Parallella arbetsflöden kan utformas och var och en körs i en separat tråd.
De olika komponenterna som finns är Datakällor, Dataservrar, filter, klassificerare, kluster, utvärdering och visualisering.
# 5) Arbetsbänk
WEKA har arbetsbänkmodul som innehåller alla GUI: er i ett enda fönster.
Funktioner i WEKA Explorer
# 1) Dataset
En dataset består av objekt. Det representerar ett objekt till exempel: i marknadsföringsdatabasen kommer den att representera kunder och produkter. Datauppsättningarna beskrivs av attribut. Datauppsättningen innehåller datatuples i en databas. En dataset har attribut som kan vara nominella, numeriska eller strängar. I Weka representeras datamängden av weka.core.Instances klass.
Representation av dataset med 5 exempel:
@data
soligt, FALSKT, 85,85, nr
soligt, SANT, 80,90, nr
mulet, FALSKT, 83,86, ja
regnigt, FALSKT, 70,96, ja
regnigt, FALSKT, 68,80, ja
Vad är ett attribut?
Ett attribut är ett datafält som representerar karakteristiken för ett dataobjekt. Till exempel, i en kunddatabas kommer attributen att vara kund_id, kundadress, kundadress etc. Attribut har olika typer.
Dessa möjliga typer är:
A) Nominella attribut: Attribut som relaterar till ett namn och har fördefinierade värden som färg, väder. Dessa attribut kallas kategoriska attribut . Dessa attribut har ingen ordning och deras värden kallas också uppräkningar.
@attributsikter {soligt, mulet, regnigt}: förklaring av det nominella attributet.
B) Binära attribut: Dessa attribut representerar endast värdena 0 och 1. Dessa är typen av nominella attribut med endast två kategorier. Dessa attribut kallas också booleska.
C) Ordinära attribut: Attributen som bevarar en viss ordning eller rangordning bland dem är ordinära attribut. På varandra följande värden kan inte förutsägas utan endast ordning bibehålls. Exempel: storlek, betyg etc.
D) Numeriska attribut: Attribut som representerar mätbara kvantiteter är numeriska attribut. Dessa representeras av reella tal eller heltal. Exempel: temperatur, luftfuktighet.
@attribute fuktighet verklig: förklaring av ett numeriskt attribut
E) Strängattribut: Dessa attribut representerar en lista med tecken representerade i dubbla citat.
# 2) ARFF-dataformat
WEKA arbetar med ARFF-filen för dataanalys. ARFF står för Attribute Relation File Format. Den har tre sektioner: relation, attribut och data. Varje avsnitt börjar med “@”.
ARFF-filer har attribut för nominell, numerisk, sträng, datum och relation. Några av de välkända datamaskinuppsättningarna för maskininlärning finns i WEKA som ARFF.
Format för ARFF är:
@relation
@attribut
@data
Ett exempel på en ARFF-fil är:
@relation weather @attribute outlook {sunny, overcast, rainy}: @attribute temperature real @attribute humidity real @attribute windy {TRUE, FALSE} @attribute play {yes, no} //class attribute: The class attribute represents the output. @data sunny, FALSE,85,85,no sunny, TRUE,80,90,no overcast, FALSE,83,86,yes rainy, FALSE,70,96,yes rainy, FALSE,68,80,yes
# 3) XRFF-dataformat
XRFF står för XML-attributet Relation File Format. Det representerar data som kan lagra kommentarer, attribut och instansvikter. Det har filtillägget .xrff och .xrff.gz (komprimerat format). XRFF-filerna representerade data i XML-format.
# 4) Databasanslutning
Med WEKA är det enkelt att ansluta till en databas med en JDBC-drivrutin. JDBC-drivrutin är nödvändig för att ansluta till databasen, exempel:
MS SQL Server (com.microsoft.jdbc.sqlserver.SQLServerDriver)
Orakel (oracle.jdbc.driver.OracleDriver)
# 5) Klassificatorer
För att förutsäga utdata innehåller WEKA klassificatorer. Klassificeringsalgoritmerna som är tillgängliga för inlärning är beslutsträd, stödvektormaskiner, instansbaserade klassificeringsapparater och logistisk regression och Bayesiska nätverk. Beroende på kravet med test och test kan användaren ta reda på en lämplig algoritm för analys av data. Klassificeringsapparater används för att klassificera datamängden baserat på egenskaperna hos attributen.
# 6) Klustring
WEKA använder fliken Cluster för att förutsäga likheterna i datasetet. Baserat på klustring kan användaren ta reda på attributen som är användbara för analys och ignorera andra attribut. De tillgängliga algoritmerna för klustring i WEKA är k-medel, EM, Spindelnät, X-medel och FarhtestFirst.
# 7) Förening
Den enda algoritmen som finns tillgänglig i WEKA för att ta reda på associeringsregler är Apriori.
# 8) Åtgärdssektionsåtgärder
WEKA använder två metoder för bästa attributval för beräkningsändamål:
- Använda algoritmen för sökmetod: Bästa-först, framåtval, slumpmässig, uttömmande, genetisk algoritm och rankningsalgoritm.
- Använda algoritmer för utvärderingsmetod: Korrelationsbaserat, omslag, informationsförstärkning, chi-kvadrat.
# 9) Visualisering
WEKA stöder 2D-representation av data, 3D-visualiseringar med rotation och 1D-representation av enstaka attribut. Den har alternativet 'Jitter' för nominella attribut och 'dolda' datapunkter.
Andra huvudfunktioner i WEKA är:
- Det är ett öppen källkodsverktyg med grafiskt användargränssnitt i form av 'Explorer', 'Experimenter' och 'Knowledge Flow'.
- Det är plattformsoberoende.
- Den innehåller 49 förbehandlingsverktyg för data.
- 76 klassificerings- och regressionsalgoritmer, 8 grupperingsalgoritmer finns i WEKA
- Den har 15 attributval algoritmer och 10 funktionsval algoritmer.
- Den har tre algoritmer för att hitta associeringsregel.
- Med hjälp av WEKA kan användare utveckla anpassad kod för maskininlärning.
Slutsats
I denna WEKA-handledning gav vi en introduktion till WEKA Machine Learning Software med öppen källkod och förklarade steg för steg nedladdning och installationsprocess. Vi har också sett de fem tillgängliga alternativen för Weka Graphical User Interface, nämligen Explorer, Experimenter, Knowledge flow, Workbench och Simple CLI.
Vi har också lärt oss om funktionerna i WEKA med exempel. Funktionerna inkluderar dataset, ARFF-dataformat, databasanslutning etc.
=> Besök här för den exklusiva maskininlärningsserien
Rekommenderad läsning
- WEKA-datamängd, klassificerare och J48-algoritm för beslutsträd
- WEKA Explorer: Visualisering, klustring, Association Rule Mining
- 11 mest populära maskininlärningsverktyg 2021
- En komplett guide till artificiellt neuralt nätverk inom maskininlärning
- Data Mining Vs Machine Learning Vs Artificial Intelligence Vs Deep Learning
- Maskininlärningshandledning: Introduktion till ML och dess tillämpningar
- Topp 13 BÄSTA maskininlärningsföretag (uppdaterad 2021-lista)
- Vad är Support Vector Machine (SVM) i maskininlärning