Weka-handledning - Hur man laddar ner, installerar och använder Weka-verktyget

weka tutorial how download

Prova Vårt Instrument För Att Eliminera Problem

Välj Operativsystemet Välj Ett Projektprogram (Valfritt)

Beskriv Ditt Problem

Denna WEKA-handledning förklarar vad som är Weka Machine Learning-verktyg, dess funktioner och hur man laddar ner, installerar och använder Weka Machine Learning Software:

I Föregående handledning , vi lärde oss om Support Vector Machine i ML och tillhörande koncept som Hyperplane, Support Vectors & Applications of SVM.

Machine Learning är ett vetenskapligt fält där maskiner fungerar som ett konstgjort intelligent system. Maskinerna kan lära sig själva utan att kräva någon uttrycklig kodning. Det är en iterativ process som får åtkomst till data, lär sig av sig själv och förutsäger resultatet. För att utföra maskininlärningsuppgifter krävs många verktyg och skript.

WEKA är en maskininlärningsplattform som består av många verktyg som underlättar många maskininlärningsaktiviteter.

=> Läs igenom hela serien för maskininlärning

microsoft dynamics ax 2012 tutorial för nybörjare

Vad du kommer att lära dig:

Vad är WEKA

WEKA Bird-logotyp

WEKAGUIväljare

Weka är ett open source-verktyg som är designat och utvecklat av forskarna / forskarna vid University of Waikato, Nya Zeeland. WEKA står för Waikato Environment for Knowledge Analysis. Den är utvecklad av det internationella vetenskapssamhället och distribueras under gratis GNU GPL-licens.

WEKA är fullt utvecklat i Java. Det ger integration med SQL-databasen med Java-databasanslutning. Det ger många maskininlärningsalgoritmer för att implementera data mining-uppgifter. Dessa algoritmer kan antingen användas direkt med hjälp av WEKA-verktyget eller kan användas med andra applikationer som använder Java-programmeringsspråk.

Det ger många verktyg för förbehandling av data, klassificering, klustring, regressionsanalys, skapande av associeringsregler, extraktion av funktioner och visualisering av data. Det är ett kraftfullt verktyg som stöder utvecklingen av nya algoritmer inom maskininlärning.

Varför använda WEKA Machine Learning Tool

Med WEKA är maskininlärningsalgoritmerna lätt tillgängliga för användarna. ML-specialisterna kan använda dessa metoder för att extrahera användbar information från stora datamängder. Här kan specialisterna skapa en miljö för att utveckla nya maskininlärningsmetoder och implementera dem på verkliga data.

WEKA används av maskininlärning och forskare inom tillämpad vetenskap för lärande. Det är ett effektivt verktyg för att utföra många uppgifter mining.

WEKA nedladdning och installation

# 1) Ladda ner programvaran från här .

Kontrollera datorsystemets konfiguration och ladda ner den stabila versionen av WEKA (för närvarande 3.8) från den här sidan.

Ladda ner den stabila versionen av WEKA

#två) Efter lyckad nedladdning, öppna filplatsen och dubbelklicka på den nedladdade filen. Step Up-guiden visas. Klicka på Nästa.

Step Up-guiden

# 3) Licensavtalets villkor öppnas. Läs det noggrant och klicka på “Jag håller med”.

Licensavtalets villkor

# 4) Välj de komponenter som ska installeras enligt dina krav. Fullständig installation av komponenter rekommenderas. Klicka på Nästa.

välj de komponenter som ska installeras

# 5) Välj målmapp och klicka på Nästa.

målmapp

# 6) Sedan startar installationen.

Installationsfönster

# 7) Om Java inte är installerat i systemet installeras Java först.

Java-installationsfönster

# 8) När installationen är klar visas följande fönster. Klicka på Nästa.

Fönstret är komplett

# 9) Markera kryssrutan Starta Weka. Klicka på Slutför.

Markera kryssrutan Starta Weka

# 10) Fönstret WEKA Tool och Explorer öppnas.

WEKA Tool och Explorer

#elva) WEKA-handboken kan laddas ner från här.

Grafiskt användargränssnitt för WEKA

GUI för WEKA ger fem alternativ: Explorer, Experimenter, Knowledge flow, Workbench och Simple CLI. Låt oss förstå var och en av dessa individuellt.

# 1) Enkel CLI

Enkel CLI

Enkel CLI är Weka Shell med kommandorad och utdata. Med hjälp kan du se översikten över alla kommandon. Enkel CLI ger tillgång till alla klasser som klassificerare, kluster och filter etc.

Några av de enkla CLI-kommandona är:

Ha sönder: För att stoppa den aktuella tråden
Utgång: Avsluta CLI
Hjälp() : Matar ut hjälp för det angivna kommandot
-java weka.classifiers.trees.J48 -t c: /temp/iris.arff: För att åberopa en WEKA-klass, prefixa den med Java. Detta kommando leder WEKA att ladda klassen och köra den med givna parametrar. I det här kommandot anropas J48-klassificeraren i IRIS-datasetet.

enkla CLI-kommandon

# 2) Utforskare

utforskare

WEKA Explorer-fönstren visar olika flikar som börjar med förbehandling. Initialt är förbehandlingsfliken aktiv, eftersom datauppsättningen förbehandlas först innan algoritmer tillämpas på den och undersöktes datamängden.

Flikarna är som följer:

Förprocess: Välj och modifiera laddad data.
Klassificera: Tillämpa tränings- och testalgoritmer på data som klassificerar och regresserar data.
Klunga: Forma kluster från data.
Associera: Mina ut associeringsregel för data.
Välj attribut: Åtgärder för att välja attribut tillämpas.
Visualisera: 2D-representation av data ses.
Statusfältet: Den nedre delen av fönstret visar statusfältet. Detta avsnitt visar vad som händer just nu i form av ett meddelande, till exempel en fil laddas. Högerklicka på det här, Minne information kan ses, och också Springa sopor samlare för att frigöra utrymme kan köras.
Loggknapp: Den lagrar en logg över alla åtgärder i Weka med tidsstämpeln. Loggar visas i ett separat fönster när du klickar på Logg-knappen.
WEKA fågelikon: I det nedre högra hörnet visas WEKA-fågeln med representerar antalet processer som körs samtidigt (med x.). När processen pågår flyttar fågeln sig.

# 3) Experimentator

Experimentator

Med WEKA-experimenteringsknappen kan användarna skapa, köra och ändra olika scheman i ett experiment i en dataset. Experimentören har två typer av konfigurationer: Enkelt och avancerat. Båda konfigurationerna tillåter användare att köra experiment lokalt och på fjärrdatorer.

Knappen 'Öppna' och 'Ny' öppnar ett nytt experimentfönster som användarna kan göra.
Resultat: Ställ in målmålfilen från ARFF-, JDFC- och CSV-filen.
Experimenttyp: Användaren kan välja mellan korsvalidering och tåg- / testprocentdelning. Användaren kan välja mellan Klassificering och Regression baserat på den dataset och klassificering som används.
Datamängder: Användaren kan bläddra och välja datauppsättningar härifrån. Kryssrutan för den relativa sökvägen markeras om du arbetar på olika maskiner. Formatet för datauppsättningar som stöds är ARFF, C4.5, CSV, libsvm, bsi och XRFF.
Iteration: Standard iterationsnumret är inställt på 10. Datamängder först och algoritmer hjälper först till att växla mellan dataset och algoritmer så att algoritmer kan köras på alla datamängder.
Algoritmer: Nya algoritmer läggs till med “Ny knapp”. Användaren kan välja en klassificerare.
Spara experimentet med Spara-knappen.
Kör experimentet med knappen Kör.

Ställ in för att välja algoritm

# 4) Kunskapsflöde

WEKA KnowledgeFlow

Kunskapsflödet visar en grafisk representation av WEKA-algoritmer. Användaren kan välja komponenter och skapa ett arbetsflöde för att analysera datauppsättningarna. Uppgifterna kan hanteras batchvis eller stegvis. Parallella arbetsflöden kan utformas och var och en körs i en separat tråd.

De olika komponenterna som finns är Datakällor, Dataservrar, filter, klassificerare, kluster, utvärdering och visualisering.

# 5) Arbetsbänk

WEKA har arbetsbänkmodul som innehåller alla GUI: er i ett enda fönster.

WEKA arbetsbänk

Funktioner i WEKA Explorer

# 1) Dataset

En dataset består av objekt. Det representerar ett objekt till exempel: i marknadsföringsdatabasen kommer den att representera kunder och produkter. Datauppsättningarna beskrivs av attribut. Datauppsättningen innehåller datatuples i en databas. En dataset har attribut som kan vara nominella, numeriska eller strängar. I Weka representeras datamängden av weka.core.Instances klass.

Representation av dataset med 5 exempel:

@data
soligt, FALSKT, 85,85, nr
soligt, SANT, 80,90, nr
mulet, FALSKT, 83,86, ja
regnigt, FALSKT, 70,96, ja
regnigt, FALSKT, 68,80, ja

Vad är ett attribut?

Ett attribut är ett datafält som representerar karakteristiken för ett dataobjekt. Till exempel, i en kunddatabas kommer attributen att vara kund_id, kundadress, kundadress etc. Attribut har olika typer.

Dessa möjliga typer är:

A) Nominella attribut: Attribut som relaterar till ett namn och har fördefinierade värden som färg, väder. Dessa attribut kallas kategoriska attribut . Dessa attribut har ingen ordning och deras värden kallas också uppräkningar.

@attributsikter {soligt, mulet, regnigt}: förklaring av det nominella attributet.

B) Binära attribut: Dessa attribut representerar endast värdena 0 och 1. Dessa är typen av nominella attribut med endast två kategorier. Dessa attribut kallas också booleska.

C) Ordinära attribut: Attributen som bevarar en viss ordning eller rangordning bland dem är ordinära attribut. På varandra följande värden kan inte förutsägas utan endast ordning bibehålls. Exempel: storlek, betyg etc.

D) Numeriska attribut: Attribut som representerar mätbara kvantiteter är numeriska attribut. Dessa representeras av reella tal eller heltal. Exempel: temperatur, luftfuktighet.

@attribute fuktighet verklig: förklaring av ett numeriskt attribut

E) Strängattribut: Dessa attribut representerar en lista med tecken representerade i dubbla citat.

# 2) ARFF-dataformat

WEKA arbetar med ARFF-filen för dataanalys. ARFF står för Attribute Relation File Format. Den har tre sektioner: relation, attribut och data. Varje avsnitt börjar med “@”.

ARFF-filer har attribut för nominell, numerisk, sträng, datum och relation. Några av de välkända datamaskinuppsättningarna för maskininlärning finns i WEKA som ARFF.

Format för ARFF är:

@relation
@attribut
@data

Ett exempel på en ARFF-fil är:

@relation weather @attribute outlook {sunny, overcast, rainy}: @attribute temperature real @attribute humidity real @attribute windy {TRUE, FALSE} @attribute play {yes, no} //class attribute: The class attribute represents the output. @data sunny, FALSE,85,85,no sunny, TRUE,80,90,no overcast, FALSE,83,86,yes rainy, FALSE,70,96,yes rainy, FALSE,68,80,yes

# 3) XRFF-dataformat

XRFF står för XML-attributet Relation File Format. Det representerar data som kan lagra kommentarer, attribut och instansvikter. Det har filtillägget .xrff och .xrff.gz (komprimerat format). XRFF-filerna representerade data i XML-format.

# 4) Databasanslutning

Med WEKA är det enkelt att ansluta till en databas med en JDBC-drivrutin. JDBC-drivrutin är nödvändig för att ansluta till databasen, exempel:

MS SQL Server (com.microsoft.jdbc.sqlserver.SQLServerDriver)

Orakel (oracle.jdbc.driver.OracleDriver)

# 5) Klassificatorer

För att förutsäga utdata innehåller WEKA klassificatorer. Klassificeringsalgoritmerna som är tillgängliga för inlärning är beslutsträd, stödvektormaskiner, instansbaserade klassificeringsapparater och logistisk regression och Bayesiska nätverk. Beroende på kravet med test och test kan användaren ta reda på en lämplig algoritm för analys av data. Klassificeringsapparater används för att klassificera datamängden baserat på egenskaperna hos attributen.

# 6) Klustring

WEKA använder fliken Cluster för att förutsäga likheterna i datasetet. Baserat på klustring kan användaren ta reda på attributen som är användbara för analys och ignorera andra attribut. De tillgängliga algoritmerna för klustring i WEKA är k-medel, EM, Spindelnät, X-medel och FarhtestFirst.

# 7) Förening

Den enda algoritmen som finns tillgänglig i WEKA för att ta reda på associeringsregler är Apriori.

# 8) Åtgärdssektionsåtgärder

WEKA använder två metoder för bästa attributval för beräkningsändamål:

Använda algoritmen för sökmetod: Bästa-först, framåtval, slumpmässig, uttömmande, genetisk algoritm och rankningsalgoritm.
Använda algoritmer för utvärderingsmetod: Korrelationsbaserat, omslag, informationsförstärkning, chi-kvadrat.

# 9) Visualisering

WEKA stöder 2D-representation av data, 3D-visualiseringar med rotation och 1D-representation av enstaka attribut. Den har alternativet 'Jitter' för nominella attribut och 'dolda' datapunkter.

Andra huvudfunktioner i WEKA är:

Det är ett öppen källkodsverktyg med grafiskt användargränssnitt i form av 'Explorer', 'Experimenter' och 'Knowledge Flow'.
Det är plattformsoberoende.
Den innehåller 49 förbehandlingsverktyg för data.
76 klassificerings- och regressionsalgoritmer, 8 grupperingsalgoritmer finns i WEKA
Den har 15 attributval algoritmer och 10 funktionsval algoritmer.
Den har tre algoritmer för att hitta associeringsregel.
Med hjälp av WEKA kan användare utveckla anpassad kod för maskininlärning.

Slutsats

I denna WEKA-handledning gav vi en introduktion till WEKA Machine Learning Software med öppen källkod och förklarade steg för steg nedladdning och installationsprocess. Vi har också sett de fem tillgängliga alternativen för Weka Graphical User Interface, nämligen Explorer, Experimenter, Knowledge flow, Workbench och Simple CLI.

Vi har också lärt oss om funktionerna i WEKA med exempel. Funktionerna inkluderar dataset, ARFF-dataformat, databasanslutning etc.

=> Besök här för den exklusiva maskininlärningsserien

Rekommenderad läsning

WEKA-datamängd, klassificerare och J48-algoritm för beslutsträd
WEKA Explorer: Visualisering, klustring, Association Rule Mining
11 mest populära maskininlärningsverktyg 2021
En komplett guide till artificiellt neuralt nätverk inom maskininlärning
Data Mining Vs Machine Learning Vs Artificial Intelligence Vs Deep Learning
Maskininlärningshandledning: Introduktion till ML och dess tillämpningar
Topp 13 BÄSTA maskininlärningsföretag (uppdaterad 2021-lista)
Vad är Support Vector Machine (SVM) i maskininlärning

Weka-handledning - Hur man laddar ner, installerar och använder Weka-verktyget

Vad är WEKA

Varför använda WEKA Machine Learning Tool

WEKA nedladdning och installation

Grafiskt användargränssnitt för WEKA

# 1) Enkel CLI

# 2) Utforskare

# 3) Experimentator

# 4) Kunskapsflöde

# 5) Arbetsbänk

Funktioner i WEKA Explorer

# 1) Dataset

# 2) ARFF-dataformat

# 3) XRFF-dataformat

# 4) Databasanslutning

# 5) Klassificatorer

# 6) Klustring

# 7) Förening

# 8) Åtgärdssektionsåtgärder

# 9) Visualisering

Slutsats

Rekommenderad läsning

Intressanta Artiklar

Redaktionen

Destruktoidgranskning: Manhunt 2

PSA: Mario Kart 8 Deluxe DLC Ninja Hideaway-banan har en märkbar glitch

Här är de bästa egenskaperna i Hogwarts Legacy

Granskning: Robot Unicorn Attack 2

Giveaway: Ta en Explorer-pakets förbeställningsbunt för kommande MMO Conqueror's Blade

Rock Band 4 får fler låtar som knappast kvalificeras som rock

Igavanias, rankad

Ställ in gränssnitt i Java: Java Set-handledning med exempel

Atari släpper kopior av PCB för Black Widow, Gravitar och Major Havoc

Dune: Spice Wars tar sin strategi till tidig tillgång den här månaden

2B fungerar till en sjuk Weight of the World-remix i nya Granblue Fantasy Versus: Rising-trailer

Take-Two köper Zynga i en svindlande affär på 12,7 miljarder dollar

Skytex Softbox - the perfect solution for professional photography and videography.