top 30 sas interview questions
Lista med de mest populära SAS-intervjufrågorna med svar:
I den här artikeln tar vi en titt på några av de grundläggande såväl som avancerade koncepten för SAS-programmering genom de vanligaste frågorna och svaren på SAS-intervjuer.
Statistiskt analyssystem, allmänt känt som SAS, betraktas som en uppsättning av flera program som är integrerade och används för olika operationer som Data Management, Predictive - Perspective & Descriptive Analysis, Quality Improvement, Business Analysis, Application Development, etc.
SAS stora antal anpassningar av komponenter, liksom den omfattande programmeringsmetoden, tillsammans utför uppgifter analys och data transformation uppgifter. Det kan köras på vilket operativsystem som helst (Linux, Windows, etc.) eftersom det är plattformsoberoende.
Mest populära SAS-intervjufrågor och svar
Nu kör vi..
F # 1) Anropa de funktioner som utförs av SAS.
Svar: SAS (Statistical Analysis System) har sin egen betydelse inom varje affärsområde.
Nedan listas några av de sammanfattade funktionerna som utförs av SAS:
- Datahantering och projektledning
- Datalagring
- Operativ forskning och beslutsstöd
- Informationssökning och kvalitetshantering
- Affärsplanering
- Statistisk analys
F # 2) Vilka är de tre komponenterna i SAS-programmering?
Svar: De tre komponenterna i SAS-programmering är:
- Uttalanden
- Variabler
- Dataset
F # 3) Anmäla de syntaxregler som följs i SAS-uttalanden.
Svar: SAS-programmet är skrivet i Editor-fönstret. Här innehåller den en serie uttalanden följt av rätt syntax i en order för att SAS-programmet ska förstå det.
Några av de syntaxregler som följs när det gäller Statement-komponenten i SAS är följande:
- Slutet på alla uttalanden markeras med ett semikolon (;).
- Ett semikolon används också för att separera flera påståenden som visas på en rad.
- SAS-uttalanden är inte skiftlägeskänsliga och extra avstånd innan uttalanden tas bort automatiskt.
- Kommentarer kan inkluderas i SAS-programmet för uttalanden på två olika sätt som:
- En rad som börjar med en asterisk (*) och slutar med semikolon (;).
- En rad som börjar med ett snedstreck och en asterisk (/ *) och slutar med en asterisk och ett snedstreck (* /).
F # 4) Vilka datatyper innehåller SAS?
Svar: 'Numerisk' och 'Karaktär' är de två typerna av datatyper som SAS-programmet innehåller.
F # 5) Vad är PDV och deras funktioner?
Svar: Program Data Vector (PDV) är ett logiskt koncept och definieras som ett minnesområde där en datamängd byggs av SAS.
PDV: s funktioner är följande:
- En databas med en observation i taget skapas.
- Ingångsbufferten för att lagra data från en extern fil skapas vid tidpunkten för sammanställningen.
- PDV innehåller två automatiska variabler, nämligen _N_ (visar antalet datasteg som körs) och _ERROR_ (meddelar felet som inträffar vid tidpunkten för körningen).
F # 6) Vad vet du om SAS-datauppsättningen?
Svar: SAS-datauppsättning kallas i princip de data som är tillgängliga för analys inom ett SAS-program. SAS-dataset kallas också för SAS-datatabellen.
SAS datatabell består av två delar:
- Kolumner med variabler
- Rader av observationer
Användbar information om SAS-datauppsättningen kan sammanfattas enligt följande:
- SAS Dataset kan läsa såväl som det har inbyggda datakällor för användning som Excel, Access, etc.
- Datauppsättningen som endast används i den aktuella sessionskörningen och kasseras efter att sessionen avslutats kallas tillfällig dataset.
- Dataset som lagras för användning i den framtida sessionen kallas också Permanent Dataset.
- Den inbyggda datamängden kan nås med den här sökvägen Bibliotek -> Mina bibliotek-> SASHELP.
F # 7) Förklara varför dubbel efterföljande @@ används i inmatningsuttalanden?
Svar: Under datasteget innebär iteration, inklusive dubbel efterföljande @@ i inmatningsuttalanden, att SAS ska ha den aktuella posten i syfte att utföra nästa ingångssats i stället för att byta till den nya posten.
F # 8) Förklara skillnaden mellan NODUP- och NODUPKEY-alternativen?
Svar: För att ta bort dubbla värden från tabellen, PROC SORT är i grunden kategoriserad mellan två alternativ:
- NODUP
- NODUPKEY
Skillnaden mellan dessa två alternativ kan ses nedan:
NODUPKEY | NODUP |
---|---|
Jämför bara BY-variabeln som finns i datasetet. | Jämför alla variabler som finns i datasetet. |
Tar bort dubblettalternativ för värdena för variabeln som anges i BY-satsen. | Identifierar och eliminerar dubbla observationer. |
Syntax: PROC SORT DATA = readin NODUPKEY; BY variabelnamn; SPRINGA; | Syntax: PROC SORT DATA = readin NODUP; BY variabelnamn; SPRINGA; |
F # 9) Vilket kommando används för att utföra sortering i SAS-programmet?
Svar: PROC SORT-kommandot används för att utföra sortering, vare sig det gäller en enda variabel eller flera variabler. Detta kommando utförs på datamängden där den nya datamängden skapas till följd av sortering men den ursprungliga datamängden förblir oförändrad.
Syntax:
PROC SORT DATA=original OUT=Sorted; BY variable;
Var,
”Original” avser den ursprungliga datasetet
'Sorterat' hänvisar till resultatet som sorterad dataset
”Variabel” avser den kolumn som sorteringsåtgärden görs på.
Sortering kan göras i både stigande och fallande ordning.
För att datauppsättningen ska visas i fallande ordning används nyckelordet 'Descending' i BY-satsen med kolumnnamnet som sorteringen ska utföras på.
PROC SORT DATA=original OUT=Sorted; BY DESCENDING variable
F # 10) Förklara skillnaden mellan Informat och Format med ett exempel.
Svar: Skillnaden mellan Informat och Format kan förklaras som:
Få reda på mer | Formatera |
---|---|
Ange SAS hur man läser in data i SAS-variabeln. | Ange SAS hur man visar värden i variabeln. |
Dessa används för att läsa data eller ta inmatningsdata från externa filer. | Dessa används för att skriva data. |
F # 11) Differentiera INPUT och INFILE.
Svar: Att inkludera ett INFILE-uttalande i SAS-programmeringen identifierar en extern fil som består av data, medan inkludering av INPUT-uttalande i SAS-programmering beskriver de variabler som används.
Syntaxen för INFILE:
INFILE ‘filename’;
Syntaxen för INPUT:
INPUT ‘varname1’ ‘varname2’;
F # 12) Förklara användningen av PROC-utskrift och PROC-innehåll?
Svar: PROC-steget i SAS-programmet används för att åberopa inbyggda procedurer för analys av data i datasetet.
PROC-utskrift: Säkerställer att data som finns i datasetet läses korrekt.
PROC-innehåll: Visar informationen om SAS-datasetet.
F # 13) Förklara DATA_NULL_?
Svar: Som namnet definierar är DATA_NULL_ ett datasteg som faktiskt inte skapar någon datamängd.
Den används för:
- Skapa makrovariabler.
- Skriva utdata utan någon datauppsättning.
F # 14) Hur omvandlas teckenvariabel till en numerisk variabel och vice versa?
Svar: Under SAS-programmering uppstår många uppgifter där ett teckenvärde ska konverteras till det numeriska och på samma sätt ska ett numeriskt värde konverteras till ett teckenvärde.
SÄTTA() används för att konvertera numeriskt till tecken. I det här fallet måste källformatet och typen av källvariabel alltid vara lika.
Exempel:
char_var= PUT( num_var, 6.);
INPUT () används för att konvertera ett tecken till numeriskt. I detta fall måste källvariabelns typ alltid vara teckenvariabler.
Exempel:
Num_var= INPUT(char_var,2.0);
F # 15) Vad är syftet med _CHARACTER_ och _NUMERIC_?
Svar: I den aktuella datasetet
_KARAKTÄR_ definierar alla teckenvariabler som för närvarande är definierade.
Exempel : För att inkludera alla teckenvariabler i PROC MEANS används följande påståenden:
PROC MEANS; Var_character_; Run;
_NUMERISK_ definierar alla numeriska variabler som för närvarande är definierade.
Exempel: För att inkludera alla de numeriska variablerna i PROC MEANS används följande påståenden:
PROC MEANS; Var_numeric_; Run;
F # 16) Vilka kommandon används för att inkludera eller exkludera specifika variabler i datamängden?
Svar: DROP-, KEEP- och datauppsättningsalternativ används för detta ändamål.
Variabeln som vi vill ta bort från datasteget specificeras i DROP-uttalandet.
Variabeln som vi vill behålla från datasteget specificeras i KEEP-uttalandet.
F # 17) Skill mellan PROC MEANS och PROC SAMMANFATTNING.
Svar: Skillnaden mellan PROC MEANS och PROC SAMMANFATTNING kan förstås på följande sätt:
PROC betyder | PROC SAMMANFATTNING |
---|---|
Denna procedur producerar den utskrivna rapporten som standard i OUTPUT-fönstret. | Denna procedur inkluderar PRINT i uttalandet för att producera den utskrivna rapporten. |
PROC MEANS tar som standard alla numeriska variabler i analysen. | PROC SAMMANFATTNING tar variablerna in i den statistiska analysen som beskrivs i VAR-uttalandet. |
F # 18) Förklara syftet med SUBSTR-funktioner i SAS-programmering.
Svar: Vid SAS-programmering används SUBSTR-funktionen när det gäller ett teckenvariabel närhelst det finns krav på programmet att abstrakta en substring.
När en startposition och längd anges, används den här funktionen för att abstrahera teckensträng.
Syntax: SUBSTR (char_var, start, längd);
F # 19) Namnge och beskriv några få SAS-karaktärsfunktioner som kortfattat används för datarengöring.
Svar: Få SAS-karaktärsfunktioner som används för datarengöring är listade nedan:
- Komprimera (char_string) funktionen används för att ta bort tomma eller vissa angivna tecken från en viss sträng.
- TRIM (str) funktionen används för att ta bort efterföljande ämnen från en given sträng.
- LOWCASE (char_string) funktionen används för att konvertera alla tecken i en viss sträng till gemener.
- UPCASE (char_string) funktionen används för att konvertera alla tecken i en viss sträng till versaler.
- COMPBL (str) -funktionen används för att konvertera flera ämnen till ett enda ämne.
F # 20) Nämn några få sätt att göra en 'tabelluppslagning' i SAS-programmering.
Svar: I SAS-programmering kan tabelluppslagsvärdena lagras på följande sätt:
- Koda
- Array
- Hash-objekt
- Formatera
- Dataset
Följande tekniker används för att utföra ”tabelluppslagning” i SAS respektive:
- VÄLJ / NÄR eller OM / DÅ uttalanden
- Array Index-värde
- Hash-objektets nyckelvärde
- FORMAT-uttalande, PUT-funktion
- Slå samman, gå med, NYCKEL = Alternativ
Låt oss se ett exempel som visar sättet 'Kod' för att utföra tabelluppslagning med 'IF / THEN' -uttalanden:
data location; set myinfo; if AreaCode='226' then Location='Ontario, Canada'; else if AreaCode='212' then Location='New York, NY'; else Location='Unknown'; run;
F # 21) Skilja mellan CEIL- och FlOOR-funktioner.
Svar: CEIL-funktion används för att avkorta numeriska värden där den visar utdata som det minsta heltalet. Med det minsta heltalet betyder här att heltalets värde är större än / lika med argumentet.
Exempel: CEIL (12.85) visar utdata som 13.
GOLV-funktion används för att avkorta numeriska värden där den visar utdata som det största heltalet. Med största heltal betyder här att heltalets värde är mindre än / lika med argumentet.
Exempel: FLOOR (12.85) visar utgången som 12.
F # 22) Vilka sätt kan makrovariabler skapas i SAS-programmering?
Svar: Ett antal olika tekniker kan användas för att skapa makrovariabler i SAS-programmering.
Nedan listas de fem mest använda metoderna:
- % LET-uttalande
- Makroparametrar (såväl namngivna som positionella)
- % DO-uttalande (iterativ)
- INTO i PROC SQL
- SAMTALSSYMPUTX-rutin
F # 23) Förklara syftet med RETAIN-uttalandet.
Svar: Eftersom betydelsen av ordet ”RETAIN” betyder att behålla värdet en gång tilldelat, är syftet med RETAIN-uttalandet detsamma i SAS-programmering som dess innebörd innebär.
Inom ett SAS-program, när det krävs att flytta från den aktuella iterationen till nästa av datasteget, berättar RETAIN-uttalandet vid den tidpunkten SAS att behålla värdena snarare än att ställa in dem på att saknas.
Exempel: Låt oss skriva ut ett program som visar utgångsvärdet för 'z' med början 1 med hjälp av RETAIN-uttalandet.
data abc; set xyz; RETAIN z 0; z = z + 1; run;
F # 24) Vilket kommando används för att spara loggar i den externa filen?
Svar: TRYCKT PROCESS kommandot används för att spara loggar i den externa filen.
java mot c ++
Exempel:
PROC PRINTTO log='C:UsersabcDownloadsLOG11.txt' new; run;
F # 25) Nämn några vanliga fel som vanligtvis begås vid SAS-programmering.
Svar: Nedan listas några av de vanligaste felen som vanligtvis begås, särskilt när du är ny på detta programmeringsspråk.
- Den grundläggande syntaxen innehåller ett semikolon i slutet av varje uttalande och att missa ett semikolon är det vanligaste misstaget.
- Du hoppar över att kontrollera loggarna efter att du skickat in programmet.
- Kommentera fel som att misslyckas med att använda kommentarer vid behov eller använda kommentarer på ett olämpligt sätt.
- Använder inte korrekta felsökningsmetoder.
F # 26) Nämn SAS-systemalternativ för att felsöka SAS-makron.
Svar: För att hjälpa till att spåra makrokoden såväl som SAS-koden som genereras av makron kan vissa systemalternativ användas.
Dom är:
- MLOGIC
- MPRINT
- SYMBOLER
Meddelandet som genereras av dessa systemalternativ kan ses i SAS-loggen.
F # 27) Skilja mellan SAS-funktioner och SAS-procedurer.
Svar: De stora skillnaderna kan upptäckas / förstås av det fall som förklaras för både SAS-funktioner och procedurer.
Fall:
För Fungera , tillhandahålls argumentvärde eller sägs tas för beräkning över observationen som nämns i programförklaringen medan, i fallet med Procedur varje observation förväntas ha endast en variabel genom vilken beräkning görs som nämns i nedanstående exempel.
Låt oss förstå det med exempel:
data average; set temp; avgtemp = mean( of T1 – T24 ); run;
Här i ovanstående exempel tas argumenten som skickas till medelfunktionen för beräkning som en observation.
proc sort; by month; run; proc means; by month; var avgtemp; run;
Här i exemplet ovan beräknar Proc-funktionen funktionen medeltemperaturen för ett argument som skickas som en observation, dvs. per månad.
F # 28) Vad vet du om SYMPUT och SYMGET?
Svar: De stora skillnaderna mellan de två nämns nedan.
SYMPUT används för att lagra värdet på en datamängd i makrovariabeln medan SYMGET används för att hämta värdet från makrovariabeln till datamängden.
F # 29) Förklara de särskilda ingångsavgränsarna som används vid SAS-programmering.
Svar: De särskilda ingångsavgränsarna som används vid SAS-programmering är:
- DLM
- DSD
De används i uttalandet 'INFILE' och DSD har funktionen att ignorera avgränsarna som visas i citattecken.
F # 30) Vilken funktion används för att räkna antalet intervall mellan två SAS-datum?
Svar: Intervallfunktionen INTCK används för att räkna antalet intervall mellan två givna SAS-datum.
Syntax:
INTCK(interval,start-of-period,end-of-period)
Slutsats
Hittills har vi sett flera frågor och svar som skulle ha gett dig en tydlig förståelse för SAS programmeringskoncept samt gett dig en uppfattning om vilken typ av frågor som ställs i SAS-intervjuer.
Tja, om du är ny inom SAS-programmering kommer kunskapen om vissa teknologier för datorprogrammering och förtrogenhet med SQL (Structured Query Language) att vara en extra fördel för dig att förstå såväl som att lära dig SAS snabbt.
Hoppas, du är redo att möta alla SAS-intervjuer med säkerhet !!