datautforskning i eg, eg 7.1 og egendefinerte …...vi ser på hvordan man kan bruke dette...
TRANSCRIPT
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
DATAUTFORSKNING I EG, EG 7.1 OG
EGENDEFINERTE FUNKSJONER
SAS FANS I TRONDHEIM 17. MARS 2015, MARIT FISKAAEN
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
2
INNLEDNING TEMA
• I SAS Enterprise Guide versjon 5.1 (februar 2012) kom det et nytt
datautforskingsverktøy, «Data Explorer». Vi ser på hvordan man
kan bruke dette verktøyet til å få et raskt overblikk over et datasett.
• Vi ser på måter å bli kjent med dataene på i prosessflyten.
• Ny funksjonalitet i SAS Enterprise Guide versjon 7.1.
(EG 7.1, oktober 2014, støttet på 9.2, 9.3, 9.4)
• Bruk av egendefinerte funksjoner i SAS (fra 9.2 i datasteg)
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
3
DATA EXPLORATION STARTE DATAUTFORSKNING
Velg File + Open + Data Exploration:
Denne muligheten fra EG 5.1.
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
4
DATA EXPLORATION ÅPNE DATASETT OG SE PÅ STATISTIKK
Datasettet åpnes,
klikk på «Quick Stats»:
Klikk på «Run Statistics for
this Column»:
Vi ser antall distinkte verdier og
antall for de ulike kolonnene i
datasettet og får fram histogram
og tabell.
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
5
DATA EXPLORATION QUICK STATS
Merk at tabellen ikke viser alle verdiene kun de
med høyest frekvens ->
Link til frekvens i prosessflyt
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
6
DATA EXPLORATION VELGE STATISTIKK
Til høyre under «Select Statistics» kan man velge hvilke som vises:
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
7
DATA EXPLORATION FILTRERING
Vi ser også link til «Quick stats» når vi
holder musa over kolonnene. Det kan
filtreres om vi trykker på den lille pila:
Vi må velge «Apply Updates» for å få
oppdatert resultatet av bare å velge «Audi» ->
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
8
DATA EXPLORATION STATISTIKK FOR NUMERISKE VERDIER
Hvis det er numeriske verdier i kolonnen kan velge «Statistics for All Values»:
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
9
DATA EXPLORATION HISTORIKK
<- For å se «Data Exploration History»
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
10
DATA EXPLORATION LAGRING OG VIEW
Prosjektet kan lagres på vanlig måte.
Til høyre kan vi skifte view. I vårt eksempel («View 1» kun Audi’ene).
Vi kan også endre navn på view (velg «Manage Views»):
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
DATAUTFORSKNING I PROSESSFLYTEN
GODE «GAMLE» TASKS
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
12
DATA SET
ATTRIBUTESDATASETT ATTRIBUTTER
Vi kan bruke «Data Set Attributes» for å få rask oversikt over kolonnenavn,
datatyper, formater, labels og lengde.
(Ikke nytt også i EG 4.3)
(Hvis høyreklikker dataset + properties finner også info om kolonner….)
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
13
ONE-WAY
FREQUENCIESFREKVENSER I PROSESSFLYTEN
Velge kun
«Make» + huke
av for å få
histogram. Link til frekvens i
explorer view
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
14
CHARACTERIZE
DATAFÅ OPPSUMMERENDE STATISTIKK FOR DATASETT
Vi kan bruke «Characterize Data» for å få oppsummerende
statistikk for et datasett.
(Ikke nytt også i EG 4.3)
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
15
SUMMARY
STATISTICSOPPSUMMERENDE STATISTIKK
Eksempel:
Ta kode herfra og tilpasse.
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
16
COMPARE DATA SAMMENLIGNING AV DATASETT
Sammenligning av to datasett enkelt vha. pek og klikk eller kode
(«proc compare»).
Kan f.eks. brukes når man har gjort en kodeendring og vil finne ut
om datasettene fortsatt er like.
(Ikke nytt også i EG 4.3)
Vise valgene som er mulig sammenligning basert på id eller rad
for rad:
- Cars
- Lage kopi av Cars
- Compare, Match data by «Observations»
- Ser at alle like
- Så sortere Cars f.eks. på Engine size
- Compare, Match data by «Observations»
- Ikke like
- Compare, Match data by «ID Variables» velg: Make og
Model ->duplikater
- Compare, Match data by «ID Variables» velg: Make, Model
og Drive Train
- Best om man hadde en unik ID i datasettet.
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
SAS ADD-IN TIL MICROSOFT OFFICE
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
18SAS ADD-IN FOR
MICROSOFT OFFICE INNLEDNING
Hvorfor?
• Normalt raskere å benytte SAS Server enn laptop
• Eksportere data direkte til Excel pivot tabell
• «Refresh» for å oppdatere data
• Fjerne link til data om ønsker at data ikke oppdateres
• Excel kan brukes til å editere tabeller («Begin Edit», husk «Commit»)
• Kan bruke tabeller som er lengre enn Excels begrensning, eksempel
Excel 2013 har maksimum 1.048.576 rader, men i SAS menyen kan vi
gjøre analyser på datasett som har flere rader enn dette.
• Tilgang til «Tasks» som vi kjenner fra EG i Excel
• Åpne VA rapporter fra Excel/PowerPoint/Word
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
19SAS ADD-IN FOR
MICROSOFT OFFICE QUICK STATS I EXCEL
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
20SAS ADD-IN FOR
MICROSOFT OFFICE ÅPNE VA RAPPORT – FØRST DEFINERE CONNECTION
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
21SAS ADD-IN FOR
MICROSOFT OFFICE ÅPNE VA RAPPORT
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
SAS ENTERPRISE GUIDE 7.1
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
23
EG 7.1 NY FUNKSJONALITET
• EG 7.1 støtter integrasjon med SAS Visual Analytics 6.2, 6.3, 6.4 og 7.1
• Søke i prosjekt
• Søke etter task (navn, prosedyre, nøkkelord)
• Nytt prosjekt log vindu «Log Summary», aggregert liste over alle meldinger generert i
prosjektet
• Ny program historikk (spore endringer)
• Kopiere og lime inn process flows
• Kan kjøre SAS Studio tasks i EG (hvis installert SAS Studio og Internet Explorer 10
eller senere)
• Kan nå åpne query builder når merket flere tabeller (automatisk join)
• Når merker et ord, så merket gjennom hele koden
• Ny «Upload to LASR» (Tasks + Data) slik at man kan laste opp data til SAS LASR
server slik at dataene kan nås fra SAS Visual Analytics
• Macro variable viewer, makrovariablene definert i inneværende SAS sesjon (Tools)
• SAS Systems Options viewer, system options for inneværende SAS sesjon (Tools +
System Options Viewer)
• Favorites
http://support.sas.com/software/products/guide/index.html
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
24
EG 7.1 SØKE I PROSJEKT ELLER ETTER TASK
Eksempel: søke på proc contents.
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
25
EG 7.1 LOG SUMMARY
View + «Log Summary»
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
26
EG 7.1 PROGRAM HISTORIKK
Når man har gjort en endring:
Velg «Commit»: Kan legge inn beskrivelse.
«Changes» for å se på endringer siden forrige «Commit».
For å se de ulike versjonene klikk på «History»
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
27
EG 7.1 PROGRAM HISTORIKK
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
28
EG 7.1 MACRO VARIABLE VIEWER
Velg:Tools + SAS
Macro Variable Viewer
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
29
EG 7.1 FAVORITES
EG 7.1
EG 4.3
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
30
EG 7.1 SYSTEM OPTIONS VIEWER
Tools + System Options Viewer
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
PROC FCMP
LAGE EGENDEFINERTE FUNKSJONER
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
32
PROC FCMP EGENDEFINERTE FUNKSJONER
Hva er proc FCMP?
• FCMP akronym for “Function Compiler”
• Lage funksjoner vha data steg syntaks
• Lagre funksjoner data steg
• Kalle funksjonene fra data steg akkurat som man gjør med “ordinære”
SAS funksjoner
• Nestede funksjoner
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
33
PROC FCMP EGENDEFINERTE FUNKSJONER
Før SAS 9.2 – begrenset til product proc’er
SAS/STAT
SAS/ETS
SAS/OR
Fra SAS 9.2 brukes i datasteg
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
34
PROC FCMP EGENDEFINERTE FUNKSJONER
Fordeler:
- Mer oversiktlig kode
- Nestede funksjoner
- Gjenbrukbare funksjoner
- Enkelt, ligner en del på egendefinerte funksjoner i Visual Basic
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
35
PROC FCMP EGENDEFINERTE FUNKSJONER
Syntaks:
PROC FCMP OUTLIB = LIBNAME.DATASET.PACKAGE;
FUNCTION FUNCTION-NAME (ARGUMENT... ARGUMENT);
... Program Statements...
RETURN (EXPRESSION);
ENDSUB;
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
36
PROC FCMP EGENDEFINERTE FUNKSJONER
Eksempel:
Det som settes inn som «label» finner vi som «Description».
(Kopiert fra VBA – kun litt endringer i syntaks.)
proc fcmp outlib=sasuser.fun.functions;
function my(a, b, logc, x)
label='Dødsintensitet for en x-åring';
return ( a + b * 10 ** (logc * x));
endsub;
run;
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
37
PROC FCMP EGENDEFINERTE FUNKSJONER
Library
Table
Package
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
38
PROC FCMP EGENDEFINERTE FUNKSJONER
Får fram funksjonen ved å dobbelklikke på den. Funksjonene kan redigeres her. Men kanskje man
heller ønsker vedlikehold via et EG-prosjekt?
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
VEDLEGG
EG – KODE, PROC FCMP
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
40
PROC FCMP KODE LAGE EGENDEFINERTE FUNKSJONER
proc fcmp outlib=sasuser.fun.functions;
function my(a, b, logc, x) label='Dødsintensitet for en x-åring';
return ( a + b * 10 ** (logc * x));
endsub;
function lx(a, b, logc, x) label='Antall levende x-åringer';
return (10 ** (5 - b / (logc) * ((0.4342944818) ** 2) * (((10 ** logc))** (x) - 1) -
(x) * a * 0.4342944818));
endsub;
function ETx(a, b, logc, x) label='Forventet gjenstående levetid for en x-åring';
omega = 110;
element = 0;
do tau = 0 To (omega - x);
element = element + my(a, b, logc, x + tau) * lx(a, b, logc, x + tau) /
lx(a, b, logc, x) * tau;
end;
return (element - 0.5 * (my(a, b, logc, omega) * lx(a, b, logc, omega) /
lx(a, b, logc, x) * (omega - x)));
endsub;
run;
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
41
PROC FCMP KODE KALLE EGENDEFINERTE FUNKSJONER I DATASTEG
options cmplib=sasuser.fun;
data work.alderdata;
input obs_nr alder;
datalines;
1 0
2 10
3 20
4 30
5 40
6 50
7 60
8 70
9 80
10 90
11 100
12 110
run;
data work.Forventet_levetid;
set work.alderdata;
Forventet_rest_liv=ETx(0, 0.000027, 0.042, alder);
run;
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
42
PROC FCMP RESULTAT
Resultat ved å kjøre koden på siden foran:
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
43
PROC FCMP RESULTAT
Vise hvordan man i EG lister ut hvilke funksjoner man har laget:
proc fcmp listfuncs inlib=sasuser.fun;
run;
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
SAS STUDIO
VISES HVIS SPØRSMÅL
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
45
EG 7.1 SAS STUDIO
Hva er SAS Studio?
• Web basert programmerings brukergrensesnitt til SAS (slippe
installasjon på den enkeltes pc)
• Skrive egne programmer, bruke «Tasks»
• HTML 5 basert
• Front end for SAS University Edition
• SAS 9.4 (juni 2013)
http://support.sas.com/software/products/sasstudio/
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
46
EG 7.1 SAS STUDIO 3.2
Web basert. Task som vi kjenner fra EG kan enkelt brukes. Klikk mannen som løper!
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
47
EG 7.1 SAS STUDIO 3.2
Tilbake til nyheter EG 7.1
Copyr i g ht © 2015, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
48