chybějící hodnoty
DESCRIPTION
Semináře ke kurzu Analytické metody výzkumu Jindřich Krejčí. Chybějící hodnoty. Chybějící hodnoty - co s nimi?. neprovádět analýzu aplikovat teoreticky zdůvodněné postupy vyřazení proměnných nebo objektů z analýzy vyhledání alternativních dat jednoduché způsoby nahrazení: - PowerPoint PPT PresentationTRANSCRIPT
ISSChybějící hodnoty
Semináře ke kurzuSemináře ke kurzu
Analytické metody výzkumuAnalytické metody výzkumuJindřich KrejčíJindřich Krejčí
ISS Str. Str. 22
Chybějící hodnoty - co s nimi?
neprovádět analýzu
aplikovat teoreticky zdůvodněné postupy
• vyřazení proměnných nebo objektů z analýzy
• vyhledání alternativních dat
• jednoduché způsoby nahrazení:• průměry, klouzavé průměry, medián, sousední hodnoty, ...
• analýza missing values -> odhad hodnot
ISS Str. Str. 33
MVA (Missing Values Analysis)
popis a posouzení struktury souboru a chybějících hodnot (průměry, kovarianční matice, korelace, regrese, odhady)
odhad chybějících hodnotnový datový soubor s odhadnutými hodnotami
• určení kategorických proměnných
• provede se série t-testů průměrů mezi skupinami
• analýza počtu chybějících a nechybějících hodnot (tabulky)
• další statistiky
• odhady: EM nebo regrese
ISS Str. Str. 44
MVA [VARIABLES =] {varlist}{ALL } [/CATEGORICAL = varlist] [/MAXCAT = {25**}{n }] [/ID = varname]Description: [/NOUNIVARIATE] [/TTEST [PERCENT = {5}] [{T }] [{DF } [{PROB }]... [/CROSSTAB [PERCENT = {5}{n}]] [/MISMATCH [PERCENT = {5}{n}] [NOSORT]] [/DPATTERN [SORT = varname[({ASCENDING })] [varname ... ]] ... [/MPATTERN [NOSORT] [DESCRIBE = varlist]] [/TPATTERN [NOSORT] [DESCRIBE = varlist] [PERCENT={1}{n}]]Estimation: [/LISTWISE] [/PAIRWISE] [/EM [predicted_varlist] [WITH predictor_varlist]... [OUTFILE ='file' ])] [/REGRESSION [predicted_varlist] [WITH predictor_varlist]... [OUTFILE = 'file' ])]].
ISS Str. Str. 55
ISSSemináře, listopad 2011Semináře, listopad 2011Jindřich Krejčí: Analytické metody výzkumuJindřich Krejčí: Analytické metody výzkumu Str. Str. 66
MVA
lifeexp infmort health hrswrk prison gdp gdpgrow services labor region
/MAXCAT = 25
/ID = country
/CATEGORICAL = region
/EM ( TOLERANCE=0.001 CONVERGENCE=0.0001 ITERATIONS=25 OUTFILE='E:\A06 MVS\dataNEW.sav' ) .