ausgleichungsrechnung ii gerhard navratil regression und kollokation regression –lineare...
TRANSCRIPT
Ausgleichungsrechnung IIGerhard Navratil
Regression und Kollokation
• Regression– Lineare Regression
• Kovarianzfunktion
• Kollokation– Ansatz– Schätzung der Zielfunktion– Anwendung
Ausgleichungsrechnung IIGerhard Navratil
Regression
• Bisher funktionaler Zusammenhang zwischen Beobachtungen und Unbekannten gegeben
• Nicht bekannt z.B. bei– Zusammenhang Getreideertrag – Düngermenge– Zusammenhang Ausgaben für Bücher –
Schulbildung– Zusammenhang m2-Preis – Widmung– Zusammenhang Differenz Soll-Ist-Strecke und
Streckenlänge
Ausgleichungsrechnung IIGerhard Navratil
Begriff ‚Regression‘
• Definiert von Galton – Versuch, die Evolutionstheorie von Darwin zu belegen (Körpergröße von Kindern und ihren Eltern)
• Regression to mediocrity (Rückschritt zum Mittelmaß)
Ausgleichungsrechnung IIGerhard Navratil
Was ist Regression
• Ausgangslage: Zufallsvariablen X und Y bzw. die Realisierungen xi und yi
• Gesucht: Verteilung von Y (Zielgröße) in Abhängigkeit von X (Einflussgröße)
• Oder: Beobachtungen yi, ‚varianzfreie‘ Parameter xi
Ausgleichungsrechnung IIGerhard Navratil
Beispiele
• Stochastischer Prozess: Wert der Auto-kovarianzfunktion Cxx(k) ist abhängig von k
• Prädiktion nach kleinsten Quadraten: Wert der Kovarianzfunktion C(s) ist abhängig von s
• Zusammenhang zwischen Gewicht und Körpergröße: Gewicht abhängig, Größe unabhängig
Ausgleichungsrechnung IIGerhard Navratil
Regression
• Abhängigkeit durch Funktion ausgedrückt:
• Funktionsparameter möglich• Aufgabe: Bestimmung der Funktionsparameter• Vorher notwendig: Festlegung der Art der
Regression– Lineare Regression– Nicht-lineare Regression– Multiple Regression
,XfY
Ausgleichungsrechnung IIGerhard Navratil
Lineare Regression (1)
• Es gilt: yi+vi=b0+b1x
• Verbesserungen: in y-Richtung gemessener Abstand der yi von der Regressionsgeraden
• Verbesserungen nach rechts gebracht: Residuen
• Matrizenschreibweise: y=Xb+BeobachtungenDesignmatrixUnbekannte Parameter b0 und b1Negative Verbesserungen
(Residuen)
Ausgleichungsrechnung IIGerhard Navratil
Ausgleichungsrechnung IIGerhard Navratil
Lineare Regression (2)
• Stochastisches Modell
• Damit Gewichtsmatrix Einheitsmatrix (Annahme Beobachtungen gleich genau und unkorreliert)
• Parameter nach Methode der kleinsten Quadrate bestimmt, also Tmin
• Lösung:
I20 yy
uns
TT
bb
TT
εεXXQ
yXbεyXXXb
20
1
1
,
,
Ausgleichungsrechnung IIGerhard Navratil
Lineare Regression (3)
• Übergang auf Schwerpunktskoordinaten – Translationsterm fällt weg Signifikanz der übrigen Einflussparameter verbessert
• Lösung:
ssx
xy
n
isisixy
n
isix
n
iis
n
iis
xbybs
sb
yyxxn
sxxn
s
xn
yxn
x
1021
11
22
11
,
1
1,
1
1
1,
1
Kovarianz der Zufallsvariablenx und y
Steigung der Regressionsgeraden = Regressionskoeffizient
Ausgleichungsrechnung IIGerhard Navratil
Regressionskoeffizient
• Positive bzw. negative lineare Regression
• Derselbe Regressionskoeffizient kann verschiedene Datensätze repräsentieren
Ausgleichungsrechnung IIGerhard Navratil
Lineare Regression (4)
• Vor Ansatz: Prüfen, ob tatsächlich ein linearer Zusammenhang besteht
• Möglichkeit: Korrelationskoeffizient
• Vorsicht: Scheinkorrelation (Geburten-Störche)
Ausgleichungsrechnung IIGerhard Navratil
Multiple Regression
• Ansatz auf mehrere Einflussgrößen erweitert: yi=b0+b1x1i+b2x2i+…+buxui±
• Formalen Vorgehen bleibt gleich, Dimension von b ändert sich
• Beispiel: Regressionsebene – Zusammen-hang zwischen Lagekoordinaten und Messwerten gesucht y=b0+b1x+b2y+
Ausgleichungsrechnung IIGerhard Navratil
Nicht-lineare Regression
• Linearisierung notwendig gute Näherungswerte wichtig
• Sonst wie Methode der kleinsten Quadrate
Ausgleichungsrechnung IIGerhard Navratil
Wichtig
• Methoden sind nur mathematisch-statistische Betrachtungen!
• Kausale Beurteilung notwendig
• Sonst Sprüche wie:Mit Statistik kann alles bewiesen werden – auch das Gegenteil.
Ausgleichungsrechnung IIGerhard Navratil
Kovarianzfunktion (1)
• Verhalten von Residuen kann zur Ver-feinerung von Approximationen verwendet werden
• Erhaltensneigung innerhalb eines Feldes
• Gekennzeichnet durch– Korrelationslänge– Form
Ausgleichungsrechnung IIGerhard Navratil
Kovarianzfunktion (2)
• Typische Ansätze– Linear– Exponentiell– Periodisch
aC
beaC
a
aC
sin
Ausgleichungsrechnung IIGerhard Navratil
Kollokation
• Bisher: Parameter durch Ausgleichung bestimmt und anschließend Prädiktion
• Kombination dieser Schritte: Kollokation
• Idee: Zerlegung der Beobachtungen in– Systematischer Anteil (Trend)– Unregelmäßiger Anteil (Signal)– Zufällige Messabweichungen (Rauschen)
Ausgleichungsrechnung IIGerhard Navratil
Ausgleichungsrechnung IIGerhard Navratil
Kollokationsansatz (1)
• Erweiterung des Regressionsansatzes:y=Xb+s+n
• mit n … Noise (Rauschen = Residuen) s … Signal y … diskrete Beobachtungen Xb . Trend (eig. Regression)
Ausgleichungsrechnung IIGerhard Navratil
Kollokationsansatz (2)
• Stochastisches Modell: 2 Teile– Zufällige Fehler, stochastisch unabhängig
mit D Diagonalmatrix– Signal, korreliert
mit Css voll besetzt, symmetrisch
• Beschreibung des Signals wird für Interpolation benutzt Interpolationsvektor
• Mehrere Punkte: Matrix
DI 20
20 .bzw
ssss C20
jnjjTjs CCC 21c
Ausgleichungsrechnung IIGerhard Navratil
Kollokationsansatz (3)
• Kreuzkovarianzmatrix zwischen n Stütz-stellen und m Prädiktionspunkten
mnmm
n
n
Ps
CCC
CCC
CCC
21
22221
11211
C
Ausgleichungsrechnung IIGerhard Navratil
Schätzung der Zielfunktion (1)
• Für (n.1)-Vektor von Beobachtungensy+n+Xb-y=0
• sy: Signalanteil aus Messwerten
• Zusätzlich prädizierte Werte yP=XPb+sP
• sP: Stochastisches Signal über Kovarianz-beziehung
• Gleichungssystem0bXs
0yXbns
PP
y
Lage der zu prädizierenden Punkte
Ausgleichungsrechnung IIGerhard Navratil
Schätzung der Zielfunktion (2)
• Matrixschreibweise:
• System der Form Bv+Ax-l=0
• Stochastisches Modell
00
yb
X
X
s
n
s
I00
0II
PP
y
m
nn
PPPs
TPsss
yy
C0C
0D0
C0C
Mit w=-l: Allgemeinfall derAusgleichungsrechnung
Ausgleichungsrechnung IIGerhard Navratil
Schätzung der Zielfunktion (3)
• Kunstgriff von Moritz: Signal, Trend und Rauschen sind unabhängig von den Interpolationsstellen Zunächst nur oberer Teil betrachtet
• Bedingungsgleichungen
• Normalgleichungssystem
0IIB nn1
00
y
b
k
0X
XBΣB
T
Tyy 11 0
0
y
b
k
0X
XDC
T
ss
Ausgleichungsrechnung IIGerhard Navratil
Schätzung der Zielfunktion (4)
• Parametervektor b:
• Korrelatenvektor k:
• (n,1)-Hilfsvektor z mit z=y-Xb=s+n (ent-spricht Verbesserungsvektor bei einfacher Regression) ergibt sich mit Czz=Css+D:
yDCXXDCXb 111 ssT
ssT
XbyDCk 1ss
zCk 1 zz
Ausgleichungsrechnung IIGerhard Navratil
Schätzung der Zielfunktion (5)
• Mit Korrelaten Bestimmung von sP über
• Für Einzelkomponenten getrennte Bestimmung
zC
I0
0I
0I
C0C
0D0
C0C
kB
s
n
s1
zz
m
n
n
PPPs
TPsss
Tyy
P
y
zCCs 1 zzssy
zDCn 1 zz
zCCs 1 zzPsP
Ausgleichungsrechnung IIGerhard Navratil
Anwendung
• Filterung: Verbesserte Approximation des Signals in den Stützstellen, keine Interpolation
• Prädiktion: Gegebene Approximations-funktion, Werte an Interpolationsstellen sollen verbessert werden
Ausgleichungsrechnung IIGerhard Navratil
Anwendungsbeispiele
• Schweremessungen: Gravimetermessungen mit Messfehlern, Schwereanomalien als Signal
• Satellitenbeobachtungen: Trend ist ‚normale‘ Bahn, Bahnstörungen als Signal
• Transformationen: Trend ist Transformation selbst, Klaffungen sind Signal