ausgleichungsrechnung ii gerhard navratil regression und kollokation regression –lineare...

Ausgleichungsrechnung IIGerhard Navratil

Regression und Kollokation

• Regression– Lineare Regression

• Kovarianzfunktion

• Kollokation– Ansatz– Schätzung der Zielfunktion– Anwendung


Regression

• Bisher funktionaler Zusammenhang zwischen Beobachtungen und Unbekannten gegeben

• Nicht bekannt z.B. bei– Zusammenhang Getreideertrag – Düngermenge– Zusammenhang Ausgaben für Bücher –

Schulbildung– Zusammenhang m2-Preis – Widmung– Zusammenhang Differenz Soll-Ist-Strecke und

Streckenlänge


Begriff ‚Regression‘

• Definiert von Galton – Versuch, die Evolutionstheorie von Darwin zu belegen (Körpergröße von Kindern und ihren Eltern)

• Regression to mediocrity (Rückschritt zum Mittelmaß)


Was ist Regression

• Ausgangslage: Zufallsvariablen X und Y bzw. die Realisierungen xi und yi

• Gesucht: Verteilung von Y (Zielgröße) in Abhängigkeit von X (Einflussgröße)

• Oder: Beobachtungen yi, ‚varianzfreie‘ Parameter xi


Beispiele

• Stochastischer Prozess: Wert der Auto-kovarianzfunktion Cxx(k) ist abhängig von k

• Prädiktion nach kleinsten Quadraten: Wert der Kovarianzfunktion C(s) ist abhängig von s

• Zusammenhang zwischen Gewicht und Körpergröße: Gewicht abhängig, Größe unabhängig


Regression

• Abhängigkeit durch Funktion ausgedrückt:

• Funktionsparameter möglich• Aufgabe: Bestimmung der Funktionsparameter• Vorher notwendig: Festlegung der Art der

Regression– Lineare Regression– Nicht-lineare Regression– Multiple Regression

,XfY


Lineare Regression (1)

• Es gilt: yi+vi=b0+b1x

• Verbesserungen: in y-Richtung gemessener Abstand der yi von der Regressionsgeraden

• Verbesserungen nach rechts gebracht: Residuen

• Matrizenschreibweise: y=Xb+BeobachtungenDesignmatrixUnbekannte Parameter b0 und b1Negative Verbesserungen

(Residuen)



• Stochastisches Modell

• Damit Gewichtsmatrix Einheitsmatrix (Annahme Beobachtungen gleich genau und unkorreliert)

• Parameter nach Methode der kleinsten Quadrate bestimmt, also Tmin

• Lösung:

I20 yy

uns

TT

bb

TT

εεXXQ

yXbεyXXXb

20

1

1

,

,



• Übergang auf Schwerpunktskoordinaten – Translationsterm fällt weg Signifikanz der übrigen Einflussparameter verbessert

• Lösung:

ssx

xy

n

isisixy

n

isix

n

iis

n

iis

xbybs

sb

yyxxn

sxxn

s

xn

yxn

x

1021

11

22

11

,

1

1,

1

1

1,

1

Kovarianz der Zufallsvariablenx und y

Steigung der Regressionsgeraden = Regressionskoeffizient


Regressionskoeffizient

• Positive bzw. negative lineare Regression

• Derselbe Regressionskoeffizient kann verschiedene Datensätze repräsentieren



• Vor Ansatz: Prüfen, ob tatsächlich ein linearer Zusammenhang besteht

• Möglichkeit: Korrelationskoeffizient

• Vorsicht: Scheinkorrelation (Geburten-Störche)


Multiple Regression

• Ansatz auf mehrere Einflussgrößen erweitert: yi=b0+b1x1i+b2x2i+…+buxui±

• Formalen Vorgehen bleibt gleich, Dimension von b ändert sich

• Beispiel: Regressionsebene – Zusammen-hang zwischen Lagekoordinaten und Messwerten gesucht y=b0+b1x+b2y+


Nicht-lineare Regression

• Linearisierung notwendig gute Näherungswerte wichtig

• Sonst wie Methode der kleinsten Quadrate


Wichtig

• Methoden sind nur mathematisch-statistische Betrachtungen!

• Kausale Beurteilung notwendig

• Sonst Sprüche wie:Mit Statistik kann alles bewiesen werden – auch das Gegenteil.


Kovarianzfunktion (1)

• Verhalten von Residuen kann zur Ver-feinerung von Approximationen verwendet werden

• Erhaltensneigung innerhalb eines Feldes

• Gekennzeichnet durch– Korrelationslänge– Form


Kovarianzfunktion (2)

• Typische Ansätze– Linear– Exponentiell– Periodisch

aC

beaC

a

aC

sin


Kollokation

• Bisher: Parameter durch Ausgleichung bestimmt und anschließend Prädiktion

• Kombination dieser Schritte: Kollokation

• Idee: Zerlegung der Beobachtungen in– Systematischer Anteil (Trend)– Unregelmäßiger Anteil (Signal)– Zufällige Messabweichungen (Rauschen)


Kollokationsansatz (1)

• Erweiterung des Regressionsansatzes:y=Xb+s+n

• mit n … Noise (Rauschen = Residuen) s … Signal y … diskrete Beobachtungen Xb . Trend (eig. Regression)



• Stochastisches Modell: 2 Teile– Zufällige Fehler, stochastisch unabhängig

mit D Diagonalmatrix– Signal, korreliert

mit Css voll besetzt, symmetrisch

• Beschreibung des Signals wird für Interpolation benutzt Interpolationsvektor

• Mehrere Punkte: Matrix

DI 20

20 .bzw

ssss C20

jnjjTjs CCC 21c



• Kreuzkovarianzmatrix zwischen n Stütz-stellen und m Prädiktionspunkten

mnmm

n

n

Ps

CCC

CCC

CCC

21

22221

11211

C


Schätzung der Zielfunktion (1)

• Für (n.1)-Vektor von Beobachtungensy+n+Xb-y=0

• sy: Signalanteil aus Messwerten

• Zusätzlich prädizierte Werte yP=XPb+sP

• sP: Stochastisches Signal über Kovarianz-beziehung

• Gleichungssystem0bXs

0yXbns

PP

y

Lage der zu prädizierenden Punkte



• Matrixschreibweise:

• System der Form Bv+Ax-l=0

• Stochastisches Modell

00

yb

X

X

s

n

s

I00

0II

PP

y

m

nn

PPPs

TPsss

yy

C0C

0D0

C0C

Mit w=-l: Allgemeinfall derAusgleichungsrechnung



• Kunstgriff von Moritz: Signal, Trend und Rauschen sind unabhängig von den Interpolationsstellen Zunächst nur oberer Teil betrachtet

• Bedingungsgleichungen

• Normalgleichungssystem

0IIB nn1

00

y

b

k

0X

XBΣB

T

Tyy 11 0

0

y

b

k

0X

XDC

T

ss



• Parametervektor b:

• Korrelatenvektor k:

• (n,1)-Hilfsvektor z mit z=y-Xb=s+n (ent-spricht Verbesserungsvektor bei einfacher Regression) ergibt sich mit Czz=Css+D:

yDCXXDCXb 111 ssT

ssT

XbyDCk 1ss

zCk 1 zz



• Mit Korrelaten Bestimmung von sP über

• Für Einzelkomponenten getrennte Bestimmung

zC

I0

0I

0I

C0C

0D0

C0C

kB

s

n

s1

zz

m

n

n

PPPs

TPsss

Tyy

P

y

zCCs 1 zzssy

zDCn 1 zz

zCCs 1 zzPsP


Anwendung

• Filterung: Verbesserte Approximation des Signals in den Stützstellen, keine Interpolation

• Prädiktion: Gegebene Approximations-funktion, Werte an Interpolationsstellen sollen verbessert werden


Anwendungsbeispiele

• Schweremessungen: Gravimetermessungen mit Messfehlern, Schwereanomalien als Signal

• Satellitenbeobachtungen: Trend ist ‚normale‘ Bahn, Bahnstörungen als Signal

• Transformationen: Trend ist Transformation selbst, Klaffungen sind Signal

ausgleichungsrechnung ii gerhard navratil regression und kollokation regression –lineare...

Documents