silvia arcelli 1 metodi di ricostruzione in fisica subnucleare corso di metodologie informatiche...

50
Silvia Arcelli 1 Metodi di Metodi di Ricostruzione in Ricostruzione in Fisica Subnucleare Fisica Subnucleare Corso di Metodologie Informatiche Corso di Metodologie Informatiche Avanzate Avanzate Per la Fisica Nucleare e Per la Fisica Nucleare e Subnucleare Subnucleare A.A. 2009/2010 A.A. 2009/2010 III Lezione, 11/11/09 III Lezione, 11/11/09

Upload: eustorgio-stella

Post on 01-May-2015

213 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

Silvia Arcelli 1

Metodi di Metodi di Ricostruzione in Ricostruzione in

Fisica SubnucleareFisica SubnucleareCorso di Metodologie Informatiche Corso di Metodologie Informatiche

AvanzateAvanzate

Per la Fisica Nucleare e SubnuclearePer la Fisica Nucleare e Subnucleare

A.A. 2009/2010A.A. 2009/2010

III Lezione, 11/11/09III Lezione, 11/11/09

Page 2: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

2

Silvia Arcelli

Sommario della scorsa Sommario della scorsa lezione:lezione:

• Metodi di riconoscimento di tracciaMetodi di riconoscimento di traccia (pattern (pattern recognition):recognition):

• Metodi Globali → Template Matching, Metodi Globali → Template Matching, MST, MST, Fuzzy Radon (Hough) Transform, Fuzzy Radon (Hough) Transform, Neural NetworksNeural Networks

• Metodi Locali: il track followingMetodi Locali: il track following

Page 3: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

3

Silvia Arcelli

In questa lezione:In questa lezione:

• Track Fitting:Track Fitting: • Track Fit - generalitàTrack Fit - generalità• Track Model: Track Model:

• Parametrizzazione della tracciaParametrizzazione della traccia• Effetti del materialeEffetti del materiale

• Kalman FilterKalman Filter: un metodo recursivo di track : un metodo recursivo di track finding e fitting simultaneofinding e fitting simultaneo

Page 4: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

4

Silvia Arcelli

Track Fitting Track Fitting Dopo il track finding, si vuole estrarre dal set di

misure associatealla traccia suoi parametri (origine, direzioni e

impulso/carica al piano di riferimento). Il LSM (Minimizzazione

del 2 ) è ilmetodo generalmente adottato :

N2

i

2ii2

σ

))λ(f(mχ

)λ(f

σ

m

λ

i

i

i

Vettore dei parametri di traccia

Misura i-esima di posizione

Incertezza sulla misura i-esima

Valore previsto della misura i-esima sulla base del track Model, in funzione dei parametri della traccia

Page 5: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

5

Silvia Arcelli

Track FittingTrack FittingNotazione Matriciale:

))λ(fm(V))λ(fm(χ 1T2

Condizione di minimo :0λd

dχ 2

mVFfVF 1T1T j

iij λ

)λ(fF

F è la matrice delle derivate:

2i

1ii

σ

1V

con

diagonale: •incertezze non correlate •misure gaussiane

Si assume inoltre

0λd

dV

Page 6: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

6

Silvia Arcelli

Track FittingTrack FittingSe il track model è lineare (N.B: nei parametri!)

allora e: λFf

11T

1T11T

F)V(F)λcov(

mVFF)V(Fλ

Per dim. vedere ad

esempio: “Data Analysis

Techniques for High

Energy Physiscs”, R.

Fruhwirth et al, p.232,

(Cambridge Univ. Press)

Page 7: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

7

Silvia Arcelli

Track FittingTrack Fitting

Soluzione esplicita

Se gli errori di misura sono gaussiani, gli errori sui parametri sono gaussiani (i parametri di traccia sono una funzione

lineare delle misure)

Il LSM fornisce un estimatore non biassato ed efficiente, cioè di minima varianza

Test Statistics: 2, pulls (validazione dei candidati di traccia)

Vantaggi di avere un Track Model Lineare:

Page 8: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

8

Silvia Arcelli

Track FittingTrack FittingUn esempio banale di fit globale con track model lineare:

tracciain un piano in assenza di campo magnetico:

b

n

2

0

y

y

y

m

N

1

0

z1

z1

z1

F

Track model:(zr=0)

ii bza)λ(f

N i2

2ii

N i2

2ii2

σ

)bza(y

σ

))λ(f(yχ

Applicando:

11T

1T11T

F)V(F)λcov(mVFF)V(Fλ

Si arriva alle note formuledi regressione lineare

Page 9: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

9

Silvia Arcelli

Track Model-Equazioni del Track Model-Equazioni del MotoMoto

)x(Bvqdt

pd

costantev

0vF

c

Moto di una particella carica in un campo magnetico statico B(x)Moto di una particella carica in un campo magnetico statico B(x)::

PoichèPoichè

)x(Bds

xd

P

q

ds

xd2

2

Si può eliminare la dipendenza esplicita dal Si può eliminare la dipendenza esplicita dal tempo esprimendotempo esprimendol’equazione in funzione della distanza lungo la l’equazione in funzione della distanza lungo la traiettoria, s=traiettoria, s=ct.ct.

Se B é Se B é uniformeuniforme, la soluzione (analitica) é un’elica , la soluzione (analitica) é un’elica cilindrica. Se cilindrica. Se il campo è significativamente non uniforme, il campo è significativamente non uniforme, occorre risolvere l’equazione utilizzando metodi occorre risolvere l’equazione utilizzando metodi numerici.numerici.

Page 10: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

10

Silvia Arcelli

Track Model-Equazioni Track Model-Equazioni del Motodel Moto

Principali configurazioni di campo magnetico negli esperimenti:

Campo uniforme lungo z (asse dei fasci), simmetria cilindrica, piani di misura a R=cost

(Geometria a Collider)

Campo uniforme lungo x, rivelatore planare con layer

(xy) lungo z(Geometria a Bersaglio Fisso)

Deflessione in xy (ρ) Deflessione in yz

Page 11: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

11

Silvia Arcelli

Track Model-Elica Track Model-Elica CilindricaCilindrica

)sign(qB)h ,cos

qRP(con

,sin)(

],sin)cos

sin([)(

],cos)cos

cos([)(

H

0

000

000

B

szsz

RhsRysy

RhsRxsx

HH

HH

Equazione parametrica dell’elica cilindrica (B lungo z)Equazione parametrica dell’elica cilindrica (B lungo z)::

Sei parametriSei parametri (tre equazioni differenziali del (tre equazioni differenziali del secondo ordine...). secondo ordine...).

B

Page 12: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

12

Silvia Arcelli

Track Model-Elica Track Model-Elica CilindricaCilindrica

2200

200 )sin()cos( HHH RRyyRxx

T

L

P

Ptan

0

•RRH H é il raggio dell’elicaé il raggio dell’elica

• è legato alla pendenza è legato alla pendenza delladella tangente alla tangente alla circonferenza a s=0,circonferenza a s=0,

•λ é il “dip angle”: é il “dip angle”:

La proiezione in xy è un La proiezione in xy è un cerchio:cerchio:

H H

•x0,y0,z0 sono le coordinate a s=0x0,y0,z0 sono le coordinate a s=0

200

Page 13: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

13

Silvia Arcelli

Track Model-Parametri Track Model-Parametri della tracciadella traccia

Tuttavia, una volta fissata una superficie di riferimento Tuttavia, una volta fissata una superficie di riferimento (ad esempio, in R o in z), la traiettoria è descritta da solo (ad esempio, in R o in z), la traiettoria è descritta da solo cinque parametri indipendenti cinque parametri indipendenti (scelta del pivot).(scelta del pivot).

H

r

r

r

r

Rp

pp

zpRp

/1

tan

5

4

3

2

1

Simmetria cilindrica (collider),riferimento: cilindro raggio R quanto più prossimo al vertice di interazione :

Punto impatto

direzioni

impulso

Page 14: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

14

Silvia Arcelli

Track Model-Parametri Track Model-Parametri della tracciadella traccia

H

r

r

r

r

Rp

zzdz

dyp

zzdz

dxp

ypxp

/1

)(

)(

5

4

3

2

1

•Simmetria planare (Bersaglio fisso): il riferimento è in genereun piano a z=cost (vicino al vertice)

Punto impatto

direzioni

momento

•In assenza di campo magnetico, la traiettoria è una retta e sono ovviamente necessari solo quattro parametri (l’impulso è indefinito)

Page 15: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

15

Silvia Arcelli

Track FittingTrack Fitting

L’elica cilindrica non è lineare nei parametri di traccia, ma se

si sceglie la parametrizzazione in modo opportuno, di fatto “localmente” è lineare con una buona approssimazione.

Per localmente si intende che le distanze entro cui assumo che il track model sia lineare sono piccole rispetto al

raggio dell’elica. In questo caso le proprietà del track model

lineare sono in gran parte preservate.

Page 16: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

16

Silvia Arcelli

Track FittingTrack FittingQuindi, in presenza di track model ~lineare, ci si

riconduce ad un problema piuttosto semplice, con una soluzione

esplicita:

Inversione di matrici di dimensione uguale al Inversione di matrici di dimensione uguale al numero massimonumero massimo

di parametri di traccia (n=5). Come cambia di parametri di traccia (n=5). Come cambia quando includoquando includo

l’effetto dei materiali (Scattering Multiplo, perdita l’effetto dei materiali (Scattering Multiplo, perdita di Energia,...)? di Energia,...)?

mVFF)V(Fλ 1T11T

( N x N), diagonale (N x 5) (5 x N)

(N x 1) (5 x 1)

Page 17: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

17

Silvia Arcelli

Track Model-Effetti del Track Model-Effetti del MaterialeMateriale

Multiple Scattering: non cambia il valore assoluto dell’impulso,

ma influenza la direzione della particella.

In media, su molti scattering elementari ci si aspetta una deviazione nulla. Non si applica una correzione esplicita alla descrizione parametrica della traiettoria (f)

Nel fit di traccia , si introducono ulteriori incertezze sulla posizione della traccia sull’i-esimo layer di misura, correlate tra le misure nei differenti layer. Questo implica la comparsa di termini non diagonali nella matrice di

covarianza V delle misure (altrimenti assunte indipendenti)

Page 18: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

18

Silvia Arcelli

Multiple ScatteringMultiple Scattering

2MSi

2ik

2MSj

2jk

2kkk

2MSi

2ij

2jjj

2iii

)()z(z)()z(zσV)()z(z σ V

σ V

Elementi diagonali della Matrice di Covarianza:

Direzione di volodella particella

Page 19: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

19

Silvia Arcelli

Multiple ScatteringMultiple Scattering

Elementi off-diagonal della Matrice di Covarianza:

Direzione di volodella particella

2MSiijikjk

ik

ij

))(z)(zz(z0V0V0 V

Page 20: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

20

Silvia Arcelli

Multiple ScatteringMultiple Scattering

0

2MS X

d

βp

MeV/c13.6θ

XX00 MSMS

Si (300 Si (300 μμm)m)

9.4 9.4 cmcm

0.8 100.8 10-3-3

Argon Argon (1m)(1m)

110 m110 m 1 101 10-3-3

Pioni con impulso 1 GeV/c:

Se consideriamo un rivelatore a silicio con layer di spessore 300 300 μμmm, e una distanza da layer a layer di 10 cm, l’incertezza indotta dal MS per pioni da 1 GeV/c a incidenza normale è ~80 μm, confrontabile con la precisione del rivelatore.

Questi termini sono significativi?

Page 21: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

21

Silvia Arcelli

Multiple ScatteringMultiple Scattering•Scala come 1/p, contributo dominante per particelle di basso impulso!

•Lo spessore effettivo d aumenta con l’angolazione della traccia rispetto al piano del materiale

Atlas Pixel Detector “Material Budget”

Page 22: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

22

Silvia Arcelli

Multiple ScatteringMultiple ScatteringUn altro metodo a volte usato per tener conto nel fit del MS èquello dei “Break-Points”: in pratica, si introducono nel fit ditraccia altri parametri liberi (angoli) in corrispondenza delle superfici di scattering:

))θ,λf(m(V))θ,λf(m()θ,λ(χ bp1T

bpbp2

Numero di parametri extra = numero di superfici di scattering, per N elevato è impraticabile. La sua applicazione sono i casi in cui si ha un numero limitato di superfici (attive o passive) incui ci aspetta un forte effetto di MS.

Page 23: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

23

Silvia Arcelli

Perdita di EnergiaPerdita di EnergiaPerdita di energia per ionizzazione : non cambia la direzione, ma l’impulso. In seguito ad una perdita di energia in uno strato d di materiale, la curvatura aumenta:

effettivo"" spessored ,R

1C

d),)dx

dE(

βp

1C(1C

H

IP

Nel fit di traccia:•Correzione a C su ogni layer di materiale •In genere si trascurano le fluttuazioni sulla dE/dx (non si modifica la matrice di covarianza).

Page 24: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

24

Silvia Arcelli

Perdita di EnergiaPerdita di Energia

densitàdensità

(g cm(g cm-3)-3)

dE dE (MeV(MeV

))Si (300 Si (300

μμm)m)2.332.33 0.140.14

Argon Argon (1m)(1m)

1.8 101.8 10-3-3 0.360.36

Per Pioni con impulso 1 GeV/c:

E’ molto piccolo, relativamente all’impulso iniziale. Per MIP la correzione può essere rilevante se nel volume di tracking la traccia attraversa uno strato significativo di materiale passivo denso. In particolare, nel tracking di muoni.

Quanto è grande questo effetto, per MIP?

21 cmgMeV 2(MIP)dx

dE

Page 25: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

25

Silvia Arcelli

Perdita di EnergiaPerdita di Energia

Protoni con impulso 0.2 GeV/c (=0.2)

La perdita di energia è significativamente maggiore per particelle di impulso più basso, e pesanti. Ad esempio:

In Si (300 In Si (300 μμm): 1 MeV. Correzione dello m): 1 MeV. Correzione dello ~0.5~0.5% % su ogni layer. su ogni layer. N.B. Per applicarla correttamente dovrei N.B. Per applicarla correttamente dovrei conoscere la massa!conoscere la massa!

Page 26: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

26

Silvia Arcelli

Track Model-Effetti del Track Model-Effetti del MaterialeMateriale

In entrambi i casi, MS e dE/dx, la trattazione degli In entrambi i casi, MS e dE/dx, la trattazione degli effetti deleffetti del

materiale nel fit dipende 1) dai parametri della traccia materiale nel fit dipende 1) dai parametri della traccia (angoli(angoli

di incidenza, impulso) e 2) dalla massa (che è in genere di incidenza, impulso) e 2) dalla massa (che è in genere ignota, ignota,

a questo livello). a questo livello).

Si può adottare una procedura iterativa (prima stima Si può adottare una procedura iterativa (prima stima dei parametri senza correzione, si calcola la dei parametri senza correzione, si calcola la correzione, si ripete il fit, e così via fino alla correzione, si ripete il fit, e così via fino alla convergenza). convergenza).

Si esegue il fit con diverse ipotesi di massa (Si esegue il fit con diverse ipotesi di massa (ππ,k,p,...) ,k,p,...) che possono essere ulteriormente discriminate che possono essere ulteriormente discriminate utilizzando l’ informazione di PID del tracking (se utilizzando l’ informazione di PID del tracking (se presente)presente)

Page 27: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

27

Silvia Arcelli

Track Model-Effetti del Track Model-Effetti del MaterialeMateriale

In generale, la trattazione degli effetti di materiale In generale, la trattazione degli effetti di materiale in un fit di traccia globale è complessa e pesante in un fit di traccia globale è complessa e pesante dal punto di vista computazionale. dal punto di vista computazionale.

In particolare, la matrice V non è più diagonale, e In particolare, la matrice V non è più diagonale, e questo comporta l’inversione di matrici N x N, (N questo comporta l’inversione di matrici N x N, (N il numero di misure), operazione che scala come il numero di misure), operazione che scala come NN33

Inoltre, il risultato del fit corrisponde alla miglior Inoltre, il risultato del fit corrisponde alla miglior stima stima

dei parametri della traccia alla superficie di dei parametri della traccia alla superficie di riferimento, e riferimento, e

la traiettoria estrapolata non segue in dettaglio la la traiettoria estrapolata non segue in dettaglio la traiettoria reale della traccia (MS).traiettoria reale della traccia (MS).

Page 28: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

28

Silvia Arcelli

Kalman FilterKalman Filter R.E.Kalman (“R.E.Kalman (“A new approach to linear A new approach to linear

filtering and prediction problemsfiltering and prediction problems” Trans. ” Trans. ASME J. Basic Eng. 82 (1960), 35): metodo ASME J. Basic Eng. 82 (1960), 35): metodo recursivo per stimare gli stati di un sistema recursivo per stimare gli stati di un sistema dinamico sulla base ad una serie di misure. dinamico sulla base ad una serie di misure.

Introdotto in fisica subnucleare (1984) da P. Introdotto in fisica subnucleare (1984) da P. Billoir sotto il nome di “Progressive Fit”, Billoir sotto il nome di “Progressive Fit”, sviluppato ulteriormente da sviluppato ulteriormente da

R.FrR.Früühwirth e M. Regler.hwirth e M. Regler.

Nel contesto del track finding, il Kalman Nel contesto del track finding, il Kalman Filter è la stima dello stato della traccia in Filter è la stima dello stato della traccia in corrispondenza di un numero corrispondenza di un numero

finito di superfici, su cui sono finito di superfici, su cui sono eventualmente disponibili delle misure.eventualmente disponibili delle misure.

Page 29: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

29

Silvia Arcelli

Kalman FilterKalman Filter Metodo recursivo di Metodo recursivo di track finding e fitting track finding e fitting

simultaneosimultaneo

Si dimostra che è equivalente ad una procedura Si dimostra che è equivalente ad una procedura globale di globale di minimizzazione di minimizzazione di 22, con le stesse , con le stesse proprietè del LSMproprietè del LSM

Costo computazionale limitato, massima Costo computazionale limitato, massima dimensione delle matrici pari a quelle del vettore dimensione delle matrici pari a quelle del vettore dei parametri della tracciadei parametri della traccia

E’ in grado di fornisce la stima E’ in grado di fornisce la stima ottimale ottimale dei dei

parametri della traccia in ogni punto della parametri della traccia in ogni punto della traiettoria traiettoria

Page 30: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

30

Silvia Arcelli

Kalman FilterKalman FilterUna traccia è rappresentata da un set di Una traccia è rappresentata da un set di parametri, che nel formalismo del Kalman parametri, che nel formalismo del Kalman Filter vengono raggruppati in quello che si Filter vengono raggruppati in quello che si definisce lo definisce lo “StateVector”:“StateVector”:

Lo stato evolve su un insieme di valori, Lo stato evolve su un insieme di valori, secondo una componente deterministica ed secondo una componente deterministica ed una componente stocastica. una componente stocastica. Il Kalman Filter è la procedura utilizzata per Il Kalman Filter è la procedura utilizzata per determinare lo stato della traccia in determinare lo stato della traccia in corrispondenza di un numero finito N corrispondenza di un numero finito N di posizioni (i layer di misura del rivelatore), di posizioni (i layer di misura del rivelatore), sulla base di N misure, tenendo anche conto di sulla base di N misure, tenendo anche conto di processi stocastici.processi stocastici.

x

Page 31: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

31

Silvia Arcelli

Kalman FilterKalman Filter Il Kalman Filter è un estimatore recursivo, Il Kalman Filter è un estimatore recursivo,

cioè per fornire la stima dello State Vector cioè per fornire la stima dello State Vector allo step k+1 sono necessari unicamente allo step k+1 sono necessari unicamente la stima dello State Vector allo step k, e il la stima dello State Vector allo step k, e il vettore di misura allo step k+1.vettore di misura allo step k+1.

Questo nell’ambito di una serie di Questo nell’ambito di una serie di assunzioni generali (che corrispondono assunzioni generali (che corrispondono sostanzialmente ad avere un modello di sostanzialmente ad avere un modello di traccia lineare, e processi stocastici che traccia lineare, e processi stocastici che non diano un bias sulla stima dei non diano un bias sulla stima dei parametri dello State Vector)parametri dello State Vector)

Page 32: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

32

Silvia Arcelli

Kalman Filter-Assunzioni Kalman Filter-Assunzioni GeneraliGenerali

Dove F è una funzione lineare: Dove F è una funzione lineare:

Il termine descrive il “process noise”.Il termine descrive il “process noise”. Si Si assume assume

che non sia biassatoche non sia biassato , , sia gaussiano sia gaussiano e sia caratterizzato da una definita matrice di e sia caratterizzato da una definita matrice di covarianzacovarianza

La matrice di covarianza di è indicata con La matrice di covarianza di è indicata con

Si assume che l’evoluzione del vettore di stato Si assume che l’evoluzione del vettore di stato dal layer k al layer successivo k+1 sia dal layer k al layer successivo k+1 sia descritto da una descritto da una “System Equation”“System Equation”con definite proprietà :con definite proprietà :

kkk1k w)x(Fx

kkkk xFxF

)(

kw

0 kw

kQ

kCkx

Page 33: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

33

Silvia Arcelli

F descrive la parteF descrive la parte deterministica deterministica dell’evoluzione dell’evoluzione dello stato dello stato

dal layer k al layer k+1 (è legata alle soluzione delle dal layer k al layer k+1 (è legata alle soluzione delle equazioni del moto). Se la funzione non è equazioni del moto). Se la funzione non è strettamente lineare ma è “localmente lineare”, il strettamente lineare ma è “localmente lineare”, il principio resta inalterato e il Filtro di Kalman si principio resta inalterato e il Filtro di Kalman si dice “esteso”. dice “esteso”.

Il termine tiene conto della variazione Il termine tiene conto della variazione stocastica dello stocastica dello

State Vector durante la propagazione dal layer k al State Vector durante la propagazione dal layer k al layer k+1 layer k+1

(dovuta, ad esempio, al MS). (dovuta, ad esempio, al MS).

Kalman Filter-Assunzioni Kalman Filter-Assunzioni GeneraliGenerali

kw

Page 34: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

34

Silvia Arcelli

Kalman Filter-Assunzioni Kalman Filter-Assunzioni GeneraliGenerali

Anche H è una funzione lineare Anche H è una funzione lineare

Il termine descrive la componente Il termine descrive la componente stocastica associata all’incertezza sulle misure stocastica associata all’incertezza sulle misure (“measurement noise”), e si (“measurement noise”), e si

suppone che non sia biassato , sia suppone che non sia biassato , sia gaussiano e che sia caratterizzato da una gaussiano e che sia caratterizzato da una matrice di covarianzamatrice di covarianza

Si assume inoltre che il process noise e il Si assume inoltre che il process noise e il measurement measurement

noise siano noise siano indipendentiindipendenti

Inoltre, si assume che sia possibile, dato il Inoltre, si assume che sia possibile, dato il vettore di stato ad un certo layer k, connetterlo vettore di stato ad un certo layer k, connetterlo al vettore delle misure (coordinate) allo al vettore delle misure (coordinate) allo stesso layer attraverso la stesso layer attraverso la “Measurement “Measurement Equation”Equation”::

kV

k

km

kkkk xHm

k

Page 35: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

35

Silvia Arcelli

Kalman FilterKalman FilterLo stesso esempio usato per il formalismo del fit di

tracciaglobale ora nel formalismo del Kalman Filter:

kkyk b

ayx

tan

10

1 1 kkk

zzF

)01(kH

kk ym

ky

kk

kyk

k

kykkk

yzzyx

yy

xHm

tan10

1

tan

tan)01(

1

1

1

N.B. Qui ho ignorato il process ed il measurement noise

Page 36: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

36

Silvia Arcelli

Kalman FilterKalman FilterRispetto al formalismo del fit di traccia globale :

Il modello di traccia mette in relazione due stati consecutivi (continuo cambio del piano di riferimento)

Il modello di traccia deve essere lineare solo tra due layer

consecutivi

Il MS è trattato nella matrice Qk, che ha la dimensionalità

dello State Vector

Correzioni (come quella per dE/dx o piccole disuniformità di campo magnetico) si incorporano in maniera molto semplice

Page 37: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

37

Silvia Arcelli

Kalman Filter-Come Kalman Filter-Come funzionafunziona

Prediction: Prediction: Stima di uno stato “futuro”Stima di uno stato “futuro”

Filter :Filter : Stima dello stato “presente”, includendo Stima dello stato “presente”, includendo l’informazione della misura l’informazione della misura

Smoother: Smoother: Stima di uno stato “passato”, in base a Stima di uno stato “passato”, in base a tutta tutta

l’informazione della traccia.l’informazione della traccia.

Operativamente, il Kalman Filter si articola Operativamente, il Kalman Filter si articola secondo 2 processi di base (secondo 2 processi di base ( più un terzo più un terzo “opzionale”, smoother) iterati N volte:“opzionale”, smoother) iterati N volte:

Page 38: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

38

Silvia Arcelli

Kalman Filter-Come Kalman Filter-Come funzionafunziona

Per “partire”, il filtro ha bisogno di un “seed” Per “partire”, il filtro ha bisogno di un “seed” (vedi track following), che dia una stima iniziale (vedi track following), che dia una stima iniziale dello State Vector: dello State Vector:

j|kx

Quindi, se si indica con la Quindi, se si indica con la stimastima dello State dello State Vector al layer k sulla base delle j misure nei j Vector al layer k sulla base delle j misure nei j layer {m1,...mj}:layer {m1,...mj}:1) k>j : Prediction

2) k=j : Filter3) k<j: Smoother

0|0 ,0|0 Cx

Quindi il filtro procede alternando le due Quindi il filtro procede alternando le due operazioni 1) e 2)operazioni 1) e 2)fino all’ultima misura che si ritiene associata fino all’ultima misura che si ritiene associata alla traccia. alla traccia. (il track finding si fa in simultanea) (il track finding si fa in simultanea)

Page 39: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

39

Silvia Arcelli

Kalman Filter, Kalman Filter, “Prediction” Step“Prediction” Step

Supponiamo di avere una stima dello State Vector al layer k sulla base delle misure {m1,..mk}, {m1,..mk}, con matrice di con matrice di covarianza . Equazioni del “Prediction Step”:covarianza . Equazioni del “Prediction Step”:

kkx |

kx

kkQ |

kkT

kkkkk

kkkkk

QFCFC

xFx

||1

||1

)0 ( kw State Vector

kkx |

kkx |1

kQ

kFkF

Covariance Matrix

•dim(Q,F,C)= dim(x) · dim(x)

• ho già una stima locale dei parametri (errori MS)

• posso applicare correzioni (dE/dx)

Page 40: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

40

Silvia Arcelli

Kalman Filter, Filter Kalman Filter, Filter StepStep

In questa fase, si utilizza la stima dello State Vector e della sua matrice di covarianza dal Prediction Step, combinandola con una eventuale misura al layer k+1, per produrre la miglior stima dello State Vector al layer k+1, sulla base delle misure {m1,...,mk+1}. La prescrizione si deriva richiedendo che sia minima la funzione:

)( )(

)()()(

1|11

|11|1

111111111

kkkkkT

kkk

kkkkT

kkkk

xxCxx

xHmVxHmxL

2 della parte “di misura”

2 della parte “di predizione”

Page 41: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

41

Silvia Arcelli

Kalman Filter, Filter Kalman Filter, Filter StepStep

Imponendo si ottengono le Equazioni di Filter, che danno la miglior stima dello stato al layer k+1, e della sua matrice di covarianza:

0xd

dL

1|11

~ kkk xx

11|11

1111|1

1|11

111

1111|1

1|1

1|1

)(

kkkkTkkk

kkkkTk

kkTkkkkk

kk

CHVHC

CHVH

mVHxCx

State Vector

Covariance Matrix

Page 42: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

42

Silvia Arcelli

Kalman Filter, “Filter” Kalman Filter, “Filter” StepStepLa miglior stima dello State Vector al layer k+1,

basato sulle misure {m1,...mk+1} non è altro che non è altro che la la media pesata media pesata della previsione e della misura.della previsione e della misura.

kkx |

kkx |1

kQkF

kF

1km

1|1 kkx

Anche in questa fase, si fa track finding!

•Ho una serie di informazioni per decidere l’associazione dell’hit

•Posso tener conto della eventuale dipendenza degli errori di misura dai parametri della traccia

Page 43: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

43

Silvia Arcelli

Kalman Filter, Filter Kalman Filter, Filter StepStep

Usando e sostituendo, le equazioni di filter si possono anche scrivere:

1k11k

T1k

11k|1k

1k|1k HVHCC

kkkkkk

kkkkkkkkk

CHKIC

xHmKxx

|1111|1

|1111|11|1

)(

)(

)HCHV(

HCK

T1kk|1k1k1k

T1kk|1k

1k

Dove:

é la “Gain Matrix”

“Correction”“Prediction”

Page 44: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

44

Silvia Arcelli

Kalman Filter, Filter Kalman Filter, Filter StepStep

La Gain Matrix K determina il peso della correzione.

)HCHV(

HCK

T1kk|1k1k1k

T1kk|1k

1k

All’inizio del filtro:massimo guadagno nell’incorporare la

misura

IKVC ,

Alla fine del filtro:

0 , KVCincorporare nuove

misureha sempre meno

impatto

Page 45: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

45

Silvia Arcelli

Kalman Filter, Filter Kalman Filter, Filter StepStep

La Stima filtrata ha tutte le proprietà ottimali di un estimatore lineare di minimi quadrati. Ad essa è associata un 2 :

Tkkkkkk

kkkkkk

kHCHVR

xHmr

11|1111|1

1|1111|1

1|11|1

11|1

2,1

kkkkrRr kk

TFk

distribuito come una variabile di 2 a dim(mk)

gradi di libertà. Il 2 globale della traccia è la

somma di tutti i 2 ad ogni passo del filtro. 22

,12

1 kFkk

Page 46: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

46

Silvia Arcelli

Kalman FilterKalman FilterIl filtro procede iterando queste due operazioni fino all’ N-esimo layer, rifinendo continuamente la stima dello State Vector al layer corrente:

•La stima filtrata segue più da vicino la traiettoria fisica della traccia (soprattutto nello stadio iniziale)

•La stima all’ultimo layer è la più precisa, perchè contiene l’informazione delle misure di tutti i layer. Se si vuole la miglior stima al vertice, si inizia il filtro dal layer più esterno.

Page 47: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

47

Silvia Arcelli

Kalman Filter-Smoother Kalman Filter-Smoother StepStep

Abbiamo visto che lo State Vector è più preciso all’ultimo layer di misura. Ma il Kalman Filter permette di ottenere la stima migliore, basata su tutte le N misure, a qualunque layer k={1...N}.

Equazioni di Smoothing (ancora un processo recursivo):

1|11|

|1|1||

|1|1||

)(

)(

kkTkkkk

TkNkkkkkkNk

NkkkkkkNk

CFCA

ACCACC

xxAxx

Page 48: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

48

Silvia Arcelli

Kalman Filter-Smoother Kalman Filter-Smoother StepStep

•Anche alla stima “smoothed” è associato un 2, ma la loro somma non dà il 2 globale (non sono indipendenti)

Utile per l’individuazione di hit di rumore (“outliers”)

nknkrRr nk

TSk ||

1|

2,

•Lo Smoother si dimostra equivalente alla media pesata di un “Forward Filter” e di un “Backward Filter”.

•La traiettoria dopo lo smoothing è, appunto, più “smooth”

Page 49: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

49

Silvia Arcelli

Kalman Filter-SommarioKalman Filter-Sommario Permette di fare track finding e fitting

simultaneamente

Perturbazioni alla traiettoria “ideale” (MS, perdita di Energia,

disuniformità di campo magnetico) sono trattabili in maniera più semplice

Il formalismo consente di utilizzare matrici di dimensione limitata (al massimo quella dello State Vector). Quindi il numero di operazioni scala come ~N, e non come N3.

Il modello lineare di traccia deve essere valido solo “localmente” (tra step e step)

Page 50: Silvia Arcelli 1 Metodi di Ricostruzione in Fisica Subnucleare Corso di Metodologie Informatiche Avanzate Per la Fisica Nucleare e Subnucleare A.A. 2009/2010

50

Silvia Arcelli

Kalman Filter-SommarioKalman Filter-Sommario I parametri di traccia sono stimati

localmente, e seguono da vicino la traiettoria fisica della traccia, non solo l’estrapolazione delle condizioni iniziali come in un fit globale

Estrapolazione ottimale dello stato della traccia ad altri device (calorimetri, sistemi di Particle-ID, rivelatori di muoni)

Quando conviene usarlo? Quando sono in condizione

di “continuità e prossimità” delle misure.