analisi interprocedurale. tino cortesitecniche di analisi di programmi 2 chiamata di procedura le...
TRANSCRIPT
Analisi Interprocedurale
Tino Cortesi Tecniche di Analisi di Programmi 2
Chiamata di proceduraLe tecniche di analisi dataflow viste finora non consideravano chiamate di funzioni o procedura: sono analisi intraprocedurali.Si parla di analisi interprocedurale quando si tengono in considerazione anche chiamate di procedure e funzioni
Consideriamo chiamate di procedura del tipo:
[call p(a,z)]lclr
dove: a è un parametro di ingresso z è un parametro di outputlc è l’etichetta che segna l’ingresso della procedura p
lr è l’etichetta che segna l’uscita dalla procedura p
Tino Cortesi Tecniche di Analisi di Programmi 3
FlussoNell’analisi intraprocedurale abbiamo usato il termine “flusso” per denotare insiemi di coppie di etichette (archi del grafo).
Consideriamo la chiamata [call p(a,z)]lclr
dove la procedura p è definita da
proc p(val x, res y) islin S endlout;
Nel grafo di flusso interprocedurale bisognerà considerare due archi particolari:
(lc; lin) è il flusso che corrisponde alla chiamata di una procedura in
lc, dove lin è il punto di entrata nel corpo della procedura chiamata
(lout; lr) è il flusso che corrisponde all’uscita dal corpo della
procedura in lout, ed al ritorno del controllo alla procedura
chiamante (nel punto lr).
Tino Cortesi Tecniche di Analisi di Programmi 4
EsempioLa dichiarazione di una procedura è del tipo
proc p(val x, res y) islin S endlout;
proc fib(val: z,u; res: v) is1
if [z<3]2 then [v:=u+1]3
else[call fib(z-1,u,v)]4
5 ; [call fib(z-2,v,v)]67
end8;[call fib(x,0,y)]9
10
Tino Cortesi Tecniche di Analisi di Programmi 5
Grafo di flusso (animazione)
[call fib(x,0,y)]9
10
[call fib(z-2,v,v)]6
7
[call fib(z-1,u,v)]4
5
end8
[v:=u+1]3
[z<3]2
is 1
Tino Cortesi Tecniche di Analisi di Programmi 6
Grafo di flusso
[call fib(x,0,y)]9
10
[call fib(z-2,v,v)]6
7
[call fib(z-1,u,v)]4
5
end8
[v:=u+1]3
[z<3]2
is 1
Tino Cortesi Tecniche di Analisi di Programmi 7
Equazioni dell’analisi (naif)Una formulazione naif delle equazioni di analisi dataflow potrebbe essere una semplice estensione di quella formulata per l’analisi intraprocedurale:
se l E GA(l)=
lub { GAœ(l’) | (l’, l) F o (l’; l) F} altrimenti
GAœ(l)= fl ( GA(l) )
Tino Cortesi Tecniche di Analisi di Programmi 8
Cammini non percorribiliPoiché consideriamo tutti i possibili flussi (l’, l) F o (l’; l) F l’analisi risulta essere corretta.
Ma niente ci impedisce nell’analisi di considerare il cammino [9, 1, 2, 4, 1, 2, 3, 8, 10] che non corrisponde a nessuna esecuzione del programma. L’analisi risulterebbe poco precisa!
Tino Cortesi Tecniche di Analisi di Programmi 9
Cammini non percorribili
[call fib(x,0,y)]9
10
[call fib(z-2,v,v)]6
7
[call fib(z-1,u,v)]4
5
end8
[v:=u+1]3
[z<3]2
is 1
Il cammino [9, 1, 2, 4, 1, 2, 3, 8, 10] non corrisponde a nessuna esecuzione del programma
Tino Cortesi Tecniche di Analisi di Programmi 10
Inter-flusso
Definiamo il concetto di flusso interprocedurale:
inter-flusso = {(lc, lin ,lout ,lr) | il programma P contiene
sia [call p(a,z)]lclr
che proc p(val x, res y) islin S endlout
}
Tino Cortesi Tecniche di Analisi di Programmi 11
Flusso e inter-flusso
flusso = {(1,2), (2,3), (2,4), (3,8), (4;1), (5,6), (6;1), (7,8),
(8;5), (8;7), (8;10), (9;1)}
inter-flusso= {(9,1,8,10), (4,1,8,5), (6,1,8,7)}
[call fib(x,0,y)]9
10
[call fib(z-2,v,v)]67
[call fib(z-1,u,v)]45
end8
[v:=u+1]3
[z<3]2
is 1
Tino Cortesi Tecniche di Analisi di Programmi 12
Rendere esplicito il contesto
Per estendere il Framework Generale all’analisi interprocedurale dovremo:
codificare l’informazione sui cammini (contesto)estendere lo spazio delle proprietà al contestoestendere le funzioni di transfer introducendo in particolare due funzioni di trasfer in corrispondenza di ogni flusso interprocedurale (lc, lin ,lout ,lr)
Tino Cortesi Tecniche di Analisi di Programmi 13
Rendere esplicito il contesto
Data un’istanza (L, F, F, E, , f) del framework monotono, costruiamo una istanza del framework monotono
arricchito che tiene in considerazione il contesto: (L, F, F, E, , f ), dove
L = L ( ad es. = codifica dei cammini) le funzioni di transfer in F sono monotone
la funzione f mappa etichette in F e E in funzioni di transfer in F :
per ogni l in E o F, d in L e ogni in , la funzione di trasfer fl è definita da: fl (d)() = fl (d())
Tino Cortesi Tecniche di Analisi di Programmi 14
Il frammento intraprocedurale
EAœ(l)= fl ( EA(l) )per tutte le etichette l che non sono
etichettedi una chiamata di procedura, ovvero che
non compaiono come primo o quarto
elemento diuna tupla
EA(l)= { EAœ(l’) | (l’, l) F o (l’; l) F} lE
per tutte le etichette l, incluse quelle che sono etichette di una chiamata di procedura
Tino Cortesi Tecniche di Analisi di Programmi 15
Il frammento interprocedurale
Restano da formulare le equazioni relative alle chiamate di procedura.
In corrispondenza di ogni dichiarazione di procedura del tipo
proc p(val x, res y) islin S endlout
abbiamo due funzioni di transfer:
flin , flout: ( L) ( L)
che possono essere ad es. l’identità: flin(d) = flout(d) = d
Tino Cortesi Tecniche di Analisi di Programmi 16
Il frammento interprocedurale
In corrispondenza ad ogni chiamata di procedura (interflusso)(lc, lin ,lout ,lr)
abbiamo due funzione di transfer:
flc(d): ( L) ( L)
flc,lr(d,d’): ( L) ( L) ( L)
E per ogni inter-flusso (lc, lin ,lout ,lr) avremo in più le equazioni
EAœ(lc)= flc( EA(lc) )
EAœ(lr)= flc,lr( EA(lc), EA(lr) )
Tino Cortesi Tecniche di Analisi di Programmi 17
Chiamata di procedura
[call p(a,z)]lclr
proc p(val x, res y)
islin
endlout
flc,lr(d,d’)
d
d
d’
flc(d)
Peephole Optimizations
Tino Cortesi Tecniche di Analisi di Programmi 19
guardando dallo spioncino...
Un modo relativamente semplice per migliorare la qualità del codice nativo prodotto da un compilatore semplice è quello di far girare un peephole optimizer.Un peephole optimizer lavora considerando una finestrella di alcune istruzioni alla ricerca di istruzioni subottimali equivalenti.L’insieme dei patterns da osservare sono in gran parte frutto di euristiche
Tino Cortesi Tecniche di Analisi di Programmi 20
Esercizio
1. r2:= 3 * 2
2. r2:= 4r3:= r1 + 2r2:= 2 * r3
3. r2:= 4r3:= r1 + r2r3:= *r3(assumendo r2 dead)
4. r1:=3r2:= r1*2
5. r2:= r1 * 5r2:= r2 + r3r3:= r1 * 5
6. r2:= r1r3:= r1 + r2r2:= 5
7. r1:= r2 * 2 r3:= r4 / 2
8. r1:= r1 + 0r2 := r2 * 1
ognuno dei seguenti frammenti di codice può essere ottimizzato. in quale codice lo trasformereste?che nome dareste a queste trasformazioni? (ce ne sono di 6 tipi!) quali analisi dataflow potrebbero supportarle?9. r2:= r1 + 5
i := r2r3:= ir4:=r3 * 3
Tino Cortesi Tecniche di Analisi di Programmi 21
Constant Foldingil peephole optimizer può spesso accorgersi che alcuni calcoli richiesti a tempo di esecuzione possono essere realizzati a tempo di compilazione
r2:= 3 * 2 diventa r2:=6
Tino Cortesi Tecniche di Analisi di Programmi 22
Constant PropagationA volte possiamo dire che una variabile in un certo punto del programma avrà sempre un certo valore costante. Possiamo quindi sostituire le occorrenze della variabile con occorrenze di tale costante
r2:= 4 r2:=4r3:= r1 + r2 diventa r3:=r1+4 diventa r3:=r1+4 r2:= 2 * r3 r2:= 2*r3 r2:= 2*r3
Tino Cortesi Tecniche di Analisi di Programmi 23
Constant Propagationr2:= 4 r3:= r1 + 4r3:= r1 + r2 diventa r3:= *r3 diventa r3:=
*(r1+4)r3:= *r3(assumendo che r2 sia dead)
r1:=3 diventa r1:= 3 diventa r1:= 3
r2:= r1*2 r2:= 3*2 r2:= 6
Tino Cortesi Tecniche di Analisi di Programmi 24
Common Subexpression Elimination
Quando la stessa espressione viene calcolata più di una volta nello spioncino dell’ottimizzatore, si può spesso eliminare la seconda computazione
r2:= r1 * 5 r4:= r1*5r2:= r2 + r3 diventa r2:= r4 + r3r3:= r1 * 5 r3:= r4
Tino Cortesi Tecniche di Analisi di Programmi 25
Copy PropagationAnche quando non si può dire che il contenuto di una variabile sarà costante, si può osservare talvolta che la variabile b contiene sempre lo stesso valore della variabile a. In questo caso si può rimpiazzare l’uso di b con la variabile a fino a che né a né b vengono modificate
r2:= r1 r2:= r1r3:= r1 + r2 diventa r3:= r1+r1 diventa r3:= r1+r1r2:= 5 r2:= 5 r2:= 5
Tino Cortesi Tecniche di Analisi di Programmi 26
Strenght ReductionAlcune istruzioni aritmetiche sono più “costose” di altre (ad esempio la moltiplicazione o la potenza rispetto all’addizione), e possono essere sostituite da operazioni meno costose. In particolare, la moltiplicazione e la divisione per potenze di 2 possono essere rimpiazzate, rispettivamente, con addizioni e shifts:
r1:= r2 * 2 diventa r1:= r2 + r2
r3:= r4 / 2 diventa r3 >> 1
Tino Cortesi Tecniche di Analisi di Programmi 27
Eliminazione di codice inutile
Istruzioni come le seguenti possono essere tout court eliminate:
r1:= r1 + 0 diventa r2 := r2 * 1
Tino Cortesi Tecniche di Analisi di Programmi 28
Loads e stores ridondantiil peephole optimizer può spesso accorgersi che il valore prodotto da una istruzione di load è già disponibile in un registro
r2:= r1 + 5 r2:=r1+5i := r2 diventa i:= r2r3:= i r4:= r2 * 3r4:=r3 * 3
Tino Cortesi Tecniche di Analisi di Programmi 29
= Stringhe di chiamata Per completare l’analisi di un programma rimane da specificare l’insieme che contiene l’informazione di contesto, ed il valore iniziale .Ad esempio, possiamo prendere = Lab* i cui valori sono sequenze di etichette.Per ogni tupla di inter-flusso (lc, lin ,lout ,lr)
flc(d)([, lc])= flc(d())
dove [,lc] denota il cammino ottenuto appendendo lc a e flc : L L specifica come la proprietà viene modificata.
flc,lr(d,d’)()= flc,lr(d(), d’([lc]))
e flc,lr : LL L permette di combinare l’informazione d di contesto con d’ .
Tino Cortesi Tecniche di Analisi di Programmi 30
Analisi dei segniConsideriamo un’analisi volta a determinare il segno delle variabili intere. Possiamo considerare il seguente dominio Sign:{-,0,+}Possiamo considerare il reticolo
L = (Var Sign)che descrive insiemi di stati astratti che mappano variabili nei loro segni possibili
Ad esempio, se Var={x,y}, un elemento di L può essere= { {x+, y+}, {x-, y-}}
che dice “le variabili x e y sono entrambe positive oppure entrambe negative”
Tino Cortesi Tecniche di Analisi di Programmi 31
Funzioni di transferLa funzione di transfer fl quando l è un comando di assegnamento del tipo [x:= a]l può essere scritta come:
fl (Y) = { l () | Y} dove
Y (Var Sign)l () = {[x/s] | s A[a](s)}A: AExp (Var Sign) (Sign)
A specifica l’analisi di espressioni aritmetiche
Per esercizio, specificare completamente l’analisi dei segni (intraprocedurale e interprocedurale)
Tino Cortesi Tecniche di Analisi di Programmi 32
EsercizioSpecificare nei dettagli l’analisi dei segni, a partire dagli esempi 2.36 e 2.38 del libro Nielson - Nielson - Hankin (pag. 89-95), modificando in modo opportuno le equazioni della Constant Propagation Analysis
Analizzare l’esempio di analisi interprocedurale di Constant Propagation dell’analizzatore PAG/WWW