tesi specialistica: pattugliamento strategico multi-robot in ambienti di topologia arbitraria
TRANSCRIPT
PATTUGLIAMENTO STRATEGICO MULTI-ROBOT IN AMBIENTI DI
TOPOLOGIA ARBITRARIA
Federico Villa720492
Politecnico di Milano
Ingegneria Informatica
1 /24
SOMMARIO• Obiettivo: estendere lo stato dell’arte del pattugliamento strategico da singolo-agente a multi-agente
• Parte I - Introduzione:
• Il problema del pattugliamento
• Il problema del pattugliamento strategico
• Il modello Basilico-Gatti-Amigoni (BGA)
• Parte II - Contributi:
• Astrazione della topologia: il multi-grafo etichettato
• Minimo numero di robot non coordinati
• Dimensioni di coordinamento
• Parte III - Valutazioni sperimentali2 /24
PARTE IINTRODUZIONE
3 /24
PATTUGLIAMENTO
4
0,4
0,6
/24
PATTUGLIAMENTO STRATEGICO - I
• Due giocatori: un pattugliatore che difende un ambiente e un intruso che cerca di entrare
• Tempo discretizzato in turni
• L’intruso può aspettare indefinitamente fuori dall’ambiente, osservando la strategia del pattugliatore per poi entrare
• Gioco non-cooperativo con equilibrio leader-follower, dove il leader è il pattugliatore e il follower è l’intruso
5 /24
PATTUGLIAMENTO STRATEGICO - II
singolo multi
perimetrale
topologia arbitraria
Agmon et al.
BGA
modelli esistenti
6 /24
BGA - I
• L’ ambiente comprende degli obiettivi (celle con un valore su cui pattugliatore e intruso compiono le medesime valutazioni)
• Ogni obiettivo ha un tempo di penetrazione, ovvero un numero di turni per cui l’intruso non può compiere azioni diverse dallo stare fermo dopo avere tentato l’attacco
• E’ un gioco ad orizzonte infinito, che sotto ipotesi Markoviane diventa un gioco finito
7 /24
BGA - IIt1d=6
t4d=6
t2d=7
t3d=14
8 /24
PARTE IICONTRIBUTI
9 /24
BGA MULTI-AGENTE• Una configurazione è un insieme di celle che specifica la
posizione dei robot
• Un obiettivo è indifeso se nessun robot può raggiungerlo in un tempo inferiore al tempo di penetrazione del target stesso
c = (c1, c2, . . . , c|R|)
t1d=2
R1
t3d=2 R2 t2
d=2
t1d=2
R1
t3d=2 R2 t2
d=2
Nessun obiettivo indifeso
t1 è indifeso
10/24
NUMERO MINIMO DI ROBOT
• Astrazione dell’ambiente: multi-grafo etichettato, un multi-grafo con delle etichette sugli archi
• E’ possibile trovare una copertura in termini di clique etichettate massime tale per cui ogni obiettivo appartiene ad almeno una clique
• Il numero di clique massime della copertura è il minimo numero di robot non coordinati necessari a proteggere l’ambiente in modo che sia 1 la probabilità che l’intruso non attacchi
11/24
MULTIGRAFO ETICHETTATO
12
Vertici:
Archi:
Etichette:
t1d=4
t2d=4
t3d=4
t1 t2
t3
t1d=4
t2d=4
t3d=4
t1 t2
t3
e1
t1d=4
t2d=4
t3d=4
t1 t2
t3
{t1, t2, t3}
{t1, t3} {t2, t3}
e1
e3e2
/24
CLIQUE ETICHETTATA
13
t1 t2
t3 t4
{t1,t2,t3}
{t1,t2,t3}{t1,t2,t3}
{t2,t4}
{t1,t4}
{t3,t4}
Un pattugliatore può muoversi tra gli obiettivi della clique senza lasciarne mai indifeso nessuno
L’insieme degli obiettivi della clique è contenuto nell’intersezione delle etichette degli archi della clique
/24
ALGORITMO PER LE CLIQUE ETICHETTATE MASSIME
• Estensione dell’algoritmo di Bron-Kerbosch (1973), modificato per gestire multi-grafi
• E’ in grado di distinguere tra clique etichettate massime e clique etichettate non massime
• Individuate le clique massime, è possibile trovare una copertura impostando un problema di programmazione matematica intera
14/24
ESEMPIOt1d=4
t2d=4
t3d=4
t1d=4
t2d=4
t3d=4
t1 t2
t3
{t1, t2, t3}
{t1, t3} {t2, t3}
t1 t2
t3
{t1, t2, t3}
{t1, t2, t3} {t1, t2, t3}
e1
e2 e3
e1
e3e2
15/24
DIMENSIONI DI COORDINAMENTO - I
• Disaccoppiamento strategico: grado di coordinazione nel calcolare le strategie
• Strategia congiunta: la strategia è calcolata considerando tutti i robot, che scelgono come muoversi globalmente
• Strategia disaccoppiata: ogni robot decide come muoversi localmente, ma la strategia è calcolata considerando tutti gli agenti
• Strategie separate: il movimento dei robot e le strategie sono indipendenti
• Disaccoppiamento topologico: grado di coordinazione nel partizionare l’ambiente
• Assegnamento completo: tutti i robot pattugliano l’intero ambiente
• Assegnamento in clique massime: ogni robot è assegnato ad una clique etichettata massima
• Assegnamenti separati: ogni robot è assegnato ad una clique, anche non massima
16/24
DIMENSIONI DI COORDINAMENTO - II
• Possibili combinazioni Strategico/Topologico
assegnamento completo
assegnamento in clique massime
assegnamento separato
strategia congiunta
strategia disaccoppiata
strategie separate
D1 D2
D3
D4 D5
17/24
PARTE IIIVALUTAZIONI SPERIMENTALI
18/24
VALUTAZIONI SPERIMENTALI
• Algoritmo per l’enumerazione delle clique massime: JAVA
• Insieme delle clique appartenenti alla copertura: JAVA
• Modelli:
• AMPL
• CPLEX: problemi lineari
• SNOPT: problemi non lineari19/24
VALUTAZIONI SPERIMENTALI
1
10
100
1.000
10.000
D1 D2 D3 D4 D5
%T_medio su D5 %U_media su D5
20/24
VALUTAZIONI SPERIMENTALI
Pro Contro
D1
D2
D3
D4
D5
garantisce la massima utilità attesa calcolabile oneroso, non è scalabile
garantisce la massima utilità attesa calcolabile oneroso, non è scalabile
miglior compromesso tempo/utilità utilità inferiore a D1 e D2
nessuno qualità della soluzione strettamente inferiore a D5
scalabiletempo di calcolo dipendente
dal numero di assegnamenti da risolvere
21/24
CONCLUSIONI
• Abbiamo fornito un’astrazione che ci ha permesso di indicare un lower bound sul numero di robot
• Abbiamo indicato due dimensioni di coordinamento e le loro combinazioni
• I test sperimentali indicano come sia possibile usare ogni combinazione per un certo tipo di ambiente
• Più è forte è il coordinamento, maggiore è il tempo di elaborazione
• Più forte è il coordinamento, migliore è l’utilità dei pattugliatori
• Agenti numerosi non-coordinati funzionano peggio di pochi agenti coordinati
22/24
CONCLUSIONI - II
• Nicola Basilico, Nicola Gatti, Federico Villa Asynchronous Multi-Robot Patrolling against Intrusion in Arbitrary Topologies.
In Proceedings of the 24th AAAI Conference on Artificial Intelligence (AAAI). Atlanta, USA, 11-15 July, 2010.
23/24
GRAZIE PER L’ATTENZIONE
24/24