Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/epdo293... ·...
TRANSCRIPT
![Page 1: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/1.jpg)
Βάσεις Δεδομένων ΙΙ
Ενότητα 10 Βάσεις Δεδομένων Πολυμέσων
Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσων
Το περιεχόμενο του μαθήματος
διατίθεται με άδεια Creative
Commons εκτός και αν αναφέρεται
διαφορετικά
Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού
Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και
συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό
Κοινωνικό Ταμείο) και από εθνικούς πόρους
Βάσεις Δεδομένων ΙΙ
Δεικτοδότηση Πολυμέσων
Πρόβλημα Δοθείσας μίας μεγάλης συλλογής (πολυμεσικών) εγγραφών (πχ μετοχές) Επιτρέπει γρήγορα ερωτήματα ομοιότητας
Εφαρμογές time series χρηματοιοκονομικά marketing (click-streams) ECGs ήχος εικόνες ιατρική ψηφιακές βιβλιοθήκες εκπαίδευση τέχνη higher-d σήματα επιστημονικές ΒΔ (πχ αστροφυσική) ιατρική (MRI ακτινογραφίες) ψυχαγωγία (video)
Παραδείγματα Ερωτημάτων Βρες ιατρικές υποθέσεις παρόμοιες και του κ Παπαδόπουλου Βρες ζεύγη μετοχών που κινούνται με συγχρονισμό Βρες ζεύγη εγγράφων που είναι παρόμοια (λογοκλοπία) Βρες πρόσωπα παρόμοια με του lsquoTiger Woodsrsquo
Λεπτομ ορισμός προβλήματος Πρόβλημα δοθείσας μιας συλλογής πολυμεσικών αντικειμένων βρες αυτά που είναι παρόμοια με ένα επιθυμητό αντικείμενο-ερώτημα
για παράδειγμα
τιμή
τιμή
1 365 μέρα
τιμή
1 365 μέρα
1 365 μέρα
συνάρτηση απόστασης από ειδικό
(πχ Ευκλείδεια απόσταση)
Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα
Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)
Πολυμέσα- λεπτομερώς
Πολυμέσα Motivation ορισμός προβλήματος
Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap
Κεντρική ιδέα
Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια
απόσταση τιμή
τιμή
1 τιμή
1
365 μέρα
1
365 μέρα
365 μέρα
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 2: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/2.jpg)
Βάσεις Δεδομένων ΙΙ
Δεικτοδότηση Πολυμέσων
Πρόβλημα Δοθείσας μίας μεγάλης συλλογής (πολυμεσικών) εγγραφών (πχ μετοχές) Επιτρέπει γρήγορα ερωτήματα ομοιότητας
Εφαρμογές time series χρηματοιοκονομικά marketing (click-streams) ECGs ήχος εικόνες ιατρική ψηφιακές βιβλιοθήκες εκπαίδευση τέχνη higher-d σήματα επιστημονικές ΒΔ (πχ αστροφυσική) ιατρική (MRI ακτινογραφίες) ψυχαγωγία (video)
Παραδείγματα Ερωτημάτων Βρες ιατρικές υποθέσεις παρόμοιες και του κ Παπαδόπουλου Βρες ζεύγη μετοχών που κινούνται με συγχρονισμό Βρες ζεύγη εγγράφων που είναι παρόμοια (λογοκλοπία) Βρες πρόσωπα παρόμοια με του lsquoTiger Woodsrsquo
Λεπτομ ορισμός προβλήματος Πρόβλημα δοθείσας μιας συλλογής πολυμεσικών αντικειμένων βρες αυτά που είναι παρόμοια με ένα επιθυμητό αντικείμενο-ερώτημα
για παράδειγμα
τιμή
τιμή
1 365 μέρα
τιμή
1 365 μέρα
1 365 μέρα
συνάρτηση απόστασης από ειδικό
(πχ Ευκλείδεια απόσταση)
Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα
Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)
Πολυμέσα- λεπτομερώς
Πολυμέσα Motivation ορισμός προβλήματος
Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap
Κεντρική ιδέα
Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια
απόσταση τιμή
τιμή
1 τιμή
1
365 μέρα
1
365 μέρα
365 μέρα
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 3: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/3.jpg)
Πρόβλημα Δοθείσας μίας μεγάλης συλλογής (πολυμεσικών) εγγραφών (πχ μετοχές) Επιτρέπει γρήγορα ερωτήματα ομοιότητας
Εφαρμογές time series χρηματοιοκονομικά marketing (click-streams) ECGs ήχος εικόνες ιατρική ψηφιακές βιβλιοθήκες εκπαίδευση τέχνη higher-d σήματα επιστημονικές ΒΔ (πχ αστροφυσική) ιατρική (MRI ακτινογραφίες) ψυχαγωγία (video)
Παραδείγματα Ερωτημάτων Βρες ιατρικές υποθέσεις παρόμοιες και του κ Παπαδόπουλου Βρες ζεύγη μετοχών που κινούνται με συγχρονισμό Βρες ζεύγη εγγράφων που είναι παρόμοια (λογοκλοπία) Βρες πρόσωπα παρόμοια με του lsquoTiger Woodsrsquo
Λεπτομ ορισμός προβλήματος Πρόβλημα δοθείσας μιας συλλογής πολυμεσικών αντικειμένων βρες αυτά που είναι παρόμοια με ένα επιθυμητό αντικείμενο-ερώτημα
για παράδειγμα
τιμή
τιμή
1 365 μέρα
τιμή
1 365 μέρα
1 365 μέρα
συνάρτηση απόστασης από ειδικό
(πχ Ευκλείδεια απόσταση)
Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα
Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)
Πολυμέσα- λεπτομερώς
Πολυμέσα Motivation ορισμός προβλήματος
Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap
Κεντρική ιδέα
Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια
απόσταση τιμή
τιμή
1 τιμή
1
365 μέρα
1
365 μέρα
365 μέρα
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 4: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/4.jpg)
Εφαρμογές time series χρηματοιοκονομικά marketing (click-streams) ECGs ήχος εικόνες ιατρική ψηφιακές βιβλιοθήκες εκπαίδευση τέχνη higher-d σήματα επιστημονικές ΒΔ (πχ αστροφυσική) ιατρική (MRI ακτινογραφίες) ψυχαγωγία (video)
Παραδείγματα Ερωτημάτων Βρες ιατρικές υποθέσεις παρόμοιες και του κ Παπαδόπουλου Βρες ζεύγη μετοχών που κινούνται με συγχρονισμό Βρες ζεύγη εγγράφων που είναι παρόμοια (λογοκλοπία) Βρες πρόσωπα παρόμοια με του lsquoTiger Woodsrsquo
Λεπτομ ορισμός προβλήματος Πρόβλημα δοθείσας μιας συλλογής πολυμεσικών αντικειμένων βρες αυτά που είναι παρόμοια με ένα επιθυμητό αντικείμενο-ερώτημα
για παράδειγμα
τιμή
τιμή
1 365 μέρα
τιμή
1 365 μέρα
1 365 μέρα
συνάρτηση απόστασης από ειδικό
(πχ Ευκλείδεια απόσταση)
Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα
Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)
Πολυμέσα- λεπτομερώς
Πολυμέσα Motivation ορισμός προβλήματος
Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap
Κεντρική ιδέα
Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια
απόσταση τιμή
τιμή
1 τιμή
1
365 μέρα
1
365 μέρα
365 μέρα
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 5: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/5.jpg)
Παραδείγματα Ερωτημάτων Βρες ιατρικές υποθέσεις παρόμοιες και του κ Παπαδόπουλου Βρες ζεύγη μετοχών που κινούνται με συγχρονισμό Βρες ζεύγη εγγράφων που είναι παρόμοια (λογοκλοπία) Βρες πρόσωπα παρόμοια με του lsquoTiger Woodsrsquo
Λεπτομ ορισμός προβλήματος Πρόβλημα δοθείσας μιας συλλογής πολυμεσικών αντικειμένων βρες αυτά που είναι παρόμοια με ένα επιθυμητό αντικείμενο-ερώτημα
για παράδειγμα
τιμή
τιμή
1 365 μέρα
τιμή
1 365 μέρα
1 365 μέρα
συνάρτηση απόστασης από ειδικό
(πχ Ευκλείδεια απόσταση)
Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα
Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)
Πολυμέσα- λεπτομερώς
Πολυμέσα Motivation ορισμός προβλήματος
Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap
Κεντρική ιδέα
Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια
απόσταση τιμή
τιμή
1 τιμή
1
365 μέρα
1
365 μέρα
365 μέρα
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 6: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/6.jpg)
Λεπτομ ορισμός προβλήματος Πρόβλημα δοθείσας μιας συλλογής πολυμεσικών αντικειμένων βρες αυτά που είναι παρόμοια με ένα επιθυμητό αντικείμενο-ερώτημα
για παράδειγμα
τιμή
τιμή
1 365 μέρα
τιμή
1 365 μέρα
1 365 μέρα
συνάρτηση απόστασης από ειδικό
(πχ Ευκλείδεια απόσταση)
Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα
Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)
Πολυμέσα- λεπτομερώς
Πολυμέσα Motivation ορισμός προβλήματος
Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap
Κεντρική ιδέα
Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια
απόσταση τιμή
τιμή
1 τιμή
1
365 μέρα
1
365 μέρα
365 μέρα
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 7: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/7.jpg)
τιμή
τιμή
1 365 μέρα
τιμή
1 365 μέρα
1 365 μέρα
συνάρτηση απόστασης από ειδικό
(πχ Ευκλείδεια απόσταση)
Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα
Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)
Πολυμέσα- λεπτομερώς
Πολυμέσα Motivation ορισμός προβλήματος
Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap
Κεντρική ιδέα
Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια
απόσταση τιμή
τιμή
1 τιμή
1
365 μέρα
1
365 μέρα
365 μέρα
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 8: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/8.jpg)
Τύποι ερωτημάτων Ολική ταύτιση εν sub-pattern match ερωτήματα εύρους εν πλησιέστερων γειτόνων όλα τα ζεύγη ερώτημα
Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)
Πολυμέσα- λεπτομερώς
Πολυμέσα Motivation ορισμός προβλήματος
Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap
Κεντρική ιδέα
Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια
απόσταση τιμή
τιμή
1 τιμή
1
365 μέρα
1
365 μέρα
365 μέρα
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 9: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/9.jpg)
Στόχοι σχεδίου Γρήγορα (γρηγορότερα από σειρ αναζήτηση) lsquoορθόrsquo (πχ όχι ψεύτικοι συναγερμοί όχι λάθος απορρίψεις)
Πολυμέσα- λεπτομερώς
Πολυμέσα Motivation ορισμός προβλήματος
Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap
Κεντρική ιδέα
Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια
απόσταση τιμή
τιμή
1 τιμή
1
365 μέρα
1
365 μέρα
365 μέρα
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 10: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/10.jpg)
Πολυμέσα- λεπτομερώς
Πολυμέσα Motivation ορισμός προβλήματος
Κύρια ιδέα time sequences εικόνες sub-pattern matching Αυτόματη εξαγωγή χαρακτηριστικών FastMap
Κεντρική ιδέα
Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια
απόσταση τιμή
τιμή
1 τιμή
1
365 μέρα
1
365 μέρα
365 μέρα
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 11: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/11.jpg)
Κεντρική ιδέα
Πχ χρονικές ακολουθίες lsquoολική ταύτισηrsquo ερωτήματα εύρους Ευκλείδεια
απόσταση τιμή
τιμή
1 τιμή
1
365 μέρα
1
365 μέρα
365 μέρα
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 12: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/12.jpg)
Κεντρική ιδέα Η ακολουθιακή αναζήτηση δουλεύει - πώς γίνεται γρηγορότερα
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 13: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/13.jpg)
Ιδέα lsquoGEMINIrsquo (GEneric Multimedia INdexIng) Εξήγαγε μερικά αριθμητικά χαρακτηριστικά για lsquoγρήγορο και
πρόχειροrsquo έλεγχο
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 14: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/14.jpg)
lsquoGEMINIrsquo - Παραστατικά
πχ std S1
F(S1)
1
365 μέρα
F(Sn)
Sn
πχ avg
1 365 μέρα
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 15: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/15.jpg)
GEMINI Λύση lsquoΓρήγορο-και-πρόχειρο φίλτρο εξήγαγε n χαρακτηριστικά (αριθμούς πχ avg κτλ) πρόβαλε σε ένα σημείο στο n-d χώρο χαρακτηριστικών οργάνωσε τα σημεία με έτοιμη spatial access μέθοδο (lsquoSAMrsquo) Απόρριξε false alarms
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 16: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/16.jpg)
GEMINI Σημαντικό Ε πώς να εγγυηθεί απουσία ψευδών απορρίψεων A1 διατήρηση αποστάσεων (αλλά δύσκολοακατόρθωτο) A2 Lower-bounding λήμμα αν η αποτύπωση lsquoκάνει τα πράματα να
εγγύτεραrsquo τότε δεν υπάρχουν ψευδείς απορρίψεις
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 17: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/17.jpg)
GEMINI Σημαντικό Q how to extract features A ldquoif I have only one number to describe my object what should this berdquo
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 18: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/18.jpg)
Time sequences Q what features
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 19: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/19.jpg)
Time sequences Q what features A Fourier coefficients (wersquoll see them in detail soon)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 20: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/20.jpg)
Time sequences
white noise
brown noise
Fourier spectrum
in log-log
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 21: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/21.jpg)
Time sequences Eg
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 22: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/22.jpg)
Time sequences conclusion colored noises are well approximated by their first few Fourier
coefficients colored noises appear in nature
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 23: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/23.jpg)
Time sequences
brown noise stock prices (1f2 energy spectrum) pink noise works of art (1f spectrum)
black noises water reservoirs (1fb bgt2) (slope related to lsquoHurst exponentrsquo for self-similar traffic like eg Ethernetweb [Schroeder] [Leland+]
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 24: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/24.jpg)
Time sequences - results keep the first 2-3 Fourier coefficients faster than seq scan NO false dismissals (see book) time
total cleanup-time
r-tree time
coeff kept
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 25: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/25.jpg)
Time sequences - improvements
improvementsvariations [Kanellakis+Goldin] [Mendelzon+Rafiei] could use Wavelets or DCT
could use segment averages [Yi+2000]
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 26: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/26.jpg)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shapes) sub-pattern matching automatic feature extraction FastMap
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 27: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/27.jpg)
Images - color
what is an image A 2-d array
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 28: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/28.jpg)
Images - color
Color histograms and distance function
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 29: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/29.jpg)
Images - color
Mathematically the distance function is
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 30: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/30.jpg)
Images - color
Problem lsquocross-talkrsquo Features are not orthogonal -gt SAMs will not work properly
Q what to do A feature-extraction question
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 31: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/31.jpg)
Images - color
possible answers avg red avg green avg blue
it turns out that this lower-bounds the histogram distance -gt no cross-talk SAMs are applicable
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 32: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/32.jpg)
Images - color
performance
time seq scan
w avg RGB
selectivity
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 33: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/33.jpg)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 34: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/34.jpg)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 35: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/35.jpg)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q how to normalize them A divide by standard deviation)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 36: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/36.jpg)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 37: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/37.jpg)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo (Q other lsquofeaturesrsquo distance functions A1 turning angle A2 dilationserosions A3 )
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 38: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/38.jpg)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 39: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/39.jpg)
Images - shapes distance function Euclidean on the area perimeter and 20 lsquomomentsrsquo Q how to do dim reduction A Karhunen-Loeve (= centered PCASVD)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 40: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/40.jpg)
Images - shapes Performance ~10x faster
log( of IOs)
all kept
of features kept
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 41: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/41.jpg)
Case study Informedia Video database system developed at CMU 2+ TB of video data (broadcast news) retrieval by text image and face similarity wwwinformediacscmuedu
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 42: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/42.jpg)
Case study Informedia next foils visualization features by space
by time by concept
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 43: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/43.jpg)
bull geo mapping bull automatic place recognition bull ambiguity resol + bull lookup
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 44: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/44.jpg)
time line
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 45: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/45.jpg)
concept
space
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 46: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/46.jpg)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 47: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/47.jpg)
Sub-pattern matching
Problem find sub-sequences that match the given query pattern
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 48: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/48.jpg)
$price
$price
1
$price
1
400 day
1
300 day
30
365 day
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 49: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/49.jpg)
Sub-pattern matching
Q how to proceed Hint try to turn it into a lsquowhole-matchingrsquo problem (how)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 50: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/50.jpg)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 51: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/51.jpg)
Sub-pattern matching
Assume that queries have minimum duration w (eg w=7 days) divide data sequences into windows of width w (overlapping or not) A sliding overlapping windows Thus trails Pictorially
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 52: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/52.jpg)
Sub-pattern matching
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 53: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/53.jpg)
Sub-pattern matching
sequences -gt trails -gt MBRs in feature space
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 54: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/54.jpg)
Sub-pattern matching
Q do we store all points why not
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 55: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/55.jpg)
Sub-pattern matching
Q how to do range queries of duration w
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 56: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/56.jpg)
Sub-pattern matching (very recent improvement [Moon+2001]) use non-overlapping windows for data
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 57: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/57.jpg)
Conclusions GEMINI works for any setting (time sequences images etc) uses a lsquoquick and dirtyrsquo filter faster than seq scan (but how to extract features automatically)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 58: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/58.jpg)
Multimedia - Detailed outline
multimedia Motivation problem definition
Main idea time sequences images (color shape) sub-pattern matching automatic feature extraction FastMap
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 59: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/59.jpg)
FastMap Automatic feature extraction Given a dissimilarity function of objects Quickly map the objects to a (k-d) `feature space (goals indexing andor visualization)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 60: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/60.jpg)
FastMap
~100 O1
O2
O3
O4
O5 O1
0
1
1
100
100 O2
1
0
1
100
100 O3 1 1
O4 100 100
0 100 100 ~1
100 0 1
O5
100
100
100
1
0
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 61: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/61.jpg)
FastMap Multi-dimensional scaling (MDS) can do that but in O(N2) time
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 62: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/62.jpg)
MDS
Multi Dimensional Scaling
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 63: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/63.jpg)
Main idea projections We want a linear algorithm FastMap [SIGMOD95]
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 64: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/64.jpg)
FastMap - next iteration
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 65: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/65.jpg)
Results
Documents cosine similarity -gt Euclidean distance (how)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 66: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/66.jpg)
Results
bb reports
recipes
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 67: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/67.jpg)
Applications time sequences given n co-evolving time sequences visualize them + find rules [ICDE00] GBP
rate JPY
HKD time
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 68: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/68.jpg)
Applications - financial
currency exchange rates [ICDE00] 1
DEM
08
06 HKD
04
USD(t)
FRF FRF(t-5)
DEM(t-5)
HKD(t)
FRF(t) DEM(t)
DEM
JPY(t)
JPY(t-5)
FRF GBP HKD JPY USD
USD(t)
USD(t-5)
02
0 USD(t-5)
-02
HKD(t-5)
USD
JPY
GBP(t-5)
GBP -04
-02 0 02
GBP(t)
04 06 08 1 12 14 16
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 69: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/69.jpg)
VideoTrails [ACM MM97]
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 70: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/70.jpg)
Conclusions GEMINI works for multiple settings FastMap can extract lsquofeaturesrsquo automatically (-gt indexing visual dm)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 71: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/71.jpg)
References Faloutsos C R Barber et al (July 1994) ldquoEfficient and Effective Querying by Image Contentrdquo J of Intelligent Information Systems 3(34) 231-262 Faloutsos C and K-I D Lin (May 1995) FastMap A Fast Algorithm for Indexing Data-Mining and Visualization of
Traditional and Multimedia Datasets Proc of ACM-SIGMOD San Jose CA Faloutsos C M Ranganathan et al (May 25-27 1994) Fast
Subsequence Matching in Time-Series Databases Proc ACM SIGMOD Minneapolis MN Flickner M H Sawhney et al (Sept 1995) ldquoQuery by Image and Video Content The QBIC Systemrdquo IEEE Computer 28(9) 23-32 Goldin D Q and P C Kanellakis (Sept 19-22 1995) On Similarity Queries for Time-Series Data Constraint Specification
and Implementation Int Conf on Principles and Practice of Constraint Programming (CP95) Cassis France
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 72: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/72.jpg)
References
Leland W E M S Taqqu et al (Feb 1994) ldquoOn the Self- Similar Nature of Ethernet Trafficrdquo IEEE Transactions on Networking 2(1) 1-15 Moon Y-S K-Y Whang et al (2001) Duality-Based Subsequence Matching in Time-Series Databases ICDE Heidelberg Germany Rafiei D and A O Mendelzon (1997) Similarity-Based Queries for Time Series Data SIGMOD Conference Tucson AZ Schroeder M (1991) Fractals Chaos Power Laws Minutes from an Infinite Paradise New York WH Freeman and Company Yi B-K and C Faloutsos (2000) Fast Time Sequence Indexing for Arbitrary Lp Norms VLDB Kairo Egypt
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 73: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/73.jpg)
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Μη Εμπορική Χρήση Παρόμοια Διανομή 40 [1] ή μεταγενέστερη Διεθνής Έκδοση Εξαιρούνται τα αυτοτελή έργα τρίτων πχ φωτογραφίες διαγράμματα κλπ τα οποία εμπεριέχονται σε αυτό Οι όροι χρήσης των έργων τρίτων επεξηγούνται στη διαφάνεια laquoΕπεξήγηση όρων χρήσης έργων τρίτωνraquo
Τα έργα για τα οποία έχει ζητηθεί άδεια αναφέρονται στο laquoΣημείωμα Χρήσης Έργων Τρίτωνraquo
[1] httpcreativecommonsorglicensesαπό-nc-sa40
Ως Μη Εμπορική ορίζεται η χρήση
bull που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο
bull που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο
bull που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (πχ διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο
Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση εφόσον αυτό του ζητηθεί
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 74: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/74.jpg)
Επεξήγηση όρων χρήσης έργων τρίτων Δεν επιτρέπεται η επαναχρησιμοποίηση του έργου παρά μόνο εάν ζητηθεί εκ νέου άδεια από το δημιουργό copy
διαθέσιμο με
άδεια CC-BY
διαθέσιμο με άδεια
CC-BY-SA
διαθέσιμο με άδεια
CC-BY-NC-SA
διαθέσιμο με άδεια
CC-BY-NC
Επιτρέπεται η επαναχρησιμοποίηση του έργου και η δημιουργία παραγώγων αυτού με απλή αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου
Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού και διάθεση του έργου ή του παράγωγου αυτού με την ίδια άδεια Δεν επιτρέπεται η εμπορική χρήση του έργου
διαθέσιμο με άδεια
CC-BY-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η δημιουργία παραγώγων του έργου
διαθέσιμο με άδεια
CC-BY-NC-ND Επιτρέπεται η επαναχρησιμοποίηση του έργου με αναφορά του δημιουργού Δεν επιτρέπεται η εμπορική χρήση του έργου και η δημιουργία παραγώγων του
διαθέσιμο με άδεια
CC0 Public Domain
διαθέσιμο ως κοινό κτήμα
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
Επιτρέπεται η επαναχρησιμοποίηση του έργου η δημιουργία παραγώγων αυτού και η εμπορική του χρήση χωρίς αναφορά του δημιουργού
χωρίς σήμανση Συνήθως δεν επιτρέπεται η επαναχρησιμοποίηση του έργου
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 75: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/75.jpg)
Διατήρηση Σημειωμάτων
Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει
το Σημείωμα Αναφοράς
το Σημείωμα Αδειοδότησης
τη δήλωση Διατήρησης Σημειωμάτων
το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει)
μαζί με τους συνοδευόμενους υπερσυνδέσμους
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-
![Page 76: Βάσις Δομένων ΙΙeclass.teiion.gr/modules/document/file.php/EPDO293... · 2015-03-25 · Βάσις Δομένων ΙΙ. Ενότητα . 10: Βάσις Δομένων](https://reader036.vdocuments.pub/reader036/viewer/2022070806/5f0498d77e708231d40ec1f9/html5/thumbnails/76.jpg)
Χρηματοδότηση
bull Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα
bull Το έργο laquoΑνοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσωνraquo έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού
bull Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος laquoΕκπαίδευση και Δια Βίου Μάθησηraquo και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους
- 10
- 10_MultimediaIndexing
-
- Slide Number 1
- Slide Number 2
- Slide Number 3
- Slide Number 4
- Slide Number 5
- Slide Number 6
- Slide Number 7
- Slide Number 8
- Slide Number 9
- Slide Number 10
- Slide Number 11
- Slide Number 12
- Slide Number 13
- Slide Number 14
- Slide Number 15
- Slide Number 16
- Slide Number 17
- Slide Number 18
- Slide Number 19
- Slide Number 20
- Slide Number 21
- Slide Number 22
- Slide Number 23
- Slide Number 24
- Slide Number 25
- Slide Number 26
- Slide Number 27
- Slide Number 28
- Slide Number 29
- Slide Number 30
- Slide Number 31
- Slide Number 32
- Slide Number 33
- Slide Number 34
- Slide Number 35
- Slide Number 36
- Slide Number 37
- Slide Number 38
- Slide Number 39
- Slide Number 40
- Slide Number 41
- Slide Number 42
- Slide Number 43
- Slide Number 44
- Slide Number 45
- Slide Number 46
- Slide Number 47
- Slide Number 48
- Slide Number 49
- Slide Number 50
- Slide Number 51
- Slide Number 52
- Slide Number 53
- Slide Number 54
- Slide Number 55
- Slide Number 56
- Slide Number 57
- Slide Number 58
- Slide Number 59
- Slide Number 60
- Slide Number 61
- Slide Number 62
- Slide Number 63
- Slide Number 64
- Slide Number 65
- Slide Number 66
- Slide Number 67
- Slide Number 68
- Slide Number 69
- Slide Number 70
- Slide Number 71
- Slide Number 72
-
- eclass_genika_B
-