programski sustav za raspoznavanje tiskanog teksta

22
PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA Autor: Mladen Jurković Mentor: Prof.dr.sc. Zoran Kalafatić Broj rada: 858 Datum: 10.7.2009.

Upload: vanya

Post on 29-Jan-2016

61 views

Category:

Documents


1 download

DESCRIPTION

PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA. Autor: Mladen Jurković Mentor: Prof.dr.sc. Zoran Kalafatić Broj rada: 858 Datum: 10.7.2009. Sadržaj. Uvod Metoda izrade sustava Modeli sustava Prikaz faza Prikaz rada programa Zaključak. Uvod. Optičko raspoznavanje znakova - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

Autor: Mladen JurkovićMentor: Prof.dr.sc. Zoran Kalafatić

Broj rada: 858Datum: 10.7.2009.

Page 2: PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

Sadržaj

Uvod Metoda izrade sustava Modeli sustava Prikaz faza Prikaz rada programa Zaključak

Page 3: PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

Uvod

Optičko raspoznavanje znakova

Računalni vid

Raspoznavanje uzoraka

Page 4: PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

Metoda izrade sustava

Učenje s učiteljem

Dvije faze:

Faza učenja

Faza odlučivanja

Page 5: PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

Slike za učenje

JPG format

Svako slovo prikazano s 19 fontova

Page 6: PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

Model faze učenja

Page 7: PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

Model faze odlučivanja

Page 8: PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

Ulazna slika

Page 9: PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

Pretprocesirana slika

Page 10: PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

Pronalaženje kontura

Page 11: PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

Polovice slova

Page 12: PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

Izlučivanje značajki

Vektor značajki je 5-dimenzionalan

Prva značajka: broj rupa u slovu

Ostale: Hu-ovi invarijantni momenti

Page 13: PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

Sličnost uzoraka

Udaljenost između vektora

n

iBi

Ai

BA mmxxd

1

11),(

Ai

Ai

Ai xxsignm log)(

gdje je i-ti član vektora značajki uzorka AAix

Ukupna sličnost: umnožak sličnosti svake od polovica slika i cijele slike

Page 14: PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

Klasifikacija nepoznatih uzoraka

1-NN metoda

Klasifikacija pomoću jednog prototipa

Konačna odluka: kombinacija ovih metoda

Page 15: PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

Problemi kod prepoznavanja

Sljepljivanje slova

Nezatvorenost kontura

Razlomljena slova

Page 16: PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

Prikaz rada programa

Page 17: PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

Slika za testiranje

Page 18: PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

Prepoznati tekst

THE QUICK BROMN DOG JUMPS OVER THE AZY FON

THE QUECK BMOWN DOG JUMFS OVES THE LAY FOX

THE QUICK BROKN DOC JUMPS OVER THE LAY FOZ

TNE QUICK BROWN DOG JUMPS OVER TNE LAZY FOX

TME QUICK BRONS SOG JUMPS OVER TME AY FOX

TGE QUICE BROSM DOG JXMPS OVER TME LAZY FON

TNE QUICK BROMN DOG JUMPS OVER TNE AZV FOX

Page 19: PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

Testiranje i uspješnost

Testirano na 7 nepoznatih fontova

Pogrešna klasifikacija: 5,66 %

Baza slika za učenje: 26 x 19 slova

Baza slika za testiranje: 7 x 400 slova

Page 20: PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

Programska potpora

Programski jezik: c++

Korištenje funkcija knjižnice OpenCV

Visual Studio 2008

Page 21: PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

Zaključak

Uspješnost ostvarenog programskog sustava > 94%

Moguća poboljšanja: korištenje rječnika

Page 22: PROGRAMSKI SUSTAV ZA RASPOZNAVANJE TISKANOG TEKSTA

Hvala na pažnji

Pitanja?