osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

218

Click here to load reader

Upload: naca-maja

Post on 16-Jul-2016

264 views

Category:

Documents


31 download

TRANSCRIPT

Page 1: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf
Page 2: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf
Page 3: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Visoka škola elektrotehnike i računarstva

Dr Zoran Bojković Dr Dragoljub Martinović

OSNOVE MULTIMEDIJALNIH

TEHNOLOGIJA -udžbenik-

Beograd 2011.

Page 4: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Autori: dr Zoran Bojković i dr Dragoljub Martinović

Recenzenti: dr Bratislav Milovanović, dr Dušan Starčević

Lektor: Slavica Bajić, dipl. filolog

Tehnički urednik: mr Milica Mišić, dipl. inž. elektr.

Izdavač: Visoka škola elektrotehnike i računarstva strukovnih studija

Za izdavača: dr Dragoljub Martinović

Štampa: MST Gajić, Beograd

Tiraž: 20

Nastavno veće Visoke škole elektrotehnike i računarstva strukovnih studija na sednici održanoj 22.09.2011. godine odobrilo je izdavanje i korišćenje ovog udžbenika u nastavi. CIP – Katalogizacija u publikaciji Narodna biblioteka Srbije, Beograd 004.4'27(075.8)(0.034.2) BOJKOVIĆ, Zoran, Osnove multimedijalnih tehnologija [Elektronski izvor] / Zoran Bojković, Dragoljub Martinović. - Beograd : Visoka škola elektrotehnike i računarstva strukovnihstudija, 2011 (Beograd : MST Gajić). - 1 elektronski optički disk (CD-ROM) ; 12 cm Sistemski zahtevi: Nisu navedeni. - Nasl. sa etikete na disku. - Tiraž 20. - Bibliografija uz svako poglavlje. ISBN 978-86-7982-105-8 1. Martinović, Dragoljub, [koautor] a) Multimediji COBISS.SR-ID 186944524

Page 5: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

PREDGOVOR

Rukopis Osnove multimedijalnih tehnologija, posle pozitivne recenzije, Nastavno veće Visoke škole elektrotehnike i računarstva u Beogradu odobrilo je za korišćenje kao udžbenik za predmete Digitalne multimedije 1 i Digitalne multimedije 2. Pisan je s namerom da bude koristan svim studentima koji izučavaju multimedije na visokim školama i fakultetima.

U prvih sedam poglavlja autor dr Zoran Bojković izložio je fundamente ove oblasti koja se neprekidno razvija. Koautor dr Dragoljub Martinović izložio je, u osmom i devetom poglavlju, aplikativni aspekt multimedijalnih tehnologija.

Autori su zahvalni recenzentima dr Bratislavu Milovanoviću i dr Dušanu Starčeviću na korisnim primedbama, mr Milici Mišić na pomoći, redakciji i tehničkoj obradi, i Slavici Bajić, profesoru, na lekturi. Beograd, septembar, 2011. godine Autori

iii

Page 6: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

iv

Page 7: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

SADRŽAJ

1. Uvod ……………………………………………………………………………….... 1 1.1 Klasifikacija medija…………………………………………………………... 2 1.2 Osobine multimedijalnih sistema……………………………………………... 3 1.3 Konvergencija telekomunikacija i računara………………………………….. 4 1.4 Multimedijalni komunikacioni model………………………………………... 5 1.5 Korisnički zahtevi…………………………………………………………….. 6 1.6 Mrežni zahtevi………………………………………………………………... 7 1.7 Multimedijalni terminali……………………………………………………… 7 1.8 Paketski transfer………………………………………………………………. 8 1.9 Rezime………………………………………………………………………... 10 Pitanja………………………………………………………………………………… 11 Literatura……………………………………………………………………………... 11

2. Osnovi audia………………………………………………………………………. 13 2.1 Karakteristike zvuka………………………………………………………….. 13 2.2 Neke karakteristike čovečijeg slušnog sistema……………………………….. 15 2.3 Registrovanje audia…………………………………………………………… 16 2.4 Predstavljanje audio signala………………………………………………....... 16 2.5 Rezime………………………………………………………………………... 18 Pitanja………………………………………………………………………………… 18 Literatura……………………………………………………………………………... 19

3. Vizuelni efekti…………………………………………………………………….. 20 3.1 Neke karakteristike čula vida…………………………………………………. 21 3.2 Vidljivost šuma……………………………………………………………….. 23 3.3 Čovečiji vizuelni sistem………………………………………………………. 24 3.4 Vizuelni modeli……………………………………………………………….. 26 3.4.1 Monohromatski vizuelni model……………………………………... 26 3.4.2 Vizuelni model u boji………………………………………………... 28 3.4.3 Opšti model vizuelnog komunikacionog sistema……………………. 29 3.5 Rezime………………………………………………………………………... 31 Pitanja………………………………………………………………………………… 31 Literatura……………………………………………………………………………... 32

4. Audio-vizuelne integracije……………………………………………………... 33 4.1 Interakcija medija…………………………………………………………….. 33 4.2 Bimodalnost ljudskog govora………………………………………………… 34 4.3 Očitavanje sa usana…………………………………………………………… 35

v

Page 8: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

4.4 Praćenje usana………………………………………………………………… 37 4.5 Audio-vizuelno preslikavanje………………………………………………… 37 4.5.1 Konverzija na bazi klasifikacije……………………………………... 37 4.5.2 Audio i vizuelna integracija kod primena za očitavanje sa usana…… 38 4.6 Združeno audio-video kodovanje…………………………………………….. 38 4.7 Bimodalna personalna verifikacija…………………………………………… 39 4.8 Rezime………………………………………………………………………... 40 Pitanja………………………………………………………………………………… 40 Literatura……………………………………………………………………………... 41

5. Multimedijalna akvizicija podataka……………………………………….... 43 5.1 Diskretizacija kontinualnog signala…………………………………………... 43 5.2 Odmeravanje………………………………………………………………….. 44 5.2.1 Odmeravanje audio signala………………………………………….. 46 5.2.2 Odmeravanje dvodimenzionalnih (2-D) slika……………………….. 51 5.2.3 Niskopropusni anti-aliasing filtri……………………………………. 52 5.3 Digitalizacija audio signala…………………………………………………... 53 5.3.1 Analogno-digitalna konverzija……………………………………..... 54 5.3.2 Kriterijumi vernosti audio signala…………………………………… 55 5.4 Digitalizacija slika……………………………………………………………. 57 5.4.1 Vizuelna vernost……………………………………………………... 57 5.5 Rezime………………………………………………………………………... 58 Pitanja………………………………………………………………………………… 59 Literatura……………………………………………………………………………... 61

6. Kompresija teksta……………………………………………………………….. 62 6.1 Predstavljanje teksta u digitalnoj formi………………………………………. 62 6.2 Principi kompresije teksta, statistička suvišnost……………………………… 64 6.3 Shannon-ova teorema kodovanja za bešumni izvor………………………….. 67 6.4 Huffman-ovo kodovanje…………………………………………………….... 69 6.5 Aritmetičko kodovanje……………………………………………………….. 71 6.6 Rezime………………………………………………………………………... 74 Pitanja………………………………………………………………………………… 75 Literatura……………………………………………………………………………... 76

7. Standardi u multimedijalnim komunikacijama………………………….. 77 7.1 Značaj standardizacije………………………………………………………… 78 7.2 MPEG prilaz multimedijalnoj standardizaciji………………………………... 79 7.3 MPEG-1 standard…………………………………………………………….. 80

vi

Page 9: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

7.4 MPEG-2 standard…………………………………………………………….. 82 7.5 MPEG-4 standard…………………………………………………………….. 84 7.5.1 Delovi MPEG-4 standarda…………………………………………... 86 7.5.2 MPEG-4 standard: vizuelni deo……………………………………... 89 7.5.3 MPEG-4 standard: audio…………………………………………...... 90 7.5.4 H.264/AVC MPEG-4 (Part 10) standard……………………………. 91 Kodovanje i dekodovanje kod H.264/AVC standarda…................. 93 Entropijsko kodovanje kod H.264/AVC standarda……….............. 95 7.6 Kratak pregled standarda za kodovanje mirnih slika…………………………. 96 7.7 Standard JPEG 2000………………………………………………………….. 97 7.8 MPEG-7 standard…………………………………………………………...... 98 7.9 MPEG-21 standard…………………………………………………………… 101 7.10 ITU-T proces standardizacije kod audio-vizuelnih komunikacionih sistema… 104 7.10.1 Standardi za video kodovanje……………………………………...... 108 7.10.2 Standardi za kodovanje govora……………………………………… 112 7.10.3 Standardi za multimedijalno multipleksiranje i sinhronizaciju……… 113 7.11 Rezime………………………………………………………………………... 116 Pitanja………………………………………………………………………………… 117 Literatura……………………………………………………………………………... 119

8. Aplikativni aspekt multimedija………………………………………………. 124 8.1 Aplikativni aspekt osnovnih informaciono-komunikacionih pojmova………. 126 8.2 Osnove multimedijalne delatnosti……………………………………………. 129 8.2.1 Multimedijalna preprodukcija……………………………………….. 130 Prethodna analiza u preprodukciji………………………………… 130 Priča na tabli – Storyboard………………………………………... 132 Procena troškova………………………………………………….. 133 Radni tim za multimedijalnu produkciju………………….............. 133 8.2.2 Multimedijalna produkcija…………………………………………... 134 8.2.3 Multimedijalna postprodukcija……………………………………… 136 8.3 Slika u multimediji……………………………………………………………. 137 8.3.1 Memorisanje, prenos i prikazivanje slike……………………………. 137 8.3.2 Senzori slike…………………………………………………………. 138 8.3.3 Osnovne obrade slike………………………………………………... 139 8.3.4 Bitmapirana slika…………………………………………………….. 141 8.3.5 Vektorski generisane slike…………………………………………... 143 8.3.6 Promenljive slike u multimediji……………………………………... 146 8.4 Tekst u multimediji…………………………………………………………… 148 8.4.1 Standardi za digitalnu prezentaciju karaktera……………………….. 149

vii

Page 10: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

8.4.2 Font…………………………………………………………………... 150 8.4.3 Prikazivanje teksta na monitoru……………………………………... 151 8.4.4 Veličina, razmera i tip fontova………………………………………. 152 8.5 Animacija……………………………………………………………………... 154 8.5.1 Tradicionalna animacija……………………………………………... 155 8.5.2 Kompjuterska animacija……………………………………………... 157 8.5.3 Animacija u multimedijalnim sistemima……………………………. 160 Trodimenzionalni objekti u animaciji – 3D animacija……………. 160 Virtualna realnost u animaciji…………………………………….. 160 8.6 Zvuk u multimediji…………………………………………………………… 161 8.7 Dodir u multimediji…………………………………………………………... 163 8.8 Miris u multimediji…………………………………………………………… 165 8.9 Interakcija u multimediji……………………………………………………… 167 8.10 Rezime………………………………………………………………………... 168 Pitanja………………………………………………………………………………… 170 Literatura……………………………………………………………………………... 171

9. Aplikativni softver za multimedije…………………………………………... 172 9.1 Softverski alati za izradu multimedijalnih prezentacija………………………. 173 9.2 Softverski alati za obradu slika……………………………………………….. 174 9.2.1 Softverski alati za obradu bitmapiranih slika………………………... 174 9.2.2 Softverski alati za obradu vektorskih slika………………………….. 175 9.2.3 Softverski alati za editovanje pokretnih slika……………………….. 176 Program Adobe Premiere………………………………………..... 178 Program Final Cut Pro…………………………………………….. 179 9.2.4 Softverski alati za kreiranje animacija………………………………. 181 Program Adobe Flash…………………………………….............. 181 Program Autodesk Maya………………………………………….. 182 9.3 Programi za snimanje, obradu i editovanje zvuka……………………………. 186 9.3.1 Obrada zvuka pomoću Sound Forge-a………………………………. 187 Spektralna analiza u Sound Forge………………………………... 188 Uklanjanje šuma u Sound Forge-u……………………….............. 188 Dinamička kompresija u Sound Forge-u…………………………. 191 Promena učestanosti u Sound Forge-u……………………………. 193 9.4 Rezime………………………………………………………………………... 194 Pitanja………………………………………………………………………………… 195 Literatura……………………………………………………………………………... 196

Spisak skraćenica…………………………………………………………………….. 197

viii

Page 11: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

1. UVOD Prema standardu ISO/IEC JTC1 SC29/WG12, multimedija predstavlja sposobnost postupanja sa različitim vidovima prezentacionih medija koji čine tip podataka sa zadatkom da definišu prirodu informacije u njenom kodiranom formatu. Komunikacione tehnologije imaju veliki uticaj na razvoj savremenog društve. Pre pojave računara, novine, radio, bioskop i televizija bile su primerena sredstva za masovne komunikacije. Kada su ranih osamdesetih godina uvedeni personalni računari, malo ljudi bilo je u stanju da pretpostavi njihov ogroman uticaj na našu svakodnevnicu. Da bi se što efikasnije koristili računarski potencijali, prezentacija informacija treba da bude efikasno strukturirana kroz memorisanje, prenos i pretraživanje. Medijum je sredina (vazduh, voda) kroz koju se nešto prenosi. Pošto skraćenica “multi” predstavlja multipl, multimedija se odnosi na sredstva komunikacije sa više od jednog medijuma [1.1]. Multimedijalne tehnologije su glavna pokretačka snaga za uvođenje čitavog niza pogodnosti i primena sa tačke gledišta korisnika. Radi se o interaktivnom predstavljanju govora, audija, videa, grafike, teksta, uz činjenicu da informacione tehnologije povezuju komunikacije, računarsku tehniku, i procesiranje signala u jednu interdisciplinarnu celinu. Pri razmatranju problematike multimedijalnih tehnologija, pored ostalog, treba uzeti u obzir [1.2]:

• Kontinualni trend u digitalizaciji, • Brzo širenje digitalnih mreža i naročito interneta, • Konvergenciju različitih tehnologija, uključujući komunikacije, distribuciju digitalnih

medija, informacione tehnologije, • Pojavu novih komunikacijskih servisa i primene koje potiču od interneta i bežičnih

tehnologija, • Zahtev za multimedijalnim komunikacijama u realnom vremenu kao proširenje

monomedijalnih sistema. Sa tačke gledišta multimedijalnih komunikacija, cilj je da se najpre obezbede one

primene kojima se integrišu tekst, zvuk i video informacija, a da se pri tome omogući u svakom trenutku, interakcija. Pre svega, aplikacije Međunarodne unije za telekomunikacije (eng. International Telecomunications Union – ITU) i Grupe eksperata za obradu pokretne slike (eng. Motion Picture Expert Group – MPEG) treba da budu uzete u obzir. One podrazumevaju integracije, interaktivnosti, memorisanja, striminga, pretraživanja i distribucije digitalnih medija, kao i odgovarajuću infrastrukturu. S tačke gledišta aplikacionog sloja značajni su i mobilni servisi, korisnički intrerfejsi i mobilni pristupi bazama podataka. Sa druge strane, na mrežnom

1

Page 12: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

sloju, naglasak je na kontroli pristupa, alokaciji resursa i širine propusnog opsega, kontroli zagušenja saobraćaja, i modeliranju saobraćaja. Jednako je značajan i kvalitet servisa (eng. quality of service – QoS) u mrežnim multimedijalnim sistemima. Zahtev za kvalitet servisa i odgovarajući parametri moraju biti u skladu sa garancijama QoS [1.3].

Nagli razvoj multimedijalnih tehnologija, i mogućnosti razmene multimedijalnih sadržaja preko interneta, doprineli su značaju povećanja količine multimedijalnih podataka i to kako broja dokumenata, tako i veličine pojedinih fajlova. Uz to, pojavila se i potreba za efikasnim tehnikama kompresije, pretraživanja i pronalaženja željenih multimedijalnih dokumenata. Treba istaći da se u srcu širokopojasnih mreža nalaze tehnologije koje omogućavaju brzi prenos podataka prenosnim putevima velikog kapaciteta između različitih tačaka u mreži.

1.1 Klasifikacija medija

Naglašeno je da multimedija predstavlja raznolikost medija. Mediji se mogu klasifikovati prema kriterijumima: percepciji, predstavljanju, prikazivanju, memorisanju, prenosu, sadržaju, itd.

U tipičnom multimedijalnom okruženju, informacija se prenosi zainteresovanim korisnicima putem naših čula sluha, vida, mirisa, dodira i ukusa. Međutim, najčešće se u multimedijalnim sistemima koriste audio i vizuelne informacije. Tehnologije za uključenje ostalih čula: mirisa, dodira i ukusa zahtevaju dodatna istraživanja [1.4]. U okviru tekućih multimedijalnih tehnologija tekst, mirne slike – image i pokretne slike – video, pripadaju vizuelnom mediju, dok se muzika i govor tretiraju kao auditorni medijum.

Što se tiče predstavljanja (eng. representation), medijum je okarakterisan internim računarskim predstavljanjem. Na primer, slova iz nekog teksta mogu se predstaviti korišćenjem Američkog standardnog koda za razmenu informacija (eng. American standard code for information interchange – ASCII), audio signali putem impulsno kodno modulisanih (eng. pulse code modulation – PCM) odbiraka, podaci o mirnoj slici memorisanjem PCM ili Grupe eksperata za fotografiju (eng. Joint Photographic Experts Group - JPEG) formata, dok se video podaci mogu predstaviti, na primer u obliku PCM ili MPEG formata.

Prikazivanje (eng. presentation) se odnosi na alate i uređaje koji prikazuju ulaznu i izlaznu informaciju. Tako na primer, novine, ekrani, i zvučnici su izlazni mediji, dok tastatura, miš, mikrofon i kamera čine ulazne medije.

Memorisanje se tiče prenosioca podataka koji objedinjuje memorisanje informacije. Novine, mikrofilmovi, magnetni i optički diskovi služe za memorisanje informacija.

Kontinualni prenos podataka omogućavaju mediji kao što su optički kablovi, koaksijalni kablovi, slobodan vazdušni prostor (za bežični prenos).

Najzad, poznata je klasifikacija medija na diskretne i kontinualne. Diskretni mediji su vremenski nezavisni, dok su kontinualni vremenski zavisni. Za diskretne medije (na primer tekst, grafika) obrada podataka nije vremenski kritična, dok su kod kontinualnih medija predstavljanje i obrada podataka vremenski zavisni. Na Slici 1.1.1 prikazano je nekoliko primera podataka za diskretne i kontinualne medije kao i karakteristične primene.

I neki drugi signali mogu takođe da se tretiraju kao multimedijalni podaci. To su, na primer, izlazi iz različitih senzora kao što su detektori dima, vazdušnog pritiska, temperature (kontinualni mediji).

2

Page 13: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

MULTIMEDIJALNI PODACI

DISKRETNI KONTINUALNI

PODACI: TEKST MIRNA SLIKA AUDIO VIDEO

NEINTER- AKTIVNI

INTERAK-TIVNI

KNJIGE SLAJDOVI

RAZGOVORI U MREŽI

DVD FILMOVI TV/AUDIO DISTRIBUCIJA

VIDEO KONFER. INTERAKTIVNA TELEVIZIJA

NEINTER- AKTIVNI

INTERAK-TIVNI

INTERAK- TIVNOST:

PRIMENE, PRIMERI:

Slika 1.1.1—Primeri podataka za diskretne i kontinualne medije i karakteristične primere

1.2 Osobine multimedijalnih sistema

Formalno gledano, svaki sistem koji podržava dva ili više medija mogao bi se nazvati multimedijalni. Dnevne novine, na primer, predstavljaju multimedijalnu prezentaciju, jer obuhvataju tekst i mirnu sliku kao ilustraciju. Bez obzira na sve, multimedijalni sistem treba da obuhvati i kombinaciju medija, nezavisnost, računarski podržanu integraciju i mogućnost komuniciranja.

Kombinacija medija podrazumeva dva ili više medija pri čemu se ide na specifikaciju tipova medija. Neki istraživači predlažu da postoji najmanje jedan kontinualan (vremenski zavisan) i jedan diskretan (vremenski nezavisan) medij [1.5]. U tim uslovima, sistem za obradu teksta, koji može da inkorporira mirne slike, ne bi predstavljao multimedijalni sistem (oba medija su diskretna). Pojedini istraživači prihvataju opštije definicije multimedija.

Različiti mediji u multimedijalnom sistemu treba da poseduju visok stepen nezavisnosti. Ovaj kriterijum obezbeđuje nezavisno procesiranje različitih tipova medija i fleksibilnost prilikom kombinacije ovakvih medija.

Da bi se postigla nezavisnost medija potrebno je nezavisno procesiranje. Što se tiče multimedijalnih sistema, kompjuteri obezbeđuju još jednu važnu osobinu – mogućnost integracije. Različiti mediji u multimedijalnom sistemu trebalo bi da budu integrisani. Visok stepen integracije obezbeđuje da promene sadržaja jednog medija dovode do odgovarajućih promena u drugom mediju. U današnjem visokoumreženom svetu, multimedijalni sistemi mogu

3

Page 14: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

komunicirati međusobno tako što se kroz mrežu prenose multimedijalni podaci u diskretnom ili kontinualnom obliku.

1.3 Konvergencija telekomunikacija i računara

Konvergencija telekomunikacija i računara, čiji smo svedoci već duže vreme, ima veliki uticaj na tehnologiju, industriju i šire slojeve društva [1.6]. Da bi se ovo bolje shvatilo, usvojićemo model sa tri nivoa za mrežu koja služi za prenos informacija, uz mogućnost pružanja odgovarajućih servisa. Pogodan model prikazan je na Slici 1.3.1. pri čemu ćemo za sada samo navesti middleware i transportni sloj.

APLIKACIJE

MIDDLEWARE

TRANSPORTNI SLOJ

Slika 1.3.1—Model sa tri nivoa mreže Middleware sloj služi za stvaranje multimedijalnih aplikacija na brz i robusan način.

Transportni sloj obezbeđuje pouzdan transparentan prenos multimedijalnih podataka između krajnjih tačaka u mreži.

Aplikacije tretiramo kao skup funkcija koje obezbeđuju zahteve korisnika. Primeri mrežnih aplikacija su elektronska pošta, telefonija, pristup bazi podataka, transfer fajla, video konferencija. Primeri servisa odnose se na audio ili video transport, upravljanje sistemom fajla, štampanje, mehanizme elektronskog plaćanja, kao i na enkripciju uz pouzdan prenos podataka.

Svaki korisnik u slučaju umrežene aplikacije nalazi se u interakciji sa lokalnim terminalom koji komunicira sa udaljenim računarima ili drugim korisnicima u mreži. Mrežne aplikacije podrazumevaju interakciju korisnika sa serverom ili sa drugim korisnikom. Na Slici 1.3.2 dati su primeri arhitektura za multimedijalne mrežne aplikacije i to: korisnik – korisnik na Slici 1.3.2-a, korisnik – dva korisnika na Slici 1.3.2-b, više korisnika – server na Slici 1.3.2-c, i korisnik – server – korisnik na Slici 1.3.2-d.

Slika 1.3.2—Primeri arhitekture za mrežne multimedijalne aplikacije

a) b) KORISNIK KORISNIK KORISNIK

c) d) KORISNIK

KORISNIK

KORISNIK

S E R V E R

KORISNIK

KORISNIK

KORISNIK

SERVER

KORISNIK

4

Page 15: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

1.4 Multimedijalni komunikacioni model

Na multimedijalni komunikacioni model strogo utiču rešenja proizvođača opreme za personalne računare i radne stanice, uključujući odgovarajući aplikacioni softver sa jedne, i koncept intiligentne mreže sa druge strane [1.7]. Slojeviti model za današnje i buduće multimedijalne komunikacije obuhvata pet komponenata:

• Deobu kompletnih informacionih objekata prema različitim vrstama informacija (podaci,

audio, video) radi lakšeg komuniciranja, memorisanja i obrade, pri čemu se vodi računa o mogućnosti integracije različitih tipova multimedija,

• Standardizaciju servisnih komponenata zavisno od vrste informacije, po mogućnosti sa nekoliko nivoa kvaliteta,

• Stvaranje platforme za dva nivoa: platforme za mrežni servis i multimedijalne komunikacione platforme,

• Definisanje opštih aplikacija za višestruku namenu u različitim multimedijalnim okruženjima,

• Specifične primene: elektronske kupovine, učenje na daljinu, pri čemu se koristi platforma za mrežni servis i multimedijalna komunikaciona platfoma.

S obzirom na mogućnost dostupnosti resursa u svakom pojedinačnom slučaju,

multimedijalne komunikacione aplikacije moraju biti skalabilne. Generalno, multimedijalni komunikacioni model koristi dve vrste komunikacija, kao što

je prikazano na Slici 1.4.1. KORISNIČKI

INTERFEJS

KORISNIČKI INTERFEJS

KORISNIČKI INTERFEJS TRANSPORT

TRANSPORT PROCESIRANJE, MEMORISANJE,

TIP A

TIP B

PRETRAŽIVANJE

Slika 1.4.1— Dva tipa multimedijalnih komunikacijskih modela

Kod tipa A postoji korisnički interfejs koji obezbeđuje da svi korisnici budu međusobno povezani dok transportni sloj prenosi multimedijalni signal od jednog do drugog korisnika, ili ka svim korisnicima u komunikaciji. Korisnički interfejs kreira multimedijalni signal i omogućava korisnicima interakciju na najlakši način. Transportni sloj čuva kvalitet multimedijalnog signala kako bi ga svaki od korisnika primio na što kvalitetniji način. Neki od primera za tip A su telekonferencija, radiodifuzija, videofoni, učenje na daljinu, kao i scenarija koji se odnose na deobu radnog prostora.

Kod tipa B, postoji korisnički interfejs za interakciju, i transportni sloj za prenos multimedijalnog signala od memorije do korisnika. Takođe, postoji i mehanizam za memorisanje i pretraživanje multimedijalnih signala koje kreira, ili zahteva korisnik. Pored memorisanja i pretraživanja postojećih multimedijalnih podataka, od najvećeg značaja su memorisanje i

5

Page 16: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

ažuriranje ovih podataka. Neki primeri za tip B uključuju difuziju, video, arhive dokumenata iz digitalne biblioteke, pristup poslovnim sastancima, itd.

1.5 Korisnički zahtevi

Korisniku je potreban multimedijalni informacioni sistem koji priprema i predstavlja informaciju od interesa, dozvoljava dinamičku kontrolu aplikacija i obezbeđuje prirodan interfejs. Sa tačke gledišta korisnika najvažniji zahtevi multimedijalnih komunikacija su sledeći:

• Brze pripreme i prezentacije različitih tipova informacija od interesa, vodeći računa o sposobnosti i dostupnosti terminala i servisa,

• Dinamička kontrola multimedijalnih primena, s obzirom na interakcije konekcije i kvalitet na zahtev kombinovan sa interfejsima čovek – mašina,

• Podržavanje korisnika imajući u vidu njihove individualne mogućnosti, • Standardizacija.

Sa tačke gledišta korisnika, njihovi zahtevi u pogledu servisa su definisani putem medija, sadržaja koji se prenose, tipa komunikacija, kao i mogućnosti da se kombinuju ova tri faktora. S druge strane multimedijalni korisnički servisi mogu se podeliti na tri kategorije: lokalni (neinteraktivni i interaktivni), udaljeni neinteraktivni i udaljeni interaktivni. Takođe se mogu podeliti na servise za rezidencijalnu, mobilnu i biznis upotrebu. U Tabeli 1.5.1 prikazan je kontekst u kome se mogu koristiti multimedijalni servisi [1.8].

Uslovi korišćenja servisa definišu se zavisno od njihove hitnosti, mesta, nezavisnosti. Terminali i servisi obično se koriste u kancelarijama, kod kuće, u prevoznim sredstvima, ili na javnim mestima. Nezavisnost se može definisati kao mogućnost prenošenja terminala i njegove nezavisnosti od date infrastrukture, sa tačke gledišta korisnika. Stepen nezavisnosti varira od jednog do drugog terminala. S druge strane, stepen hitnosti određuje da li će servis biti obezbeđen u realnom vremenu, ili je dovoljno oflajn servis.

Tabela 1.5.1—Kontekst u kome se mogu koristiti multimedijalni servisi

Lokalni Udaljeni neinteraktivni Udaljeni interaktivni Rezidencijalni: zabava (TV), umetnost, podučavanje, igre

Difuzija Telefonija, videofoni, kupovina od kuće, igre, konsultacije na daljinu, video na zahtev

Mobilni: prezentacije, demonstracije

Difuzija, bezbednost na daljinu, monitoring

Upravljanje, ugovaranje

Biznis: multimedijalna prezentacija, vežbanje, konsultacija baze podataka

Telekonferencija, vežbanje na daljinu, nadgledanje na daljinu

Video sastanak, videokonferencije, učenje na daljinu, upravljanje, bezbednost na daljinu, monitoring, daljinska dijagnostika

Postoje mnogobrojni ključni zahtevi zajednički za sve multimedijalne servise: trenutna dostupnost, prenos informacija u realnom vremenu, servis onlajn, pristup terminala bilo kom servisu, itd.

6

Page 17: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

1.6 Mrežni zahtevi Sa tačke gledišta mreže, najvažniji zahtevi multimedijalnih tehnologija ogledaju se u sledećem:

• Velike brzine i promene bitskih protoka, • Nekoliko konekcija koje koriste isti pristup, • Sinhronizacija različitih tipova konekcija, • Pogodni standardizovani servisi i dodatni servisi koji podržavaju multimedijalne

aplikacije. Zahtevi za primenama u komunikacijskim servisima mogu se podeliti na saobraćajne i finkcionalne zahteve. Saobraćajni zahtevi uključuju širinu propusnog opsega, kašnjenja i pouzdanost. Mogu se zadovoljiti korišćenjem upravljanja resursom. Uspostavljaju relaciju između prenošenja podataka i resursa, i obezbeđuju prenos audio-vizuelnih podataka. Informacija o potrebnim resursima zato mora biti dostupna u svim čvorovima koji učestvuju u distribuiranim aplikacijama, krajnjim i centralnim sistemima, tokom prenosa podataka. Stoga, resursi treba da budu nezavisni, a u čvorovima se uspostavlja takvo stanje koje označava da je veza uspostavljena. Funkcionalni zahtevi podrazumevaju višedifuzni prenos, i sposobnost definisanja koordiniranih nizova podataka.

Postojeće fiksne i mobilne mreže karakterisane su takvom arhitekturom koja obezbeđuje upravljanje saobraćajem, različitim konfiguracionim mogućnostima, servisnim platformama i dobro definisanim tačkama interkonekcije između mreže različitih operatora. Ključni zahtev svodi se na to da bi isti visokokvalitetni mrežni servisi trebalo da postoje kada se grade integrisane mrežne platforme za govor, podatke i multimedijalne servise [1.9]. Buduća multimedijalna mreža mora da bude tako organizovana da podrži intenzivan saobraćaj, široku lepezu servisa i različite oblike saobraćaja, kada je reč o efikasnom rutiranju saobraćaja i preopterećenju u mreži. Mreža se mora, takođe, brzo adaptirati na stalne promene saobraćajnih uslova.

1.7 Multimedijalni terminali Multimedijalni terminali služe za pretraživanje, memorisanje i difuziju pisanog sadržaja (podaci), zvuka i vizuelnog sadržaja. Arhitektura ovih sistema može se definisati na osnovu različitih prilaza na bazi obrade telekomunikacionih podataka i audio-vizuelnih tehnologija. Uključivanjem glasa i podataka, kao i mirne i pokretne slike u komunikacije, raste sofisticiranost u pogledu pristupa distribuiranim resursima, uz značajnu uštedu vremena u procesu odlučivanja. Dijalog na daljinu, diskusija, proizvodnja informacija, održavanje i nadzor, omogućeni su uvođenjem multimedijalnih sistema po ceni koja stalno opada. Postojeća rešenja nude, na primer, multimedijalnu kancelariju, ili kompjutersku radnu stanicu sa strogo namenskom opremom, kao što su telefonski terminali, videofoni, ili telekonferencijski sistemi. Multimedijalna radna stanica u kućnom i kancelarijskom okruženju prikazana je na Slici 1.7.1 na nivou blok-šeme. Set – top box je uređaj koji se primenjuje na standardni TV prijemnik i omogućava prijem digitalnih TV signala, pristup internetu, itd. Sabirna magistrala predstavlja jednu ili više provodnika koji služe kao zajednička veza za prenos signala između određene grupe uređaja. Eternet mreža koristi tzv.

7

Page 18: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

postupak višestrukog pristupa uz detekciju (eng. carrier sence multiple access with collision detection – CSMA/CD).

BRZA EKSTERNA MREŽA

LAN, KABLOVSKA, SATELITSKA

Slika 1.7.1—Blok-šema multimedijalne radne stanice u kućnom i kancelarijskom okruženju

Današnji terminali osposobljeni su za širokopojasne multimedijalne aplikacije. Radi se o personalnim računarima uz dodatne telekomunikacione i video – audio mogućnosti, kao i o inteligentnim TV prijemnicima uz dodatne mogućnosti interaktivnosti. Istovremeno, televizija visoke rezolucije (eng. high-definition television – HDTV) utrla je put digitalnoj televiziji. Obezbedila je memorisanje, procesore za mirnu sliku i video, kao i ravne ekrane [1.10]. Oprema za multimedijalni terminal sadrži, takođe, odgovarajuće kamere, skenere, štampače i memoriju. Pored toga, potrebna je i specijalna oprema za editovanje multimedijalnih informacija što podrazumeva kreiranje, naizmenično ponavljanje i poništavanje struktura sadržaja. Uređaji za trodimenzionalni (eng. three-dimesional – 3D) displej i sistem za prepoznavanje govora olakšaće bržu i lakšu interakciju čoveka sa multimedijalnim promenama. Radi se o tome da se postigne što lakša integracija svih oblika informacija, uz obezbeđenje odgovarajućih bitskih brzina.

1.8 Paketski transfer

U poređenju sa komutacijom kanala, paketska komutacija pruža dinamičku alokaciju (raspored) širina propusnog opsega i komutacionih resursa. Paketske mreže omogućavaju transport integracionog servisa. One prenose glas, video i podatke koristeći iste hardverske protokole. Uz to, paketska komutacija ne zahteva od korisnika da alocira kanal ili širinu propusnog opsega prenosa podataka. Pošto više korisnika može da šalje pakete po zajedničkom kanalu, resursi u paketskim mrežama koriste se efikasnije nego u mrežama sa komutacijom

KANCELARIJSKO/ KUĆNO OKRUŽENJE

INTERAKTIVNA TV

TF LINIJA

LAN/ETERNET MREŽA

Set – Top Box MODEM

VIDEO RIKORDER

KAMERA

RAČUNAR

SABIRNA MAGISTRALA

KUĆNO OKRUŽENJE

8

Page 19: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

kanala. Video signali su naročito pogodni za paketsku komutaciju. Slike obično sadrže oblasti sa više ili manje detalja, kao i periode bržih i sporih pokreta. Otuda, video kanali treba da budu u stanju da daju nizove podataka sa promenljivim bitskim protokom [1.11], [1.12]. Paketske mreže prenose direktno signale promenljivih bitskih brzina (eng. variable bit rate – VBR). Na strani predajnika nije potrebna bafer memorija niti kontrola bitskog protoka u povratnoj sprezi. Pod bafer memorijom podrazumeva se mesto za skladištenje podataka koji se koriste u toku obrade i prenosa. U principu, bafer se koristi i pri povezivanju mreža za kompenzaciju razlike u brzini obrade signala između mrežnih uređaja. Treba naglasiti i to da paketske mreže koje obezbeđuju prioritet paketima istovremeno omogućavaju video koderima da zaštite kritičnu informaciju. Takođe, paketski video-transfer kroz mrežu za asinhrono multipleksiranje sa vremenskom raspodelom kanala (eng. asynchronous time division multiplexing – ATDM) – vremenski multipleks ili internet, podrazumeva kodovanje i prenos digitalnog video signala pri čemu se vodi računa o kvalitetu prijemnog signala. U principu, ATDM podrazumeva tehniku multipleksiranja kod koje se prenos ostvaruje u obliku nezavisnih vremenskih intervala koji se popunjavaju označenim paketima saglasno realnim trenutnim potrebama svake aplikacije. U tom slučaju, terminalna oprema (tj. korisnička aplikacija) definiše trenutni bitski protok, bez obzira na to koliko on iznosi, a koji se može menjati u toku trajanja same komunikacije. Na Slici 1.8.1 dat je jedan primer za transfer digitalnog video signala.

VIDEO SIGNAL

KODER - TRANSFORMACIJA - KVANTIZACIJA - ENTROPIJSKO KODOVANJE - KONTROLA BINARNOG PROTOKA

APLIKACIJA - STRUKTURIRANJE PODATAKA

MREŽNO MULTIPLEKSIRANJE/RUTIRANJE

- KOREKCIJA GREŠAKA UNAPRED

- DETEKCIJA GREŠAKA - DETEKCIJA GUBITAKA - KOREKCIJA GREŠKE

APLIKACIJA - RESINHRONIZACIJA

DEKODER - ENTROPIJSKO DEKODOVANJE - INVERZNA TRANSFORMACIJA - PRIKRIVANJE GUBITAKA - POSTPROCESIRANJE - DEKVANTIZACIJA

KORISNIK

Slika 1.8.1—Operacije prilikom paketskog transfera digitalnog video signala

U mrežama sa internet protokolom, paketi su promenljive dužine i ne postoji prethodno

uspostavljanje putanje – ruta. Kašnjenje i paketski gubici neizbežni su [1.13], [1.14]. Internet protokol (eng. internet protocol – IP) služi za međumrežni rad koji obezbeđuje nekonektivni

9

Page 20: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

servis kroz više mreža sa komutacijom paketa. IP obezbeđuje funkcije adresiranja, specifikacije tipa servisa, rastavljanje i ponovno sastavljanje i zaštite. IP je specificiran u dokumentu “Zahtev za komentar REC791” (eng. request for comment – REC). REC-ovi predstavljaju standarde i preporuke na osnovu kojih funkcioniše internet. Ove preporuke objavljuje Grupa za IP standarde (eng. Internet Engineering Task Force – IETF). Ova međunarodna organizacija za standarde sastoji se od preko 80 radnih grupa i bavi se oblastima vezanim za razvoj protokola kontrole prenosa/internet protokola (eng. transmission control protocol/internet protocol – TCP/IP). Protokol je razvijen u SAD od strane Ministarstva odbrane, za potrebe međunarodnog rada na sloju 3(IP) i pouzdanog prenosa na sloju 4 za dvoslojno bezbedno rutiranje (eng. two-level secure re-routing – TSR) zasnovan na klizećem prozoru i retransmisijama. Danas se ova skraćenica koristi za referenciranje na čitavu grupu protokola na internetu.

Najbolji izbor za video-transfer je statističko multipleksiranje uz garanciju kvaliteta. Novi spojni putevi u mreži su obezbeđeni ukoliko se može unapred garantovati traženi kvalitet, imajući u vidu opterećenje mreže na bazi utvrđenog saobraćajnog toka.

1.9 Rezime Trend u multimedijalnim komunikacijama ogleda se u obezbeđenju servisa koji integrišu tekst, zvuk, mirnu i pokretnu sliku, uz jednostavnost upotrebe i odgovarajuću interaktivnost. S druge strane, termin multimedijalne komunikacije odnosi se na predstavljanje, memorisanje, pretraživanje i širenje vremenski obrađene informacije u obliku teksta, mirne i pokretne slike, grafike, govora, zvuka, animacije, rukom pisanog teksta, fajlova podataka, kao što je to prikazano na Slici 1.9.1.

AUDIO KOMUNIKACIJA (TELEFONIJA, PRENOS ZVUKA)

MULTIMEDIJALNA KOMUNIKACIJA

PRENOS TEKSTA I MIRNE SLIKE

PRENOS PROMENLJIVIH

SLIKA

Slika 1.9.1—Multimedijalna komunikacija

Osnovni elementi komunikacionih modela su: obrada, memorisanje, pretraživanje,

transport i korisnički interfejs. Što se tiče korisnika, njemu je potreban sistem koji priprema i predstavlja informaciju, omogućuje dinamičko upravljanje odgovarajućim informacijama i obezbeđuje interfejs. S tačke gledišta mreže, najvažniji zahtevi odnose se na velike bitske protoke, sinhronizaciju različitih tipova informacija i na odgovarajuće standardizovane servise. Opšte funkcije mreže kod paketskog transfera od izvora do korisnika su rutiranje i multipleksiranje. Rutiranjem se obezbeđuje povezanost čvorova u mreže nezavisno od tipa informacije koja se prenosi. Multipleksiranjem se obezbeđuje kvalitet prenosa. Pri tome treba uzeti u obzir saobraćajne karakteristike i kvalitet aplikacija koje zahteva korisnik.

10

Page 21: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Pitanja

1. Šta je to multimedija? 2. Koje faktore treba uzeti u obzir pri razmatranju problematike multimedijalnih

tehnologija? 3. Kakva je funkcija aplikacionog i mrežnog sloja u multimedijalnim komunikacijama? 4. Navesti i analizirati kriterijume prema kojima se sprovodi klasifikacija medija. 5. Koje elemente treba da obuhvati jedan multimedijalni sistem? 6. Šta su to kontinualni mediji i kako se uključuju u multimedijalni sistem? 7. U čemu se ogleda značaj nezavisnosti medija u okviru multimedijalnog sistema i kako

se ona postiže? 8. Nacrtati četiri blok-šeme arhitekture za mrežne multimedijalne aplikacije. 9. Koje komponente sadrži slojeviti model za multimedijalne komunikacije?

10. Oblici multimedijalnih komunikacionih modela: uloga i značaj pojedinih elemenata. Navesti odgovarajuće blok-šeme.

11. Koji su najavažniji zahtevi multimedijalnih komunikacija sa tačke gledišta korisnika? 12. Koje su sve kategorije multimedijalnih komunikacionih servisa? 13. Koji su uslovi korišćenja multimedijalnih servisa? 14. Šta su osnovni zajednički zahtevi kod uvođenja multimedijalnih servisa? 15. Koji su najvažniji mrežni zahtevi multimedijalnih komunikacija? 16. Koja je razlika između saobraćajnih i funkcionalnih zahteva u multimedijalnoj mreži? 17. Koje uslove u pogledu organizovanosti treba da ispuni jedna multimedijalna mreža? 18. Koje su funkcije multimedijalnih terminala? 19. Navesti neophodnu opremu za multimedijalne terminale. 20. Koje su karakteristike paketskog transfera multimedijalnih podataka? 21. Čime se karakteriše paketski video transfer kroz mrežu za asinhrono multipleksiranje

sa vremenskom raspodelom kanala?

Literatura [1.1] M. Kr. Mandal, Multimedia Signals and Systems. Kluwer Academic Publishers, 2003. [1.2] K. R. Rao, Z. S. Bojković, and D. A. Milovanović, Introduction to Multimedia

Communications: Applications, Middleware, Networking. Wiley, 2006. [1.3] N. Chapman and J. Chapman, Digital Multimedia. Wiley, 2000. [1.4] T. N. Ryman, “Computers learn to smell and taste,” Expert Syst., vol. 12, no. 2, pp.

156–161, May 1995. [1.5] R. Steinmetz and K. Nahrstedt, Multimedia: Computing, Communications and

Applications. Prentice Hall, 1996. [1.6] D. G. Messerschmitt, “The convergence of telecommunications and computing: what

11

Page 22: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

are the implications today”? Proc. IEEE, vol. 84, pp. 1167–1186, 1996. [1.7] K. Watabe et al., “Distributed desktop conferencing system with multiuser multimedia

interface,” IEEE J. Sel. Areas Commun., vol. 9, pp. 531–539, May 1991. [1.8] K. R. Rao, Z. S. Bojković, and D. A. Milovanović, Multimedia Communication

Systems; Techniques, Strandardes, and Netwoks. Prentice Hall, 2002. [1.9] E. Fouques, “Switching and routing: providing value with multimedia services,” Alcatel

Telecommun. Rev., no. 3, pp. 198–204, 1999. [1.10] Z. S. Bojković, “Digital HDTV system compression,” J. Commun., vol. 45, pp. 2–10,

May–Jun. 1994. [1.11] L. Chiariglione and L. Corgnier, “System consideration for picture communications,” in

Proc. IEEE Int. Conf. on Communications, ICC '84, Amsterdam, Netherlands, pp. 245–249.

[1.12] Z. S. Bojković, “Some issues in packet video: Modeling, coding and compression,” in 2nd Int. Workshop Image and Signal Processing: Theory, Methodology, Systems and Applications, Budapest, Hungary, Nov. 1995, pp. 2–23.

[1.13] G. Karlsson, “Asynchronous transfer of video,” Swedish Institute of Computer Science, Kist, Sweden, Res. Rep. R95:14, 1997.

[1.14] P. White and J. Groweroft, “The integrated services in the Internet: State of the Art,” Proc. IEEE, vol. 85, pp. 1934–1946, Dec. 1997.

12

Page 23: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

2. OSNOVI AUDIA

2.1 Karakteristike zvuka Kada proizvedeni zvučni talas dođe do uha i obradi ga mozak, čujemo zvuk. Zvuk, kao i

svaki talas, ima osobine koje uključuju refleksiju, refrakciju i difrakciju. Zvučni talas ima svoju frekvenciju, amplitudu (glasnost) i anvelopu (talasni oblik). Audio sistemi su uneli mnogo specifičnih karakterisitka koje su rezultat izuzetnih zahteva čula sluha kao krajnjeg korisnika zvučnih informacija. Izvesne specifičnosti proizilaze kao posledica velikog informacionog polja koje je određeno rasponom dinamičkog opsega reda veličine 100 dB i više, uz frekvencijski opseg širine od 20 Hz do 20 kHz. Treba dodati i činjenicu da čulo sluha ima veliku osetljivost i detekciju različitih vrsta izobličenja signala. Frekvencijski opseg zvuka može se podeliti u četiri kategorije:

• Infra zvuk: od 0 Hz do 20 Hz, • Zvuk koji se čuje: od 20 Hz do 20 kHz (audio opseg), • Ultrazvuk: od 20 kHz do 1 GHz, • Hiperzvuk: od 1 GHz do 10 GHz.

Audio opseg se razlikuje od osobe do osobe, a reakcija uha na zvuk visoke frekvencije

pogoršava se starenjem. Srednjovečni ljudi, sa dobro očuvanim slušnim sistemom, čuju zvuke frekvencije iznad 15 kHz. Zvučni talasi prostiru se brzinom od 340 m/s pri sobnoj temperaturi (20 °C). Stoga, talasna dužina varira od 17 m (odgovara frekvenciji od 20 Hz) do 1.7 cm (odgovara frekvenciji od 20 kHz). Spektar audio signala sadrži frekvencije, njihove harmonike, moguće je i modulacione produkte. Najveći broj osnovnih frekvencija zvučnih talasa je ispod 5 kHz. Zvučni talasi u opsegu 5 kHz do 15 kHz uglavnom se sastoje od harmonika. Harmonici i njihove amplitude određuju kvalitet zvuka. To omogućuje da se razlikuju zvuci koji dolaze iz različitih izvora (glas, muzički instrument, npr. klavir ili gitara). Intezitet ili amplituda zvuka odgovara glasnosti kojom ga uho registruje. Za zvuk ili audio-registrovanje i reprodukciju, intezitet zvuka se izračunava na dva načina. Najpre se može izraziti na akustičnom nivou, što predstavlja intezitet koji uho registruje. Drugo, može se izraziti na električnom nivou, jer je zvuk konvertovan u električni signal. U oba slučaja, intezitet se izračunava u dB. Akustički, intezitet zvuka meri se preko nivoa zvučnog utiska, tj.,

13

Page 24: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

( ) 10ref

Intenzitet zvuka dB 20 log P=P

⎛ ⎞⎜⎝ ⎠

⎟ (2.1.1)

gde je P akustična snaga zvuka, Pref intenzitet zvuka na pragu čujnosti. Utvrđeno je da je karakteristična vrednost za Pref = 0.0002 dyn/cm2 [2.1] ili Pref = 2 × 10−5 Pa. Ova vrednost se koristi u (2.1.1) za obrađivanje intenziteta zvuka. Treba istaći da je uho neosetljivo na nivoe zvučnog pritiska manje od Pref . Intezitet audio signala izražava se preko nivoa električne snage, tj.,

( ) 100

Intenzitet zvuka dBm 10 log P=P

⎛ ⎞⎜⎝ ⎠

⎟ (2.1.2)

gde je P snaga audio signala, P0 1 mW. Sufiks “m” u dB stavljen je zato što se intezitet zvuka menja u odnosu na snagu od 1 mW. Na Slici 2.1.1 prikazane su granice čujnosti i područja govora i muzike.

Slika 2.1.1—Granice čujnosti i područja govora i muzike

Važna karakterisitka zvuka je njegova anvelopa. Tipična anvelopa sastoji se iz četiri sekcije: porast, opadanje, podrška i vraćanje na početnu vrednost amplitude. Jedan primer za muzičku notu dat je na Slici 2.1.2.

U toku porasta anvelope, intezitet zvuka raste do najvišeg nivoa, zatim opada do nekog srednjeg nivoa na kome je podešen u određenom vremenskom periodu. Posle određenog vremena, intezitet zvuka opada na početnu vrednost.

14

Page 25: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Slika 2.1.2—Anvelopa za muzičku notu

Za efikasnu analizu govora kao jedne od najvažnijih multimedijalnih kategorija, treba poznavati principe ljudskog vokalnog sistema. Međutim to izlazi iz okvira ove knjige, pa ćemo se više baviti efikasnim predstavljanjem govora i s tim u vezi najpre ćemo razmotriti osobine čovečijeg slušnog sistema.

2.2 Neke karakteristike čovečijeg slušnog sistema

Uho i njemu pridružni nervni sistem kompleksan je interaktivni sistem. S jedne strane, uho je osetljivo na mala izobličenja u signalu. S druge strane, zanemaruju se izobličenja za koje se pretpostavlja da su irelevantna. Ove osobine omogućuju da se postigne dobra kompresija radi efikasnog memorisanja audio signala. Treba naglasiti i to da kod slušnog sistema postoji izbalansiranost između frekvencijske i vremenske razlike.

Utvđeno je da zvuk treba da postoji najmanje 1 ms pre nego što bi se mogao čuti. Osetljivost zvuka smanjuje se u prisustvu drugog zvuka sa sličnim frekvencijskim sadržajem. Ovaj efekat je poznat kao maskiranje i prikazan je na Slici 2.2.1.

Slika 2.2.1—Efekat maskiranja

15

Page 26: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Jak ton pri zadatoj frekvenciji može da maskira slabije signale koji odgovaraju susednim frekvencijama, što je prikazano na Slici 2.2.1. Dakle, ovde jak ton maskira druge blisko rasprostranjene slabije tonove.

Frekvencijska rezolucija uha nije uniformna u celom audio-spektru od 20 Hz do 20 kHz. Osetljivost je najviša na niskim frekvencijama i opada na višim frekvencijama. Na niskim frekvencijama uho može da razlikuje izdvojene tonove od nekoliko Hz. Međutim, na višim frekvencijama, tonovi se moraju razlikovati za stotine Hz da bi se mogli registrovati.

Kombinovanjem frekvencijske osetljivosti i šuma maskiranja dobija se prag čujnosti. Svaki audio signal čija je amplituda ispod praga maskiranja ne čuje se.

2.3 Registrovanje audia

Zvuk se generiše i procesira na različite načine. U toku govora, zvučni talas generiše osoba, a čuje je slušalac. U tom slučaju, nije potrebna automatska obrada zvuka. Međutim, obrada i memorisanje zvuka potrebni su kod mnogobrojnih primena, na primer, radiodifuzija i muzička industrija. U ovim primenama proizvedeni audio signali su memorisani za pretraživanja u budućnosti i tzv. “playback”. Registrovanje zvuka podrazumeva izvor, slušaoca i okruženje. Zvuk se reflektuje od okolnih objekata. Slušalac čuje zvuk direktno iz izvora kao i reflektovani zvuk. Ostale komponente zvuka doprinose tzv. zvučnom ambijentu. Ambijent se stvara refleksijama u zatvorenim prostorima kao što su to, na primer, koncertne dvorane. U manjim prostorijama može biti više refleksija, a nijedna od njih ne kasni toliko da bi proizvodila eho koji predstavlja diskretno ponavljanje dela zvuka, koji i dalje postoji u prostoriji, sve dok se postepeno ne izgubi, usled parcijalne apsorpcije koja nastaje prilikom svake refleksije. Na primer, kada se u praznoj dvorani vikne “zdravo”, najverovatnije će se čuti “zdravo-o-o-o-o”. Ovaj fenomen naziva se reverberacija i doprinosi osećaju prostora. Značajan je kod reprodukcije zvuka. Na primer, ako zvuk dolazi direktno sa muzičkog instrumenta bez reverberacije činiće se kao da zvuk ne postoji. Kada uho primi zvuk, mozak dekoduje dva rezultujuća signala i određuje direktivnost zvuka. Registrovanje i reprodukcija započeti su preko jednog audio-kanala (mono-audio). Ubrzo se pokazalo da se direktivnost zvuka može značajno poboljšati korišćenjem dva audio-kanala (stereo zvuk). Više audio-kanala dalje poboljšava prostorni osećaj zvuka. Utvđeno je da se realnija reprodukcija zvuka dobija sa jednim ili više kanala reprodukcije koji emituju (proizvode) zvuk iza slušaoca. To je princip tzv. “okružujućeg” zvuka (eng. surround sound) koji se široko primenjuje kod bioskopskih i pozorišnih predstava.

2.4 Predstavljanje audio signala

Postoje dva načina za prikazivanje audio signala: pomoću talasnog oblika i parametarski. U prvom slučaju važno je tačno predstaviti proizvedeni audio signal, dok se pri parametarskom predstavljanju vrši modulisanje procesa generisanja signala. Tu postoje dve metode:

• Sinteza govora modulisanjem ljudskog vokalnog sistema i • Muzička sinteza.

16

Page 27: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Prva metoda primenjuje se u najvećem broju slučajeva kako bi se postigao što manji bitski protok. Druga metoda se koristi u okviru standarda za digitalni interfejs za muzički instrument (eng. musical instrument digital interface – MIDI).

REGISTROVANJE AUDIA

(MIKROFON)

ODMERAVANJE I KVANTOVANJE

(DIGITALIZACIJA)

MEMORISANJE ILI

PRENOS

PRIJEMNIK

DIGITALNO – ANALOGNA

KONVERZIJA

PLAYBACK GOVORNIK

Audio izvor Uho

Slika 2.4.1—Generisanje audia i playback-a

Karakteristična blok-šema za generisanje audio signala i “playback” data je na Slici 2.4.1. Jedan ili više mikrofona koristi se za konverziju akustične energije (nivoa zvučnog pritiska) u elastičnu energiju (u vatima). Napon proizveden na izlazu iz mikrofona odmeravan je i kvantovan. Digitalni audio signal proizveden na taj način memorisan je kao audio fajl ili je prenesen do prijemnika za “playback” postupak. Digitalni audio je konvertovan u vremenski promenljivi analogni napon koji se dovodi ka jednom ili više govornika. Da bi se postigao željeni kvalitet reprodukovanog audio signala, elementi blok-šeme za generisanje audia i playback moraju biti pažljivo odabrani, u skladu sa odgovarajućim standardima. O samom postupku digitalizacije, kasnije će biti više reči. Muzički zvuci razlikuju se od ostalih po načinu na koji se mogu generisati. Na primer, muzičke zvuke može kreirati više muzičara. To je doprinelo uvođenju MIDI standarda [2.3], [2.4]. U ovom standardu je deo muzike predstavljen nizom brojeva. MIDI sistem sastoji se iz četiri podsistema: kontroler, sintisajzer, sekvencer i zvučni modul. Muzički uređaj generiše MIDI signal. Sintisajzer kreira zvuke elektronskim putem. Sekvencer je uređaj ili kompjuterski program koji registruje MIDI signal koji odgovara muzičkom performansu. Zvučni modul proizvodi prethodno registrovane odzive koje stvara MIDI kontroler. Na Slici 2.4.2 prikazan je MIDI sistem. Muzičar svira na tastaturi MIDI kontrolera [2.5].

Kada se aktivira tastatura kontrolera, on šalje odgovarajući kod za kreiranje muzike. Ovaj kod prihvata zvučni modul koji ima nekoliko ton-generatora. Ovi ton-generatori stvaraju zvuke koji odgovaraju različitim instrumentima (na primer klavir, gitara, bubnjevi). Zvučni modul je povezan sa sekvencerom koji registruje MIDI signal koji može biti sačuvan na flopi disku, CD-u, ili hard disku.

Muzika se efikasno predstavlja koristeći MIDI standard. Međutim, MIDI fajl može da pruži različite kvalitete zvuka zavisno od playback hardvera. Na primer, deo MIDI sekvence može da odgovara određenoj noti na klaviru. Ukoliko je kvalitet klavira loš, ili ako klavir nije naštimovan, zvuk sa klavira može da ne bude visokog kvaliteta.

17

Page 28: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

ZVUČNI MODUL

KONTROLER

SEKVENCER

MIDI SIGNAL

MIDI SIGNAL

Slika 2.4.2—Uprošćena blok šema MIDI sistema Još jedan problem sa MIDI standardom je u tome što se izgovoreni dijalozi ili pesme teško mogu predstaviti u parametarskom obliku. Otuda, ljudski glas treba predstaviti odmerovanim podacima u MIDI fajlu. To povećava veličinu MIDI fajla.

2.5 Rezime

Zvuk ima osobine koje uključuju refleksiju, refrakciju i difrakciju. Audio sistemi imaju mnogo specifičnih karakteristika koje proizilaze iz zahteva čula sluha kao krajnjeg korisnika zvučnih informacija. Na primer, uho ima veliku osetljivost na percepciju različitih vrsta izobličenja signala. Audio opseg kreće se od 20 Hz do 20 kHz. Zvučni talasi u opsegu 5 kHz do 15 kHz sastoje se iz harmonika. Harmonici i njihove amplitude određuju kvalitet zvuka. Uho i njemu pridružni nervni sistem predstavljaju kompleksan interaktivni sistem. Uho je osetljivo na mala izobličenja u signalu, a zanemaruje one za koje se predpostavlja da su izobličeni. Ove osobine omogućuju da se postigne dobra kompresija radi kvalitetnijeg memorisanja audio signala. Osetljivost na zvuk se smanjuje u prisustvu drugog zvuka sa sličnim frekvencijskim sadržajem. Ovaj efekat je poznat kao maskiranje. Frekvencijska rezolucija uha nije uniformna u celom audio spektru. Osetljivost je najviša na niskim frekvencijama i opada na višim frekvencijama. Obrada i memorisanje zvuka potrebni su u mnogim primenama (radiodifuzija, muzička industrija, itd.). Za registrovanje zvuka potrebni su izvor, slušaoci i okruženje. Zvuk se reflektuje od okolnih objekata. Slušalac čuje zvuk direktno iz izvora, kao i reflektovani zvuk. Ostale komponente zvuka doprinose tzv. zvučnom ambijentu. Eho predstavlja diskretno ponavljanje dela zvuka u određenoj prostoriji koji se postepeno gubi usled parcijalne apsorpcije nastale prilikom svake refleksije zvuka. Fenomen reverberacije zvuka doprinosi osećaju prostora i značajan je kod reprodukcije zvuka. Audio signal se može prikazati pomoću talasnog oblika parametarski (sintezom govora i muzičkom sintezom). Muzika se predstavlja koristeći MIDI standard. Što se tiče MIDI sistema on se sastoji iz kontrolera, sintisajzera, sekvencera i zvučnog modela.

Pitanja

1. Koje su osobine zvuka? 2. Čime se karakteriše zvučni talas? 3. Kako se deli frekvencijski opseg zvuka?

18

Page 29: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

4. U kojim granicama varira talasna dužina zvuka i kako se ona određuje? 5. Šta utiče na kvalitet zvuka? 6. Kako se izračunava intezitet zvuka? 7. Skicirati dijagram granice čujnosti i područja govora i muzike. 8. Navesti sekcije iz kojih se sastoji anvelopa zvuka. Skicirati mogući grafik. 9. Objasniti efekat maskiranja zvuka.

10. Kako se postiže efikasno memorisanje audio signala? 11. Kako se ponaša uho u pogledu registrovanja tonova na niskim i visokim

frekvencijama? 12. Šta je to reverberacija zvuka i kako se manifestuje? 13. Na koji način se poboljšava prostorni osećaj zvuka? 14. Kako se može prikazati audio signal? 15. Šta je to MIDI? 16. Kako izgleda blok-šema za generisanje audio signala i “playback”? 17. Nacrtati uprošćenu blok-šemu MIDI sistema i opisati najvažnije funkcionalne delove. 18. Koji su nedostaci MIDI standarda?

Literatura [2.1] M. T. Smith, Audio Engineer's Reference Book. 2nd ed. Oxford, Focal Press, 1999. [2.2] D. R. Begault, 3-D Sound for Virtual Reality and Multimedia. Cambridge, MA:

Academic Press, 1994. [2.3] B. Bartlett and J. Bartlett, Practical Recording Techniques. 2nd ed. Focal Press, 1998. [2.4] J. Rothstein, MIDI: A Comprehensive Introduction. 2nd ed. Madison, WI, A-R Editions,

1995. [2.5] M. Kr. Mandal, Multimedia Signals and Systems. Kluwer Academic Publishers, 2003.

19

Page 30: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

3. VIZUELNI EFEKTI Kada udaljeni objekat vibrira, stvara kontrakciju i ekspanziju medijima u okruženju. Pri tome nastaje zvučni talas koji detektuje ljudsko uho da bi se osetilo prisustvo objekta. Međutim, kada objekat ne vibrira, ili ne postoji medijum kroz koji se prenose vibracije, uho neće biti u stanju da oseti prisustvo objekta. Srećom, priroda nas je podarila još jednim senzorom – okom koje može da detektuje elektromagnetne (eng. elektromagnetic – EM) talase koji dolaze sa objekta. Od svih naših čula, oko je najefikasniji prijemnik informacija. Savremeni industrijski svet veoma je orijentisan prema vizuelnoj komunikaciji. Široko je rasprostranjeno mišljenje da se 70 % informacija koje dobijamo, prenosi posredstvom čula vida. Otuda je oko najvažniji senzor u poređenju sa ostalim senzorima, kao što su čulo sluha, mirisa, dodira ili ukusa. Uzimajući u obzir da se kao krajnji korisnik video informacije pojavljuje čulo vida, navešćemo najpre neke njegove karakteristike. Kako u procesu digitalne obrade slike izvesnu pažnju treba posvetiti vidljivosti šuma, pojasnićemo i ovaj problem. Poznato je da multimedijalne aplikacije sadrže ili generišu slike koje će posmatrati čovek [3.1], [3.15]. Međutim, ljudsko čulo vida nije dovoljno ispitano. Takođe, ne postoji objektivna mera kvaliteta koja odgovara ljudskoj proceni o kvalitetu slike. Srećom, istraživanja u oblasti perceptualne psihologije obezbeđuju neka važna saznanja o vizuelnom sistemu. Na Slici 3.1 prikazana je građa ljudskog oka.

Slika 3.1—Građa ljudskog oka Mrežnjača (retina) je prekrivena fotoreceptorskim ćelijama. One apsorbuju svetlost od slike koju na mrežnjači fokusiraju leća i rožnjača. Fotoreceptorske ćelije generišu električne impulse koji

20

Page 31: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

putuju ka mozgu kroz optičke nerve, od kojih se svaki sastoji od oko milion vlakana. Ove ćelije su najgušće u području žute mrlje (fovea). Kad je svetlost slaba, otvor zenice je veći, pa je svetlost rasuta po većem delu mrežnjače i slika je lošije fokusirana. Postoje dve vrste fotoreceptorskih ćelija, štapići (eng. rods) i čunići (eng. cones). Nazive su dobile po njihovom izgledu. Štapići su mnogo osetljiviji i omogućavaju monohromatski vid noću. S druge strane, čunići omogućavaju gledanje u boji, ali samo pri jakom nivou osvetljaja. Postoje tri vrste čunića. Oni dele vidljivi spektar u tri opsega: crveni, zeleni i plavi. Zbog toga su ove tri boje označene kao osnovne boje ljudskog vida. Oko opisuje boju upoređujući odzive svih tipova čunića. Zbog različite gustine čunića osetljivih na crvenu, plavu i zelenu boju, ukupna osetljivost oka je najveća na zelenu, a najslabija na plavu svetlost. Međutim, ova osetljivost dolazi po cenu slabijeg raspoznavanja u opsegu zelene boje. Na primer, u mikroskopiji se koriste filteri da bi se izdvojila samo zelena boja, jer je oko najosetljivije na zelenu boju. Grubo govoreći, oko može da vidi boje u opsegu od 400 nm do 700 nm. Pitanje koje se često postavlja je: koja proporcija crvene, plave i zelene boje odgovara svetlosti jedinstvene talasne dužine. Na to pitanje nema odgovora zbog nekoliko razloga. Pre svega, osećaj boje zavisi od percepcije čoveka i opsega promena od osobe do osobe, a takođe zavisi od ambijenta posmatranja. Od uticaja su i širina i preklapanja opsega osetljivosti tri navedena tipa čunića što znači da se isti osećaj boje može dobiti sa mnogo različitih kombinacija talasnih dužina.

3.1 Neke karakteristike čula vida

Čovečije čulo vida može se smatrati diskretnim sistemom koji karakterišu određeni pragovi razlikovanja, gradacije sjaja kritične dužine trajanja nadražaja. Zbog strukture mrežnjače koja se sastoji od oko 800 000 receptivnih polja obrazovanih od grupe foto-receptora u okviru kojih oko ne može da razlikuje prostornu konfiguraciju svetlosnog nadražaja, kao i zbog prenosa informacije od oka do moždanih centara, kontinualna površina slike se razlaže u oku na diskretne elemente. Neprekidnost površine slike je samo iluzija čula vida. Gledalac neće biti u stanju da primeti razliku ako se slike realnih predmeta zamene diskretnim slikama sastavljenim od elemenata različitih gradacija slike. Vizuelna percepcija oka nije podjednaka za komponente visokih i niskih učestanosti. Oko je veoma osetljivo na komponente niskih učestanosti i ta osetljivost opada sa porastom učesanosti. Pored toga, oko nije podjednako osetljivo na sve komponente vidnog spektra [3.1]. Krive a) i b) na Slici 3.1.1 predstavljaju relativnu osetljivost oka pri normalnoj i pri vrlo slaboj svetlosti u funkciji od talasne dužine λ. Pri dnevnoj svetlosti, kao što se vidi, oko je najosetljivije za radijacije talasne dužine od 555 nm. Prelaženje sa jedne krive osetljivosti na drugu vrši se automatski i naziva se prilagođenje oka. Da bi gledalac imao utisak da gleda prirodnu sliku, dovoljno je da odnos maksimalnog i minimalnog sjaja na ekranu bude isti kao i u originalu.

Najmanja promena sjajnosti ΔBp koju oko meže da zapazi, zavisi od apsolutne sjajnosti B. Pri povećanju B, povećava se i ΔBp, Pa stoga odnos ΔBp/B ostaje konstantan. Odnos B/ΔBp predstavlja meru osetljivosti oka za zapažanje kontrasta. Prag kontrasta ΔBp/B menja svoju vrednost sa promenom površine i vremena trajanja nadražaja. Ukoliko promena sjaja jednog ili više elemenata mozaika slike na ekranu ne premašuje prag kontrasta čula vida, gledalac ne primećuje izobličenje.

Oko ne reaguje trenutno na promene osvetljaja. Kada se svetlosni fluks koji pada na mrežnjaču naglo poveća, potrebno je da prođe izvesno vreme pa da se u mozgu stvori utisak

21

Page 32: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

odgovarajuće sjajnosti. Produženje osećaja po prestanku pobude ili persistencija predstavlja značajnu karakteristiku oka. Pri određenoj adaptaciji, persistencija je kraća ako je intenzitet pobude veći.

Slika 3.1.1—Relativna osetljivost oka u funkciji talasne dužine, a) svetlost normalne jačine, b) vrlo slaba svetlost

Sledeća značajna karakteristika vida je moć razlaganja oka tj. sposobnost raspoznavanja

sitnih detalja. Na raspoznavanje detalja, osim kontrasta i oštrine, utiče i adaptacija oka kao i dinamika slike. Broj detalja nekog objekta mnogo je veći kada je objekat stacionaran, nego kada se brzo kreće. Kada postoji mala razlika u nivou sjaja između podešenih elemenata slike, mogu se uočiti veoma male razlike u sjaju. S druge strane kada su razlike u nivou sjaja velike, osetljivost se znatno smanjuje [3.2] . Na Slici 3.1.2-a prikazan je test, dok je na Slici 3.1.2-b data osetljivost kontrasta.

Slika 3.1.2— Test i osetljivost kontrasta Neka je B1 sjaj pozadine, a B2 i B2 + ΔB sjaj leve i desne polovine malog kruga, respektivno. Razlika u sjaju ΔB, koja je potrebna da bi se razlikovala promena od B2 do B2+ ΔB varira zavisno od razlike u sjaju |B2 − B1|.

22

Page 33: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Naime, kada je ova razlika mala, neznatna veličina ΔB je dovoljna da bi se promena razlikovala. Sa povećavanjem |B2 − B1|, ΔB raste, kao što je to prikazano na Slici 3.1.2-b. Međutim treba naglasiti da je stvarna osetljivost kompleksnija, jer ona zavisi od funkcije |B2 − B1|, od vrednosti B1 ili B2, a takođe i od veličine kruga i trajanja izloženih slika.

Što se tiče osetljivosti oka, ona se može posmatrati sa tri aspekta. Prvo, kada su varijacije osetljivosti nezavisne od slike i kada prag detekcije šuma raste sa porastom frekvencije šuma, to je tzv. frekvencijska zavisnost. Drugo, kada su varijacije osetljivosti zavisne od slika i kada prag detekcije šuma raste sa porastom broja detalja na slici, to je tzv. zavisnost od detalja. I najzad, treće, kada su varijacije osetljivosti zavisne od slike i kada prag detekcije šuma raste sa porastom osvetljaja, to je tzv. zavisnost od osvetljaja [3.3].

Na kraju, treba istaći da oko ima sposobnost usrednjavanja na one delove slike koji sadrže bitnu informaciju. Pošto je prenosni sistem složeniji ukoliko je broj optičkih informacija koje treba prenositi veći, ne treba ni prenositi one optičke informacije koje oko pod normalnim uslovima ne može da primi.

3.2 Vidljivost šuma

Ukoliko je šum pridodat slici on je vidljiviji ako je korelisan sa slikom, nego ako je slučajan. Prisustvo šuma znatno smanjuje kontrast i oštrinu slike. Na prijemnoj strani, prisustvo šuma u signalu slike pogoršava direktno kvalitet prijema. Na primer, TV šum na ekranu izaziva kod gledalaca zamor, jer posmatrač stalno ide za tim da otkrije fine detalje slike koji su maskirani šumom. Da bi šum bio uočljiv, mora biti veći od određene vrednosti koja zavisi od praga vidljivosti. Ovaj prag je znatno veći u blizini ivica, i u oblastima sa malim detaljima, nego u delovima slike bez detalja, jer se šum maskira sadržajem slike. Osetljivost oka na izobličenje na slici zavisi od sadržaja elemenata slike koji neposredno okružuju onaj deo gde se izobličenje pojavilo. Vidljivost nekorelisanih smetnji na slici može se predstaviti izrazom:

( ) ( )0

W

n nV = V ω S ω dω⋅∫ (3.2.1)

gde je Sn (ω) spektralna gustina signala smetnji unutar propusnog opsega W prenosnog sistema, V(ω) težinska funkcija koja predstavlja relativnu osetljivost oka na pojedine frekventne

komponente. Težinska funkcija V(ω) uključuje uticaj prenosne funkcije sistema za prenos slike, kao i vizuelnog sistema posmatrača.

Eksperimentalno je dokazano da oko slabije uočava šum pridodat video signalu u trenutku znatnih promena, nego u oblastima slike gde se video signal relativno malo menja. Odnos vidljivosti šuma i brzine promene video signala zavisi od ukupnog sadržaja slike.

23

Page 34: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

U vezi sa problemom vidljivosti šuma, stoji pitanje kvaliteta pogoršane slike. On je definisan subjektivnim nalazima i može se upoređivati na osnovu subjektivnih odgovora posmatrača. U literaturi se često koristi kriterijum srednje kvadratne greške [3.4]. Ako se sjajnost ulazne slike predstavi funkcijom f(x, y) a sjajnost izlazne slike funkcijom g(x, y), gde su (x, y) prostorne koordinate, greška je data izrazom

ε(x, y) = f(x, y) – g(x, y). (3.2.2) Kada je sa Fε(u, v) označena Fourier-ova transformacija greške, pri čemu su “u” i “v” prostorne frekvencije, tada je srednja kvadratna greška data relacijom:

( ) ( ) ( ) 22, ,+ + + +

D f g = ε x, y dx dy = F u v du dvε

∞ ∞ ∞ ∞

−∞ −∞ −∞ −∞∫ ∫ ∫ ∫ . (3.2.3)

Vidi se da kvalitet pogoršane izlazne slike g(x, y) ne zavisi samo od greške ε(x, y) već i

od originalne slike f(x, y).

3.3 Čovečiji vizuelni sistem Pošto je izlaz iz multimedijalnog sistema, u opštem slučaju, najčešće baš vizuelni sistem, važno je poznavati karakteristike čovečijeg vizuelnog sistema (eng. human visual system – HVS) radi što efikasnijeg korišćenja multimedijalnih tehnologija [3.5]. Elektromagnetni talasi imaju različite talasne dužine u širokom dijapazonu, od dugih do ekstremno kratkih talasa (gama zraci). Međutim, oko može da detektuje talase uskog spektra od približno 400 nm do 700 nm. Sunčeva svetlost ima spektar u ovom talasnom opsegu i ona predstavlja glavni izvor zemaljskih EM talasa.

Na Slici 3.3.1 prikazan je karakterističan proces detekcije objekta.

Slika 3.3.1—Dolazna svetlosna struja u procesu detekcije objekta

24

Page 35: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Ako je L (λ) ulazna raspodela energije koja dolazi iz svetlosnog izvora, svetlost koju prima posmatrač nekog objekta može se izmeriti u obliku:

I(λ) = ρ(λ) L(λ) (3.3.1) gde je ρ(λ) refleksija od objekta.

Ukoliko su svetlosni izvor, objekat i posmatrač stacionarni, spektar od I(λ) imaće isti frekvencijski opseg kao i L(λ), ali će im spektri biti različiti, što određuje ρ(λ). Kada posmatrač primi svetlosnu energiju raspodele I(λ) počinje kompleksan proces u vizuelnom sistemu koji se odnosi na formiranje slike. Radi efikasnijeg projektovanja prenosnog sistema, važno je proučiti karakteristike HVS. To je značajno i zbog displeja informacija o slici. Da bi se smanjila cena prenosa i displej uređaja, važi princip da ne treba prenositi niti prikazivati informaciju koju oko ne može da vidi. Čovečiji vizuelni sistem tretira se kao optički sistem. Naime, kada svetlost objekta padne na oko, zenica oka deluje kao jedan prorez, slika se stvara na mrežnjači, a gledalac vidi objekat. Uočena veličina objekta zavisi od ugla pod kojim se ovaj stvara na mrežnjači. Mrežnjača može bolje da razluči detalje kada je slika na mrežnjači veća i kada se širi na više foto receptora. Zenica kontroliše količinu svetlosti koja pada na oko. Ona je prečnika 2 mm. Pri slabijem osvetlenju, veličina raste kako bi se omogućilo da dolazi više svetlosti, dok pri jačem osvetljenju njena veličina opada da bi se ograničila količina svetlosti. U cilju uprošćenja HVS modela načinjeno je nekoliko predpostavki. Pre svega, predpostavljeno je da je HVS linearni sistem što je u opštem slučaju tačno za slike sa malom kontrašću. Zatim, može se predpostaviti da je HVS izotropan u prostornom domenu, tj. da oči nemaju ni jedan preferencijalni pravac (prema horizontalnom, vertikalnom ili dijagonalnom). Takođe, utvrđeno je da je osetljivost očiju u dijagonalnom pravcu manja nego u horizontalnom ili vertikalnom, pa se ta činjenica koristi kod mnogih modela.

Najzad, HVS se može tretirati kao sistem koji se sastoji iz nekoliko podsistema. Istakli smo da kada svetlost pada na oko, zenica se ponaša kao jedan prorez. To je ekvivalentno niskopropusnom filtru. Zatim, spektralni odgovor oka (a to je funkcija efikasnosti osvetljaja V(λ)) se primenjuje na dolaznu svetlost, pa se dobija osvetljaj slike. Osetljivost čovečijeg vizuelnog sistema je mala na visokim prostornim frekvencijama. Ova osobina koristi se u mnogim primerima obrade slike. U slučaju videa, kamera cilja slike (ili video kadrove) koje brzo slede jedna za drugom. Displej uređaj (TV, kompijuterski monitor) prikazuje individualne kadrove istom brzinom. Ukoliko je brzina prikazivanja individualnih kadrova iznad izvesnog praga, HVS ne može da opaža individualne kadrove, pa zato izgleda kao da se pokretna slika menja kontinualno. Kritična brzina promene kadra zavisi od faktora kao što su uslovi gledanja i video sadržaj. Danas postoji veliki broj istraživanja koja se bave određivanjem kritične brzine kadra i njene zavisnosti od eksperimentalnih rezultata. Navešćemo jedan primer. Tačkasti izvor svetlosti menja osvetljaj prema zakonu:

L + ΔLcos(2πft) gde je ΔL amplituda promene,

25

Page 36: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

f frekvencija u Hz. Ukoliko ΔL ima dovoljno veliku vrednost, a frekvencija nije suviše visoka, opaža se tzv. fliker efekat. Za bilo koju datu vrednost frekvencije, vrednost ΔL koja prizvodi prag osećaja flikera određena je eksperimentalno. Označimo tu vrednost sa ΔLT.. Odnos L/ΔLT poznat je kao osetljivost na kontrast čovečijeg vizuelnog sistema. Oko je osetljivije na fliker efekat pri visokom osvetljaju. Osetljivost na fliker je zanemarljiva iznad (50 do 60) Hz. Ova osobina služi kao polazna osnova za projektovanje TV sistema i kompjuterskih displej uređaja.

3.4 Vizuelni modeli

Različiti vizuelni modeli prikazani su, do danas, u literaturi. Najpre, u tom smislu bilo je mnogo pokušaja da se koncepcija linearnih sistema primeni na čovečiji vizuelni sistem. S druge strane, neka istraživanja su pokazala da je čovečiji vizuelni sistem nelinearan [3.6]. Na ovom mestu biće govora o monohromatskom vizuelnom modelu kao i o vizuelnom modelu u boji. Na kraju, u okviru vizuelnih modela, biće dat prikaz nekih opštih modela vizuelnog komunikacionog sistema. 3.4.1 Monohromatski vizuelni model

U principu jedan optički sistem može se tretirati kao dvodimenzionalni linearni sistem koji se karakteriše 2D transfer funkcijom [3.7]. Posmatrajmo optički sistem prikazan na Slici 3.4.1.1.

OPTIČKI SISTEM H(ωx, ωy)

Iu(x, y) Ii(x, y)

Slika 3.4.1.1—Uprošćena blok šema optičkog sistema

Označimo sa Iu(x, y) polje objekta na ulazu u sistem, sa H(ωx, ωy) transfer funkciju posmatranog sistema, dok Ii(x, y) predstavlja polje slike na izlazu iz sistema. Ovde su ωx i ωy prostorne frekvencije. Frekvencijski spektri signala na ulazu u sistem Фu (ωx, ωy) i na izlazu iz sistema Фi (ωx, ωy), definisani su, respektivno, na sledeci način:

( ) ( ) ( )exp+ +

u x y u x yΦ ω ,ω = I x, y i ω x+ω y dx dy∞ ∞

−∞ −∞

⎡ ⎤−⎣ ⎦∫ ∫ (3.4.1.1)

( ) ( ) ( )exp+ +

i x y i x yΦ ω ,ω = I x, y i ω x+ω y dx dy∞ ∞

−∞ −∞

⎡ ⎤−⎣ ⎦∫ ∫ . (3.4.1.2)

Ovi spektri povezani su relacijom:

26

Page 37: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Фi (ωx, ωy) = H(ωx, ωy) Фu (ωx, ωy). (3.4.1.3)

Polje slike na izlazu iz posmatranog sistema dobija se iz izraza (3.4.1.2) kada se primeni inverzna Fourier-ova transformacija, tj.,

( ) ( ) ( )2

1 exp4π

+ +

i i x y x yI x, y = Φ ω ,ω i ω x+ω y dω dω∞ ∞

−∞ −∞

⎡ ⎤⎣ ⎦∫ ∫ x y . (3.4.1.4)

Što se tiče transfer funkcije, to je u opštem slučaju kompleksna veličina koja se može predstaviti preko modula |H(ωx, ωy)| i faze ϕ (ωx, ωy), tj.,

H(ωx, ωy) = |H(ωx, ωy)| exp[iϕ (ωx, ωy)]. (3.4.1.5) Moduo |H(ωx, ωy)| naziva se modulaciona transfer funkcija, dok se ϕ (ωx, ωy) po neki put sreće u literaturi pod nazivom fazna transfer funkcija [3.8]. Na Slici 3.4.1.2 prikazana je blok-šema monohromatskog vizuelnog modela logaritamskog tipa. Ako je odziv čula na ulazni signal logaritamskog tipa, tada ukoliko signal ima oblik jednog eksponencijalnog sinusnog talasa, tj. exp[sin Iu(x, y)], čovečiji vizuelni sistem može biti linearizovan [3.6].

LINEARNI SISTEM H(ωx, ωy)

SIGNAL RECEPTOR

LOG

Slika 3.4.1.2—Monohromatski vizuelni model logoritamskog tipa

Osnovni logaritamski monohromatski vizuelni model predpostavlja da je polje slike na

izlazu iz sistema oblika

( ) ( )[ ]yxIkkkyxI ui ,log, 321 += (3.4.1.6) gde ki , i = 1, 2, 3 predstavljaju konstante, Iu (x, y) predstavlja polje objekta na ulazu u sistem. Jedan drugi monohromatski vizuelni model predložio je Cornsweet [3.9]. Kod ovog modela, odziv je oblika

( ) ( )( )

1

2

ui

u

K I x, yI x, y =

K + I x, y (3.4.1.7)

gde

27

Page 38: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

K1 i K2 predstavljaju konstante. Mannos i Sakrison [3.10] su proučavali uticaje nelinearnosti različitog tipa koje su primenjivane u proceni mere vrednosti na prijemu slike. Oni su pokazali da je nelinearnost oblika

( ) ( ) Sui

I x, y = I x, y⎡ ⎤⎣ ⎦ (3.4.1.8)

gde je S konstanta koja pruža solidno slaganje mere vizuelne vernosti sa subjektivnom

procenom. 3.4.2 Vizuelni model u boji U svetu su vršeni mnogi eksperimenti radi utvrđivanja vizuelnog modela u boji. Prvu grupu eksperimenata izvršio je Thomas Young sa saradnicima, a zatim Newton i Maxvell. Na ovom mestu biće prikazan vizuelni model koji je predložio Frei [3.11]. Njegova uprošćena blok- šema prikazana je na Slici 3.4.2.1.

Kod ovog modela, tri receptora sa spektralnim osetljivostima S1 (λ), S2 (λ), i S3 (λ) daju signale:

( ) ( )1 1e = c S dλ λ λ∫ (3.4.2.1)

( ) ( )2 2e = c S dλ λ λ∫ (3.4.2.2)

( ) ( )3 3e = c S dλ λ λ∫ (3.4.2.3)

gde je c(λ) raspodela spektralne energije svetlosnog izvora.

Kada se na tri napred navedena signala primeni logaritamska transfer funkcija, dobijaju

se originali:

( )1 logd = e1 (3.4.2.4)

( ) ( ) 22 2 1

1

log log log ed = e e =e

⎛ ⎞− ⎜

⎝ ⎠⎟ (3.4.2.5)

( ) ( ) 33 3 1

1

log log log ed = e e =e

⎛ ⎞− ⎜ ⎟

⎝ ⎠. (3.4.2.6)

28

Page 39: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Na kraju, signali d1, d2 i d3 prolaze kroz linearne sisteme čije su transfer funkcije H1(ωx, ωy), H2(ωx, ωy) i H3(ωx, ωy) respektivno. Signali g1, g2 i g3 na izlazu iz odgovarajućih linearnih sistema pružaju osnovu za percepciju boje u mozgu.

e1 d1

APSORPCIJA PLAVE BOJE

g2 H2 (ωx, ωy) e2

APSORPCIJA ZELENE BOJE

Logd2

+ −

g3 H3 (ωx, ωy) e3

Logd3

+ −

g1 H1 (ωx, ωy)

APSORPCIJA ŽUTO- -ZELENE BOJE

Log

Slika 3.4.2.1—Blok-šema Frei-ovog vizuelnog modela u boji

Navedeni model karakteriše se time što zadovoljava osnovne zakone kalorimetrije. Na primer, ukoliko se spektralna energija obojene svetlosti menja za konstantan multiplikativni faktor, boja i zasićenje svetlosti ostaju invarijantni u širem dinamičkom opsegu. 3.4.3 Opšti model vizuelnog komunikacionog sistema

Kao što je poznato, opšti model komunikacionog sistema dao je Shannon. Posle toga, neki drugi istraživači modifikovali su ovaj opšti model. Na predajnoj strani uvode se izvorni i kanalni koder, a na prijemnoj strani uvode se odgovarajući dekoderi. Kod vizuelnih komunikacionih sistema, karakteristike izvora određene su metodom razlaganja, brojem elemenata u slici, prisustvom ili odsustvom slike u boji. Izvorni koder prepoznaje srodne predmete. Oni se koduju standardnim simbolima. Nesrodni objekti određuju se element po element. Dekoder služi za prevođenje kodovane poruke u oblik koji koristi korisnik [3.12]. Na Slici 3.4.3.1 prikazan je Fano-ov opšti model vizuelnog komunikacionog sistema [3.13]. Vizuelni svet je onakav kakav je viđen pomoću kamere. Funkcija izvornog kodera je da predstavi vizuelni svet, odnosno ulazni signal kao slučajan signal binarnog oblika.

Izvorni koder je obična TV kamera. Ona grupiše vizuelne scene sa malim percepcionim razlikama i svaku grupu predstavlja jednom kodnom reči.

Kanalni koder uzima povorku izvornih binita i koduje je u druge nizove kanalnih binita, tako da prenos do prijemnika bude obavljen na najefikasniji način bez pogoršanja zbog šuma.

Uređaji na prijemu služe za obavljanje operacija inverznih onima na predaji. To su obnavljanje izlaza iz izvornog kodera pomoću kanalnog dekodera i obnavljanje predstave vizuelnog sveta pomoću izvornog dekodera. Pri svemu ovome ne može se zanemariti uticaj šuma

29

Page 40: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

u kanalu, a time i izobličenje slike. U principu, kod kodovanja video signala cilj može da bude da se poboljša kvalitet slike, a da se kapacitet kanala održava konstantnim, zatim da se smanji kapacitet kanala da bi se održavao dati kvalitet slike, najzad da se pogoršava kvalitet slike da bi kapacitet kanala bio optimalan.

VIZUELNI SVET

IZVORNI KODER

KANALNIKODER KANAL KANALNI

DEKODERIZVORNI

DEKODER PRIJEMNIK

KRITERIJUM VERNOSTI ŠUM

U X Y

Slika 3.4.3.1—FANO-ov model vizuelnog komunikacionog sistema

Da bi uveo kriterijum vernosti, Pearson je proširio Fano-ov model vizuelnog komunikacionog sistema. Pearson-ov model vizuelnog komunikacionog sistema, prikazan na Slici 3.4.3.2, sastoji se iz kola sa povratnom spregom od prijemnika – posmatrača do izvornog i kanalnog kodera.

VIZUELNI SVET

IZVORNI KODER

KANALNIKODER KANAL KANALNI

DEKODERIZVORNI

DEKODER PRIJEMNIK

ŠUM

U X Y V

Slika 3.4.3.2—Pearson-ov model vizuelnog komunikacionog sistema Optimizacija parametara izvedena je na jedan od sledeca dva načina. Prvo, kriterijum

vernosti na prijemu je fiksiran prema nameni komunikacionog sistema, a to znači da je izvestan minimum kvaliteta na prijemu unapred određen. Poželjno je pronaći metode izvornog i kanalnog kodovanja koje će smanjiti traženi kapacitet kanala na najmanju moguću vrednost, a da se u isto vreme zadovolje kriterijumi vernosti. Ona kombinacija izvornog i kanalnog kodovanja koja zadovoljava kriterijum vernosti pri najmanjem iznosu količine informacija u kanalu predstavlja optimalnu metodu kodovanja. Drugo, kada se za kapacitet kanala smatra da je unapred fiksiran, cilj je da se maksimizira vernost na prijemu, tj. da se pronađe takva kombinacija izvornog i kanalnog kodovanja koja će omogućiti prenos datim kanalom, a da se u isto vreme kao rezultat dobije najbolji mogući kvalitet slike na prijemu.

Problemi koji se pojavljuju kada je u pitanju Pearson-ov model vizuelnog komunikacionog sistema odnose se na funkciju izvornog kodera i na određivanje kriterijuma vernosti [3.14]. Izvorni koder treba da izdvoji iz vizuelne okoline one oblike koje je i sam čovek – gledalac u stanju da izdvaja. Naše sadašnje znanje o tome kako gledalac reaguje na različite vrste slika i na izobličenja u tim slikama je veoma oskudno. Prilikom izvornog kodovanja može

30

Page 41: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

u principu da bude kapacitet kanala C minimiziran pri čemu je izobličenje D manje ili jednako određenom maksimumu Dmax, tj. D ≤ Dmax, ili da izobličenje D bude minimizirano pri čemu je kapacitet kanala C < Cmax, gde je Cmax maksimalni kapacitet kanala.

3.5 Rezime Od svih naših čula, oko je najefikasniji prijemnik informacija. Oko 70 % informacija koje dobijamo, prenosi se posredstvom čula vida. Čovečije čulo vida može se smatrati diskretnim sistemom koji karakterišu određeni pragovi razlikovanja, gradacije sjaja i kritične dužine trajanja nadražaja. Oko je veoma osetljivo na komponente niskih učestanosti i ta osetljivost opada sa porastom učestanosti. Oko ne reaguje trenutno na promene osvetljaja. Kada se svetlosni fluks koji pada na mrežnjaču naglo poveća, potrebno je izvesno vreme da se u mozgu stvori utisak odgovarajuće sjajnosti. Na raspoznavanje detalja, osim kontrasta i oštrine, utiče i adaptacija oka kao i dinamika slike. Osetljivost oka može se posmatrati sa tri aspekta: frekvencijska zavisnost, zavisnost od detalja i zavisnost od osvetljaja. Prisustvo šuma znatno smanjuje kontrast i oštrinu slike. Šum je vidljiviji ako je korelisan sa slikom nego ako je slučajan. Osetljivost oka na izobličenje u slici zavisi od sadržaja elemenata slike koji neposredno okružuju onaj deo gde se izobličenje pojavilo. Kvalitet slike je definisan subjektivnim nalazima i može se upoređivati na osnovu subjektivnih odgovora posmatrača. Radi što efikasnijeg korišćenja multimedijalnih tehnologija važno je poznavati karakteristike čovečijeg vizuelnog sistema. On se tretira kao optički sistem. U literaturi su do danas prikazani različiti vizuelni modeli: monohromatski vizuelni modeli, vizuelni modeli u boji, kao i opšti modeli vizuelnog komunikacionog sistema. Prvi opšti model dao je Shannon. Neki drugi istraživači (Fano, Pearson) modifikovali su ovaj model. Na prednjoj strani uvode se izvorni i kanalni koder, dok se na prijemnoj strani uvode odgovarajući dekoderi. Kod vizuelnih komunikacionih sistema, karakteristike izvora određene su metodom razlaganja, brojem elemenata u slici, prisustvom ili odsustvom slike u boji.

Pitanja

1. U čemu se ogleda uloga čula vida kao senzora? 2. Čime se karakteriše čulo vida? 3. Skicirati dijagram relativne osetljivosti oka u funkciji talasne dužine i to pri svetlosti

normalne jačine i pri vrlo slaboj svetlosti. 4. Kako se definiše mera osetljivosti oka? 5. Šta je to persistencija oka? 6. Šta utiče na raspoznavanje detalja od strane čula vida? 7. Sa kojih se aspekata može posmatrati osetljivost oka? 8. Kako se može predstaviti vidljivost nekorelisanih smetnji na slici? 9. Kako se definiše svetlost koju prima posmatrač od nekog objekta?

10. Opisati način rada čovečijeg vizuelnog sistema? 11. Od čega zavisi osetljivost čovečijeg vizuelnog sistema? 12. Šta je to fliker efekat i kako on utiče na osetljivost oka?

31

Page 42: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

13. Nacrtati uprošćenu blok-šemu optičkog sistema i naznačiti sve potrebne elemente za njegovu analizu?

14. Iz kojih se elemenata sastoji monohromatski vizuelni model logaritamskog tipa? Nacrtati odgovarajuću blok-šemu.

15. Kako se određuje odziv kod Cornsweet-ovog vizuelnog modela? 16. Čime se karakteriše Mannos-Sakrison-ov model vizuelnog sistema? 17. Nacrtati i opisati blok-šemu Frei-ovog vizuelnog modela u boji. 18. Kako izgleda opšti model Fano-ovog vizuelnog komunikacionog sistema? 19. Koje su osobine Pearson-ovog modela vizuelnog komunikacionog sistema? 20. Od čega zavisi osetljivost oka na izobličenje u slici? 21. Koja proporcija crvene, zelene i plave boje odgovara svetlosti jedinstvene talasne

dužine?

Literatura [3.1] B. Nastić, Osnovi Televizijske Tehnike. Beograd, Naučna knjiga, 1986. [3.2] T. Fukinuki, “Optimization of D-PCM for TV signals with consideration of visual

property”, IEEE Trans. Commun., vol. COM-22, pp. 821–826, Jun. 1974. [3.3] D. J. Connor, R. C. Brainard, and J. O. Limb, “Intraframe coding for picture

transmission,” Proc. IEEE, vol. 60, no.7, pp. 779–791, Sep. 1972. [3.4] T. S. Huang, W. F. Schreiber, and O. J. Tretiak, “Image processing”, Proc. IEEE, vol.

59, no. 11, pp. 1586–1609, Nov. 1971. [3.5] M. Kr. Mandal, Multimedia Signals and Systems. Kluwer Academic Publishers, 2003. [3.6] W. K. Pratt, Digital Image Procesing. New York: John Wiley and Sons, 1978. [3.7] J. W. Goodman, Introduction to Fourier Optics. New York: McGraw-Hill, 1968. [3.8] K. D. Baker, “Basic image concepts in Digital Signal Processing,” N. B. Jones, Ed.,

1982. [3.9] T. N. Cornsweet, Visual Perception. New York, NY: Academic Press, 1970.

[3.10] J. L. Mannos and D. J. Sakrison, “The effect of a visual fidelity criterion of the encoding of images,” IEEE Trans. Inf. Theory, vol. IT-20, pp. 525–536, Jul. 1974.

[3.11] W. Frei, “A new model of color vision and some practical limitations,” University of Southern California, Image Processing Institute, Los Angeles, USCEE Rep. 530, Mar. 1974, pp. 128–143.

[3.12] Z. Bojković, Digitalna Obrada Slike. Beograd, Naučna knjiga, 1989. [3.13] D. E. Pearson, “A realistic model for visual communication systems,” Proc. IEEE, vol.

55, no. 3, Mar. 1967. [3.14] T. Berger, Rate-Distortion Theory: A Mathematical Basis for Data Compression.

Englewood Cliffs, NJ: Prentice-Hall, 1971. [3.15] J. C. Russ, The Image Processing Hand Book. 5th ed. Boca Raton, FL: CRC Press,

2007.

32

Page 43: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

4. AUDIO-VIZUELNE INTEGRACIJE U multimedijalnim komunikacijama gde je uključen čovečiji govor, audio-vizuelna integracija je posebno značajna. Ne samo da je važno zanemariti verbalnu i univerzalnu informaciju, već je interesantno pitanje interakcije između različitih medija. U ovom poglavlju pozabavićemo se pitanjem zašto su multimedijalne komunikacije više nego prosto objedinjivanje teksta, audia, slike i videa. Daćemo pregled trendova u multimedijalnom istraživanju radi korišćenja audio-vizuelne informacije, pre svega radi uspostavljanja veze između obrade audio i video signala. Koristeći tehnologiju poznavanja govora, analiziraju se govorni talasni oblici kako bi se otkrio izgovoreni tekst. Na osnovu rečenice u tekstu, integriše se glava govornika (eng. talking head) na osnovu audio-vizuelnog niza i to korišćenjem kompleksne grafike za analizu facijalnog modela kao i sintezu teksta i govora kako bi se proizveo sintetičko akustični govor [4.1], [4.2]. Isto tako, za komunikaciju osoba–osoba koja je uključena u multimedijalne aplikacije (videotelefonija, videokonferencija) od interesa je audio i vizuelna interakcija. S druge strane, audio-vizuelna integracija takođe obuhvata automatsko očitavanje sa usne, primenu kod prepoznavanja govora animacijom lica govornika, sinhronizaciju usana, praćenje crta lica, audio-vizuelno preslikavanje, združeno audio-vizuelno kodovanje, itd.

4.1 Interakcija medija

Integracija i interakcija različitih vrsta medija predstavljaju interesantnu oblast istraživanja [4.3]. Interakcija medija prikazana je na Slici 4.1.1. Kao što se vidi, medijumi su kategorisani u tri klase. Prva se odnosi na tekstualne informacije, druga je audio uključujući govor i muziku, dok treća predstavlja mirnu sliku i video.

Cilj prepoznavanja govora je da obezbedi mašinu da bude u stanju da prisluškuje govorne ulaze i individualne reči. Istraživanje razumevanja govornog jezika podrazumeva izdvajanje značenja iz svega onoga što je nepoznato [4.4]. Jedan dobar primer za audio-video (a/v) interakciju pri govornoj komunikaciji je očitavanje sa usana koje se naziva još i govorno očitavanje. Očitavanje sa usana se široko koristi u videotelefoniji i video konferenciji. Karakteristična situacija nastaje kod video-konferencijske opreme kada brzina promene kadra nije adekvatna za percepciju sinhronizacije usana. Jedno rešenje je da se izdvoji informacija iz akustičnog signala koji određuje odgovarajuće pokrete usta, pa da se onda obradi slika usta govornika kako bi se postigla sinhronizacija usana. Takođe je moguće izvršiti jedno takvo prilagođenje da akustični signal daje zvuk sinhronizovan sa pokretom usana. Ovakav prilaz je koristan kod primene u nerealnom vremenu.

33

Page 44: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

MIRNA SLIKA/VIDEO

AUDIO

MULTIMEDIJA

TEKST

KOMPRESIJA SINTEZA 3D ZVUK

PREPOZNAVANJE GOVORA: TEKST-GOVOR SINHRONIZACIJA USANA

ANIMACIJA LICA ZDRUŽENO A/V KODOVANJE

PREVOD PRIRODAN JEZIK

JEZIK OČITAVANJE SA USANA KOMPRESIJA, GRAFICI

INDEKSIRANJE/PRETRAŽIVANJE BAZE PODATAKA

Slika 4.1.1—Interakcija medija

Proizvođenje vizuelnog govora iz auditornog, podrazumeva generisanje glave govornika [4.4], [4.5]. Glavne primene ove tehnike uključuju interfejse čovek–računar, instrukcije koje podržava računar, video igre, multimedijalnu telefoniju za osobe sa oštećenim sluhom, itd.

4.2 Bimodalnost ljudskog govora Zbog bimodalnosti u percepciji govora, audio–vizuelna interakcija postaje važan faktor kod projektovanja multimedijalnih komunikacionih sistema, kao što su, na primer, videotelefonija i video konferencija. Bimodalnosna priroda percepcije čovečijeg govora prikazana je u [4.6]. U slučaju konfliktnih audio i vizuelnih stimulansa, registrovani zvuk ne postoji ni u jednom modalitetu.

Primer 4.2.1

Kada “čujemo” zvuk (ba) i “vidimo” govornika kako kaže (ga), on ne opaža ni (ga) ni (ba). Umesto toga, ono što je generisano je nešto što je blisko sa (da). Neki drugi primeri audio-vizulenih kombinacija su prikazani u Tabeli 4.2.1. Tabela 4.2.1—Primeri za McGurk-ov efekat

AUDIO + VIZUELNO PERCEPIRANO

BA GA DA

PA GA TA

MA GA NA

34

Page 45: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Do izražaja dolazi tzv. McGurk-ov efekat, što znači da govor koji registruje čovek zavisi ne samo od akustičnih znakova, već i od vizuelnih, kao što su, na primer, pokreti usana. Ukoliko rezultati vizuelne percepcije govora utiču na audio govor, radi se o tzv. inverznom McGurk-ovom efektu [4.6].

Produkcija i percepcija govora su po svojoj prirodi bimodalni. U akustičnom sistemu,

osnovna jedinica je fonem. Slično, u vizuelnom domenu, osnovna jedinica za meru pokretanja usne je vizem. To je najmanja uočljiva jedinica za govor.

Primer 4.2.2

Fonemi (p), (b) i (m) su proizvedeni sa zatvorenim ustima i vizuelno nisu uočljivi. Stoga, oni formiraju jednu grupu vizema. Slično, (f) i (v) pripadaju istoj grupi vizema koji nastaju tako što gornji zubi dodiruju donju usnu.

4.3 Očitavanje sa usana

Osoba vična očitavanju sa usana (eng. lip reading) u stanju je da razume značenje izgovorenih rečenica posmatrajući konfiguraciju i pokret vidljivih artikulatora govornika kao što su jezik, usne, zubi, itd. Poznavajući položaje ovih artikulatora obezbeđujemo informaciju o sadržaju koji sobom nosi govorni signal. Pošto ovi artikulatori nisu vidljivi, informacija može po neki put da bude nekompletna. Kombinovanjem vizuelnog sadržaja sa leksičkim, sintaktičkim, semantičkim i programskim informacijama, ljudi se mogu obučiti da razumeju govorni jezik posmatranjem pokreta govornikovog lica. Predstavljanje očitavanja sa usana zavisi od više faktora. Uslovi gledanja mogu da utiču na kvalitet vizuelne informacije. Na primer, slabo osvetljenje može da oteža utvrđivanje položaja i pomeranje usana, kao i detekciju zuba i jezika. Faktori kao što je ugao gledanja mogu takođe da budu od uticaja na prikazivanje. Direktno gledanje govornika doprinosi bržem prepoznavanju nego pod uglom. Poboljšanje očitavanja sa usne postiže se treningom [4.8], [4.9]. Poznavanje procesa prema kome ljudi izdvajaju i ugrađuju vizuelnu informaciju u govornu percepciju može biti od koristi. Isto tako, važno je znati informaciju koja je dostupna vizuelnom kanalu, koje ljudi koriste za prepoznavanje i koja se sredstva koriste za integrisanje akustične i vizuelne informacije. Akustične i vizuelne komponente nisu samo redundantne. One su isto tako i komplementarne.

Primer 4.3.1

Fonemi (p) i (k) imaju slične akustičke karakterisitke, ali se mogu lako razlikovati na osnovu zatvaranja usta. Za uzvrat (p) i (b) fonemi imaju slične vizuelne karakterisitke ali se akustički razlikju na osnovu glasnosti.

Jedno od najvažnijih pitanja u videotelefoniji i videokonferenciji je sinronizacija usne obzirom na to da je percepcija čovečijeg govora bimodalna. Tipična situacija u

35

Page 46: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

videokonferencijskoj opremi sa ograničenjima u širini propusnog opsega nastaje kada je brzina kadra takva da nije u sukobu sa percepcijom sinhronizacije usana. Rešenje bi mogli biti da se izdvoji informacija iz akustičnog signala koja se odnosi na odgovarajuće pomeranje usana, pa da se zatim obradi slika koja prikazuje usta govornika kako bi se postigla odgovarajuća sinhronizacija usana. Moguće je i izobličiti akustični signal tako da njegov zvuk bude sinhronizovan sa pokretom čovečijih usana. Ovaj prilaz je koristan za promene u nerealnom vremenu. Da bi se obezbedila sinhronizacija usana, analizator spektra ispituje audio iz studija kao i originalni zapis. Rezultati se dovode na ulaz u procesor kako bi se modifikovala vremenska skala za redosled originalnog ubeležavanja. Video kodek često preskače neke kodove kako bi se udovoljilo zahtevu za širinom propusnog opsega, što daje kao rezulatat manju brzinu kadra na dekoderskoj strani. Izostavljanje kadra dovodi do pojave pruga, podrhtavanja i gubitka sinhronizacije usne. Da bi se rešio ovaj problem možemo izdvojiti informaciju iz govornog signala i obraditi sliku usta tako da se postigne sinhronizacija usne [4.10]. Blok-šema jednog ovakvog prilaza data je na Slici 4.3.1. Modul za praćenje kadra analizira ulazne kadrove kako bi pronašao lokaciju i oblik usta [4.11]. Audio-vizuelni model preslikavanja analizira audio signal i proizvodi niz odgovarajućih oblika usta koji su izostavljeni u video kadru. Izostavljanje slike se zatim koristi kod ulaznih kadrova kako bi se modifikovao oblik usta radi proizvođenja novih kadrova koje treba uneti u originalni video. Uočava se interakcija između analize slike i analize govora. Rezultat analize slike može se iskoristiti za poboljšanje tačnosti sa kojom se prepozanje govor, kao što je to učinjeno iz automatskog očitavanja sa usne. S druge strane, govorna informacija se može iskoristiti za poboljšanje rezultata analize slike.

OBLICI USTAAUDIO-VIZUELNO PRESLIKAVANJE

PRAĆENJE KADRA

IZOBLIČENJE SLIKE

VREMENSKO IZGLAĐIVANJE

ULAZNA SLIKA (MALA BRZINA KADRA)

OBLICI I POLOŽAJ USTA

AUDIO

IZLAZNI VIDEO

(VELIKA BRZINA KADRA)

Slika 4.3.1—Blok-šema sistema za izdvajanje informacije iz govornog signala i obradu slike usta radi

postizanja sinhronizacije usne

Pored male brzine kadra, i prenos prouzrokuje gubitak sinhronizacije usne kod video-konferencije. Kašnjenje kod prenosa u slučaju videa je duže nego kod audio kašnjenja. Tehnika obrade videa uz pomoć govora rešava problem izobličenjem slike usta govornika koja je sada u sinhronizaciji sa audio signalom. Otuda je moguće smanjiti ukupno kašnjenje.

36

Page 47: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

4.4 Praćenje usana

Do danas su razvijeni mnogi postupci za parametarsko predstavljanje govora. Primera radi, linerani prediktivni koeficijent koristi se u postupku kodovanja, dok se izlazi iz filtera koriste u postupku prepoznavanja govora. U skladu sa tim, često se postavlja pitanje kako analizirati vizuelni signal, tj. u ovom slučaju pomeranje usana. Za razliku od govornog signala koji je u suštini jednodimenzionalni (eng. one-dimensional – 1D), vizuelni izlaz je predstavljen 3D video signalom sa dve prostorne dimenzije i jednom vremenskom domenzijom. Sistem za vizuelnu analizu treba da konvertuje ovaj niz slika u značajan parametar. Sistemi za vizuelnu analizu mogu se podeliti u dve glavne klase. Prva klasa razvrstava sliku usta u jednu od sedam kategorija, na primer u vizeme. Druga klasa meri parametre ili dimenzije na osnovu ulazne slike, na primer, visinu i širinu usana. Što se tiče prve klase, vektorska kvantizacija i neuralne mreže su standardne metode za klasifikaciju ulaznih slika u nekoliko kategorija. Kod druge klase, traže se parametri ili dimenzije koji imaju neko fizičko značenje. Tako, na primer, može se meriti visina između usana, kao i razmak između uglova usana kao i da se odrede parametri tog modela koji blisko povezuju model i slike. Na bazi kompjuterskog viđenja (engl. computer-vision) za praćenje pokreta usana govornika, računar može da bude tako podešen da je u stanju da razume vizuelni govor [4.12]. U bimodulnoj analizi i sintezi govora, ključno je pitanje uspostavljanja preslikavanja akustičnih parametara i onih koji se odnose na oblik usta. To znači da za zadate akustične parametre, kao što su, na primer, banke filtara, treba proceniti odgovarajući oblik usta. Otuda, u nastavku pažnju treba posvetiti audio-vizuelnom preslikavanju, kao i konvertovanju akustičnih govornih parametara u parametre koji karakterišu oblik usta.

4.5 Audio-vizuelno preslikavanje Problem konverzije govora u parametre koji koriste oblik usta može se rešiti na taj način što se uzima u obzir činjenica da je govor lingvistički entitet. Naime, govor je najpre segmentiran u niz fonema. Zatim je svaki fonem preslikan u odgovarajući vizem. Prisustvo ovakvog prilaza ogleda se u tome što je akustični signal istražen u potpunosti tako da su sve informacije uzete u obzir. Otuda, ovakav prikaz pruža najtačniju analizu govora. Pri tome ne postoji potreba za prepoznavanjem izgovorenih reči ili rečenice da bi se sprovelo audio-vizuelno preslikavanje. Pošto postoji fizička relacija između oblika vokalnog trakta i proizvedenog zvuka, može da postoji funkcionalna relacija između govornih i vizuelnih parametara. Problem konverzije sastoji se u pronalaženju najbolje funkcionalne aproksimacije za zadati niz podataka. Danas se mnogi algoritmi mogu modifikovati da bi se obavio taj zadatak (vektorska kvantizacija, neuralne mreže, kao i skriveni Markovi modeli (eng. hidden Markov model – HMM) [4.13]). 4.5.1 Konverzija na bazi klasifikacije

Konverzija na bazi klasifikacije data je blok-šemom prikazanom na Slici 4.5.1.1. Tu postoje dva dela. U prvom, akustični signal se klasifikuje na jednom od mnogobrojnih ulaza. U drugom delu, preslikava se svaka akustična klasa u odgovarajući vizuelni izlaz. U prvom delu, koristi se vektorska kvantizacija (eng. vector quantization – VQ) da se podele akustični podaci u

37

Page 48: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

jedan broj izlaza. Za svaku akustičnu klasu ugrađene su odgovarajuće vizuelne kodne reči kako bi se proizveo vizuelni efekat.

KLASIFIKACIJA

PRESLIKAVANJE

AUDIO ULAZ

VIZUELNI IZLAZ

Slika 4.5.1.1—Konverzija na bazi klasifikacije Jedan drugi problem unešen primenom metode na bazi klasifikacije je u tome što se ne proizvodi kontinualno preslikavanje već se dobija različiti broj izlaznih nivoa. Postoji nekoliko primena gde se koriste tzv. neuralni moduli za konverziju ili sinhronizaciju uključujući HMM model za audio-vizuelno preslikavanje. Mogućno je koristiti i tzv. neuralne mreže sa vremenskim kašnjenjem (eng. time-delayed neural network – TDNN ). 4.5.2 Audio i vizuelna integracija kod primena za očitavanje sa usana

Zbog naglog razvoja digitalne video tehnologije, danas je moguće uključiti i vizuelnu informaciju u proces razumevanja govora preko očitavanja sa usne. Ovo nudi efektivnu integraciju vizuelne informacije u današnje sisteme za prepoznavanje govora, kao i to da se dobije poboljšano potiskivanje šuma bez pogoršanja govora. Kompletan audio-vizuelni sistem za očitavanje sa usne može se razložiti u tri glavne komponente [4.14]:

• Prethodna obrada audio-vizuelne informacije (ekstrakcija karakterisitka iz audio i video podataka).

• Strategija prepoznavanja oblika (skriveno Markovsko modeliranje, podešavanje oblika sa dinamičkim ili linearnim izobličenjem u vremenu i različiti oblici neuralnih mreža).

• Integracija strategije (odlučivanje na osnovu prepoznavanja audio i video signala). Svaka od navedenih komponenti ima odogovarajuću strategiju koja izlazi iz okvira ovog poglavlja.

4.6 Združeno audio-video kodovanje

Audio-vizuelna informacija može se iskoristiti na više načina. Na primer, relacija između audia i videa može se primeniti da se postigne efikasnije kodovanje kako audia tako i videa. Jedan način da se iskoristi ta relacija je prediktivno kodovanje. Ovaj tip kodovanja videa koristi informaciju iz prethodnog video kadra da bi se načinila procena tekućeg kadra. Radi omogućavanja da se na prijemnoj strani obnovi originalni video kadar, prenosi se razlika između originalnog i procenjenog signala. Ovim postupkom otklanja se vremenska suvišnost u video signalu. Takođe, potrebno je sprovesti predikciju na unakrsni modalni način kako bi se istraživala unakrsna modalna suvišnost. Tu se radi o predikciji u akustičnom signalu koji se može iskoristiti da se prediktuje kako će izgledati video signal. Pošto se takođe prenose akustični

38

Page 49: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

podaci, prijemnik je u stanju da obnovi video uz vrlo malu informaciju sa strane. Postupak unakrsno-modalne predikcije prikazan je na Slici 4.6.1. Jedan ovakav sistem je skalabilan u širokom opsegu bitskih brzina.

VIZUELNA ANALIZA

AUDIO-VIDEO PRESLIKAVANJE

VIDEO SIGNAL MODEL

ODLUČIVANJA (R-D)

AUDIO SIGNAL

PARAMETARX

X

(X − X)

X

Slika 4.6.1—Blok-šema unakrsno modalnog prediktivnog kodovanja

Izmereni parametri upoređuju se sa akustičnim parametrima, a model odlučuje o informaciji koja može biti poslata. Odluka se zasniva na kriterijumu funkcije stepena oštećenja (eng. rate distortion function – RDF) informacije.

4.7 Bimodalna personalna verifikacija

Audio-vizuelna interakcija može se takođe primeniti i kod personalne verifikacije. Postojeće metode za personalnu verifikaciju zasnivaju se na slici lica ili glasu. Koristeći svaki modelitet uvode se ograničenja, kako u bezbednosti, tako i u robustnosti. Na primer, personalna verifikacija samo na bazi mirne slike dovodi do pojave pruga pri kodovanju i varijacija u uslovima različitog osvetljaja. S druge strane, upotreba glasa samo za personalnu verifikaciju nije pouzdana jer je moguće preurediti foneme na osnovu prethodno registrovanog govora osobe za sintetizovanje različitih rečenica. Uz to, govorni sistemi mogu da otkažu ukoliko je akustično okruženje u šumovima ili postoji eho kao u slučaju kancelarijskog okruženja. Ove probleme može da reši združena primena govora i videa. Kombinovanjem ova dva modaliteta moguće je dobiti bezbednije i robustnije sisteme za personalnu verifikaciju. Brojne tehnike koriste pokretanje usne zajedno sa akustičnim govorom da bi se identifikovala ili verifikovala osoba. Mogućnosti multimedijalnih personalnih računara sa kamerama i mikrofonom čine ove tehnike atraktivnim. U toku faze registracije korisnik izgovara određenu rečenicu, dok se glas i pomeranje usne ubeležava u bazu podataka. U toku faze verifikacije, od korisnika se zahteva da pročita i prikaže rečenicu na displeju. Korisnikov glas i video podaci se zatim upoređuju sa onima iz baze podataka kako bi se verifikovao određeni korisnik [4.15]. Pri tome se pomeranje usana koristi uglavnom za prepoznavanje govora, a ne za verifikaciju govornika. U [4.16] je pokazano da pomeranje usne takođe sadrži informaciju o identitetu osobe.

39

Page 50: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

4.8 Rezime U multimedijalnim komunikacijama gde je uključen ljudski govor, audio-vizuelna integracija je od posebnog značaja. Ovaj značaj ogleda se ne samo zbog razmatranja verbalne i univerzalne informacije u multimedijalnim komunikacijama, nego i zbog razlike informacija i integracija između različitih medija. U ovom poglavlju utvrđeno je da multimedijalna komunikacija predstavlja često više od prostog objedinjavanja teksta, audia, slike i videa. Kroz audio-vizuelnu interakciju data je veza između obrade audio i video signala. Naglasak je stavljen na očitavanje sa usne, sinhronizaciju, audio-video preslikavanje, kao i bimodalnu personalnu verifikaciju osobe. Združena obrada audio i video signala pruža dodatne mogućnosti koje nisu prihvatljive ukoliko se audio i video proučavaju posebno. U današnjim komunikacijama, uglavnom se ne integrišu mediji u komunikaciji među ljudima. Multimedijalni sistemi dolaze do izražaja kada je integracija sprovedena na tri ključna načina: integracija sadržaja, integracija korisnika i integracija sa drugim medijima [4.17]. Primer audio-vizuelne integracije zbog bimodalnosti percepcije govora je očitavanje sa usana. Ono se naročito koristi u okruženju šuma. Na bazi tehnika kompjuterskog viđenja za praćenje pomeranja usne u toku govora, kompjuter može da razume vizuelni govor. Uz to, automatsko očitavanje sa usana se takođe koristi za akustično prepoznavanje govora. Ukoliko brzina promene kadra nije adekvatna za percepciju sinhronizacije usana, jedno rešenje je da se izdvoji informacija iz akustičnog signala koji objedinjuje odgovarajuće pokrete usta. Potom se obrađuje slika govornikovih usta, kako bi se postigla sinhronizacija usana. Ključna stvar u analizi i sintezi govora je preslikavanje između akustičnih parametara i parametara koji odgovaraju obliku usta. Drugim rečima, to znači da za date akustične parametre treba proceniti odgovarajući oblik usta i obratno. Za ovaj postupak postoje mnoge procedure kao što su korišćenje vektorske kvantizacije, neuralne mreže i skriveni Markovski modeli. Audio-vizuelna informacija može se koristiti i za verifikaciju osobe. Postojeće relacije između audio i video signala koriste se za efikasnije kodovanje kako audia tako i videa. Neke druge aplikacije uključuju segmentaciju slike, interfejs čovek-računar, itd. Takođe, zajednička primena audia i videa može poslužiti za klasifikaciju multimedijalnih sadržaja.

Pitanja

1. U čemu se ogleda značaj audio-vizuelnih integracija u multimedijlanim komunikacijama? Gde se danas koristi tehnologija prepoznavanja govora? 2. Šta sve obuhvata audio-vizuelni interfejs? 3. Nacrtati blok-šemu koja prikazuje interakciju medija i naznačiti sve potrebne elemente. 4.

5. Navesti primer audio-vizuelne interakcije pri govornoj komunikaciji. 6. Opisati pojavu audio-vizuelne interakcije kod videokonferencije. 7. Šta je to McGurk-ov efekat? 8. Šta je fonem, a šta vizem? 9. Od čega zavisi očitavanje sa usana govornika?

40

Page 51: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

10. Nacrtati blok-šemu sistema za izdvajanje informacije iz govornog signala i obradu slike usta radi postizanja sinhronizacije usana. Kako se vrši vizuelna analiza vezana za pokretanje usne? 11.

12. Opisati način na koji se vrši audio-vizuelno preslikavanje. Iz kojih se elmenata sastoji audio-video konverzija na bazi klasifikacije? Nacrtati odgovarajuću blok-šemu.

13.

Navesti glavne komponente koje sadrži audio-video sistem za očitavanje sa usana. 14. Kako izgleda blok šema unakrsno modalnog prediktivnog kodovanja? 15.

16. Šta je bimodalna personalna verifikacija?

Literatura [4.1] K. R. Rao, Z. S. Bojković, and D. A. Milovanović, Multimedia Communication

Systems: Techniques, Standards and Networks. Prentice-Hall, 2002. [4.2] Z. S. Bojković and D. A. Milovanović, “Audiovisual integration in multimedia

communications based on MPEG-4 facial animation,” Circuits Systems Signal Processing, vol. 20, no. 3, pp. 311–339, 2001.

[4.3] T. Chen and R. R. Rao, “Audio-visual integration in multimodal communication,” Proc. IEEE, vol. 86, no. 5, pp. 837–852, May 1998.

[4.4] L. R. Rabiner and B. H. Juang, Fundamentals of Speech Recognition. Englewood Cliffs, NJ: Prentice Hall, 1993.

[4.5] F. Lavagetto, “Converting speech into lip movements: A multimedia telephone for hard of hearing people“, IEEE Trans. Rehabil. Eng., vol. 3, no.1, pp. 90–102, Mar. 1995. H. McGurk and J. MacDonald, “Hearing lips and seeing voices,” Nature, vol. 264, pp. 746–748, Dec. 1976.

[4.6]

[4.7] D. Burnham and B. Dodd, “Auditory-visual speech perception as a direct process: The McGurk effect in infants and across languages,” in Speechreading by Humans and Machines. Stork D. G. and Hennecke M. E., Eds. Berlin: Springer-Verlag, 1996, pp. 103–114. K. Neely, “Effect of visual factors on the intelligibility of speech,” J. Acoust. Soc. Am., vol. 28, pp. 1275–1277, Nov. 1956.

[4.8]

B. Walden, “Effects of training on the visual recognition of consonants,” J. Speech Hear. Res., vol. 20, pp. 130–145, Mar. 1977.

[4.9]

[4.10] T. Chen, H. P. Graf, and K. Wang, “Lip synchronization using speech-assisted video processing,” IEEE Signal Process. Lett., vol. 2, no. 4, pp. 57–59, Apr. 1995.

[4.11] R. Rao and R. Mersereau, “On merging Hidden Markov models with deformable templates,” in IEEE Proc. 1995 Int. Conf. Image Processing, vol. 3.Washington, DC, pp. 556–559.

[4.12] R. Chellappa, T. Chen, and A. K. Katsaggelos, “Audio-visual interaction in multimodal communication,” IEEE Signal Processing Mag., vol. 14, pp. 37–38, Jul. 1997

[4.13] S. Voran and S. Wolf, “Proposed framework for subjective audiovisual testing,” ANSI

41

Page 52: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Working group T1A1.5, vol. T1.A1.5, pp. 93–151, Nov. 1993. [4.14] P. L. Silsbee and A. C. Bovik, “Computer lipreading for improved accuracy in

automatic speech recognition,” IEEE Trans. Speech Audio Process., vol. 4, pp. 337–351, Sept. 1996.

[4.15] M. R. Civanlar and T. Chen, “Password-free network security through joint use of audio and video,” Proc. SPIE Photonic, pp. 120–125, Nov. 1996. J. Luettin, N. A. Thacker, and S. W. Beet, “Speaker identification by lipreading,” Proc. Int. Conf. Spoken Language Processing, Philadelphia, Oct. 1996, pp. 62–65.

[4.16]

C. L. Nikias, “Riding the new integrated media systems wave,” IEEE Signal Processing Mag., vol.14, pp. 32–33, Jul. 1999.

[4.17]

42

Page 53: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

5. MULTIMEDIJALNA AKVIZICIJA PODATAKA

Da bi se sprovela analiza i obrada multimedijalnih podataka, potrebno je digitalizovane audio ili video podatke smestiti u računar. Posle obrade digitalni signal se rekonstruiše, odnosno konvertuje u analogni oblik. Audio izvori (mikrofoni) ili izvori slike (kamere) u opštem slučaju proizvode analogne signale kontinualne u vremenu. Da bi prikupili audio ili video podatke, moramo ih odmeravati i digitalizovati. U ovom poglavlju zadržaćemo se pre svega na primerima odmeravanja i digitalizacije multimedijalnih podataka.

5.1 Diskretizacija kontinulanih signala Pri diskretizaciji kontinualnog signala, za ceo postupak koriste se dve operacije: diskretizacija signala po vremenu (odmeravanje) i diskretizacija signala po trenutnim vrednostima (kvantovanje) [5.1]. Kada treba izvršiti još i digitalizaciju kontinualnog signala, obavlja se još i treća operacija – kodovanje, odnosno predstavljanje digitalnih vrednosti signala grupom cifara ili impulsa. Digitalizovani signal se obično predstavlja pomoću dijagrama ili pomoću tabele. Na Slici 5.1.1 predstavljen je jedan digitalizovani signal pomoću dijagrama i tabelarno.

Slika 5.1.1—Predstavljanje digitalizovanog signala pomoću dijagrama a) i b)

i tabelarno c)

Očigledno je da je prikaz pomoću dijagrama na Slici 5.1.1-b pregledniji od prikaza na Slici 5.1.1-a.

43

Page 54: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

5.2 Odmeravanje Signali koji odgovaraju realnim porukama su konačnog trajanja i imaju beskonačno širok spektar. Međutim, glavni deo spektra koncentrisan je u nekom konačnom opsegu učestanosti. Izvan datog opsega, spektralna gustina amplituda signala poruka postaje toliko mala da će pri realnim radnim uslovima praktično uvek biti prekrivena šumom. Zavisnost frekvencijskog opsega signala od nivoa šuma data je na Slici 5.2.1. Smatra se da signali poruka imaju ograničeno trajanje i ograničenu širinu spektra. Vidi se da nema razloga da se pri prenosu signala prenosi i deo spektra iznad učestanosti označene sa ωg. Zbog toga, kontinualnim razlikama dovodimo u korespodenciju kontinualne vremenske funkcije koje imaju strogo ograničen spektar.

Slika 5.2.1—Zavisnost frekvencijskog opsega signala od nivoa šuma Na primer, za rad telefonskog signala dovoljno je preneti sve komponente koje se nalaze u opsegu učestanosti od 300 Hz do 3400 Hz, a da se pri tome sačuva razumljivost i snaga signala. Činjenica da realni informacioni signali ne sadrže spektralne komponente iznad neke granične učestanosti fg, omogućava diskretizaciju signala po vremenu.

Postupak odmeravanja kontinualnog signala prikazan je na Slici 5.2.2. Ova slika se sastoji iz: a) kontinualnog signala, b) povorke impulsa s0(t) dobijene odmeravanjem signala s(t) u intervalima Δt i c) kola za odmeravanje kontinulanog signala.

Ako u jednakim vremenskim intervalima Δt uzmemo trenutne vrednosti signala, što je prikazano na Slici 5.2.2-b, odnosno ako u tim tačkama generišemo impulse čija je visina jednaka amplitudi kontinualnog signala, dobićemo povorku pravougaonih impulsa čije amplitude pripadaju jednom kontinuitetu mogućih trenutnih vrednosti signala. Postupak uzimanja trenutnih vrednosti kontinulanog signala u određenim vremenskim intervalima naziva se odmeravanje. Kolo za odmeravanje sastoji se iz dvopolnog prekidača na koji se priključuje signal koji se odmerava. Prekidač ravnomernom brzinom f0 = 1/Δt naizmenično spaja jedan od dva kontakta. Neuzemljeni kontakt ostaje uključen θ sekundi, a uzemljeni kontakt je aktivan preostali period vremena od Δt − θ sekundi. Na izlazu kola pojavljuje se povorka impulsa širine θ, periode T = Δt i promenljive amplitude. Diskretne vrednosti dobijene odmeravanjem nazivaju se odmerci. Teorijski, odmerci treba da budu beskonačno uski.

44

Page 55: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Slika 5.2.2—Odmeravanje kontinualnog signala: a) kontinualni signal, b) povorka impulsa s0(t) dobijena odmeravanjem signala s(t) u intervalima Δt, c) kolo za odmeravanje

Na ovom mestu pomenućemo tzv. teoremu o odmeravanju. Ona kaže da se svaki

kontinualni vremenski signal čiji je frekvencijski opseg ograničen i nalazi se u intervalu od 0 Hz do fg može jednoznačno definisati konačnim brojem svojih diskretnih vrednosti u konačnom vremenskom intervalu pod uslovom da se odmeravanje vrši u vremenskim intervalima

0g

12

T tf

= Δ ≤ (5.2.1)

Recipročna vrednost periode odmeravanja T0 naziva se učestanost odmeravanja:

00

1 2 gf fT

= = (5.2.2)

Količnik trajanja odmerka i intervala odmeravanja naziva se faktor težine odmeravanja:

00 0 0

0

2 g 0f fTθα θ= = = θ (5.2.3)

45

Page 56: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Postupak odmeravanja može se shvatiti kao množenje signala s(t) i funkcije odmeravanja h0(t) u vremenskom domenu, tj.,

s0(t) = s(t)h0(t). (5.2.2)

Objašnjenje procedure odmeravanja kao množenje dve vremenske funkcije prikazano je na Slici 5.2.3.

h0(t)

MNOŽENJE s(t) s0(t)

Slika 5.2.3—Procedura odmeravanja 5.2.1 Odmeravanje audio signala Posmatrajmo talasni oblik jednog audio signala prikazanog na Slici 5.2.1.1, gde je predstavljena normalizovana amplituda signala u funkciji vremena. Signal se brzo menja.

Slika 5.2.1.1—Talasni oblik jednog audio signala Da bi se signal memorisao fizički je nemoguće odrediti vrednost signala u svakom trenutku i tu vrednost memorisati. Stoga je potrebno odmeravati signal u regularnim vremenskim intervalima. Kada je odmeravanje sprovedeno, vrednosti signala u vremenima koja se ne poklapaju sa trenucima odmeravanja se očigledno za uvek izgubljena. Količina informacije koja se izgubi zbog odmeravanja povećava se sa intervalom odmeravanja. Na Slici 5.2.1.2 prikazan je amplitudni spektar jednog audio signala.

46

Page 57: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Uočava se da je spektar zanemarljiv iznad 12 kHz. Pošto su visoko frekvencijske komponente vrlo male, može se reći da se signal ne menja velikom brzinom. U tom slučaju, moguće je odmeravati signal i obnoviti ga kompletno primenom interpolacije ukoliko je frekvencija odmeravanja dovoljno visoka. Tražena frekvencija odmeravanja određuje se primenom Nyquist-ovog kriterijuma.

Slika 5.2.1.2—Amplitudni spektar audio signala

Primer 5.2.1.1

Ako je periodični signal dekomponovan u pet sinusnih talasa sa frekvencijama 100 Hz, 300 Hz, 500 Hz, 700 Hz i 900 Hz treba odrediti širinu propusnog opsega i nacrtati spektar signala uz predpostavku da su sve komponente maksimalne amplitude od 10 V.

U odgovoru na ovaj primer, označićemo sa fh najvišu a sa fl najnižu frekvenciju, dok je B širina propusnog opsega. Tada je

B = fh − fl = 900 Hz – 100 Hz = 800 Hz. Odgovarajući spektar signala dat je na Slici 5.2.1.3.

Slika 5.2.1.3 Spektar signala uz primer 5.2.1.1

47

Page 58: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Primer 5.2.1.2

Signal ima širinu propusnog opsega od 20 Hz. Najviša frekvencija je 60 Hz. Koja je najniža frekvencija? Nacrtati spektar signala koji sadrže sve frekvencije iste amplitude.

Ako je sa fh označena najviša, a sa fl najniža frekvencija, tada je širina propusnog opsega:

B = fh − fl tj.

fl = fh – B = 60 Hz – 20 Hz = 40 Hz.

Spektar koji sadrži sve integralne frekvencije prikazan je na Slici 5.2.1.4

Slika 5.2.1.4—Spektar signala

Primer 5.2.1.3

Posmatrajmo neki audio signal predstavljen funkcijom g(t). Fourier-ova transformacija signala je oblika:

( ) ( )+

jωtG ω = g t e dt∞

−∞∫ (5.2.1.1)

Ukoliko je G(ω) = 0 za |ω| > 2πB, za g(t) se može reći da je opsega ograničenog na {B}Hz, signal g(t) se može predstaviti u obliku:

( ) ( ) ( ) ( ) ( )sk

g t g t s t g kT s t kT+∞

=−∞

= = −∑ (5.2.1.2)

gde je s(t) funkcija odmeravanja definisana na sledeći način:

48

Page 59: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

( ) ( )∑+∞

−∞=

−=t

kTtts δ (5.2.1.3)

Fourier-ova transformacija od gs(t) je [5.2]

( ) (1 2+

)s st=

G ω = G ω πkfT

−∞

−∑ (5.2.1.4)

Primer 5.2.1.4

Na Slici 5.2.1.5 prikazan je vremenski i frekvencijski domen signala koji ilustruju proces odmeravanja u ograničenom opsegu. Ovde g(t) predstavlja ulazni signal, fs je frekvencija odmeravanja, s(t) predstavlja talasni oblik prilikom odmeravanja, dok je gs(t) odmeravani signal.

Slika 5.2.1.5—Proces odmeravanja u ograničnom opsegu

49

Page 60: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

S druge strane, G(ω), S(ω) i Gs(ω) su Fourier-ove transformacije od g(t), s(t) i gs(t) respektivno. Uočimo da je Gs(ω) periodičko proširenje za G(ω). Dva uzastopna perioda od Gs(ω) neće se preklapati ako je:

fs > 2B (5.2.1.5) Ovaj uslov je poznat kao Nyquist-ov kriterijum [5.3] Na osnovu Nyquist-ovog kriterijuma, signal g(t) širine propusnog opsega {B}Hz može se tačno obnoviti iz g(kT) ukoliko je frekvencija odmeravanja fs = 1/T > 2B. Minimalna frekvencija odmeravanja za perfektnu rekonstruciju signala (u našem slučaju to je 2B odmeraka/s) naziva se Nyquist-ova frekvencija. Da bi rekonstruisali originalni signal, odmeravani signal mora da se dovede idealnom niskopropusnom filtru sa graničnom frekvencijom fs/2. To će usloviti visokofrekventne komponente iz Gs(ω), pa se dobija originalni signal sa Fourier-ovim spektrom. Kao alternativa, audio signal se može rekonstruisati direktno iz odmeraka koristeći sledeću formulu iz vremenskog domena:

( ) ( ) ( )( )

sin+s

k= s

f t k πg t = g kt

f t k π

−∞

−−∑ (5.2.1.6)

Ova relacija ukazuje na to da vrednosti signala između neodmeravanih trenutaka moraju da se tačno odrede koristeći težinsku sumu svih odmeravanih vrednosti. Treba uočiti da oba prilaza i u frekvencijskom i u vremenskom domenu, mada prividno različiti, u suštini su ekvivalenti jer sin funkcija na desnoj strani predstavlja impulsni odgovor idealnog niskopropusnog filtra. Kada je audio signal odmeravan sa fs odmeraka/s frekvencijski opseg koji može biti tačno rekonstruisan je:

0 ≤ f ≤ fs/2 (5.2.1.7)

Frekvencije veće od fs/2 se preklapaju, frekvencija odmeravanja audio signala zavisi od primene. Pošto je širina audio-opsega 20 kHz, frekvencija odmeravanja od 40 kHz je dovoljna kod visokokvalitetnih audio aplikacija. Za audio CD aplikacije, frekvencija odmeravanja je 44.1 kHz. U tom slučaju margina od 4.1 kHz čini da je projektovanje ulaznog filtra (eng. antialising filter) olakšano. Tako, na primer, za telefonske sisteme koristi se frekvencija odmeravanja od 8 kHz.

50

Page 61: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

5.2.2 Odmeravanje dvodimenzionalnih (2D) slika Nyquist-ova teorija odmeravanja može se proširiti na diskretizaciju slika. Neka je slika predstavljena funkcijom i(x, y) gde su x i y dve prostorne dimenzije. Dvodimenzionalna (eng. two-dimensional – 2D) formirana transformacija slike može se predstaviti u obliku:

( ) ( ) ( ) dydxeyxiI yxjvh

vh ωωωω +−+∞

∞−

+∞

∞−∫ ∫= ,, (5.2.2.1)

gde je

ωh horizontalne prostorna frekvencija, ωv vertikalna prostorna frekvencija.

Treba naglasiti da je ωh = 2πfh i ωv = 2πfv, gde su fh i fv horizontalne i vertikalne frekvencije. Uz predpostavku pravougaone rešetke odmeravanja i ako je slika odmeravana u prostornom intervalu (Δx, Δy), odmeravana slika može se izraziti kao:

( ) ( ) ( ) (, , , ( , ) ,sm n

i x y i x y s x y i m x n y x m x y n yδ+∞ +∞

=−∞ =−∞

= = Δ Δ − Δ∑ ∑ )− Δ (5.2.2.2)

gde je s(x, y) 2D funkcija odmeravanja definisana relacijom

( ) (∑ ∑+∞

−∞=

+∞

−∞=

Δ−Δ−=m n

ynyxmxyxs ,, δ ) . (5.2.2.3)

2D funkcija odmeravanja prikazana je na Slici 5.2.2.1. Frekvencije odmeravanja u horizontalnim i vertikalnim pravcima su 1/Δx i 1/Δy, respektivno.

Slika 5.2.2.1—Dvodimenzionalna funkcija odmeravanja

51

Page 62: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Proširujući Nyquist-ovu teoriju na dve dimenzije, može se pokazati da se slika i(x, y) može dobiti ako su ispunjeni sledeći uslovi:

1/Δx ≥ 2fm i 1/Δy ≥ 2fv. (5.2.2.4)

Jedan značajan parametar u stvaranju digitalne slike je rezolucija slike. Tako na primer, kada je slika skenirana, treba navesti rezoluciju skenirane slike. Pogodna rezolucija se određuje na osnovu (5.2.2.4) i osobina čovečijeg vizuelnog sistema. S druge strane, detalji slike koje vidimo očima zavise od ugla koji slika formira na retini. 5.2.3 Niskopropusni anti-aliasing filtri

U praksi, signal nije tačno ograničenog opsega mada su višefrekvencijske komponenete u opštem slučaju veoma male. Ove komponente unose preklapanja (alias) i mogu se smatrati kao izobličenja u odmeravanom signalu. Da bi se obezbedilo da audio signal ili signal slike bude dovoljno ograničenog opsega, signal se propušta kroz niskipropusni anti-aliasing filtar kako bi se znatno smanjile visokofrekvencijske komponente tako da tzv. alias komponente imaju vrlo malu energiju. Tipična karakteristika 1D niskopropusnog/anti-aliasing filtra prikazana je na Slici 5.2.3.1. gde je sa fs označena frekvencija odmeravanja.

Slika 5.2.3.1—Karakteristike niskopropusnog/anti-aliasing filtra: a) idealni uskopropusni filter sa ravnim pojačanjem u propusnom opsegu, b) realizabilni niskopropusni filter sa postepenim prelaskom od propusnog

ka nepropusnom opsegu Jedan idealni nisko-propusni filtar ima opštu graničnu (eng. cut-off) frekvenciju od fs/2 što je prikazano na Slici 5.2.3.1-a. U praksi je međutim nemoguće realizovati jedan takav filtar. Na Slici 5.2.3.1-b prikazan je frekvencijski odziv tipičnog filtra koji se može realizovati. Ovde je pojačanje u propusnom opsegu blisko jedinici, dok je pojačanje u nepropusnom opsegu blisko nuli. Prelazni opseg omogućuje postupno opadanje pojačanja i to od 1 ka 0. Projektovanje 1D niskopropusnog/anti-aliasing filtra može se proširiti na projektovanje 2D niskopropusnog/anti-

52

Page 63: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

aliasing filtra za Slike. U tom slučaju filtar će imati dve granične (cut-off) frekvencije i to po jednu u horizontalnom i vertikalnom pravcu.

5.3 Digitalizacija audio signala Uprošćena blok-šema digitalizacije audio signala data je na Slici 5.3.1. Navešćemo glavne funkcije svakog bloka.

Na Slici 5.3.1-a prikazan je proces odmeravanja i digitalizacije audio signala. Analogni audio signal iz mikrofona ima mali dinamički opseg. Otuda se on pojačava pre bilo kakve obrade. Naime, audio signal će biti pojačan pre unošenja bilo kakvog šuma (šum zbog ditera ili šuma kvantovanja). Diter generator unosi malu količinu slučajnog šuma koji se pridodaje audio signalu na izlazu iz pojačavača. Anti-aliasing filter je niskopropusni filtar koji obezbeđuje da audio signal bude ograničenog opsega. Pored toga, on eliminiše komponentu preklapanja posle odmeravanja [5.4].

DISKRETNIDIGITALNI

AUDIO

POJAČAVAČ

ANALOGNI AUDIO SIGNAL IZ MIKROFONA

GENERATORDITERA

ANTI-ALIASING FILTER

A/D KONVERTOR +

SH

ANALOGNI AUDIO (C – N)

MULTIPLEKSER

SKLADIŠTENJE

PODATAKA

ODMERAVANJE I

DIGITALIZACIJA

ODMERAVANJE I

DIGITALIZACIJA

KOMPRESIJA I KOREKCIJA

GREŠKE

DIGITALNI AUDIO

ANALOGNI AUDIO (N – 1)

DIGITALNI AUDIO

a)

b)

Slika 5.3.1—Digitalizacija audio signala: a) odmeravanje i digitalizacija, b) N-kanalno registrovanje i skladištenje audio podataka

Uzorak i zadržavanje (eng. sample and hold – SH) blok služi za držanje amplitudne

vrednosti odmeraka od trenutka odmeravanja audio signala do trenutka nailaska sledećeg odmerka. Zatim se vrši odmeravanje audio signala u svakom trenutku odmeravanja. Analogno– digitalni (eng. analog to digital – A/D) konvertor služi za ekvivalentno digitalno predstavljanje

53

Page 64: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

analognog signala. Multipleksiranje niza bita koji dolaze iz razlićitih kanala vrši se pomoću multipleksera. Komprimovanjem se smanjuje suvišnost i komprimuje veličina audio fajla pri čemu se održava prihvatljiv nivo kvaliteta audio signala. Kada je audio signal kvantovan koristeći mali broj bita po odmerku, kvalitet audio signala je loš. Utvrđeno je da ako se pre kvantizacije pridoda mala količina diter šuma subjektivni kvalitet se poboljšava. Ukoliko audio sistem ima više kanala (na primer 7 – 8 kanala), gornja procedura se primenjuje posebno na svaki kanal. To znači da se odmerci iz različitih audio kanala multipleksiraju, komprimuju i skladište za budući tzv. “playback”, što je prikazano na Slici 5.3.1-b. 5.3.1 Analogno-digitalna konverzija Ulaz u A/D konvertor je diskretni vremenski signal čija je amplituda realni broj koji može da zahteva jedan beskonačan broj bita/digita radi vernog predstavljanja. Za obradu na digitalnom računaru, signal u svakom trenutku treba da bude konvertovan u 8, 16 ili 32 bita. To realizuje kvantizer koji ustvari preslikava kontinualnu promenljivu u diskretnu promenljivu. Ulazno– izlazna relacija za tipičan kvantizer je stepenasta funkcija kao što je prikazano na Slici 5.3.1.1.

Slika 5.3.1.1—Proces kvantizacije, (a) uniformni kvantizer, (b) neuniformni kvantizer Predpostavimo sada da nam je potreban kvantizer sa N izlaznih nivoa. Nivoi odlučivanja i

izlazni (rekonstruisani) nivoi označeni su sa (dk, 0 ≤ k ≤ N) i (rk, 0 ≤ k ≤ N − 1), respektivno, gde je dk ≤ rk < dk+1. Izlaz iz kvantizera za zadati ulaz u kvantizer označen sa g(nT) može se izračunati primenom relacije:

Q [g(nT)] = rk, ako je dk ≤ g(nT) < dk+1. (5.3.1.1)

54

Page 65: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Ukoliko su nivoi odlučivanja ekvidistantni, tj. ako je (dk-1 – dk) konstantno za svako k, radi se o uniformnom kvantizeru, što je prikazano na Slici 5.3.1.1-a. Ulazno–izlazna funkcija i greška kvantovanja za neuniformni kvantizer su dati na Slici 5.3.1.1-b. Kvantovane vrednosti signala mogu se predstaviti korišćenjem različitih metoda. Najviše rasprostranjena metoda je tzv. metoda PCM. Tu se svaki odmerak predstavlja korišćenjem fiksnog broja bita i kodovan je nezavisno od drugih. Ukupan broj mogućih amplitudnih nivoa u PCM je povezan sa brojem bita koji se koriste za predstavljanje svakog odmerka. Ako je N broj nivoa izlaza iz kvantizera a B broj bita po odmerku, tada je:

N = 2B. (5.3.1.2) Vidi se da ukoliko je upotrebljen veći broj bita B za predstavljanje odmerka, broj izlaznih nivoa N će se povećavati. To će smanjivati grešku kvantovanja pa će se dobiti bolji kvalitet audio signala. Bitski protok kvantnog audio signala dobija se iz izraza:

BITSKI PROTOK = fsB (bita/kanal/sekundi) (5.3.1.3) gde je sa fs označena frekvencija odmeravanja, dok je B, kao i pre, broj bita po odmerku. Za stereo audio, kanali se mogu posmatrati kao nezavisni [5.5]. Otuda, bitski protok za stereo audio biće dva puta od onoga za mono audio, tj. 2fsB bita u sekundi. 5.3.2 Kriterijum vernosti audio signala Kvalitet audio signala postiže se ako se veliki broj bita koristi za reprezentovanje svakog odmerka. S druge strane, to će povećati bitski protok audio signala. Dakle, kaže se da postoji veza bitskog protoka i kvaliteta digitalizovanog audio signala. Izbor bitskog protoka i kvaliteta audio signala zavisi od odgovarajuće primene audio signala. U cilju postizanja objektivnosti ocene, važno je da se definišu kriterijumi vernosti audio signala. Koriste se dva kriterijuma za procenu kvaliteta analize signala: subjektivni (kvalitativni) i objektivni (kvantitativni). Kod subjektivne procene, vernost audio signala predstavlja se pomoću tzv. skale pogoršanja koja ima pet nivoa od 1 do 5 što je prikazano u TabelI 5.3.2.1 [5.6].

Tabela 5.3.2.1—Skala pogoršanja za procenu vernosti audio signala

Vrlo neugodna smetnja 1

Neugodna smetnja 2

Neznatno neugodna smetnja 3

Smetnja se oseća ali nije neugodna 4

Smetnja se ne oseća 5

55

Page 66: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Na skali pogoršanja meri se kvalitet čujnosti obzirom na izobličenje u signalu. Za zadati audio signal grupe ispitanika (nazvani subjekti) su ispitivani da procene kvalitet audio signala dajući odgovarajuće ocene na skali od pet opcija. Mišljenja su subjektivna, a rezultati variraju od subjekta do subjekta. Prosečan rezultat (srednja vrednost) se naziva srednja vrednost mišljenja (eng. mean opinion score – MOS). MOS zahtev zavisi od oblasti primene. Tako, na primer ocena tri može biti zadovoljavajuća u telefoniji. S druge strane, za kvalitetan audio, vrednost ocene za MOS treba da bude bliska pet (veća od 4.5). Subjektivni kvalitet audio signala na osnovu ljudskog auditornog sistema je složena procedura koja uključuje eksperimente uz prisustvo eksperata i/ili neekspertnih subjekata. Uz to, na subjektivne procene utiče izbor subjekata i pravilno obavljanje eksperimenta. Iz tog razloga razvijeno je nekoliko kvantitativnih mera da bi se procenio objektivni kvalitet audio signala. Izbor objektivne (kvantitativne) mere izobličenja zavisi od više faktora. Pre svega, ovakva mera se može prikazati u prirodnom analitičkom obliku, a onda biti prilagođena za lako izračunavanje. Odnos signal–šum (eng. signal-to-noise ratio – SNR) i srednja kvadratna greška (eng. mean square error – MSE) su dva parametra za utvđivanje izobličenja audio signala. Oni su dati sledećim izrazima:

( )

( ) ( )

12

01 2

0

ˆ

ˆ

N

nN

n

f nSNR

f n f n

=−

=

=−⎡ ⎤⎣ ⎦

∑ (5.3.2.1)

( ) 1010 logSNR dB SNR= (5.3.2.2)

( ) ( )21

0

1 ˆN

nMSE f n f n

N

=

= −⎡ ⎤⎣ ⎦∑ (5.3.2.3)

gde su

( )f n odmerci originalnog audio signala,

odmerci kvantitativnog audio signala i ( )ˆf n

N predstavlja broj audio odmeraka. Tradicionalno, SNR je najpoznatija mera za grešku. Pored toga što pruža korisne informacije, ovaj odnos je matematički prilagodljiv, pa je iz tog razloga naišao na najširu primenu. Nažalost, vrednosti SNR nisu u dobroj koleraciji sa subjektivnim ocenama, naročito pri velikim odnosima kompresije. Kvalitet digitalnog audio odmerka je određen brojem bita po odmerku. U procesu kvatizacije, ulazna vrednost odmerka je predstavljena najbliže mogućim izlaznim nivoom. U tom procesu, unosi se šum u kvantovani signal. Greška (šum) kvantovanja je razlika između stvarne vrednosti analognog signala i njegove kvantovane vrednosti. Drugim rečima

( ) ( ) ( ) ( ) ( )ˆe nT f nT g nT g nT Q g nT= − = − ⎡ ⎤⎣ ⎦ (5.3.2.4)

56

Page 67: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

gde je (g nT )

) ulazni signal,

(g nT izlaz iz kvantizera,

( )e nT signal greške u trenutku odmeravanja nT.

Ukoliko se za grešku e(nT) predpostavi da je statistički nezavisna i sa uniformnim redosledom u intervalu [-Q/2, Q/2], srednja kvadratna vrednost šuma kvantovanja za signal sa dinamičkim opsegom od 1 (tj. Q = 2 –B) može se izraziti u obliku

/ 2 2 22

/ 2

112 12

Q

Q

QE = e de = =Q

−∫

B2 (5.3.2.5)

gde je

B broj bita upotrebljen za predstavljanje svakog odmerka. Izraženo u dB, srednja kvadratna vrednost šuma može se predstaviti u obliku:

2 2B

10 10210log 10log 6B 10.8

12 12QE = = =

− − . (5.3.2.6)

Jednakost (5.3.2.6) pokazuje da svaki dodatni bit u postupku A/D konverzije smanjuje šum za oko 6 dB i na taj način povećava SNR za isti iznos. Tako, na primer, SNR za 16 bitni kvantovani audio signal će biti reda veličine 96 dB. Za jedan audio signal koji ima SNR veći od 90 dB se smatra da je odličnog kvaliteta za najveći broj primena.

5.4 Digitalizacija slika Osetljivost ljudskog vizuelnog sistema je skromnija nego kod auditivnog sistema. Dok auditivni sistem može da razlikuje na hiljade nivoa zvučnog pritiska, HVS može da razlikuje samo oko 200 nivoa sjaja [5.7]. Slika sivog nivoa može se opistai kao slika odličnog kvaliteta sa 8-bitnom rezolucijom koja odgovara vrednosti od 256 nivoa sivog [5.8]. Što se tiče slike u boji, njene tri osnovne komponente R, G i B zajedno se koriste. Svaka od tri komponente posebno se kvantuje [5.9]. Na primer, senzori visoke rezolucije u opštem slučaju koriste 8 bita/kanal/piksel. Stoga je ukupno 24 bita potrebno za predstavljanje piksela u boji. Uočimo da 24 bita po pikselu odgovara broju od 224 boja, što je mnogo više od nego što ljudske oči mogu da razlikuju. Otuda, mnogi elementarni uređaji koriste displej sa nižom rezolucijom (tj. 8 bita ili 16 bita). 5.4.1 Vizuelna vernost

U procesu kvantizacije piksela pogoršava se kvalitet vizuelnih podataka. Uz to, može se pojaviti izobličenje usled kompresije slike. Kao i u slučaju audio signala, postoje dva tipa mere

57

Page 68: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

vernosti: subjektivni i objektivni. U slučaju subjektivnih mera, koristi se slična skala kao i kod audio signala za procenu kvaliteta slike. Međutim vizuelno testiranje sa realnim subjektima predstavlja glomaznu proceduru. Otuda, kada je u pitanju vizuelna vernost, u praksi se najčešće koriste objektivne mere vernosti. Ove najčešće korišćene mere su SNR i MSE. Ovim merama treba pridodati vršni odnos signal–šum (eng. peak-signal-to-noise ratio – PSNR), kao i srednju apsolutnu grešku (eng. mean absolute error – MAE). Ako su ( ),f m n i (ˆ , )f m n originalna i izobličena slika, respektivno, dimenzija M × N, vizuelna vernost može se oceniti primenom sledećih parametara [5.10], [5.11]:

( )( )

( ) ( )

1 1 2

0 010 1 1 2

0 0

ˆ ,10 log

ˆ , ,

M N

m nM N

m n

f m nSNR dB

f m n f m n

− −

= =− −

= =

⎡ ⎤⎣ ⎦

=⎡ ⎤−⎣ ⎦

∑∑

∑∑ (5.4.1.1)

( )[ ]

( ) ( )

1 12

0 010 1 1 2

0 0

vršna vrednost signala10log

ˆ , ,

M N

m nM N

m n

PSNR dBf m n f m n

− −

= =− −

= =

=⎡ ⎤−⎣ ⎦

∑∑

∑∑ (5.4.1.2)

( ) ( )21 1

0 0

1 ˆ , ,M N

m nMSE f m n f m n

MN

− −

= =

⎡ ⎤= −⎣ ⎦∑∑ (5.4.1.3)

( ) ( )1 1

0 0

1 ˆ ,M N

m n,MAE f m n f m n

MN

− −

= =

= −∑∑ (5.4.1.4)

Mada ove objektivne mere omogućuju da se brzo proceni izobličenje, one nisu dobro korelisane sa subjektivnim procenama, naročito kada se radi o velikom izobličenju.

5.5 Rezime U današnjim telekomunikacionim sistemima, analiza i obrada multimedijalnih podataka predstavlja vrlo aktuelan problem. Kod analognih sistema javljaju se problemi šuma, nestabilnost, velike potrošnje energije. Da bi se audio ili video podaci smestili u računar moraju se digitalizovati. Digitalni sistemi omogućavaju jednostavan prenos i skladištenje podataka. Pored toga, široke mogućnosti programiranja čine digitalne sisteme superiornim u odnosu na analogne. Digitalizacija multimedijalnih signala je opšta tema koja se pojavljuje u više naučnih disciplina. Činjenica je da su audio i video sistemi uneli mnogo specifičnih zahteva koji se postavljaju prema digitalizovanom signalu, a koji su posledica izuzetnih zahteva čula sluha u čula vida kao krajnjih korisnika informacija. Da bi se analogni audio adekvatno digitalizovao njegov spektar mora biti ograničen u skladu sa teoremom odabiranja. Spektar audio signala možemo ograničiti na dva načina. Prvi način je da ga ograničimo samo sa ulaznim filtrom. Drugi način je da koristimo ulazni filtar u

58

Page 69: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

kombinaciji sa tzv. “oversampling-om”. Pojam “oversampling” podrazumeva odmeravanje koje se obavlja na mnogo višoj frekvenciji od Nyquist-ove granice. Pošto je frekvencija odmeravanja dovoljno velika, neće doći do preklapanja u spektru.

Kvantovanje je proces koji trajno unosi grešku kako u audio tako i u video signal. Veličina greške zavisi od broja nivoa kvantovanja. Zbog nelinearnosti karakteristike kvantizera dolazi do izobličenja koja prouzrokuju harmonike (granulacioni šum). Efikasna metoda za uklanjanje granulacionog šuma je diterovanje. To je nezaobilazni proces kod A/D konvertora audio signala.

Greška kvantovanja može se smanjiti na dva načina: da se poveća broj nivoa kvantovanja, odnosno broj bita po odmerku ili da se koristi “oversampling”. Kako je danas isplativije da se povećava brzina odmeravanja nego broj bita, treba se opredeliti na primenu “oversampling-a”.

Ukoliko audio signal dolazi iz više kanala odmerci iz različitih audio kanala se multipleksiraju, komprimuju i skladište za budući “playback”.

Da bi se digitalizovala slika treba poznavati osobine ljudskog vizuelnog sistema. Odmeravanje slike vrši se pomoću više rešetki. Heksagonalno odmeravanje bolje formira frekvencijsku ravan što rezultuje manjom frekvencijom odmeravanja. Nedostatak ovih tipova odmeravanja je u tome što nisu skalabilna. Za kvantovanje slike koriste se dve vrste kvantizacije: skalarna i vektorska. Skalarno kvantovanje koristi uglavnom osam bita, jer više bita neće generalno poboljšati kvalitet slike, osim ako se ne vrše neka dodatna ispitivanja. Prednost skalarne kvantizacije u odnosu na vektorsku je u tome što je skalarna kvantizacija brža.

Radi postizanja ocene kvaliteta audio signala definišu se dva kriterijuma i to subjektivni (kvalitativni) i objektivni (kvantitativni). Subjektivni uključuje procene na osnovu eksperimenata sa ispitanicima. Objektivni kriterijum, s druge strane, uzima u obzir odnos signal–šum i srednju kvadratnu grešku nastalu u procesu kvantizacije signala.

U procesu kvantizacije piksela pogoršava se kvalitet vizuelnih podataka. Kada je reč o vizuelnoj vernosti, dva najčešće korišćena parametra za procenu kvaliteta su opet odnos signal– šum i srednja kvadratna greška. Međutim, u ovom slučaju kao parametri se još pridodaju vršni odnos signal–šum i srednja apsolutna greška.

U skoroj budućnosti od uređaja za akviziciju audia očekuje se: povećanje frekvencije odmeravanja, zamena analognih komponenti i na taj način poboljšanje performansi sistema za akviziciju. Korišćenjem vektorske kvantizacije treba povećati kvalitet i kompresiju digitalnog audio signala. Treba imati u vidu i to da je zbog porasta kompleksnosti integracije i trenda smanjenja napona napajanja sve teže realizovati konverziju visoke rezolucije sa klasičnim A/D konvertorima. Što se tiče akvizicije slike, potrebno je povećanje gustine odmeravanja i na taj način poboljšanje performansi sistema za akviziciju, korišćenje vektorske kvantizacije, kao i rad na usavršavanju poluprovodničkih senzora i otklanjanju njihovih nedostataka.

Napretkom tehnologije sve više se prelazi na digitalne sisteme za akvizaciju slike. Na primer, razvoj silicijumskih senzora i odgovarajućih čipova osnovni su razlog za široku eksploataciju digitalnih kamera.

Pitanja

Koji se postupci koriste pri diskretizaciji, a koji pri digitalizaciji kontinualnog signala?1. 2. Šta je to odmeravanje kontinulanog signala i kako se ono vrši?

59

Page 70: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

3. Šta je to kontinualno odmeravanje? 4. Nacrtati blok-šemu kola za odmeravanje signala i objasniti kako radi ovo kolo. 5. Kako glasi teroema o odmeravanju? 6. Šta je to faktor režima odmeravanja?

Nacrtati blok-šemu koja ilustruje proceduru odmeravanja u vremenskom domenu. 7. 8. Šta predstavlja Nyquist-ov kriterijum? 9. Kako se Nyquist-ova teorija odmeravanja može proširitu na diskretizaciju slike?

10. U čemu se ogleda uloga tzv. anti-aliasing filtra kod multimedijalne akvizicije podataka?

11. Nacrtati karakteristiku anti-aliasing filtra koji se može realizovati u praksi i naznačiti odgovarajuće parametre. Nacrtati blok-šemu za digitalizaciju audio signala, naznačiti i objasniti funkciju svakog elementa.

12.

Na koji se način vrši N-kanalno registrovanje audio podataka? 13. 14. Šta je to uniformni, a šta neuniformni kvantizer?

Na koji način se može poboljšati kvalitet audio signala kada se primeni impulsno kodovana modulacija?

15.

Kako se određuje bitski protok kvantovanog audio signala za monoaudio i za stereoaudio?

16.

Koji se kriterijumi koriste za procenu kvaliteta audio signala? 17. Kada se koristi subjektivni, a kada objektivni kriterijum za procenu kvaliteta audio signala?

18.

19. Predstaviti tabelarno skalu pogoršanja za procenu vernosti audio signala. 20. Šta utiče na subjektivne procene kvaliteta audio signala?

Kako glase izrazi za utvrđivanje odnosa signal-šum u dB i srednju kvadratnu grešku nastalu u toku obrade audio signala?

21.

22. Predpostavljajući da je šum kvantovanja statistički nezavisan i sa uniformnom raspodelom u intervalu [-Q/2, Q/2] odrediti srednju kvadratnu vednost šuma u dB.

23. U čemu se ogleda uloga dodatnog bita u postupku analogno-digitalne konverzije? Kada se smatra da je za najveći broj primena audio signal odličnog kvaliteta? 24.

25. Uporediti osetljivost ljudskog auditivnog i vizuelnog sistema. Šta je potrebno za opisivanje digitalne slike sivog nivoa, a šta za opisivanje kada je ista u boji?

26.

Koji se parametri koriste za utvrđivanje vizuelne vernosti digitalizovane slike? 27. Kako se definiše vršni odnos signal-šum za određivanje vizuelne vernosti digitalizovane slike?

28.

29. Napisati analitički izraz za srednju kvadratnu grešku nastalu u procesu digitalizacije slike.

30. U čemu se razlikuju subjektivne i objektivne mere za procenu vernosti digitalizovane slike?

60

Page 71: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Literatura

Z. Urošević i M. Savić, Telekomunikacije: Elementi Teorije, Analize i Obrade Signala. Beograd, Nauka, 1995.

[5.1]

M. Kr. Mandal, Multimedia Signals and Systems. Kluwer Academic Publishers, 2003. [5.2] B. P. Lahti, Signal Processing and Linear Systems. Carmichael, CA: Berkeley-Cambridge Press, 1998.

[5.3]

N. S. Jayant and P. Noll, Digital Coding of Waveforms: Principles and Applications to Speech and Video. Englewood Cliffs, N. J: Prentice Hall, 1984.

[5.4]

K. C. Pohlmann, Principles of Digital Audio. New York, McGraw-Hill, 2000. [5.5] Methods for the Subjective Assessment of Small Impairments in Audio Systems, Including Multichannel Sound Systems, ITU-R REC. BS.1116, 1994.

[5.6]

Z. S. Bojković, C. I. Toma, V. Gui, and R. Vasiu, Advanced Topics in Digital Image Compression. Timisoara, Romania: Politechnica, 1997.

[5.7]

M. Rabbani and P. W. Jones, Digital Image Compression Techniques. Bellingham, Washington, USA, SPIE-The International Society for Optical Engineering, 1991.

[5.8]

R. W. G. Hunt, The Reproduction of Colour. England, Fountain Press, 1987. [5.9] A. K. Jain, Fundamentals of Digital Image Processing. Englewood Cliffs, New Jersey, Prentice Hall, 1989.

[5.10]

K. R. Rao and J. J. Hwang, Techniques and Standards for Image, Video, and Audio Coding. Upper Saddle River, NJ: Prentice Hall, 1996.

[5.11]

61

Page 72: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

6. KOMPRESIJA TEKSTA Tekst je još jedan značajan medium za predstavljanje multimedijalnih informacija. Ustvari, to je najstariji medijum za skladištenje i prenos informacija. Najveći broj današnjih informacija jos uvek se čuva u tekstualnom obliku. U ovom poglavlju daćemo najpre kratak uvod u predstavljanje teksta u digitalnoj formi, a zatim će biti reči o nekim tehnikama kompresije teksta.

6.1 Predstavljanje teksta u digitalnoj formi Za razliku od audio i video podataka, kod teksta nema odmeravanja u vremenskom domenu niti kvantizacije. Za podatke o tekstu može se pretpostaviti da su stvoreni iz diskretnog informacionog izvora koji emituje simbole, a ovi predstavljaju slova koja odgovaraju nekoj azbuci (alfabetu). Pošto se tekstualni podatak široko koristi za predstavljanje mnogih dokumenta (knjige, novine, periodike), važno je sprovesti efikasno predstavljanje kako bi se smanjio zahtev za skladištenim prostorom (memorijom). Pošto izvor ima svoju azbuku, to znači da on može da emituje bilo koji simbol (poruku) koji pripada datoj azbuci. Da bi opisali izvor, možemo uzeti u obzir sve moguće simbole koje izvor može da emituje. To znači da će izvor biti mnogo bolje opisan nekom srednjom količinom informacije koju on emituje. Ova srednja količina informcije naziva se entropija izvora. Entropija predstavlja prosečnu količinu informacija po simbolu kojom izvor snabdeva posmatrača, odnosno prosečni izvor neizvesnosti koju posmatrač poseduje pre nego sto izvrši ispitivaje izlaza iz izvora. Neka diskretni izvor informacija emituje simbole iz azbuke tj. skupa simbola S

S = {s1, …, si, …, sj …, sq} pri čemu se svaki simbol pojavljuje sa izvesnom verovatnoćom

P(s1), …,P(si), …,P(sj)…,P(sq). Ukoliko pojava datog simbola ne zavisi od prethodnih simbola, entropija ovakvog izvora informacije data je izrazom

62

Page 73: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

( ) ( ) ( )21logi

S iiH s = P s , s S

P s∈∑ . (6.1.1)

Maksimalnu entropiju imaće izvor kod koga su verovatnoće emitovanja svih simbola date azbuke jednako verovatne. Tada je neizvesnost najveća pošto nijedan simbol nema prioritet. Ako azbuka ima q simbola čija je verovatnoća pojavljivanja p = 1/q onda je maksimalna entropija

( ) ( ) ( ) ( )max 2 2 21 1

1 1log log logq

ii= i=i

H = P s = q = qP s q

∑ ∑ (6.1.2)

jer je očigledno 111

=∑=

q

i q .

Kao što se vidi, maksimalna entropija brojno je jednaka količni informacija.

Minimalna entropija nastaje kada izvor ne emituje nikakvu informaciju. To je slučaj kada izvor emituje samo jedan simbol, tj. kada je verovatnoća pojavljivanja jednog simbola jednaka jedan, a svih ostalih je nula. Na Slici 6.1.1 prikazana je entropija binarnog izvora informacija u funkciji verovatnoce pojave 0 ili 1.

Slika 6.1.1—Entropija binarnog izvora informacija Funkcija H(p) naziva se entropijska funkcija. Izvori koji emituju simbole koji su međusobno statistički nezavisni nazivaju se izvori bez memorije. Najzad na osnovu svega do sada naloženog može se izvući zaključak da je izvor informacija definisan: azbukom (listom simbola) koju emituje, verovatnoćom pojavljivanja simbola, brzinom emitovanja simbola i prosečnom brzinom emitovaja informacije.

63

Page 74: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Primer 6.1.1

Odrediti entropiju diskretnog izvora bez memorije sa četiri izvorna simbola S = { A, B, C, D} čije su verovatnoče pojavljivanja: P(A) = 0.60, P(B) = 0.30, i P(C) = P(D) = 0.05.

Tražena entropija dobija se iz izraza:

( ) ( ) ( )

( ) ( )

( )

21

21

2 2 2

10 10 10

1log

log

0.60log 0.60 0.30log 0.30 0.05log 0.05 0.05log 0.05

3.33 0.60log 0.60 0.30log 0.30 2 0.05log 0.05

1.40 bita/simbol

ii= i

q

i ii=

H s = P sP s

= P s P s

=

= + +

=

− − − −

⎡ ⎤⎣ ⎦

∑2

6.2 Principi kompresije teksta, statistička suvišnost Tipični podaci o tekstu nose suvišnu informaciju. Tehnike kompresije teksta smanjuju ili eliminišu tu suvišnost čime se postiže kompresija. Neka je izvor informacija pisani jezik. On se kao i govorni može posmatrati kao stohastički proces u kome su nizovi slovnih znakova determinisani zakonima verovatnoće. Međutim opisivanje jezika kao stohastičkog procesa je otežano zbog toga sto su različiti elementi jezika (slova, grupe slova i reči u jeziku ) međusobno zavisni. To znači da upravo emitovanje simbola zavisi od niza prethodno emitovanih simbola. Ukoliko verovatnoća pojavljivanja datog slova zavisi od “m” prethodnih simbola, tj ako je uslovna verovatnoća da će posle sj1, sj2, …, sjm biti emitovan simbol si data izrazom

P (si |sj1, sj2, …, sjm) gde je i = 1, 2, … , q, jp = 1, 2, … , q, kažemo da se radi o Markovljenim izvorima m-tog reda koji generišu simbole sa liste s = (s1, s2,… sq), pri čemu su pored već opisanih uslovnih verovatnoća poznate i verovatnoće P(si), dok se entropija ovog izvora određuje pomoću izraza

( ) ( ) ( )1

21

1logm+q

j1 jm ii= i j1 j2 jm

H S = P s , ,s ,sP s | s ,s , ,s

… ×…∑ . (6.2.1)

Niz od prethodno emitovanih “m” simbola predstavlja stanje izvora. Ukupan broj stanja iznosi qm, pa je broj uslovnih verovatnoća qm+1. Postojanje statističke zavisnosti ismeđu simbola

64

Page 75: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

smanjuje neizvesnost pa, prema tome, i količinu informacije. To znači da će entropija izvora koji emituje statistički zavisne impulse uvek biti manja od entropije istog takvog izvora, ali koji emituje statistički nezavisne impulse. Označimo sa Hp vrednost entropije neke azbuke pod pretpostavkom da je verovatnoća pojavljivanja svih slova (simbola) date azbuke jednaka i da ne postoji nikakva statistička zavisnost pri pojavi slova (H0 = Hmax). Neka je H∞ stvarna vrednost entropije u slučaju da su uzete u obzir sve statističke zavisnosti jezika koje se izrazavaju pomoću date azbuke. Tada odnos H∞/H0 predstavlja stepen iskoriscenja simbola (slova) ili relativnu entropiju. Statistička suvišnost odnosno redundantnost predstavlja meru za ograničenja koju tekstu nameće statistička struktura jezika. Definiše se preko stepena iskorišćenja slova, tj.,

0

1 HRH

∞= − (6.2.2)

ili u procentima

R (%) = 100 (H0 − H∞)/H0. (6.2.3)

Primer 6.2.1

Koliki je stepen iskorisćenja slova ruske azbuke (32 slova) i kolika je redundantnost ruskog jezika ako se zna da stvarna entropija ove azbuke (H∞) iznosi 1.4 bita po slovu?

Najpre treba odrediti entropiju nultog reda koja iznosi:

( ) ( ) ( )0 2 232

1 1 1log log 32 32 5 log 232 32

= 5 bita po slovu

is i

2H = H s = P s = = =P s

× × ×∑ ∑ .

Sada je stepen iskorisćenja slova ove azbuke:

28.054.1

0

==∞

HH

.

Primer 6.2.2

Koliku količinu informacije nosi televisijska slika koja se sastoji od 625 linija a svaka linija od 500 elementarnih tačaka pri čemu svaka tačka može da ima 16 nivoa osvetljenosti u rasponu od belog do crnog?

Posmatrana TV slika sastoji se od

65

Page 76: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

625 linija × 500 tačaka = 312 500 tačaka. Svaka tačka može da ima 16 nivoa osvetljenosti. To znači da ukupan broj razlilčitih slika koje se mogu pojaviti iznosi ( )625 50016 × slika. Pošto je pojava svake slike jednako verovatna, biće

( ) ( )625 500

116

P E =×

.

Količina informacije koji nosi TV slika iznosi

( )( )( ) ( )625 500 4

2 2 21log log 16 312 500 log 2 312 500 4

1 250 000 1.25Mb

I = = = =P E

× × ×

= =

=.

Teorija izvornog kodovanja bavi se kompresijom podataka generisanih iz informacionih izvora koji emituje niz simbola odabranih iz konačnog alfabeta. U teoriji izvornog kodovanja, entropija i funkcija stepena oštećenja informacije (eng. grade distortion function – GDF) su dva osnovna koncepta. Kao sto smo videli, entropija pruža meru za informaciju sadržanu u izvoru podataka i otuda određuje minimum prosečnog bitskog protoka potrebnog za perfektnu reprodukciju izvornih simbola. Teorija oštećenja informacije daje nižu granicu za prosečan broj bita za dato izobličenje u obnovljenim simbolima [6.1].

Primer 6.2.3

Posmatrajmo povorku slova X = “aaabbbbbbbccaaabbcbbbb”. Alfabet zadatog izvora sadrži tri slova {a, b, c}. U povorci slova postoji 6a, 13b i 3c. Histogram će biti: h(a) = 6 , h(b) = 13 i h(c) = 3. Pošto ima ukupno 22 slova biće: p(a) = 6/22 = 0.27, p(b) = 13/22 = 0.59 i p(c) = 3/22 = 0.14. Zbir svih verovatnoća je 1.

Mada izvor informacije može imati K simbola, informacija koju nosi svaki simbol nije podjednako verovatna. Prosečna informacija koju nosi simbol povezana je sa recipročnom vrednosću njegove verovatnoće i data je u obliku

( ) [ ]1logiI s =

p k. (6.2.4)

Iako svaki simbol može biti analiziran posebno, korisno je razmotriti velike blokove simbola pre nego pojedinačne simbole. Izlaz iz izvora se grupiše u blokove od N simbola, a za simbole se može predpostaviti da su generisani iz izvora SN sa alfabetom dimenzije KN. U tom slučaju izvor SN predstavlja N-to proširenje izvora S.

66

Page 77: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Entropija izvora definisana je kao prosečna količina informacija “po izvornom simbolu”, tj.,

( ) [ ] ( ) [ ] [ ]∑∑==

−==K

kk

K

kkpkpsIkpSH

12

1log (6.2.5)

i izražava se u bitima po simbolu. Ovo je često korisćena tzv. entropija prvog reda (eng. first order entropy – FOE). Sa p[k] označena je verovatnoća nastajanja k-tog simbola. FOE se često zove entropija bez memorije jer daje minimalni bitski protok za reprodukciju diskretnog niza podataka bez gubitaka.

Primer 6.2.4

Neka je data povorka slova iz izvora “aaabbbbbbbccaaabbcbbbb”. Treba odrediti entropiju prvog i drugog reda.

Prema datim podacima u povorci postoji ukupno 22 slova. Od toga postoji: 6a, 13b, i 3c. Stoga je: p(a) = 6/22 = 0.27, p(b) = 13/22 = 0.59 i p(c) = 3/22 = 0.14.

Sa ovim, entropija prvog reda iznosi H1 = − (0.27 log20.27 + 0.59 log20.59 + 0.14 log20.14) = 1.36 bita/simbol. Da bi smo izračunali verovatnoću drugog reda, treba uzeti u razmatranje dva slova. U tom slučaju alfabet će se sastojati iz devet simbola: {aa, bb, cc, ab, ba, ac, ca, bc, cb}. Pošto imamo 22 simbola u startu, može se smatrati da povorka (niz) sadrži 11 parova od dva simbola {aa, ab, bb, bb, bb, cc, aa, ab, bc, bb, bb}. Verovatnoće različitih simbola su: p(aa) = 2/11 = 0.18, p(ab) = 2/22 = 0.18, p(bb) = 5/11 = 0.45, p(cc) = 1/11 = 0.09 i p(bc) = 1/11 = 0.09. Entropija drugog reda izračunava se na sledeći način: H2 = − (2 · 0.18 · log2 0.18 + 0.45 · log2 0.45 + 2 · 0.09 · log2 0.09) = 2.03 bita/simbol, (1 simbol = 2 slova).

6.3 Shannon-ova teorema kodovanja za bešumni izvor Funkcija gustine verovatnoće i entropija izvora informacija mogu se primeniti kod komprimovanja teksta. U tom cilju pomoći će nam Shannon-ova teorema kodovanja za bešumni izvor [6.2]. Neka je S izvorni tekst sa alfabetom veličine K i entropijom H(S). Posmatrajmo blokove kodovanja od N izvornih simbola u binarne kodne reči. Shannon-ova teorema kodovanja za bešumni izvor kaže da je za bilo koje S > 0, moguće za N dovoljno veliko konstruisati kod tako da prosečan broj bita po originalnom izvornom simbolu R zadovoljava sledeću relaciju:

67

Page 78: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

( ) ( )H S R H S S≤ ≤ + (6.2.6) Drugim rečima izvor može biti kodovan bez gubitaka sa prosečnim brojem bita bliskim njihovoj entropiji ali ne manjoj od entropije. Entropija izvora ograničena je sa 0 i log2K. To znači, drugim rećima da je

0 ≤ H(S) ≤ log2 K. (6.2.7) U ovoj relaciji leva strana važi ako je p[k] nula za sve izvorne simbole sk izuzev jedinice. U tom slučaju je izvor apsolutno prediktabilan. Desna strana važi kada svaki izvorni simbol sk ima istu verovatnoću pojavljivanja. Redundansa izvora je definisano kao

REDUNDANSA = log2K – H(S). (6.2.8) Ova relacija pokazuje da ukoliko izvor ima alfabet velicine K, maksimalna entropija izvora je log2K. Ako je entropija iznosi log2K za izvor se može kazati da je nulte suvišnosti. U najvećem broju slučajeva informacija sadrži suvišnost.

Primer 6.3.1

Posmatrajmo izvor informacija sa alfabetom {a, b, c, d}. Simboli imaju podjednaku verovatnoću nastajanja. Treba odrediti entropiju i redundansu izvora. Takođe treba pronaći broj bita potreban za prenos simbola iz izvora a zatim i koder pogodan za kodovanje simbola.

Pošto je p(a) = p(b) = p(c) = p(d) = 0.25, entropija izvora iznosi: 4 · 0.25 · log2 0.25 ili 2 bita/simbol. Imajući u vidu da je veličina alfabeta K = 4, redundansa je nula, pošto je entropija jednaka log2 K = 2. Prosečan broj bita potreban za prenos simbola je 2 bita/simbol. U tom slučaju, projektovanje kodera je trivijalno. Naime biće a: 00, b: 01, c: 10 i d:11.

Primer 6.3.2

Koliki je prosečan broj bita potreban za izvor od tri simbola? Koliki je minimalan broj bita potreban za kodovanje izvora od tri simbola koji je inače oblika {aaabbbbbbbccaaabbcbbbb}. Takođe treba odrediti redundansu izvora. Kada je redundansa izvora jednaka nuli?

Broj bita potreban za jedan izvor informacije od tri simbola je log2 3 = 1.59 bit/simbol. U primeru 6.2.4 pokazali smo da je entropija za zadati izvor informacija 1.36 bit/simbol. Suvišnost u datom izvoru informacije sa 3 simbola je: log2K – H(S) = 1.59 – 1.36 = 0.23 bit/simbol. Suvišnost izvora je nula kada je entropija H(S) jednaka log2K. To će se dogoditi

68

Page 79: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

samo u slučaju da svi simboli imaju podjednaku verovatnoću tj. 1/K. Treba uočiti da Shannon-ova teorema pruža donju granicu zahteva za brojem bita. U praksi je vrlo teško postići broj bita jednak entropiji. Ukoliko se želi da projektujemo koder sa tri simbola, lako možemo dobiti koder prenošenjem dva bit/simbol. Pri tome se pojavljuje bitski iznos od 0.64 (2 – 1.36) bit/simbol veći od nivoa entropije S = 0.64. Ukoliko se S smanjuje, znatno se povećava kompleksnost kodera.

6.4 Huffman-ovo kodovanje Prema Shannon-ovoj teoremi o bešumnom kodovanju, prosećan broj bita R za kodovanje izvorne informacije je ograničen sa donje strane entropijom izvora. Međutim Shannon-ova teorema ne utvrđuje način projektovanja kodera koji će korigovati izvornu informaciju sa prosečnim brojem bita R . Huffman je dao praktičnu metodu za projektovanje kodera koji daje broj bita blizak entropiji. Ovaj metod daje kod promenljive dužine (eng. variable length code – VLC) za svaki izvorni simbol i to tako da je broj bita u kodu približno obrnuto proporcionalan verovatnoći nastajanja simbola [6.3]. Tabela 6.4.1 prikazuje alfabet izvora zajedno sa verovatnoćama individualnih simbola. Izvor informacija sa 6 simbola zahteva najviše log2 6 = 2.58 bita. Entropija izvora je u ovom slučaju H = − (0.3·log2 0.3 + 2·0.2 log2 0.2 + 3·0.1 log2 0.1) = 2.44 bit/simbol. To drugim rećima znači da je moguće projektovati koder koji će obavljati svoju funkciju sa 2.44 bit/simbol u proseku.

Tabela 6.4.1—Primena modela za alfabet {a, b, c, d, e, !}

Simboli Verovatnoća Huffman-ov kod a 0.2 10 b 0.1 011 c 0.2 11 d 0.2 0100 e 0.3 00 ! 0.1 0101

Huffman-ov kod za izvor informacije je generisan u dva koraka: redukcija izvora i naznaka koda. Proces redukcije izvora za informacioni izvor koji odgovara Tabeli 6.4.1. objasnićemo korišćenjem Slike 6.4.1. Postoji nekoliko koraka. U prvom koraku simboli su poređani po opadajućoj verovatnoći nestajanja. Na primer ovde je p(b) = p(d) = p(!) = 0.1. Izabrali smo redosled “b, d, !”, ali je mogućan bilo koji redosled.

Proces redukcije izvora za informacioni izvor koji odgovara Tabeli 6.4.1 objasnićemo korisćenjem Slike 6.4.1. Tu postoji nekoliko koraka. U prvom koraku simboli se poređaju po opadajućem verovatnoci i nastajanja. Na primer, ovde je p(b) = p(d) = p(!) = 0.1. Odabran je redosled “b, d, !” ali mogućan bilo koji redosled. Kada se simboli razvrstavaju, u sledećem koraku novi simbol je kreiran kombinacijom dva najmanja verovatna simbola. U našem primeru stavili smo “d” i “!”. Stoga, novi simbol ima

69

Page 80: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

verovatnoću nastajenja 0.2 (0.1 i 0.1). Sada vidimo da se broj simbola smanjio za jedan. U koloni dva, izvor ima četiri simbola umesto pet. Verovatnoće ta četiri simbola su raspoređene po opadanju, kao što je to prikazano u koloni tri. U sledećem koraku dva najmanje verovatna simbola su ponovo spojena, pa su zatim nove verovatnoće ponovo raspoređene po opadanju. Proces se ponavlja dok se izvor ne svede na dva simbola. U našem primeru dve poslednje verovatnoće su 0.6 i 0.4.

ORIGINALNI IZVOR DODELJIVANJE KODA

Simbol Verovatnoća 1 2 3 4

e 0.3 0.3 0.3 0.4 0.6

a 0.2 0.2 0.3 0.3 0.4

c 0.2 0.2 0.2 0.3

b 0.1 0.2 0.2

d 0.1 0.1

! 0.1

Slika 6.4.1—Huffman-ov proces redukcije izvora

Pošto je završen proces redukcije izvora, započinje proces dodeljivanja Haffman-ovog

koda koji je prikazan na Slici 6.4.2.

ORIGINALNI IZVOR DODELJIVANJE KODA

Simbol Verovatnoća KOD 1 2 3 4

e 0.3 00 0.3 00 0.3 00 0.4 1 0.6 0

a 0.2 10 0.2 10 0.3 01 0.3 00 0.4 1

c 0.2 11 0.2 11 0.2 10 0.3 01

b 0.1 001 0.2 010 0.2 11

d 0.1 0100 0.1 011

! 0.1 0101

Slika 6.4.2—Proces dodeljivanja Huffman-ovog koda

Za prva dva simbola dodeljene su kodne reči 0 i 1. U tom slučaju dodeljujemo “0” simbola sa verovatnoćom pojavljivanja 0.6 i “1” simbolu sa verovatnoćom pojavljivanja 0.4. Verovatnoća pojavljivanja 0.6 dobijena je spajanjem dve verovatnoće 0.3 i 0.3. Kodovi dodeljeni ovim verovatnoćama su “0 praćena 0” i “0 praćena 1”. Posle tog dodeljivanja postoje tri simbola sa verovatnoćama 0.4, 0.3 i 0.3 i kodovima 1, 00 i 01 respektivno. Verovatnoća 0.4 dobijena je spajanjem dve verovatnoće 0.2 i 0.2. Na tom koraku kodovi dodeljeni ovim verovatnoćama (0.2 i 0.2) su “1 praćen 0” i “1 praćen sa 1”.

70

Page 81: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Posle tog dodeljivanja postoje 4 simbola sa verovatnoćama 0.3, 0.3, 0.2 i 0.2 i kodovima 00, 01, 10 i 11 respektivno. U sledećem koraku, druga verovatnoća 0.3 dobijena je spajanjem dve verovatnoće 0.2 i 0.1. Kodovi dodeljeni ovim verovatnoćama (0.2 i 0.1) su “01 praćen 0” i “01 praćen sa 1”. Posle tog dedeljivanja postoji pet simbola sa verovatnoćama pojavljivanja 0.3, 0.2, 0.2, 0.2 i 0.1 sa kodovima 00, 10, 11, 010 i 011 respektivno. Četvrta verovatnoća 0.2 dobijena je spajanjem dve verovatnoće 0.1 i 0.1. U ovom koraku kod dodeljen ovim verovatnoćama (0.1 i 0.1) je “010 praćen sa 0” i “010 praćen sa 1“. Posle tog dodeljivanja postoji šest simbola sa verovatnoćama 0.3, 0.2, 0.2, 0.1, 0.1 i 0.1 i odgovarajućim kodovima 00, 10, 11, 011, 0100 i 0101 respektivno. Na taj način dobili smo Huffman-ove kodove za sve originalne izvorne simbole. Iako dosta korišćeno još od otkrića 1952 godine, Huffman-ovo kodovanje ima nedostatke. Pre svega, ono zahteva najmanje jedan bit za predstavljanje pojavljivanja svakog simbola. Stoga, ako je entropija izvora manje od jednog bita po simbolu, Huffman-ovo kodovanje nije efikasno. Dalje, ovo kodovanje se ne može efikasno prilagoditi ukoliko se menjaju statistike izvora. Najzad, ni uređaji koji koriste Huffman-ov koder nisu jednostavni za implementaciju.

6.5 Aritmetičko kodovanje Da bi se postigla razumna efikasnost primenom Huffman-ovog kodovanja, niz koji generiše izvor deli se na blokove, a svakom bloku se dodeljuje kodna reč promenljive dužine. Na strani dekodera, primenjeni niz je raščlanjen na blokove različite dužine koji odgovaraju individualnim kodnim rečima. Pri tome, postoji korespondencija jedan prema jedan između blokova kodne reci i blokova koji se odnose na izvorni niz. Kod aritmetičkog kodovanja, neznatno različiti izvorni nizovi daju značajno različite kodne nizove [6.4], [6.5]. Kao entropijska kodna tehnika, aritmetičko kodovanje postiže veću kompresiju nego Haffman-ovo kodovaje. Za razliku od Huffman-ovog kodovanja, kod aritmetickog kodovanja prosečan broj bita se približava teorijskoj granici, entropiji, za bilo koji proizvoljan izvor. Kod Huffman-ovog kodovanje svakom simbolu se pripisuje kodna reč promenljive dužine. U procesu kodovanja, simboli su nezavisno kodovani. Kod aritmetičkog kodovanja, kodnoj reči je pripisana cela ulazna poruka [6.6]–[6.11] .

Primer 6.5.1

Posmatrajmo englesku azbuku sa 26 slova. Treba odrediti maksimalan broj različitih tekstualnih povorki dužine 1, 2 i 100.

Tekstualnu povorku dužine 1 čine “a”, “b”, “c”, … i “z”. Stoga je maksimalan broj mogućih povorki 26. Tekstualnu povorku dužine 2 čine “aa”, “ab”, …”az”, “ba”, “bb”, “bc”,…, “bz”,… “zz”. Maksimalan broj različitih povorki je 262 ili 676. Na sličan način postoji 26100 različitih povorki sa 100 znakova.

71

Page 82: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Primer 6.5.1 pokazuje da ako izvor ima azbuku dimenzije K postoji Km različitih mogućih poruka dužine m. Ukoliko je poznata funkcija gustine verovatnoće individualnih simbola, može se izračunati verovatnoća nastajanja date poruke sm dužine m. Pošto postoji Km različitih mogućih poruka, može se izračunati verovatnoća p(sm) nastajanja tih individualnih poruka, pri čemu je

( ) 10

=∑=

mK

mmsp . (6.5.1)

Ukoliko se želi da se koduje celokupna poruka odjednom, povećava se efikasnost kodera. Huffman-ov kod obezbediće prosečan broj bita blizak entropiji čak i kada je to manje od jednog bita po simbolu. Međutim, generisanje Huffman-ove tabele od Km simbola bilo bi vrlo teško, čak i gotovo nemoguće. Srećom aritmetičko kodovanje obezbeđuje pogodan način da se ostvari taj cilj pod optimalnim uslovima.

Predspostavimo sad da su poznate verovatnoće p(sm) različito mogućih poruka. Njihova ukupna suma je 1. Podelićemo interval [0, 1] na realnoj osi na Km podintervala, tako da širina svakog podinternala odgovara verovatnoći nastajanja poruka. Neka su podintervali [Ll, Rl], (l = 1, 2, … , Km). Kada su jednom podintervali utvrđeni, bilo koji realan broj u tom podintervalu odgovaraće jednoj poruci, pa se stoga može dekodovati cela ulazna poruka. Pošto se podintervali ne preklapaju kodna reč za Sm može se konstruisati pomeranjem bilo koje tačke u intervalu u binarnom obliku i zadržavajući samo ni = [ −log2p(sm)] bita posle decimalne tačke. Pošto bi gornja procedura mogla biti komplikovana može se primeniti jednostavna rekurzivna tehnika. Sada ćemo tehniku kodovanja objasniti na konkretnom primeru. Posmatraćemo informacioni izvor dat u Tabeli 6.5.1. Primenićemo više koraka.

Tabela 6.5.1—Simboli, njihove verovatnoće pojavljivanja i opseg za aritmetički koder

Simboli Verovatnoća Opseg za aritmetički koder a 0.2 [ 0, 0.2 ] b 0.1 [ 0.2, 0.3 ] c 0.2 [ 0.3, 0.5 ] d 0.1 [ 0.5, 0.6 ] e 0.3 [ 0.6, 0.9 ] ! 0.1 [ 0.9, 1.0 ]

Korak 1: Simboli i njihove verovatnoće pojavljivanja poređaju se kao što je to pokazano u Tabeli 6.5.1. Korak 2: Podeliti inteval [0, 1] na 6 ( = K) podintervala pošto postoji 6 simbola. Širina svakog podintervala jednaka je verovatnoći nastajanja individualnog simbola. Korak 3: Predpostavimo da želimo da prenesemo simbol baad! Pošto je prvi simbol “b” biramo interval [0.2, 0.3]. To je prikazano u Tabeli 6.5.2 (treći red), kao i na Slici 6.5.1.

72

Page 83: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Tabela 6.5.2—Generisanje niza bita pri aritmetičkom kodovanju

Podinterval Binarni interval Generisani niz bita

START [ 0, 1.0]

b [ 0.2, 0.3 ] [ 0.0, 0.5 ] 0

a [ 0.2, 0.22 ] [ 0.0, 0.25 ] 0

a [ 0.2, 0.204 ] [ 0.125, 0.25 ] 1

d [ 0.2020, 0.2024 ] [ 0.1875, 0.25 ] 1

! [ 0.20236, 0.2024 ] [ 0.1875, 0.21875 ] 0

Slika 6.5.1—Proces aritmetičkog kodovanja Kada je podinterval odabran, on je podeljen na 6 podintervala drugog nivoa, kao što je to prikazano na Slici 6.5.1.

Korak 4: Drugi simbol je “a”. Otuda biramo podinterval koji odgovara “a” u intervalu [0.2 do 0.3]. To je [0.2, 0.22], kao što je to dato na Slici 6.5.1. Podinterval je [0.2 do 0.22] je podeljen na 6 podintervala trećeg nivoa. Korak 5: Treći simbol je opet “a”. Otuda je odabran podinterval [0.2, 0.204]. Podinterval je opet izdeljen na 6 podintervala četvrtog nivoa. Korak 6: Četvrti simbol je “d”. Stoga, odabran je podinterval [0.2020, 0.2024]. Podinterval je podeljen na 6 podintervala petog nivoa. Korak 7: Poslednji, peti simbol je “!”. Zbog toga je uzet podinterval [0.20236, 0.2024].

Pošto više nema drugih simbola, proces kodovanja je sada kompletiran. Predajnik može da šalje proizvoljan broj u intervalu [0.20236 do 0.2024], a dekoder će biti u stanju da rekonstruiše ulazni niz. Razume se, dekoder treba da zna informaciju koja postoji u Tabeli 6.5.1.

73

Page 84: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Dosadašnja opisana procedura proizvodi realne brojeve koji se mogu poslati dekoderu. Realni brojevi su predstavljeni nizom bita koji se generišu kada jednom znamo konačan realan broj. Niz bita se generise posle nailaska ulaznih simbola i pošto su podintervali segmentirani kao što je prikazano u Tabeli 6.5.2. Za simbol “b” koder zadržava opseg na [0.2, 0.3]. Pošto je određeno da je interval [0.0, 0.5], dekoder zna da je prvi simbol “0”. Stoga, on sada može da otpočne sa slanjem ulaznih bita. Posle drugog simbola, koder dalje sužava opseg na [0.2, 0.22]. Tada koder zna da je drugi simbol “0”, jer je interval u opsegu [0, 0.25]. Na sličan način, treći simbol će biti ''1'', jer se interval nalazi u opsegu [0.125, 0.25]. Četvrti simbol je “1”, itd. Šema dekodovanja je vrlo jednostavna. Predpostavimo da je poslat broj 0.20238. Dekoder prepoznaje da je prvi simbol “b” pošto leži u opsegu [0.2, 0.3] kao što je prikazano u Tabeli 6.5.2. Drugi simbol je “a” jer leži u opsegu [0.2, 0.22]. Zatim se proces nastavlja. U navedenom primeru korišćen je fiksni model koji nije pogodan za kodovanje nestacionarnih izvora kod kojih se statistike izvora menjaju se vremenom. U tim slučajevima trebalo bi primeniti adaptivni model. Tako, na primer, u [6.12] je predložen efikasan model za primenu adaptivnog aritmetićkog kodovanja koji daje broj bita vrlo blizak entropiji izvora.

6.6 Rezime Najveći broj informacija još uvek se danas čuva u tekstualnom obliku. Podaci o tekstu stvoreni su iz diskretnog informacionog izvora koji emituje simbole a ovi predstavljaju slova koja odgovaraju nekoj azbuci. Pošto se tekstualni podaci još uvek koriste kao različiti dokumenti, važno ih je predstaviti u najprihvatljivijoj formi kako bi se smanjili zahtevi za skladištenim prostorom. Prosečna količina informacija po simbolu kojom izvor snabdeva posmatrača predstavlja entropiju. Maksimalnu entropiju imaće izvorni kod kod koga su verovatnoće emitovanja svih simbola date azbuke podjednako verovatne. Ujedno tada je i neizvesnot najveća, pošto nijedan simbol nema prioritet. Minimalna entropija nastaje kada izvor ne emituje nikakvu informaciji. To je slučaj kada izvor emituje samo jedan simbol čije je verovatnoća pojavljivanja jednaka jedan, a svih ostalih je nula. Izvori koji emituju simbole koji su medjusobno statistički nezavisni nazivaju se izvori “bez memorije”. S druge strane, izvor informacije je definisan: azbukom (listom simbola) koji emituje, verovatnoćom pojavljivanja simbola i prosećnom brzinom emitovanja informacija (simbola). Podaci o tekstu nose suvišnu informaciju. Tehnika kompresije teksta smanjuje ili eliminiše tu suvišnost čime se postiže kompresija. Entropija izvora koji emituje statistički zavisne impulse uvek će biti manja od entropije istog takvog izvora koji emituje statistički nezavisne impulse. Statistička suvišnost odnosno redundantnost predstavlja meru ograničenja koju tekstu nameće statistička struktura jezika. Dva ogromna koncepta u teoriji izvornog kodovanja su entropija i funkcija stepena ostećenja informacije. Entropija pruža meru za informaciju izvornih simbola sadržanu u izvoru podataka i određuje minimum prosečnog bitskog protoka potrebnog za perfektnu reprodukciju izvornih simbola. S druge strane, teorija ostećenja informacije pruža nižu granicu za prosečan broj bita za dato izobličenje u obnovljenim simbolima. Ukoliko izvor ima alfabet veličine K, maksimalna entropija izvora je log2 K. Ako entropija iznosi log2 K, za izvor se kaže da je nulte suvišnosti. U najvećim broj slučajeva informacija sadrži suvištnost.

74

Page 85: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Prema Shannon-ovoj teoremi o bešumnom kodovanju, prosečan broj bita R za kodovanje izvorne informacije ograničen je sa donje strane entropijom izvora. Međutim Shannon-ova teorema ne utvrđuje način projektovanja kodera koji će korigovati izvornu informaciju sa prosečnim brojem bita R Huffman-ova metoda pruža mogućnost projektovanja kodera koji daje broj bita blizak entropiji. Ova metoda daje kod promenljive dužine za svaki izvorni simbol i to tako da je broj bita u kodu približno obrnuto proporcionalan verovatnoći nastajanja simbola. Međutim, Huffman-ovo kodovanje zahteva najmanje jedan bit za predstavljanje svakog simbola. Stoga, ako je entropija izvora manja od jednog bita po simbolu, Huffman-ovo kodovanje nije efikasno. Dalje, ovo kodovanje se ne može efikasno prilagoditi ukoliko se menjaju statistike izvora. Najzad, ni uređaji koji koriste Huffman-ov koder nisu jednostavni za implementaciju. Dok se kod Huffman-ovog kodovanja svakom simbolu pripisuje kodna reč promenljive dužine, kod aritmetičkog kodovanja kodnoj reči je pripisana cela ulazna poruka. Primenom aritmetičkog kodovanja postiže se veća kompresija nego kod Huffman-ovog kodovanja. Metode entropijsnog kodovanja koriste statistički model za kodovanje simbola sadržanih u ulaznim podacima. Kompresija je postignuta uklanjanjem statitističke suvišnosti prisutne u podacima. U tu srvrhu koristi se kodovanje simbola kodovima koji sadrže manje bita za ove simbole koji se češće pojavljaju. Mada su za kodovanje podataka o tekstu prikazane neke kodne tehnike koje ne unose gubitke, ove tehnike se takođe koriste za kodovanje audio signala i slike. Druga grupa tehnika koje su predložili Lempel i Ziv zasniva se na kompresiji na bazi rečnika [6.13], [6.14]. Međutim ta materija izlazi iz okvira ove knjige.

Pitanja

Čime se karakteriše predstavljanje teksta u digitalnoj formi? 1. 2. Šta je to entropija izvora informacija? 3. Po čemu se tekstualni podaci razlikuju od audio i video podataka? 4. Kada izvor informacija ima maksimalnu, a kada minimalnu entropiju? 5. Šta su to izvori informacija bez memorije? 6. Šta je to relativna entropija?

Kako se definiše statistička suvišnost nekog jezika? 7. 8. Jedna azbuka sastoji se iz 32 slova. Stvarna entropija ove azbuke iznosi 1.4 bita po slovu.

Odrediti entropiji nultog reda, kao i stepen iskorišćenja slova ove azbuke. 9. Čime se bavi teorija izvornog kodovanja?

10. Šta proučava teorija oštećenja informacije? 11. Kako glasi Shannon-ova teorema kodovanja za bešumni izvor? 12. Kada se za izvor informacija kaže da je nulte suvišnosti? 13. Čime se karakterise Huffman-ova metoda za projektovanje kodera?

Kako se generiše Huffman-ov kod za izvor informacija? 14. 15. U čemu se ogledaju nedostaci nastali u procesu Huffman-ovog kodovanja?

Koja je glavna karakteriska aritmetičkog kodovanja? 16.

75

Page 86: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

17. U čemu se razlikuje aritmetičko od Huffman-ovog kodovanja? Koji parametri definišu izvor informacija koji emituje simbole? 18. Čime se karakterišu metode entropijskog kodovanja?

19.

Literatura

[6.1] D. Drajić, Teorija Informacija i Prenos Podataka. Elektrotehnički fakultet, Beograd,

1982. [6.2] C. E. Shannon and W. Weaver, The Mathematical Theory of Communication. Urbana,

IL: University of Illinois Press, 1949. [6.3] D. A. Huffman, “A Method for the construction of minimum-redundancy codes,” Proc.

Inst. Radio Eng., vol. 40, pp. 1098–1101, Sept. 1952. [6.4] A. N. Netravali and B. Prasada, “Adaptive quantization of picture signals using spatial

masking,” Proc. IEEE, vol. 65, no. 4, pp. 536–548, Apr. 1947. [6.5] S. P. Lloyd, “Least squares quantization in PCM,” IEEE Trans. Inf. Theory, vol. IT-28,

pp. 129–137, 1982. N. S. Jayant and P. Noll, Digital Coding of Waveforms: Principles and Applications to Speech and Video. Englewood Cliffs, NJ: Prentice Hall, 1984.

[6.6]

K. R. Rao and P. Yip, Discrete Cosine Transform: Algorithms, Advantages, Applications. New York, NY: Academic Press, 1990.

[6.7]

K. R. Rao and J. J. Hwang, Techniques and Standards for Image, Video, and Audio Coding. Upper Saddle River, NJ: Prentice Hall, 1996.

[6.8]

[6.9] G. G. Langdon and J. Rissanen, “Compression of black-white images with arithmetic coding,” IEEE Trans. Commun., vol. COM-29, pp. 858–867, 1981. A. K. Jain, Fundamentals of Digital Image Processing. Englewood Cliffs, New Jersey, Prentice Hall, 1989.

[6.10]

M. Rabbani and P. W. Jones, Digital Image Compression Techniques. Bellingham, Washington, USA, SPIE-The International Society for Optical Engineering, 1991.

[6.11]

[6.12] I. H. Witten, R. M. Neal, and J. G. Cleary, “Arithmetic coding for data compression,” Commun. of ACM, vol. 30, pp. 520–540, Jun. 1987. J. Ziv and A. Lempel, “A universal algorithm for sequential data compression,” IEEE Trans. Inf. Theory, vol. IT-23, pp. 337–342, 1977.

[6.13]

[6.14] J. Ziv and A. Lempel, “Compression of individual sequences via variable-rate coding,” IEEE Trans. Inf. Theory, vol. IT-24, pp. 530–536, 1978.

76

Page 87: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

7. STANDARDI U MULTIMEDIJALNIM KOMUNIKACIJAMA

Za razmatranje standarda u oblasti multimedijalnih komunikacija postoje dva pristupa.

Jedan od pristupa se fokusira na bit-niz sintaksu u nameri da se razume šta predstavlja svaki sloj sintakse i na šta ukazuje svaki bit u jednom određenom nizu bita. Ovakav pristup je važan za proizvođače opreme u skladu sa standardima. Drugi pristup je usredsređen na algoritme za kodiranje koji se koriste za generisanje nizova bita, u skladu sa odgovarajućim multimedijalnim kodnim standardom. Isto tako, ovaj pristup zasniva se na istraživanju, razvoju, modernizaciji i implementaciji različitih tipova algoritama za kodovanje multimedijalnog sadržaja kako bi se podržao veliki broj različitih i sve zahtevnijih multimedijalnih aplikacija i servisa.

Predstavljanje neobrađenih video signala zahteva veliki kapacitet pa se, u vezi sa tim, moraju definisati manje kompleksni video kodni algoritmi radi efikasnije kompresije video sekvenci kako bi se iste memorisale i prenosile. Pravilni izbor algoritma za video kodovanje multimedijalnih aplikacija je značajan faktor koji zavisi od raspoloživog kapaciteta i multimedijalnih zahteva za kvalitetom. Bitski prenos i brzina frejmova su faktori sa kojima se selektovani video koder može adaptivno birati, a sve to u skladu sa raspoloživim propusnim opsegom medijuma za komunikaciju. Sa druge strane, stalni napredak u tehnologiji daje kao rezultat povećanje svoga procesora digitalnih signala i značajno smanjuje cene opreme. U oblasti audio-vizuelnih komunikacija takvi video kodni algoritmi se koriste za kompresiju video signala sa visokom efikasnošću kodovanja i maksimalnim perceptualnim kvalitetom. Kod video komunikacija zahtevi korisnika obično su konfliktni te se mora ići na kompromis kako bi se obezbedio kvalitet servisa koji je korisnik zahtevao. Korisnički zahtevi za digitalne video servise definišu se preko kvaliteta i širine opsega video signala, kompleksnosti, sinhronizacije i kašnjenja. Sa jedne strane, kompleksnost video-kodnih algoritama odnosi se na logaritamska izračunavanja koja se izvrše tokom kodovanja i dekodovanja. Sa druge strane, sinhronizacija između različitih nizova bita mora se održavati da bi se obezbedile zadovoljavajuće performanse. Što se tiče kašnjenja, kod aplikacija koje se odvijaju u realnom vremenu, važno je da je vreme kašnjenja između frejma koji se koduje i posle toga dekoduje, minimalno. Sve ukazuje na to da je veoma značajno razmotriti aspekte multimedijalnih kodnih standarda i odgovarajućih algoritama. Od ne manjeg značaja je svakako smanjenje implementirane kompleksnosti multimedijalnih algoritama, a da se pri tome ne naruše njihove performanse.

77

Page 88: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

7.1 Značaj standardizacije Sa neprekidnim povećanjem brzine prenosa, očigledno je da su kapacitet memorisanja hard diskova, fleš memorija i optičkih medija veći nego ranije. Savremene tehnike kompresije multimedijalnih podataka pružaju mogućnost memorisanja ili prenosa velike količine informacija neophodnih za prezentaciju digitalnog sadržaja na efikasan način. Sa neprekidnim povećanjem kapaciteta prenosa i memorisanja, kompresija postaje jedna od osnovnih komponenata za multimedijalne servise [7.1]. Što se tiče videa, kompresija ima važne prednosti. Pre svega, ona omogućava da se digitalni video koristi u okruženju za prenos ili memorisanje koji ne podržava nekompresovani video. Zatim, video kompresor omogućava da se efikasnije koriste resursi za prenos i memorisanje. Na primer, ako je raspoloživ kanal sa velikim bitskim protokom, tada je opšteprihvatljivo da se pošalje komprimovani video signal velike rezolucije ili veći broj komprimovanih video signala, nego da se pošalje jedan nekomprimovani tok ili niz niže rezolucije. Signal koji nosi informaciju može se komprimovati da bi se odstranila redundansa. Kod sistema za kompresiju bez gubitka statistička redundansa je odstranjena na taj način da se komprimovani signal može perfektno rekonstruisati na prijemniku. Međutim, većina praktičnih tehnika za video kompresiju, na primer, zasniva se na kompresiji sa gubicima, tako da signal koji je dekodovan nije identičan originalnom. Cilj algoritma za kompresiju je da se postigne što efikasnija kompresija uz minimiziranje izobličenja koje nastaje u tom procesu. Na primer, algoritmi za video kompresiju rade tako što odstranjuju redundansu u prostornom, vremenskom, statističkom i psihovizuelnom domenu. Odstranjivanjem redundanse u različitim oblicima, moguće je značajnije komprimovati podatke. Na primer, ljudski vizuelni sistem (oko i mozak) više je osetljiv na niže, nego na više frekvencije pa ako se odstrani iz slike sadrzaj sa nižim frekvencijama, slika će i dalje biti prepoznatljiva uprkos činjenici da je deo informacija odstranjen. Videli smo, takođe, da se kompresija može postići tako što se podaci koji se prenose koduju primenom entropijskog kodovanja (Huffman-ovo kodovanje, aritmetičko kodovanje).

Kompresija slike i videa je alternativno polje za istraživanje i razvoj oblasti multimedijalnih komunikacija. Predloženi su mnogi različiti algoritmi za kompresiju i dekompresiju. U cilju podsticaja medijumskog rada, konkurencije i povećanja mogućnosti izbora, neophodno je bilo da se definišu neophodne metode za kompresiju, kako bi se obezbedilo da uređaji različitih proizvođača budu kompatabilni. Ovo je dovelo do razvoja drugih ključnih multimedijalnih standarda. Što se tiče tehnike kompresije slike i videa, one se razvijaju intenzivno od pre dvadesetak i više godina uz razvoj prateće tehnologije. Početni algoritmi su bili bazirani na pikselima, a nešto kasniji algoritmi su koristili grupe piksela ili osobine vida, kao i redundantna svojstva slike u prostornom, vremenskom i frekvencijskom domenu. U postupku standardizacije kompresije slike i video signala pojavljuju se dve organizacije i to:

• Međunarodna unija za telekomunikacije–telekomunikacioni sektor (eng. International Telecomunication Union–Telecomunication sector – ITU–T) za standardizaciju sa svojom Ekspertskom grupom za video kodovanje (eng. Video Coding Expert Group – VCEG)

• Međunarodna organizacija za standardizaciju ⁄ Međunarodni elektrotehnički komitet (eng. International Standard Organization/International Electrotechnical Committee – ISO/IEC) sa grupom MPEG.

78

Page 89: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Mada deluju odvojeno, u mnogim slučajevima dolazi do konkurencije nekih njihovih rezultata, kao što je to prikazano na Slici 7.1.1.

Slika 7.1.1—Razvoj standarda za kompresiju video signala ISO/IEC MPEG standardi video kodovanja su namenjeni za arhiviranje i distribuciju kvalitetnog video materijala u komercijalne svrhe. Ciljnu grupu čine proizvođači, provajderi, i korisnici zabavnog video materijala. Sa druge strane, ITU standardi su pretežno koncentrisani na telekomunikacionu industriju. Standardi video kodovanja koje razvija ova organizacija pretežno su namenjeni komunikaciji u realnom vremenu i to od jednog ka drugom korisniku, ili od jednog ka ostalim korisnicima. Ovi standardi su poznati kao H.26x standardi. Sa x je obeležena odgovarajuća tačka generacije standarda.

7.2 MPEG prilaz multumedijalnoj standardizaciji Grupa eksperata za obradu pokretne slike MPEG formirana je 1988 godine sa zadatkom da razvije standarde za kodovanje pokretne slike, audia, i njihove kombinacije. Ova grupa radi u okviru združenog ISO/IEC tehničkog komiteta (eng. technical committee – TC) TC 1 na informacionim tehnologijama, kao radna grupa (eng. working group – WG) WG11 pri podkomitetu (eng. sub-committee – SC ) SC 29. U zavisnosti od prirode standarda, donose se različiti dokumenti. Za audio i kodne standarde, prvi dokument je nazvan Verifikacioni model (eng. Verification model – VM). U standardma MPEG-1 i MPEG-2, on nosi naziv Simulacioni i Test model, respektivno. VM opisuje rad kodera i dekodera. Kada MPEG stekne poverenje u pogledu stabilnosti standarda, izdaje se tzv. radni draft (eng. working draft – WD). On je izrađen već u formi standarda, ali zbog postojanja revizije, ostaje interni akt u MPEG-u. U planirano vreme, kada postane dovoljno stabilan WD postaje dodeljeni draft (eng. committee draft – CD). Pre prelaska u CD stadijum, WD je podvrgnut na još nekoliko revizija. Različite tehničke opcije proučavaju najmanje dva različita partnera. Pri tome je, pri svakoj reviziji, angažovan veliki broj eksperata čiji je zadatak da ukažu na eventualno moguće greške sadržane u dokumentu. Lista radnih pojedinosti u procesu multimedijalne standardizacije je sledeća:

79

Page 90: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

• ISO/IEC, 11172 – Kodovanje pokretnih slika sa pridruženim audiom do oko 1.5 Mbit/s (MPEG-1)

• ISO/IEC, 13818 – Kodovanje pokretne slike i pridruženje audia (MPEG-2) • ISO/IEC, 14496 – Kodovanje audio-vizuelnih objekata (MPEG-4) • ISO/IEC, 15938 – Intefejs za opis multimedijalnog sadržaja (MPEG-7) • ISO/IEC, 21000 – Multimedijalni okvir (MPEG-21)

Iako je MPEG-3 bio predviđen da se bavi velikim binarnim protocima (binarni protok se

uobičajeno izražava kao broj bita u sekundi (eng. bits per second) bit/s, b/s, bps), nikada nije razvijen, jer su se ovi zahtevi mogli sresti kod MPEG-2. Što se tiče MPEG-5 i MPEG-6, oni nisu nikada ni definisani. Najzad, treba istaći da je MPEG-21 prvi standard uspostavljen u 21. veku.

MPEG sledi princip da standard treba da obezbedi interoperabilnost. To produžava životni vek standarda i obezbeđuje istovremeno uvođenje novih tehnologija. Na primer, MPEG standardi kodovanja specificiraju samo sintaksu i semantiku tokova bita (eng. bit stream) i proces dekodovanja. Ništa se ne govori o tome kako kodovi kreiraju tokove bita. To ostavlja istraživačima više slobode oko optimizacije izbora kodera (estimacija pokreta, upravljanje protokom bita kod psihoakustičnih modela), a sve se to radi zbog minimiziranja performansi za ciljane aplikacije i sadržaje. Istraživači koriste primene novih tehnologija u MPEG standardima radi što boljeg korišćenja sredstava primenjenih u procesu kodovanja. Time se postiže konkurencija u kvalitetu i ceni uz stalno obezbeđene uzajamne interoperebilnosti.

7.3 MPEG-1 standard

MPEG-1 standard predstavlja prvu generaciju iz grupe MPEG standarda koja je uvedena u periodu od 1988 do 1991 godine [7.3]. MPEG-1 je u stvari originalni MPEG standard za kodovanje (kompresiju) audija i videa, protokom do 1.5 Mbit/s. Standard ne specificira parametre za prenos signala.

MPEG obično razvija audio i video kodne standarde paralelno, zajedno sa specifikacijama za multipleksiranje i sinhronizaciju. Mada pripremljene da se koriste zajedno, moguće su i individualne specifikacije koje se mogu koristiti nezavisno. Na primer, jedan različiti video format može se koristiti zajedno sa MPEG-1 rešenjima za sisteme i audio. To je razlog zbog čega su MPEG standardi organizovani po delovima, od kojih svaki definiše neki deo tehnologije. MPEG-1 se sastoji iz pet Delova.

a) Deo 1: Sistemi

Odnosi se na kombinaciju jednog ili više strimova podataka (MPEG-1 Video, Audio) sa vremenskom informacijom koja formira jedinstveni strim, optimiziran za digitalno memorisanje ili prenos.

b) Deo 2: Video

Specificira kodni format (video strim i odgovarajući proces dekodovanja) za video sekvence pri binarnim protocima od oko 1.5 Mbit/s. Ciljano radno okruženje je memorija pri kontinualnoj brzini prenosa, ali je modni format uopšten i može se koristiti u širem smislu. Omogućena je interaktivnost. Kao rešenje za koder ustanovljeno je hibridno kodovanje na bazi diskretne kosinusne transformacije (eng. discrete cosine transform –

80

Page 91: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

DCT) u bloku primenjeno na jednoj slici ili na grešku predikcije dobijenu posle predikcije po vremenu (na bazi jedne ili dve slike) sa kompenzacijom pokreta. DCT je praćena kvantizacijom, cik–cak smenjivanjem i kodovanjem primenom promenljive dužine kodne reči, kao što je prikazano na Slici 7.3.1. MPEG-1 video podržava samo progresivne formate, a broj linija je fleksibilan. −

Slika 7.3.1—Arhitektura uprošćenog MPEG-1 video kodera

c) Deo 3: Audio

Specificira kodne formate (audio strim i odgovarajući proces dekodovanja) za monofonski od 32 kbit/s do 192 kbit/s i stereofonski od 128 kbit/s do 134 kbit/s zvuk. Ovaj standard specificira tri hijerarhijska sloja kodovanja: I, II i III koji su pridruženi zbog kompleksnosti, kašnjenja i efikasnosti. Sloj III je poznatiji pod oznakom MP3. Ova kodna rešenja su namenjena za opšti audio i koriste perceptualna ograničenja čovečijeg auditornog sistema sa krajnjim ciljem koji je vezan za uklanjanje parcijalnih nevažnih delova signala.

d) Deo 4: Prilagođeno ispitivanje

Određuje testove za proveru da li su strimovi bita (sadržaj) i dekoderi korektni u odnosu na specifikacije u delovima 1, 2 i 3.

e) Deo 5: Softverska simulacija

Sastoji se iz softvera koji primenjuje alate specifične u Delovima 1, 2 i 3. To je tehnički izveštaj koji ima samo informativnu vrednost. U kasnijim MPEG standardima tzv. Referentni softver postaje deo standarda. MPEG-1 je još uvek popularan kod internet video striminga i downloading-a. Isto tako, poznato je da je u oblasti distribucije digitalne muzike značajan standard Grupe eksperata za obradu pokretne slike-1 audio sloj 3 (eng. Motion Picture Experts Group-1 Audio Layer 3 – MP3), odnosno MPEG-1 audio sloj 3.

BINARNI NIZ

ORIGINALI

ENTROPIJSKO KODOVANJE

DCT + KVANTIZER KREACIJA

SIMBOLA

IZLAZNI BAFER

ENTROPIJSKO KODOVANJE

INVERZNA KVANTIZACIJA

INVERZNA DCT

+

Kompenzacija pokreta

Prethodni kadar

81

Page 92: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

7.4 MPEG-2 standard MPEG-2 je ISO/IEC 13818 standard koji specificira kompresiju audia i videa. Po pravilu MPEG-2 komprimovani signal višeg je kvaliteta nego u slučaju MPEG-1 kompresije. Ovaj standard specificira parametre prenosa i čini centralni deo digitalne video difuzije (eng. digital video broadcasting – DVB). Glavni cilj MPEG-2 video standarda je definisanje formata koji će se koristiti za opis kodovanog video signala. MPEG-2 standard definiše rezultujući strim bita. Kada je MPEG-2 razvijen, jedini zahtev je bio da se formira tako da bude dovoljno fleksibilan za upotrebu kod šireg spektra video aplikacija, koje zahtevaju binarne protoke do Mbit/s, kao što su HDTV, DVD, interaktivna memorija (eng. interactive storage media – ISM), širokodifuzni (eng. broadcast) servisi, kablovska TV distribucija i interaktivni TV servisi pogodni za fleskibilne mogućnosti mreže, ograničenja u širini mrežnog opsega i kvalitetu slike [7.4]. U odnosu na MPEG-1 standard, MPEG-2 je uveo sledeće razlike:

• Pretraživanje u poljima, a ne samo u kadrovima, • Generisanje makroblokova tipa 4:2:2 i 4:4:4, • Veličina kadra može biti do 16 383 × 16 383 piksela, • Može se koristiti nelinearna kvantizacija trakta makrobloka.

Kodni algoritmi i metode predikcije u MPEG-2 skoro su isti kao kod MPEG-1. Međutim,

MPEG-2 sadrži više mogućnosti, na primer, analiza sa proredom i skalabilnost [7.5]. MPEG-2 sistemi, audio i video specifikacije su bazirani na odgovarajućim MPEG-1

specifikacijama [7.6]. Kasnije je pridodat još jedan Audio Deo, sa novim audio kodekom koji pripada naprednom audio kodovanju (eng. advanced audio coding – AAC). Danas standard MPEG-2 sačinjavaju različiti Delovi [7.7]–[7.11].

a) Deo 1:Sistemi Ovde važe iste karakteristike kao i za MPEG-1 sisteme s tim što se još podržavaju:

1) Okruženje kao što je difuzija, 2) Hardverski orijentisano procesiranje pored softverski orijentisanog procesiranja, 3) Prenos više programa simultano bez zajedničke vremenske baze, 4) Prenos u asinhronom transfer modu (eng. asynchronous transfer mode – ATM)

[7.12].

Ovi zahtevi daju kao rezultat specifikaciju dva tipa sistema strimova: Programski strim sličan i kompatibilan sa MPEG-1 sistemima strimova i novi Transportni strim za prenos više nezavisnih programa.

b) Deo 2: Video Određuje opšti domet kodovanja (video strim i odgovarajući proces dekodovanja) za video sekvence sve do HDTV rezolucije. Osnovna kodna arhitektura je ista kao i za MPEG-1 Video, uz podršku za isprepletane video formate i skalabilne/ hijerarhijske kodne formate (vremenski, prostorni, SNR). MPEG-2 Video podrazumeva više alata. U nekim primenama neki, od ovih alata suviše su komplikovani za primenu. MPEG-2

82

Page 93: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Video definiše, tzv. profile koji su u stanju da obezbede kodna rešenja uz odgovarajuću kompleksnost. Profili su podnizovi alata koji se odnose na potrebe specifičnih klasa aplikacija. Takođe, izvestan broj nivoa je definisan za svaki profil kako bi se ograničila memorija i računarski zahtevi za primenu dekodera. Nivoi obezbeđuju donju granicu kompleksnosti strimova bita i minimum mogućnosti za dekoder. MPEG-2 Video dekoder je u stanju da dekoduje MPEG-1 video strimove. Kompatibilnost, koja se ogleda u tome da je MPEG-2 Video moguće kodovati pomoću MPEG-1 Video dekodera, je obezbeđena preko specifičnih profila kroz skalabilnost [7.13], [7.14].

c) Deo 3: Audio

Određuje kodni fomat (audio strim i odgovarajući proces dekodovanja) za višekanalni audio. Deo 3 obezbeđuje kompatibilnost sa MPEG-1 Audio strimovima. Na primer, MPEG-1 Stereo dekoder bio bi u stanju da reprodukuje značajnu verziju originalnog vušekanalnog MPEG-2 Audio strima. MPEG-2 Audio je u tehničkom pogledu sličan sa MPEG-1 Audio sa ista tri sloja.

d) Deo 4: Prilagođeno ispitivanje

Obuhvata specifične testove koji omogućavaju da se proveri da li su strimovi bita (sadržaj) i dekoderi takvi da odgovaraju specifikacijama i tehničkim delovima MPEG-2. Za video strimove prilagođavanje je definisano za strimove određenog nivoa i određenog profila.

e) Deo 5: Softverska simulacija

Sastoji se iz softvera i koristi alate specificirane u delovima 1, 2, i 3. Opis je dat u obliku informativnog Tehničkog Izveštaja.

f) Deo 6: Digitalna memorija-komanda i kontrola (eng. digital storage media- command

and control – DSM-CC) Obuhvata specifične opšte komande i kontrole nezavisno od vrste DSM, kako bi se predstavile funkcije specifične za MPEG strimove bez potrebe da se znaju detalji o DSM. Ove komande se primenjuju na MPEG-1 Sisteme, kao i na MPEG-2 Programske i Transportne strimove.

g) Deo 7: AAC

Pošto je MPEG-2 Audio (Deo3) specifičan sa ograničenjem u pogledu kompatibilnosti, određuje multikanalni kodni format, bez zahteva u pogledu kompatibilnosti. Na taj način postiže se sličan kvalitet na znatno nižim bitskim brzinama nego kod MPEG-2 audio dela 3.

h) Deo 8:

Povučen (u početnom stadijumu odnosi se na 10-bitno video kodovanje). i) Deo 9: Interfejs u realnom vremenu

Određuje dodatne alatke za korišćenje MPEG-2 sistema za razmenu podataka u realnom vremenu, što je praktičan zahtev u telekomunikacionim primenama.

83

Page 94: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

j) Deo 10: DSM-CC prilagođeno proširenje Specificira testove za proveru da li strimovi bita (sadržaj) i dekoderi odgovaraju specifikaciji u Delu 6.

k) Deo 11: Upravljanje intelektualnom svojinom i zaštita (eng. intellectual property

management and protection – IPMP) u MPEG-2 sistemima To je dodatak uveden radi daljeg specificiranja alata u sistemu koji obezbeđuje da IPMP mogućnosti i karakteristike budu razvijene i sklopu standarda MPEG-4 koji bi se koristio sa strimovima MPEG-2 Sistema [7.14].

Završavajući ovaj kratak prikaz MPEG-2 standarda, može se reći da se on bavi tehnologijama kompresije i sintakse bit strimova, u cilju obezbeđivanja prenosa audia i videa u širokopojasnim mrežama. U mnogim slučajevima MPEG-2 se pripisuje samo video kompresiji. Međutim, MPEG-2 standardi ne uključuju samo video. Različiti delovi ovog standarda prikazuju više aspekata predstavljanja, prenosa i predaje kako digitalnog videa tako i digitalnog audia.

7.5 MPEG-4 standard MPEG-4 je standard koji specificira postupke simultanog kodovanja (kompresije) sintetičkih i prirodnih objekata i zvuka [7.15], [7.16]. Radi se, dakle, o standardu za audio-vizuelno kodovanje radi zadovoljenja različitih potreba komunikacionih, interaktivnih i difuznih modela servisa, kao i potreba mešovitih modela servisa. To daje kao rezultat tehnološku konvergenciju [7.17]. MPEG-4 standard obezbeđuje skup tehnologija da bi zadovoljio potrebe autora, provajdera servisa i krajnjih korisnika. Autorima MPEG-4 obezbeđuje produkciju sadržaja koji ima veću mogućnost da se ponovo koristi i veću fleksibilnost nego što je to moguće primenom pojedinačnih tehnologija kao što su to digitalna televizija, animirana grafika, web strane itd. Provajderima servisa MPEG-4 nudi transparentne informacije koje mogu biti interpretirane i prevedene u odgovarajuće signalne poruke za svaku mrežu, kao i pomoći od strane relevantnih tela za standardizaciju. Krajnjim korisnicima MPEG-4 obezbeđuje visoki nivo interaktivnosti sa sadržajem unutar ograničenih skupova od strane autora. Generalno, MPEG-4 omogućava:

• Prikazivanje audio, vizuelnog i audio-vizuelnog sadržaja koji se nazivaju medija objekti. Ovi objekti mogu biti prirodnog ili sintetičkog porekla, što znači da mogu biti snimljeni kamerom ili mikrofonom ili biti generisani pomoću računara;

• Opisivanje kompozicije objekata da bi se kreirao složeni medija objekat koji formira audio-vizuelne scene;

• Multipleksiranje i sinhronizaciju podataka koji su povezani sa medija objektima, tako da se mogu prenositi kanalom u mreži obezbeđujući pri tome QoS koji odgovara prirodi specifičnih objekata;

• Interakcije sa audio-vizuelnim scenama generisanim na prijemnom sloju. Audio-vizuelna scena je prikazana na Slici 7.5.1. Slika sadrži složene medija objekte koji grupišu zajedno osnovne medija objekte. Glavna razlika, na bazi novih funkcionalnosti u odnosu na prethodne standarde, je na objektu baziran audio-vizuelni model prikazivanja koji je osnova MPEG-4.

84

Page 95: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Slika 7.5.1—Jedan primer za audio-vizuelnu scenu

Na Slici 7.5.2 prikazana je MPEG-4 arhitektura koja se zasniva na objektima [7.18].

Slika 7.5.2—MPEG-4 arhitektura zasnovana na objektima

85

Page 96: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

MPEG-4 audio-vizuelne scene sastoje se od nekoliko medija objekata koji su organizovani na hijerarhijski način. U odsustvu hijerarhije mogu se pronaći osnovni medija objekti (slike, video objekti, audio objekti itd.).

MPEG-4 standardizuje brojne osnovne medija objekte i u mogućnosti je da prikaže i prirodne i sintetičke tipove sadržaja koji mogu biti 2D ili 3D. Takođe, MPEG-4 definiše i prikazivanje podataka o objektu. Medija objekti u svojoj kodovanoj formi sastoje se od deskriptivnih elemenata koji omogućavaju rukovanja objektima u audio-vizuelnim scenama [7.19]. Svaki medija objekat se može prikazati u sopstvenoj kodovanoj formi, nezavisno od sopstvenog okruženja i pozadine.

MPEG-4 je tako koncipiran da obezbedi uspešnu podršku na polju digitalne televizije [7.20], na polju interaktivnih grafičkih aplikacija (sintetizovan sadržaj), kao i na polju interaktivne multimedije (World Wide Web, distribucija i pristup sadržaju). MPEG-4 obezbeđuje standardizovane tehnološke elemente omogućavajući integraciju proizvodnje, distribucije i pristup sadržajima u okviru navedena tri polja. 7.5.1 Delovi MPEG-4 standarda MPEG-4 standard se sastoji iz sledećih delova [7.21]:

a) Deo 1: Sistemi

Određuju arhitekturu sistema i alate koje treba pridružiti kako za binarne oblike scena (eng. binary format for scenes – BIFS), tako i za proširene MPEG-4 tekstualne (eng. eXtensible MPEG-4 textual – XMT) formate. Od ne manjeg značaja su, takođe, i multipleksiranje, sinhronizacija, upravljanje baferom, kao i IPMP. Takođe ovaj deo specificira fajl format Grupe eksperata za obradu pokretne slike-4 (eng. Motion Picture Experts Group-4 File Format – MPEG-4, MP4) koji je tako sačinjen da je nezavisan od bilo kog posebnog protokola za predaju informacija, pri čemu je omogućena efikasna podrška za predaju, razmenu, upravljanje, emitovanje i prezentaciju uređaja. Isto tako, tzv. MPEG-J (MPEG-Java) definiše kako aplikacije mogu biti realizovane na korisničkom terminalu.

b) Deo 2: Vizuelni

Određuje kodne alate pridružene vizuelnim objektima prirodnog i sintetičkog porekla. Na primer, to podrazumeva specifikaciju rešenja za video kodovanje i to od vrlo malih bitskih brzina do vrlo zahtevnih uslova uključujući dinamičke 3D objekte. O vizuelnom MPEG-4 Delu biće kasnije više govora.

c) Deo 3: Audio

Specifira sve kodne alate koji se pridružuju objektima kako prirodnog tako i sintetičkog porekla (na primer kodna rešenja za muzičke i govorne podatke za vrlo širok opseg bitskih brzina i sintetičkog audia uključujući tu i 3D audio prostore). O MPEG-4 audio- komunikaciji biće još reči.

d) Deo 4: Prilagođeno ispitivanje

86

Page 97: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Definiše testove koji omogućavaju da se proveri da li strimovi (sadržaj) i dekoderi odgovaraju tehničkim specifikacijama propisanim prema Delovima MPEG-4 standarda. Pri tome je za video i audio strimove profil definisan kao niz objekata.

e) Deo 5: Referentni softver

Uključuje softver koji odgovara najvećem broju Delova MPEG-4, naime video i audio koderima i dekoderima. Za razliku od MPEG-1 i MPEG-2, MPEG-4 referentni softver za dekodere pomaže da se razumeju tekstualni delovi poruka.

f) Deo 6: Okvir za isporuku multimedijalnih integracija (eng. delivery multimedia

integration framework – DMIF) Specificira isporuku formata nezavisno od medija i omogućava da se transparentno prevaziđu granice različitih predajnih okruženja.

g) Deo 7: Optimizirani softverski alati za MPEG-4

Uključuje optimizirane kodne softvere za vizuelne kodne alate kao što su estimacija pokreta i brza globalna estimacija pokreta.

h) Deo 8: Prenos MPEG-4 sadržaja po IP mrežama

Specificira preslikavanje MPEG-4 sadržaja u nekoliko IP protokola. i) Deo 9: Referentno opisivanje hardvera

Uključuje hardverski opisni jezik za vrlo brzo integrisano kolo (eng. very high speed integrated circuit hardware description language – VHDL). Ovi MPEG-4 alati su prenosivi.

j) Deo 10: Napredno video kodovanje (eng. advanced video coding - AVC)

Specificira napredne video-kodne alate na bazi kodera koji obezbeđuju do 50 % veću kodnu efikasnost nego najbolji profil video kodovanja u MPEG-4 Deo 2 za široki opseg bitskih brzina i video rezolucija. Međutim, u poređenju sa prethodnim standardima, kompleksnost dekodera je oko četiri puta veća nego kod MPEG-2 Videa i dva puta veća u poređenju sa jednostavnim MPEG-4 Vizuelnim profilom. Ovaj deo razvio je Združeni video tim (eng. Joint Video Team - JVT) koji je osnovan u cilju formalizovanja saradnje između ISO/IEC MPEG i ITU-T VCEG za razvoj ovog kodeka. Standard MPEG-4 združeno video kodovanje (eng. joint video coding – JVC) je već poznat u ITU-T kao Preporuka H.264.

k) Deo 11: Uređaj za opis scene i primenu

Uključuje alate koji su već specificirani u Delu 1 u vezi sa kompozicijom scene i to kako u binarnom BIFS, tako i u tekstualnim formatima XMT, MPEG-J i multi-korisničkom svetu.

l) Deo 12: Medija fajl format

Ovaj format je opšti format koji čini osnovu za druge brojne specifične fajl formate. Sadrži vreme, strukturu, i informacije o medijima za vremenske serije podataka o

87

Page 98: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

medijumu kao što su to, na primer, audio-vizuelne prezentacije. Ovaj deo je primenjiv na MPEG-4, a takođe i na JPEG-2000 (združena specifikacija) [7.22].

m) Deo 13: IPMP procesiranje

Određuje alate za upravljanje i zaštitu intelektualne svojine u audio-vizuelnom sadržaju i algoritmima tako da samo autorizovani korisnici imaju pristup do njih.

n) Deo 14: Fajl format

Definiše MP4 fajl format kao poseban slučaj medija fajl formata (Deo 12). Ovaj deo je ranije bio uključen u Deo 1, ali je sada izdvojen.

o) Deo 15: AVC fajl format

Definiše oblik memorije za video strimove komprimovane primenom AVC. Ovaj format se zasniva i kompatibilan je sa ISO medija fajl formatom (Deo 12).

p) Deo 16: Proširenje okvira animacije (eng. animation framework eXtension – AFX)

Određuje alate za interaktivni 3D sadržaj koji radi na geometrijskim modelirajućim i biometričkim nivoima i obuhvata alate prethodno definisane u MPEG-4 i to u kontekstu sintetičkog prirodnog hibridnog kodovanja (eng. sinthetic natural hybrid coding – SNHC). AFX nudi jedinstveni standardizovani 3D okvir obezbeđujući značajne osobine kao što su kompresija, striming, i integracija sa drugim audio-vizuelnim medijima i omogućavajući uvođenje visoko kvalitetnih kreativnih unakrsnih aplikacija preko medijuma.

q) Deo 17: Striming tekstualni format

Određuje strimove teksta, vezu između pristupnih jedinica teksta, format strimova teksta pristupne jedinice za tekst, signalizaciju i dekodovanje strimova teksta. Što se tiče pristupnih formata, ovaj Deo upotpunjuje alate već specificirane u Delu 1.

r) Deo 18: Kompresija fonta i striming

Određuje alate koji obezbeđuju komunikaciju podataka o fontu kao deo MPEG-4 kodovane audio-vizuelne prezentacije.

s) Deo 19: Strim sintetizovane teksture

Specificira sintetičke teksture koje proizilaze iz animacije foto-realističkih tekstura opisivanjem informacija u boji. Pri tome se koriste vektori koji proizvode pokrete vrlo malih bitskih brzina i koji se nazivaju sintetičke teksture. t) Deo 20: Svetlosne primene kod scenskog predstavljanja (laser)

Obezbeđuje scensko predstavljanje sa ciljem da se uspostavi veza između brzine, efikasnosti kompresije, dekodovanja.

u) Deo 21: Proširenja okvira grafike (eng. graphics framework eXtensions - GFX)

Obezbeđuje potpuni programski okvir uključujući tu i operacije prirodnog i sintetičkog kodovanja. GFX koristi interfejs za programske aplikacije (eng. application

88

Page 99: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

programming interface – API), omogućavajući široki opseg aplikacija na prijemniku od mobilnih uređaja do stacionarnih računara.

Završavajući kratak prikaz delova MPEG-4 standarda koji se još uvek proširuje, treba

reči da tehnička specifikacija ne predstavlja poslednji kodek na široko rasprostranjenom usvajanju i primeni. U nastavku ćemo se, najpre, malo opširnije pozabaviti Vizuelnim delom MPEG-4 standarda. 7.5.2 MPEG-4 standard: vizuelni deo ISO/IEC standard 14 496 Deo 2 tj., MPEG-4 vizuelni deo, unapređuje MPEG-2 standard kako po pitanju efikasnosti kompresije (bolja kompresija za isti vizuelni kvalitet) i po pitanju fleksibilnosti (mnogo širi opseg primena). To je omogućeno na dva načina : korišćenjem naprednih algoritama za kompresiju i obezbeđenjem seta alata za kodovanje i manipulaciju sa digitalnim medijumom. Vizuelni deo se sastoji iz video-koder/dekoder modela kao i iz brojnih dodatnih alata za kodovanje [7.23]. Model se zasniva na dobro poznatom hibridnom modelu kodovanja – diferencijalna impulsno kodovana modulacija/diskretna kosinusna transformacija (eng.differential pulse code modulation /discrete cosine transform –DPCM/DCT) [7.24], čija je osnovna funkcija poboljšanje efikasnosti kodovanja, pouzdan prenos, kodovanje specijalnih oblika i objekata, kao i poboljšanje kompresije. Značajne karakteristike po kojima se MPEG-4 vizuelni kodni standarad razlikuje od prethodnih su:

• Efikasno kodovanje progresivnih i isprepletanih (eng. interlaced) “prirodnih’’ video sekvenci (kompresija frekvenci sa pravougaonim video frejmovima);

• Kodovanje video objekata (video scene sa neregularnim regionima). Ovo predstavlja

novu koncepciju za video kodovanje i omogućava nezavisno kodovanje objekata i video scena;

• Podrška za prenos preko postojećih mreža. Alati za otpornost uz greške pomažu dekoderu

da se oporavi od grešaka u prenosu i održi uspešnu video konekciju u mrežnom okruženju. Treba imati u vidu da i skalabilni alati za kodovanje mogu pomoći u podršci za fleksibilniji prenos kodiranih bitskih protoka;

• Kodovanje animiranih vizuelnih objekata kao što su 2D i 3D poligonalne mreže

animiranih lica i animiranih ljudskih tela;

• Kodovanje specijalnih aplikacija koje su video-studijskog kvaliteta. Kod ovog tipa aplikacije vizuelni kvalitet je važniji nego velika kompresija.

Vizuelni deo MPEG-4 standarda obezbeđuje kodne funkcije kroz kombinaciju alata,

objekata i profila. Alat predstavlja podskup kodnih funkcija za podršku specifične funkcije (na primer, video kodovanje oblika objekta). Objekat je video element (na primer sekvenca sa pravougaonim frejmovima, mirna slika itd) koji je kodovan korišćenjem jednog ili više alata. Profil je skup tipova objekata za koji se očekuje da koder-dekoder (eng. coder-decoder –

89

Page 100: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

CODEC) ima mogućnosti da ih obrađuje. Ovaj vizuelni deo MPEG-4 standarda obuhvata profile za kodovanje prirodnih video scena. Pored podskupa alata za kodovanje, profili definišu i nivoe. Nivoi definišu ograničenja u parametarskom bitstrimu. Svaki nivo postavlja ograničenja u maksimalnim performansama za dekodovanje MPEG-4 kodovane sekvence. Definicije nivoa postavljaju ograničenja na veličinu memorije bafer, veličinu dekodovanog frejma i brzinu procesiranja. U okviru ovog dela MPEG-4 standarda, video sekvenca se posmatra kao kolekcija jednog ili više objekata. Objekti se definišu kao frekvencijske celine koje korisniku omogućavaju pristup, prezentovanje i manipulaciju. Video objekat (eng. video object - VO) je oblast video scene koja može zauzimati region proizvoljnog oblika i može postojati proizvoljno vreme. Trenutni video objekat u određenemo trenutku vremena predstavlja video objektnu ravan (eng. video object plane - VOP). Na Slici 7.5.2.1 prikazan je video objekat koji se sastoji od tri pravougaone video objektne ravni. Video scena može biti kreirana od objekata u drugom planu (eng. background object) i posebnih objekata u prvom planu (eng. foreground object).

Slika 7.5.2.1—Video objektne ravni i video objekat (pravougaonik) Ovaj pristup je fleksibilniji nego fiksna pravougaona struktura frejma kod prethodnih standarda. Posebni objekti se mogu kodovati sa različitim vizuelnim kvalitetom i vremenskom rezolucijom da bi prikazali svoju važnost u konačnoj sceni. Objekti sa više izvora (uključujući i sintetičke i prirodne objekte) mogu se kombinovati u jednu scenu. Preko visoke interaktivne aplikacije krajnji korisnik može da reguliše kompoziciju i ponašanje scene. Svaki objekat koduje se posebno. 7.5.3 MPEG-4 standard: audio Kao što smo videli, MPEG-4 standardizacija razvila se sa ciljem da definiše fleksibilan okvir za audio/video multimediju uz prilagođenje specifičnim aplikacijama, kao što su: efikasno kodovanje, pristup i prenos prirodnog i računarski generisanog audio/video signala za mobilne i internet komunikacije [7.25]. Zahvaljujući aktivnosti ISO MPEG organizacije, perceptualna kompresija audio signala je postala de-facto standard za distribuciju muzike [7.26]. Primenom MPEG-4 naprednog kodera AAC ostvaruje se kompresija u odnosu 16:1 sa kvalitetom veoma bliskim kompakt disku (eng. compact disc – CD) i transparentni kvalitet prema normama koje propisuje Međunarodna unija za telekomunikacije–Radio sektor za standardizaciju (eng. International Telecommunication Union–Radio Standardization Sector – ITU-R) sa kompresijom 11:1.

90

Page 101: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Međutim, sa povećanjem kvaliteta kodera, povećava se kompleksnost kao i kašnjenje signala. Povećanje kašnjenja ne predstavlja problem u aplikacijama difuzije i striminga zato što pojedini servisi dozvoljavaju kašnjenje reda veličine desetak sekundi. Sa druge strane, tipične implementacije audio kodera na procesorima za digitalnu obradu signala (eng. digital signal procesing – DSP) imaju kašnjenje sa kraja na kraj od 290 ms: kašnjenja ovog reda veličine su neprihvatljiva za aplikacije sa dvosmernom komunikacijom kao što su telekomunikacije i telefonija visokog kvaliteta. Za sve aplikacije razvijeni su kodovi od strane ITU (6.711, 6.722, 6.728, 6.729) i GSM6.10 sa algoritamskim kašnjenjem od 20 ms [7.27]. Ovi koderi su projektovani za kompresiju ljudskog govora, tako da se pri kodovanju audio signala u opštem slučaju ostvaruje nedovoljan kvalitet. Idealno rešenje je algoritam koji je sposoban da ostvari AAC i MP3 kvalitet sa algoritamskim kašnjenjem tipičnim za ITU-T kodere govora. Postoje dve grupe alata za kodovanje audia kod MPEG-4 i to: Prirodni alati koji omogućavaju da digitalni audio bude komprimovan i prenešen i sintetički alati koji koji omogućavaju parametarsko opisivanje zvuka koji se prenosi i koristi za sintezu na prijemnoj strani [7.28]–[7.31]. Prirodni audio alati omogućavaju prenos komprimovanog govora i širokopojasni audio u opsezima od 6 kbit/s za kodovanje govora za male bitske brzine do 64 kbit/s po kanalu za niskokvalitetni višekanalni zvuk. MPEG-4 ima tri glavne alatke za audio kodovanje. Generalni audio (eng. general audio – GA) koder obezbeđuje prenos visoko-kvalitetnih širokopojasnih multikanalnih signala kao što je muzika pri bitskim brzinama od 16 kbit/s do 64 kbit/s u kanalu. Ovaj koder predstavlja skalabilnu verziju dobro poznatih perceptuelno kompresovanih tehnika [7.32]. Zasniva se na MPEG-2 naprednom audio kodnom standardu sa dodatnim poboljšanjima u kvalitetu i fleksibilnosti [7.33]. MPEG-4 ima dva sintetička audio kodera. Jedan obezbeđuje interfejs sa sistemima tekst-govor. Tzv. interfejs tekst-govor (eng. text-to-speech interface – TTSI) prihvata strim bita koji sadrži potrebne podatke o fenomenima kao i podatke o dužini slojeva i kontroliše eksterni govorni sintisajzer. U standardu nije specificifiran poseban metod za sintezu govora. Standardizovani su samo format interfejsa i bit strima u delu MPEG-4 TTSI. Drugi je opšti alat za sintezu muzičkih i zvučnih efekata nazvan strukturni audio (eng. structured audio – SA). SA koder omogućava prenos algoritma za sintezu zvuka na novom tzv. Muzičkom V jeziku nazvanom strukturni jezik audio orkestra (eng. structured audio orchestra language – SAOL) [7.34]. MPEG-4 je prvi standard za prenos zvuka preko algoritama za sintezu [7.35]. Muzički jezik SAOL je takođe važan za audio alate. Konvergencija između kodnih tehnika za strukturni audio i efekte procesiranja u MPEG-4 je jedan od važnih aspekata ovog standarda. 7.5.4 H.264/AVC MPEG-4 (Part 10) standard H.264/AVC je video kodni standard koji su zajednički razvili eksperti iz JVT, odnosno ITU-T VCEG i ISO/IEC MPEG komiteta za standardizaciju [7.36]–[7.38]. U poređenju sa prethodnim standardima H.264/AVC obezbeđuje veću kompresiju, efikasnije kodovanje video sadržaja, kao i niže bitske protoke uz mnogo prihvatljiviji perceptualni kvalitet. Takođe, standard podržava fleksibilnost u kodovanju, kao i organizaciju kodovanih podataka tako da je povećana otpornost na greške i gubitke. Poboljšanje kodnih performansi produkt je uglavnom dela za predikciju. Osnovni funkcionalni elementi H.264/AVC standarda su: transformacija za redukciju prostorne korelacije i kvantizacije za kontrolu bitskog protoka. Od ne manje važnosti su

91

Page 102: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

predikcija kompenzacije pokreta za redukciju vremenske korelacije, kao i entropijsko kodovanje za redukciju statističke korelacije. Sa povećanjem kodne efikasnosti i fleksibilnosti dolazi i do povećanja kompleksnosti samog kodera. Za određene aplikacije, H.264/AVC definiše sedam Profila. Profili definišu skup kodnih alata i algoritama koji se mogu koristiti pri generisanju odgovarajućeg toka bita. Takođe, za svaki profil H.264/AVC definiše i skup nivoa i podnivoa. Arhitektura H.264/AVC standarda se bazira na dva sloja: mrežnom apstraktnom sloju (eng. network apstraction layer – NAL) i video kodnom sloju (eng. video coding layer – VCL) [7.39], kao što je to prikazano na Slici 7.5.4.1.

Slika 7.5.4.1—Veza između mrežnog apstraktnog sloja i video kodnog sloja u strukturi standarda H.264/AVC

Mrežni apstraktni sloj omogućava efikasno prilagođenje VCL za korišćenje u širokom spektru sistema. NAL obezbeđuje mapiranje H.264/AVC podataka u transportne nivoe kao što su to žični i bežični internet servisi, različiti formati fajlova (ISO MP4 za arhiviranje, na primer), H.32 x standardi za žične i bežične konverzacijske servise, MPEG-2 sisteme za širokodifuzne (eng. broadcasting) servise itd. NAL sloj definiše interfejs između video kodera i spoljašnjeg mrežnog okruženja. NAL jedinice su logične celine uvedene da olakšaju prenos video sadržaja ka nivou koji odgovara pojedinim mrežama. Jedinice čine paket sa celobrojnim bitovima u kome prvi (zaglavlje) opisuje da li je reč o prenosu paketskog tipa ili o strimingu. Preostali bajtovi sadrže podatke o korisnom sadržaju (eng. payload). Struktura NAL jedinice definiše specifičan opšti format koji se može koristiti kako u paketski orijentisanim tako i u bitskim sistemima. NAL apstrahuje VCL podatke u nameri da ih pripremi za isporuku po različitim komunikacionim kanalima i medijumima za arhiviranje. VCL sloj specificira efikasnu prezentaciju komprimivanog video signala [7.40]. Video kodni nivo je dizajniran na blok bežičnom hibridnom video koderu na kome je svaka kodovana slika predstavljena makroblokovima piksela. VCL jedinica sadrži sledeće video kodovane podatke: video sekvencu, sliku, isečak (eng. slice), makroblok i blok. Elementi VCL prikazani su na Slici 7.5.4.2.

92

Page 103: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Slika 7.5.4.2—Elementi VCL Video sekvence se sastoje od okvira (eng. frame) ili polja (eng. field). H.264/AVC standard podržava progresivnu ili analizu sa proredom koje mogu biti u istoj sekvenci. Slike su izdeljene u isečke. Isečak je sekvenca makroblokova i ima fiksnu veličinu. Postoje tri osnovna tipa isečka: I unutar (eng. intra - I), P prediktivni (eng. predictive - P) i B dvosmerno prediktivni, biprediktivni (eng. bidirectionally-predictive - B) isečci. Kod H.264/AVC standarda, I-isečci makroblokova su komprimovani bez korišćenja neke predikcije pokreta od isečka u drugim slikama. P-isečci sadrže makroblokove koji se mogu komprimovati sa korišćenjem predikcije pokreta. P-isečci mogu sadržati i intra makroblokove. B-isečci sadrže makroblokove koji se mogu komprimovati korišćenjem predikcije pokreta i slično kao kod P-isečaka mogu imati intra makroblokove. KODOVANJE I DEKODOVANJE KOD H.264/AVC STANDARDA Na Slici 7.5.4.3 prikazan je koder sa dva dela za prenos podataka ’’unapred“ (sa leva u desno) i ’’deo za rekonstrukciju“ (sa desna u levo). Kod kodera (deo unapred) ulazni frejm ili polje je procesirano u makroblok jedinice. Svaki makroblok je kodovan u Inter ili Intra modu i za svaki blok u okviru makrobloka predikcija PRED (označeno sa P) se formira na osnovu rekonstruisanih odbiraka slike. Kod Intra moda, PRED je formirana od odbiraka aktuelnog isečka koji je perthodno kodovan, dekodovan i rekonstruisan što je označeno sa “uF'n“. Kod Inter moda PRED je formirana pomoću predikcije kompenzacije pokreta od jedne ili dve referentne slike koje su selektovane iz skupa liste 0 i/ili liste 1 referentnih slika. Referentna slika je prikazana kao prethodno kodovana slika F'n-1. Predikcija referentne slike za svaki deo makrobloka (kod Intra moda) mora se izabrati između selektovanih prošlih ili budućih slika koje su već kodovane, rekonstruisane i filtrirane. Predikcija PRED se oduzima od aktuelnog bloka da bi se dobio rezidualni (razlika) Dn blok koji se transformiše (koriste se blok transformacija T) i kvantuje Q da bi se dobio skup kvantovanih koeficijenata tranformacije X koji su ponovo uređeni i entropijski kodovani. Koeficijenti entropijski kodovani, zajedno sa ostalim informacijama zahtevaju da se dekoduje svaki blok unutar makrobloka (modovi predikcije, parametri kvantizacije, informacije o vektoru pokreta itd.) komprimovanog toka koji je posle

93

Page 104: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

prosleđen mrežnom apstraktnom sloju NAL radi prenosa ili memorisanja. Dekoder (deo za rekonstrukciju) dekoduje (rekonstruiše) svaki blok u makrobloku da bi obezbedio referencu za dalje predikcije. Koeficijenti X se skaliraju (Q^-1) i inverzno transformišu (T^-1) da bi se dobio blok razlike D'n. Predikcije bloka PRED se dodaje da bi se dobio rekonstruisani blok ’’nF'n“ (dekodovane verzije originalnog bloka). Oznaka “n“ ukazuje na to da rekonstruisani blok nije filtriran. Filter se primenjuje da se redukuju efekti debloking izobličenja. Rekonstruisana referentna slika je kreirana iz serije F'n blokova.

P

Inter

X

NAL

Fn trenutni −

F'n−1 referenca

F'n rekonstruisani

Estimacija pokreta

Kompenzacija pokreta

Izbor Intra predikcije

Intra predikcija

Filter

Q

T

Preraspodela Entropijsko kodovanje

T^ − 1 Q^ − 1

Intra

+

1 ili 2 prethodno kodovana frejma

uF'nD'n

+

+

Dn

Slika 7.5.4.3—Blok-šema kodera za prenos podataka i rekonstrukciju

Blok šema dekodera prikazana je Slici 7.5.4.4

X Preraspodela Entropijsko kodovanje NAL Inter

Slika 7.5.4.4—Blok-šema dekodera

P

F'n−1 Kompenzacija referenca pokreta

F'n rekonstruisani

Intra predikcija

Filter

T^ − 1 Q^ − 1

Intra

1 ili 2 prethodno kodovana frejma

D'n+uF'n

+

94

Page 105: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Dekoder prima komprimovani tok bita od NAL i entropijski dekoduje elemente sa podacima da bi se dobio skup koeficijenata kvantizacije X [7.41]. On ima mogućnost skaliranja i inverzne transformacije za dobijanje D'n. Koristeći informacije iz dekodovanog zaglavlja toka bita, dekoder kreira blok za predikciju PRED koji je identičan originalnom PRED kod kodera. PRED je pridodat D'n da bi se dobio “uF'n“ koji se filtrira kako bi se dobio svaki dekodovani blok F'n.

Što se tiče metoda entropijskog kodovanja, postoje alternativne metode o kojima će biti reči u nastavku. ENTROPIJSKO KODOVANJE KOD H.264/AVC STANDARDA H.264/AVC standard specificira dve alternativne metode entropijskog kodovanja: adaptivno kodovanje sa promenljivom kodnom reči (eng. context adaptive variable length coding – CAVLC) i računarski zahtevniji algoritam binarnog aritmetičkog adaptivnog kodovanja konteksta (eng. context adaptive binary arithmetic coding – CABAC). Obe metode predstavljaju bitno poboljšanje efikasnosti kodovanja u poređenju sa tehnikama statističkog kodovanja koje su korišćene kod prethodnih standarda. Dodavanjem modelovanja konteksta u njihov entropijski kodni okvir, obe metode kod H.264/AVC nude visoki stepen adaptacije osnovnog okvira. Korišćenjem CAVLC moguće je redukovati bitski protok.

Za poboljšanje efikasnosti kodovanja kod H.264/AVC, CABAC je odobren kao alternativni entropijski način kodovanja. Blok-dijagram za CABAC prikazan je na Slici 7.5.4.5 CABAC postiže dobre performanse kompresije preko:

• Selekcije metode verovatnoća za svaki element sintakse prema sadržaju elemenata, • Adaptacije procenjenih verovatnoća zasnovanoj na statistici, • Korišćenja aritmetičkog kodovanja [7.42].

Slika 7.5.4.5—Blok-dijagram za CABAC

Kodovanje simbola obuhvata sledeća stanja: binarizaciju, selekciju modela konteksta, aritmetičko kodovanje i ažuriranje verovatnoća. Binarizacija podrazumeva da CABAC koristi binarno aritmetičko kodovanje koje dozvoljava da se samo binarna odluka (0 ili 1) koduje. Simbol koji nema binarne vrednosti je binarizovan ili konvertovan u binarni kod pre aritmetičkog kodovanja. Model konteksta je model verovatnoće za jedan ili više bita binarizovanog simbola i izabran je selekcijom raspoloživih modela zavisnih od statistika kodovanih simbola. Model konteksta memoriše verovatnoće za svaki bit 1 ili 0. Aritmetički

95

Page 106: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

koder koduje svaki bit prema selektovanom modelu verovatnoće. Selektovani model konteksta je baziran na ažuriranju aktuelne kodovane vrednosti. Završavajući ovo izlaganje, treba istaći da je zahvaljujući svojim unapređenim performansama H.264/AVC privukao pažnju industrije. Pored klasičnih aplikacionih domena kao što su videokonferencije i broadcasting TV sadržaji (satelitski, kablovski i zemaljski), sa poboljšanjem sposobnosti kompresije, H.264/AVC je obuhvatio i nove servise i tako otvorio nove tržišne mogućnosti u industriji. Druga oblast koja je privikla dosta interesovanja proizvođača opreme je prenos i memorisanje sadržaja visoke definicije (eng. high definition – HD) [7.43]. H.264/AVC standard se može primeniti i kod korisne opreme (na primer digitalne kamere, celularni telefoni itd.), videa preko IP mreža [7.44], [7.45], digitalnog broadcasting-a visoke definicije (preko zemaljskih ili satelitskih kanala) i digitalnih sistema za memorisanje (digitalni video disk (eng. digital video disk – DVD ) visoke rezolucije). Danas H.264/AVC omogućava i prenos preko IPTV preko digitalnih pertplatničkih linija i pasivnih optičkih mreža. H.264/AVC standard našao je primenu i kod mreža sa asinhronim načinom prenosa ATM.

7.6 Kratak pregled standarda za kodovanje mirnih slika Na ovom mestu treba pomenuti MPEG-4 standard za kodovanje vizuelne teksture (eng. visual texture coding – VTC), JPEG standard sa primenom od interneta do digitalne fotografije, JPEG standard za kodovanje mirnih slika bez gubitaka (eng. JPEG standard for image lossless coding – JPEG-LS) standard za kodovanje mirnih slika bez gubitaka, kao i preporuku za kodovanje mirnih slika koja se odnosi na pokretne mrežne grafike (eng. portable network graphics – PNG). O standardu JPEG 2000 biće posebno govora. MPEG-4 VTC je algoritam korišćen u MPEG-4 standardu kako bi se komprimovala informacija o teksturi u foto-realističnim 3D modelima. Pošto je tekstura u 3D modelima slična kao i kod mirne slike, ovaj algoritam može se takođe primeniti za kompresiju mirnih slika. Zasniva se na diskretnoj wavelet transformaciji (eng. discrete wavelet transform – DWT), skalarnoj kvantizaciji i aritmetičkom kodovanju. MPEG-4 VTC podržava SNR skalabilnosti kroz primenu različitih strategija kvantizacije: jednostruka kvantizacija (eng. single quantization – SQ), multipl kvantizacija (eng. multiple quantization – MQ) i dvostruka kvantizacija (eng. bi-level quantization – BQ). SQ ne obezbeđuje SNR skalabilnost. MQ obezbeđuje ograničenu SNR skalabilnost dok BQ pruža opštu SNR skalabilnost. Rezoluciona skalabilnost je podržana primenom skeniranja opseg po opseg (eng. band by band – BB). MPEG-4 VTC takođe podržava kodovanje objekata proizvoljnog oblika pomoću DWT adaptivnog oblika i nekoliko objekata može se kodovati posebno, sa mogućnošću postizanja različitog kvaliteta. Zatim je na strani dekodera izvršeno spajanje kao bi se dobila konačna dekodovana slika. JPEG je dobro poznati ISO/ITU-T standard stvoren osamdesetih godina prošlog veka. Postoji nekoliko oblika modela JPEG standarda: osnovni (eng. base-line), bez gubitaka, progresivni i hijerarhijski. “Base-line“ je najpopularniji i podržava samo kodovanje sa gubicima. Zasniva se na diskretnoj kosinusnoj transformaciji DCT [7.46], pri čemu se koristi blok tipa 8 × 8, cik-cak skeniranje, HVS težinska uniformna skalarna kvantizacija i Huffman-ovo kodovanje [7.47]. Progresivni i hijerarhijski modovi se sa gubicima. Oni se razlikuju samo po načinu na koji su DCT koeficijenti kodovani ili izračunavani, respektivno, kada se uporede sa “base-line“ modom. Oni omogućavaju rekonstrukciju nižeg kvaliteta ili verziju sa nižom rezolucijom i to parcijalnim dekodovanjem komprimovanog bitskog toka.

96

Page 107: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

JPEG-LS je ISO/ITU-T standard za kodovanje mirnih slika bez gubitaka. Zasniva se na adaptivnoj predikciji i modelovanju teksta. Uz to, ovaj standard ocrtava ravne oblasti da bi ih zatim kodovao. Fiksiranjem maksimalne greške odbiraka postiže se kompresija skoro bez gubitaka. Algoritam je namenjen za slučaj da se radi o maloj kompleksnosti uz veliki odnos kompresije. Međutim, nije obezbeđena podrška za skalabilnost i otpornost na greške. Pokretna mrežna grafika PNG je preporuka WWW Konzorcijuma (eng. World Wide Web Consortium – W3C) za kodovanje mirnih slika. Zasnovana je na predikciji i entropijskom kodovanju. PNG pruža kompresiju bez gubitaka i podržava sivu skalu, osnovnu boju, opcionu alfa ravan, preplitanje na slici.

7.7 Standard JPEG 2000 Standard JPEG 2000 pruža niz karakteristika koje su od vitalne važnosti za mnoge primene koje omogućavaju nove tehnologije. Jedna od najvažnijih karakteristika je da se definišu regioni od interesa (eng. region of interest – ROI) na jednoj slici. Od ne manje važnosti su svakako još i prostorna i SNR skalabilnost, otpornost na greške i mogućnost zaštite intelektualnih prava [7.48]. Što se tiče kodovanja ROI, to podrazumeva da se neki regioni od interesa na slici koduju tako što se postiže bolji kvalitet u poređenju sa ostatkom slike (pozadina). ROI metod na bazi skaliranja deli koeficijente tako da su biti koji pripadaju ROI oblasti postavljeni u više bitske ravni. U procesu kodovanja, ovi biti su smešteni u bitski tok pre delova slike koji ne pripadaju ROI. Otuda će ROI biti dekodovan ili otkriven pre ostatka slike. Bez obzira na skaliranje, dekodovanje toka bita daje kao rezultat rekonstrukciju celokupne slike sa što je moguće većom dostupnom vernošću. Ako je tok bita prekinut, ili je pak proces kodovanja završen pre nego što je celokupna slika u potpunosti kodovana, ROI će imati veću vernost nego ostatak slike [7.49]. ROI prikaz definisan u standardu JPEG 2000, Deo I, omogućava ROI kodovanje u regionima proizvoljnog oblika bez potrebe za dodatnom informacijom o obliku i dekodovanju oblika.

Skalabilno kodovanje mirnih slika pruža mogućnost da se sprovede kodovanje i to simultano kada se radi o više od jedne rezolucije i/ili je u pitanju različit kvalitet slike. Znači, radi se o generisanju takvog kodovanog bitskog toka da se dobije slika sa više od jedne rezolucije i/ili mogućnosti uz različitu skalu kvaliteta. Arhitektura JPEG 2000 podržava skalabilnost jer se u mnogim primenama traži da slike budu simultano dostupne za dekodovanje uprkos različitim rezolucijama i/ili da su različitog kvaliteta. Ako je tok bita skalabilan, koegzistiraju dekoderi različite složenosti i to od najmanje kompleksnih do najkompleksnijih. Najvažniji tipovi skalabilnosti su SNR skalabilnost i prostorna skalabilnost. SNR skalabilnost se primenjuje kod onih sistema gde je potrebno najmanje dva nivoa kvaliteta slike za istu prostornu rezoluciju kod određenog nivoa slike. Niži nivo pruža osnovni kvalitet, dok viši nivo generiše viši kvalitet reprodukcije ulazne slike. Prostorna skalabilnost obuhvata generisanje najmanje dva nivoa prostorne rezolucije i to iz jedinstvenog izvora s tim da je niži nivo kodovan tako da obezbedi osnovnu prostornu rezoluciju. Viši nivo koristi prostorno interpolirani niži nivo i na taj način prenosi se ulazna slika sa punom prostornom rezolucijom. Oba tipa skalabilnosti su vrlo važna za primene koje se odnose na internet i pristup bazi podataka, kao i za skaliranje širine propusnog opsega. SNR i prostorne skalabilnosti ogledaju se u njihovoj sposobnosti da omoguće otpornost na pojam grešaka nastalih u toku prenosa. Naime, najvažniji podaci iz nižeg

97

Page 108: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

sloja mogu biti poslati kanalom sa boljom performansom greške. Manje kritičan viši sloj šalje podatke kanalom sa smanjenom performanskom greške. Da bi se poboljšao prenos komprimovanih slika, u ovaj standard su uključeni sinteza bita otpornog na greške i odgovarajući alati. Kada se radi o otpornosti na greške, odgovarajući alati koriste deobu podataka kao i resinhronizaciju, detekciju i snimanje greške uz QoS na bazi prioriteta. Mnoge primene zahtevaju isporuku podataka o slici kroz različite tipove komunikacionih kanala. Tipični bežični komunikacioni kanali orijentisani su ka slučajnim i sporadičnim bitskim greškama. I internet komunikacije su slične nastojanju gubitka usled nagomilavanja saobraćaja/saobraćajnog preopterećenja. Što se tiče mogućnosti zaštite intelektualne svojine, standardom je definisan opcioni fajl format za JPEG 2000 (eng. optional file format for JPEG 2000 – JP2) kod komprimovanja podataka o slici. Format služi za mirnu sliku i meta podatke, a ima i mehanizam za naznaku tonske skale i boja na slici. To je mehanizam pomoću koga čitaoci mogu da prepoznaju u fajlu postojanje informacije o zaštiti prava intelektualne svojine (eng. intelectual property rights – IPRS). Takođe, to je mehanizam pomoću koga metapodaci mogu biti uključeni u fajl. Blok-šema kodera i dekodera za JPEG 2000 data je na Slici 7.7.1. Najpre je primenjena diskretna tranformacija na izvorne podatke o slici. Transformacioni koeficijenti su potom kvantovani i entropijski kodovani pre formiranja izlaznog toka bita. Zavisno od wavelet transformacije i primenjene kvantizacije, JPEG 2000 može biti sa gubicima i bez gubitaka. Na strani dekodera obavljaju se procesi entropijskog dekodovanja, dekvantizacije i inverzne transformacije kako bi se dobili rekonstruisani podaci o slici.

Slika 7.7.1—Blok-šema za JPEG 2000 arhitekturu kodera i dekodera

7.8 MPEG-7 standard Sa dostupnošću standarda MPEG-1, MPEG-2, MPEG-4 i drugih digitalnih kodnih standarda bilo je lako pribaviti i raspodeliti audio-vizuelni sadržaj. Međutim, mnoštvo digitalnog sadržaja predstavljalo je ogroman izazov za upravljanje tim sadržajem. Što je više sadržaja, postaje teže da se njime upravlja, da se on pretražuje i filtrira kako bi se pronašlo ono što nam stvarno treba. Sa druge strane, sadržaj ima vrednost ukoliko može biti otkriven brzo i efikasno. Pošto su načinjeni važni koraci na putu daljeg razvoja digitalnog audio-vizuelnog sadržaja, MPEG je prepoznao da je potrebno usmeriti problem ka upravljanju audio-vizuelnim sadržajem.

98

Page 109: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

1996 godine MPEG je pokrenuo MPEG-7 projekat pod nazivom “Opis interfejsa za multimedijalni sadržaj“ [7.50] sa ciljem da se specifira standard za opis različitih tipova audio-vizuelnih informacija kao što su osnovni delovi, skladištenje informacija, bez obzira na njihov format, način predstavljanja ili medijum. Poput drugih MPEG standarda, MPEG-7 se susreće sa nizom zahteva od prethodnih MPEG standarda, audio-vizuelna predstava ovde nema za cilj da komprimuje i reprodukuje podatke, već se bavi tzv. metapodacima (podaci o podacima). MPEG-7 deskriptori obezbeđuju rešenje za metapodatke kod velikog broja primena. Oni su nezavisni od medijuma i formata na bazi objekata i sa mogućnošću proširenja. Rade na različitim nivoima i to počev od opisa na niskom nivou automatskih i često statističkih karakteristika pa sve do predstavljanja istih na visokim nivoima gde se prenose semantička značenja. Sledeći princip da MPEG standardi moraju specificirati samo potreban minimum, MPEG-7 specificira format za deskripciju i njegovo dekodovanje. Na taj način ostavljeno je mnogo slobode za istraživače u oblasti aplikacija. MPEG-7 specificira dva osnovna tipa alata: deskriptori (eng. descriptor – D) i šeme za deskripciju (eng. descriptor scheme – DS). Deskriptor je predstavljanje karakteristika koje definišu sintaksu i semantiku. Kao primer može poslužiti vremenski kod za predstavljanje trajanja procesa ili momenti boja i histogrami za predstavljanje boje. Sa druge strane šema za deskripciju određuje strukturu i semantike relacija između komponenti. To mogu biti određeni deskriptori i šeme za deskripciju. Jednostavan primer je opis filma, struktuiranog kao scene i pucnjevi uključujući tekstualne deskriptore na scenskom nivou kao i aspekte pomeranja uz deskriptor audio amplitude na nivou pucnja. Deskripcije MPEG-7 mogu se predstaviti na dva načina: tekstualni tipovi koji koriste opis definicije jezika (eng. desciption definition language – DDL) i binarne tokove koji koriste binarni format za metapodatke (eng. binary format for metadata – BiM) MPEG-7. To je u osnovi DDL alat za kompresiju.

MPEG-7 specifcira primenjenu tehnologiju kroz 11 Delova:

a) Deo 1: Sistemi Specificira alate za:

1) Transportovanje i memorisanje MPEG-7 deskripcije na efikasan način koristeći BiM format za binarno predstavljanje;

2) Deo 2: Opis jezika po definiciji DDL Specificira jezik kod kreiranja novih šema za deskripciju kao i za proširenje i modifikaciju postojećih. DDL je baziran na označenom jeziku za proširenje (eng. eXtensible markup language – XML) koji je deo W3C. Neka proširenja za XML su razvijena da bi se ispunili DDL zahtevi.

b) Deo 3: Vizuelni

Određuje alate za deskripciju osnovne strukture i deskriptore ili deskripcione šeme za opis vizuelnih karakteristika i za lokalizaciju opisanih objekata na slici ili video sekvenci. MPEG-7 vizuelni deskriptor pokriva pet osnovnih vizuelnih karakteristika koji uključuju boju, teksturu, oblik, pokret i lokalizaciju (deskriptor prepoznavanja lica je takođe definisan).

c) Deo 4: Audio

99

Page 110: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Specificira alate za audio deskripciju koji su organizovani kao melodija, tišina, govorni sadržaj i zvučni efekti.

d) Deo 5: Šeme za multimedijalnu deskripciju (eng. multimedia description schemes –

MDS) Specificira deskripcione alate koji se bave opštim i multimedijalnim entitetima. Opšti entiteti su oni koji se mogu primeniti kod audio, vizuelnih i tekstualnih deskripcija pa se mogu tretirati kao opšti u svim medijima. Alati za multimedijalnu deskripciju mogu se grupisati u šest različitih klasa prema svojoj funkcionalnosti kao što je to prikazano na Slici 7.8.1. Prva klasa sadrži deskripciju sadržaja: strukturne i semantičke aspekte. Druga klasa sadrži upravljanjem sadržajem: medije, korišćenje, kreaciju i produkciju. Treću čini organizacija sadržaja: kolekcija i modeli. Četvrta klasa bavi se navigacijom i pristupom: rezimea, varijacije i gledišta. Sledi klasa koja se odnosi na korisnike: davanje prvenstva korisnicima i poreklo primene. Najzad šesta klasa bavi se bazičnim elementima: tipovima podataka i strukturama, šemama različitih alata, linkovima i lokalizacijom medija kao i osnovnim deskripcionim šemama DS.

Slika 7.8.1—Pregled deskriptivnih alata kod multimedijalnih deskriptivnih šema e) Deo 6: Referentni softver

Sadrži softver za implementaciju alata specificiranih u Delovima 1–5. Kao i kod MPEG-4 standarda, ovaj softver koristi se za primene koje su prilagođene sa MPEG-7 standardom.

f) Deo 7: Prilagođeno testiranje Specificira procedure koje obezbeđuju da se proveri da li deskripcioni tokovi odgovaraju specifikacijama u Delovima 1–5.

100

Page 111: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

g) Deo 8: Ekstrakcija i primena MPEG-7 deskripcije Obezbeđuje korisne informacije o ekstrakciji i upotrebi deskripcije.

h) Deo 9: Profili i nivoi

Specificira deskripciju profila i nivoa. Deskripcioni nivo u opštem slučaju opisuje podniz svih deskripcija i alata opisanih u MPEG-7. Deskripcija alata u deskripcionom profilu podržava niz funkcionalnosti za izvesnu klasu primena; nivo dispersije profila definiše dalja ograničenja u pogledu usklađenosti deskripcija sa ograničenjem koje postavlja maksimalna dozvoljena kompleksnost.

i) Deo 10: Definicija šeme

Specificira definiciju šeme kroz Delove MPEG-7. Prikuplja deskripciju alata specificiranih u MPEG-7 i specificira opis sintakse u šemi primenom opisa jezika po definiciji DDL.

j) Deo 11: Profil šema

Obuhvata šeme za različite profile. MPEG-7 je obiman, moćan i u suštini kompletan standard. On se odnosi na različite

ciljeve u poređenju sa prethodnim MPEG standardima gde je potreba za interoperabilnošću manja.

7.9 MPEG-21 Standard Početak rada na MPEG-21 standardu 1999 godine obeležen je pojavom da je, uprkos postojanju MPEG-1, MPEG-2, MPEG-4 i MPEG-7 standarda potpuna interoperabilnost u multimedijalnoj raspodeli i potrošnji, iako dobrodošla, bila još uvek daleko od krajnjeg cilja. Sa jedne strane u pitanju je bilo nepostojanje izgrađene infrastrukture za dostavljanje i potrošnju multimedijalnog sadržaja, a sa druge strane nije se moglo jasno sagledati kako opisati elemente već spremne za eksploataciju i one u razvoju i kako ih povezati radi dobijanja multimedijalne infrastrukture [7.51], [7.52]. Na osnovu diskusije koje su pratile MPEG Forum, ciljevi u ranom stadijumu razvoja MPEG-21 Standarda bili su [7.53]:

• Da se shvati kako različite dostupne komponente mogu biti uzajamno fitovane, • Da se diskutuje o tome koji su to potrebni standardi ukoliko za to postoji prostor u

odgovarajućoj infrastrukturi, • Kada se zadovolje prethodne dve tačke da se sprovede integracija različitih standarda.

Da bi se ostvarila ideja o jednom interoperabilnom okruženju, MPEG sarađuje sa drugim telima koji takođe donose standarde. Kao rezultat te saradnje pojavila se lista od sedam delova–elemenata kao i prvo izdanje jednog finalnog dokumenta nazvanog Tehnicki izvestaj (eng. Tehnical report – TR) [7.54]. Ovih sedam delova formiraju osnovni koncept MPEG-21 standarda. U centru pažnje ovde se nalaze korisnik i Digitalni deo (eng. Digital item – DI). Korisnik je bilo koji entitet koji koristi Digitalni deo. Prema Tehničkom izveštaju, DI predstavlja

101

Page 112: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

struktuirani digitalni obejkat sa standardnom prezentacijom, identifikacijom i meta podacima u okviru MPEG-21 standarda. Ovaj entitet je, takođe, osnovna jedinica za raspodelu i transakciju.

Sedam delova u TR predstavljaju grupisane elemente arhitekture standarda MPEG-21. Granice između elemenata nisu striktne, a kasniji tok standardizacije je pokazao da primenjene tehnologije mogu obuhvatiti više elemenata. Ovi elementi su identifikovani sledećim redom:

• Deklaracija o digitalnim delovima (eng. digital item declaration – DID): obezbeđuje uniformno i fleksibilno uopštavanje i interoperabilnu šemu za naznaku digitalnih delova;

• Identifikacija i opis digitalnih delova predstavlja sposobnost da opiše bilo koji entitet bez obzira na njegovu prirodu ili tip;

• Upravljanje sadržajem i primena podrazumeva interfejse i protokole koji omogućavaju kreiranje, rukovođenje, istraživanje i pristup, memorisanje, predaju i korišćenje sadržaja kroz distribuciju i potrošnju vrednosnog lanca;

• Upravljanje intelektualnom svojinom i zaštita odnose se na omogućavanje prava na intelektualnu svojinu sadržaja kojom se upravlja postojano i pouzdano, dok se zaštita sprovodi kroz široki opseg u mreži i na uređajima;

• Terminali i mreže obuhvataju sposobnost da se obezbedi interoperabilnost i transportni pristup sadržaju kroz mreže i terminale;

• Predstavljanje sadržaja bavi se predstavljanjem resursa uređaja; • Izveštavanje o događaju bavi se metrikama i interfejsima koji omogućavaju korisnicima

da upravljaju događajima u okruženju.

Sedam delova – elemenata vezanih za arhitekturu koji olakšavaju transakcije između korisnika kod standarda MPEG-21 dato je na Slici 7.9.1. U daljem delu izlaganja rezimiraćemo funkciju svakog navedenog alata.

a) Deklaracija o digitalnom delu To je osnovni element u MPEG-21 standardu. Koncept digitalnog dela čini kompletan skup tehnologija koje omogućavaju zaštitu standarda, adaptaciju i grupisanje formiranih digitalnih delova.

b) Identifikacija i opis digitalnog dela

Ključni aspekt MPEG-21 standarda je potreba da se svi sadržaji mogu identifikovati i locirati. Cilj je da svi digitalni sadržaji i resursi medija u okviru MPEG-21 standarda prenose jedinstvene identifikatore. Broj zahteva za takvim identifikatorima i lokatorima je jasno izražen pa su uvedene mnoge scene za identifikaciju specifičnih medija [7.55]–[7.57]. Takođe su prepoznate neke inicijative za identifikaciju u unakrsnim domenima kao i u industrijskim sektorima. Stoga je zadatak MPEG-21 standarda bio da kreira zajednički prostor u kome korisnici mogu da objedine identifikatore na jedan interoperabilan način.

c) Upravljanjem sadržajem i primena U ranoj fazi razvoja MPEG-21 standarda, utvrđeno je da bi ga obavezno trebalo uvesti u oblasti mreže, servera i upravljanja multimedijalnim sadržajem od strane klijenta. Takođe je uočena neophodnost ovog standarda kod personalizacije sadržaja kao i kod mogućnosti

102

Page 113: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

agenata da konzumiraju i filtriraju sadržaj za korisnike. Zato je ovaj deo standarda uvršćen u oblast koja se odnosi na personalizaciju korisnika.

Slika 7.9.1—Sedam delova–elemenata kod standarda MPEG-21

d) Upravljanje intelektualnom svojinom i zaštita Upravljanje digitalnim pravima (eng. digital rights managament – DRM) je oblast velikog interesovanja još od sredine devedesetih godina prošlog veka. MPEG je utvrdio da uključivanje DRM mehanizma u multimedijalni okvir može biti od vitalne važnosti, kao i da bi se prilaz sastojao u interoperabilnosti i prilagodljivosti. Ova oblast je poznata u MPEG standardizaciji kao IPMP. U standardu MPEG-21 ovaj element uključuje koncepcije jezičkih prava kao i zaštitne mehanizme za sadržaj. Nešto kasnije MPEG-21 standard usvaja novi prikaz koji omogućava višestruko upravljanje digitalnim pravima kroz tzv. ’’utikačke zaštitne mehanizme u standardu“. Dalje, MPEG je razvio ’’zaštićenu verziju“ digitalnog dela koja može da koristi prikaz upravljanja digitalnim pravima na bazi utikačke jedinice [7.58].

e) Terminali i mreže

Cilj okvira ovog standarda bio je da kreira transparentni pristup za napredni multimedijalni sadržaj (onakav kakav je opisan u objektima sa digitalnim delovima). Zbog toga je shvatanje efektivne zaštite između korisnika i terminala sa jedne i mreže sa

103

Page 114: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

druge strane bilo od vitalne važnosti. Povezanost elemenata, širina propusnog opsega i kvalitet servisa predstavljaju važne komponente za adaptaciju okvira standarda [7.59].

f) Predstavljanje sadržaja

TR za standard MPEG-21 pokazao je da sadržaj može biti:

1) Predstavljen MPEG standardima, 2) Upotrebljen od strane MPEG ali da nije pokriven MPEG standardima, na primer

puni tekst, hipertekst sa označenim jezikom (eng. hyper text markup language – HTML) i standardni generalizovani jezik za markiranje (eng. standard generalized markup language – SGML),

3) Prikazan pomoću prethodna dva stava, 4) Predstavljen preko standarda za sezonske medije.

U TR-u se takođe kaže da okvir standarda treba da podrži predstavljanje sadržaja. Tako je potrebno da MPEG-21 standard podrži sinhronizovani i multipleksirani medijum.

g) Izveštavanje o događaju U toku rane faze izrade ovog standarda ukazala se potreba za interakcijama sa digitalnim delovima. Naime, radilo se o tome da se standardizuju metrike i interfejsi za interakcije koje se očekuju kod digitalnih delova. Dalje transport podataka pridružen raznim događajima-saopštenjima treba standardizovati.

Ovih sedam delova - elemenata mogu se preklapati. U svakom elementu identifikovane su oblasti standardizacije, generisani su zahtevi, a odgovarajuće tehnologije odabrane su na osnovu tih zahteva.

7.10 ITU-T proces standardizacije kod audio-vizuelnih komunikacionih sistema

Kod pripreme standarda za globalnu informacionu infrastrukturu (eng. global information infrastructure – GII) uključen je ITU. Sprovedena je konvergencija tehnologija i industrije i obezbeđene su različite multimedijalne aplikacije. Globalna povezanost i interoperabilnost su neki od ključnih zahteva od strane GII što je zahtevalo uvođenje novih standarda. Prihvaćeno je da najvažniji globalni standardi moraju odgovarati tržišnim zahtevima, da ne smeju pogoršavati ili ograničavati kreativnost proizvođača opreme, provajdera informacija kao i servisnih provajdera. Od ne manje važnosti bilo je svakako da se obezbedi realna i stabilna baza za informacionu infrastrukturu. Uvođenjem ovakvih standarda postignuta je interoperabilnost sistema uz mogućnost vođenja računa o tržišnim zahtevima, troškovima i kvalitetu servisa. To, pored ostalog, pruža mogućnost povezivanja industrijski manje razvijenih sa visoko razvijenim industrijskim zemljama [7.60]. Što se tiče multimedijalnih komunikacija, postoje dve glavne organizacije u oblasti standardizacije: ITU i ISO. Tako na primer, neki standardi za video kodovanje definisani od strane tih organizacija dati su u Tabeli 7.10.1.

104

Page 115: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Navedeni standardi se razlikuju u pogledu bitskog protoka. Svi ovi standardi se mogu primeniti u širokom opsegu bitskih tokova. U zavisnosti od algoritama kodovanja, oni prate slične standardizacione okvire.

Tabela 7.10.1–Neki standardi za video kodovanje

Organizacije Video kodni

standard Tipičan opseg Tipične primene

standarda bitskog protoka ITU-T H.261 p × 64 kbit/s; ISDN VIDEOFON

p = 1, 2…, 30 ISO ISO/IEC 11172-2

MPEG-1 VIDEO 1.2 Mbit/s CD – ROM

ISO ISO/IEC 13818-2 MPEG-2 VIDEO

od 4 Mbit/s do 80 Mbit/s SDTV, HDTV

ITU-T H.263 64 kbit/s ili niže PSTN VIDEOFON ISO CD 14496-2

MPEG-4 VIDEO od 24 kbit/s do 1024 kbit/s Interaktivni

Audio-Video ITU-T H.263 Verzija 2 Manje od 64 kbit/s PSTN VIDEOFON ITU-T H.26L Manje od 64 kbit/s Mreža na bazi paketskog videa

Standard H.320

Za sve ITU standarde obavezna je interoperabilnost sa standardom H.320. Međutim, ova interoperabilnost je postignuta kroz mrežni prolaz koji u nekim slučajevima mora da predstavlja prolaze između različitih protokola, različitih standarda za kompresiju i različitih šema za multipleksiranje. Varijacije u signalizaciji i multipleksiranju za različite standarde nastaju usled različitih karakteristika mreža na koji se svaki odgovarajući standard primenjuje. Jedan aspekt standarda H.320 je centralizovan prikaz održavanja konferencije između više mesta. Standard H.320 definiše centralni konferencijski server nazvan kontrolna jedinica za više tačaka (eng. multipoint control unit – MCU). MCU obezbeđuje poziv za više tačke [7.61]. Svaki učesnik uspostavlja poziv direktno sa MCU. Ova kontrolna jedinica tada kontroliše tok konferencije. Dakle, postoji veza od tačke do tačke kao kod digitalne mreže integrisanih servisa (eng. integrated services digital network – ISDN). Radi se o mreži integrisanih servisa koja obezbeđuje digitalnu vezu na relaciji korisnik – mreža. To je svetski telekomunikacioni servis koji koristi tehnologiju digitalnog prenosa i komutacije za podršku komunikacija glasom i digitalnim podacima, protocima koji su umnožak 64 kbit/s. Pri tome se koristi i komutacija kanala (kola) i komutacija paketa. ISDN je široko rasprostranjena mreža za interaktivne multimedijalne komunikacije. Za brojne poslovne korisnike H.320 familija ITU-T preporuka primenjuje se kod video-telefonskih i video-konferencijskih sistema. Preporuke H.310 i H.321 ITU-T Studijska grupa (eng. Study Group – SG) SG 15 razvila je sledeće dve preporuke za audio-vizuelne komunikacione sisteme u ATM okruženjima:

• H.321–Prilagođenje standarda H.320 za vizuelne telefonske terminale na širokopojasno

105

Page 116: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

ISDN (eng. broadband ISDN – BISDN) okruženje [7.62], • H.310–Širokopojasni audio-vizuelni komunikacioni sistem i terminali [7.63].

Preporuka H.321 specificira prilagođenje H.320 za vizuelne terminale na BISDN

okruženje. Na taj način zadovoljen je zahtev da ATM terminali mogu međusobno da rade sa onim terminalima koji su priključeni na uskopojasnu digitalnu mrežu integrisanih servisa (eng. Narrow-band ISDN – NISDN). Preporuka H.310 obuhvata uzajamni rad H.320/H.321 pri čemu se uzima u obzir preimućstvo koje obezbeđuje ATM postupak u smislu postizanja većeg kvaliteta kod audio-vizuelnih komunikacionih sistema. Iako NISDN omogućava samo mali broj transfer protoka, kvantizacja multiplima od 64 kbit/s, 394 kbit/s, 1536 kbit/s i 1920 kbit/s omogućava za BISDN široki opseg transfer protoka. To pruža izvesno preimućstvo koje se ogleda u fleksibilnosti, ali isto tako stvara potencijalni problem u pogledu interoperebilnosti. Naime, može se dogoditi da jedan terminal podržava jednu grupu transfer protoka, a da drugi terminal podržava drugu različitu grupu transfer protoka, pri čemu nemaju zajedničkih vrednosti. Preporukom H.310 rešava se ovaj problem na taj način što se najpre transfer protoci tako definišu da protoci budu multipl od 64 kbit/s, a zatim se koriste dva protoka 96 × 64 kbit/s = 6114 kbit/s i 144 × 64 kbit/s = 9216 kbit/s. Drugi mogući transfer protoci mogu se ugovoriti kroz primenu H.245 procedure [7.64]. ITU-T H.323 standard Primarna razmatranja u razvoju H.323 bila su sledeća:

• Interopereabilnost, naročito sa NISDN i H.320, • Kontrola pristupa LAN mrežama da bi se izbeglo nagomilavanje poziva, • Modeli poziva za više tačaka, • Skalabilnost počev od mreža malih do srednjih veličina.

H.323 terminali mogu se primeniti za konfiguracije sa više tačaka i mogu da međusobno

rade sa H.310 terminalima iz mreže tipa BISDN, sa H.320 terminalima iz mreže tipa NISDN, sa H.321 terminalima iz BISDN mreža, kao i sa H.322 terminalima koji garantuju kvalitet servisa u lokalnim računarskim mrežama (LAN local area network). Podsetimo se da LAN obezbeđuje povezivanje čitavog niza različitih uređaja za komuniciranje (radne stanice, periferijski uređaji, terminali, drugi uređaji ) unutar male teritorije. Ovde se radi o velikom protoku i maloj verovatnoći greške u prenosu podataka. Takođe H.323 terminali rade sa H.324 terminalima iz opšte komutacione telefonske mreže (eng. general switched telephone network – GSTN), kao i sa bežičnim mrežama i V.70 terminalima u mreži tipa GSTN [7.65].

Zona H.323 sistema data je na Slici 7.10.1. H.323 ne uključuje mrežu tipa LAN. U zoni je obezbeđen nadzor prolaza radi pristupa kontroli H.323 terminala u okviru zone. Kriterijumi koji koriste nadzor prolaza da bi se omogućio jedan takav pristup nisu standardizovani. Uz to, nadzor prolaza ograničava širinu propusnog opsega koji koristi terminal i može da kontroliše upotrebljeni model poziva koji takođe utiče na korišćenje širine propusnog opsega. Samo elementi potrebni za interakciju sa mrežom za komutaciju kanala (eng. switched circuit network

106

Page 117: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

– SCN) su vezani za H.323. Kombinacija mrežnog prolaza kod H.323, H.323 terminala i mreže tipa LAN pojavljuje se u SCN mreži kao H.320, H.310, ili H.324 terminal.

Slika 7.10.1—Zona H.323 sistema

H.323 opisuje ukupan sistem i komponente, uključujući terminale, mrežne prolaze (eng. gate way – GW), nadzore prolaza (eng. gate keeper – GK), kontrolore procesa za više tačaka i kontrolne jedinice za više tačaka MCUs. Zonom koju čini kolekcija svih terminala, mrežnih prolaza, i kontrolnih jedinica za više tačaka upravlja jedinstveni nadzor prolaza. Zona obuhvata najmanje jedan terminal i može a i ne mora, da obuhvati mrežne prolaze ili kontrolnu jedinicu za više tačaka. LAN segmenti koji su povezani primenom rutera ili drugih uređaja mogu biti u istoj zoni. H.324 standard Ukoliko se telefonske mreže koriste za multimedijalne konferencije, najveći broj komercijalnih proizvoda bazira se na H.324 protokolu da bi se obezbedila interoperabilnost. ITU-T preporuka H.324 pod nazivom ’’Terminali za multimedijalne komunikacije niskog bitskog protoka“ [7.66] daje pregled multimedijalnih terminala u mreži tipa PSTN i referencira sve druge ITU-T preporuke potrebne da se izradi jedan takav terminal na standardan način. Sistemi na bazi H.324 ugovoraju vrednosti parametara kod protokola kao što su dimenzije paketa i omogućavaju kašnjenje prilikom prenosa u oba smera. Takve vrednosti i naročito potrebne vrednosti kašnjenja u oba smera, značajno utiču na načine za predstavljanje otpornosti na grešku. Da bi se minimiziralo kašnjenje paketa, obično se ugovaraju paketi malih veličina. Karakterističan koristan sadržaj za video pakete u sistemu H.324 je 128 bajta. Ta vrednost se često koristi kod različitih interoperabilnih testova za komercijalne H.324 sisteme [7.67]. Na žalost, mnogi H.324 sistemi imaju značajno kašnjenje sa kraja na kraj najviše zbog integracije H.324 mehanizma protokola sa okruženjem operativnog sistema personalnog računara (eng. personal computer – PC) koje nije optimizirano za primene u realnom vremenu. Tipično kašnjenje sa kraja na kraj u takvom sistemu je iznad 0.5 s. Odgovarajući modemi omogućavaju da se optimizira veza između vrednosti grešaka i bitskog protoka.

107

Page 118: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

7.10.1 Standardi za video kodovanje Postoje dva prilaza za razumevanje standarda za video kodovanje. Jedan prilaz je da se fokusiramo na sintaksu niza bita i da se pokuša shvatiti šta predstavlja svaki sloj sintakse i šta svaki bit u nizu bita označava. Ovaj prilaz je veoma značajan za proizvođača opreme koji treba da sagleda opremu koja je prilagođena standardima. Drugi prilaz je da se koncentrišemo na algoritme kodovanja koji se mogu upotrebiti za generisanje niza bita prilagođenih standardu, a zatim da se shvati da svaka komponenta ne specifira bilo koji od kodnih algoritama. Ovaj prilaz obezbeđuje bolje razumevanje video kodnih tehnika u celini, a ne samo standardnu sintaksu niza bita. H.261 standard Ovaj standard bavi se slučajevima u kojima postoji mali bitski protok i malo kodno kašnjenje. Ovde se radi o bitskim protocima od oko p × 64 kbit/s, gde p varira od 1 do 30. Kodni algoritam korišćen u H.261 je u osnovi hibrid kompenzacije pokreta, da bi se uklonila vremenska suvišnost, i transformacionog kodovanja DCT kako bi se redukovala prostorna suvišnost. Takva koncepcija formirala je bazu za sve standarde koji se odnose na video kodovanje. H.261 standard je imao značajan uticaj na mnoge postojeće i ostale standarde za video kodovanje u fazi razvoja. Digitalni video sastoji se od niza slika ili kadrova koji se odigravaju izvesnom brzinom. Svaka slika sadrži tzv. elemente slike piksele. Za standard kod video kodovanja važno je znati dimenzije slike na koju se standard primenjuje i položaj piksela-tela. H.261 bavi se sa dva formata slike: zajednički srednji format (eng. common intermediate format – CIF) i četvrtni zajednički srednji format (eng. quarter CIF – QCIF). Kod mirnih slika prema standardu H.261 koristi se četiri puta veći format. Na primer ukoliko je video format CIF, odgovarajući video format je 4CIF. Standard H.261 se primenjuje za video telefoniju i video konferenciju. Ovde je izvorni materijal sastavljen od scena osoba koje govore, tzv. nizova glave i ramena osobe, pre nego opštih TV programa koji sadrže dosta promena u pokretu i na sceni. Kod H.261, svaki odmerak sadrži luminentnu komponentu Y i dve hrominentne komponente označene sa Cb i Cr. Posebno crna boja je predstavljena sa Y = 16, bela sa Y = 235, dok su Cb i Cr varirali između 16 i 240, pri čemu 128 predstavlja sivo. Kod standarda H.261 blok je definisan kao grupa od 8 × 8 pela. Jedan blok koji čine Cb peli i jedan blok sa Cr pelima odgovara vrednosti od četiri bloka Y pela. Kolekcija ovih šest blokova predstavlja makroblok (eng. macroblock – MB). Jedan makroblok sa redosledom blokova označenih od 1 do 6 dat je na Slici 7.10.2. MB se tretira kao jedna jedinica u procesu kodovanja.

Slika 7.10.2—Prikaz jednog makrobloka

108

Page 119: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Brojni makroblokovi grupisani zajedno predstavljaju grupu blokova (eng. group of blocks – GOB). Za H.261 GOB sadrži 33 makrobloka. Rezultujuće strukture za sliku u slučaju CIF formata, kao i u slučaju formata tipa QCIF prikazane su na Slici 7.10.3 [7.68].

Slika 7.10.3—GOB strukture u slučaju CIF i QCIF za standard H.261 Algoritam za kodovanje u standardu H.261 može se prikazati sa dve blok-šeme prikazane na Slici 7.10.4 i na Slici 7.10.5 [7.69]. Na strani kodera, ulazna slika je upoređena sa prethodno dekodovanim kadrom sa kompenzacijom pokreta. Diferencijalni signal je transformisan primenom DCT postupka, kvantovan, entropijski kodovan i prenesen.

Kompenzacija pokreta

DCT

Filter

video ulaz

Q

IDCT

+

+

Slika 7.10.4—Blok-šema video kodera u standardu H.261

+ IDCT

+

+

Kompenzacija pokreta

Filter

Slika 7.10.5—Blok-šema video dekodera u standardu H.261

Na strani dekodera, dekodovani DCT koeficijenti su inverzno DCT (eng. inverse DCT – IDCT) transformisani i zatim pridodati perthodno dekodovanoj slici sa kompenzacijom pokreta.

109

Page 120: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Pošto je predikcija tekućeg kadra sastavljena od blokova na različitim lokacijama u referentnom kadru, predikcija sama po sebi može da sadrži šum kodovanja i izobličenja zbog postojanja blokova, koja mogu da dovedu do povećanih grešaka usled predikcije. Da bi se smanjile te greške, prediktovani koder se propušta kroz niskopropusni filter pre nego što se upotrebi kao predikcija za tekući kadar. H.263 standard H.263 standard kombinuje osobine standarda H.261 zajedno sa MPEG i optimiziran je za vrlo niske bitske protoke. Što se tiče odnosa signal-šum SNR, H.263 može da obezbedi 3 dB do 4 dB poboljšanja u odnosu na H.261 pri bitskim protocima ispod 64 kbit/s. U stvari, H.263 daje veću kodnu efikasnost u poređenju sa H.261 pri svim bitskim protocima. Tako na primer, u poređenju sa MPEG-1, H.263 daje uštedu od 30 % u pogledu bitskog protoka. Osnovna struktura H.263 standarda je u suštini ista kao i kod H.261. Međutim, glavne razlike između ova dva standarda ogledaju se u sledećem:

• H.263 podržava više formata slika i koristi različitu strukturu za grupu blokova GOB, • H.263 koristi polu-pikselsku kompenzaciju pokreta, ali ne koristi filtriranje ili polu

pokretne sprege kao kod H.261, • H.263 koristi 3D VLC za kodovanje DCT koeficijenata, • Uz osnovni kodni algoritam, opcije u H.263 koje se mogu ugovoriti između kodera i

dekodera mogu da pruže bolje performanse, • H.263 standard obezbeđuje da se veličina koraka kvantizacije menja u svakom

makrobloku MB. Razlike između H.261 i H.263 ogleda se i u polupikselskoj predikciji u kompenzaciji

pokreta. Ova koncepcija se isto tako koristi i kod MPEG standarda. Vektori pokreta u H.261 mogu imati samo celobrojne vrednosti, dok H.263 omogućava da vektori pokreta budu sa polovinom od vrednosti piksela. Tako, na primer, moguće je imati vektore pokreta sa vrednostima između 4.5–2.5. Kada vektor pokreta ima necelobrojne vrednosti, koristi se bilinearna interpolacija da bi se pronašle odgovarajuće vrednosti tela za predikciju.

Kao i kod H.261, H.263 standard može se primeniti kod terminala u različitom mrežnom okruženju. Jedan primer za ovo je H.324 standard koji definiše audio-vizuelne terminale za tradicionalne javne komutirane telefonske mreže (eng. public switched telephone network – PSTN). U ovom slučaju se kod H.324 standarda koristi kao video kodek terminal na bazi H.263 standarda. ITU-T H.261/H.263 standardi za video kompresiju namenjeni su za kodovanje i dekodovanje u realnom vremenu u slučaju video-konferencijskog sistema preko konekcije sa konstatnim bitskim protokom. H.263+ (H.263 version 2) standard H.263+ (često nazvan H.263 verzija 2) sadrži oko 12 novih karakteristika koje ne postoje u standardu H.263. One uključuju nove načine kodovanja za poboljšanje efikasnosti kompresije,

110

Page 121: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

podržavanje skalabilnog bitskog protoka, nekoliko novih karakteristika koje podržavaju paketske mreže, pridodatu funkcionalnost i podršku različitim video formatima. Među novim karakteristikama H.263+, jedna od nekoliko koja tačno ističe neefikasnost opriginalne H.263 preporuke je modifikovani način kvantizacije. Ovaj način ima četiri ključna elementa [7.70]:

• Označavanje većih promena od makrobloka do makrobloka kod kvantizera kako bi se bolje sprovodila kontrola protoka;

• Sposobnost korišćenja finijeg hrominentnog kvantizera kako bi se bolje očuvala hrominentna vernost;

• Sposobnost da se podrži celokupni opseg kvantovanih vrednosti koeficijenata pre nego da se klipuju vrednosti veće od 128;

• Eksplicitno ograničenje prilikom predstavljanja kvantovanih transformacionih koeficijenata na one koji mogu sigurno nastati.

Najzad, H.263+ podržava širi opseg varijacija ulaznih video formata u poređenju sa

H.263. Jedna važna osobina H.263+ je korišćenje dodatnih informacija koje se mogu uključiti u tok bita da bi se istaklo kašnjenje ili da bi se pridružila informacija za spoljašnu primenu. Dodatna informacija prisutna je u bitskom protoku i kada dekoder nije u stanju da je prihvati ili da je jasno interpretira. Drugim rečima, ukoliko zahtev za obezbeđivanjem tražene sposobnosti nije dogovoren unapred, dekoder može jednostavno da odbaci bilo šta u dodatoj informaciji. Druga uloga korišćenja dodatne informacije sastoji se u tome da se specificira hroma ključ za predstavljanje transparentnih i semi transparentnih piksela [7.71]. Sledeća runda korišćenja H.263 standada dala je treću generaciju H.263 sintakse, koja se neformalno naziva H.263++. Identifikovane su četiri ključne tehničke oblasti za dalja istražiavanja: tip promenljive transformacije, adaptivno aritmetičko kodovanje, tabele za kodove promenljive dužine otporne na grešku, kao i filtriranje za oslobađanje od pravljenja prstenova oko slike. H.263++ standard Razvojni napor za H.263++ usmeren je ka standardizaciji treće verzije H.263 video kodeka za komunikacije u realnom vremenu i sa tim u vezi ka nekonvencionalnim servisima [7.72]. Ključne tehničke oblasti koje pokazuju poboljšanje u pogledu dobitka kod performanse su sledeće [7.73], [7.74]:

• Deoba podatka otpornih na greške, • Kompenzacija pokreta kod bloka dimenzije 4 × 4.

Deoba podatka otpornih na greške podrazumeva kreaciju podataka koji su podeljeni,

zatim i slojevitu zaštitu strukture kodovanih podataka. Tu je i duža resinhronizacija kodne reči radi poboljšanja detekcije i smanjenja verovatnoće pogrešne detekcije. U drugom slučaju koji se odnosi na konpenzaciju pokreta kod bloka dimenzija 4 × 4 obuhvaćeni su: memorije slike, alternacije kod optimizacije stepena oštećenja, alternacije za optimizaciju pokreta, novi tip filtera za deblokiranje, novi tip predikcije unutar oblasti slike,

111

Page 122: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

izvesne alternacije kod kodova promenljive dužine VLC kada se radi o transformacionim koeficijentima, vektori pokreta i oblik kodovanog bloka. H.26L standard U pozivu za predloge, standard H.26L trebalo je da posluži za vrlo male bitske brzine, za rad u realnom vremenu, malo kašnjenje pri kodovanju od kraja do kraja veze za različite izvore [7.75]. Omogućena je softverska implementacija, naglašena je robustnost na greške (naročito kod mobilnih mreža), a zastupljeni su i mehanizmi za kontrolu brzine rada. U odgovoru na poziv za predloge za standard H.26L procenjeni su kao korisni i uzeti u obzir sledeći tehnički predlozi [7.76]:

• Modifikovana metoda na bazi predikcije/transformacije, • Vektorska kvantizacija sa blok aproksimacijom koristeći kodnu knjigu ili kompenzaciju

pokreta iz prethodnog kadra, • Filtriranje u kolu povratne sprege radi smanjenja bloking efekta, ugaonih ocrtavanja i

prstenastog šuma, • Adaptivna skalarna kvantizacija koja koristi kodne knjige na nivou različitom od nule, • Video koder na bazi DCT uz korišćenje preuređivanja DCT koeficijenata, • Gruba segmentacija slična šemi koja koristi kompenzaciju pokreta, vektorsku

kvantizaciju i DCT, • Deoba podataka primenom algoritma s preuređivanjem podataka, • Video kodovanje koje koristi memoriju za više referentnih kadrova slično predikciji sa

kompenzacijom pokreta. Iz napred izloženog, proizašlo je da je primarni cilj za standard H.26L što jednostavnije

video kodovanje uz postojanje što efikasnije kompresije. Uz to, u govornom domenu uveden je u mrežu paketski video (video-telefonija), kao i negovorne aplikacije (memorisanje, difuzija). H.26L ima video kodni sloj VCL koji omogućava video prezentaciju sa velikom kompresijom, kao i umrežen sloj NAL za isporuku video sadržaja preko specijalne mreže. Sa H.26L VCL, postignuto je značajno poboljšanje u pogledu efikasnosti stepena oštećenja u poređenju sa drugim standardima. H.26L NAL je razvijen sa ciljem da se transportuje video kroz različite mreže kao što su to, na primer IP mreže i bežični sistemi treće generacije (eng. third generation – 3G). 7.10.2 Standardi za kodovanje govora ITU je standardizovao kodere za govor koji se primenjuju u multimedijalnim komunikacijama. ITU preporuke G.729 8 kbit/s konjugovana struktura-algebarski kod pobuđene linerane predikcije (eng. conjugate structure - algebraic code excited linear prediction – CS-ACELP) ima kašnjenje od 15 ms za kodek i pruža kvalitetan govor u mreži [7.77]. Namenjen je za primene u bežičnim komunikacijama, ali i u multimedijalnim komunikacijam. ITU preporuka G.723.1 za govorni koder od 6.3 kbit/s i 5.3 kbit/s za multimedijalne komunikacije bio je namenjen za videofone sa malim bitskim protokom. U primenama gde je malo kašnjenje važno,

112

Page 123: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

kašnjenje za G.723.1 može biti suviše veliko. Međutim, ukoliko je kašnjenje prihvatljivo, G.723.1 pruža alternativu za G.729 sa manjom kompleksnošću po cenu neznatnog pogoršanja kvaliteta. Veliki broj govornih kodera je standardizovan. Na primer, davno u periodu 1995–1996 pojavila su se tri međunarodna standarda (ITU G.729, G.729 A, i G.723.1) i tri regionalna standarda (koderi za evropske i severnoameričke mobilne sisteme). Kvalitet govora koji proizvodi govorni koder zavisi od bitskog protoka, kompleksnosti, kašnjenja i širine propusnog opsega. Otuda, prilikom analize govornih kodera važno je uzeti u obzir sve te parametre. Bitno je naglasiti da postoji stroga uzajamna povezanost između njih. Dodatni faktori koji utiču na izbor govornog kodera su uslovi dostupnosti i specificiranja radi specificiranja standarda. Najveći broj govornih kodera radi sa fiksnim bitskim protokom bez obzira na ulazne karakteristike signala. S obzirom da multimedijalni govorni koderi dele kanal sa drugim oblicima podataka, bolje je odabrati koder sa promenljivim protokom. Kod prikaza standarda za govorne kodere, vodi se računa o tome da se specificiraju izrazi za reference (eng. terms of reference – ToR) pri čemu se tu imaju u vidu: bitski protok, kašnjenje, kompleksnost i kvalitet. Za G.729 standard jedan od ToR zahteva bio je da bi govorni koder trebalo da radi sa 8 kbit/s. Ovaj protok bio je izabran delimično i zbog toga što je opseg prve generacije digitalnih celularnih standarda varirao od 6.7 kbit/s u Japanu, do 7.95 kbit/s u SAD, pa sve do 13 kbit/s u Evropi. Za G.723.1, ToR zahtevi bili su da bi govorni koder trebalo da radi sa protokom nižim od 9.6 bit/s. Za koder za digitalni simultani glas i podatke (eng. digital simultaneous voice and data – DSVD), ToR zahtevi za bitski protok izvedeni su na osnovu količine govornih podataka koje treba preneti modemom od 14.4 kbit/s. Kašnjenje predstavlja glavnu razliku između G.729 i G.723.1. ToR zahtev za kašnjenje za G.729, najpre za kodek u jednom pravcu bilo je 10 ms. Zatim je taj zahtev za kašnjenje sistema u jednom pravcu kod G.729 sveden na 35 ms. Glavna primena za G.723.1 je videofonija sa malim bitskim protokom koja se obavlja sa 5 kadrova/s ili mešto manje. Ovaj protok odgovara periodu video kodera od 200 ms. Kod konačne verzije G.723.1, kašnjenje sistema u jednom pravcu iznosi 97.5 ms. G.723.1 je manje kompleksan od G.729. On se karakteriše sa 14.6 miliona instrukcija u sekundi (eng. millions of instructions per second – MIPS) pri bitskom protoku od 5.3 kbit/s i sa 16 MIPS-a pri bitskom protoku 6.3 kbit/s. Pri tome se koristi 2200 reči iz memorije sa slučajnim pristupom (eng. radnom access memory – RAM). Zahtevi za upotrebom DSVD kodera bili su 10 MIPS-a, 2000 reči iz RAM memorije i 10 000 reči iz memorije sa očitavanjem (eng. read-only memory – ROM). Koderi govora predstavljeni na ovom mestu su slični. Čini se da su G.723.1 i G.729A (DVD verzija od G.729) malo manje robusni na greške nastale usled šuma u pozadini i na uslove rada u tandemu. Njihova karakteristika za čist govor i opšta robusnost je dovoljna da ih ITU preporuči za primenu kod simultanog glasa i podataka kao što je to slučaj kod multimedijalnih komunikacija sa malim bitskim protokom. 7.10.3 Standardi za multimedijalno multipleksiranje i sinhronizaciju

Osnovni strimovi (eng. elementary streem – ES) kao što su video podaci, signali za kontrolu sinhronizacije video kadra i indikacije od kojih svaki može biti standardizovan,

113

Page 124: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

multipleksirani su u paketski strim prema preporuci H.222.0. H.222.1/H.222.0 funkcije obuhvataju multipleksiranje obnavljanja vremenske baze, sinhronizaciju medija, otklanjanje džitera, upravljanje baferom, kontrolu bezbednosti i pristupa, podkanalnu signalizaciju. Preporuka H.222.1 određuje elemente i procedure za H.222.0 radi njihove primene u ATM okruženju a takođe specificira kodne tačke i procedure za ITU-T definisane osnovne strimove [7.78]. Podkanalna signalizacija je proces na osnovu koje podkanal za audio, video i druge osnovne strimove ESs je uspostavljen između predaje i prijema H.222.1 entiteta. ITU-T preporuka H.221

Ova preporuka nosi naziv ’’Struktura kadra za 64 kbit/s do 1920 kbit/s kanal kod audio-vizuelnih teleservisa“ [7.79]. H.221 je namenski protokol koji se odnosi na multipleksiranje za H.320 terminale. Do 30 ISDN B kanala mogu biti združeni da bi se formirao superkanal sa bitskim protokom od n × 64 kbit/s. Kanali media za audio, video, i informacije o podacima su multipleksirani u superkanalu. Za audio i video informacije, H.221 ne daje bilo kakvu kontrolu greške, ali se zato kompletno oslanja na otpornost na greške pri kodovanju medija, što je omogućeno zbog prirode mreže tipa ISDN i malih vrednosti grešaka. Protokol nudi samo bitski orijentisan, nezaštićeni transport servis od tačke do tačke. ITU-T preporuka H.223 Ova preporuka se zove ’’Multipleksiranje protokola za multimedijalne komunikacije sa malim bitskim protokom“ [7.80]. Tri različita tipa adaptacionih slojeva (eng. adaption layers – ALs) iz modela za povezivanje otvorenih sistema (eng. open system interconnection – OSI) su dostupni. Oni imaju različite karakteristike u pogledu verovatnoće greške i kašnjenja. Adaptacioni slojevi su deo OSI referentnog modela. Podsetimo se da je OSI standard ISO koji služi za definisanje okvira primene protokola, hijerarhijski podeljenih na sedam slojeva (nivoa), radi ostvarivanja komunikacija između međusobno kooperativnih uređaja. Referentni OSI model za protokole sastoji se od skupa protokola hijerarhijski poređanih u sedam slojeva (nivoa). Ovaj model je definisan za komuniciranje dva uređaja pri zajedničkom radu. Kanali sa malim kašnjenjem dozvoljavaju veće greške. AL 1 i AL 2 obavljaju različite zadatke. AL 3 služi za kodovani video. Video podaci smešteni su u male pakete promenljive dužine (oko 100 bajta (eng. byte), mada se mogu ugovoriti i veće dimenzije paketa). 16-bitna ciklična provera suvišnosti (eng. cyclic redundancy check – CRC) za svaki paket omogućava detekciju greške. Zaglavlje za svaki paket iznosi jedan do tri bajta plus informacije o kontroli greške za AL 3. Što se tiče AL 3, tu je uključen optimalni retransmisioni protokol koji po neki put omogućava retransmisiju izgubljenog ili oštećenog paketa. Retransmisija AL 3 vezana je za brzo pristizanje potvrda poruke što je znak da su paketi korektno prenešeni. ITU-T preporuka H.225 Preporuka H.225.0 opisuje načine na koje audio, video podaci, i kontrola mogu biti združeni, kodovani, i paketizovani za transport između H.323 terminala u slučaju

114

Page 125: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

negarantovanog QoS ili između H.323 terminala i H.323 mrežnog prolaza koji može biti povezan sa H.320, H.324, ili H.310/321 terminalima u mrežama tipa NISDN, GSTN, ili BISDN respektivno. Ovaj mrežni prolaz kao i konfiguracija terminala i procedura opisani su u H.323 i H.225.0 protokolima i formatima u obliku poruke. Cilj H.225.0 komunikacije je između H.323 terminala i H.323 mrežnog prolaza po istoj mreži tipa LAN, pri čemu se koristi isti transportni protokol. H.225 koristi transportni protokol u realnom vremenu ⁄ kontrolni protokol u realnom vremenu (eng. real time transport protocol ⁄ real time control protocol – RTP/RTCP) za paketizaciju strimova medija i sinhronizaciju mreža tipa LAN. Generalno govoreći, H.225.0 treba da obezbedi način za sinhronizaciju paketa kako bi se olakšale transportne procedure u LAN mrežama. H.225.0 ne traži da svi mediji i kontrola budu zajedno u jednom strimu koji se onda paketizuje. H.225 terminali šalju audio i video koristeći RTP protokol kroz nepouzdane kanale kako bi se minimiziralo kašnjenje. Poništavanje grešaka može se primeniti kako bi se prevazišao problem izgubljenih paketa; u opštem slučaju audio/video nisu prenešeni jer bi to dalo kao rezultat preterano veliko kašnjenje. H.225.0 terminali šalju i primaju audio i video po posebnim transportnim adresama koristeći posebne primere, kad RTP protokol dozvoljava za svaki medijum posebno QoS i kadar. Poseban slučaj za analizu je kada su audio i video paketi pomešani tako da čine jedinstveni kadar i kada su poslati na jednu adresu. Protokoli za zajedničku kontrolu H.245 H.245 je tako struktiran da se definišu tri glavna odeljka: sintaksa, semantika, i procedure. Notacija ASN.1 se koristila za generisanje sintakse za poruke. Sekcija semantike definiše značenje elemenata sintakse i obezbeđuje sintetička ograničenja. Interakcija između različitih entiteta protokola je samo kroz komunikaciju sa H.245 korisnikom. H.245 obezbeđuje brojne različite servise korisnicima. Servisi se mogu koristiti na osnovu različite preporuke za terminale. Neki od ovih servisa su sledeći:

• Mogućnost razmene, • Procedura logičke signalizacije u kanalima, • Signali kontrole i indikacije,

Mogućnost razmene znači da, pre nego što multimedijalna komunikacija otpočne,

terminal mora biti obavešten o sposobnosti drugog terminala da primi i dekoduje multimedijalne signale. Audio mogućnosti određene su na osnovu jedne od ITU-T G serija preporuka kao što su G.711, G.722, ili MPEG-1 ili MPEG-2 Audio. Što se tiče podataka koristi se serija preporuka T.120. Postoji i audio-vizuelno multipleksiranje. U tom slučaju primenjuje se preporuka H.221. Što se tiče procedure logičke signalizacije u kanalima, terminalni resursi za kodovanje i dekodovanje koriste logičku signalizaciju u kanalu. Logički broj kanala predstavlja određeni kanal u sistemu multipleksa. Logički brojevi kanala su jedinstveni u svakom pravcu prenosa za specijalni poziv. Signali kontrole i indikacije povezuju da su poruke tako definisane da se prenose signali kontrole i indikacije definisani u H.221 i H.320. Poruke nose različite informacije uključujući održavanje u kolu povratne sprege, video/audio signale za brzi odgovor, zatim informaciju o komutaciji izvora za primene u više tačaka itd. Od početka razvoja H.245 očekivalo se da će to

115

Page 126: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

biti značajan dokument sa dodatnim osobinama koje se pridodaju povremeno, da bi se omogućile nove preporuke za terminal ili da se obezbedi moderna funkcionalnost za već postojeće preporuke za terminal. Otuda je sintaksa kod H.245 široka. To se postiže korišćenjem markera za proširenje u sintaksi kao i polja za identifikaciju protokola koje označava upotrebljenu verziju H.245. Markeri za proširenje omogućavaju da se pridoda sintaksa na ranije dekoderske implementacije kod H.245, mogu da preskoče dodatnu sintaksu, a da je i ne razumeju i da nastave normalno postupak dekodovanja [7.81]. Koristiće se polje identifikatora protokola da bi se naznačile izmene u preporuci kao što su definicije novih procedura ili dodavanje nove sintakse koju mora da prepozna udaljeni terminal.

7.11 Rezime Standardi imaju veliku ulogu u multimedijalnim komunikacijama jer omogućavaju, pre svega, interoperabilnost između hardvera i softvera. Radi se o kompromisu između onoga što je teorijski omogućeno, sa jedne, i u tehnološkom smislu ostvarljivo, sa druge strane. Standardi mogu biti uspešni samo ukoliko su dobro izbalansirani kako u tehničkom tako i ekonomskom smislu. To je naročito značajno u oblasti audio-video kodovanja gde postoji raznolikost u pogledu kodnih algoritama koji mogu biti vrlo kompleksni za implementiranje. Uspeh različitih MPEG i ITU-T standarda zavisi od brojnih eleemenata. MPEG je vodeće telo za standardizaciju u audio-vizuelnoj tehnologiji. MPEG-1 je namenjen za CD-ROM sa primenama pri bitskom protoku od oko 1.5 Mbit/s. Standard se pokazao korisnim kod kompjuterski generisanih multimedijalnih podata kada su širina propusnog opsega i kapacitet memorije ograničeni ili skupi. Standard MPEG-2 nemenjen je za visokokvalitetno kodovanje za sve digitalne multimedijalne prenose pri protocima od 2 Mbit/s do 50 Mbit/s. Prema ovom standardu može se proizvesti potreban kvalitet video signala sve do kuće i to za vrlo zahtevne potrebe naučnih primena i biznisa. Cilj i potencijal MPEG-4 standarda analiziran je u kontekstu audio-vizuelnih multimedijalnih komunikacionih okruženja. Pokazano je da ovaj standard pruža alatke i algoritme za kodovanje kako prirodnog tako i sintetičkog audia i videa. Od ne manjeg značaja je svakako predstavljanje audio/vizuelnih podataka na korisničkim terminalima i to na jedan krajnje fleksibilan način. Standard JPEG-2000 govori o stepenu oštećenja poruka, dok subjektivni kvalitet mirne slike treba da bude bolji od onog koji su u stanju da proizvedu do tada postojeći standardi. Cilj MPEG-7 procesa standardizacije je da olakša pretraživanje multimedijalnih podataka. Standard MPEG-21 pruža audio-vizuelnu prezentaciju u okviru multimedijalnih poruka. ITU-T proces standardizacije u multimedijalnim komunikacijama obuhvata pre svega video i govorno kodovanje, multipleksiranje i sinhronizaciju (H.32x, H.26x, H.22x). ITU-T preporuka H.261 optimizirana je u smislu primene za opremu koja se odnosi na interektivnu audio-vizuelnu komunikaciju tj. Videofon. U skladu sa H.320 serijom preporuka koristi se za protokole, multipleksiranje i kontrolu kod mreža tipa ISDN. Što se tiče H.263, to je prvi međunarodni standard za video kompresiju koji omogućava video komunikaciju sa protokom ispod 64 Kb/s. Kada je 1996 godine standard kompletiran, postalo je očigledno da ga treba dograđivati i poboljšati: ITU-T preporuka H.263 Verzija 2 (H.263+) je prvi međunarodni standard u oblasti video kodovanja koji je tako projektovan da podrži celokupan opseg mreže za komutaciju kanala i komutaciju paketa. H.263+ sadrži više novih karakteristika u oblasti video kodovanja u odnosu na H.263. To su poboljšane efikasnosti kompresije, podrška skalabilnim

116

Page 127: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

strimovima bita kao i različitim video formatima, poboljšan kvalitet video prenosa, itd. Aktivnosti oko standarda H.26L sastojale su se u istraživanju naprednih kodnih tehnika koje se razlikuju od onih iz preporuke H.263.

Pitanja

1. Zašto se koriste algoritmi za video kodovanje? 2. Od čega zavisi pravilan izbor algoritama za video kodovanje?

Koja se ograničenja pojavljuju u postupku standardizacije mirnih slika i video signala?

3.

Kako se organizuju MPEG standardi? 4. Iz kojih se delova sastoji MPEG-1 standard? 5. Čime se karakteriše audio deo standarda MPEG-1? 6.

7. Šta karakteriše audio deo standarda MPEG-1? 8. Nacrtati blok-šemu arhitekture uprošćenog MPEG-1 video kodera.

Koji je cilj MPEG-2 video standarda? 9. Koje razlike uvodi MPEG-2 standard u odnosu na MPEG-1 standard? 10.

11. Navesti tipove sistema strimova u standardu MPEG-2. Iz kojih se delova sastoji MPEG-2 standard? 12. Kako izgleda i čime se karakteriše video deo MPEG-2 standarda? 13. Čemu služi audio deo kod MPEG-2 standarda? 14. Čime se karakteriše MPEG-4 standard? 15.

16. Šta standard MPEG-4 nudi provajderima servisa, a šta korisnicima? Iz kojih se delova sastoji MPEG-4 standard? 17. Po kojim karakteristikama se razlikuje MPEG-4 vizuelni kodni standard od prethodnog standarda?

18.

Na koji način vizuelni deo MPEG-4 standarda obezbeđuje funkcije kodovanja? 19. 20. Šta je to alat, a šta profil kod MPEG-4 standarda? 21. Šta je to profil, a šta nivo na osnovu vizuelnog dela MPEG-4 standarda?

Koje vrste alata se koriste za kodovanje audija kod MPEG-4 standarda? 22. Čime se karakterišu prirodni a čime sintetički alati kod kodovanja audija za MPEG-4? 23. Gde se primenjuje standard H.264/AVC? 24. Koji su osnovni funkcionalni elementi standarda H.264/AVC? 25. Koja je uloga profila kod standarda H.264/AVC? 26.

27. Na koliko slojeva se bazira mrežna arhitektura kod H.264/AVC standarda? Koji su to slojevi? Koja je uloga mrežnog apstraktnog sloja kod standarda H.264/AVC? 28. Čemu služi video kodni sloj kod standarda H.264/AVC? 29.

30. Objasniti ulogu svih tipova isečaka kod H.264/AVC standarda.

117

Page 128: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Kako izgleda blok-šema kodera za prenos i rekonstrukciju podataka kod standarda H.264/AVC?

31.

Nacrtati blok-šemu i objasniti princip rada dekodera kod standarada H.264/AVC. 32. Koja je uloga CABAC i CAVLC metoda kod H.264/AVC standarda? 33.

34. U čemu i gde se ogleda primena H.264/AVC standarda u industriji? Koje su osnovne karakteristike i primene MPEG-4 VTC standarda? 35. Čime se karakteriše JPEG-LS standard? 36.

37. Šta je to pokretna mrežna grafika PNE i čemu služi? Koje su osnovne karakteristike standarda JPEG-2000? 38.

39. U čemu se ogleda značaj skalabilnog kodovanja mirnih slika? Koji su najznačajniji tipovi skalabilnosti i koje su njihove karakteristike? 40. Kako se kod JPEG standarda može poboljšati prenos komprimovanih slika? 41. Kakve su mogućnosti zaštite intelektualne svojine kod JPEG-2000 standarda? 42. Nacrtati blok šemu arhitekture kodera i dekodera za JPEG-2000 standard. 43. Koje su okolnosti uticale na pojavu MPEG-7 standarda? 44. Koji su osnovni tipovi alata kod standarda MPEG-7? 45. Iz kojih se delova sastoji MPEG-7 standard? 46.

47. Navesti klase alata za multimedijalnu deskripciju kod standarda MPEG-7. Koji su bili ciljevi u ranoj fazi razvoja MPEG-21 standarda? 48.

49. U čemu se ogleda osnovni koncept razvoja MPEG-21 standarda? Koji su to elementi vezani za arhitekturu koji olakšavaju transakcije između korisnika kod standarda MPEG-21?

50.

Čime se karakteriše proces ITU-T standardizacije i zašto su ove standardizacije uvedene?

51.

Koje su osnovne karakteristike standarda H.320? 52. Šta je rešilo uvođenje preporuka H.310 u multimedijalne komunikacije? 53. Zašto je uvedena preporuka H. 321 u multimedijalne komunikacije? 54. Šta je uticalo na pojavu standarda H.323? 55. Iz kojih se elemenata sastoji zona H.323 standarda? 56. Koje su prednosti i nedostaci sistema koji koriste H.324 standard? 57. Koje su osnovne karakteristike standarda H.261? 58. Gde se primenjuje standard H.261? 59. Kako se definišu blok, makroblok, i grupa blokova kod standarda H.261? 60. Iz kojih se elemenata sastoje blok-šeme video kodera i video dekodera u standardu H.261? Nacrtati odgovarajuće blok-šeme.

61.

62. U čemu se razlikuje standard H.263 od standarda H.261? Koje novine unosi standard H.263+ (H.263 verzija 2) u odnosu na H.263? 63. Šta se postiže uvođenjem verzije standarda H.263++? 64. Koji su osnovni ciljevi standarda H.26L? 65.

118

Page 129: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

66. Od čega zavisi kvalitet govora koji proizvodi govorni koder? Šta su to referentni zahtevi kod standarda za govorne kodere? 67. Kako su formirani referentni zahtevi za bitski protok kod digitalnog simultanog kodera za glas i podatke?

68.

69. U čemu se razlikuju standardi G.729 i G.723.1? Čemu služi preporuka H.222.0? 70.

71. Šta predstavlja preporuka H.221? Čime se karakteriše preporuka H.223? 72. Koji je zadatak preporuke H.225.0? 73.

74. Koja je funkcija H.225.0, a koja H.225 terminala? Iz kojih se odeljaka sastoji protokol za zajedničku kontrolu H.245? 75. Koje najvažnije servise obezbeđuje protokol H.245? 76. Zašto se koristi polje identifikatora protokola kod H.245? 77.

Literatura [7.1] I. E. G. Richardson, H.264 and MPEG-4 Video Compression. Video Coding for Next-

generation Multimedia. Chichester, England, UK: John Wiley and Sons, 2003. [7.2] K. R. Rao, Z. S. Bojković, and D. A. Milovanović, Multimedia Communication

Systems: Techniques, Standards and Networks. Prentice Hall, 2002. [7.3] Coding of Moving Pictures and Associated Audio at up to About 1,5 Mbit/s, ISO/IEC

11172:1991. [7.4] Information Tehnology-Generic Coding of Moving Pictures and Associated Audio

Information: Systems, ISO/IEC 13818-1:1996. A. Puri, “Video coding using the MPEG-2 compression standard,” Proc. SPIE Visual Commun. Image Processing, pp. 1701-1713, Nov. 1993.

[7.5]

B. Heskell, A. Puri, and A. Netraveli, Digital Video: An Introduction to MPEG-2. Chapman and Hall, 1997.

[7.6]

[7.7] B. L. Tseng and D. Anastassiou, “Multiviewpoint video coding with MPEG-2 compatibility,” IEEE Trans. Circuits Syst. Video Technol., vol. 6, pp. 414–419, Aug. 1996.

[7.8] T. Homma, “MPEG Contribution 95/N0861: Report of the Ad Hoc Group on MPEG-2 Applications for Multi-Viewpoint Pictures,” Mar. 1995.

[7.9] J. Ni, T. Yang, and D. H. K. Tsang, “CBR transportation of VBR MPEG-2 video traffic for video-on-demand in ATM Networks,” in IEEE Int. Conf. Communications, Dallas, TX, Jun. 1996, pp. 1391–1395. M. Orzessek and P. Sommer, ATM and MPEG-2 Integration of Digital Video Into Broadband Networks. Upper Saddle River, NJ: Prentice Hall, PTR, 1998.

[7.10]

[7.11] D. Milovanović, V. Jovanović, and Z. Bojković, “MPEG-2 sensitivity to date loss and effects of different packet loss patterns,” WSEAS Trans. on Commun., vol. 3, pp.777–

119

Page 130: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

782, Apr. 2004. K. R. Rao and Z. S. Bojković, Packet Video Communications Over ATM Networks. Prentice Hall, 2000.

[7.12]

[7.13] Z. Bojković, “Multimedia communication systems: Modeling, standardization, requirements,” in Proc. ICOMPT’96 Int. Conf. Multimedia Technology and Digital Telecommunication Services, Budapest, Hungary, Oct. 1996, pp. 5–13.

[7.14] Z. Kruševac and Z. Bojković, “SNR in MPEG video compression standard for optimum bit allocation,” in 7th IEEE Singapore Int. Conf. Communication Systems ICCS 2000, Singapore, Nov. 2000. Coding of Audio-Visual Objects, ISO/IEC 14496:1999. [7.15] F. Pereira, T. Ebrahimi, The MPEG-4 Book. Prentice Hall, 2002. [7.16] MPEG-4 Overview - (V.18-Singapore Version), ISO/IEC JTC1/SC29/WG11 N4030, Mar. 2001.

[7.17]

F. Pereira, “MPEG-4: why, what, how and when?” Signal Process.: Image Commun., vol.15, pp.271–279, Jan. 2000.

[7.18]

[7.19] Z. S. Bojković and D. A. Milovanović, “Audiovisual integration in multimedia communications based on MPEG-4 facial animation,” Circuits Systems Signal Processing, vol. 20, no. 3, pp. 311–339, 2001.

[7.20] Z. Bojković and B. Bakmaz, “A Survey on MPEG-4 standard and digital television deployment“, WSEAS Transactions on Communications, vol. 9, pr. 33–42, Jan. 2010.

[7.21] Z. Bojković, “MPEG-4 video standardization process,” in Proc. ICOMPT’ 97, 2nd Int. Conf. Multimedia Technology and Digital Telecommunication Services, Invited paper, Budapest, Hungary, Oct. 1997, pp. 1–10.

[7.22] S. G. Chao, Z. Bojković, D. Milovanović, J. Lee, and J. J. Hwang, “Image quality evaluation: JPEG 2000 versus intra only H.264/AVC high profile,” Facta Universitatis, Nis, Series: Electronics and Energetics, vol.20, no.1, pp. 71–81, Apr. 2007. Information Technology-Coding of Audio-Visual Objects-Part2: Visual, ISO/IEC 14496-2, Amd 1: 2001.

[7.23]

[7.24] Z. Bojković, “Analysis of output signal-to-noise ratio in hybrid DCT/DPCM image coding system,” in Proc. EUSIPCO’88, Grenoble, France, pp. 1661–1664. Information technology-Coding of audio-visual objects-Part 2: Visual, ISO/IEC 14496-2:2001, Part 3: Audio, ISO/IEC 14496-3:2001.

[7.25]

[7.26] J. Dimković, D. Milovanović, and Z. Bojković, “Fast software implementation of MPEG advanced audio coder,” in Proc. IEEE/EURASIP Int. Conf. DSP, Santorini, Greece, 2002.

[7.27] D. Milovanović, J. Dimković, and Z. Bojković, “MPEG-4 audio/video komunikacija: Optimizacija implementacije i modeli licenciranja,” X Telekomunikacioni Forum TELFOR 2002, Zbornik radova, Beograd, str. 669-672.

[7.28] P. K. Doenges at al., “MPEG-4 audio/video and synthetic graphics/audio for mixed media,” Signal Process.: Image Commun., vol. 9, pp. 433–463, May 1997. S. R. Quackenbush, “Coding of natural audio in MPEG-4,” in Proc. IEEE Int. Conf. Acoustics, Speech and Signal Processing, Seattle, WA, May 1998, pp. 3797–3800.

[7.29]

120

Page 131: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

E. D. Sheirer, “The MPEG-4 structured audio standard,” in Proc. IEEE Int. Conf. Acoustics, Speech and Signal Processing, Seattle, WA, May 1998, pp. 3801–3804.

[7.30]

[7.31] E. D. Sheirer, Y. Lee, and J. W. Yang, “Synthetic audio and SNHC audio in MPEG-4,” in Advances in Multimedia: Systems, Standards and Networks, A. Puri and T. Chen, Eds. New York, NY: Marcel Dekker, 1999.

[7.32] N. Jayant, J. Johnston, and R. Safranek, “Signal compression based on models of human perception,” Proc. IEEE, vol. 81, pp. 1385–1422, Oct. 1993. M. Bosi et al., “ISO/IEC MPEG-2 advanced audio coding,” J. Audio Eng. Soc., vol. 45, pp. 789–814, Oct. 1997.

[7.33]

[7.34] E. D. Scheirer and B. L. Vercoe, “SAOL: The MPEG-4 structured audio orchestra language,” Comput. Music J., vol. 23, pp. 35–51, Feb. 1999.

[7.35] B. L. Vercoe, W. G. Gardner, and E. D. Scheirer, “Structured audio: The creation, transmission, and rendering of parametric sound representations,” Proc. IEEE, vol. 85, pp. 922–940, May 1998.

[7.36] A. Puri, H. Chen, and A. Luthra, “Video coding using H.264/MPEG-4 AVC compression standard,” Signal Process.: Image Commun., vol.19, no. 9, pp. 793–846, Oct. 2004.

[7.37] Z. Bojković and Z. Miličević, “Wireless multimedia networking standards: WLAN, WPAN, WMAN,” Seminar in Signal Procesing/Communications, Electrical Engineering Faculty, University of Texas at Arlington, UTA, Texas, USA, Apr. 2006. K. R. Rao, Z. S. Bojković, and D. A. Milovanović, Introduction to Multimedia Communications: Applications, Middleware, Networking. Wiley, 2006.

[7.38]

[7.39] T. Weigand, G. J. Sullivan, G. Bjontegaard, and A. Luhtra, “Overview of the H.264/AVC video coding standard,” IEEE Trans. Circuits Syst. Video Technol., vol. 13, pp. 560–576, Jul. 2003.

[7.40] S. Kwon, A. Tamhankar, and K. R. Rao, “Overview of H.264/MPEG-4 Part 10,” Journal of Visual Communication and Image Representation, vol. 17, no. 2, pp. 186–216, Apr. 2006.

[7.41] J. Ribas-Corbera, P. A. Chou, and S. L. Regunathan, “A generalized hypothetical reference decoder for H.264/AVC,” IEEE Trans. Circuits Syst. Video Technol., vol. 13, pp. 674–687, Jul. 2003.

[7.42] D. Marpe, H. Schwarz, and T. Wiegand, “Contest-based adaptive binary arithmetic coding in the H.264/AVC video compression standard,” IEEE Trans. Circuits Syst. Video Technol., vol. 13, pp. 620–636, Jul. 2003.

[7.43] D. Marpe, T. Wiegand, and G. J. Sullivan, “The H.264/MPEG-4 advanced video coding standard and its applications,” IEEE Commun. Mag., vol. 44, no. 8, pp. 134–144, Aug. 2006.

[7.44] Z. Miličević and Z. Bojković, “Kvalittet servisa u IP mrežama, parametri i protokoli,” XLVII konferencija ETPAN, Zbornik radova, Sveska II, Herceg Novi, 8–13 juni 2003. S. Wenger, “H.264/AVC over IP,” IEEE Trans. Circuits Syst. Video Technol., vol. 13, pp. 645–656, Jul. 2003.

[7.45]

K. R. Rao and P. Yip, Discrete Cosine Transform: Algorithms, Advantages, Applications. New York, NY: Academic Press, 1990.

[7.46]

121

Page 132: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

W. B. Pennebaker and J. L. Mitchell, JPEG:Still Image Data Compression Standard. New York, NY: Van Nostrand Reinhold, 1993.

[7.47]

[7.48] D. Santa Cruz and T. Ebrahimi, ”An analytical study of JPEG 2000 functionalities,” in Proc. IEEE Int. Conf. Image Processing ICIP, vol. 2, Vancouver, Canada, Sept. 2000, pp. 49–52.

[7.49] D. Nister and C. Christopoulos, “Lossless region of interest with embedded wavelet image coding,” Signal Process., vol. 78, pp. 1–17, Jan. 1999. Multimedia Content Description Interface, ISO/IEC 15938:2002. [7.50] F. Pereira and R. Koenen, “MPEG: Context, goals and working methodologies,”in The MPEG-21 Book, I. S. Burnett et al., Eds. John Wiley and Sons, 2006, pp. 1–30.

[7.51]

[7.52] Z. Bojković and B. Bakmaz, “MPEG-21 standardization process: Organization and rate distortion modeling for network adaptation“, in Latest Trends on Communications, N. Mastorakis, V. Mladenov, and Z. Bojković, Eds. 14th WSEAS Int. Conf. Communications, Corfu, Greece, Jul. 2010, pp. 103–108.

[7.53] L. Chiariglione, K. Hill, and R. Koenen, “Introduction to MPEG-21,” in “Open workshop on MPEG-21-Multimedia Framework,” in Doc. ISO/MPEG M5707, MPEG Noordwijkerhout Meeting, The Netherlands, Mar. 2000.

[7.54] Information Technology-Multimedia Framework (MPEG-21)-Part1: Vision, Technologies and Strategy, ISO/IEC TR 21000-1:2004.

[7.55] Information and documentation-International Standard Book Number (ISBN), ISO 2108: 2005.

[7.56] Information and Documentation-International Standard Recording Code (ISRC), ISO 3901:2005.

[7.57] Information and Documentation-International Standard Musical Work Code (ISWC), ISO 15707:2001.

[7.58] MPEG Multimedia Description Schemes (MDS). “FCD MPEG-21 IPMP Components, ISO/MPEG N7196,” 72nd MPEG Meeting, Busan, Korea, Apr. 2005. Information Technology-Multimedia Framework (MPEG-21)-Part 7: Digital Item Adaptation, ISO/IEC TR 21000-7:2004.

[7.59]

[7.60] K. Asatani and S. Nogami, “Trends in the standardization of telecommunications on GII, multimedia and other network technologies and services,” IEEE Commun. Mag., vol. 34, pp. 32–44, Jun. 1996.

[7.61] M. H. Willebeek-LeMair and Z. Y. Shae, “Videoconferencing over packet-based networks,” IEEE J. Sel. Areas Commun., vol.15, pp. 1101–1114, Aug. 1997. Adaptation of H.320 Visual Telephone Terminals to B-ISDN Environments, ITU-T Recommendation H.321 (03/1996).

[7.62]

Broadband Audiovisual Communication Systems and Terminals, ITU-T Recommendation H.310 (11/1995).

[7.63]

Control Protocol for Multimedia Communication, ITU-T Recommendation H.245 (03/1996).

[7.64]

Procedures for the Simultaneous Transmission of Data and Digitally Encoded Voice Signals Over the General Switched Telephone Network (GSTN), or Over 2-Wire Leased Point-to-Point Telephone Type Circuits, ITU-T Recommendation V.70 (08/1996).

[7.65]

122

Page 133: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Terminal for Low Bitrate Multimedia Communication, ITU-T Recommendation H.324 (03/1996).

[7.66]

S. Wenger et al., “Error resilience support in H.263+,” IEEE Trans. Circuits Syst. Video Technol., vol. 8, pp. 867–877, Nov. 1998.

[7.67]

Video Codec for Audiovisual Services at p x 64 kbit/s, ITU-T Recommendation H.261 (03/93).

[7.68]

A. N. Netravali and J. D. Robbins, “Motion-compensated television coding: Part I,” Bell Syst. Tech. J., vol. 58, pp. 629–668, Mar. 1979.

[7.69]

H.263+ Video Coding for Low Bitrate Communication, Draft ITU-T Recommendation H.263 Version 2, Sept. 1997.

[7.70]

[7.71] T. Chen, C. T. Swain, and B. G. Haskell, “Coding of subregions for content-based scalable video,” IEEE Trans. Circuits Syst. Video Technol., vol. 7, pp. 256–260, Feb. 1997.

[7.72] ITU-T, Study group 16, Video Coding Experts Group (Question 15), Doc. Q15F09, Report of the Ad Hoc Committee H.263++ Development, Seoul, Korea, Nov. 1998.

[7.73] ITU-T, Study group 16, Video Coding Experts Group (Question 15), Doc. Q15D62, Recommended Simulation Conditions for H.263 v3, Tampere, Finland, Apr. 1998.

[7.74] ITU-T, Study group 16, Video Coding Experts Group (Question 15), Doc. Q15D65, Video Codec Test Model, Near-Term, Version 10 (TMN10), Draft 1, Tampere, Finland, Apr. 1998.

[7.75] ITU-T, Study group 16, Video Coding Experts Group (Question 15), Doc. Q15F10, Report of the Ad Hoc Committee H.26L development, Seoul, Korea, Nov. 1998.

[7.76] ITU-T, Study Group 16, Video Coding Experts Group (Question 15), Doc. Q15D62, call for proposals for H.26L Video coding, Geneva, Switzerland, Jan. 1998.

[7.77] R. V. Cox and P. Kroon, “Low bit-rate speech coders for multimedia communications,” IEEE Commun. Mag., vol. 34, pp. 34–41, Dec. 1996. Mulimedia Multiplex and Synchronization for Audiovisual Communication in ATM Environment, ITU-T Recommendation H.222.1 (03/96).

[7.78]

Frame Structure for a 64 to1920 kbit/s Channel in Audiovisual Teleservices, ITU-T Recommendation H.221 (07/97).

[7.79]

Multiplexing Protocol for Low Bit Rate Multimedia Communication, ITU-T Recommendation H.223 (03/1996).

[7.80]

Information Technology-Abstract Syntax Notation One (ASN.1)-Specification of Basic Notation, ITU-T Recommendation X.680 (07/1994).

[7.81]

123

Page 134: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

8. APLIKATIVNI ASPEKT MULTIMEDIJA

Aplikativni aspekt multimedija obuhvata praktična znanja, postupke i resurse koji se koriste u procesu multimedijalnog stvaralaštva.

Multimedijalnim stvaralaštvom, u najširem smislu, mogu se označiti sve kreacije stvorene za višečulnu percepciju čoveka. Koreni multimedija mogu se tražiti već u ranoj fazi razvoja ljudskih zajednica sa pojavom prvih oblika čulnih komunikacija. Prvobitne međuljudske komunikacije, kao i komunikacije između životinja, audio-vizuelne su, što znači da su se zasnivale na percepciji zvuka i slike.

Slika koja deluje na čulo vida predstavlja ulazni signal za video percepciju. Zvuk koji deluje na čulo sluha predstavlja ulazni signal za čujnu percepciju. U razvoju komunikacija između ljudi, kao i između ljudi i životinja, zvuk je imao značajniju ulogu od slike. Komunikacija pomoću zvuka može se ostvariti u odsustvu svetlosti, kada nema slike, što je za evolucioni opstanak vrsta izuzetno značajno. Za čoveka, zvuk je značajan, jer je modulisanjem i kodovanjem zvučnih signala formiran govorni jezik za sporazumevanje. Govor čoveka uzdiže na viši oblik komunikacija u odnosu na životinjski. Logika i proces mišljenja zasnovani su na rečima i jeziku. Razvojem govornog jezika razvija se proces ljudskog mišljenja. Govor i govorna komunikacija opstaju kao dominantan oblik komunikacije. Tokom razvoja civilizacije razvijali su se, pored govornih, i drugi oblici komunikacije među ljudima. Govor i u najrazvijenim državama, kao i u nerazvijenim društvenim zajednicama i nepismenom delu stanovništva, ostaje najznačajniji način komunikacije.

Pojava pisma doprinela je ubrzanom razvoju ljudske civilizacije. Pismom se memoriše govorni jezik. Razvoj pisanog jezika omogućio je da se stečeno znanje generacijski čuva, dopunjuje i integriše. Pismo predstavlja simboličan prikaz govornog jezika. Elementi govornog jezika glasovi – fonemi, reči i rečenice, koduju se pomoću vidljivih simbola zapisanih na čvrstoj podlozi. Predstavljanje govornog jezika pomoću pisma, ostvareno pre više milenijuma, ekonomičan je način izražavanja veoma pogodan za memorisanje, obradu i prenos pomoću savremenih informaciono-komunikacionih uređaja i sistema. Duže od jednog veka govorni jezik memoriše se i reprodukuje u prirodnom obliku, što predstavlja izvanrednu pogodnost za nepismene i konfor za pismene. Iako je za generacijski prenos znanja pisani jezik teorijski prestao da bude jedina mogućnost, ne sagledava se kraj korišćenja pisma. Savremeno pismo ima višestruku informacionu i dizajnersku funkciju. Poslednje ubrzavanje civilizacijskog razvoja ostvaruje se razvojem programiranja i primenom programabilnih sistema. Programiranjem se regulišu procesi, upravlja događajima u sadašnjem i budućem trenutku. U sofisticirane uređaje ugrađuje se sve više znanja i na taj način

124

Page 135: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

im se prepušta vođenje složenih procesa koji su ranije zavisili od čoveka. Razvojem programiranja ostvarena je mogućnost interakcije čoveka i mašina.

Razvoj sofisticiranih informaciono-komunikacionih urađaja i sistema omogućio je da se integrišu slika, zvuk i tekst što je označeno kao multimedija. Multimedija, o kojoj su posvećena prethodna poglavlja ove knjige, uključuje sva pomenuta saznajna dostignuća koja se odnose na zapisivanje, obradu, i prikazivanje audio-vizuelnih sadržaja.

Sa multimedijom se uvodi pojam virtuelnog sveta i virtuelne stvarnosti. Formiran je, takođe, pojam fizička realnost i virtuelna realnost.

Virtuelnost je pojam kojim se označava nešto što nije a prikazuje se kao da jeste. Primer za virtuelnost su ceremonijali koji prikazuje englesku kraljicu kao da ima apsolutnu vlast, iako ona nema stvarnu vlast. U demokratskim monarhijama, za vlast kraljeva kaže se da je protokolarna, odnosno virtuelna. Protokoli posebne vrste koriste se i u multimedijalnim sistemima na kojima se prikazuje virtuelna stvarnost.

Pomoću multimedijalnih tehnologija umetnici kreiraju nove imaginarne svetove, pokušavajući da što više budu originalni, različiti od poznatog realnog sveta. Da bi se imaginarni svetovi predstavili čoveku, dizajniraju se prema mogućnostima čulne percepcije. To znači da se u prezentaciju imaginarnog sveta ugrađuju zakonitosti fizičkog sveta, jer su čula na njih adaptirana. Imaginarni svetovi na taj način postaju virtuelni. Virtuelni svet kreira se pomoću signala slike i zvuka, a u novije vreme uključuju se i uređaji za generisanje signala mirisa. Najveći stepen virtualizacije ostvaruje se u multimedijalnim prezentacijama u koje je uprogramirana mogućnost interakcije sa korisnikom.

Virtuelna, kao i realna stvarnost prezentira se čovečijim čulima u prostorno-vremenskim koordinatama. U prostoru i vremenu ispoljava se sve ono što sadrži fizički svet. Virtuelni svet i virtuelna realnost, koji se kreira pomoću multimedijalnih tehnologija, kao i fizički svet i fizička realnost, takođe se neizbežno prikazuju u prostoru i vremenu.

Prostor i vreme su fizičke veličine koje imaju presudnu ulogu u svim fazama realizacije multimedijalnog projekta.

Angažovani multimedijalni resursi definišu se na osnovu prostornih i vremenskih parametara informacionih sadržaja multimedijalnog proizvoda.

Prostorni domen informacionih sadržaja određuje potrebnu veličinu, odnosno kapacitet memorijskih resursa.

Vremenski domen informacionih sadržaja određuje zahtevanu propusnu moć, odnosno kapacitet prenosnih resursa komunikacionog sistema.

Alati za multimedijalnu produkciju kojima se obrađuju informacioni sadržaji u prostornom i vremenskom domenu isprogramirani su na osnovama analitičke geometrije i Fourier-ovih transformacija. Prostorne i vremenske koordinate signala međusobno se povezuju i transformišu u cilju obrade i prenosa vizuelnih sadržaja. Tako se prenos 2D slike kroz 1D kanal ostvaruje zahvaljujući prostorno-vremenskoj transformaciji. Slika, kao 2D raspodela svetlosti, tretira se kao skup piksela koji se mogu sukcesivno preneti kroz 1D kanal i na odredištu rasporediti u 2D prostor na osnovu vremenskog redosleda pristizanja.

125

Page 136: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

8.1 Aplikativni aspekt osnovnih informaciono-komunikacionih pojmova

U ovom poglavlju multimedija se razmatra sa aplikativnog aspekta. Čitaoce koje

multimedija interesuje samo sa aplikativnog aspekta korisno je podsetiti na pojednostavljene definicije osnovnih pojmova u oblasti multimedija. Medij, reč starogrčkog porekla koristi se da označi sredinu, prostor, ili sredstvo za prenos, memorisanje i prezentaciju informacija.

Multimedija, što bukvalno znači mnogo sredina, sadrži pojmovnu suvišnost jer je medija množina od medij, a počinje da se koristi sedamdesetih godina prošlog veka u različitim kontekstima da bi se devedesetih godina preciznije definisala. Multimedija, prema standardu ISO/IEC JTC1 SC29/WG12, kako je već navedeno na početku ove knjige, predstavlja sposobnost postupanja sa različitim vidovima prezentacionih medija koji čine tip podataka sa zadatkom da definišu prirodu informacije u njenom kodiranom formatu.

Navedena definicija najkompetentnijih asocijacija za multimediju je uopštena i strogo egzaktna. Iako se sa naučnog aspekta ne može dati primedba, data definicija je, zbog apstraktnosti, suviše neprikladna za širu upotrebu.

Za praktičare zadovoljavajuće je koristiti jednostavniju definiciju. Multimedija, sa aplikativnog aspekta, predstavlja informaciono-komunikacioni proizvod

računarskih tehnologija koji pomoću integrisanih hardverskih i softverskih uređaja prikazuju pojave za čulo vida, sluha, i dodira, u novije vreme i za čulo mirisa. Multimedijalni proizvod predstavlja sintezu slika, teksta, animacije, zvuka, taktilnih elementa, u novije vreme i mirisa. Multimedija pojmovno obuhvata različite medije, informacione sadržaje, i interaktivnost.

Interaktivna multimedija podrazumeva postojanje interakcije sa korisnikom. Savremeni multimedijalni proizvodi su, po pravilu, interaktivni, pa se pod pojmom multimedija interaktivnost već podrazumeva, i pridev interaktivna izostavlja.

Hipermedija je interaktivna multimedija sa linkovima za navođenje korisnika. U savremenom društvu miltimedija postaje nova pismenost i opšti način izražavanja. Multimedija se koristi u marketingu, obrazovanju, zabavi, medicini i poslovanju. Skoro

da nema delatnosti gde multimedija ne nalazi primenu. Proces realizacije multimedijalnih proizvoda definišu: namena, sadržaj, raspoložive

tehnologije i korišćeni mediji. Namena multimedijalnog proizvoda definisana je funkcijom koju proizvod treba da

ostvari da bi se ulaganja u njegovu realizaciju isplatila. Sadržaj se određuje prema nameni, i prema raspoloživim tehnologijama i korišćenim

medijima. Koje će se raspoložive tehnologije i mediji koristiti zavisi od namene proizvoda i izdvojenog budžeta.

Prema funkciji, mediji se klasifikuju na: memorijske, prenosne i prezentacione. Memorijski medij je fizičko sredstvo za skladištenje informacija, kao što su:

poluprovodničke, magnetne i optičke memorije. Osnovni parametri koji karakterišu memorijske medije su: kapacitet memorije, vreme

pristupa i fizički gabariti. Prenosni medij je sredina ili sredstvo za prenos signala kao što su: bakarni provodnici,

staklena vlakna i slobodan prostor.

126

Page 137: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Osnovni parametri kojim se karakterišu prenosni mediji su: podužno slabljenje i prenosni kapacitet.

Prezentacioni medij je fizičko sredstvo ili uređaj pomoću koga se informacije predstavljaju korisniku, kao što su uređaji sa ekranima za prikazivanje slike i uređaji sa zvučnicima za generisanje zvuka.

Medij za prikazivanje slike karakterišu parametri za rezoluciju, kontrast i osvetljaj slike. Medij za generisanje zvuka karakteriše dinamički i frekvencijski opseg audio pojačavača

i zvučnika. Kroz medij cirkuliše energija, materija i informacija. Komunikacije se zasnivaju na

razmeni informacija. U informaciono-komunikacionim tehnologijama, od interesa je informacioni aspekt korišćenja medija.

Osnovni informaciono-komunikacioni pojmovi su: informacija, poruka, podatak, komunikacija, signal i kodovanje.

Informacija predstavlja skup poruka. Poruka predstvalja skup podataka. Podatak predstavlja karakteristiku elementa, sistema, ili procesa. Komunikacija predstavlja proces prenošenja informacija. Prenošenje informacija se ostvaruje pomoću signala. Signal je materijalizovani nosilac informacija.

Po obliku razlikuju se analogni i digitalni signali. Analogni signali nastaju kao neposredan odraz procesa koji generišu fizički fenomeni i na prijemu donose informacije u istom obliku kako ih fizički fenomeni, čiji su odraz, generišu. Primeri analognih signala su zvučni i svetlosni talasi, odnosno zvuci koje slušamo i slike koje gledamo. Čovečija čula predstavljaju prijemnike za analogne signale slike, zvuka, dodira, mirisa i ukusa. Digitalni signali nastaju u procesu kodovanja i prenose informacije pomoću simbola određenog kodnog sistema. Kodovanje je postupak simboličnog šifrovanog predstavljanja informacija pomoću elemenata određenog brojnog sistema ili azbuke određenog jezika. Za memorisanje, obradu, prenos i korišćenje digitalnih signala koriste se sofisticirani uređaji i sistemi. Signali se karakterišu dinamičkim, frekvencijskim i vremenskim domenom. Dinamički domen signala koristi se za predstavljanje snage, odnosno intenziteta signala. Za obradu i prenos signala značajan je raspon ili odnos maksimalnog i minimalnog intenziteta signala što se označava kao dinamika signala. Od dinamike signala zavisi sa koliko bita, osnovnih informacionih jedinica, analogni signal se koduje i prevodi u digitalni oblik. Frekvencijski domen koristi se za predstavljanje brzine promena signala. Za obradu, memorisanje i prenos signala značajna je maksimalna brzina promene, odnosno maksimalna učestanost – frekvencija signala. Povećanjem maksimalne učestanosti rastu i zahtevi u pogledu potrebnih resursa za obradu, memorisanje, i prenos signala. Vremenski domen koristi se za predstavljanje brzine promena, trajanja pojedinih intervala, i ukupno trajanje signala. Brzine promena povezane su sa spektrom signala, odnosno frekvencijskim domenom. Trajanja pojedinih intervala i ukupno trajanje signala određuje zauzetost procesorskih, memorijskih i prenosnih resursa.

127

Page 138: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Pomoću multimedijalnih tehnologija obrađuju se pojedinačno i/ili objedinjuju podaci koji se odnose na tekst, zvuk i sliku. Od podataka se formiraju signali za potrebe memorisanja, prenošenja ili prikazivanja multimedijalnih informacija. Signali sa tekstualnim, zvučnim i slikovnim sadržajima razlikuju se po količini informacija, odnosno brzini prenošenja. Najmanje memorije zauzimaju i najbrže se prenose signali sa tekstualnim sadržajem. Najviše memorije zauzimaju i najsporije se prenose video signali, odnosno signali koji nose informacije o pokretnim slikama. Signali zvuka predstavljaju talasni prenos oscilacija kroz materijalnu sredinu i imaju u osnovnom opsegu spektar širine 20 kHz i dinamički opseg od preko 100 dB. Kod prevođenja zvučnog signala u elektronski analogni ekvivalent koji se zovu audio signali potrebni su veliki kapaciteti memorija i prenosnih kanala. Za prevođenje analognih u digitalne signale potrebno je još više kapaciteta. Signali pokretnih slika, odnosno njihovi električni ekvivalenti koji se najčešće nazivaju video signali, imaju u osnovnom opsegu spektar širine od 5 MHz i dinamički opseg od 50 dB, zbog čega je i za njih, kod prevođenja u digitalni oblik, potrebna velika memorija i velike brzine prenosa. Za ekonomično memorisanje i prenos audio i video signala razvijeni su postupci kompresije pomoću kojih se smanjuje količina podataka koja reprezentuje signale. Prenos i memorisanje digitalnih audio i video signala bez kompresije bili bi izuzetno zahtevni i mnoge komunikacije praktično neostvarljive. Procesom kompresije omogućava se memorisanje i prenos digitalnih audio i video signala sa višestruko manjim memorijskim i prenosnim resursima. Postupci kompresije su dugo godina razvijani i usavršavani da bi se na kraju optimalne varijante kompresije usvojile u formi standarda. Usvojeni su standardi za kompresiju mirne slike, kompresiju audio signala i za kompresiju video signala. Kompresioni postupci mogu biti reverzibilni – bez gubitaka, i nereverzibilni – sa gubicima. Za prezentaciju kod krajnjeg korisnika neophodno je postupcima dekompresije vratiti signal u prirodni oblik. Dekompresovani signal, zavisno od toga da li je kompresija reverzibilna ili nereverzibilna, može biti potpuno veran originalu, ili unekoliko degradiran zbog gubitka određenog procenta informacionog sadržaja. Multimedijalni sistem predstavlja skup uređaja i programa za integrisanu obradu i upravljanje nezavisnim diskretnim i kontinualnim medijima u cilju prilagođavanja realnih pobuda–stimulusa čovečijem čulnom sistemu za zadovoljenje odgovarajuće percepcije. Multimedijalni sistemi obrađuju nezavisne medije i kada su oni funkcionalno povezani, na primer snimak lica govornika i njegovog govora. Ako je zbog sinhronizacije i prepoznavanja govora potrebno da se poveže izgovor sa pokretima usana, onda se koriste multimodalni sistemi. Multimodalnost predstavlja povezanost međusobno zavisnih kanala – modalities za čulnu percepciju, kao što je zavisnost govora od pokretanja usana i izraza lica. Multimodalni sistem predstavlja skup uređaja i programa za integrisanu obradu i upravljanje međusobno zavisnih medija odnosno međusobno zavisnih komunikacionih kanala. Govor je povezan sa pokretanjem usana i izrazima lica, pa se preko čula vida dopunjava doživljaj koji dolazi od čula sluha.

128

Page 139: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

8.2 Osnovne multimedijalne delatnosti

Multimedijalna delatnost je multidisciplinarna i obuhvata razne tehničko-tehnološke, ekonomske, sociološke i umetničke specijalnosti.

Stvaranje multimedijalnog dela, zavisno od njegove kompleksnosti, zahteva angažovanje različitog broja i profila stručnjaka. Kreiranje multimedijalnog proizvoda može da bude nemetodično ili proceduralno strukturirano. Primer nemetodičnog stvaranja su pojedinačni proizvodi koji nisu dobro definisani.

Za realizaciju kompleksnih projekata uključuju se timovi stručnjaka, dok određeni jednostavni proizvod može da kreira samo jedan izvršilac. Projekti zatevaju procedure i metodološku strukturalizaciju.

Za početak rada treba da postoje određeni zahtevi kojima se specificiraju zahtevi investitora. Ti zahtevi predstavljaju projektni zadatak za realizaciju multimedijalnog proizvoda.

Projektni zadatak predstavlja dokument kojim se izražavaju:

• Potrebe, • Sadržaj, • Propisi, • Specifikacija naručioca – klijenata, • Proizvodnja ili izbor multimedijalnih komponenti teksta, slike/ grafike, audio i

video/animacije koji će najbolje preneti poruku, • Navigacija koja određuje željeni način prezentacije multimedijalnog proizvoda, • Tehnološka ograničenja: potrebe – zahtevi za materijal, softver, hardver, troškovi i vreme

stvaranja, su ograničavajući činioci stvaranja multimedijalne aplikacije koje je potrebno uzeti u obzir u procesu stvaranja,

• Kontrola ispravnog funkcionisanja multimedijalnog proizvoda, • Tržište, • Medij za isporuku, način distribuiranja, • Transport, reklamiranje i održavanje – podrška multimedijalnog proizvoda,

Karakteristične su tri faze u realizaciji projekata iz oblasti multimedija: preprodukcija, produkcija i postprodukcija. Multimedijalna preprodukcija predstavlja prvu fazu realizacije projekta koju karakterišu sledeće aktivnosti:

• Razrađuju se zahtevi naručioca, definišu ciljevi, analizira interesna grupa, postavljaju zadaci;

• Definiše se žanr: dokumentarni, obrazovni ili instruktivni, narativni, animacija, interaktivni, umetnički ili ekspresivni;

• Definiše se vrsta medija: letak, bilbord, novine, televizija, internet; • Definiše se sadržina proizvoda; • Analiziraju se iskustva drugih i postojeća rešenja; • Sastavlja se detaljan pregledan plan, najčešće u vidu ilustrovane priče koja je, zbog

vešanja na tablu, nazvana storibord.

129

Page 140: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Multimedijalna produkcija predstavlja drugu fazu realizacije projekta u kojoj se neposredno formira sadržaj koji će se ugrađivati u proizvod. Zavisno od kompleksnosti proizvoda koristi se računar, kamera, glumci, kostimi, studija i scenografija. Multimedijalna postprodukcija predstavlja završnu fazu realizacije projekta u kojoj se formira konačna verzija multimedijalnog proizvoda. Kod digitalnih multimedija postprodukcija se svodi na uredništvo, editovanje (eng. editing). Kad se radi sa zvukom i pokretnim slikama, to je montaža. 8.2.1 Multimedijalna preprodukcija

Multimedijalna preprodukcija predstavlja prvu fazu multimedijalnog projekta u kojoj se prikupljaju i razrađuju zahtevi naručioca/klijenta, definišu ciljevi, analiziraju korisničke specifikacije i pravi se projektni plan. Redosled aktivnosti i metod planiranja zavise od vrste proizvoda. Različite tehnologije i vidovi multimedijalne proizvodnje: video, grafika i/ili animacija opredeljuju postupke koji će se primenjivati u fazi preprodukcije. PRETHODNA ANALIZA U PREPRODUKCIJI

Prethodna analiza predstavlja prvu aktivnost u realizaciji svakog projekta i sastoji se od razrade ideje i sagledavanja postojećih rešenja iz predmetne oblasti.

U razvoju multimedijalnog projekta cilj je da se ideja o planiranom projektu identifikuje i vizualizuje.

Identifikacija ideje podrazumeva istraživanje, inkubaciju – spori razvoj bez uticaja spoljašnjih, opažljivih znakova i generisanje ideje.

Jedna od tehnika generisanja ideje je brejnstorming (eng. brainstorming – moždana oluja, stvaralački žar) – spontano grupno razmatranje da bi se proizvele ideje i rešenja za problem. Brejnstorming predstavlja intenzivnu mentalnu aktivnost razrade i vizualizacije ideja. Na početku je dobro da se razmotri što više ideja, brojnost ide ispred kvaliteta, loše ideje nekada navedu na dobre ideje. Da bi se uspešno kompletirala većina produkcija sa ostvarenom svrhom multimedijalnog proizvoda za koju je namenjen, definišu se zadaci – Brejnsorming koraci. Razlikuje se šest Brejnsorming koraka [8.1]:

a) Analiza projektnog zadatka Analiza projektnog zadatka predstavlja temeljno istraživanje zadate teme koja najčešće

nije zadata u strogo definisanom obliku. Razmatraju se mogući problemi i potencijalna rešenja: video, audio, tekst.

b) Analiza ciljne publike Analiza ciljne publike može biti demografska i psihografska.

130

Page 141: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Demografska analiza strukture ljudske populacije koristi statistiku koja se odnosi na godinu rođenja, smrti, ekonomski nivo, bolesti, geografske koncentracije ili znanja proizvoda. Psihografskom analizom se vrši klasifikacija populacije prema njihovim osobinama, kao što su način života, primarni interesi, verovanja. Na dizajn poruke utiču faktori kao što su: publika kojoj je namenjena, medijum, svrha i priroda poruke. Kada se planira za multimedijalnu produkciju, važno je definisati gde će se distribuirati zavšeni projekat, definisati krajnjeg korisnika – ciljnu publiku, što određuje kako će sadržaj biti prezentovan.

c) Definisanje cilja Definisanje cilja koji se želi postići multimedijalnim projektom služi kao odrednica multimedijalnoj produkciji. Kada se postavljaju ciljevi projekta, treba da budu jasno definisani, hijerarhijski uređeni i kvantitativno formulisani. Brojne vrednosti za

prikazivanje poruke omogućavaju da se kasnijim prikupljanjem podataka može ustanoviti da li je konačan proizvod uspešan. Ciljevi treba da budu realno dostižni, što znači da se uzimaju u obzir realne mogućnosti, isplativost i troškovi proizvodnje.

d) Osnovno istraživanje Osnovno istraživanje obuhvata proučavanje teme i tehnologije na kojoj se radi. Kreator multimedijalnog proizvoda istraživanjem izgrađuje subjektivno znanje o predmetnoj

materiji. Istraživanje može uključiti susret sa ekspertima, čitanje publikacije, istraživanje na internetu, ili pogledati kako su drugi profesionalci rešili slične probleme.

Proces generisanja ideje – Brainstorming za stvaranje multimedijalnog proizvoda uključuje i razmišljanje:

1) O emocijama – kakva osećanja su povezana sa projektom na kom se radi, kojim

se vizuelnim sredstvima i sumbolima mogu izraziti; 2) O analogijama – kakvim oblicima i bojama se mogu izraziti određene emocije, ili

toplota na primer; analogije pomažu da se ode dalje od originalnih reči i osmisle konkretni vizuelni elementi za projekat;

3) O suprotnostima; ideje treba svesti na jednu, onu koja najbolje može izraziti ciljeve.

e) Razmatranje sadržaja

Posle definisanja ideje razmatra se prototip/skica sadržaja. U multimedijalnom dizajnu prototip se može izraditi kao: serija skica, storyboard, Powerpoint slide show, Flash prezentacija, video koji simulira korišćenje sistema, kartonska simulacija, serija veb stranica. Skica sadržaja je narativni opis sadržaja multimedijalnog proizvoda, konfiguracija istorije/priče ili poruke koja treba da se prenese korisnicima, koristeći odgovarajuću usmenu ili pismenu tehniku. Istraživane informacije se prikazuju određenim redosledom. Dizajnirane su da obezbede usredsređivanje na ideju ili subjekat videa.

Razvijanje teme multimedijalnog projekta uključuje:

1) Identifikaciju stila multimedijalnog proizvoda,

131

Page 142: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

2) Razmatranja dizajna screen layout uključujući: ravnotežu (eng. balance), jedinstvo (eng. unity), boju (eng. color).

3) Skiciranje na papiru screen layout, raspored osnovnih elemenata. 4) Definisanje interfejs dizajna.

Korisnički interfejs je medijum preko koga korisnik vrši interakciju sa multimedijalnim proizvodom, koji uključuje navigaciju od strane korisnika u jednoj aplikaciji i reakciju/odziv aplikacije na aktivnost, kao što je klik na button ili hiperlink. U toku formiranja konture sadržaja utvrđuje se koja će informacija biti uključena u multimedijalni proizvod. Informacija treba da bude sažeta i organizovana kolekcija istraživanja koja podržava izabrani cilj. Većina produkcijskih tekstova u audio/video proizvodnji pisana je na stranici koja je podeljena na dve kolone. U levoj koloni je opis video scene, a u desnoj odgovarajući audio. Selekcija reči, zvuka i slike utiče na postizanje zahtevanog cilja.

f) Okvirni nacrt – scope dokument

Skoup dokument treba da specifikuje sledeće:

1) Metode na osnovu kojih će korisnik ostvariti multimedijalnu interakciju, 2) Izvođačke kriterijume projekta, kao što su vreme obrade i raspoloživo vreme, 3) Osobine projekta kao što su modularnost (norma, standard) i bezbednost, 4) Ograničenja u mogućnostima za kreiranje multimedijalnog proizvoda, kao što su

korišćenje specifičnog softvera ili metodologije.

Svrha skoup dokumenta je da produkcioni tim precizno shvati postavljene produkcione zahteve i da ga koristi za proizvodnju i kontrolu realizacije multimedijalnog projekta.

PRIČA NA TABLI - STORYBOARD

Storibord predstavlja očigledan, sažet i strukturiran prednacrt sadržaja multimedijalnog proizvoda.

Za video produkciju, storibord je vizuelna, grafička, reprezentacija svake specifične sekvence u videu. Storibording (eng. storyboarding) je proces stvaranja niza skica oblika strip knjige kojima su prikazani ključni spotovi, željeni okviri – frejming (eng. framing) u videu i glavni objekti kao i akcije za svaki snimak, sa detaljnim opisom raznih poruka, razgovora, slika.

Storibord se koristi kao vodič za snimanje ili animaciju. Njime se određuje broj i tip snimka za svaki video ili audio proces, kao i specijalni efekti i tranzicije – cue. On pomaže razvojnom timu da proceni logički tok sekvence koja se koristi u videu, obezbedi miran, blag (eng. smooth) pokret i odredi digitalni audio i video sadržaj koji je potrebno da se snimi i edituje.

U multimedijalnim aplikacijama storibord reprezentuje izgled i linkove svakog ekrana multimedijalnog projekta. Osnovna funkcija storiborda je povezivanje sadržaja i poruke, tako da bude olakšan razvoj multimedijalnog proizvoda sa softverskim alatima. Jedna stranica storiborda opisuje sliku multimedijalnog proizvoda u jednom određenom vremenskom trenutku.

Storibord sadrži glavnu poruku koja se želi preneti korisniku i precizan sadržaj multimedijalnog proizvoda sa jasnim uputstvom za oblikovanje sadržaja, što znači sledeće:

132

Page 143: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

• Identifikaciju sadržaja koji treba da ima specijalnu dozvolu ili copyright izdanje, • Ukupan broj stranica – layout-a, • Neophodne detalje za navigaciju, • Definisanje određenih oblika interaktivnosti, • Informacije u vezi sa projektantima (dizajniranje) multimedijalnog proizvoda, • Komentare i druge korisne informacije za programere koji će da preuzmu kreiranje

multimedijalnog proizvoda.

Za snimanje videa definiše se lokacija, postavljanje svetla i položaja kamera. Posebno se analiziraju potencijalni problemi kako za snimanje slike tako i za snimanje zvuka. Određuje se mesto gde će biti postavljene kamere, veličina frejma i kretanje glumca u kadru. PROCENA TROŠKOVA

Procena troškova je jedan od ključnih elemenata za uspešnu realizaciju multimedijalnog projekta. Radi se na osnovu procene troškova za rad i materijalnih troškova. Troškovi za rad određuju se na osnovu cene učešća angažovane ekipe, a materijalni troškova na osnovu cene korišćene opreme za produkciju, postprodukciju i distribuciju multimedijalnog proizvoda. Cena za rad računa se na osnovu cene norma časa svakog angažovanog pojedinca u projektnom timu i vremena angažovanja svakog izvršioca. Za organizovanje resursa za multimedijalnu produkciju, distribuciju i prezentaciju potrebno je identifikovati:

• Projektni tim: izvršioce sa znanjem dizajna i tehnologija za proizvodnju, distribuciju i prezentaciju multimedijalnih sadržaja: glumce, producente i direktore, tehničko osoblje, kamermane, audio/video inženjere, direktora svetla;

• Hardverske resurse: uređaje i sisteme za prijem i obradu, montažu i distribuciju multimedijalnih sadržaja: skeneri, audio rekorderi, video rekorderi, fotoaparati, video kamere, računari za audio i video obradu i montažu, širokopojasne računarske mreže, uređaji za audio reprodukciju, uređaji za video reprodukciju.

• Softverske alate za obradu teksta, zvuka i slike kao što su: Painter ili Photoshop – za obradu bitmapirane grafike, ImageReady – za veb grafiku,

Freehand i Illustrator – za vektorsku grafiku, Dreamweaver – za razvoj veb prezentacija, Sound Forge i SoundMaker – za obradu zvuka, Flash – za animaciju i interaktivnost, Premiere, After Effects i QuickTime Pro – za video i audio montažu, 3D MAX i MAYA – za animaciju, kao i softver koji omogućava dizajneru da poveže različite multimedijske elemente u vremenu i prostoru i doda celini interaktivno ponašanje.

• Pogodan medijum za dostavljanje. RADNI TIM ZA MULTIMEDIJALNU PRODUKCIJU

Radni timovi za multimedijalnu produkciju sastavljaju se na osnovu planiranog budžeta i kompleksnosti projekata. Za velike projekte angažuju se specijalisti, dok jednostavnije projekte

133

Page 144: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

mogu raditi izvršioci koji objedinjuju više različitih funkcija. Sledeće specijalnosti se mogu izdvojiti kao posebne:

• Menadžer projekta – oblikuje projekt u svim fazama rada, počev od trenutka programske

i uredničke odluke za određeni projekat pa do njegove potpune realizacije. Predlaže i usvaja tehnološko-produkciona rešenja realizacije projekta. Vrši rediteljsku razradu emisije i izrađuje detaljnu knjigu snimanja.

• Urednik – osmišljava projekte i akcije, obavlja predistraživanje, istražuje, prikuplja, stilski i žanrovski klasifikuje i uređuje sadržaj, učestvuje u realizaciji, koordinira rad ekipe.

• Direktor produkcije – upravlja, organizuje, koordinira i kontroliše tehnološki proces proizvodnje.

• Producent – izrađuje/odobrava plan proizvodnje, organizuje i finansijski vodi proizvodnju i finalizaciju projekata, odgovoran je za budžet projekta, sprovođenje tehničkih standarda i rokove proizvodnje.

• Reditelj – učestvuje u oblikovanju projekta u svim fazama rada, počev od trenutka programske i uredničke odluke za određeni projekat pa do njegove potpune realizacije, predlaže i usvaja tehnološko-produkciona rešenja realizacije projekta, učestvuje na dramaturškoj obradi scenarija, vrši rediteljsku razradu emisije i izrađuje detaljnu knjigu snimanja, vrši izbor glumaca, izvođača i drugih učesnika u projektu, rukovodi kreativnim procesom snimanja slike i zvuka, kreativno rukovodi postprodukcijskim procesom.

• Snimatelj slike – u pripremnoj fazi učestvuje u utvrđivanju tehničko-produkcionih uslova, utvrđuje tehničke standarde snimanja slike, potrebnu tehniku i opremu za snimanje slike, u fazi snimanja postavlja svetlosnu postavku, pozicionira kameru, snima sliku u skladu sa produkcijskim zahtevima, utvrđuje sve pokrete kamere, način i opremu za njihovo izvođenje.

Pored navedenih za veće projekte i televizijsku produkciju postoje sledeće specijalnoasti:

dizajner svetla, montažer, video-mikser, majstor zvuka, mikser zvuka, majstor slike, dizajner video grafike i snimatelj tona. 8.2.2 Multimedijalna produkcija

Produkcija je druga faza realizacije projekta, realizacije multimedijalnog proizvoda u kojoj se vrši neposredno formiranje sadržaja koji će se ugrađivati u proizvod. U fazi produkcije, zavisno od kompleksnosti proizvoda, koristi se računar, kamera, glumci, kostimi, studio i scenografija.

U zavisnosti od projekta zavise i aktivnosti u toku produkcije. U video produkciji to može biti poseta lokacija, organizacija opreme, kostima, rekvizita i snimanje.

Procesi u fazi produkcije su:

• Pisanje scripta, • Istraživanje i pisanje sadržaja, • Izbor i priprema odgovarajuće opreme za video snimanje: kamera, tripod, mikrofoni,

134

Page 145: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

svetlo, • Snimanje audio i video sadržaja koristeći storyboard, • Montaža audio i video sadržaja, • Stvaranje multimedijalnih komponenti, • Razvoj kompjuterske animacije, • Interfejs dizajn, • Grafičko oblikovanje, • Integrisanje multimedijalnih komponenti u multimedijalni proizvod (eng. authoring), • Testiranje proizvoda.

U video produkciji postoje sledeće faze:

• Video plan – capture, • Uvođenje videa u multimedijalni projekat, • Identifikacija softvera koji je na raspolaganju za video produkciju /nelinearnu montažu, • Nelinearna montaža videa, titlovanje, specijalni efekti, prelazi–tranzicije.

Osnovne strategije organizacije sadržaja Osnovne strategije organizacije sadržaja su:

a) Izveštaj, reportaža, raport, saopštenje, b) Hronološka, c) Geografska, d) Sistemska, e) Strukturalna.

U svim ovim strategijama, sadržaj je organizovan u hijerarhijskim nivoima. Da bi

korisnik lokalizovao određenu informaciju, potrebno je da pređe hijerarhiju (eng. drill down). Hijerarhijska organizacija daje korisniku informacije u pogledu organizacione konstrukcije i istovremeno ne dopušta da ga “pretrpaju” nepotrebne informacije, što bi bilo neizbežno u linijskoj konstrukciji organizacije.

a) Izveštaj reportaža i sopštenje predstavlja najopštiji oblik organizacije sadržaja za enciklopedijske oblike rada. Sadržaji se grupišu u konstitucione i logičke grupe.

b) Hronološka organizacija predstavlja vremensku organizaciju sadržaja i prikazivanje

multimedijalne aplikacije kao što je proizvodnja videa na vremenskoj osi. Dizajner treba da izvrši korelaciju događaja i odgovarajućih datuma. Da bi se problem umanjio upotrebljavaju se razne tehnike zasnovane na prepoznavanju, a ne na sećanju, kao što je korišćenje pop-up displeja za prikazivanje događaja dok dizajner prelazi vremensku osu (eng. timeline) i pokazivanje slika koje reprezentuju glavne istorijske momente, na vremenskoj osi.

c) Geografska organizacija predstavlja prikazivanje geografskih sistema i upotrebu 2D

karti ili 3D predstavljanja. Hijerarhijska konstrukcija i navigacija je podržana opercijom

135

Page 146: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

zum (eng. zoom). Kombinacija geografskog i vremenskog prikazivanja je veoma česta, jer pokriva veliki broj multimedijalnih proizvoda, kao što je prikazivanje istorijskih događaja za oblast neke države, ili prikazivanje prostorno-vremenskih manifestacija.

d) Sistemska organizacija sadržaja je klasična metodologija prikazivanja načina

funkcionisanja sistema sa tehnološkog aspekta. Ima široku upotrebu u obrazovne svrhe, tutorijali i simulacije. Sistemska organizacija je posebno pogodna za interaktivne multimedijske proizvode. Sistem se deli na podsisteme, podsistemi na druge podsisteme, sve dok se ne stigne do osnovnih sastavnih komponenti. Glavni problem sa sistemskom organizacijom je teškoća prilagođavanja prikazivanja velikom broju kategorija korisnika koji nisu upoznati sa tehnologijom koja se objašnjava. Iz tog razloga dobro je da se koriste neki početni primeri iz svakodnevnog života korisnika za početno razumevanje sistema.

e) Strukturalna organizacija sadržaja ima za cilj prikazivanje strukture organizama i

preduzeća što se tiče njihovih aktivnosti, službenika, proizvoda i usluga koje daju. Prikazivanje je hijerarhijsko, pošto se organizacija preduzeća zasniva na hijerarhiji osoblja, kao i odseka.

8.2.3 Multimedijalna postprodukcija Multimedijalna postprodukcija predstavlja završnu fazu u kojoj se formira konačna verzija multimedijalnog proizvoda. Kod digitalnih multimedija postprodukcija se svodi na uredništvo, editing. Kad se radi sa zvukom i pokretnim slikama onda je to audio i video montaža. Postprodukcija ima zadatake da izradi:

• Originalni, glavni (eng. master) uzorak i proizvede duplikate. • Uputstvo za korisnike (eng. user manual) i napravi arhivu proizvoda – pakovanje –

ambalažu proizvoda. Video postprodukcija je obrada snimljenog videa, materijala ili filma u završni proizvod

za emitovanje ili distribuciju. Osnovni procesi u video postprodukciji su rendering i snimanje završne verzije na prenosni medij. Rendering (eng. rendering) predstavlja proces kompjuterske sinteze slike od sirovih podataka, modela, odnosno elemenata scene čije objekte i osobine materijala uobličavaju svetlosni izvori, položaji i pravac posmatranja gledaoca. Osvetljenje ima presudan uticaj na scenski doživljaj pa se renderovanje često označava kao poslednja faza u procesu dizajniranja slika. Poslednja faza pred distribuciju multimedijalnog proizvoda je snimanje kreiranog proizvoda na spoljašnji prenosni medij: tejp, DVD, CD, fleš memoriju. Distribucija multimedijalnog proizvoda može da se obavlja preko interneta – on-line, ili pomoću memorijskih medija CD-ROM, DVD, fleš memorija – off-line.

136

Page 147: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

8.3 Slika u multimediji Slika, sa fizičkog aspekta, predstavlja raspodelu svetlosti na površini, u ravni ili prostoru. Svetlost je elektromagnetni talas sa širokim opsegom talasnih dužina od 390 nm do 760 nm, koje se pojedinačno vide kao boje svetlosti. Boja predstavlja jedan uži deo svetlosnog spektra koji sistem za vid razlikuje od susednih delova spektra. Boje se klasifikuju na primarne, sekundarne i tercijarne. Primarne ili osnovne boje su crvena, plava i žuta. Sekundarne boje ili boje drugog reda su narandžasta (žuta + crvena), zelena (plava + žuta) i ljubičasta (crvena + plava) . Tercijarne boje – boje višeg reda su kombinacije primarnih i sekundarnih boja. Ljudsko oko razlikuje oko 10 miliona različitih boja. Ogromna paleta tercijarnih boja dobija se mešanjem primarnih i sekundarnih boja. Postoje dva načina mešanja boja, aditivno i subtraktivno mešanje boja. Aditivno mešanje boja odvija se na osnovu superpozicije, sabiranja svetlosnih talasa pojedinih boja. Svaka boja se može sintetizovati od odgovarajuće količine tri osnovne boje. Primer aditivnog mešanja boja su slike na ekranima. Subtraktivno mešanje boja odvija se na osnovu međusobne apsorpcije obojenih čestica, što je slučaj u slikarstvu. Monohromatska slika je crno-bela slika, a hromatska slika je slika u boji. Slika u multimediji predstavlja 2D tabelu diskretnih elemenata slike – piksela. Piksel (eng. picture element) je elemenat slike određen svojom sjajnošću i položajem u slici. Sjajnost piksela se izražava brojnom vrednosti intenziteta. Položaj piksela predstavlja se koordinatama (x, y). 8.3.1 Memorisanje, prenos i prikazivanje slike

Memorisanje, prenos i prikazivanje slike vrši se pomoću elektronskih uređaja posle procesa konverzije piksela iz svetlosnog u električni domen i formiranja video signala.

Video uređaji za snimanje slike – elektronske kamere, razvijeni su po ugledu na čulo vida živih organizama. Oko je predstavljalo uzor za konstrukciju elektronske kamere.

Pikseli optičke slike pretvaraju se u mrežnjači oka u bioelektrične impulse, takozvane talase akcionog potencijala. Od mrežnjače, snop nervnih vlakana prenosi talase akcionih potencijala do centra za vid u temenom delu korteksa. U centru za vid odvija se proces percepcije, prepoznavanje sadržaja, tumačenja slike. Čulo vida ima visoku rezoluciju zahvaljujući ogromnom broju fotoreceptora u mrežnjači i nervnih vlakana u živčanom snopu kojih ima oko 120 000 000. Pikseli se u sistemu čula vida paralelno konvertuju, prenose i obrađuju.

Tehnički video sistemi, za razliku od čula vida sa paralelnim sistemom prenosa, koriste serijski sistem prenosa. Serijski prenos se zasniva na transformaciji prostornih koordinata u vremenske. Tokom snimanja slike linearnom sekvencijalnom analizom, prostorne koordinate transformišu se u vremeski niz. Tokom reprodukcije linearnom sintezom, formiraju se prostorne koordinate.

137

Page 148: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Kod sofisticiranih tenničkih video sistema, razvijaju se, po ugledu na moždani centar za vid, viši nivoi obrade slike. Istražuje se sadržaj, semantika slike, i razvijaju sistemi za prepoznavanje oblika. Uređaji koji transformišu optičku u električnu sliku pogodnu za obradu i prenos su elektronske kamere i skeneri. To su uređaji za snimanje – capture uređaji.

Optička slika kao 2D raspodela svetlosti transformiše se u 2D sliku raspodele elektronskih naelektrisanja.

Dvodimenzionalna slika raspodele elektronskih naelektrisanja transformiše se u analogni video signal.

Memorisanje slike vrši se posredstvom video signala u kome su sadržane informacije o svim elementima slike – pikselima.

Kod savremenih uređaja analogni video signal transformiše se u digitalni video signal koji obrađuju mikroprocesori. Slika se u digitalnom obliku memoriše kao matrica u kojoj su redovi pikseli na koordinati X, a kolone pikseli na koordinati Y. 8.3.2 Senzori slike Senzori slike su komponente video sistema koje transformišu optičku sliku u video signal. Razlikuju se senzori slike sa elektronskim mlazom i senzori slike sa poluprovodnicima. Senzori slike sa elektronskim mlazom: vidikoni, ortikoni, super ortikoni, plumbikoni, satikoni. Fotoelektrični senzori u vidu mozaika na poluprovodnoj pločici smešteni su u vakuumsku cev od stakla. Svetlosna slika koja se projektuje na fotoosetljivu senzorsku pločicu transformiše se u sliku naelektrisanja. Slika naelektrisanja skenira se pomoću elektronskog mlaza koji zatvara strujno kolo preko radnog otpornika formirajući na taj način video signal. Senzore slike sa elektronskim mlazom potisnuli su mnogo manji poluprovodnički senzori. Senzori slike sa poluprovodnicima predstavljaju fotoosetljive pločice sa mozaikom elemenata koji pod dejstvom svetlosti formiraju električnu sliku. Za očitavanje je moguć pristup svakom nizu fotoosetljivih elemenata koji reprezentuju piksele. Naelektrisanja elemenata mozaika proporcionalna su intenzitetu osvetljaja pojedinih piksela. Sukcesivnom analizom 2D slike naelektrisanja formira se video signal. Senzori slike sa poluprovodnicima imaju adresibilnu vezu do svakog piksela 2D slike elektronskog naelektrisanja, što daje fleksibilnost u očitavanju. Postoje više izvedbi ovih senzora pod nazivom:

• Uređaji sa spregnutim naelektrisanjem (eng. charge-coupled device – CCD), • Uređaj za detektovanje punjenja (eng. charge injection device – CID), • Komplementarne logike tranzistorski metal-oksid-poluprovodnik (eng. Complemantary

metal-oxide-semiconductor – CMOS), • Fotodiode (eng. photodiode).

CCD, CID i CMOS senzori slike sastavljeni su od miliona fotoosetljivih elektronskih senzora. Zavisno od intenziteta svetlosti, u elektronskim senzorima se stvara određeno naelektrisanje. Proces pražnjenja se vrši primanjem određene kontrolne naredbe. Izlaz senzora proporcionalan je integralu svetlosne energije. Elektronski senzori su raspoređeni u matričnom obliku – obliku mreže. Svaki senzor odgovara jednom pikselu. Za dobijanje boje upotrebljavaju se R, G, B filteri kojima se oblažu senzori. CCD, CID i CMOS elementi se integrišu u 2D matrice, formirajući senzore slike koji se koriste u kamerama.

138

Page 149: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Fotodiode se integrišu u 1D nizove koji se koriste kao senzori u skenerima. Napon na izlazu fotodiode je proporcionalan intenzitetu svetlosti. 8.3.3 Osnovne obrade slike Osnovu za obradu slike čine elementi 2D prostora – pikseli, elementi 3D prostora – vokseli i elementi vremenske koordinate – vremenski intervali. Osnovne obrade slike su: analiza slike, digitalizacija signala slike, poboljšanje, restauracija, kompresija i rekonstrukcija. Analiza slike predstavlja pretraživanje i odmeravanje elemenata slike, pojedinih segmenata slike i slike u celini. Slika se može analizirati po površini, nivoima i sadržaju. Analiza po prostoru vrši se sistematskim pretraživanjem – skeniranjem, liniju po liniju, elemenata slike po površini fotoosetljivog senzora slike. U senzoru optičke slike proizvodi se analogna električna 2D slika. Linijskom analizom se analogna slika sa senzora prevodi u analogni video signal pri čemu se 2D koordinate piksela transformišu u vremenske intervale video signala. Linijska analiza slike sa proredom primenjuje se u televizijskim sistemima:

• PAL sistem 625/50 Hz (Evropski standard linijske promene faze (eng. phase alternating line – PAL)),

• NTSC sistem 525/60 Hz (Američki standard nacionalnog komiteta za televizijski sistem (eng. National Television System Committee – NTSC))

• HDTV –. Televizija visokokog kvaliteta – definicije (eng. high-definition television – HDTV) postoji više varijanti. Osnovne su dve: 1125 /60 Hz i 1250/50 Hz, ali obzirom na digitalnost fleksibilan je i razvijaju se nove verzije sa znatno većim brojem linija. Analiza slike po nivoima koristi se za izdvajanje ivica, segmentaciju i identifikaciju

objekata. Analiza slike po sadržaju – semantička analiza koristi se za analizu sadržaja slike i prepoznavanje oblika.

Analizi slike po nivoima i semantičkoj analizi prethodi digitalizacija analognog video signala. Digitalizacija predstavlja analogno-digitalnu konverziju koja se odvija u tri koraka: odabiranje, kvantizacija i kodovanje. Odabiranje ili uzorkovanje – sampling predstavlja proces tokom kojeg se iz kontinualnog video signala, u određenim vremenskim intervalima, periodima odabiranja, izdvajaju trenutne vrednosti signala, odbirci – uzorci u cilju diskretizacije video signala i konverzije iz analognog u digitalni oblik. Diskretizacijom se oslobađaju vremenski intervali između uzimanja odbiraka za formiranje višestrukog prenosa signala – vremenskog multipleksa. Prevođenje signala iz analognog u digitalni oblik – A/D konverzija omogućava složene obrade signala slike. Kvantizacija je proces odmeravanja što znači procenu brojne vrednosti svakog odbirka. Odbircima se dodeljuju vrednosti iz konačanog skupa vrednosti koje su određene kvantizacionim nivoima. Vrednosti svih odbiraka koji pripadaju jednoj kvantnoj zoni uzimaju vrednost kvantnog simbola koji reprezentuje datu zonu.

139

Page 150: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Kodovanje je proces izražavanja kvantovane vrednosti odbiraka pomoću određenog koda, odnosno brojnog sistema. Po pravilu koristi se binarni brojni sistem gde je ukupan broj simbola N određen željenim brojem bita B prema formuli N = 2B. Poboljšanje slike predstavlja postupak obrade kojim se vrši poboljšanje kontrasta, potiskivanje šuma, pojačanje oštrine i bojenje. Postupci za poboljšanje slike relativno su jednostavni i mogu se obavljati u realnom vremenu. Restauracija slike je postupak obrade kojim se poboljšava kvalitet slike kada je degradacija slike poznata i kada se može formirati model degradacije. Tu spada korekcija geometrijskih izobličenja optičkog sistema kamere, potiskivanje šuma čiji je statistički model poznat i korekcija smanjene oštrine slike usled pokreta ili defokusacije kamere. Metode restauracije su kompleksni i najčešće se ne mogu izvršavati u realnom vremenu. Kompresija slike je postupak smanjenja broja informacionih bita pomoću kojih se slika memoriše i prenosi. Standardna filmska slika dimenzija 24 mm × 36 mm, ima oko 107 piksela ako je rezolucija filma 0.01 mm. Standardna digitalna slika rezolucije 512 × 512 piksela ima oko 256 000 elemenata kodovanih sa 8 bita/odbirku smešta se u 256 KB memorije. Za memorisanje TV slika u toku jedne sekunde potrebno je 10 MB. Efikasnost kompresije zavisi od sadržaja slike. Sve metode kompresije sadrže programski deo i deo za podatke koji se povećava sa povećanjem stepena kompresije što ograničava krajnju uštedu u potrebnom memorijskom i prenosnom kapacitetu. Kompresija bez gubitaka (eng. lossless compression) omogućava dekompresiju originalne slike. Dekomprimovana slika je identična originalnoj slici. Kodovanje dužine niza (eng. run-length encoding – RLE) je kompresija sadržaja slike bez gubitaka pomoću beleženja dužine niza istih vrednosti piksela. Algoritmi RLE kompresije su:

• Promenljiva dužina kodova VLC, Huffman-ov codes • Kodiranje na bazi rečnika (eng. dictionary-based coding – DBC)

Kompresija sa gubicima (eng. lossy compression) omogućava dekompresiju koja daje

aproksimativnu sliku originala. Kompresija JPEG je kombinacija smanjenja količine podataka i kompresije podataka. Niz piksela predstavljenih koordinatama x i y i vrednošću z koja odgovara sjajnosti ili boji, moguće je transformisati u frekvencijski domen koristeći Fourier-ovu transformaciju. Komponente ove transformacije koje se nalaze u spektru viših frekvencija odgovaraju naglim promenama intenziteta čije efekte ljudsko oko manje primećuje, naročito ako se radi o slikama u boji. Primenjuje se diskretna kosinusna transformacija DCT, kojom se dobija 2D matrica koeficijenata istih dimenzija kao i početna 2D matrica vrednosti piksela. Pomoću DCT izvršena je promena podataka u formu pogodniju za procenu i komprimovanje, dobija se 2D slika u prostornom frekvencijskom domenu u kojem se lakše određuju i odstranjuju beznačajne suvišne komponente. Da bi se smanjilo vreme obrade proporcionalno sa kvadratom broja piksela, DCT se vrši nad slikom i to sa blokovima od 8 × 8 piksela.

Komponente na različitim frekvencijama kvantuju se različitim brojem nivoa kvantizacije. Broj kvantizacinih nivoa može se definisati posebno za svaki koeficijent

140

Page 151: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

kvantizacionom matricom. Mnoge komponente, naročito na višim frekvencijama, aproksimiraju se sa vrednošću nula, dok je kod ostalih komponenti smanjen broj bitova potrebnih za memorisanje vrednosti komponenata koje nemaju vrednost nula. Naknadno se na njih primenjuje RLE kodovanje. Selekcija se vrši specijalizovanim alatima za izdvajanje pravougaonih i eliptičnih oblika, nepravilnih površina sa tkz. magičnim štapom (eng. magic wand) i magnetskim lasom (eng. magnetic lasso). Selekcija definiše masku koja stoji preko dela slike koji nije selektovan i koji je zaštićen od obrade. Maska može biti: providna, neprovidna, i poluprovidna. Nijansirane maske nazivaju se alfa kanali (eng. alpha channel), mogu imati 256 nivoa providnosti. Bojenje, filtracija i druge modifikacije piksela pomoću digitalnih maski proporcionalno je vrednosti zapisanoj u alfa kanalu. Dve ili više slika mogu se utopiti u jednu pomoću raznih veličina prozirnosti maski kao i ublažiti oštre ivice objekata na slici. Obrada pojedinačnih piksela omogućava proporcionalne promene bitmapirane slike u celini kao što su dobijanje negativa, korekcija sjajnosti i kontrasta, kao i korekcija boja. Za vrednost piksela p nova vrednost p' se dobija kada se primeni funkcija f, tj.,

p' = f(p). Funkcija f se naziv funkcija mapiranja. Primer konstrukcije negativa crno bele slike:

f(p) = W – p gde je

W vrednost piksela koja reprezentuje belu boju. Obrada grupe piksela omogućava geometrijske promene u slici i prilagođavanje bitmapa različitim ekranima. Ova se obrada zasniva na procesu konvolucije koji pri transformaciji vrednosti piksela u obzir uzima vrednost piksela u neposrednom okruženju tog piksela. Filteri čiji je efekat zamućenje ili pak izoštravanje slike su dve tipične primene obrade grupe piksela. Rekonstrukcija slike je postupak pomoću kojeg se 2D ili 3D objekti sastavljaju iz više 1D ili 2D projekcija. 8.3.4 Bitmapirana slika Bitmapirana slika predstavlja 2D niz vrednosti elemenata slike – piksela u digitalnoj video memoriji ili prikazanih na ekranu u vidu optičke slike. Pikseli bitmapirane slike formiraju se u procesu snimanja ili skeniranja optičke slike. Raster slike ili bitmapa predstavlja pravougaonu mrežu piksela kojom se formira slika na ekranima ili papiru. Monohromatska slika predstavlja se 2D matricom, gde su reprezentovane vrednosti odbiraka na koordinatama X i Y koje odgovaraju vrednostima intenziteta svetlosti na određenom

141

Page 152: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

mestu slike. Opseg mogućih vrednosti intenziteta svetlosti je određen brojem kvantizacionih nivoa – brojem nivoa sivog, zavisno od broja bita po pikselu. Hromatska slika predstavlja se sa tri 2D matrice (crvena, zelena i plava) gde su reprezentovane vrednosti odbiraka na koordinatama X i Y koje odgovaraju vrednostima intenziteta boje na određenom mestu slike. Rezolucija slike, kao osnovni parametar bitmapirane slike, predstavlja meru sa kolikom finoćom digitalna slika, sa konačnim brojem piksela, aproksimira kontinualnu sliku. Kvalitet slike zavisi od broja piksela – prostorne rezolucije i broja kvantizacionih nivoa – nijansi. Geometrijske promene u bitmapiranoj slici vrše se transformacijama za rekonstrukciju slike iz jednog oblika u drugi. To je ekvivalentno transformaciji u analogni video signal i ponovno odabiranje pri čemu se koriste metode interpolacije. Rezolucija za štampače i skenere izražava se brojem tačaka po jedinici dužine (eng. dots per inch – dpi). Rezolucija štampača se definiše brojem linija po inču. Rezolucija štampači je 600 dpi do 1200 dpi, a najbolji do 2700 dpi. Štampači u boji mogu imati rezoluciju čak i 1200 tačaka po inču, što ne znači da se tako velika rezolucija koristi za štampanje svih fotografija. Časopisi u boji koriste rezoluciju od 137 linija po inču, dok se u knjigama najviše upotrebljavaju rezolucije od 150 tačaka po inču. Štampači u boji koriste četiri do šest osnovnih boja. Rasterska ćelija štampača u boji sadrži osnovne boje i definiše veličinu piksela kolor slike. Rezolucija skenera određuje sa kolikom finoćom će raster slike biti iskorišćen da reprezentuje datu sliku. Bitmapirana slika će imati više detalja ako je veći dpi skenera. Tipičan opseg vrednosti rezolucije skenera je oko 300 dpi do 3600 dpi i više. Veličina rezolucije za skeniranje bitmapirane slike zavisi od toga za koju je namenu planirana slika: da li će se slika štampati, da li je slika planirana za prikazivanje na monitoru, ili za veb prezentaciju. Fotografije u časopisima reprodukovane su sa oko 200 dpi do 300 dpi. Ako se planira skeniranje slike iz časopisa i slanje na veb, skeniranje se može izvršiti sa rezolucijom od 72 dpi. Dubina boje (eng. bit depth) je broj bita koji se dodeljuje svakoj tački i koristi se za opis boje. Sa većom vrednosti bit depth skener je u mogućnosti da odabira više boja, što omogućava veći raspon u promeni kontrasta (eng. contrast) i sjajnosti (eng. brightness) bitmapirane slike. Da bi se formirala “true colour” skeneru je potrebno 24 bit depth, znači da se dodeljuje po 8 bita za crevenu, plavu i zelenu boju za svaku tačku – piksel. U tom slučaju ukupan broj mogućih boja je 28 × 28 × 28 = 256 × 256 × 256 = 16 777 216 ≈ 16.7 miliona boja. Rezolucija bitmapiranih slika na televizijskim ekranima i računarskih monitora izražava se brojem piksela u slici. Primeri slika sa visokom i niskom rezolucijom dati su na Slici 8.3.4.1. Nezavisno od veličine ekrana, televizijska slika se prikazuje pomoću istog broja piksela i to:

• PAL standard: 720 × 576 piksela, • NTSC standard: 640 × 480 piksela, • HDTV standard: 1280 × 720 piksela.

Rezolucija slike računarskih monitora može biti:

• VGA standard (video grafička kartica – niz (eng. video graphics array – VGA)): 640 × 480 pixela, • SVGA standard (super video grafička kartica – niz (eng. super video graphics array –

142

Page 153: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

SVGA)): 800 × 600 pixela, • XGA standard (proširena grafička kartica – niz (eng. eXtended graphics array – XGA): 1024 × 768 pixela, • 14 inčni monitor sa 72 dpi = 640 × 480 piksela, • 17 inčni monitor sa 72 dpi = 832 × 624 piksela.

Slika 8.3.4.1—Primeri slika sa visokom i niskom rezolucijom

Dimenzije bitmapirane slike izražavaju se ukupnim brojem piksela koje sadrži i ne poklapaju se uvek sa dimenzijama ekrana. Slika sa stranicom dužine 128 piksela na ekranu sa rezolucijom: od 72 dpi, biće 45 mm, od 115 dpi od 28 mm, a na štampaču sa 600 dpi biće široka samo 5 mm širine. To se može izraziti relacijom: fizičke dimenzije slike (inch) = dimenzije ekrana u pikselima (pix) / rezolucija uređaja (pix/inch). Softver za prikazivanje originalnih dimenzija slike skalira bitmap pomoću formule:

faktor skaliranja = rezolucija uređaja / rezolucija slike. Reprodukcija bitmapa na ekranu sa većom rezolucijom vrši se interpolacijom – prekoodabiranje (eng. oversampling), a na ekrane sa manjom rezolucijom izbacivanjem međupiksela – pododabiranje (eng. downsampling). 8.3.5 Vektorski generisane slike

Vektorski generisana slike su veštačke slike urađene pomoću vektorske grafike. Vektorska grafika ili geometijsko oblikovanje predstavlja proizvodnju slika pomoću

geometrijskih oblika kao što su: tačke, linije, krive i poligoni. Zasniva se na matematičkom opisu

143

Page 154: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

pravih i krivih linija i oblika. Vektorska aritmetika ili analitička geometrija glavni je matematički aparat koji se koristi pri proračunu vrednosti piksela. Sa operativnog aspekta, vektorska grafika predstavlja niz komandi kojima se ostvaruje generisanje i transformacije raznih geometrijskih oblika. Prilikom prikazivanja vektorske grafike na ekranu, odvija se proces renderovanja. Prikazivanje vektorskih slika – renderovanje zahteva prethodni proračun za generisanje vrednosti piksela. Osnovni elementi za formiranje vektorskih slika su:

• Koordinate – brojčani podaci o položaju tačaka u ravni prostora, • Koordinatni sistem – ravan ili prostor u kome su definisane ose i koordinatni početak, • Vektori – orijentisane duži za predstavljanje fizičkih veličina koje karakteriše jačina,

pravac i smer delovanja, • Linije – neprekidno geometijsko mesto tačaka koje povezuje određeno svojstvo, • Poravnanje – približno predstavljanje provlačenjem glatke linije između tačaka koje od

te linije odstupaju sa određenom tolerancijom, • Bezijerove krive – linije koje spajaju zadate tačke na optimalan način kao što je prikazano

na Slici 8.3.5.1-a, • Putanje – linije kojima se označavaju kretanja određenih objekata, što se takođe vidi na

Slici 8.3.5.1-a, • Potezi i popunjavanje – standardizovano povezivanje tačaka i bojenje određenih površina

što je prikazano na Slici 8.3.5.1-b.

Slika 8.3.5.1—Primeri: Bezijerova kriva, putanja, potezi i popunjavanje Transformacije koje se jednostavno izvode u vektorskoj grafici su skaliranje, rotacija, translacija i refleksija kao što je prikazano na Slici 8.3.5.2.

Vektorske slike (Slika 8.3.5.3-a) u poređenju sa bitmapiranim slikama – rasterskom grafikom (Slika 8.3.5.3-b):

• Zauzimaju manje memorijskog prostora, manja je količina podataka, što je prikazano u

Tabeli 8.3.5.1,

144

Page 155: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Slika 8.3.5.2—Ilustracija vektorskih transformacija: skaliranje, rotacija, translacija i refleksija

• Jednostavnije su za editovanje, • Lakše se pamte jer se percepcija mozga zasniva na pamćenju osnovnih karakteristika

slike, kontura, engrama, • Pogodnije su za internet, • Reprezentacija vektorskih slika je kompaktna, skalabilna, nezavisna od rezolucije ekrana

što nije slučaj sa bitmapiranom slikom, • Uvećanje objekta i približavanje ne izaziva smanjenje rezolucije detalja i gubitka na

kvalitetu, • Informacije o transformacijama i procedurama se pamte što omogućava da se mogu

kasnije menjati; to znači da pomeranje, skaliranje, rotiranje, popunjavanje, ili neka druga geometrijska transformacija ne smanjuju kvalitet crteža kao kod bitmapirane slike.

Zbog čistih i oštrih prelaza između boja, vektorskom grafikom se ne mogu prikazati fotorealistične slike, fotografije.

Slika 8.3.5.3—Primer vektorske i bitmapirane slike

145

Page 156: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Tabela 8.3.5.1—Poređenje veličine datoteke bitmapirane i vektorske slike

Dimenzije u pikselima

Bitmapa Vektorski zapis

250 × 78 57 KB 36KB 800 × 248 581 KB 36KB

1500 × 466 2000 MB 36KB

8.3.6 Promenljive slike u multimediji

Promenljive, pokretne (eng. move) slike na prezentacionim medijima, bioskopskim i monitorskim ekranima, predstavljaju niz različitih slika koje se prikazuju jedna za drugom takvom brzinom da ih čulo vida ne može pojedinačno pratiti i sistem za percepciju povezuje njihov sadržaj u kontinuitet koji doživljavamo kao jedinstvenu promenljivu odnosno pokretnu, ”živu” sliku. Dinamička slika nastaje usled promena ili pomeranja objekata ili usled promene jačine i/ili boje svetlosti koja osvetljava scenu. Doživljaj dinamike u reprodukovanoj slici ostvaruje se zahvaljujući inerciji čula vida. Doživljaj pokretnih slika sa bioskopskih i monitorskih ekrana stvara se u moždanom centru za vid. Slika objekta projektovana pomoću sočiva na fotoosetljivu mrežnjaču oka prenosi se do centara za vid pomoću talasa akcionih potencijala, koji kroz nervna vlakna očnog živca formiraju diskretne bioelektrične video signale. Delovanje svetlosnog nadražaja svakog pojedinačnog piksela proizvodi niz impulsa talasa akcionog potencijala ograničenog trajanja. Vrednosti pojedinih piksela i čitave slike koju formiraju prenose se do centra za vid u sukcesivnim intervalima. U centru za vid odvija se, na osnovu prispelih impulsa, proces viših nivoa obrade, memorisanje, i prepoznavanje objekata što se označava kao proces percepcije. Mrežnjača oka, nervna vlakna očnog živca, i centar za vid imaju ograničenu sposobnost razlikovanja brzih promena svetlosti koje se smenjuju u intervalima kraćim od 100 ms. Brže diskretne promene povezuju se u neprekidan doživljaj zbog inercije koju karakteriše perzistencija vida. Perzistencija vida (eng. persistence of vision) predstavlja vreme zadržavanja percepcije prethodne slike, granični interval za razlikovanje susednih slika, odnosno povezivanje sukcesivnih slika i percepcija kontinuiteta niza pojedinačnih slika. Povezivanje susednih slika u kontinuum karakteriše učestanost sjedinjavanja slika.

Učestanost sjedinjavanja slika – fuziona frekvencija (eng. fusion frequency) predstavlja graničnu brzinu smenjivanja slika u nizu pri kojoj naša percepcija gubi sposobnost da razlikuje pojedinačne slike tako što vidimo kontinualne promene ili pokrete u slici. Minimalna fuziona frekvencija je (12 do 15) slika u sekundi. Fuziona frekvencija od 40 slika u sekundi eliminiše treptanje koje postoji pri malim brzinama smenjivanja slika.

Proizvodnja pokretnih slika obavlja se pomoću:

• Filmske tehnike • Video tehnike • Tehnike animacije

146

Page 157: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Filmska tehnika predstavlja proizvodnju pokretnih slika pomoću celuloidne trake, tako što se u procesu snimanja slike pokretnih i promenljivih objekata projektuju na filmsku traku, a u procesu reprodukcije slike sa filmske trake projektuju se na ekran. Prenos slike na filmsku traku, u toku snimanja, kao i prenos slike sa filmske trake, u toku prikazivanja, ostvaruje se projekcijom pomoću svetlosnih zraka. U toku postprodukcije, sa filmom je moguća takozvana linearna montaža, koja se svodi na nadovezivanje i lepljenje filmske trake. Dimenzije filma su standardizovane. Filmski formati za širinu trake su: 8 mm, 16 mm, 32 mm. Fuziona frekvenca kod filma iznosi 24 slike u sekundi sa po dva prosvetljavanja, što za smanjenje treptanja daje efekat kao da je 48 slika. Prednost filmske tehnike je visoka rezolucija slike. Nedostatak filmske tehnike je nemogućnost kontrole snimka u realnom vremenu. Video tehnika, odnosno video, predstavlja elektronsko snimanje, obradu i reprodukciju niza slika koje se sukcesivno smenjuju. Kod reprodukcije niza slika sa različitim sadržajem, koje se smenjuju dovoljno brzo da vizuelna percepcija ne uspeva da prati sadržaje svake slike pojedinačno, već da ih povezuje u kontinuitet, stvara se doživljaj promena odnosno pokreta u sadržaju posmatrane video slike. Video tehnika omogućava da se optičke slike pomoću fotoelektričnog efekta transformišu u električne slike, a zatim linijskom analizom se pikseli električne slike sukcesivno transformišu u video signal. Iz video signala sukcesivnom linijskom sintezom reprodukuju se slike na ekranu monitora ili na bioskopskom ekranu pomoću video projektora.

Jedna video slika se naziva frejm (eng. frame). U televizijskom sistemu jedan frejm sastavlja se ispisivanjem linija dve poluslike koje se zovu fild (eng. field) sistemom učešljavanja sa proredom (eng. interlaced), sa parnim i neparnim linijama. Kod računarskih video monitora, za razliku od ispisivanja sa proredom, ispisivanje slike može da bude progresivno (eng. progressive) ispisivanje, odnosno skeniranje (eng. scan), što znači linija za linijom. Prikazivanje pomoću poluslika, slično dvostrukom prosvetljavanju svake pojedinačne slike kod filma, vrši se zbog smanjenja efekta treptanja video slike.

U televizijskom PAL sistemu učestanost sukcesivnog smenjivanja slika je 25 frejma u sekundi (eng. frames per second). Veličina jedne slike je 576 linija ×720 kolona.

U televizijskom sistemu NTSC učestanost je 30 frejma u sekundi. Veličina jedne slike je 480 linija × 720 kolona.

U HDTV veličina jedne slike je u granicama od 720 linija × 1280 kolona do 1080 linija × 1920 kolona.

Obrada slike u video tehnici može biti prostorna, vremenska i prostorno – vremenska. Prostorna obrada video slike vrši se pojedinačno unutar slike i sastoji se od otklanjanja

šuma u slici, izdvajanja ivica i poboljšanja kvaliteta slike. Vremenska obrada video slike podrazumeva obradu piksela u slici u više uzastopnih

vremenskih trenutaka i vrši se u cilju detekcije i estimacije pokreta i vremenskog filtriranja. Prostorno – vremenska obrada video slike omogućava transformaciju formata slike kao

što je video skaliranje 4:3 slike u 16:9 sliku. U procesu snimanja vrši se opto – električna, a u procesu reprodukcije elektro – optička

transformacija slike. Konverzija površinske slike u video signal obavlja se postupkom prostorno

147

Page 158: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

– vremenske transformacije. Iz video signala se vremensko – prostornom koverzijom reprodukuje slika na TV ekranima i monitorima.

Osnovne prednosti video tehnike koje joj obezbeđuju primat nad filmskom tehnikom, su mogućnosti kontrole kvaliteta slike tokom snimanja i elektronska obrada video slike sa velikim mogućnostima za različite transformacije, promenu sadržaja, kompresiju, dekompresiju i nelinearnu montažu u procesu editovanja.

Klasičnom video tehnikeom ostvarivana je manja rezolucija slike u odnosu na film, a finansijska ulaganja su velika zbog potreba za velikim memorijskim kapacitetom računara, širokim opseom kanala za prenos video signala i veoma brzim video procesorima. Tokom razvoja, navedeni problemi praktično su prevaziđeni.

Standardi u video tehnici usklađeni su sa televizijskim standardima:

• NTSC 525 vidljivih linija, 30 slika/s, 60 poluslika/s; • PAL i SECAM (Francuski televizijski standard (fran. sequentiel couleur a me moire, eng.

sequential color with memory – SECAM)) vidljivih 575 linija, 25 slika/s, 50 poluslika/s; • HDTV 1125linija, 50 slika/s, ili 1250 linija 50 slika/s.

Računarski video sistemi nisu zavisni od TV standarda, broj kadrova se može podešavati. Za internet broj kadrova za prenos smanjuje se na (12 do 15) kadrova u sekundi, jer se na

prijemu mogu interpolirati međukadrovi i povećati brzina osvežavanja ekrana. Potrebni kapaciteti memorije i prenosnih kanala za tekst, sliku, zvuk i video znatno se

razlikuju. Tekst – jedna stranica sa 80 slova po liniji i 64 linije po stranici zahteva:

80 slova po liniji × 64 linije × 1 stranica × 8 bita po slovu = 40 960 bita = 41 kbit/stranici. Slika – 24 bita po pikselu, 512 × 512 piksela, zahteva: 512 × 512 piksela × 24 bita po

pikselu = 6 Mbit/slici. Zvuk – CD kvalitet odabiranja 44.1 kHz i 16 bita po odmerku zahteva za mono:

44 100 odmeraka/s × 16 bita/odmerku = 706 kbit/s, i za stereo 1412 kbit/s. Videokadar – 360 × 240 piksela, kodovanih sa 24 bita po pikselu, 30 kadrova u sekundi

zahteva: 360 × 240 piksela × 24 bita po pikselu × 30 kadrova u sekundi = 60 Mbit/s. Zvuk i slika u originalnom obliku teško bi se memorisali i prenosili. Za memorisanje i prenos audio i video signala neminovna je potreba za kompresijom signala zvuka i slike.

Kompresija signala zvuka i slike detaljno je obrađena u okviru sedmog poglavlja ove knjige Standardi u multimedijalnim komunikacijama. 8.4 Tekst u multimediji

Tekst predstavlja zapis govornog jezika. O značaju zapisivanja govornog jezika, odnosno pisma, bilo je reči na početku ovog poglavlja, a o predstavljanju teksta u digitalnoj formi, kompresiji, i standardima u šestom poglavlju ove knjige Kompresija teksta. Sledeća razmatranja posvećena su problematici prikazivanja teksta u multimedijalnim proizvodima i servisima.

148

Page 159: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Tekst u multimediji predstavlja vidljivu reprezentaciju govornog jezika i istovremeno predstavlja grafički, dizajnerski i estetski element. O dualističkoj prirodi teksta u multimediji dizajneri posvećuju posebnu pažnju. Kao reprezent govornog jezika tekst nosi semantički smisao zapisan slovima odgovarajuće azbuke korišćenog pisma. Vizuelni izgled teksta u multimediji posebno je značajan, a odnosi se na oblik slova – karaktera, prostor koji oni zauzimaju, kao i raspored po redovima, pasusima i većim delovima teksta na ekranu ili stranici, što je problematika kojom se bavi umetnost tipografije. Tekst se sastoji od rečenica, rečenice su sastavljene od reči, a reči predstavljaju kombinaciju slova. Pored slova, tekst sadrži interpunkcijske znake, brojeve i matematičke simbole. Tekst u dalekoistočnim zemljama, koje koriste slikovno pismo, sastoji se od ideograma. Uopšteno, može se reći da su osnovni elementi teksta karakteri. Karakter, kao tekstualni elemenat, naziv je za slova, brojeve, interpunkcijske ili matematičke znake, ili pisane simbole. U informaciono-komunikacionim tehnologijama, karakter se predstavlja, memoriše i prenosi u binarnoj formi. Razvoj digitalizacije i uvođenje teksta u računar počeo je sa digitalnim kodovanjem engleskog jezika, da bi se širio preko jezika razvijenih zemalja i danas obuhvatio idiograme i praktično sva postojeća pisma. 8.4.1 Standardi za digitalnu prezentaciju karaktera

Razvojem informaciono-komunikacionih tehnologija, uvodila se i vremenom proširivala standardizacija za digitalno memorisanje i reprezentaciju karaktera. Dominantni standardi su: ASCII, ISO 646, Unicode, i ISO 10646. Američki standardni kôd za razmenu informacija ASCII je dominantan skup karaktera, od 1970 godine. Za svaki karakter rezerviše po jedan bajt memorije, od čega koristi sedam bita, što znači da može da kombinuje 128 kodnih vrednosti. Repertoar karaktera ASCII sastoji se od samo 95 karaktera. Vrednosti od 0 do 31 i 127 koriste se za kontrolne karaktere kao što je formiranje pomaka, nosioca, i brisanje koji se tradicionalno koriste za kontrolu operacija izlaznih uređaja. Međunardona organizacija za standardizaciji ISO donela je standard ISO 646 koji koristi jedan bajt za korišćenje ASCII izvan Amerike. Dalji razvoj, pojava, ekspanzija interneta i uključivanje kineskog pisma, uslovljen je rezervisanjem više memorije. Unicode je standard koji se koristi od 1991 godine i zasniva se na šesnaestobitnom skupu karaktera koji ima 65 536 kodnih mogućnosti i može obuhvatiti 256 osmobitnih varijanti istovremeno. Sa Unicode-om obezbeđene su kodne vrednosti za pisanje svih savremenih “velikih” jezika, kao i klasične forme nekih jezika. Dostupni alfabeti uključuju latinski, grčki, ćirilicu, jermenski, hibru, arapski, devanagari, bengalski, gurmukhi, gudžarati, oraja, tamil, teluga, kanara, malajam, tai, lao, gruzijski i tibetanski, kao i kineske, japanske i koreanske ideograme i japansko i koreansko fonetsko i silabičko pismo. Uključuje, takođe, znake interpunkcije, tehničke i matematičke karaktere, strelice i mnoge raznovrsne karaktere kao što su šaka, zvezda, itd. Karakteri kao što su akcentovana slova korišćena u mnogim jezicima, znaci raspoznavanja, kao što su akcenat i tilda (talasić), obuhvaćeni su, a obezbeđen je i mehanizam kombinovanja karaktera kombinovanjem tih oznaka sa drugim simbolima. Ovo ne obezbeđuje

149

Page 160: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

samo alternativno kreiranje akcentovanih slova, već odgovara matematičarima koji po navici prave nove karaktere dekorišući postojeće. Obezbeđene su kodne vrednosti za gotovo 39 000 karaktera, ostavljajući neke od kodnih poena neiskorišćenim. Markap jezici kakvi su HTML i XML i programski jezik Java, koriste Unicode kao svoj skup karaktera. Kada jednom bude usvojen kao skup karaktera većih operativnih sistema, zadatak prenosa teksta koji koristi karaktere van SAD – engleskog ASCII repertoara trebalo bi da bude višestruko olakšan.

Unicode je kompatibilan sa ISO 10646 standardom koji predstavlja dalje proširenje za zapise koji nisu obuhvaćeni sa prethodnim standardima, kao što su, na primer, notni zapisi.

ISO 10646 je 32-bitni kôd karaktera, od kojih je 8 bita za 256 grupa, 8 bita za 256 ravni za svaku od grupa i 16 bita za 65 536 karaktera u svakoj od ravni. Sa ovim standardom ostavljene su najšire mogućnosti za sva buduća proširenja. 8.4.2 Font

Font je izraz koji se u tipografiji koristio za skup slova jedne veličine i jednog tipa, a u multimedijalnim tehnologijama font označava fajl sa glifovima i slovnim ornamentima. Font predstavlja jednu određenu familiju glifova. Glif je izraz za šaru, grafički oblik i sličicu, a u multimedijalnim tehnologijama glif označava spoljašnji lik sa kojim se prezentira karakter. Tekst se sastoji od nizova karaktera koji se u računaru memorišu kao binarni kodovi određenog standarda: ASCII, ISO 646, Unicode i ISO 10646. Da bi se prikazali, kodovi karaktera se povezuju sa glifovima smeštenim u glifovskim datotekama – fontovima. Datoteke glifova, odnosno fontovi, razlikuju se po stilu, dizajnu i načinu memorisanja glifova. Glifovi predstavljaju sličice i formiraju se, kao i slike, pomoću bitmapirane ili vektorske grafike. Način formiranja glifova uzima se kao osnova za klasifikaciju fontova koji predstavljaju zbirku glifova. Fontovi se, na osnovu načina formiranja glifova, dele na bitmapirane i vektorske. Bitmapirani – Bitmap ili rasterski fontovi sastavljeni su od niza tačaka, piksela, pomoću kojih se prikazuje slika karaktera. Prednost ovih fontova je što se brzo očitavaju, a nedostatak što nisu skalabilni, jer je za svaku veličinu potrebno imati poseban skup fontova.

Bitmapirani fontovi pokazuju iste karakteristike kao i bitmapirane slike klasičnih formata: .bmp – bitska mapa (eng. bitmap), .png – pokretna mrežna grafika (eng. portable network graphics), i .tif format označene slike (eng. tagged image format) ili .tiff format dat. označene slike (eng. tagged image file format). Svaka platforma poseduje sopstveni format bitmapiranih fontova, najčešće poboljšan na neki način, da bi efikasno radio sa rutinama sistemskog softvera koje obrađuju prikazivanje teksta. Konturni (eng. outline) ili vektorski fontovi sadrže skup instrukcija, pomoću kojih se iscrtava glif kao vizuelna predstava karaktera. Velika im je prednost što su skalabilni, odnosno, mogu menjati veličinu. Promena veličine glifa ne utiče na njegovu rezoluciju, tako da se može koristiti samo jedan tip datog fonta.

Konturni fontovi grade se po pravilima vektorske grafike od krivih i pravih linija, i obično su smešteni u formate za više platformi. Dva najčešće korišćena formata su Adobe Type 1, koji se često jednostavno naziva PostScript font, iako postoji još drugih PostScript fontova, i TrueType.

150

Page 161: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

TrueType font originalno je uveden od strane Apple-a, ali ga više koristi Windows nego Macintosh operativni sistem (eng. operating system – OS)) Mac OS, kod koga se zbog popularnosti Adobe više koristi Type 1. Konturni fontovi mogu biti proizvoljno skalirani i isti font može biti korišćen za prikazivanje na niskoj rezoluciji ili štampanje na jako visokoj. Program za prikazivanje može da prevodi konturne fontove bilo koje veličine. Program Adobe Type Manager (ATM) obavlja ovu funkciju na sistemskom nivou za Type 1 fontove. Konturni fontovi u bilo kom od popularnih formata mogu sadržati do 256 glifova. Glifovi u Type 1 fontu jednostavno su mali programi, napisani u ograničenom podskupu PostScripta. Ograničenja su namenjena da učine mogućim da glifovi budu efikasno prikazani na ekranu, programima kao što je ATM, u dovoljnom kvalitetu kada se prikažu na rezoluciji ekrana. TrueType je alternativni format. Konturni karakter u TrueType fontu čuva se kao serija tačaka koje definišu linije i krive čineći njihov oblik. Novorazvijeni format OpenType ujedinjuje Type 1 i TrueType fontove, obezbeđujući format fajla koji omogućava da bilo koja vrsta konturnih fontova bude sačuvana. OpenType su razvili Adobe i Microsoft zajedno 1997–8 godine, a pojavio se 1998 i Type 3 format. Postoji i format Type 0 u kome elementi fonta nisu glifovi karaktera, već drugi fontovi. Type 0 font namenjen je za čuvanje kombinovanih fontova, od kojih je svaki sastavljen od nekoliko Type 1 fontova. Njegova glavna namena je da obezbedi veliki repertoar karaktera, koji bi bili potrebni za korišćenje u saradnji sa Unicode-om. Type 1 i TrueType sadrže, pored opisa glifova, i informacije koje mogu biti iskorišćene od strane programa za prikazivanje, da bi se poboljšao izgled teksta na niskim rezolucijama. Ove informacije odnose se na izuzetno fine osobine, koje mogu izgubiti svoju finoću kada se manje piksela koristi za svaku liniju. U Type 1 fontovima nalaze se u obliku saveta (eng. hints), koji obezbeđuju vrednosti i parametre koji mogu biti iskorišćeni da upravljaju prikazivanjem glifova na niskim rezolucijama. Na primer, saveti su namenjeni da izazovu smanjenje prelaza. Kao što smo pomenuli, prelaz normalno pomaže da se poboljša propisani izgled fonta. Kako bilo, na niskim rezolucijama, kada se veličina prelaza zaokruži na najbliži piksel, efekat može biti preteran i tekst će izgledati nepravilnije nego što bi izgledao da mala slova budu tačno visine h. Tačka na kojoj će se uključiti smanjenje prelaza direktno zavisi od dizajna fonta, pa ne može biti uključena bez informacija koje pruža sam dizajner fonta. Saveti Type 1 fontova omogućavaju distribuciju ovih informacija. Ostali saveti srazmerno smanjuju varijacije u osnovi fonta, koje će iako estetski ugodne na velikim rezolucijama, izgledati u najmanju ruku nejednako na niskim rezolucijama. 8.4.3 Prikazivanje teksta na monitoru

Tekst se na monitorima računara prikazuje pomoću glifova određenog fonta koji se povezuje sa kodovima karaktera. Kodovi karaktera očitavaju se, iz memorije računara, i zamenjuju glifovima koji se prikazuju na ekranu monitora. Proces je jednosmeran jer iz teksta, kao grafičkog dizajna karaktera na ekranu monitora, ne sledi mogućnost direktne povratne veze u memoriju kodovanih karaktera prikazivanog teksta. U procesu prikazivanja na ekranu tekst postaje grafika čija se prvobitna osnova u formi kodovanih karaktera ne može iz grafičkog oblika lako pretraživati i menjati.

151

Page 162: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Problem povratka iz pisanog teksta u memoriju kodova karaktera javlja se zato što je kod karaktera jedinstven i zauzima manje bita, dok je njegova grafička predstava – glif složenija i zauzima više memorije. Niz kodova karaktera kompaktniji je od niza glifova koji predstavljaju isti tekst, pa zamena karakter – kodova glifovima uvećava veličinu fajla koji sadrži tekst. Grafički prikaz teksta neefikasan je za pretraživanje i zbog toga što ne koristi ponavljajuću prirodu teksta. Isti karakter, odnosno glif, višestruko će se ponavljati, pa ako je izvršen prelaz u glifove, mnogo kopija istog glifa će biti korišćeno, a svaki će biti mnogo veći nego odgovarajući kôd karaktera. Vraćanje u kod karaktere iz prikazivanog teksta može da se ostvari na posredan način, pomoću specijalizovanog računarskog programa. Ako je stranica odštampana pa tekst skeniran, rezultat je bitmapirana slika teksta. Do karaktera skeniranog teksta može se doći pomoću specijalizovanog programa za optičko prepoznavanje znakova (eng. optical character recognition – OCR) koji analizira oblike na bitmapiranoj slici i prepoznaje koje karaktere ti oblici predstavljaju. Ne postoji potpuna uspešnost prepoznavanja ali je primena ovog programa veoma zahvalna naročito kod digitalizacije papirnih izdanja.

Za sigurnu reprodukciju karaktera kod razmene tekstualnih dokumenata, naročito u slučaju ređe korišćenih fontova, postoji mogućnost da se korišćeni font ugnezdi i šalje zajedno sa dokumentom. To povećava veličinu fajla ali obezbeđuje sigurnost repliciranja. 8.4.4 Veličina, razmera i tip fontova

Veličina, razmera i tip fonta definiše izgled glifova koji tom fontu pripadajaju. Veličina i razmera fonta označavaju fizičke dimenzije glifova: slova, brojeva i znakova odnosno svih grafena koji pripadaju datom fontu, a izražavaju se u poenima (eng. points – pt). U digitalnoj tipografiji jedan poen je 1/72 inča, približno 0.3528 mm. To je veoma mala jedinica, pogodna za merenje dimenzija malih objekata kakvi su karakteri. Za malo veće vrednosti, kakav je razmak među linijama teksta, obično se koristi cicero (pica – pc), koji je 12 poena ili 1/6 inča, 4.2333 mm. Za razliku od ostalih mernih jedinica kakvi su metar ili stopa, poeni nemaju internacionalno priznatu standardnu veličinu. Vrednost od tačno 1/72 inča je uvedena od strane PostScript-a.

Na Slici 8.4.4.1-a prikazane su karakteristične veličine fonta. Razmera između visine x i veličine tela fonta jedna je od najvažnijih karakteristika svakog fonta. Visina – x nekog fonta koristi se kao jedinica mere i obično se piše kao ex. Ima korisnu osobinu da nije apsolutna jedinica, kao što je poen, već je relativna, menja se kako se menja veličina fonta, i razlikuje se za različite fontove, ali uvek ostaje u istoj relaciji u odnosu na visinu malih slova. Tako obezbeđuje zgodan način izražavanja vertikalne veličine koja se menja proporcionalno ovoj veličini. Srodna jedinica je horizontalni razmak i naziva se em. Tradicionalno 1em je širok kao veliko slovo M. Kod mnogih fontova, širina slova M jednaka je širini tela fonta pa se značenje jednog em-a promenilo tokom godina, i danas se najčešće uzima kao jedinica dužine jednaka veličini fonta. Veličina em je definisana slično kao jezik formatiranja kaskadni stil listova (eng. cascading style sheets – CSS). Dugačke crte korišćene za umetnute fraze dugačke su 1 em i samim tim se nazivaju em crte. Ponekad se sreće još jedna relativna jedinica en koja predstavlja osnovnu širinu velikog slova N, i koristi se da se definiše 0.5 em. Jedna en-crtica je crtica širine 1 en, i koristi se za odvajanje stranica ili datuma, kao što je 1998–99 godina.

152

Page 163: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Svako slovo ima svoj prihvatni prostor (eng. bounding box) koji je u stvari najmanji prostor koji može da obuhvati to slovo. Najčešće se ostavlja mali razmak među prihvatnim prostorima susednih karaktera. Drugim rečima kada crtamo glif neposredno pored drugog, prazan prostor se umeće blizu glifa, i nalazi se van prihvatnog prostora, najčešće levo, na razmaku koji je poznat kao nosač leve strane (eng. left side bearing), što je prikazano na Slici 8.4.4.1-b. Ponekad, kada se dva određena slova smeste jedno pored drugog, prostor među njima izgleda premali ili preveliki. Postoji mogućnost podešavanja – letter spacing.

Slika 8.4.4.1—Veličine koje karakterišu font Veličine koje opisuju veličinu pojedinog karaktera i razmak među karakterima, zajedno su poznate kao metrika fonta. Programi koji obavljaju slovoslaganje, zahtevaju pristup metrici fonta da bi odredili gde tačno da smeste glif dok prave linije, pasuse i stranice. Organizacija ovih informacija zavisi od formata fonta, računarskog sistema i slovoslagačkog softvera koji se koristi. Tip fonta predstavlja dizajn sa kojim su urađeni glifovi koji pripadaju određenom fontu. Razvijen je veliki broj različitih tipova fontova. Ne postoji jedinstvena klasifikacija tipova fontova. Najosnovnija podela fontova po tipu je na fontove fiksne veličine – jednomesne i proporcionalne fontove. Fontovi fiksne veličine sadrže glifove koji za svaki karakter horizontalno zauzima jednaku veličinu prostora, nezavisno od svoje veličine. Neka slova imaju, oko sebe, više praznog mesta od drugih. Na primer, uski oblik malog slova j ima oko sebe onoliko praznog prostora koliko je potrebno da se popuni širina malog slova š. Proporcionalni fontovi sadrže glifove koji za svaki karakter zauzimaju onoliko mesta kolika je širina slova. Na primer, slovo š zauzima više mesta od slova j. Pokazalo se da tekst sa proporcionalnim fontovima izgleda skladnije i lakši je za čitanje, u većini slučajeva. Osim toga, više reči staje u redovima.

153

Page 164: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Sledeća klasifikacija odnosi se na serif i sans serif (ponekad sanserif) fontove. Serifi su crtice dodate na krajeve fontova kao na Slici 8.4.4.2. Crtice se nalaze na serif fontovima, ali su izostavljene na sans serif glifovima, što im daje uobičajeni izgled. Serifi potiču od tragova dleta na rimskim kamenim pločama, pa se serif fontovi nekad nazivaju i rimski.

Slika 8.4.4.2—Serifi

Opšta je mogućnost ispisivanja slova sa vertikalnim linijama, ili koso sa italik fontom. Italik fontovi imitiraju glifove sa slovima nagnutim na desnu stranu, čime se imitira odrećeni stil pisanja. Većina italik fontova su ili parnjaci, ili različite varijante uspravnih fontova. Na primer, Times italik je italik verzija fonta Times Roman. Postoje, ipak, neki italik fontovi koji imaj svoj sopstveni dizajn, koji su obično dizajnirani da imaju izgled rukopisa, i koriste se kada je potreban lepši, humaniji izgled od običnog kucanog teksta. Postoje konturni fontovi koji imaju šuplja slova i fontovi koji bacaju senku. Razvijeni su fontovi koji izgledaju malo horizontalno spljošteni, kada se uporede sa proporcijama većine fontova. Nazivaju se “skraćeni” fontovi, i namenjeni su prilozima, kao što su poruke na marginama ili uske novinske rubrike, gde se zahteva da tekst bude upakovan na što manje prostora. Za razliku od ovih, fontovi koji se nazivaju “prošireni” izgledaju horizontalno razvučeni, što ih čini pogodnijim za naslove i druge izolovane tekstualne elemente. Fontovi se mogu klasifikovati prema težini, to jest, prema debljini crta koje čine slova. Deblje crte čine da tekst izgleda tamnije i čvršće. Po konvenciji, ovi fontovi se nazivaju teškim (debljih crta), boldfejs ili jednostavno bold. Kao i italik, bold fontovi su obično verzije fontova sa manjom težinom. Rezultat toga je da težina nije apsolutna osobina, bold težina nekog jako lakog fonta može biti lakša od obične težine nekog jako teškog fonta, čija bi bold verzija bila još teža. Neki od fontova mogu postojati u više varijanti, predstavljajući različite stepene težine. Pod ovim okolnostima, pojedini stilovi se opisuju terminima kao što su: ultra-bold, semi-bold, laki i ultra-laki. Tekst procesori često tretiraju podvlačenje kao stilsku opciju sličnu italik ili boldu, pa se može pretpostaviti da su i to, takođe, podvučene verzije fontova. Podvučeni fontovi veoma su retki, jer se u tipografskim krugovima smatra da su loša zamena italizacije, pogodna samo za slovoslagače koji nemaju italik-opciju. Kao i većina tipografske rutine, i nepoželjnost podvlačenja je dovedena u pitanje. Pošto se raznovrsniji efekti mogu postići kombinovanjem običnih fontova sa linijama različitih debljina, ovo preispitivanje nije dovelo do ekspanzije u korišćenju podvučenih fontova.

8.5 Animacija

Animirati znači oživeti, pokrenuti, udahnuti dušu (eng. to animate – to get thing alive, to make them change).

154

Page 165: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Animacija je postupak stvaranja iluzije o kretanju 2D i 3D objekata, slika, crteža i modela.

Prikazivanje pokreta može se videti na crtežima iz paleolitskog doba. Nizovi slika, slično savremenim stripovima, postoje u staroegipatskim, persijskim, indijskim i kineskim hramovima. Ideja o animaciji je veoma stara, ali je tehnički realizovana tek krajem 19. veka, pojavom filma. U razvoju animacije karakteristična su dva perioda. Prvi period je do početka primene računara za obradu i montažu slike krajem 20. veka, što se označava kao tradicionalna animacija. U 21. veku, tradicionalnu animaciju potiskuje kompjuterska animacija.

Pojedinačne slike od kojih se pravi niz za animaciju mogu biti snimci crteža ili modeli – objekata koji se namenski kreiraju. Animacioni niz se može praviti i kombinovanjem pojedinačnih slika snimljenog filma ili frejmova TV slika. U nizu slika koje se formiraju za animaciju, objekti na slikama imaju tendenciju promene pozicije, oblika, boje, transparencije, strukture usled aktivnosti samih objekata ili promene uslova okoline. Promene između dve susedne slike mogu biti jedva primetne, ili opažljivo primetne. Prikazivanjem niza slika dobija se iluzija kretanja zbog perzistencije čula vida. Minimalni broj slika za doživljaj kontinuiteta, odnosno iluzije kretanja, je niz od 12 slika u sekundi. Proces animacije označava formiranje niza različitih crteža i/ili fotografija koji se u toku prikazivanja smenjuju dovoljno velikom brzinom, da se stvara doživljaj pokretnih slika. Svaka pojedinačna slika predstavlja jedan okvir – frejm. Animacija se proizvodi frejm po frejm (eng. a frame at a time). Princip je isti kao i kod filma i televizije, jer se slike – frejmovi sukcesivno smenjuju slično prikazivanju pomoću kono-projektora. Brzina smenjivanja je 24 slike u sekundi, 25 slika u sekundi u PAL TV mreži i 30 slika u sekundi u NTSC TV mreži. U računarskim mrežama, brzina promene frejmova može se proizvoljno menjati. Savremena digitalna animacija obično se projektuje, zbog ekonomičnosti i mogućnosti interpolacije, sa manjima brojem slika u sekundi, u odnosu na TV standarde i film. 8.5.1 Tradicionalna animacija

Tradicionalna ili klasična animacija, takođe poznata kao celuloidna – cel animacija, predstavlja formiranje pokreta pomoću niza crteža, modela i objekata snimljenih na celuloidnu traku.

Za stvaranje iluzije pokreta, potreban je veliki broj crteža koji se međusobno malo razlikuju. Crtanje je zahtevan posao pa su se, u cilju uštede vremena i materijala, tražili načini da se smanji broj crteža i izbegne ponovno crtanje istog sadržaja slike. U procesu crtanja koristi se providna folija (eng. sheets) za odvajanje statične pozadine i pokretnih objekata koji su sastavni delovi slike. Postupak kreiranja animacije korišćenjem folija prikazan je na Slici 8.5.1.1. Statični elementi crtaju se na pozadini samo jednom. Preko pozadine postavlja se transparentna, providna folija – sloj (eng. layer), na koji se crtaju oni elementi slike koji treba da se kreću ili menjaju oblik. Pozadina je stacionarna, a providna celuloidna folija, na kojoj se crtaju slike sa kojima se formira pokret, postavlja se, tokom crtanja i snimanja, preko pozadine. Tehnika predstavljanja efekta putovanja kroz scenu zasniva se na kreiranju pozadine na površini većoj od frejma – slike i pomeranjem pozadine ispod providnog lista – lejera.

Kompletirani crteži snimaju se pojedinačno, jedan po jedan u nizu, kako će se reprodukovati i proizvesti iliziju kretanja. Taj je postupak nazivan animacija stani – kreni.

155

Page 166: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Slika 8.5.1.1—Ilustracija postupka kreiranja animacija korišćem folija

Animacija stani – kreni (eng. stop – motion) zasniva se na fizičkom manipulisanju objekata koji se snimaju kadar po kadar da bi se kod prikazivanja dobila iluzija o kretanju. Sa tehnikom stani – kreni razvijeno je više načina animacije, kao što su:

• Lutkarska animacija (eng. uppet animation) • Glinena ili platična animacija (eng. clayanimation) • Animacija od isečaka (eng. cutout animation) • Animacija sa modelima (eng. model animation) • Animacija sa grafičkim materijalom (eng. graphic animation) • Animacija sa glumcima – pixilation

U tradicionaloj animaciji postoji 12 principa i postupaka koji se koriste i u kompjuterskoj

animaciji:

• Gnječenje i rastezanje (eng. squash and stretch) je postupak kojim se naglašava fleksibilnost, pokret i brzina pokreta objekta čime se stvara predstava o promeni oblika i težini crtanih objekata, a ekstremnim efektima postiže se komičnost.

• Anticipacija (eng. anticipation) je postupak koji se koristi za pripremu publike za predstojeću akciju animiranog objekta da bi utisak bio uverljiviji. Skakač iz mesta priprema se savijanjem kolena, a igrač golfa pravi zamah unazad.

• Postavljanje scene (eng. staging) predstavlja prezentovanje ideje sredstvima usmeravanja pažnje gledalaca na glavni objekt scene da bi prezentacija svake akcije, ličnosti i izraza raspoloženja bila nedvosmislena.

• Podešavanje vremena – tajming (eng. timing) predstavlja jasno definisanje i proračunavanje etapa planirane akcije: priprema, akcija i reakcija. Tajming se realizuje brojem crteža ili slika za datu akciju, odnosno brzinu akcije. Dobar tajming čini da objekti izgledaju kao da poštuju zakone fizike, na primer, padanje, klizanje, sudari. Vreme je od ključne važnosti za uspostavljanje raspoloženje lika, emocije i reakcije.

156

Page 167: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

• Planiranje i određivanje pogodnog završetaka akcije (eng. follow through and overlapping action). U jednoj akciji može biti više planiranih kretanja ili promena koje se ne odvijaju simultano i koji mogu da se preklapaju u vremenu.

• Izbor jednog od dva postupka u procesu stvaranja animacije. Prvim postupkom se vrši kreiranje svih slika u sekvenci, od prve do poslednje (eng. straight ahead action). Drugim postupkom se naglašava akcija i njene faze: prvo se vrši kreiranje glavnih slika–scena, dok se ostale slike stvaraju kasnije (eng. pose-to-pose action).

• Usporavanje kretanja u krajnjim ekstremnim tačkama (eng. slow in and out), lagan ulazak i izlazak.

• Luk (eng. arcs) predstalja prikazivanje putanje kretanja objekta koja može biti prava linija ili, što je češće i prirodnije, u obliku luka.

• Preuveličavanja (eng. exaggeration) objekata ili kretanja ima za cilj da se bolje definiše neko emocionalno stanje.

• Sekundarna akcija (eng. secondary action) predstavlja sporednu radnju koja se odvija istovremeno sa glavnom akcijom sa kojom ima veze, a koristi se da naglasi realnost glavne akcije.

• Princip čvrstog crteža (eng. solid drawing) uzima u obzir oblike u 3D prostoru, dajući im jačinu i težinu. Animator treba da bude vešt crtač i razume osnove 3D oblika, anatomije, težine, svetlosti i senke.

• Privlačnost (eng. appeal) crtanih likova odgovara harizmi glumca koji ne mora da bude simpatičan i pozitivan. Važno je da gledalac oseća da je lik realan i interesantan.

8.5.2 Kompjuterska animacija

Kompjuterska animacija predstavlja proces generisanja animacije pomoću kompjuterske grafike. Na sličnom logičkom i proceduralanom konceptu, kao tradicionalna cel animacija, kompjuterska animacija omogućava da se niz slika generisanih u računaru sukcesivnim očitavanjem i elektrooptičkom transformacijom prikaže na ekranu, stvarajući percepciju pokretnih i promenljivih objekata.

Kompjuterska animacija, u suštini, digitalni je naslednik tehnike stani – kreni tradicionalne animacije sa 3D modelima, i slika po slika animacije sa 2D ilustracijama. Kompjuterski generisane animacije mogu se kontrolisati više nego fizički procesi. To omogućava kreiranje pokretnih slika što ne bi bilo izvodljivo korišćenjem bilo koje druge tehnologije. Takođe je omogućeno da grafički umetnik radi bez glumaca, skupe scene i rekvizita.

Za kreiranje komjuterske animacije potrebna su dizajnerska znanja, i moćan računarski hardver i softver. Postoje 2D i 3D kompjuterske animacije. Pretežno se kreiraju 2D animacije, jer ih je lakše i jeftinije realizovati. Postoje više različitih softverskih alata kako visoko profesionalnih i skupih tako i besplatnih – otvoreni kod – otvoreni izvor (eng. open source) za izradu animacija. Pregled ovih alata dat je u poslednjoj glavi ove knjige.

Digitalno predstavljanje slike je, u suštini, numeričko, što daje mogućnost interpolacije koja je izuzetno koristan postupak u kompjuterskoj animaciji. Računar sa algoritmima za interpolaciju formira međuslike i tako pomaže animatoru, smanjujući mu broj kadrova koje je u tradicionalnoj animaciji morao da crta.

157

Page 168: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Animacija se može generisati uvođenjem, importovanjem svakog pojedinačnog kadra – frejma u vremensku osu, odnosno animacioni niz i kreiranjem sadržaja svakog pojedinačnog kadra u nizu. Takav postupak animacije poznat je kao niz fajlova sa slikama. Niz fajlova sa slikama (eng. sequence of image files) predstavlja reprezentaciju animacije koja je veoma fleksibilna, jer daje mogućnost obrade pojedinih fajlova u izabranom grafičkom programu, pojedinačan fajl može biti uklonjen iz sekvence, zamenjen ili dodat. Sequence of image files može se importovati u video-editing aplikaciju i konvertovati u format za video – isprepletani zvuk i slika (eng. audio video interleave, audio video interleaved – AVI) ili QuickTime standard za video format. Drugi način generisanja animacije je pomoću ključnih kadrova– frejmova. Ključni kadrovi su prvi i poslednji kadar jedne akcije. Mogu se koristiti u svakoj tački ili momentu, u kojem postoji ili nastaje značajna promena. Ključni kadrovi se obično uzimaju za karakteristične položaje pokretanih objekata, takozvane ekstreme. Animacija pomoću ključnih kadrova (eng. key frame animation) je postupak formiranja frejmova između dva ključna frejma – in-betweeners automatski, primenom interpolacije. Interpolacija je matematički postupak za proračunavanje vrednosti funkcije između poznatih tačaka. Kreiranje frejmova koji posreduju između ključnih frejmova označen kao proces rađanja bliznaka – tvining (eng. tweening). U tvining-procesu, kreiraju se prvo dva ključna kadra koji reprezentuju određenu promenu, zatim se crta niz progresivno različitih frejmova – međukadrova. Kreiranje međukadrova može da odradi računar pomoću interpolacionih algoritama, što je prikazano na Slici 8.5.2.1.

Slika 8.5.2.1—Interpolacija između ključnih kadrova Kod kreiranja kompjuterske animacije bitan parametar je putanja kretanja objekata. Na osnovu definisane putanje kreiraju se promene između ključnih kadrova. Putanja (eng. path) određuje promenu na objektu: veličine, boje, detalja, i promene brzine kretanja. Putanja na osnovu koje se vrši interpolacija međukadrova može biti ili prava linija ili neki drugi oblik, što se definiše linearnim jednačinama prvog reda ili Bazirijevim krivama.

U linearnoj interpolaciji veličina pokreta, što znači promene između dva susedna kadra, konstantne su i određene priraštajem između krajnjeg i početnog ključnog kadra, podeljeno sa brojem međukadrova. Bazirijeva interpolacija koristi se kada polazak iz početnog ključnog kadra i završetak u krajnji ključni kadar ne treba da budu nagli, što bi se dobilo linearnom interpolacijom, već sa postepenim prelazima. Kompjuterska animacija se može kreirati vektorskim i bitmapiranim slikama. Animacija vektorskim slikama izvodi se zahvaljujući mogućnostima geometrijske transformacije slike kao što su translacija, rotacija i skaliranje čijom se kombinacijom mogu

158

Page 169: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

prikazati razni oblici promena i realizovati niz slika sa kojima se stvara iluzija kretanja. Za animaciju vektorskim slikama razvijeni su specijalizovani softverski alati kao što je široko primenjivani Macromedia Flash. Animacija bitmapiranim slikama izvodi se zahvaljujući mogućnostima da se bitmapirana, kao i vektorska slika, može pomerati, rotirati i skalirati i na taj način uticati na karakteristike slike, kao što je srazmera, ugao i veličina čime se može formirati niz za animaciju. Algoritmi za navedene operacije drugačiji su, i vreme izvršenja je duže nego u slučaju vektorskih slika. Program After Efect je softverski alat za kreiranje animacije sa bitmapitanim slikama.

Za jednostavnije animacije popularna su dva postupka pod nazivom grafički fajl format za razmenu (eng. graphics interchange format – GIF) i Sprajt animacija. GIF fajl format jedan je od dva najčešće korišćena računarska grafička formata za razmenu slika koji se može koristiti za kreiranje malih animacija sa nižom rezolucijom i paletom od 256 boja. GIF fajl format se koristi da bi se sačuvala sekvenca slika. GIF89 fajl format može da kontroliše ponašanje animacije, npr. ponavljanje određeni broj puta ili neograničeno, minimalno kašnjenje između frejmova. Nedostaci su što se ne može dodati zvuk i ograničenje na paletu od 256 boja. Ovo ograničenje se može prevazići korišćenjem QuickTime video formata koji može da se menja, kombinuje sa drugim klipovima, pa čak i da mu se dodaju efekti. Sprajt - sprite animacija je animacija na računarima koja se zasniva na objektima koji se pomeraju. Složen pokret može se dobiti dodeljivanjem više slika jednom sprajtu. Sprajt animacija se najčešće koristi za simulaciju hodanja kod ljudskih slika, što je prikazano na Slici 8.5.2.2, za kreiranje 2D video igrica, za različite tipove simulacija, kao i za same prezentacije na internetu.Vrednosti koje se menjaju pri pomeranju objekta proračunava kompjuter.

Slika 8.5.2.2—Kreiranje sprajt animacije

159

Page 170: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

8.5.3 Animacija u multimedijalnim sistemima

Animacija u multimedijalnim sistemima predstavlja informacionu tehnologiju za kreiranje najupečatljivije virtualne realnosti koja se ostvaruje trodimenzionalnim objektima, virtualnom realnošću i interakcijom što je najviše došlo do izražaja u računarskim igrama. Predviđa se da i razvoj buduće filmske industrije ide u pravcu sve veće primene multimedijalnih animacija, aktivnim uključivanjem gledaoca kroz interaktivne mogućnosti budućih kreacija, što film usmerava, u određenom smislu, na igru. Sledeći odeljci su abstrakti za trodimenzionalnu animaciju i virtualnu realnost dok se interakcija kao opšta mogućnost ukratko razmatra u posebnom poglavlju. TRODIMENZIONALNI OBJEKTI U ANIMACIJI – 3D ANIMACIJA Trodimenzionalni objekti su materijalni objekti koji zauzimaju stvarni 3D prostor kao i nematerijalni modeli u virtualnom 3D prostoru koji se pomoću svetlosti i senki dočaravaju na 2D ekranu. Animacija trodimenzionalnih objekata – 3D animacija predstavlja postupak prikazivanja 3D objekata na 2D ekranima pomoću kompjuterske grafike i specijalizovanih softverskih alata. Konstrukcija i prikazivanje 3D objekata najčešće uključuje i proces animacije, jer iluzija trodimenzionalnosti nije potpuna ako se objekat ne prikazuje sa raznih strana. 3D animacija nalazi primenu u raznim oblastima nauke, tehnike, umetnosti, posebno u proizvodnji računarskih igara. Za kreiranje 3D animacije potrebna je sposobnost zamišljanja objekata u tri prostorne i jednoj vremenskoj dimenziji i njihovo predstavljanje u 2D ekranu. Za renderovanje potrebni su snažni procesori i vreme. Za realizaciju ozbiljnijih 3D projekata potrebno je mnogo novca i vremena. Kod zahtevnijih 3D animacija, koriste se fizički zakoni za kreiranje pokreta. Dizajner treba da poznaje zakone kinematike. Kako se objekti kreću i šta ih pokreće treba za percepciju da bude što uverljivije. Dobar primer problematike kretanja u 3D animaciji je veza kod spojenih delova, kao što su ruke ili noge kod ljudskih figura ili životinja. Ruka se može kretati, zbog načina na koji su delovi spojeni, samo u određenim pravcima. Pokret gornjeg dela ruke određuje pokret donjeg dela ruke. Zato je zgodnije prvo pozicionirati šaku na kraju ruke, zatim uskladiti pokret njenog preostalog dela. Slično je kod animacije hoda, stopalo mora biti iznad podloge, oslonjeno na nju pri svakom koraku. Animator podešava položaj stopala, zatim program sam proračunava položaj butine i potkolenice. Ovaj oblik modelovanja se naziva inverzna kinematika. VIRTUALNA REALNOST U ANIMACIJI

Virtuelna stvarnost (eng. virtual reality) predstavlja kompjuterski kreiranu okolinu koja može da simulira fizičko prisustvo objekata u realnom svetu kao i u zamišljenom svetu. Prvobitno, izraz “virtuelna stvarnost” se koristio da opiše doživljaj sintetičkog sveta. Ekrani koji su osetljivi na pomeranje glave korišćeni su da projektuju slike na korisnikove oči, modifikujući ih dok se glava pomera, tako da korisnik ima utisak da se nalazi u 3D svetu. Postoje

160

Page 171: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

i rukavice, koje su osetljive na pomeranje ruke. Visoka cena opreme ograničila je njeno korišćenje na simulacije letenja i industrijske simulacije. Za programiranje distribucije multimedijalnih proizvoda sa virtuelnom realnošću preko interneta koristi se jezik modelovanja virtualne realnosti (eng. virtual reality modeling language – VRML). VRML je bio jezik zasnovan na tekstu, koji je omogućavao da 3D objekti i scene budu opisani u programskom jeziku. Poboljšane verzije su VRML 1.0 i VRML 2.0. VRML omogućava specifikaciju objekata, odnosno njihove geometrije i materijala od koga su sastavljeni. Različite teksture mogu biti primenjene na površine objekta, koji će se postaviti u 3D prostor. Scene mogu biti napravljene u uobičajenim tekstualnim editorima, ili u programima za 3D modelovanje i osvetljene na različite načine. Objekti u VRML fajlu nazivaju se čvorovi – nodovi. Kada su uređeni hijerarhijski, nodovi predstavljaju graf scene. Svaki VRML svet, bez obzira koliko jednostavan, predstavlja graf scene. Graf scene sadrži nodove koji opisuju objekte i njihove osobine. On sadrži hijerarhijski grupisanu geometriju da bi obezbedio audio-vizuelnu reprezentaciju objekata, kao i učešće nodova u generisanju događaja i mehanizmu rutiranja. Zajednički efekat nodova u grafu scene naziva se stanje (eng. state). Oblik noda pridružuje geometriju noda nodovima koji definišu dati geometrijski izgled. Oblik noda biće deo transformisane hijerarhije koja ima vidljiv rezultat, a sadržaj transformisane hijerarhije biće oblik noda za neku vidljivu geometriju. Grupisanje nodova ima polja koja sadrže listu dece nodova. Svako grupisanje noda definiše koordinatan prostor za njegovu decu. Ovaj koordinatni prostor relativan je u odnosu na koordinatan prostor noda čije je dete grupisani nod. Takav nod zove se roditelj nod. Ovo znači da transformacija akumulira niži graf scene u hijerarhiji.

8.6 Zvuk u multimediji

Zvuk u multimediji koristi se u različite svrhe zavisno od vrste multimedijalnog proizvoda i informacionog sadržaja koje zvuk nosi. U multimediji se koriste tri osnovna informaciona sadržaja koje zvuk može da nosi: govor, muzika i zvučni efekti raznih zvučnih izvora. Drugo poglavlje ove knjige Osnovi audija posvećeno je zvuku.

Govor u multimediji, kao osnov za jezičku komunikaciju, učenje i mišljenje može da ima primarnu funkciju i bude važniji od slike i teksta. Već i bebe više zadržavaju pažnju na likovima koji govore, nego na likovima koje ne prati zvuk. Percepcija praćena govorom otpornija je na smetnje i bolje se pamti. Govor u mozgu izaziva i vizuelne asocijacije.

Četvrto poglavlje ove knjige posvećeno je audio-vizuelnim integracijama i bimodalnosti ljudskog govora.

Muzika u multimediji može da bude primarna kada je slika prateća, kao u slučaju muzičkih koncerata i spotova ili da prati sliku kada ima funkciju da poboljšava raspoloženje i osećanja koja pobuđuje multimedijalna prezentacija.

Zvučni efekti u multimediji koriste se da pojačavaju određene funkcije, virtualnost i interaktivnost multimedijalne prezentacije.

Sa aplikativnog aspekta osnovne operacije vezane za zvuk u multimediji vezane su za procese preprodukcije, postprodukcije i reprodukcije.

U procesu preprodukcije obavljaju se snimanja zvuka i tonska režija. U procesu postprodukcije obavlja se obrada i montaža audio signala. U procesu reprodukcije obavlja se elektroakustička konverzija i ekvalizacija.

161

Page 172: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Pojednostavljena ilustracija sistema za čulnu percepciju zvuka i principa procesa snimanja data je na Slici 8.6.1.

Slika 8.6.1—Pojednostavljen prikaz čulne percepcije zvuka i principa procesa snimanja

Mikrofon je pretvarač zvučnih u električne signale što ekvivalentno radi unutrašnje uho čula sluha. Interesantno je i to da kroz slušni živac od unutrašnjeg uha do moždanog centra za sluh, prenos audio signala se odvija pomoću električnih binarnih impulsa. Broj impulsa u jedinici vremena srazmeran je intenzitetu audio signala, što odgovara impulsnoj frekvencijskoj modulaciji, što je najpouzdaniji način prenosa. Računar ima najznačajniju ulogu za sliku i zvuk. Za računar se razvijaju programi sa sve većim logičkim mogućnostima, tako da se računar sve više osposobljava za funkcije koje je imao isključivo ljudski mozak. Na taj način računar je osposobljen da u multimedijalnim primenama pretvara audio signale u tekst, odnosno da bude pisar, kao i da iz teksta sintetiše govor, odnosno da čita.

U procesu postprodukcije, analiziraju se, obrađuju, i montiraju snimljeni signali zvuka. Postoji znatan broj programa za postprodukciju zvuka kojima je posvećeno sledeće, deveto poglavlje ove knjige Aplikativni softver za multimedije. Ekrani sa Slike 8.6.2 ilustruju jedan softverski alat za multimedijalnu postprodukciju zvuka koji je razvijen u Kembridžu.

Slika 8.6.2—Ekrani jednog softverskog alata za analizu zvuka

162

Page 173: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

8.7 Dodir u multimediji

Dodir – haptόs predstavlja stimulaciju, pobudu somatosenzora u koži za percepciju prostornih i kinetičkih karakteristika objekata.

Dorir u multimediji primenom heptik tehnologija (eng. haptic technology) omogućava dobijanje informacije o veličini, obliku, teksturi, težini ili vibracijama objekata i uspostavljanje interakcije u multimedijalnom sistemu.

U informaciono-komunikacionim tehnologijama, dodir se koristi od početka razvoja prvih uređaja ne gubeći značaj do najsavremenijih sistema. Prstima se i danas kuca tekst i upravlja računarom preko tastature i miša. Osim neposrednog upravljanja dodirom, razvijeni su raznovrsni taktilni senzori koji doprinose vernijoj virtualizaciji realnih sistema.

Percepcija dodira je proces prepoznavanja objekata dodirom. Osećaj dodira se sastoji od tri glavna osećaja koja je često teško razdvojiti. To su:

• Opipljiva, dodirna percepcija (eng. tactile perception) prima informacije preko kožne

senzitivnosti kada se čovek ne kreće. Dodir je senzorska stimulacija koju osoba oseća kada nešto dolazi u dodir sa kožom. Izaziva nekoliko tipova osećaja: temperature, vibracija, teksture.

• Percepcija pokreta (eng. kinaesthetic sense) je svest pokreta, pozicije i orijentacije delova

ljudskog tela.

• Haptic percepcija koristi informacije osećaja dodira i pokreta.

Osećaj pokreta može biti rezultat akcije čoveka – aktivni dodir, koji uključuje signale koje mozak šalje u mišiće, ili može biti od sila izvan tela – pasivni dodir. Aktivna haptic percepcija, kada se uzimaju informacije o objektu izvan tela, glavna je informacija osećaja koja se pridružuje interfejsu dodira.

Interfejsi dodira su uređaji koji mere kretanje i obezbeđuju pobudu senzora od korisničkih ruku i prstiju. Interfejs dodira daje informacije kompjuteru zasnovane na poziciji uređaja i stimulišu korisnikov osećaj dodira snabdevanjem izlaza u formi sile povratne sprege i dodira. Interfejsi dodira omogućavaju korisniku da dodirne, oseti, manipuliše, stvara ili menja, sa njegovim rukama ili prstima, objekte prisutne na displeju računara, kao da su oni realni fizički objekti. To je ostvareno pažljivim merenjem sile koju bi neko osećao kada dodirne realan objekat. Prezentovanjem tih sila korisniku, korišćenjem sile povratne sprege i dodirne sposobnosti displeja heptik uređaja, stvara se iluzija dodirivanja objekta.

Način ostvarivanja komunikacije preko taktilnog ekrana prikazan je na Slici 8.7.1. Primena heptik tehnologije kod mobilnih telefona prikazana je na Slici 8.7.2.

Interfejsi dodira, na osnovu interakcije između korisnika i mašine, mogu se klasifikivati kao:

• Zasnovani na prstima: dodaju se prstima i odgovaraju na kretanje prstiju. • Zasnovani na rukama: korisnik ostvaruje interakciju sa uređajem stezanjem krute sprave.

Mašina daje ljudskoj ruci osećaj sile koja je dodeljena raznim slučajnim manevrima.

163

Page 174: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Slika 8.7.1—Komunikacija preko taktilnog ekrana

Slika 8.7.2—Komercijalna primena heptik tehnologije kod mobilnih telefona

• Spoljašnji skelet (eng. exoskeletal): prati kretanje ramena, ili čak celog tela, dozvoljavajući visoku interaktivnost, ali i ekstremno visoke cene. Te mašine se koriste u medicini, za ljude sa nekim nemogućnostima, u vojsci.

• Suštinski pasivni uređaji (eng. inherently passive devices) ili inteligentni pomoćni uređaji (eng. intelligent assist devices): pasivni roboti za direktnu fizičku interakciju sa čovekom – operatorom.

164

Page 175: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

8.8 Miris u multimediji

Miris (lat. olfactus, nem. geruch, eng. odor ili odour) predstavlja osećaj (eng. sense) prisustva određene supstance u vazduhu što detektuju hemoreceptori nosa povezani olfaktornim živcem (eng. olfactory nerve) sa moždanim centrom za miris. Čulo mirisa nalazi se u nosu i detektuje koncentraciju supstanci koje su u gasovitom stanju rastvorene u vazduhu. Pomoću hemoreceptora, na sličnom principu kao čulo mirisa, funkcioniše čulo ukusa koje detektuje koncentraciju supstance u tečnom stanju.

Receptorski neuroni za miris su specijalizovane ćelije koje mogu da transformišu prisutne molekule mirisa u povorku akcionih potencijala koje šalju u mozak snadbevajući, na taj način, centar za miris informacijama o prisustvu određene supstance u vazduhu. Na Slici 8.8.1-a prikazan je princip percepcije mirisa – biološki nos. Intenzitet mirisa je u direktnoj srazmeri sa električnim odzivom ćelija za miris (eng. olfactory cell). Ćelije organa za miris koriste jedan mali deo od ukupno 1000 receptora. Ćelije prepoznaju određeni miris selektovanjem koji će receptori imati odziv. U nosu postoje oko 10 miliona olfactory cells. Postoji najmanje 1000 različitih vrsta receptora mirisa (eng. olfactory receptors), ali svaki prepoznaje i odgovara samo jednoj vrsti mirisa (eng. fragrance). Svaka ćelija mirisa može upotrebiti samo nekoliko njenih receptora odjednom. Svaki molekul se kombinuje sa jednim brojem receptora u promenljivom stepenu i proizvodi se karakterističan odziv. Karakteristično je da miris nije aditivan, sabiranjem dva različita mirisa dobija se u potpunosti nov, različiti miris. Miris je najkompleksniji ljudski osećaj.

Istraživanja mirisa, za koja je najviše zainteresovana farmaceutska industrija, kao i vojska zbog hemijskih i bioloških detektora, prenose se i u oblast informatike. Najnovija istraživanja idu ka modelovanju ponašanja ćelije za miris. Miris u multimediji predstavlja novi medij za koji se razvijaju senzori mirisa i generatori mirisa. Uvođenjem mirisa menja se dosadašnje iskustvo u interaktivnom domenu. Miris se uvodi u filmove, igre, animaciju, ili neki drugi oblik digitalnog medija. Senzori mirisa predstavljaju sonde koje detektuju prisustvo koncentracije određene supstance u vazduhu i generišu signale mirisa.

Generatori mirisa su uređaji koji kontrolišu isparavanje određene mirisne supstance. U multimedijalnom sistemu koji uključuje i medij mirisa, interfejsi za miris detektuju ili

reprodukuju miris. Postoje dva tipa interfejsa za miris: ulazni interfejs za miris i izlazni sistem za miris. Ulazni interfejs za miris čine senzori mirisa koji detektuju prisustvo supstance u gasnom okruženju. Ulazni interfejs za miris zove se i elektronski nos (eng. electronic nose, e-nose). Elektronski nos je uređaj koji oponaša način delovanja olfaktornog sistema čoveka korišćenjem niza senzora koji mogu simulirati odziv na miris, sa ciljem prepoznavanja složenih mirisa. Koristi se za sakupljanje i interpretaciju mirisa. Na Slici 8.8.1-b prikazan je osnovni koncept projekta e-nosa. Elektronski nos je instrument kojim se analizira miris i isparljiva organska jedinjenja (eng. volatile organic compounds –VOCs). Isparljiva organska jedinjenja su organska, hemijska jedinjenja koja imaju značajne pritiske pare (eng. vapor pressures) i koja mogu uticati na okolinu i ljudsko zdravlje. Na način sličan ljudskom nosu, elektronski nos dopušta globalnu analizu isparljivih organskih jedinjenja generisanih tečnim, gasovitim ili čvrstim uzorcima.

165

Page 176: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Elektronski nos za analizu mirisa se sastoji od tri dela: sistema uzoraka (eng. sampling system), detekcionog sistema (eng. detection system), sistema prikupljanja podataka (eng. data acquisition) i sistema za obradu (eng. processing system). Molekuli gasa interaguju sa senzorima čvrstog stanja, sa tanjim ili debljim filmom od senzorskog materijala, absorbcijom, adsorbcijom ili hemijskim reakcijama. Senzorski uređaj detektuje fizičke i/ili hemijske promene nastale tim procesima i te promene se mere kao jedan električni signal.

Slika 8.8.1—Osnovni koncept projekta elektronskog nosa: a) biološki nos, b) e-nos

Molekuli mirisa se transliraju u e-nos korišćenjem tehnike odabiranja. Jedan odmerak prolazi kroz niz senzora i prouzrokuje reverzibilnu fizičku i/ili hemijsku promenu u senzorskom materijalu, koja dalje prouzrokuje odgovarajuću promenu električnih pojava, kao što je provodljivost. Svaka ćelija u nizu se ponaša kao receptor dajući različiti stepen odziva za različite mirise. Te promene se pretvaraju u električne signale koji se dalje analiziraju. Sistem e-nosa je tako napravljen da je ukupan odziv niza senzora jedinstven za dati miris iz skupa mirisa koji se razmatraju sistemom. Detekcione tehnologije koje se koriste su: senzori gasa (eng. metal oxide sensors – MOS), ekstremno brza hromatografija gasa (eng. ultra fast gas chromatography), fingerprint spektrometrija mase (eng. mass spectrometry), blago jonizovana spektrometrija mase (eng. soft ionized mass spectrometry). Postoje tri različita pristupa za ovu vrstu ulaznih uređaja:

166

Page 177: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

• Hromatografija gasa: odvajanje, identifikacija i određivanje hemijskih komponenti u kompleksnoj smeši koristeći razlike u migration rates duž komponenata;

• Spektrometrija mase: detekcija modela molekula koristeći razliku mere masa-naboj (eng. mass-to-charge ratio) jonizovanih atoma;

• Hemijski senzorski niz (eng. chemical sensor arrays): odziv niza hemijskih senzora se koristi za identifikaciju komponenti gasa.

Najveći broj postojećih hemijskih senzora je dizajnirano za detekciju specifičnih molekula. Senzori gasova se često kombinuju u jedan elektronski nos.

Izlazni interfejs za miris sačinjavaju moduli koji integrišu određeni hardver i softver za generisanje mirisa. Hardverski deo proizvodi miris, softverski deo razvija matematičke modele za miris i generiše specifične signale za specifične mirise koji će biti proizvedeni sa hardverskim uređajem. Hardverski uređaj je priključen na kompjuterski sistem. Za njega postoji drajver program koji razvija digitalne jednačine za generisanje specifičnog gasa. Displeji mirisa – “Mirisni displeji” su elektronski uređaji koji mogu da proizvedu i ostvare pobudu mirisa na osnovu digitalnih podataka – otisaka. Proces je nazvan i virtualni miris a sistem “virtualni mirisni displej”. Signali mirisa, u poređenju sa signalima slike i zvuka, relativno veoma sporo se menjaju zbog čega je njihov spektar višestruko uži od spektra audio i video signala. Pridruživanje ovih signala tonu i slici prvenstveno zavisi od ideja i opredeljenja dizajnera, jer njihovo memorisanje, obrada i prenos ne predstavlja problem zbog toga što praktično neznatno opterećuju multimedijalni sistem.

8.9 Interakcija u multimediji

Interakcija u multimediji predstavlja međusobno delovanje između korisnika i multimedijalnog sistema, a ostvaruje se tako što korisnik upravlja sofisticiranim sistemom na osnovu njegovog odziva. Upravljanje (eng. control) se vrši na osnovu povratne sprege (eng. feedback). Sistem obrađuje ulazne informacije, proizvodi odziv i prikazuje rezultat korisniku. Interakcija se ostvaruje preko interfejsa.

Interfejs je deo sistema u kome se sa jedne strane obavlja digitalizacija signala koji su fizički nosioci informacija i uvodi ih u procesor, a sa druge strane vrši prevođenje memorisanih informacija u fizičke nosioce za reprodukciju signala u prirodnom obliku. Interfejs se sastoji od senzora i pokretača. Senzori (eng. sensors) su komponente koje pretvaraju signale iz spoljašnjeg sveta u električne signale za ulaze multimedijalnog sistema koji proizvodi virtuelni domen. Ulazi senzora mogu biti: pokret koji predstavlja kinetički signal, zatim svetlosni, zvučni i/ili elektromagnetni signal. Pokretači (eng. actuators) su uređaji na izlazu multimedijalnog sistema koji na osnovu električnih signala proizvode odgovarajuća dejstva perceptibilna od strane čoveka. Odziv sistema (eng. system feedback) može biti aktivan i pasivan. Pasivni odziv je onaj koji nije generisan od sistema. Aktivni odziv je onaj koji generiše sistem i kontrolisan je od strane korisnika.

167

Page 178: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Kompjuter, kao jedan elektronski sistem, generiše odzive preko izlaznih uređaja u interfejsu, koju su perceptibilni za čoveka. To su virtuelni odzivi jer oni nisu stvarno tu, ali mogu biti perceptovani. Multimodalni interfejsi omogućavaju korisniku da čuje, vidi i oseća virtuelni svet.

Audio-vizuelni multimedijalni tipovi podataka mogu biti: diskretni ili statični podaci i kontinualni ili dinamički podaci. Diskretni podaci su oni koji ne zavise od vremenske ose: tekst, grafika i slike. Kontinualni podaci audio i video zavise od vremenske ose, kompleksniji su od diskretnih podataka, upotrebljavaju mnogo bolje kompresione i dekompresione algoritme i sofisticirane operacije za njihovu interpretaciju i manipulaciju.

Generisani mediji su različite vrste kompjuterski generisanih prezentacija, kao što su animacija i muzika. Kada su memorisani u audio i video fajlove, nema razlike u odnosu na audio i video podatke. Ako su generisani u realnom vremenu koristeći specifične uređaje i instrumente, tretiraju se kao posebni mediji. Generisani mediji zasnovani su na interakciji čovek – kompjuter zbog čega se označavaju kao interaktivni mediji.

8.10 Rezime

Sa aplikativnog aspekta, multimedija je informaciono-komunikacioni proizvod računarskih tehnologija koji pomoću integrisanih hardversih i softverskih uređaja prikazuju pojave za čulo vida, sluha i dodira, a u novije vreme i za čulo mirisa. Multimedijalna delatnost predstavlja multidisciplinarnu oblast koja obuhvata razne tehničko-tehnološke, ekonomske, sociološke i umetničke postupke. Proces stvaranja multimedijalnog dela započinje definisanjem projektnog zadatka kojim se izražavaju potrebe, postavljaju ciljevi i definišu ograničenja. Karakteristične su tri faze u realizaciji projekata iz oblasti multimedija: preprodukcija, produkcija i postprodukcija. Multimedijalna preprodukcija predstavlja prvu fazu realizacije projekta u kojoj se razrađuju zahtevi naručioca, definišu ciljevi, analizira interesna grupa, postavljaju zadaci, određuje žanr, vrsta medija, sadržina proizvoda, sastavlja detaljan pregledan plan, najčešće u vidu ilustrovane priče koja je, zbog vešanja na tablu, nazvana storibord. Multimedijalna produkcija predstavlja drugu fazu realizacije projekta u kojoj se neposredno formira sadržaj koji će se ugrađivati u proizvod. Zavisno od kompleksnosti proizvoda koristi se računar, kamera, glumci, kostimi, studio i scenografija. Multimedijalna postprodukcija predstavlja završnu fazu realizacije projekta u kojoj se formira konačna verzija multimedijalnog proizvoda. Kod digitalnih multimedija postprodukcija se svodi na uredništvo, editing. Kad se radi sa zvukom i pokretnim slikama onda je to montaža. Prostor i vreme su fizičke veličine koje imaju presudnu ulogu u svim fazama realizacije multimedijalnog projekta. Angažovani multimedijalni resursi definišu se na osnovu prostornih i vremenskih parametara informacionih sadržaja multimedijalnog proizvoda. Prostorni domen informacionih sadržaja određuje potrebnu veličinu, odnosno kapacitet memorijskih resursa. Vremenski domen informacionih sadržaja određuje zahtevanu propusnu moć, odnosno kapacitet prenosnih resursa komunikacionog sistema.

168

Page 179: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Multimedijalni proizvod predstavlja sintezu slika, teksta, animacije, zvuka, taktilnih elementa i u novije vreme mirisa.

Slika u multimediji predstavlja najzahtevniji sadržaj koji se obrađuje na nivou pojedinačnih piksela, na nivou pojedinačnih slika, frejmova kao i skupovima slika – pokretnih slika, videa i animacija. Za obradu slika potrebni su moćni hardverski resursi, a za prenos veliki kapaciteti prenosnog kanala. Da bi se ublažili zahtevi za korišćenje multimedijalnih resursa nužna je kompresija video signala.

Multimedijalni proizvodi mogu sadržati bitmapirane i/ili vektorske slike. Pokretne slike se formiraju od niza pojedinačnih slika koje se smenjuju dovoljnom

brzinom da se u procesu percepcije, zbog inercije čula vida, ostvari doživljaj kontinuiteta. Tekst u multimediji tretira se kao skup karaktera koji se u računaru memorišu kao binarni

kodovi određenog standarda: ASCII, ISO 646, Unicode i ISO 10646. Da bi se prikazali kodovi karaktera povezuju se sa glifovima smeštenim u glifovskim datotekama – fontovima. Datoteke glifova, odnosno fontovi, razlikuju se po stilu, dizajnu i načinu memorisanja glifova. Font je izraz koji se u tipografiji koristio za skup slova jedne veličine i jednog tipa, a u multimedijalnim tehnologijama font označava fajl sa glifovima i slovnim ornamentima. Font predstavlja jednu određenu familiju glifova. Glif je izraz za šaru, grafički oblik i sličicu, a u multimedijalnim tehnologijama glif označava spoljašnji lik kojim se prezentira karakter.

Animacija u multimediji predstavlja kreiranje virtuelnog sveta od velikog broja pojedinačnih slika koje se sukcesivno snimaju i prikazuju kao niz koji stvara doživljaj pokretnih slika.

Pojedinačne slike od kojih se pravi niz za animaciju mogu biti fotografije crteža ili objekata koji se namenski kreiraju. Animacioni niz se može praviti i kombinovanjem pojedinačnih slika snimljenog filma ili frejmova TV slika. U nizu slika koje se formiraju za animaciju, objekti na slikama imaju tendenciju promene pozicije, oblika, boje, transparencije, strukture usled aktivnosti samih objekata ili promene uslova okoline. Promene izmađu dve susedne slike mogu biti jedva primetne ili opažljivo primetne. Prikazivanjem niza slika dobija se utisak kretanja zbog perzistencije čula vida.

Za kreiranje animacije nephodna su dizajnerska znanja kao i moćan računarski hardver i softver. Postoje 2D i 3D kompjuterske animacije. Pretežno se kreiraju 2D animacije, jer ih je lakše i jeftinije realizovati. Postoje više različitih, kako visoko profesionalnih i skupih, tako i jeftinih i besplatnih – open sors softverskih alata za izradu animacija.

Animacija u multimedijalnim sistemima predstavlja informacionu tehnologiju za kreiranje najupečatljivije virtualne realnosti koja se ostvaruje 3D objektima, virtualnom realnošću i interakcijom, što je najviše došlo do izražaja u računarskim igrama.

Zvuk u multimediji koristi se u različite svrhe, zavisno od vrste multimedijalnog proizvoda i informacionog sadržaja koje zvuk nosi. U multimediji se koriste tri osnovna informaciona sadržaja koje zvuk može da nosi: govor, muzika i zvučni efekti raznih zvučnih izvora. Drugo poglavlje ove knjige Osnovi audija posvećeno je zvuku.

Govor u multimediji koji nosi informacioni sadržaj, može da ima primarnu funkciju i bude važniji od slike i teksta. Četvrto poglavlje ove knjige posvećeno je audio vizuelnim integracijama i bimodalnosti ljudskog govora.

Muzika u multimediji može da bude primarna kada je slika prateća, kao u slučaju muzičkih koncerata i spotova, ili da prati sliku kada ima funkciju da poboljšava raspoloženje i osećanja koja pobuđuje multimedijalna prezentacija.

169

Page 180: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Zvučni efekti u multimediji koriste se da pojačavaju određene funkcije, virtualnost i interaktivnost multimedijalne prezentacije.

Dodir u informaciono-komunikacionim tehnologijama uopšte, kao i u multimedijalnim sistemima posebno, postoji od početka razvoja prvih uređaja, ne gubeći značaj do najsavremenijih sistema. Prstima korisnika i danas se kuca tekst i upravlja računarom preko tastature i miša. Danas se već široko primenjuje heptik tehnologija neposrednog upravljanja dodirom, kao što je to slučaj u kod mobilnih telefona. Razvijeni su raznovrsni specijalizovani heptik sistemi koji doprinose vernijoj virtualizaciji realnih sistema.

Miris u savremenoj multimediji ne predstavlja nedostižni novi medij, jer su već razvijeni senzori i generatori mirisa.

Senzori mirisa predstavljaju visoku tehnologiju i skupe su komponente koje se ugrađuju u sistem označen kao elektronski nos.

Generatori mirisa su uređaji koji kontrolišu oslobađanje mirisa iz određenih rezervoara. Elektronski signali od senzora koji detektuju dodir i miris su, u poređenju sa signalima

slike i zvuka, sporo promenljivi signali. Spektar signala dodira i mirisa višestruko je uži od spektra audio i video signala. Pridruživanje ovih signala tonu i slici prvenstveno zavisi od ideja i opredeljenja dizajnera jer njihovo memorisanje, obrada, i prenos ne predstavlja problem imajući u vidu da praktično neznatno opterećuju multimedijalni sistem.

Interakcija u multimediji predstavlja međusobno delovanje između korisnika i multimedijalnog sistema, a ostvaruje se tako što korisnik upravlja sofisticiranim sistemom na osnovu njegovog odziva. Upravljanje (eng. control) se ostvaruje na osnovu povratne sprege (eng. feedback). Sistem obrađuje ulazne informacije, proizvodi odziv, i prikazuje rezultat korisniku. Interakcija se ostvaruje preko interfejsa.

Pitanja 1. Šta je projektni zadatak? 2. Šta je multimedijalna preprodukcija? 3. Šta je multimedijalna produkcija? 4. Šta je multimedijalna postprodukcija? 5. Šta je prethodna analiza u preprodukciji? 6. Šta je storibord? 7. Šta predstavlja slika u multimediji? 8. Šta su primarne boje? 9. Šta su sekundarne boje?

10. Šta su tercijarne boje? 11. Šta predstavlja aditivno mešanje boja? 12. Šta predstavlja subtraktivno mešanje boja? 13. Iz čega se sastoji elektronska kamera? 14. Šta predstavlja bitmapirana slika? 15. Šta predstavlja rezolucija slike? 16. Šta je vektorski generisana slika?

170

Page 181: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Koji su osnovni elementi za formiranje vektorske slike? 17. 18. Kakve su vektorske slike u poređenju sa bitmapiranim slikama?19. Šta predstavljaju pokretne slike na prezentacionim medijima? 20. Pomoću čega se obavlja proizvodnja pokretnih slika? 21. Šta predstavlja filmska tehnika? 22. Šta predstavlja video tehnika? 23. Šta predstavlja tekst u multimediji? 24. Šta predstavlja karakter? 25. Šta predstavlja font? 26. Šta predstavlja glif? 27. Koji su standardi za digitalnu reprezentaciju karaktera? 28. Kako se fontovi mogu klasifiovati? 29. Šta predstavlja animacija? 30. Šta predstavljaju tradicionalne animacije? 31. Šta predstavlja kompjuterska animacija?

Kako se koristi zvuk u multimediji? 32. Kako se koristi dodir u multimediji? 33. Kako se koristi miris u multimediji? 34. Šta predstavlja i kako se ostvaruje interakcija u multimediji? 35.

Literatura [8.1] H. Harrison, T. Loveland, V. Deaton, and K. Squibb, “Film technology,” in The TECH-

Know Project: High School Student Edition 2., R. Peterson, Ed. Cincinnati, OH: Centre Pointe Learning, 2005, pp. 18–23.

[8.2] Ireland Department of Education and Science. Storyboards: www.fis.ie/default. asp?PageName =Lesson7.

[8.3] E. L. Counts, Multimedia Design and Production for Student and Teachers. Pearson/Allyn and Bacon, 2004.

[8.4] V. Ray, Multimedia for Designers. New York, Delamar Cengage Learning, 2008. N. Chapman and J. Chapman, Digital media tools. New York: John Wiley & Sons, 2002.

[8.5]

N. Chapman and J. Chapman, Digital Multimedia. John Wiley & Sons, 2007. [8.6] [8.7] T. Vaughan, Multimedia: Making It Work. 8th ed. McGraw-Hill, 2011.

D. E. Knuth, Metafont. Addison-Wesley, 1986. [8.8] [8.9] B. Kerr, “Effective use of audio media in multimedia presentations,” Middle Tennessee

State University, 1999. B. L. Mann, “The evolution of multimedia sound,” Computers and Education, 2007. [8.10]

[8.11] http://de.wikipedia.org/wiki/Haptische_Wahrnehmung

171

Page 182: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

9. APLIKATIVNI SOFTVER ZA MULTIMEDIJE

Aplikativni softver za multimedije su računarski programi koji se koriste kao sredstvo, odnosno alat za izradu multimedijalnih proizvoda.

Proizvodnja softvera, te specifične “meke robe”, veoma je zahtevan posao u koji treba uložiti puno pameti i još više vremena, što iziskuje velika finansijska ulaganja u rad. Cena softvera, slično kao i kod opipljivih roba, zavisi od uloženog rada i broja korisnika, odnosno veličine serije. Kompleksni i skupi proizvodi ne mogu imati velike serije i obrnuto, jednostavniji proizvodi su jeftiniji zbog manjih početnih ulaganja i mogućnosti da budu pristupačni većem broju korisnika.

Postoje više klasifikacija aplikativnog softvera od kojih je dobro znati onu koja se odnosi na njegovu dostupnost. Osnovna podela se odnosi na vlasnička prava.

Vlasnički softver (eng. Proprietary software) su računarski programi koji su licencirani sa ekskluzivnim legalnim autorskim pravima copyright. Licenca daje pravo korišćenja softvera pod određenim uslovima. Nije dozvoljena modifikacija i distribuiranje.

Softver u javnom vlasništvu (eng. Public domain software) nekomercijalan je softver, nema autorskih prava i može se slobodno preuzimati i koristiti.

GNUs je dizajn sličan Unix-u, ali se razlikuje od Unix-a jer je slobodan softver i ne sadrži Unix kod (eng. Gnu’s Not Unix – GNU). GNU opšta javna licenca (eng. General Public License – GPL), GNU GPL ili GPL, je slobodna softverska licenca – copyleft license koja omogućava da se izvedeni posao može distribuirati pod uslovima koje definiše licenca.

Slobodan softver (eng. Free software) su programi licencirani od vlasnika sa tolerantnim uslovima. Generalno je dostupan i besplatno, ili sa mnogo nižom cenom u odnosu na Vlasnički softver. Dozvoljena je modifikacija softvera. Ovakvi softveri nemaju garanciju i ne dodeljuju zakonsku odgovornost.

Slobodan softver i Softver otvorenog koda (eng. Free and Open source software) je softver koji je slobodno licenciran da odobri pravo korisnicima da koriste, ili menjaju dizajn, sa dostupnim izvornim kodom softvera. Reč slobodan (eng. free) odnosi se na slobodu da se softver kopira i ponovo koristi, sloboda u filozofskom smislu reči koju softver daje korisniku. Reč Softver otvorenog koda fokusira na percepciju jačine razvoja modela. Softver otvorenog koda može se instalirati na više računara istovremeno, dozvoljen je pristup izvornom kodu za prepravke.

Slobodnorobni softver (eng. Freeware software) su programi dostupni za upotrebu besplatno, ali obično sa jednim ili više ograničenjem korisničkog prava.

Komercijalni softver (eng. Commercial software, payware software) proizveden je za prodaju, ili služi u komercijalne svrhe. Komercijalni softver je najčešće Vlasnički – Proprietary

172

Page 183: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

softver ali može biti i free software i free and open source software. Prilikom kupovine programa kupac dobija binarnu verziju programa. Licencirani program isključuje pristup kodu, prepravke, promene tehničke prirode i umnožavanje.

Intenzivan razvoj softvera za obradu slike i zvuka datira početkom devedesetih godina prošlog veka. U tom razvoju prednjače američke kompanije AVID, Adobe i Apple koje i danas vode sa najmoćnijim softverima za snimanje, obradu i editovanje zvuka, slike i videa.

Za razvoj multimedijalnih proizvoda postoji mnoštvo programskih alata za realizaciju projekata za različite namene i nivoe složenosti. Osnovna podela po nameni su alati za izradu multimedijalnih prezentacija, obradu slike i alati za obradu zvuka.

Ovladavanje veštinom pravljenja multimedijalnih proizvoda dobro je započeti izradom najjednostavnijh prezentacija sa uređivanjem i kreiranjem mirnih slika, nastaviti sa digitalnim video editovanjem, raditi zatim sa multimedijalnim prezentacijama da bi se ovladalo izradom ozbiljnih prezentacija sa multimedijalnim interaktivnim sadržajem. Izrada animacija i filmova, kao najviši multimedijalni nivo, zahteva i najviši profesionalizam, značajan utrošak vremena i budžeta.

Profesionalno urađeni multimedijalni proizvodi odlikuju se visokim kvalitetom dizajna i ugrađenim mogućnostima za interakciju sa korisnikom. Rade se pomoću moćnih softverskih alata, ili programskih jezika, zbog čega je potrebno da dizajner ima neophodna stručna i programerska znanja. Za multimedijalnu produkciju postoji više softverskih alata i programskih jezika različitih mogućnosti, namena i cena. Izbor zavisi kako od vrste multimedijalnog proizvoda tako i od znanja i afiniteta dizajnera.

9.1 Softverski alati za izradu multimedijalnih prezentacija

Multimedijalne prezentacije predstavljaju združeno prikazivanje tekstualnih, slikovnih i zvučnih informacija. Za izradu multimedijalnih prezentacija postoji više programskih paketa koji omogućavaju izradu raznovrsnih multimedijalnih prezentacija. Ovde je dat pregled najpoznatijih.

PowerPoint je program za izradu prezentacija koji je još krajem osamdesetih godina prošlog veka lansirao Microsoft i stalno ga usavršavao tako da najnovije verzije omogućavaju jednostavnu izradu multimedijalnih prezentacija programiranom promenom sadržaja.

HiperStudio, kreiran u Microsoft-u, sličan je PowerPoint-u, ali sa nešto većim mogućnostima za ostvarivanje interaktivnosti.

Velike mogućnosti za izradu multimedijalnih proizvoda, uz pristupačnu cenu, nudi komercijalni programski paket Macromedia Flash.

Flash je moćan softverski alat, čije je prve verzije lansirala Macromedia, zatim preuzela Adobe, predviđen je za izradu različitih prezentacija, od interaktivnih veb stranica do animiranih filmova. Poseduje odlična uputstva, lak je za učenje i veoma je efikasan. Tehničke su mu prednosti što podržava vektorsku grafiku sa visokom rezolucijom, brzim operacijama i visok stepen interakcije sa veoma malim datotekama. Macromedia Director i Macromedia Authorware su bili prvi alati za multimediju. Director pruža velike mogućnosti za dizajniranje pokreta. Authorware je sofisticirani paket za dizajniranje interaktivnih instrukcija. U savremene verzije Flash-a ugrađene su mogućnosti oba ova programska paketa.

173

Page 184: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Dreamweaver je predviđen za konstrukciju interaktivnih veb sajtova, a koristi se kao odlična platforma za isporuku i prikazivanje multimedijalne produkcije urađene u Flash-u. Sličan je sa Adobe GoLive i Microsoft Front Page.

After Effects je za kreiranje pomeranja i animacija ono što je Photoshop za mirne slike. Ovaj programski paket omogućava dizajniranje u dve i tri dimenzije, i kreiranje efekata za korišćenje u drugim softverima za multimedije.

Ulide GIF Animator veoma je popularan i jeftin programski paket za pravljenje pokretanja grafičkih slika i jednostavnih animacija na vebu, označenih kao Graphics Interchange Format – GIF.

QuickTime i Real Media su programski paketi sa velikim mogućnostima za uređivanje, beleženje zvuka, konverziju, i eksportovanje različitih datoteka, od jednostavno animiranh gifova do digitalnog video striminga.

Dizajniranje veb stranica moguće je ostvariti linijskim kodovanjem. Popularni jezici za kreiranje veb stranica su Hiper Text Markup Language - HTML, Java i Javascript.

Linijsko kodovanje može se u izvesnoj meri ostvariti i pomoću Flash-a. Actionscript je programski paket koji ima još veće mogućnosti za linijsko kodovnje.

Dizajneri pomoću linijkog kodovanja mogu da ostvare najrazličitije efekte i visokoprofesionalne kreacije. Da bi to ostvarili potrebno je, pre svega, da se familijarizuju sa softverima za linijsko kodovanje, što zahteva vreme i strpljenje.

Za multimedijalnu, kao i za svaku, kreaciju, pored znanja, koje se podrazumeva, dizajner treba da ima sklonost i ljubav prema poslu na koji se troši puno vremena.

9.2 Softverski alati za obradu slika

Softverski alati za obradu slika su programi pomoću kojih se mogu menjati karakteristike pojedinačnih slika i sekvence slika do konačno prihvatljive verzije za njihovo prikazivanje.

Izbor alata zavisi od vrste i kompleksnosti multimedijalnog proizvoda, odnosno od toga šta je potrebno da se sa slikama radi. U najjednostavnije operacije spada odabir i uređenje niza slika, što se označava kao editing. Pomoću računara radi se editovanje digitalnih slika, odnosno slika koje su u računaru memorisane kao matrica digitalnih cifara.

Editovanje digitalnih slika predstavlja obradu uređivanja mirnih slika kao što su manipulacije, obrezivanje, promena veličine i filtriranje i kreiranje slika, početna je osnova za bavljenje multimedijom. 9.2.1 Softverski alati za obradu bitmapiranih slika

Softverski alati za obradu bitmapiranih slika omogućavaju poboljšanje kvaliteta slika i njihovo prilagođavanje krajnjoj nameni. Razvijeno je više softverskih alata od kojih su ovde pobrojani samo najpoznatiji.

Adobe Photoshop ili samo Photoshop softverski je alat namenjen za generisanje i obradu bitmapiranih slika, koji ima mogućnost za interpolaciju na osnovu vrednosti najbližeg susednog piksela, bi-linearnu interpolaciju i bi-kubnu interpolaciju.

174

Page 185: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Corel Painter je softverski alat koji se može kvalifikovati kao elektronska slikarska četkica, što omogućava umetniči rad sa slikama. Program usko specijalizovan prvenstveno za crtanje i slikanje. Koriste ga slikari i crtači, manje dizajneri i oni koji se bave obradom slike. Dobro simulira alate za crtanje, kao što su olovka, pero, temper.

Corel PHOTO-PAINT, obično je u sastavu CorelDRAW paketa programa namenjenih generisanju i obradi grafike. Može se koristiti kao alternativa Photoshop-u.

Macromedia Fireworks, obično je u sastavu paketa sa programima kao što su Flash i Dreamweaver, prvenstveno se koristi za generisanje i obradu bitmapiranih slika namenjenih veb stranicama. 9.2.2 Softverski alati za obradu vektorskih slika

Za obradu vektorskih slika postoji više softverskih alata od kojih su najpoznatiji Adobe Illustrator, CorelDRAW i Macromedia FreeHand.

Adobe Illustrator jedan je od najkorišćenijih programa za izradu i obradu vektorske grafike koji pruža mogućnost umetničkog stvaranja. Radni ekran ovog programa prikazan je na Slici 9.2.2.1-b.

Macromedia FreeHand je program za generisanje i obradu vektorskih slika koji poseduje dobru interaktivnost sa softverskim proizvodima Macromedia. Često se koristi za stvaranje i obradu slika za Flash aplikaciju. Radni ekran ovog programa prikazan je na Slici 9.2.2.1-a.

Slika 9.2.2.1—Radno okruženje programa Adobe: a) FreeHand i b) Illustrator

Corel DRAW je program koji se koristi za generisanje i obradu vektorskih slika i teksta, a sadrži neke jednostavnije alate za obradu bitmapiranih slika. Na Slici 9.2.2.2-a prikazan je radni ekran programa CorelDRAW a na Slici 9.2.2.2-b prikazano je radno okruženje programa Flash.

175

Page 186: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Slika 9.2.2.2—Radno okruženje programa Adobe : a) CorelDRAW i b) Flash 9.2.3 Softverski alati za editovanje pokretnih slika

Editovanje pokretnih slika (eng. video editing) predstavlja osnovnu aktivnost u procesu postprodukcije, kada se od video materijala snimljenog i pripremljenog u procesu produkcije kreira konačna verzija video proizvoda. Kod video editovanja osnovna manipulacija je video montaža, što znači uređivanje niza slika u cilju dobijanja konačne verzije pokretnih slika.

Prethodnica video editing-a je montaža filma. Montaža filma (eng. film editing) je proces kreiranja konačne verzije filma u završnoj

fazi filmske postprodukcije što predstavlja umetnički čin koji se svodi na sečenje i lepljenje filmskih traka snimljenih u procesu produkcije. Konačna verzija filma od lepljenih traka presnimavala se na kompaktne filmske trake koje su se distribuirale bioskopima. Proizvodnja filma razvila se u jaku i profitabilnu industriju zbog čega su uloge ne samo glumaca već i režisera, montažera i producenta postale izuzetno značajne. U razvoju filmske umetnosti i filmske industrije preplitali su se interesi i uticaji režisera, montažera i producenata, zbog čega su se formirale različite filmske škole i filozofije kako za proces produkcije, tako i postprodukcije. Okosnice filmskog stvaralaštva su rediteljski rez (eng. director's cut) i završni rez (eng. final cut), što očigledno ukazuje na značaj montaže. Značaj procesa montaže, odnosno rediteljskog i završnog reza, prenosi se i kroz smenu tehnologija, što se vidi kroz nazive savremenih softverskih alata za kreiranje videa.

Sa pojavom magnetoskopa za zapisivanje televizijske slike, počinje elektronska linearna video montaža.

Linearna video montaža (eng. linear video editing) je proces selekcije, uređivanja i modifikacije slika i zvuka zabeleženih na video trakama, u cilju kreiranja konačne verzije video zapisa pomoću sistema koji sadrži dva ili više uređaja sa magnetnim trakama, video monitorima i elektronskim video mešačem – mikserom. Princip montaže sa magnetoskopskim trakama ima određene sličnosti sa filmskom montažom, ali pruža daleko veće mogućnosti. Zapisi se sa traka prevode u video signale koji se prikazuju na kontrolnim monitorima i vode na video mikser, čiji je izlaz priključen na glavni monitor. Video mikser ima mogućnost izbora kadrova sa više različitih ulaza, kao i njihovo mešanje i pretapanje.

176

Page 187: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Digitalizacijom video i audio signala stvorena je mogućnost montaže pomoću računara koja je označena kao nelinearna montaža ili digitalni video editing.

Nelinearna montaža (eng. non-linear editing) predstavlja uređivanje i obradu slika pomoću računara u cilju kreiranja digitalnog videa. Nelinearna montaža pruža daleko veće mogućnosti za kreiranje raznovrsnih multimedijalnih proizvoda od filmske i linearne video montaže.

Za nelinearnu montažu, odnosno digitalno video editovanje, razvijeno je više softverskih alata za različite operativne sisteme. Najznačajnije programe za video editovanje razvile su firme Avid Technology, Adobe i Apple Macintosh.

Detaljniji opis i pregled softverskih alata za video montažu bio bi obiman i zato su nabrojani samo najznačajniji programi, a u sledećim odeljcima dat je kratak opis samo softverskih alata Premiere i Final Cut.

Media Composer, najčešće se po firmi koja ga je 1989 godine razvila, zove Avid, prvi je hardversko – softverski sistem na Macintosh II za nelinearnu montažu koji je dominirao u filmskoj i televizijskoj produkciji u prošloj deceniji i dalje ostao značajan sa novim verzijama za visoke rezolucije slike i niskobudžetne primene.

Premiere jedan je od prvih programa za digitalnu video montažu razvijen pre dve decenije i danas u najnovijim CS verzijama jedan je od najpopularinijih programa za video editing. Instalira se na operativne sisteme Apple Macintosh kao i za Microsoft Windows. Final Cut Studio je softverski komplet (eng. software suite) za profesionalnu video i audio produkciju koji je u filmskoj i televizijskoj produkciji postao konkurencija Avidovom Media Composer-u. To je moćan i šire dostupan komplet koji sadrži šest osnovnih i više manjih aplikacija za video editing. To su: Final Cut Pro 7 za video editing, Motion 4 za grafičke animacije, Soundtrack Pro 3 za napredno editovanje i dizajniranje zvuka, DVD Studio Pro 4 za kodiranje, autorizaciju i disk izdavaštvo, Color 1.5 za nijansiranje boja i Compressor 3.5 za kodovanje finalnog video proizvoda u različite formate. iMovie veoma je popularan sistem za montažu ulaznog nivoa i sadrži filtriranje slike, konverziju ka sepia tonalitetu ili belom i crnom, mogućnost titlovanja i montažu zvuka. Nije skup i dobija se već instaliran na mnogim Macintosh računarima.

Video Wave i Studio Deluxe, slično iMovie-u, jednostavni su i jeftini, namenjeni studentima i nastavnicima koji mogu raditi DVD, VHS, CD-ROM formate i veb filmove.

EDIUS NEO je softver namenjen za nelinearnu video montažu za operativni sistem Microsoft Windows. Poseduje dobre karakteristike nelinearne montaže kao što su realno vreme, miksovani format HD/SD editovanja, titlovanje, i stvaranje DVD.

EDIUS Neo 2 je program koji pruža mogućnost editovanja raznih formata uključujući AVCHD, HDV, DV, Windows Media i QuickTime, podržava rad u realnom vremenu, ima mogućnost miksovanja različitih formata unutar iste vremenske ose. EDIUS Neo 2 je namenjen za nastavnu okolinu, ima veoma dobre karakteristike nelinearne montaže. Ima mogućnost stvaranja Blu-ray Disc i DVD (DVD authoring).

EDIUS 5 je softverski alat dizajniran za profesionalni nivo montaže, za postprodukciju. Avid Liquid Pro7 je SD i HD video editor koji ima mogućnost obrade okružavajućeg

zvuka sa preko 1000 efekata u realnom vremenu. Edituje DV, MPEG I, MPEG IBP (eng. I-frame, B-frame, P-frame – IBP), nekompresovani, Windows Media, ekspres digitalni video (eng. digital video express – DIVX) i MPEG-4 u SD kao i HDV. Ima mogućnost stvaranja DVD (DVD authoring): definisanjem interaktivnosti, kreiranjem menija, audio izlaza Dolby Digital 5.1 surround mix.

177

Page 188: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Sony Vegas Movie Studio 9 Platinum je program za video editovanje i kreiranje DVD. Namenjen je za kućne računare. Softver ima mogućnost prihvatanja i organizacije DV videa, editovanje klipova u vremenskoj osi i eksportovanje videa u DVD ili video CD (eng. video CD – VCD). Takođe omogućava eksporovanje videa za korišćenje sa pokretnom konzolom za igranje (eng. PlayStation Portable – PSP), iPod i YouTube. Pruža mogućnost HDV i AVCHD editovanja. Podržava snimanje, editovanje i kodovanje videa. Ima podršku za 5.1 surround sound miksovanje i kodovanje.

SONY Vegas Pro 9 je profesionalni softver za video i audio postprodukciju za difuziju – broadcast i digitalne video diskove (eng. digital video disc – DVD) i plave – blu-rej diskove – optičke diskove za memorisanje podataka (eng. blu-ray disc – BD).

Adobe Encore DVD je softverski alat namenjen profesionalnoj izradi DVD-a. Format videa uvedenog u programsko okruženje se automatski prebacuje u MPEG-2 format. Izlazni oblik audio formata je Dolby Digital sistem. Kompatibilan je sa Photoshop-om. Interaktivan meni se može kreirati u Photoshop-u i koristiti u programu Adobe Encore DVD.

Pinnacle Studio HD je program za video editovanje u mnogim Windows računarima. Podržava HD video i pruža mogućnosti tranzicija, animacije i efekata. CINEFORM NeoScene je program za nelinearnu montažu u filmskom stvaralaštvu, daje izuzetno visok kvalitet CineForm fajlova. PROGRAM ADOBE PREMIERE

Adobe Premiere, najčešće označen samo Premiere, jedan je od prvih programa za digitalno editovanje, raspoloživ za operativne sisteme Apple Macintosh kao i za Microsof Windows. Ima mnogostruku primenu, od kratkih filmova za veb sajtove do visokoprofesionalnih produkcija. Poseduje velik izbor postprodukcijskih efekata od prelaza do dizajna i montaže zvuka.

Prva verzija Adobe Premiere 1.0 razvijena je 1993 da bi potom sledile nove serije do 2002 godine sa oznakom Adobe Premiere 6.5. Zatim sledi razvoj sa oznakama Adobe Premiere Pro i to 2003 godine Adobe Premiere Pro 1.0, što bi odgovaralo Adobe Premiere 7.0, a zatim 2004 godine Adobe Premiere Pro 1.5 i 2005 godine Adobe Premiere Pro 1.5.1. Naredne 2006 godine razvijen je Adobe Premiere Pro 2.0 a sledeće 2007 godine pušten je pod novim nazivom Adobe Premiere Pro CS3. Naredne 2008 i 2009 godine su Adobe Premiere Pro CS4 a 2010 godine Adobe Premiere Pro CS5 da bi najnovija verzija u 2011 godine bila označena sa Adobe Premiere Pro CS5.5.

Adobe Premiere koristi tri glavna radna ekrana – prozora: projekat, vremenska osa i monitor kao što je prikazano na Slici 9.2.3.1.

Radni ekran projekat (eng. project) koristi SE za prikupljanje sirovog ili osnovnog materijala (eng. raw materijal) za projekat: video i audio klipove, nepokretne slike. Video klipovi mogu biti uneti (eng. captured) u Premiere direktno sa kamere ili sa trake, ili mogu biti importovani sa diska. Unutar prozora projekat svaki klip se prikazuje sa njegovom slikom, imenom, dužinom trajanja i drugim informacijama.

Radni ekran vremenske ose (eng. timeline) vizuelno prikazuje linearni opseg kompletiranog filma (eng. movie), prikazujući redosled komponentnih klipova. Vreme se povećava sa leva na desno. Vremenski prozori mogu imati nekoliko video i audio tragova. Veći broj tragova se koristi za tranzicije i preklapanje (eng. transitions and overlays).

178

Page 189: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Monitor je radni ekran u kome se prikazuje stvarna slika. Obično je podeljen na dva okvira, od kojih svaki ima posebnu kontrolu – playback, jog, shuttle. Leva polovina prikazuje izvorni klip. Može se izabrati određeni frejm u klipu u prozoru i mogu se postaviti ulazne – in i izlazne – out tačke. Desna polovina prozora monitora koristi se za prikazivanje filma (eng. movie) u procesu sastavljanja (eng. asemblovanja) na vremenskoj osi.

Slika 9.2.3.1—Radni ekrani Adobe Premiere

Vredost vremenskog koda (eng. timecode) prikazuje se sa četiri para brojeva 01:04:32:15, koji predstavljaju sate, minute, sekunde i frejmove. Za PAL sistem zadnja dva broja koja identifikuju broj frejma su u rasponu od 0 do 24, dok je za NTSC sistem raspon od 0 do 29. PROGRAM FINAL CUT PRO

Final Cut Pro – FCP je razvijen 1999 godine kao modul Final Cut Studio koji omogućava korisniku da priključuje video sa spoljnih uređaja ili iz računarskih memorija i na hard disku ga edituje, obrađuje i isporučuje u raznim verzijama formata. Prve verzije razvila je firma Macromedia Inc. a kasnije Apple Inc.

Final Cut Pro 7 je verzija za Mac računare sa Mac OS X verzijom operativnog sistema, ili kasnijom, koristeći Intel procesore. Sadrži jednostavne kao i napredne editing alate za neprimetne tranzicije i precizne video manipulacije. Ima izuzetne profesionalne mogućnosti za kreiranje tokom procesa nelinearne montaže kao što su: editovanje sa formatima HDV, XDCAM HD , DVCPRO HD, preko 150 filtera u realnom vremenu, veliki broj efekta, prikazivanje u

179

Page 190: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

realnom vremenu za vreme editovanja, 2D/3D prostor, audio postprodukcija, 5.1 surround sound mixing, finalizacija profesionalnog DVD sa interaktivnim karakteristikama, autorizaciju SD i dvoslojnog HD – DVD-9.

Radni ekran Final Cut Pro 7 sadrži četiri osnovna dela: okvir pretraživač (eng. Browser), ulazni prozor za pregled programskog matrijala (eng. Viewer window), izlazni prozor (eng. Canvas) i vremensku liniju (eng. Timeline) kao što je prikazano na Slici 9.2.3.2.

Slika 9.2.3.2—Radni ekran Final Cut Pro

Browser je prozor u kome se organizuje i pristupa svim izvorima materijala za dati projekt, sve sekvence, klipovi, audio zapisi, efekti i ostale datoteke medija smeštenih u Project Final Cut Pro file.

Viewer je prozor u kome se mogu medija fajlovi pregledati i skraćivati, pregledati i uređivati pojedinačni klipovi, postavljati ulazne i izlazne tačke, locirati i markirati specifični kadrovi, praviti izmene kao što je primena filtara i podešavanje parametara kretanja, menjati zvuk. U osnovu moguće su izmene u klipu koristeću Viewer i zatim postaviti klip u sekvencu na Timeline.

Viewer ima svoj interfejs – shuttle interface za skeniranje sa promenljivom brzinom, napred i nazad kroz klip kao i jog interface za napredovanje kadar po kadar. Na vrhu sadrži tabulatore za kontrolu klipova: Video Tab, Audio Tab, Filters Tab, Tabs pomoću kojih se pregledaju, markiraju i podešavaju frejmovi, tonski kanali i podešavaju ključni kadrovi.

Canvas prozor je radni prostor za editovanje klipova u sekvenci i posmatranje rezultata. To je replika programskog monitora gde se posmatra editovani materijal. Canvas ima kao i Viewer svoj shuttle interface. Timeline je traka koja objedinjuje medije i na kojoj se prikazuju slojevi (eng. layers) video i audio traka u nizu (eng. sequence) duž vremenske ose. Koristi se za pregledanje podloga (eng. layout) i komponenti u vremenskom nizu, navigaciju između klipova, selekciju specifičnih tačaka u sekvenci. Timeline se ogleda na Canvas koji prikazuje kretanje glave za reprodukciju na

180

Page 191: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

vremenskoj osi. Na njoj se video i audio klipovi mogu pomerati, menjati, raspoređivati i brisati u cilju kreiranja sekvence kakva bi na kraju trebala da se pojavi u željenom filmu. Na vremenskoj osi se postavljaju i sadržaji sekvence kao što su natpisi (eng. titles) i prelazi (eng. transitions). 9.2.4 Softverski alati za kreiranje animacija

Za kreiranje animacija različitog nivoa složenosti razvijeno je više softverskih alata i platformi. Najjednostavnije animacije kreiraju se pomoću GIF formata, dok se za kreiranje složenijih animacija koriste softvrske kolekcije Fleš (eng. Flash) i Maja (eng. Maya).

GIF format jedan je od dva najčešće korišćena računarska grafička formata za razmenu slika koji se može koristiti za kreiranje malih animacija sa nižom rezolucijom i paletom od 256 boja.

Fleš softverski komplet predstavlja platformu za kreiranje animacija. Maya softverski komplet predstavlja platformu za kreiranje 3D digitalnih sadržaja za

igrani film (eng. feature film), digitalnu video radiodifuziju i video produkciju, razvoj interaktivnih video igara, animaciju, arhitekturu, obrazovanje, naučna istraživanja. PROGRAM ADOBE FLASH

Adobe Flash, skraćeno Flash se deklariše kao multimedijalna platforma za kreiranje animacija, video sadržaja i interaktivnosti a pomoću njega mogu se praviti i računarske igre. Fleš je izvanredan alat za veb aplikacije.

Razvoj Fleša počinje 1996 godine sa prvom verzijom Macromedia Flash 1, zatim se svake sledeće godine ređaju nove savršenije verzije sve do 2005 kada se pojavljuje Macromedia Flash 8, da bi 2007 prešao u Adobe kada se lansira Adobe Flash CS3(9) Professional.

CS3 podržava ActionScript 3.0, omogućava da sve aplikacije mogu da se prevedu u ActionScript, bolje se integriše u druge Adobe programe.

Sledeće 2008 godine pojavljuje se Adobe Flash CS4(10) Professional koji sadrži inverznu kinematiku, osnovne manipulacije sa 3D objektima, tekstualno uređivanje (eng. text engine) i dalja ekspanzija ka ActionScript 3.0. CS4 omogućava kreiranje animacija sa više mogućnosti od prethodnih verzija.

Poslednja verzija od 2010 Adobe Flash Professional CS5(10.1) pojačala je tekstualno uređivanje i poboljšala rad sa kinematikom.

Fleš omogućava upotrebu vektorske i rasterske grafike za sastavljanje teksta, crteža i slika a podržava obostrani audio i video striming i prihvatanje signala sa tastature, mikrofona i kamere.

Fleš sadrži jedan objektno orijentisani jezik ActionScript sa otvorenim kodom, koji omogućava kreiranje programabilnih multimedijalnih proizvoda sa animacijom i visokim stepenom interaktivnosti.

Sadržaji Fleša mogu se prikazati na raznim kompjuterskim sistemima i uređajima pomoću Adobe Flash Player-a, mrežnih pretraživača i savršenijih mobilnih telefona.

ActionScript je programski jezik za algoritamsko kreiranje animacija i programiranje interakcija na osnovu definisanih položaja, trajektorija i simbola. Pogodan je za kreiranje veb- aplikacija i njihovo povezivanje sa korisničkim interfejsom.

181

Page 192: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

SWF (eng. shockwave flash ili small web file – SWF) je format vektorske grafike koji se može generisati sa flešom. Pogodan je za veb animacije. Grafički objekti su predstavljeni u vektorskom obliku. SWF fajl je sličan programu, uključuje definicije objekata i instrukcije kako sa njima manipulisati. SWF podaci su kodovani u binarnoj formi i komprimovani, rezultujući u vrlo malu veličinu fajla.

Fleš dozvoljava da se importuje bitmapirana slika u animaciju, ali time se povećava veličina fajla.

U flešu s koriste tri različite vrste simbola:

• Grafički simboli su vektorski objekti kreirani za motion tweening. • Simoli dugmadi (eng. button symbols) su specijalna vrsta simbola koja se koristi za

dodavanje interaktivnosti. • Simboli pokretanja (eng. movie clip symbols) su animacije sa sopstvenim vremenskom

linijom koje se ugrađuju unutar glavnog movie. Vremenska linija (eng. timeline) predstavlja grafički prikaz niza slika, odnosno sekvence

kadrova koja se koristi za kreiranje animacije u flešu. Animacija se može graditi jedan frejm u jednom trenutku, insertujući ključne frejmove u timeline sekvencijalno. Drugi način je ubacivanje glavnih frejmova u vremensku liniju.

Flash pozornica (eng. stage) je pozornica, prozor u kojoj se kreira frejm crtanjem objekata. Objekti se mogu kreirati koristeći drawing tools, ili mogu biti importovani. Bitmapirane slike, uključujući formate JPEG i PNG, mogu se importovati i transformisati u auto-traced vektorski objekat. Bitmapirane slike se mogu koristiti unutar Flash frame, ali se kasnije ne može vršiti skaliranje ili rotacija bez potencijalnog degradiranja slike.

Koriste se lejeri da bi se organizovali elementi u frejmu, interpolirano kretanje (eng. interpolating motion).

Grafički objekti mogu biti sačuvani u biblioteci u specijalnom obliku zvanom simbol (eng. symbol), koji omogućava da objekat bude ponovo korišćen. Potreban broj instances mogu se postaviti na stage. Instances ostaju linkovani za simbol. Ako se simbol menja, automatski se menjaju i instances. Instances su identični, i na njih se primenjuju transformacije, da bi se promenila veličina ili orijentacija od svake instances. PROGRAM AUTODESK MAYA

Autodesk Maya, skraćeno Maya, je moćan komercijalni softver za 3D animaciju koji omogućava previzualizaciju, vizuelne efekte, modelovanje, animaciju karaktera i rendering za razvoj projekata filmske i video produkcije, računarskih igara, arhitekture, obrazovanja i naučnih istraživanja.

Program Maya razvila je 1998 godine firma Alias Systems Corporation koju je 2005 godine otkupila firma Autodesk.

Verzija Maya 2012 može se instalirati na računarima sa operativnim sistemima Linux, Mac OS X i Microsoft Windows. Previzualizacija (eng. previsualization) predstavlja proces, razvijen u filmskoj industriji, za kreiranje prototipa kroz vizuelno istraživanje i scensko planiranje što omogućava bolje razumevanje projekta i generisanje preliminarne verzije video proizvoda. Kod kreiranja 3D

182

Page 193: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

animacija u softveru Maya, uz nižu rezoluciju slike, prikazuju se karakteristike, funkcionalnost i tok procesa željene aplikacije što omogućava brz i lak način ostvarivanja promena do postizanja željenog rezultata.

Vizuelni efekati iz realnog sveta kao što su dim, vatra, eksplozija, tok fluida, efekat kose u filmskoj i televizijskoj produkciji mogu se simulirati u softveru Maya. Na primer simulator za realistički izgled ljudske kose je ostvaren korišćenjem krivih i efekata crtanja. Simulacija životinjskog krzna – dlake slična je sa efektom kose. Može se koristiti i za simulaciju drugih sličnih objekata kao što je trava, fizika sudarenih objekata, simulacija tkanine i materijala, simulacija spreja, prskalica, simulacija prašine, praha.

Modelovanje u računarskim tehnologijama je proces predstavljanja realnih objekata pomoću tehnika kompjuterske grafike. Maja je moćno sredstvo za kreiranje računarski generisanih slika (eng. computer-generated imagery – CGI).

Računarski generisane slike predstavljaju oblast primene kompjuterske 3D grafike za specijalne efekte u filmovima, televizijekim programima i računarskim igrama.

Modelovanje pomoću programa Maja zavisi od tipa objekta. Definisana su tri tipa objekata: poligoni, NURBS i izdeljene manje površine.

Poligoni su geometrijski oblici sa tri ili više pravih stranica. Poligoni omogućavaju modelovanje površina građenjem i promenom oblika manjih delova površine.

Neuniformne racionalne osnovne krive (eng. non-uniform rational B-splines – NURBS) geometrijski su tipovi koji se mogu koristiti za stvaranje 3D krivih i površina. NURBS omogućavaju, sa visokim nivoom kontrole, kreiranje blagih, krivih površina.

Izdeljenim manjim površinama (eng. subdivision surfaces) se omogućava editovanje površina. Oblik nekog objekta se prikazuje geometrijom, materijal objekta opisuje izgled površine nakon renderovanja. Materijali i teksture se postavljaju tako da simuliraju realnu reakciju površina na svetlost.

3D animacija predstavlja važan deo televizijskih, filmskih i multimedijalnih projekata za animaciju karaktera.

Animacija karaktera predstavlja proces “oživljavanja” virtualnih objekata koji mogu biti osobe, životinje, roboti ili neki predmeti koji se animiraju izrazima lica, u cilju komunikacije sa publikom kroz akciju. Karakteri kao što su ljudi i životinje mogu se proizvesti sa visokim stepenom realizma. Pre animacije karaktera u sceni, crta se skelet karaktera, a zatim se skelet oblaže kožom. Aplikacija Maja omogućava definisanje unutrašnjeg skeleta za karaktere i dodeljivljnje kože za stvaranje realističkih pokreta sa deformacijama. Proces pripreme kontrole karaktera je nazvan rigging i omogućava fokusiranje na proces animacije. U procesu dizajna i animacije karaktera kombinuju se transformacije digitalnog skeleta sa deformacijama površine kože – spoljašnjeg omotača skeleta. Specifični zahtevi za kretanje karaktera određuju kompleksnost kontrole karaktera. Mehanika karaktera treba da bude ubedljiva publici, koža i odeća treba, takođe, da se kreću i na odgovarajući način savijaju. Maja omogućava da se upravlja delovima koji konstituišu tipičan karakter.

Rendering je računarski proces koji omogućava da se komponente kao što su površine, materijali, teksture, efekti, osvetljenja, modeli, kamere i kretanja postavljaju u sekvencu bitmapiranih slika. Maja softver sadrži ugrađen programski skript jezik (eng. Maya embedded language – MEL).

Maja programski jezik MEL omogućava prilagođavanje korisničkog interfejsa i pisanje skripta i makroa za kreiranje objekta, osvetljenja, kamere i tekstura. Na taj način se pomoću

183

Page 194: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Maja softvera mogu po zamisli autora kreirati raznovrsni efekti i animacije. MEL omogućava da se promenom vrednosti parametara u vremenu animiraju objekati, svetlo ili samo bilo koji entitet.

Maja korisnički interfejs (eng. Maya user interface) predstavlja, sa funkcionalnog aspekta, skup alata dostupnih korisniku na radnom ekranu monitora, koji osim funkcija zajedničkih za sve različite aspekte 3D grafike softverskih aplikacija, sadrži skup alata namenjenih specifičnim zadacima kao što su modeliranje, teksturisanje, animacija, renderovanje i sl.

Podrazumevani (eng. default) Maja korisnički interfejs, prikazan na Slici 9.2.4.1 i na Slici 9.2.4.2, sadrži sledeće osnovne sekcije:

• Glavni meni – Main Menu Bar • Statusna linija – Status Line • Školjka – Shelf • Alatna kutija – Tool Box • Radni prostor – Workspace • Meni za radni prostor – Panel Menus • Vremenska traka – Time Slider • Traka opsega – Range Slider • Upravljačka linija – Command Line • Pomoćna linija – Help Line • Kanalska kutija – Channel Box • Editor lejera – Layer editor

Slika 9.2.4.1—Radni ekran sa Maja interfejsom (eng. Maya Interface) i radnim prostorom

184

Page 195: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Korisnik na radnom ekranu monitora definiše virtuelni radni prostor, scenu, za realizaciju projekta. Scena može da bude sačuvana u raznim formatima. Standardni format je .mb – Maya binary.

U aplikaciji Maya 2010 dodat je MatchMover kojim se omogućava kombinovanje elemenata računarskog grafičkog interfejsa (eng. computer graphics interface – CGI).

Kamera sekventor (eng. camera sequencer) jedna je od najoriginalnijih karakteristika u softveru Maya 2011. Dodat je u aplikaciji Maya 2010. Koristi se za raspodelu planova više kamera i njihovo rukovanje u sekvenci animacije. Omogućava korišćenje različitih kamera analogno realizaciji u filmskim i televizijskim studijima. Kamera sekventor povezuje planove iz više kamera smeštenih u 3D sceni, aranžirajući planove i svičujući između uglova i planova kamera, korišćenjem više kamera, uglova i pogleda, za stvaranje kompletne sekvence animacije.

Aplikacija Maya je organizovana u tri sloja, lejera: GUI, MEL Engine i Dependency Graph.

GUI lejer predstavlja grafički korisnički interfejs dostupan animatorima, dizajnerima i programerima.

MEL Engine je Maya lejer u kome se izvršavaju komande korisnika sa GUI lejera. Dependency Graph je lejer gde su smešteni svi podaci o sceni i gde se izvršava

neophodna modifikacija podataka na osnovu skripta MEL komandi.

Slika 9.2.4.2—Radni prostor za modelovanje ili kreiranje animacije u programu Maja

Arhitektura aplikacije Maja je različita od arhitekture drugih programa. U mnogim postojećim aplikacijama su modelovanje, animacija, rasveta i rendering date kao odvojene

185

Page 196: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

procedure. Aplikacija Maja ima arhitekturu dijagrama – grafa čvora (eng. node graph architecture). Svaki elemenat scene, na primer, svaka kriva, link, slika, tekstura, ključni frejm se definiše kao čvor. Svaki čvor ima svoje osobine (eng. attributes) i prilagođenost. Svaki čvor može primiti, modifikovati i transmitovati podatke sledećem čvoru. Da bi se ostvarila željena funkcionalnost formira se mreža čvorova ili preko grafičkog korisničkog interfejsa ili programiranjem (MEL ili C++). Svaki 3D zadatak se realizuje protokom i modifikacijom podataka kroz mrežu međusobno povezanih čvorova. Informacija koja se koristi za konstrukciju scene je u obliku osobina i prenosi se međusobno zavisnim čvorovima. Jedan čvor može imati veliki broj osobina koje može proslediti dalje ili zahtevati kao ulaz. Primeri čvorova su čvor transformacije koji sadrži informacije o lokaciji, čvor oblika sadrži geometrijske informacije i čvor materijala koji sadrži informacije o boji. Čvor predstavlja jedan blok – building block scene. Blokovi se linkuju da bi kreirali kompleksnije blokove.

Blokovi formiraju model protoka podataka koji se zove Maya's pipeline. Maya's pipeline omogućava digitalni produkcioni pipeline:

• Priča – Story • Preslikavanje priče u vizuelni domen – Visual Development • Kreiranje karaktera - Character Design • Storibord – Storyboards • Postavka scene – Scene Layout • Modelovanje – Modeling • Animacija – Animation • Senčenje i tekstura – Shading and Texturing • Osvetljenje – Lighting • Rendering

Maja softver je predviđen i za proces postprodukcije (eng. post production) u kome se

vrši titlovanje, dodavanje raznih efekata, prelaza i slično.

9.3 Programi za snimanje, obradu i editovanje zvuka

Programi za snimanje, obradu i editovanje zvuka omogućavaju vremensku i frekvencijsku analizu, obradu spektra, uklanjanje šuma, dinamičku kompresiju i promenu učestanosti kod editovanog audio signala.

Elektronski uređaji sa programima za snimanje, editovanje i reprodukciju zvuka u obliku digitalnog audio signala i/ili MIDI podataka zovu se sekvenseri i realizuju se kao digitalne audio radne stanice.

Digitalne audio radne stanice (eng. digital audio workstation – DAW) predstavljaju specijalni elektronski sistem namenjen za snimanje, obradu, editovanje i reprodukciju (eng. playing back) digitalnog audio signala i mogu biti integrisani ili kompjuterski. Integrisani sistem se sastoji iz audio konzole, konvertora i uređaja za memorisanje podataka. Kompjuterski zasnovan sistem za snimanje digitalnog audio signala DAW sastoji se od: kompjutera, analogno-digitalnog i digitalno-analognog konvertora, audio softvera i najmanje jednog ulaznog uređaja za dodatni audio signal. Softverom se obezbeđuje korisnički interfejs i kontrolišu komponente hardvera da bi se omogućilo snimanje, editovanje i prikazivanje audio signala. Softver može biti

186

Page 197: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

realizovan za snimanje jednog traga, gde se u jednom trenutku prikazuje samo jedan audio signal mono ili stereo, ili više tragova, koji omogućava da se signal snima sa nekoliko mikrofona ili različitih ulaza na disk u istom trenutku na posebne tragove. Za svaki trag posebno može se podešavati jačina ili stereo balans audio signala. Svaki trag se snima u posebnom fajlu u memoriji kompjutera i može se posebno editovati. U finalizaciji se vrši miksovanje tragova u dva stereo traga ili više saraund tragova.

Razvoj softvera za digitalni audio počinje početkom devedesetih godina prošlog veka. Kompanije koje su razvile najmoćnije softvere koji i danas dominiraju u profesionalnim primenama su AVID, Adobe, Apple, Steinberg i Sony. Na tržištu se nude softverski alati i kolekcije različitog nivoa složenosti i cene koštanja.

Najpoznatije digitalne radne stanice i softverski kompleti su:

• Pro Tools, Media Composer, M-Audio, VENUE, Sibvelius i Euphonic kompanije AVID

• Audition i Logic Studio kompanije Adobe • LogicStudio kompanije Apple • Nuendo, Cubase kompanije Steinberg • Sound Forge, ACID Pro i Vegas Pro kompanije Sony

Kao primer i ilustracija za mogućnosti koje imaju softverski alati za editovanje zvuka

dataljnije će biti opisan softverski alat Sound Forge. 9.3.1 Obrada zvuka pomoću Sound Forge-a

Sound Forge je Sony-jev softverski komplet za editovanje zvuka za profesionalne i poluprofesionalne namene. Na Slici 9.3.1.1 prikazan je radni ekran Sound Forge-a.

Slika 9.3.1.1—Radni ekran Sound Forge-a

187

Page 198: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Funkcije i instrukcije editovanja Sound Forge-a:

• Spektralna analiza – Spectrum Analysis: nadzor u realnom vremenu (eng. real time). Monitoring i prikaz trenutnih vrednosti zvučnog signala – Sonogram;

• Uklanjanje šuma: Noise Gate, Noise Reduction, EQ, Click and Crackle Removal, Audio Restoration;

• Dinamička kompresija – Compressor: Threshold, Ration, Attack and Release time; • Promena učestanosti – Time Stretch, Pitch, Vibrato .

SPEKTRALNA ANALIZA U SOUND FORGE

Na Slici 9.3.1.2-a je prikazano predstavljanje zvuka u vremenskom domenu, odnosno prikazivanje amplitude signala u zavisnosti od vremena.

Spektralna analiza omogućava predstavljanje zvuka u frekvencijskom domenu, odnosno prikazivanje amplituda signala u zavisnosti od učestanosti što je prikazano na Slici 9.3.1.2-b. Spektar zvučnog signala se posmatra aktiviranjem Real Time Monitoring-a.

Slika 9.3.1.2—Analiza zvučnog signala uSoundForge-u: a) Vremenska analiza – Waveform display, b) Spektralna analiza – Spectrum graph

Sonogramom se na x osi predstavlja vreme, na y osi frekvencija, a boja predstavlja nivo

signala što je prikazano na Slici 9.3.1.3. UKLANJANJE ŠUMA U SOUND FORGE-U

Instrukcije menija za uklanjanje šuma pomoću Sound Forge-a su:

• Noise Gate– selekcija šuma, • Noise Reduction – smanjenje šuma, • EQ – izjednačavanje, • Click and Crackle Removal – uklanjanje pucketanja, • Audio Restoration – restauracija audio snimaka.

188

Page 199: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Slika 9.3.1.3—Prikaz sonograma u Sound Forge-u

Noise Gate služi za uklanjanje šuma ispod izabranog nivoa praga (eng.treshold) kao što je prikazano na Slici 9.3.1.4.

Slika 9.3.1.4—Ilustracija za instrukciju Noise Gate – selekcija šuma

Instrukcija smanjenje šuma - Noise Reduction obavlja se u dva koraka. Izabere se i označi deo snimka koji sadrži samo šum – noiseprint, što je prikazano na Slici 9.3.1.5. Uklanja se šum iz celog snimka na osnovu ovog uzorka. Za izabrani noiseprint gleda se frekvencijski spektar, zajedno sa tačkama anvelope koje ograničavaju model šuma. Signal ispod anvelope se smatra šumom i biće smanjen, dok će signal iznad anvelope ostati nepromenjen. Podizanjem tačaka anvelope biće uklonjeno više signala i obrnuto, spuštanjem anvelope manje originalnog signala biće smanjeno.

Menjanjem vrednosti “podižemo” ili “spuštamo” anvelopu noiseprint-a. Uobičajene vrednosti su između –6 dB i +6 dB. Poželjno je isprobavanje vrednosti u ovom intervalu sa ciljem pronalaženja najboljeg rešenja za dati slučaj. Vrednosti iznad 0 dB uklanjaju više šuma,

189

Page 200: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

ali povećavaju mogućnost da se ukloni i koristan signal niskog nivoa. Vrednosti ispod 0 dB uklanjaju manje korisnog signala, ali ako je vrednost preniska biće uklonjeno veoma malo šuma.

Slika 9.3.1.5—Radna površina za instrukciju Noise Reduction Izjednačavanje (izjednačavač (eng. equalizer – EQ)): Podešavanjem centralne frekvencije, širine i pojačanja filtara ekvalizatora pojačavaju se frekvencije korisnog signala koje su mogle biti oslabljene, na primer zbog korišćenja opcija za redukciju šuma. Postoji ekvilajzer sa tri opsega frekvencija 3Band EQ: niske, srednje i visoke, i Graphic EQ – sa više od 3 filtra, što je prikazano na Slici 9.3.1.6.

Uklanjanje pucketanja – Click and Crackle Removal obavlja se podešavanjem amplitude, trajanja i učestanosti gličeva koji se uklanjaju.

Audio Restoration je instrukcija koja omogućava uklanjanje gličeva, kao i smanjenje

šuma iz starih snimaka. Sadrži vremenske parametre koji određuju uključivanje i isključivanje algoritma. Vremenski parametri pomažu u sprećavanju uklanjanja korisnog signala.

190

Page 201: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Slika 9.3.1.6—Radna površina za Izjednačavanje – EQ

DINAMIČKA KOMPRESIJA U SOUND FORGE-U Dinamički kompresija predstavlja obradu audio signala kojom se smanjuje dinamički opseg jačine zvuka, odnosno smanjuje se razlika između najvišeg i najnižeg nivoa zvuka tokom snimanja ili reprodukcije. Parametri dinamičke kompresije (Slika 9.3.1.7) su:

• THRESHOLD – prag predstavlja nivo signala pri kome se kompresor uključuje; • RATIO – odnos, pokazatelj stepena kompresije posle dostizanja praga; • ATTACK TIME – vreme koje je potrebno da se dostigne odnos kompresije definisan sa

RATIO. Duže vreme znači da će se kompresija primeniti sporije; • RELEASE TIME – vreme koje je potrebno da se kompresija zaustavi, pošto je signal

prethodno pao ispod nivoa praga. Duže vreme znači da će se zvuk vratiti u nekomprimovano stanje sporije.

Radna površina za dinamičku kompresiju u Sound Forge-u predstavljena je na Slici 9.3.1.8.

191

Page 202: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Slika 9.3.1.7—Parametri dinamičke kompresije: prag - THRESHOLD, prelazne faze: vreme uspostave –

ATTACK TIME i vreme oslobađanja – RELEASE TIME, stepen kompresije – RATIO

Slika 9.3.1.8—Radna površina za dinamičku kompresiju

192

Page 203: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

PROMENA UČESTANOSTI U SOUND FORGE-U

Instrukcije menija Sound Forge-a za promenu učestanosti su:

• Time Stretch – promena trajanja snimka, • Pitch – promena visine tona, • Vibrato – promena visine tona pomoću frekvencijske modulacije.

Time Stretch menja dužinu snimka, bez promene osnovne frekvencije.Pri ubrzanoj

reprodukciji i skraćivanju trajanja snimka – komprimovanja u vremenu, širi se spektar, javljaju se više frekvencije. Ako se usporava originalni snimak, dolazi do komprimovanja spektra. Najbolji rezultati postižu se za Time Stretch između 75% i 115%, kao što je prikazano na Slici 9.3.1.9. Van ovog opsega, moguća je pojava izobličenja. Obradom snimka više puta sa malim priraštajem, na primer 10 %, dobija se bolji rezultat nego jednom jednokratnom obradom sa većom promenom dužine snimka.

Slika 9.3.1.9—Radna površina za promenu dužine snimka Pitch funkcija omogućava da se promeni osnovna frekvencija snimka.

Vibrato – efekat vibriranja koristi frekvencijsku modulaciju za promenu osnovne frekvencije signala u toku vremena.

Reverb omogućava rekonstruisanje uticaja prostora u kome je sniman zvuk na sam snimak, što znači da omogućava kreiranje efekta koji smešta zvuk u prostoriju u kojoj nije sniman. To se radi kada nije snimano u adekvatnoj prostoriji ili kada je uticaj snimane prostorije izgubljen usled neadekvatne tehnike snimanja.

Na Slici 9.3.1.10 prikazana je radna površina Sound Forge-a za reverberaciju.

193

Page 204: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Slika 9.3.1.10—Radna površina za reverberaciju

Parametri koji se podešavaju za efekat reverberacije su:

• Nivo procesuiranog signala koji će se miksovati sa originalnim signalom. • Nivo prvih refleksija koje će biti miksovane i dovedene na izlaz. Prve refleksije su one

refleksije koje su se najčešće odbile samo jednom pre nego što su stigle do slušaoca. Na osnovu ovih refleksija slušalac može da oceni veličinu prostora.

• Trajanje reverberacije: Tipično, sve preko tri sekunde je veoma dugo vreme reverberacije. Većina manjih prostorija ima vreme opadanja signala manje od jedne sekunde.

• Vreme između startnog zvuka i početka reverberacije: Ovo je parametar koji daje informaciju o veličini prostora u kome zvuk nastaje. Veće vreme je karakteristika većih prostorija.

Prostorije sa jednoličnim zvukom počinju slabljenje sugnala već na 4000 Hz, dok za “svetlije” prostorije slabljenje počinje za više frekvencije.

9.4 Rezime

Aplikativni softver za multimedije su računarski programi koji se koriste kao sredstvo, odnosno alat za izradu multimedijalnih proizvoda.

Intenzivan razvoj softvera za obradu slike i zvuka datira početkom devedesetih godina prošlog veka. U tom razvoju prednjače američke kompanije AVID, Adobe i Apple koje i danas vode sa najmoćnijim softverima za snimanje, obradu i editovanje zvuka, slike i videa. Postoji značajan broj programa razvijenih za obradu slike i zvuka, pojedinačno, ili objedinjenih u video.

194

Page 205: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

Softverski alati za obradu bitmapiranih slika omogućavaju poboljšanje kvaliteta slika i njihovo prilagođavanje krajnjoj nameni. Razvijeno je više softverskih alata od kojih su najpoznatiji Photoshop, Corel Painter i CorelDRAW.

Za obradu vektorske slike postoji više softverskih alata od kojih su najpoznatiji Adobe Illustrator, CorelDRAW i Macromedia Freehand. Za nelinearnu video montažu Media Composer, Premiere i Final Cut Studio.

Za snimanje, obradu, editing i reprodukciju zvuka koriste se digitalne radne stanice sa odgovarajućim softverskim kompletima. Najpoznatije kolekcije programa za audio su:

• Pro Tools, Media Composer, M-Audio, VENUE, Sibvelius i Euphonic kompanije AVID,

• Audition i Logic Studio kompanije Adobe, • LogicStudio kompanije Apple, • Nuendo, Cubasekompanije Steinberg, • Sound Forge, ACID Pro i Vegas Pro kompanije Sony.

Tehnološki razvoj i masovna popularizacija i prodaja audio i video uređaja doprinela je

da i sistemi za razvoj postanu finansijski dostupni većem broju dizajnera i kreatora multimedijalnih sadržaja. Raznovrsni programi za obradu zvuka i slike mogu se instalirati na personalnim i prenosnim računarima što daje tehničko-tehnološke mogućnosti širokom krugu korisnika da se posvete multimedijalnom stvaralaštvu koje pruža zadovoljstvo čulnoj percepciji.

Pitanja

Šta je aplikativni softver za multimedije? 1. 2. Šta je vlasnički softver – Proprietary software? 3. Šta je softver u javnom vlasništvu – Public domain software? 4. Šta je slobodan softver i softver otvorenog koda – free and open source

software? 5. Šta je Power Point? 6. Šta je Flash? 7. Šta je Dreamweaver? 8. Šta je AfterEffects? 9. Šta je Ulide GIF Animator?

10. Šta je Photoshop? 11. Šta je CorelDRAW? 12. Šta je Adobe Illustrator? 13. Šta je Adobe Premier? 14. Šta je EDIUS? 15. Šta je Final Cut? 16. Šta je Maya?

195

Page 206: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

17. Šta je Sound Forge? 18. Koja editovanja podržava Sound Forge? 19. Šta je spektralna analiza? 20. Koje su instrukcije za spektralnu analizu u Sound Forge-u? 21. Šta je šum? 22. Koje su instrukcije za uklanjanje šuma u Sound Forge-u? 23. Šta je to dinamička kompresija? 24. Koje su instrukcije za dinamičku kompresiju u Sound Forge-u? 25. Koje su instrukcije za promenu učestanosti u Sound Forge-u?

Literatura [9.1] http://en.wikipedia.org/wiki/Video_editing [9.2] http://en.wikipedia.org/wiki/Linear_video_editing [9.3] http://en.wikipedia.org/wiki/Non-linear_editing_system [9.4] http://en.wikipedia.org/wiki/List_of_video_editing_software [9.5] http://www.expertrating.com/courseware/MayaCourse/MAYA-Animation-Basics 1.asp

N. Chapman and J. Chapman, Digital media tools. New York: John Wiley & Sons, 2002.

[9.6]

N. Chapman and J. Chapman, Digital Multimedia. John Wiley & Sons, 2007. [9.7] [9.8] Vaughan, Multimedia: Making It Work. 8th ed. McGraw-Hill, 2011.

196

Page 207: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

SPISAK SKRAĆENICA

AAC advanced audio coding napredno audio kodovanje

ACELP algebraic code excited linear prediction algebarski kod pobuđene linerane predikcije

A/D analog to digital analogno digitalni

AFX animation framework eXtension proširenje okvira animacije

AL adaption layer adaptacioni sloj

API application programming interface interfejs za programske aplikacije

ASCII American standard code for information interchange Američki standardni kod za razmenu informacija

ATDM

asynchronous time-division multiplexing asinhrono multipleksiranje sa vremenskom raspodelom kanala

ATM

asynchronous transfer mode asinhroni transfer mod

AVC advanced video coding napredno video kodovanje

AVCHD advanced video coding high definition napredno video kodovanje visoke definicije

AVI audio video interleave, audio video interleaved isprepletani zvuk i slika

BB

band by band opseg po opseg

b bit bit

B byte bajt

B bidirectionally-predictive dvosmerno prediktivni, biprediktivni

B-frame bidirectional-frame, backwards-predicted frame, B-picture, inter-frame dvosmerni-frejm, unazad-predvidiv frejm, B-slika, među-frejm

BD blu-ray disc optički disk za memorisanje podataka

BIFS

binary format for scenes binarni oblik scena

BiM

binary format for metadata binarni format za metapodatke

197

Page 208: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

BISDN broadband ISDN širokopojasni ISDN

BMP bitmap bitska mapa

BQ

bi-level quantization dvostruka kvantizacija

CABAC

context adaptive binary arithmetic coding binarno aritmetičko adaptivno kodovanje konteksta

CAVLC context arithmetic variable-length coding adaptivno kodovanje sa promenljivom kodnom reči

CCD charge-coupled device uređaji sa spregnutim naelektrisanjem

CD

compact disc kompakt disk

CD

committee draft dodeljeni draft

CGI computer-generated imagery računarski generisane slike

CGI computer graphics interface računarski grafički interfejs, računarska grafika

CID charge injection device uređaj za detektovanje punjenja

CIF common intermediate format zajednički srednji format

CMOS complemantary metal-oxide-semiconductor komplementarne logike tranzistorski metal-oksid-poluprovodnik

CODEC coder-decoder koder-dekoder

CRC cyclic redundancy check ciklična provera suvišnosti

CS conjugate structure konjugovana struktura

CS-ACELP conjugate structure ACELP konjugovana struktura ACELP

CSMA/CD

carrier sense multiple access with collision detection postupak višestrukog pristupa uz detekciju kolizije

CSS cascading style sheets kaskadni stil listova

1D

one-dimensional jednodimenzionalni

2D two-dimensional dvodimenzionalni

198

Page 209: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

3D

three-dimesional trodimenzionalni

D

descriptor deskriptor

DAW digital audio workstation digitalna audio radna stanica

dB decibel decibel

DBC dictionary-based coding kodiranje na bazi rečnika

DCT

discrete cosine transform diskretna kosinusna transformacija

DDL

description definition language opis definicije jezika

DI digital item digitalni deo

DID

digital item declaration deklaracija o digitalnim delovima

DIVX digital video express ekspres digitalni video

DMIF

delivery multimedia integration framework okvir za isporuku multimedijalnih komunikacija

DPCM/DCT differential pulse code modulation /discrete cosine transform diferencijalna impulsno kodovana modulacija/diskretna kosinusna transformacija

dpi dots per inch broj tačaka po jedinici dužine

DRM

digital rights managment upravljanje digitalnim pravima

DS descriptor scheme šema za deskripciju

DSM-CC dgital storage media-command and control digitalna memorija-komanda i kontrola

DSP digital signal processing digitalna obrada signala

DSVD digital simultaneous voice and data digitalni simultani glas i podaci

DV digital video digitalni video

DVB

digital video broadcasting digitalna video difuzija

199

Page 210: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

DWT discrete wavelet transform diskretna wavelet transformacija

EM

electromagnetic elektromagnetni

EQ equalizer izjednačavač

ES

elementary stream osnovni strim

FEC

forward error correction korekcija grešaka unapred

FOE first order entropy entropija prvog reda

3G

third generation treća generacija

GA

general audio generalni audio

GDF grade distortion function funkcija stepena oštećenja informacije

GFX

graphics framework eXtensions proširenja okvira grafike

GIF graphics interchange format grafički format za razmenu

GII

global information infrastructure globalna informaciona infrastruktura

GK

gate keeper nadzor prolaza

GNU Gnu’s Not Unix GNUs dizajn sličan Unix-u, ali se razlikuje od Unix-a jer je slobodan softver i ne sadrži Unix kod

GOB

group of blocks grupa blokova

GPL General Public License opšta javna licenca

GSTN general switched telephone network opšta komutaciona telefonska mreža

GW gate way mrežni prolaz

HD high-definition visoka definicija

HDV high-definition video video visoke definicije, video visoke rezolucije

200

Page 211: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

HDTV high-definition television televizija visoke definicije, televizija visoke rezolucije

HMM

hidden Markov model skriveni model Markova

HTML

hyper text markup language hipertekst sa označenim jezikom

HVS human visual system čovečiji vizuelni system

I intra unutar

I-frame intra-frame unutrašnji-frejm

IBP I-frame, B-frame, P-frame I-frejm, B-frejm, P-frejm

IDCT

inverse DCT inverzna DCT

IEC

International Electrotechnical Committee Međunarodni elektrotehnički komitet

IETF Internet Engineering Task Force Grupa za IP standarde

IP

internet protocol internet protocol

IPMP

intellectual property management and protection upravljanje intelektualnoim svojinom i zaštita

IPRS intelectual property rights prava intelektualne svojine

ISDN

integrated services digital network digitalna mreža integrisanih servisa

ISM

interactive storage media interaktivna memorija

ISO Internatonal Standard Organization Međunarodna organizacija za standardizaciju

ITU International Telecommunication Union Međunarodna unija za telekomunikacije

ITU-R

International Telecommunication Union–Radio Standardization Sector Međunarodna unija za telekomunikacije–Radio sektor za standardizaciju

ITU–T

International Telecommunication Union–Telecommunication Sector Međunarodna unija za telekomunikacije–Telekomunikacioni sektor

JPEG Joint Photographic Experts Group Grupa eksperata za fotografiju

JPEG-LS JPEG standard for image lossless coding JPEG standard za kodovanje mirnih slika bez gubitaka

201

Page 212: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

JP2 optional file format for JPEG 2000 opcioni fajl format za JPEG 2000

JTC

Joint Technical Committee Pridružni tehnički komitet

JVC joint video coding združeno video kodovanje

JVT

Joint Video Team Združeni video tim

LAN

local area network lokalna računarska mreža

MAE mean absolute error srednja apsolutna greška

MB

macroblock makroblok

MCU

multipoint control unit kontrolna jedinica za više tačaka

MDS

multimedia description schemes multimedijalne šeme za deskripciju

MEL Maya embedded language ugrađen programski skript jezik u Maya softver

MIDI musical instrumment digital interface digitalni interfejs za muzički instrument

MIPS

millions of instructions per second milioni instrukcija u sekundi

MOS

mean opinion score srednja vrednost mišljenja

MOS metal oxide sensors senzori gasa

MPEG

Motion Picture Experts Group Grupa eksperata za obradu pokretne slike, Ekspertna grupa za pokretne slike

MPEG-J Motion Picture Experts Group-Java Grupa eksperata za obradu pokretne slike-Java

MP3

Motion Picture Experts Group-1 Audio Layer 3 Grupa eksperata za obradu pokretne slike-1 audio sloj 3

MP4 Motion Picture Experts Group-4 File Format Grupa eksperata za obradu pokretne slike-4 fajl format

MQ

multiple quantization multipl kvantizacija

MSE

mean square error srednja kvadratna greška

NAL network apstraction layer mrežni apstrakcioni sloj

202

Page 213: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

NISDN

narrow-band ISDN uskopojasni ISDN

NTSC National Television System Committee Nacionalni komitet za televizijski sistem

NURBS non-uniform rational B-spline neuniformna racionalna osnovna kriva

OCR optical character recognition optičko prepoznavanje znakova

OS operating system operativni sistem

OSI

open system interconnection povezivanje otvorenih sistema

P predictive prediktivni

P-frame predicted-frame, forward-predicted frame, inter-frame predvidiv-frejm, unapred-predvidiv frejm, među-frejm

PAL phase alternating line linijska promena faze

PC

personal computer personalni računar

PCM

pulse code modulation impulsna kodna modulacija

PDF probability density function funkcija gustine verovatnoće

PNG

portable network graphic pokretna mrežna grafika

PSNR peak-signal-to-noise ratio vršni odnos signal–šum

PSP PlayStation portable pokretna konzola za igranje

PSTN public switched telephone network javna telefonska mreža sa komutacijom, javna komutirana telefonska mreža

QCIF quarter common intermediate format četvrtni zajednički srednji format

QoS quality of service kvalitet servisa

RAM

random access memory memorija sa slučajnim pristupom

RDF rate distortion function funkcije stepena oštećenja

REC

request for comment zahtev za komentar

203

Page 214: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

RLE run-length encoding kodovanje dužine niza

ROI

region of interest region od interesa

ROM

read-only memory memorija sa očitavanjem

RTCP real time control protocol kontrolni protokol u realnom vremenu

RTP

real time transport protocol transportni protokol u realnom vremenu

SA

structured audio strukturni audio

SAOL

structured audio orchestra language strukturni jezik audio orkestra

SC

sub-committee podkomitet

SCN switched circuit network mreža za komutaciju kanala

SDTV

standard definision television televizija standardne rezolucije

SECAM fran. se quentiel couleur a me moire, eng. sequential color with memory Francuski televizijski standard

SG

Study Group Studijska grupa

SGML

standard generalized markup language standardni generalizovani jezik za markiranje

SH sample and hold uzorak i zadržavanje

SNHC

synthetic natural hybrid coding sintetičko prirodno hibridno kodovanje

SNR

signal-to-noise ratio odnos signal–šum

SQ

single quantization jednostruka kvantizacija

SWF shockwave Flash ili small web file format vektorske grafike koji se može generisati sa flešom

SVGA super video graphics array super video grafička kartica – niz

TC technical committee tehnički komitet

TCP/IP

transmission control protocol/internet protocol protokol kontrole prenosa/internet protocol

204

Page 215: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

TDNN

time-delayed neural network neuralne mreže sa vremenskim kašnjenjem

TIF tagged image format format označene slike

TIFF tagged image file format format dat. označene slike

ToR

terms of reference izrazi za reference

TR

Technical report Tehniški izveštaj

TSR two-level secure re-routing dvoslojno bezbedno rutiranje

TTSI

text-to-speech interface interfejs tekst-govor

VBR

variable bit rate promenljiva bitska brzina

VCD video CD, view CD, compact disc digital video video CD

VCEG

Video Coding Expert Group Ekspertska grupa za video kodovanje

VCL

video coding layer video kodni sloj

VGA video graphics array video grafička kartica – niz

VHDL

very high speed integrated circuit hardware description language hardverski opisni jezik za vrlo brzo integrisano kolo

VLC

variable-length code kod promenljive dužine

VM verification model verifikaconi model

VO

video object video objekat

VOC volatile organic compound isparljivo organsko jedinjenje

VOP

video object plane ravan video objekta

VQ vector quantization vektorska kvantizacija

VRML virtual reality modeling language jezik modelovanja virtualne realnosti

VTC

visual texture coding kodovanje vizuelne teksture

205

Page 216: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf

W3C

World Wide Web Consortium WWW Konzorcijum

WD working draft radni draft

WG

Working Group Radna grupa

XGA eXtended graphics array proširena grafička kartica

XML eXtensible markup language označeni jezik za proširenje

XMT

eXtensible MPEG-4 textual prošireni MPEG-4 tekstualni

λ

wavelength talasna dužina

206

Page 217: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf
Page 218: Osnove multimedijalnih tehnologija visa skola za elektroniku i racunarstvo.pdf