5. upravljanje dokumentima - · pdf filemreže, kao i putem interneta, ... računalne jezike...
TRANSCRIPT
Odjel za matematiku Uredsko poslovanje 1
5. Upravljanje dokumentima
Odjel za matematiku Uredsko poslovanje 2
Svrha dokumenta
Documents convert information into action.Dokumenti pretvaraju informaciju u akciju.
Kevin Craine
Informacijska tehnologija prikuplja, pretvara i prikazuje informacije. Postoji jaz između informacije i akcije. Dokumenti ispunjavaju taj jaz. Dokumenti “komuniciraju” informaciju.
communicate – dolazi od latinskih riječi “commun” i “ie”,
što znači “učiniti nešto”
Osnovna funkcija dokumenta – informaciju koju smo prikupili od informacijskog sustava iskomunicirati ljudima koji će zatim učiniti neku akciju
Odjel za matematiku Uredsko poslovanje 3
Zašto je potrebno upravljanje dokumentima?
• Informacije sadržane u dokumentima ključne su za donošenje poslovnih odluka, te je njihova točnost presudna.
• Istraživanje Xerox-a: Tvrtke koje posvećuju dovoljno pažnje upravljanju dokumentima i informacijama bolje su pripremljene za smanjivanje troškova i imaju brže reakcije na promjene na tržištu
Odjel za matematiku Uredsko poslovanje 4
Upravljanje dokumentima vs. upravljanje bazama podataka
U čemu je specifičnost upravljanja dokumentima u odnosu na baze podataka?
• BAZE – strogo strukturirani podaci• DOKUMENTI – nositelji nestrukturiranih
podataka, imaju proizvoljni oblik i sadržaj
Za upravljanje dokumentima potrebno je najprije uvesti sustav prepoznavanja informacija u njima.
Odjel za matematiku Uredsko poslovanje 5
Sustav upravljanjadokumentima (EDMS)
Sustav upravljanja dokumentima (eng. Enterprise Document Management System – EDMS) je cjelovito rješenje problema praćenja dokumenata.
Prednosti EDMS-a:• povećana učinkovitost • povećana produktivnost optimalnom upotrebom
dokumenata• povećana konzistentnost klasifikacije, indeksiranja i
dohvaćanja dokumenata• povećano dijeljenje dokumenata• praćenje donošenja odluka• automatizirano arhiviranje ili uništavanje dokumenata
Odjel za matematiku Uredsko poslovanje 6
Svrha sustava upravljanja dokumentima
1. automatizacija svih procesa koji se temelje na upravljanju dokumentima u elektronskom obliku (npr. upravljanje dokumentacijom sustava kvalitete, financijskom dokumentacijom, izrada i promjene tehničke dokumentacije, itd.)
2. trajno arhiviranje i čuvanje zbirke zapisa pomoću sustava za arhiviranje.
Odjel za matematiku Uredsko poslovanje 7
Tehnologija upravljanja dokumentima
• Sustav za upravljanje dokumentima temelji se na mrežnoj tehnologiji i upotrebi standardnog XML jezika.
• Korisnik preko standardnog Web preglednika koristi mrežnu aplikaciju tvrtke i ima točno određenu razinu pristupa dokumentima.
• Dokumenti se nalaze na poslužitelju (serveru), a za pristup se koristi standardni TCP/IP protokol kako bi korisnik mogao pristupiti poslužitelju i unutar lokalne mreže, kao i putem Interneta, uz punu zaštitu od neovlaštenog pristupa. Kako se svi dokumenti čuvaju na poslužitelju, lakše ih je zaštititi i pretraživati, nego u slučaju čuvanja na korisničkim (klijent) računalima.
Odjel za matematiku Uredsko poslovanje 8
Papirnati vs. elektronički dokumenti
• U usporedbi s papirnatim dokumentima, elektronički dokumenti imaju mogućnosti opisa dodatnih atributa –podataka o podacima (metapodataka)
• Metapodaci mogu opisivati npr. zaštitu dokumenata, rok trajanja, datum nastanka, tok nastajanja, brojčanu oznaku, adresu, autorske podatke, kontrolora, dobavljača, radno okruženje i drugo. Oni određuju i osobe koje sudjeluju u opisanom procesu.
• Svrha metapodataka: da dokumentom možemo učinkovito upravljati, a kasnije ga i jednostavno potražiti.
Odjel za matematiku Uredsko poslovanje 9
Metapodaci u dokumentuMetapodaci se kod dokumenata sastoje od dijelova:
• metapodaci o formi (obliku) dokumenta
• metapodaci o strukturi dokumenta
• metapodaci o sadržaju dokumenta
Najčešći metapodaci u dokumentima su:
• autor, naslov, šifra (broj) projekta, šifra (broj) datoteke, tip dokumenta, verzija, datum/vrijeme izmjene, i dr.
Odjel za matematiku Uredsko poslovanje 10
XML (eXtensible Markup Language)Cilj razvoja jezika za označavanje SGML (preteče HTML i XML
jezika ) i Tex (Latex) bio je umetnuti metapodatke u dokument, sa svrhom obrade informacije u njima na različitim platformama i medijima. Moto SGML jezika je “store-once-deliver-in many-forms”.
• XML ima za svrhu omogućiti jedinstvenu identifikaciju podataka na Web-u.
• u njegovom razvitku sudjeluju: Microsoft, IBM, Oracle, Sun, Intel, HP, i dr., a rad nadzire W3C (World Wide Web Consortium)
API (Application Interface) – veza između prezentacije dokumenata na webu i same aplikacije
Odjel za matematiku Uredsko poslovanje 11
XML (eXtensible Markup Language)• XML je jezični standard za opis podataka koji se koristi
za dijeljenje poslovnih informacija neovisan o operativnom sustavu, mreži ili aplikaciji.
• Nastanak: iz SGML jezika (preteča HTML-a)• XML koristi standardne oznake (tag-ove) da bi definirao
strukturu i sadržaj datoteke. Iste XML oznake u svimdatotekama omogućuju učinkovito indeksiranje, pretraživanje, kombiniranje i ponovno korištenjetekstualnih informacija.
• Budući da se XML temelji na tekstu te nije ograničen naračunalne jezike pojedinih proizvođača, omogućujerazmjenu informacija između obično nekompatibilnihsustava.
Odjel za matematiku Uredsko poslovanje 12
Razlika HTML vs. XML
HTML XML
definira što u sebi sadrže elementi web stranica
definira kako će se prikazivati podaci na Webu
omogućuje da Web stranice funkcioniraju kao slogovi u bazi podataka
Odjel za matematiku Uredsko poslovanje 13
XML primjer upotrebeKako izgledaju XML datoteke?• počinju s Document Type deklaracijom i (ili) XML deklaracijom (koja verzija se koristi)• u tekst se umeću oznake (metapodaci) za pojedine dijelove, npr. za naslov, za tekst, za model, itd. koje odgovaraju standardu koji se koristi
<?xml version="1.0"?> <!DOCTYPE advert SYSTEM http://www.foo.org/ad.dtd"> <advert> <headline>...<pic/>...</headline> <text>...</text> </advert>
<part num="DA42" models="LS AR DF HG KJ" update="2001-11-22"> <name>Camshaft end bearing retention circlip</name> <image drawing="RR98-dh37" type="SVG" x="476" y="226"/> <maker id="RQ778">Ringtown Fasteners Ltd</maker> <notes>Angle-nosed insertion tool <tool id="GH25"/> is required for the removal and replacement of this item.</notes> </part>
Primjer 2. dio dokumenta za opis proizvoda
Primjer 1. početak novinskog članka
Odjel za matematiku Uredsko poslovanje 14
XML unutar e-business alataAlati za e-business podržavaju XML, npr. • RosettaNet model partnerstva u B2B poslovanju (Cisco,
Compaq, Dell, HP, Intel, Siemens, Sun)Model se sastoji od 3 modula:– pristupnog modula, modula rječnika podataka i
implementacijskog modula
• BizTalk (inicijativa Microsofta) – skup smjernica za publiciranje shema u XML-u i korištenje XML poruka za integriranje programa u el. poslovanju– aplikacije međusobno komuniciraju putem BizTalk
poslužitelja– BizTalk poslužitelj prima formatirane dokumente od
aplikacija, obrađuje ih i konstruira poruke koje prosljeđuje drugom BizTalk poslužitelju
Odjel za matematiku Uredsko poslovanje 15
Tehnologije prepoznavanja tekstaU sustavu upravljanja dokumentima, ponekad je potrebno
paprinate dokumente pretvoriti u elektroničke. U tu svrhu koristi se najčešće optičko čitanje/prepoznavanje dokumenata (skeniranje).
Optičko prepoznavanje teksta (OCR, ICR)
• OCR program (eng. Optical Character Recognition), koristi posebne algoritme za prepoznavanje oblika slova i njihovo pretvaranje u odgovarajuće znakove na računalu.
• Kvaliteta se mjeri u točnosti pretvorbe i zadržavanjuformatiranja teksta.
•Dodatne mogućnosti – automatsko povezivanje s tekst procesorom i eksport u XML.
Odjel za matematiku Uredsko poslovanje 16
Upravljanje sadržajem web-a
• Za upravljanje dokumentima na webu koriste se alati pod nazivom CMS (eng. Content Management Systems)
CMS je sustav za upravljanje sadržajem čija je uloga olakšati i organizirati procese vezane uz kreiranje sadržaja,
posebice ako je sadržaj plod suradnje više osoba(Vlahović, V., 2004)
• namjena CMS-a: olakšati izradu i objavu web dokumenata korisnicima koji se mogu fokusirati na sadržaj
• brojna komercijalna i opensource rješenja na tržištu
Odjel za matematiku Uredsko poslovanje 17
Vrste CMS sustava• razvojne osnove za CMS (CM
Frameworks) – alati s pomoću kojih se tek izgrađuje CMS sustav
• Page-based sustavi• Modularni sustavi• Objektno orjentirani sustavi
Kako izabrati najpogodniji CMS sustav za tvrtku?
Primjeri rješenja:EZ Publish, Plone/Zope, PHPNuke
Odjel za matematiku Uredsko poslovanje 18
Skladište dokumenata
EDMS vs. Document Warehouse • standardni sustav za upravljanje dokumentima (EDMS)
tretira dokumente kao samostalne jedinice, podržava dohvaćanje informacija, ali ne i text mining, ima limitiranu semantiku metapodataka, i nije uvijek povijesno kompletan
• Skladište dokumenata (Document Warehouse) ima veću mogućnost korištenja metapodataka o dokumentima, omogućava text mining, vezu s data mining-om, fleksibilniju klasifikaciju dokumenata
Integracija EDMS-a u skladište dokumenata moguća.
Odjel za matematiku Uredsko poslovanje 19
Aktivnosti u skladištu dokumenata
Dohvaćanje dokumenata
Sumacija
Reformatiranje, konvertiranje
znakova, prijevod jezika
Indeksiranje, ključne riječi i
teme
Klasteriranje
Ekstrahiranje dokumenata
Izvor: Sullivan, D., 2001.
Odjel za matematiku Uredsko poslovanje 20
Text mining – rudarenje teksta
• predstavlja traženje neotkrivenih informacija iz mase dokumenata(traženje poslovne inteligencije iz teksta)
• dio je Data mining-a (rudarenja podataka), koje traži skrivene uzorke u podacima
TM obuhvaća ove discipline, koje su ujedno i faze TM procesa:• Dohvaćanje informacija (eng. Information retrieval - IR)• Računalnu lingvistiku (eng. Computational linguistics - CL)• Prepoznavanje uzoraka (eng. Pattern recognition)
Text mining is the art and science of extracting information and knowledge from text.
(Sullivan, D.,2001)
pretraživanje i dohvaćanje (IR)
jezična obrada (CL)
evaluacija i selekcija
ekstrakcija karakteristika i
veza
Odjel za matematiku Uredsko poslovanje 21
Primjer TM-a – migrena i prehrana
znanje jednog istraživača
znanje jednog istraživača
znanje jednog istraživača
znanje jednog istraživača
TM
znanje jednog istraživača
znanje jednog istraživača
ISTRAŽIVANJA O MIGRENAMA
ISTRAŽIVANJA O PREHRANI
Izvor: Sullivan, D, 2001.
Odjel za matematiku Uredsko poslovanje 22
TM metodologija u poslovanju• upotreba Cross-Industry Process (CRISP) modela za data
mining, koji je razvijen od strane konzorcija tvrtki: NCR, Integrated Solutions Limited, Daimler Chrysler, OHRA i BV, s ciljem razvijanja modela za otkrivanje znanja koji će biti nezavisan od alata za data mining.
Razumijevanje poslovanja
Razumijevanje podataka
Priprema podataka
ModeliranjeEvaluacija
Razvoj
CRISP model, izvor: Sullivan, D., 2001.
1 23
4
567
Odjel za matematiku Uredsko poslovanje 23
TM aplikacijeAplikacije razvijene za TM orjentirane su na rješavanje
problema iz tri područja: • poznavanje vlastitog posla• poznavanje klijenata• poznavanje konkurencije
Koraci ka učinkovitom TM:1. definirati tip informacije koja nam treba2. specificirati proces za ekstrahiranje te informacije.
Odjel za matematiku Uredsko poslovanje 24
Alati za text miningS obzirom na tip obrade teksta koji podržavaju,
razlikujemo alate koji omogućuju:• klasteriranje teksta • kategorizaciju teksta• izlučivanje važnih karakteristika• sumiranje• navigaciju u bazama teksta• vizualizaciju (prikaz rasporeda dokumenata u
obliku vizualizacijskih topografskih mapa)
Odjel za matematiku Uredsko poslovanje 25
Programski alati za upravljanje dokumentima (EDMS)
• raspoloživost brojnih alata na tržištu• masovnija upotreba alata čiji su
proizvođači ujedno isporučitelji platformi• opći i specijalizirani EDMS sustavi (npr. za
e-government)
Odjel za matematiku Uredsko poslovanje 26
MS SharePoint Services i SharePoint Portal Server
• MS Windows Share Point Products and services programski paket nudi integraciju s MS Office sustavom, na način da omogućuje lako kreiranje web stranica i web mjesta svakom članu radnog tima direktno iz bilo kojeg Office paketa (Word, Excel, Power Point, ..)
• omogućava organizacijama da personaliziraju i prema preferencama urede svoje intranet i extranet portale
• omogućava pristup poslovnim aplikacijama putem ugrađene integracije s Microsoft BizTalk Server-om.
• Share Point Portal Server 2003 – skalabilni portalski poslužitelj koji povezuje pojedinačna web mjesta organizacije u jedinstvenom portalu koji omogućuje suradnju, personalizaciju i povezivanje aplikacija
Odjel za matematiku Uredsko poslovanje 27
Lotus Domino Document Manager- IBM
• programski paket za organiziranje dokumenata te dijeljeni pristup radnim timovima. Prati dokumente kroz cijeli životni ciklus, te je dobra osnova za sustave za upravljanje sadržajem.
Odjel za matematiku Uredsko poslovanje 28
Combis Document Life Cycle
Sustav prati cijeli životnivijek dokumenta, odnjegovog nastanka(povijest obrade, odobravanja), prolaskakroz različite statuse(nadležnosti, odobravanja različitihosoba), pa sve do arhiviranja tog dokumenta.
Odjel za matematiku Uredsko poslovanje 29
• programski paket za upravljanje dokumentima prvenstveno namijenjen rješavanju problema u vertikalnoj kolaboraciji. Omogućava dijeljenje dokumenata s drugim osobama, kontrolu pristupa dokumentima, te objavljivanje istih unutar organizacije.
Aktivnosti koje e-Board podržava:• praćenje verzija dokumenata, te bilježenje njihove
povijesti• primjena opisnih, te pretraživih informacija (metadata) za
prepoznavanje dokumenata • kontrola objavljivanja dokumenata • automatizirani sustav revizije dokumenata prije njihovog
objavljivanja • Web rasprave, on-line komentiranje dokumenata od strane
revizora, lektora • kontrola pristupa dokumentima bazirana na prije određenim
pravilima
eBoard – bespapirne sjednice
Odjel za matematiku Uredsko poslovanje 30
DCS Job Manager - Invaris
Sustav koji proizvodi elektronske, interaktivne obrazce bazirane na pravim dokumentima –pogodan za izradu tehničke dokumentacije.
Odjel za matematiku Uredsko poslovanje 31
Meridio - BCC
sustav je integriran u okruženja Microsoft Windowsa, Office i SharePoint Portala. Pruža i uslugu integriranja sustava za upravljanje dokumentima u poslovne aplikacije korisnika.
može pohraniti sve vrste elektroničkih dokumenata kojeposjeduje neka organizacija, ali i informacije o onimdokumentima koji se ne čuvaju u elektroničkom obliku. I dokumenti i podaci o dokumentima pohranjuju se nastrukturiran i sistematiziran način, koji omogućuje sigurnopospremanje, potpunu kontrolu pristupa, te brz i jednostavandohvat ovlaštenim korisnicima.
Odjel za matematiku Uredsko poslovanje 32
Literatura• Čerić, V., Varga, M., ur., Informacijska tehnologija u poslovanju,
Sveučilište u Zagrebu, Element, Zagreb, 2004.• Sullivan D., Document Warehousing and Text Mining, Wiley Computer
Publishing, John Wiley & Sons, Inc., New York, 2001. • Goyal Chin A. (Editor), Text Databases and Document Management:
Theory and Practice, Wiley, 1996 • Sellen, A.J., Harper, R.H.R, The Myth of the Paperless Office, The MIT
Press; Reprint edition, 2003.• Sutton, M.J.D, Document Management for the Enterprise : Principles,
Techniques, and Applications, Wiley, 1996.• Craine, K., Designing a Document Strategy, MC2 Books, 2000.• Panian, Ž., Izazovi elektroničkog poslovanja, Narodne novine, Zagreb,
2002.• Gligorić, Z., Kako sprečiti zagušenje, Security, br. 10, 2004,
http://www.security.org.yu/Reviews%20and%20Previews/DispForm.aspx?ID=197, 10.03.2005.
Odjel za matematiku Uredsko poslovanje 33
Softverski alati• Upravljanje informacijama pomoću XML-a u programskom paketu Office
Professional Edition 2003, http://www.microsoft.com/croatia/office/editions/prodinfo/techologies/xml.mspx, 01.04.2005.
• Combis Document Life Cycle -http://www.combis.hr/index.php?lang=0&page=article&id=58, 01.04.2005.
• IBM Lotus Domino Document Manager,http://www.lotus.com/lotus/offering4.nsf/wdocs/domdochome, 11.03.2005.
• Business.com directory of Document management software, http://www.business.com/directory/computers_and_software/software/content_and_document_management/, 11.03.2005.
• Eurocomputer Systems, e-Board – rješenje za pripremu i upravljanje sjednicama, http://www.ecs.hr/ecs/rjesenja/eboard/, 10.03.2005.
• Meridio – BCC, Upravljanje dokumentima i poslovnim procesima, http://www.services.bcc.hr/Offerings/Doc&Proc-Management/Components-Meridio.htm, 10.03.2005.