information engineering und information life cycle
Post on 24-Jun-2022
3 Views
Preview:
TRANSCRIPT
Information Engineering und Information LifeCycle
Norbert Fuhr
Universitat Duisburg-Essen
Information EngineeringSS 2013
Inhaltsverzeichnis
Ubersicht uber die Vorlesung
Information Engineering
Informationskompetenz
Suchkompetenz
Daten – Information – Wissen
Wissensmanagement
Information Lifecycle
Zusammenfassung
Ubersicht uber die Vorlesung
(Vorlaufige) Ubersicht uber die Vorlesung
1. Grundlagen
2. Methoden
3. Systeme
4. Anwendungen
5. Evaluierung
Grundlagen
I Information Engineering
I Information Lifecycle
I Daten – Information – Wissen
I Wissen und Prozesse: Workflows / Wissensintensive Aufgaben
I Information Seeking & Searching
I Repositories, Datenbanken
I Digitale Bibliotheken und Collaboratories
Methoden
I (Autorensysteme)
I Digitalisierung
I Informationsextraktion
I (Information Mining)
I Metadaten
I Ontologien
I Annotationen
I Digital Preservation (Langzeitarchivierung)
I (Information Retrieval)
I Recommendation
I Evaluierung
Systeme
I Architekturen
I Repositories
I Web Server
I Content-Management-Systeme
I Wikis
I Digitale Bibliotheken
Anwendungen
I DAFFODIL
I COLLATE
I Soziale Netze / Kollaborative Web 2.0-Systeme
Information Engineering
DefinitionEigenschaften
Was ist Information Engineering?
Eine erste Definition von Information Engineering:
The application of an interlocking set of formaltechniques for the planning, analysis, design andconstruction of information systems, applied on anenterprisewide basis or across a major sector of anenterprise.
James Martin
Was ist Information Engineering?
I Formale Methoden zurI PlanungI AnalyseI EntwurfI Realisierung
von Informationssystemen
I Methoden bauen aufeinander auf und sind voneinanderabhangig
I Methoden werden zumeist unternehmensweit verwendet
Was ist Information Engineering?
Information Engineering is an integrated set oftechniques, based on corporate strategic planning, whichresults in the analysis, design and development ofsystems which supports those plans exactly. InformationEngineering is applied by managers and users with noknowledge of computers, but instead with an expertknowledge of their business - in conjunction with expertsystems which provide rapid feedback to management forrefinement of the strategic plans.
Finkelstein
I Strategische Planung
I Kooperation und Partnerschaft von Managern und Nutzernmit Entwicklern
Eigenschaften des IE
I Information Engineering beschreibt keine starre Methodik,sondern Methoden
I IE fordert Top-Down-Ansatz von Informationssystemen:
1. Unternehmensweite Informationssystemplanung2. Analyse von Geschaftsbereichen3. Informationssystementwurf4. Informationsystemrealisierung5. Informationssystemeinfuhrung
Eigenschaften des IE
I IE unterstutzt Aufbau eines sich laufend weiterentwickelndenBestands an Wissen uber ein Unternehmen
I IE unterstutzt langfristige Evolution der Informationssysteme
I Orientierung an Unternehmenszielen
I Benutzerbeteiligung
I Strategische Planung
Eigenschaften des IE
Keine Beschrankung auf Unternehmen!
I Klassische Definition des IE zugeschnitten auf das“computerisierte Unternehmen“
I Web-Informationssysteme, Digitale Bibliotheken
I Offene Communities vs. geschlossene Unternehmen
I Vermittlung von Inhalt und Wissen an Communities
I Kollaborative Erstellung neuen Wissens und neuer Inhalte
I IE-Methoden auch auf diese Informationsysteme erweiterbar
Informationskompetenz
Informationskompetenz - 6 SchritteImplizierte FahigkeitenBenachbarte Kompetenzen(Potenzielle) Systemunterstutzung
Information/Wissen als Entscheidungsgrundlage
”People’s actions are based more on what they believe than onwhat is objectively true”[Bandura, 1997; Pajares, 2002].
“What you see is all there is (WYSIATI)”(Entscheidung allein aufgrund der vorhandenen, unzureichendenInformation)(Kahneman, 2011: Thinking fast and slow)
→ Informationskompetenz als notwendige Fahigkeit, um Glaubendurch Wissen zu ersetzen
Informationskompetenz - 6 Schritte
1. AufgabendefinitionI Definiere das InformationsproblemI Identifiziere das Informationsbedurfnis
2. Informations-Beschaffungs-StrategienI Bestimme alle moglichen QuellenI Wahle die besten Quellen aus
3. Lokalisierung und ZugriffI Lokalisiere die Quellen (intellektuell und physisch)I Finde die Information innerhalb der Quelle
4. Benutze die InformationI Anschauen (z.B. lesen, horen, betrachten, anfassen)I Extrahiere die relevante Information
5. SyntheseI Organisiere die Information aus verschiedenen QuellenI Prasentiere die Information
6. BewertungI Beurteile das Produkt (Effektivitat)I Beurteile den Prozess (Effizienz)
Implizierte Fahigkeiten
1. AufgabendefinitionI Informationsbedarf erkennen
2. Informations-Beschaffungs-StrategienI Kenntnis von StrategienI Kenntnis von Quellen
3. Lokalisierung und ZugriffI Lokalisierung von InformationI zielgerichtete Selektion von Information
4. Benutze die InformationI Organisation von Information
5. SyntheseI zweckoptimierte Gestaltung und Prasentation
6. BewertungI kritische Beurteilung von Information
Benachbarte Kompetenzen
I Bibliothekskompetenz
I Computerkompetenz
I Digitalkompetenz (Fahigkeit, uber Computer dargestellteInformationen unterschiedlicher Formate verstehen undanwenden zu konnen)
I Internet-Kompetenz
I Suchkompetenz
I Kommunikationskompetenz
I Lesekompetenz
I Medienkompetenz
I Schreibkompetenz
(Potenzielle) Systemunterstutzung
1. AufgabendefinitionI Wissenstests in Lehr-/Lernumgebungen
2. Informations-Beschaffungs-StrategienI Strategien fur Standardprobleme (z.B. known item search)
3. Lokalisierung und ZugriffI Hilfe bei der Anfrageformulierung (→ Daffodil)I situationsabhangige Vorschlage zur Suchfortsetzung (→
Daffodil)
4. Benutze die InformationI strukturierte Ablage (→ personliche Handbibliothek in
Daffodil)I Annotationsmoglichkeiten
5. SyntheseI ?
6. BewertungI ?
Suchkompetenz
SuchbarkeitLinguistische FunktionenAnfragespracheRankingSuchtaktiken und Strategien
Suchkompetenz
I Aufbau einer Web-Suchmaschine
I Suchbarkeit
I Linguistische Funktionen
I Anfragesprache
I Ranking
I Suchtaktiken und Strategeme
Aufbau einer Web-Suchmaschine
Basiskomponenten einer Web-Suchmaschine
Crawler Sammelt Webseiten, interagiert mit Webservern beimDokumentzugriff, folgt Links zu neuen Quellen
Parser/Indexer Extrahiert Schlusselworter aus Texten und indexiertdie Dokumente
Datenbank Effiziente Speicherung der extrahierten undaufbereiteten Daten (z.B. in einer Datenbank mitinvertierten Listen)
Searcher Entgegenname von Anfragen, sucht in der Datenbanknach den passenden Antworten
SuchbarkeitWelche Dokumente konnen uberhaupt gefunden werden?
I Zugriff:I offentlich zuganglichI verlinktI durch robots.txt erlaubtI keine Datenbankinhalte (außer wenn verlinkt)
I AktualitatI Dokumentformat
I nur Texte (kein Faksimile, andere Medien nur uber Text)I keine exotischen Dokumentformate
I keine Sprachubersetzung
Suchkompetenz - linguistische Funktionen
Wortnormalisierung Fuhr – fuhr, Schuss – Schuß, colour – color,meta tag – meta-tag – metatag – meta tag’s
Grundformreduktion Hauser – Hauses – Hause – Haus, Duisburg –Duisburgs, ¬ Duisburger
Nominalphrasen ”information retrieval”, ”retrieval * information”
Komposita Einfamilienhaus, Reihenendhaus, Doppelhaushalfte
Synonyme Handy Mobiltelefon Smartphone / ∼handy
Anfragesprache
I UND, ODER, Negationhandy -vertrag
I Zahlenbereiche: 100..200 EURO
I Facetten: Objekttyp (Bil-der/Maps/Videos/News/Shopping/..),Standort, Sprache, Zeitraum
I site:, link:, filetype:,
related:
link:uni-due.de -site:uni-due.de
I inurl:, intitle:, intext:,
inanchor:
duisburg -intext:duisburg
RankingFaktoren, die eine Seite nach oben bringen
I Suchbegriffe kommen haufig in der Seite vor
I Suchbegriffe kommen in Ankertexten vor
I Page rank
I Nutzer-Klicks: fremde, eigene, Freunde (Google+)
I Diversitat
(Faktoren werden als Merkmale in einem learning to rank-Ansatzverwendet, auf Klick-Daten trainiert)
Search engine optimization:Maßnahmen, eine Seite nach oben zu bringenaber: Web spam
Suchtaktiken und Strategien
Taktiken:
Monitoring ”Tactics to keep the search on track and efficient”
Strukturelle Taktiken auf der Menge der potenziellen Antworten
Suchformulierung verbreitern/einengen, viele/wenige Terme
Term-Taktiken Auswahl/Variation der Suchterme
Ideen-Taktiken offene Suchmoglichkeiten/Variation
Strategie: Plan zu Durchfuhrung einer komplexen Suche
Daten – Information – Wissen
Die Begriffe Daten, Information und WissenSichtweisen auf Wissen
Daten – Information – Wissen
I Im Zusammenhang mit Informationssystemen tauchen dieBegriffe “Daten“, “Wissen“ und “Information“ auf
I In der Informatik redet man auch von “Datenbanken“ oder“Wissensmanagement“
I Was also ist der Unterschied zwischen Daten, Wissen undInformation?
Sichtweise des Wissensmanagement
I Unterscheidung zwischen Daten und Information auf der einenund Wissen der anderen Seite
I Kontinuum Daten – Information – WissenI Abgrenzung hinsichtlich der Fragestellung
I Daten und Information: “wer – was – wo – und wann?“I Wissen: “wie?“ und “warum?“
I Prozessorientierter Ansatz:I Wissen als Ressource, die zur Erledigung einer Aufgabe
notwendig istI Neues Wissen kann aus der Erledigung der Aufgabe entstehenI Integrierte Betrachtung von Daten, Information und Wissen
Sicht der Informationswissenschaft
I Ursprunglich: Kontinuum Daten – Wissen – Information
I Gegensatz zur allgemein ublichen Begrifflichkeit
I Daher: Daten – Information – Wissen, mit Erlauterungen ausder Informationswissenschaft
Syntax, Semantik und Pragmatik
Syntax: Hierbei wird ein Objekt als Folge von Symbolenaufgefasst.
Semantik beschaftigt sich mit der Bedeutung eines Objektes.
Pragmatik orientiert sich an der Nutzung eines Objektes fureinen bestimmten Zweck.
Daten — Information — Wissen Wissen
I Wissen ist die Teilmenge von Information, die von jemandemin einer konkreten Situation zur Losung von Problemenbenotigt wird
I Suche nach Wissen in externen Quellen
I Informationssysteme: Extraktion des benotigten Wissens ausder bereitgestellten Information
I Transformation von Information in Wissen als ein Mehrwerterzeugender Prozess
I Wissen ist Information in Aktion
Beispiel: LINUX Manuals
I Beinhalten Information uber Linux
I Beispiel: wie drucke ich ein Dokument?
I Benotigtes Wissen: Teilmenge der insgesamt in den Manualsverfugbaren, umfangreichen Information
I Mehrwert durch gezielte Bereitstellung (z.B. durch das Linuxman-Kommando)
Anderes Beispiel: Daten
T01 -- T02 1:2
T03 -- T04 2:0
T05 -- T06 2:4
T07 -- T08 1:4
T09 -- T10 1:1
T11 -- T12 1:0
T13 -- T14 1:4
T15 -- T16 1:3
T17 -- T18 3:2
Aus Daten wird Information
Ergebnisse Fußball-Bundesliga 28. Spieltag
Hannover – Bayern 1:2Schalke – Gladbach 2:0Hamburg – Stuttgart 2:4Aachen – Dortmund 1:4Berlin – Bielefeld 1:1Bremen – Nurnberg 1:0Leverkusen – Bochum 1:4Frankfurt – Cottbus 1:3Wolfsburg – Mainz 3:2
Wissen zur Entscheidungsfindung
Problem: Soll ich heute mein BVB-Trikotauf der Arbeit anziehen?
Ergebnisse Fußball-Bundesliga 28. Spieltag
Hannover – Bayern 1:2Schalke – Gladbach 2:0Hamburg – Stuttgart 2:4Aachen – Dortmund 1:4Berlin – Bielefeld 1:1Bremen – Nurnberg 1:0Leverkusen – Bochum 1:4Frankfurt – Cottbus 1:3Wolfsburg – Mainz 3:2
Rolle des Wissens zur Entscheidungsunterstutzung
Wissen dient zur “informationellen Handlungsabsicherung“
NützlichkeitEntscheidung WissenInformation
1) Verfügbarkeit
b) Zugänglichkeit2) Interpretierbarkeit
a) Bereitstellung
Daten
3) Neuigkeit
8) Informationswert b) Verständlichkeit a) Informationsgehalt7) Validität
4) Glaubwürdigkeit
5) Relevanz a) Kontext−Relevanz b) Aktualität
a) Bereitstellung b) Zugänglichkeit
6) Entsch.−Verfügbark.
Sichtweisen auf Wissen
I Enzyklopadisches WissenI AlltagswissenI Lexikalisches WissenI FachwissenI Erfahrungswissen
I Handlungswissen
I Raumliches Wissen
I Episodisches Wissen
AlltagswissenDies sind 4 Apfel
Unternehmen sollen Gewinne erwirtschaften
Lexikalisches Wissen
Schimmel bezeichnet weißes Pferd
Abbildung: Weißes Pferd, Jerzy Panek
Fohlen bezeichnet junges Pferd... und das Team von BorussiaMonchengladbach ;-)
Fachwissen
Gewinn ist Umsatz minus Kosten
G = U − K
Komplexe Zahlen besitzen einen Real- und ImaginarteilRealteil︷ ︸︸ ︷1.631 , 4.73i︸ ︷︷ ︸
Imaginarteil
Erfahrungswissen
Unreife Fruchte konnen Durchfall verursachen
Abbildung: Unreife Frucht der Red Savina, scharfster Chili der Welt
Handlungswissen
Kenntnis von Prozeduren und Problemlosungen
Raumliches WissenAnaloge Reprasentation physischer Objekte durch Reprasentationraumlicher Information und Verhaltnisse
Beispiel: Mentale Rotation analoger Objekte
Episodisches Wissen
Autobiografisches Wissen, das aus erinnerbaren Erlebnissen besteht
Beispiel: George spielt Golf in Yale
Implizites vs. explizites Wissen
Implizites Wissen:
In mentalen Modellen, kognitiven Bildern Konstruktenund Karten sowie routinierten Verhaltens- undVorgehensweisen eingelagertes Wissen bezeichnet man alsimplizites Wissen (tacit knowledge ),auch als Know-how oder Fingerspitzengefuhl beschrieben
Explizites Wissen (Polanyi)
Spezifisches, reproduzierbares Wissen,In der Regel schriftlich (oder anderweitig explizit)reprasentiert
Implizites vs. explizites Wissen
Aufgabe von Informationssystemen:
I Implizites Wissen in Explizites uberfuhren
I Explizites Wissen bei Anwendung evtl. wieder implizit
Wissensmanagement
SECI-Modell
Wissensmanagement
”Wissensmanagement beschaftigt sich mit den Moglichkeiten, aufdie Wissensbasis eines Unternehmens Einfluss zu nehmen. Unterder Wissensbasis eines Unternehmens werden alle Daten undInformationen, alles Wissen und alle Fahigkeiten verstanden, diediese Organisation zur Losung ihrer vielfaltigen Aufgabenbenotigt.” (Wikipedia)
I Wissen als Produktionsfaktor
I Informationssysteme zur Verwaltung des Wissens
I Chief Information Officer (CIO) fur Informationsmanagement
I Kritik: Wissensmanagement verwendet undifferenziertenWissensbegriff
SECI-Modell
[Nonaka & Takeuchi 95]
Modell der Wissenserzeugung:
I Sozialisation
I Externalisierung
I Kombination
I Internalisierung
Sozialisation
I Lernen durch Beobachtung Anderer
I Besprechungen, Brainstorming
Externalisierung
I Dokumentieren, Veroffentlichung
I Abspeichern in Datenbanken
Kombination
I Organisation von Wissen
I Integration von Wissen aus verschiedenen Quellen
Internalisierung
I Verinnerlichen von Wissen (Lernen)
I Wissen erhalten und anwenden
Information Lifecycle
Der Information Lifecycle im Information EngineeringPhasen des Information LifecycleIE-Methoden im Information Lifecycle
Information Lifecycle im IE
I In dieser VL: Konzentration auf Methoden und Werkzeuge desIE
I Grundlage der weiteren Betrachtungen: InformationLifecycle
I Betrachtung aller Lebensphasen von Information (Erstellungbis Anwendung)
I Ideal: Informationssystem unterstutzt alle Phasen
I Einsatz von Methoden hangt vom Informationssystementwurfab (nach Planung und Analyse)
I Implementierung und Integration der Methoden undWerkzeuge Teil der Realisierung des Informationssystems
Information Lifecycle
Information Lifecycle
I Information dient der Erfullung einer Aufgabe
I Formulierung als Prozess
I Teilaufgaben als untergeordnete Prozesse
I Wissensintensive Aufgaben
Creation/Receipt
I Autorensysteme (Authoring)I Erstellung einfacher TexteI Hypertext- und Multimediadokumente, Hypermedia
I MetadatenI Daten uber DokumenteI z.B. bibliographische Daten
I AnnotationenI Spezielle Art von MetadatenI Verschlagwortung, “tagging“ bzw. semantische AnnotationI Textuelle Kommentare, Diskussionen
I Markup
Creation/Receipt
I DigitalisierungI Erfassung und Umsetzung von nicht-digitalen Quellen in
digitaleI Textuelle Dokumente (Scanning, OCR)I Nicht-textuelle Daten (Schall, Messdaten, Video, Bilder) →
Sampling
I ModellierungI Formale Darstellung von Prozessablaufen, Sequenzen,
Anwendungsfallen, Zustanden und Beziehungen
Storage
I Kurz- bis langfristige Speicherung der Information
I Fluchtige Information im Hauptspeicher
I Ablage in Dateien
I Großere Datenmengen, (semi-)strukturierte Daten:Datenbanken
I Dokumente: Digitale Bibliotheken/Repositories
I Langzeitarchivierung (digital preservation)
I Wissensreprasentation und Organisation, Ontologien
I Aufbereitung fur die Suche: Indexierung
Dissemination
I Information Retrieval
I Recommender-Systeme
I Zugangsmanagement (access management)
Use
I Informationssysteme dienen haufig der Erfullung einerbestimmten Aufgabe oder eines bestimmten Zwecks
I Informationssystem kann Anwendungen gezielt unterstutzen
I Beispiel Geisteswissenschaften: Interpretation des Materialsmittels annotationsbasierter Diskussion (damit auchGenerierung neuer Information)
I Beispiel Informationssystem fur Multimediadokumente:Abspielfunktionen fur Videos oder Musik
Zusammenfassung
Zusammenfassung
I Begriff des Information Engineering erlautertI Keine starre Methodik, sondern Methoden und WerkzeugeI Konzentration auf Realisierung von Informationssystemen
I Informationskompetenz als notwendige Voraussetzung
I Daten – Information – Wissen
I WissensmanagementI Information Lifecycle
I 4 PhasenI Mogliche Methoden fur jede Phase
top related