m anagement znalostí v medicíně „datamining“

Post on 23-Jan-2016

69 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

M anagement znalostí v medicíně „Datamining“. Professor R. Hanka Director, Medical Informatics Unit,University of Cambridge Visiting Profesor, Fakulta Managementu, VŠE. M anagement znalostí -v- ‘data mining’. Data mining Těžení informací z velmi rozsáhlých souborů electronic kých dat - PowerPoint PPT Presentation

TRANSCRIPT

MManagement znalostí v anagement znalostí v medicíněmedicíně

„Datamining“„Datamining“

Professor R. HankaProfessor R. HankaDirector, Medical Informatics Unit,University of Director, Medical Informatics Unit,University of

CambridgeCambridge

Visiting Profesor, Fakulta Managementu, VŠEVisiting Profesor, Fakulta Managementu, VŠE

MManagementanagement znalostí znalostí-v--v-

‘data mining’‘data mining’ Data mining

– Těžení informací z velmi rozsáhlých souborů electronických dat

Znalost– Vytvořená z informací využitím

interpretace a důležitosti Management znalostí

– zpřístupňování interpretovaných nebo interpretovatelných informací.

PProblrobléémm

Rozdílný nárůst:

Intelektuálních schopností

Znalostí

LidskéLidské iintelentelekktutuální ální schopnostischopnosti

Nemožné měřit objektivně

Za minulých 5 millionů let objem mozku

vzrostl ze 400cm3 na 1,400cm3

Obsahuje asi 1011 neuronů a 1014 synapsí

Mezi n a n.(n-1)/2 spojů.

Zdvojnásobuje za 1.5 až 3 miliony roků

Kapacita mozkuKapacita mozku

Full connectivity

Limited connectivity

Lidské znalostiLidské znalosti

Nemožné měřit objektivně

Počet knih v knihovně Cambridge

University.

Knihy v knihovnKnihy v knihovněě Cambridg Cambridgee University University

Zdvojnásobují se každých 33 let !

Nárůst znalostí a intelektuNárůst znalostí a intelektu

time

intelekt

znalosti

Nárůst znalostí a intelektuNárůst znalostí a intelektu

time

intelekt

znalostiInformační přetížení

InformaInformační přetíženíční přetížení

15.století - polymath

18. století - lékař znal vše co

se dalo znát

20. století - specializace

21. století - úzká specializace.

Šířka znalosti

Hlo

ub

ka

znal

ostí

Velikost problémuVelikost problému

InformaInformační přetíženíční přetížení

Zahlceni informacemi

Obtížné najít požadované informace

Obtížné posoudit kvalitu nalezených informací.

Vannevar BushVannevar Bush “As We May Think” “As We May Think” (1945)(1945)

Osobní knihovnaOsobní knihovna (vertical (vertical

books)books)

StezkyStezky (horizontal hypertext) (horizontal hypertext)

MěnitelnéMěnitelné

AnAnotace.otace.

MemexMemex

Rozhodnutí lékaře hledat informaci záleží na

– Urgency

– Očekávání že definitvní závěr bude nalezen.

(Gorman & Helfand 1995)

InformaInformacece

Lokální Globální

Všeobecné

Specifické

Individual Practice Guidelines Clinical pathways

Medical knowledge baseLocal hospital prescribing guidelines

InformaInformační potřebyční potřeby ((clinické školení)

Lokální Globální

Všeobecné

Specifické

Individual Practice

Guidelines

Clinical pathways

Medical knowledge baseLocal

hospital prescribing guidelines

InformaInformační potřebyční potřeby ((lékař v praxilékař v praxi))

Lokální Globální

Všeobecné

Specifické

Individual Practice GuidelinesClinical

pathways

Medical knowledge

base

Local hospital prescribing guidelines

InformaInformační přetíženíční přetížení

Zahlceni informacemi

Obtížné najít požadované informace

Obtížné posoudit kvalitu nalezených informací

Internet ?

InternetInternet

Haphazardní sbírka informací

Navigace bez struktury

Výsledky hledání často obsahují ‘64,000 hits ‘

Informační ‘zamoření’.

Základní elementy Základní elementy managementu znalostímanagementu znalostí

‘Rozumět’ textu

Kategorizace slov, vět,paragrafů a celých dokumentů

Knihovny elektronických dokumentů.

Digitální knihovnyDigitální knihovny

Většinou zatím obsahují elektronické kopie papírových dokumentů

Podpora kompletního cyklu managementu znalostí

Záruka kvalityVybrané vnější zdrojeArchivování.

DigitDigitální knihovny ální knihovny výhodyvýhody//nevýhodynevýhody

Výhody– Založeny na informačních vědách– Dosažitelné odevšud– Kvalita managementu– Archivní role

Nevýhody– “knihy” často nejsou svázány nebo

neexistují– Žádná pomoc od professionálních

knihovníků.

Nástroje managementu Nástroje managementu znalostíznalostíManuální

– Proces je explicitní (vs. tacit knowledge) – Zvyšuje hodnotu

(Semi)automatické– Umělá inteligence (AI)– Rozpoznávání obrazců (pattern

recognition).

AutomaticAutomatická klasifikace ká klasifikace dokumentůdokumentů

Příklady tříd– Kardiovaskulární nemoce,

chirurické techniky…– oficiální guidelines, guidelines

pro zájmové skupiny, charity …‘Učení s učitelem‘

– Příklady ze všech možných tříd– starý AI problém.

Příznaky, charakteristiky Příznaky, charakteristiky ((featuresfeatures))

Příznaky– Základní termíny (slova)– Kontextuální charakteristiky– Charakteristiky struktůry dokumentů

Angličtina 500,000 slovBěžný soubor 30,000 slovKletba DimensionalityNutnost snížit počet

characteristik.

KKlasifilasifikace s omezeným kace s omezeným počtem příznakůpočtem příznaků

Original Set of 3822 Features

30.00%

40.00%

50.00%

60.00%

70.00%

80.00%

90.00%

100.00%

6 12 25 50 100 200 400 600 800

number of features

ac

cu

rac

y

SOM clustering

chi-square

hierarchical clustering

hierarchical clustering- after removal of themost frequent clusterPCA

Další nástrojeDalší nástroje

Produkce hyperlinků

Summarizace

‘Vázání’ knih

Inteligentní hledáníCíl je naučit počítač ’číst’.

Dvě revoluceDvě revoluce

Parní stroj

začal průmyslovou revoluci Železnice, poštovní služba, telegraf

skutečný průmyslový rozvoj Vynález počítače

začal informační revoluci Internet (packet switching)

začátek rozvoje informační revoluce.

OtázkyOtázky??OtázkyOtázky??OtázkyOtázky??OtázkyOtázky??OtázkyOtázky??OtázkyOtázky??OtázkyOtázky??

top related