verksamhetsanalys via journaltext - termkonferens.seutskrives retard supp pt colon mÄssigt seloken...
TRANSCRIPT
Verksamhetsanalys via journaltext
Anders Thurin 2013
Bakgrund● Sjukvård kunskapsintensivt!
● Kvalitetsregister ”Guldgruva”, men ..
– täcker bara vissa verksamheter,
– Rapportering extra arbete - dubbeldokumentation
– Behövs automatisk inrapportering från journal!
● Mycket värdefull FoU kan göras utifrån befintliga journaler
– Retrospektiva studier av t.ex. utfall av olika diagnostiska strategier
– Fas IV-studier (utvärdera läkemedel i klinisk praxis)
● Språkteknologin gav oss Google
– Kan ge även verktyg för klinisk forskning i journalinfo!
– Behövs mycket mer metodutveckling - klinisk språkteknologi!!
Journaltextcorpus?
● Samling med journaltext som kan karakteriseras noga t.ex. ordklasser, satsdelar, innebörd
● Språkbanken, GU samlar tidningstext mm
● värdefullt för att utveckla klinisk språkteknologi!– Svårt pga sekretess/anonymisering.
– Dock möjligt att identifiera (och avlägsna) personnamn, telefonnr etc i löpande text med skNamed Entity Recognition (D Kokkinakis)
Journalstruktur● 70-t: SPRI grundjournal, standardiserade sökord
– För att hitta i en pat's journal
– för att söka/sammanställa information i flera jnl!
● Ej enhetlig struktur – sällan användbart för sammanställningar
– Extra jobb att dokumentera
– Svårt hitta/genomdriva en struktur som alla accepterar
– Svårt visa nytta av viss sökordsstruktur
● Behövs : evidensbaserad journalstruktur, som kan förankras i en ny generation läkare!
● Eller: Skippa strukturen, förbättra textbearbetning
Bearbeta befintlig text -en framkomlig väg?
● Tillämpningar idag– Studera hur vården utförs och dokumenteras –
best practice
– Rapportering till nationella / lokala kvalitetsregister● hälsofaktorer/rökning?
● Framtidsmöjligheter– Textsammanfattning
– Leta ”triggers”● pat för studieinklusion- som uppfyller vissa kriterier
● ”Intelligent” beslutsstöd för komplicerade patienter
● Kommentera ordinationer
Etik
● Patientdatalagen : för forskning krävs informerat samtycke från varje patient (knappast realistiskt för hundratusen pat), journalåtkomst dock OK för kvalitetssäkring
● Sjukvårdslagen : legitimerad vårdgivare skyldig att kvalitetssäkra sin verksamhet
● I praktiken : kolleger rädda för åtal om de följer upp patienter (ej längre ”vårdrelation”)
● SU-jurist : all forskning inom SU är kvalitetssäkring
● Förslag: sekretesskommitte som kan tillåta vissa typer av sökning
Lexikologi - Melior 2004
• Direkt databasaccess (SemanticMining)– Med+Kir klin, Östra sjh
– ~200000 vårdtillfällen, 200M ord, ~1GB
• Journalinnehåll sorterat under sökord– Vissa sökord innehåller sifferuppgifter, en/flerval– Läkemedel, lab delvis i speciella moduler
Vanligaste sökord
Andning/cirkulation 120601
Vårdförlopp 114478
Allmäntillstånd 106592
Sömn 100442
Tidigare sjukdomar 100144
Syrgasmättnad (POX) 94911
Kommunikation 93604
Överkänslighet 93406
Andning/Cirkulation 93108
Smärta/sinnesintryck 89044
Besöksorsak 88698
Hälsohistoria/vårderfarenhet 87338
Puls 86237
Aktivitet 78314
Upplysningar 76848
Sökord nAnteckning 796178
Aktuellt 383077
KOPIA FRÅN 225024
Huvuddiagnos 208621
Bedömning 196602
Bidiagnos 190593
EKG / Hjärtrytm 177890
Nutrition 165646
Elimination 157810
Välbefinnande 157685
Blodtryck 154246
Blodtryck eg1 133721
OBSERVATIONER,KONTROLLER 128110
SPECIELL OMVÅRDNAD 128107
Åtgärd 127610
Omvårdnadsåtgärd 121600
Många ord förekommer mycket sparsamt (jmf Zipfs lag)
Hälften av ord ses blott en gång... (Hapax Legomena)
Innehåll okontrollerat– 1 dygn.– 020613-020615– 14/10->23/10.– 020808-020810.– 010801 - 010803– 3 dagar.– 02 04 04 - 02 04 05– 030325-030401– 2/4->5/4-01– 020413-020419– 2/7-9/7– 030606-– 021209-021223– 2004-01-13 2004-01-20– 010824-010827– 040223-040226– 1 dygn– 011101-011107– 021112-02113– 011005 - 011007.– 4-6/9.
ex Vårdtid:
svårare sammanställa
Ex Sjukskrivning0.Ej aktuellt.Sjukskrives 4 veckor.Ej angivet.Ej aktuellt.Pat är sedan tidigare sjukskriven november ut.--Noll.0.T o m 941001.Noll.Ej aktuellt.Ej angivet.Ej angivet.00.-C:a 3 veckor från arbetet på skyddad verkstad.10 dgr.
Vanliga innehållsord
OCH I HAR PÅMED PAT ATT TILL EN FÖR AV SOM ÄR DET OM FÅR KL INTE DR A
MEN MG SIG VID HAN NU EJ HON MAN ETT INGEN EFTER X UNDER FRÅN
SEDAN T BRA DETTA INGA LITE HAFT OP U ML KAN VI DÅONT
Journaltermer• Ord betydligt vanligare i både medicin- och kirurgjournaler än i
allmänspråk ( enligt Parole-corpus )
• TABL AKUTÖ INJ RTG UA CT KAD PANODIL CRP BLTR BEH MKT NGT FUROSEMID VÄ PULM POX BILJUD KETOGAN FÖRMAKSFLIMMER NGN TROMBYL INLÄGGES PALP INKOMMER LPK GLUCOS KIR MG GASTROSKOPI ANDNINGSLJUD ANAMNES DGR VES WARAN ANGINA MOTT DIURES INATT DIARREER VOLTAREN EPIGASTRIET ÅB BLÅSLJUD ENL LEVERSTATUS KLIN TIPAROL KREATININ DIARRE PAD RLS TEMP UCG AFEBRIL ELSTATUS STILNOCT RESISTENSER SMÄRTPÅVERKAD CVK PALPERAS COR SIDIG VÄS SINUSRYTM MAVA MALIGN IMOVANE CKMB UVI GRIMMA FOSSA ACTRAPID KREA PVK UPPEGÅENDE UTSKRIVES RETARD SUPP PT COLON MÄSSIGT SELOKEN POS ML PREDNISOLON ZOC NITROMEX INSÄTTES CIRKULATORISKT EPIKRIS OÖM STESOLID FYS URINSTICKA VC BRÖSTSMÄRTA ULCUS ALP ZINACEF KONTR LEVAXIN PALPÖM BUKSMÄRTA LANACRIST PECTORIS NGR LANZO NACL AUSK RESURIN EKG ALAT ANT PNEUMONI HEMATOM ISCHEMI BILAT CIPROXIN ASAT DYSPNE FFA URINODLING HEMINEVRIN LEXINOR OBSTRUKTIV CIRK BIOPSI ÖDEM OSPEC LUNGEMBOLI HEMATURI KREAT ESUCOS LAKTULOS INFILTRAT KRÄKNING ISCHEMISK PSYK FREKV BILIRUBIN DEXOFEN THORAX BUKSMÄRTOR BASALT LOKALISATION REKTOSKOPI VENFLON INREM TNT HYPERTONI RECIDIV AUSKULTERAS RONKI PATOL ULCERÖS BRÖSTSMÄRTOR REGELB REC ORIENTERANDE BLADDERSCAN AVF BLADDER GGR POSTOP ENH PALPATION GASTRIT NYTILLKOMMET TARMLJUD SÖMNTABL UROLOGEN SÅRSKADA TUNGANDAD BLODGAS RENITEC VIKTNEDGÅNG KOLOSKOPI IMORSE POLIKLINISKT VPL IKÖ INH LASIX STENOS MIXT INFUSION POLIKLINISK ACETYLCYSTEIN TABLETTBEHANDLAD MELLITUS ASCITES PLEURAVÄTSKA LIKSTORA LUNGRTG BETAPRED OPÅV ANAMNESEN SATURATION VL STÖDDROPP DIURETIKA HIA BEHANDL PSA HÖGERSIDIG INHALATIONER ATROVENT COLOSKOPI EXTREMITETER ARTERIA PANOCOD HB AMYLAS ACETAT STEMETIL DVT POXAR DISTALT REGRESS DUROFERON IMDUR RR MALIGNITET ERCP VB INSULINBEROENDE LÄK ZOPIKLON ESOFAGUS APTT OXASCAND ADIPÖS STOMIN EPIKRISKOPIA PX OML INKOMP LATERALT TN DSK SUSCARD PAT ODL UROGRAFI VÄNSTERSIDIG DOXYFERM LAB KVARSTANNAR DAGL INHALATION ÖVERFLYTTAS MIKTION TSH COLIT STOMI REKTUM VENTOLINE DRÄN VENA BRSM DISTALGESIC AORTA HYPOTHYREOS TEMPAR PROPAVAN AVFÖRINGAR TPK INSÄTTS RECTUM CROHN VÅRDTILLFÄLLET PALPABLA OP INSULATARD STAS DUNKÖMHET LEVERVÄRDEN VENTRIKELN LAXOBERAL LACTULOS DISTALA SPIRONOLAKTON TEMPFRI PARENTERAL CEFAMOX ANDN KISSAT UL CPAP ANGIO KÅVEPENIN MELENA ABSCESS GASTROSCOPI CYSTOSKOPI ANAMNESTISKT SJD DIARRER GÅBORD TENORMIN FURO DRÄNET INREMITTERANDE TROMBOS ATROPIN REHYDREX PANTOLOC KORTISON PANCREAS SKRIVES PALPÖMHET SKELETTSKADA KLYX REL CITODON UJD BEDÖMN ZOCORD INLÄGGS OBSTIPATION SYSTOLISKT OSTEOPOROS EFTERFÖRLOPPET HEREDITET VATTENKASTNINGSBESVÄR ANGIOGRAFI KOLIT AKUTMOTT ZOFRAN LATERALA SUBFEBRIL DILATERAD HERACILLIN VÄTSKELISTA SYRESÄTTER TAVEGYL BLÖDNINGSKÄLLA BEHEPAN APP NOBLIGAN FLUSCAND ANALGETIKA SÄTTES SIDIGA INS SIGMOIDEUM CYTOSTATIKABEHANDLING DOPPLER AXILL LABMÄSSIGT KONKREMENT ANDNINGSPÅVERKAD BETOLVEX VESIKULÄRT REMITTERAD PALLIATIV AORTASTENOS MMHG TURP NORMOFREKVENT ESOFAGIT DIFF LEVERPROVER HABITUALTILLSTÅND HEMORROJDER ELYZOL BESVÄRSFRI PANKREATIT PROXIMALT INFLAMMATORISK INF TRIATEC MEDELLINJEN SJH DEPOT MUPS FEMORALIS AXILLER FÖRMAKSFLADDER ÖNH VÅRDTILLFÄLLE FORTF PALPERAR POSTOPERATIVT OMV URINRETENTION BLODODLING SUSP HJÄRT ILEUS PNEUMOTHORAX HJÄRTINSUFFICIENS ÖVERFÖRES HYPOTYREOS JMF DOLCONTIN PALPATIONSÖM ARCUS EXTR ACB ORDINERAD KREPITATIONER SUTURER VESIKULÄRA DUODENUM TRIMETOPRIM INL APODOS INTERMITTENT BACTRIM DIAB GEA VÄLLÄKT PROSTATAFÖRSTORING NOVALUZID BENSV
Typer av begrepp
Lkm Unders Symt Fynd Förkortn• TABL AKUTÖ INJ RTG UA CT KAD PANODIL CRP BLTR BEH MKT NGT
FUROSEMID VÄ PULM POX BILJUD KETOGAN FÖRMAKSFLIMMER NGNTROMBYL INLÄGGES PALP INKOMMER LPK GLUCOS KIR MG GASTROSKOPI ANDNINGSLJUD ANAMNES DGR VES WARAN ANGINAMOTT DIURES INATT DIARREER VOLTAREN EPIGASTRIET ÅBBLÅSLJUD ENL LEVERSTATUS KLIN TIPAROL KREATININ DIARRE PADRLS TEMP UCG AFEBRIL ELSTATUS STILNOCT RESISTENSER SMÄRTPÅVERKAD CVK PALPERAS COR SIDIG VÄS SINUSRYTM MAVAMALIGN IMOVANE CKMB UVI GRIMMA FOSSA ACTRAPID KREA PVKUPPEGÅENDE UTSKRIVES RETARD SUPP PT COLON MÄSSIGT SELOKEN POS ML PREDNISOLON ZOC NITROMEX INSÄTTES CIRKULATORISKT EPIKRIS OÖM STESOLID FYS URINSTICKA VCBRÖSTSMÄRTA ULCUS ALP ZINACEF KONTR LEVAXIN PALPÖMBUKSMÄRTA LANACRIST PECTORIS NGR LANZO NACL AUSK RESURINEKG ALAT ANT PNEUMONI HEMATOM ISCHEMI
Besöksorsaker på kirurgakuten
buksmärtor 180,4
buksmärta 84,3
kräkningar 29,0
misshandel 19,0
sårskada 16,6
illamående 16,2
feber 14,2
falltrauma 12,2
trafikolycka 11,7
diarreer 10,2
skalltrauma 8,2
melena 8,2
hematemes 8,0
trauma skalle 7,6
diarre 6,9
förstoppning 5,4
• Vi kunde isolera en eller flera termer i ~86% av ”Kirläk akutanteckning” under sökordet ”Besöksorsak”, med en uppsättning reguljära uttryck (Thurin, Knubbe 2005)
Vanligaste (‰)
Besöksorsaker som samförekommer med ”Waran”
Frequency (‰) Ratio
Total Waran Waran/Total
hematuri 2,73 13,06 4,78
gastrointestinal blödning 2,66 12,13 4,57
svart avföring 2,20 9,33 4,25
rektalblödning 3,35 11,19 3,34
blödning per rektum 2,10 6,53 3,12
melena 8,16 25,19 3,08
subileus 1,02 2,80 2,75
rektal blödning 2,38 6,53 2,75
makroskopisk hematuri 1,04 2,80 2,70
Epikrissökord vid Kir resp Med-klin(Östra sjukhuset ~2004)
TermID Sökord n Kir n Med885 Bidiagnos 118248369 Förlopp 92084 542219448 Bidiagnos 8297319447 Huvuddiagnos 79157881 Huvuddiagnos 7783419453 Operationskod 97 67340469 Kopia 37375 2461127061 Operationskod 59165765 Tidigare sjukdomar 27680 28024284 Bedömning 34264 20462676 Sammanf. sjukhistoria 51229824 Återbesök 39045 8794625 Planering 44024814 Vårdtid 43176861 PAL 42536214 Aktuellt 5394 3707520027 Patientansvarig läkare 41585811 Vårdförlopp 3957219435 Intagen från 34564646 Recept 24922 6104803 Utskrivningsätt 30900854 Läkemedelsordination 29118674 Sammanf. intagn status 28315867 Utskriven till 16144 11866333 Dokumentationsdatum 2492027063 Fortsatt planering 20793638 Provtagning 1995927059 Diagnos 1953720102 Operatör 19410599 Ordinationer 18893598 Ordination 166282239 Ur inskrivningsstatus 16001448 Kem lab 15720699 Sjukskrivning 13453 139427474 DRG 14227718 Socialt 555 12524589 Operationsnamn 13018297 Bidiagnos 1240019341 Intagen från 12329664 Rtg 11139561 Nuvarande sjukdomar 10802586 Operation 1070120034 Sjukhistoria 10449
20012 Huvuddiagnos 7820799 Utredning 7694273 Bakt lab 696419361 Överkänslighet 620027038 Diagnos 616320165 DRGÖ 609320024 ´Överkänslighet´ 555127043 Tidigare sjukhistoria 5520809 Vårdavdelning 530727067 Ansv överläk 478020101 Operation 4265241 Ankomststatus 4231957 Lab svar 388127051 Sammanf bedömning 315719419 Diagnoskod ICD10 3148922 Läkemedelsändring 2750771 Tillägg 235019446 Sjukdomsinformation 2326835 Överkänslighet 1271 338883 Huvuddiagnos eg 2 147719421 Operationskod KKÅ. 97 1238863 Röntgensvar 1216287 Behandling 1184440 Intagningsorsak 1117596 Operatör 111327216 Utskrives till 105527032 Återbesök 928887 Bidiagnos eg 2 83827033 Inremitterad 831604 PAD 822 727040 Operationskod 810332 Dikterat av 75819501 Huvuddiagnos 596249 Anteckning 126 43027035 Varning 54727068 Dikterad datum 401917 Dikterad av 37820094 Bakt lab 37019340 Utskrivningsdatum 340267 Avdelning 32420036 Vårdavdelning 23119339 Inskrivnings datum 228882 Huvuddiagnos eg 1 20827064 Dikterad av 190
Endast 12 / 140 helt gemensamma
0 5 10 15 20 25 30 35 40 45 50 55 600
1000
2000
3000
4000
5000
6000
7000
8000
9000
MedKir
Antal per epikris
Några tekniker för att hantera mångfald
●Konkordansanalys
●Stemming -
●Vektorrumsmodell• Ord
• N-gram
●Maskininlärning
●Automatisk identifiering av ordstammar/prefix• Användes för att fylla på Morphosaurus
(SemanticMining)
Konkordansanalys
Stemming
• Tar bort betydelsefattiga ändelser etc, sparar bara ordets stam
• Sonen tittade till sin mamma idag, gick inte att väcka, ambulans tillkallas och är då låg i tryck och syresätter sig dåligt,
• son titt till sin mamm idag gick int att väck ambulantillkall och är då låg i tryck och syresät sig dål
N-gram
• Text kan delas in i korta sekvenser av bokstäver, t.ex. trigram
• Inkommer pga bröstsmärtor �__i|_in|ink|nko|kom|omm|mme|mer|er_|r_p|_pg|p
ga|ga_|a_b|_br|brö|rös|öst|sts|tsm|smä|mär|ärt|rto|tor|or_|r__
Vektorrum
• Textstycke representeras av en punkt i en mångdimensionell rymd, där varje dimension motsvarar förekomsten av trigram/ordstam
• Sökbegrepp/fråga kan översättas till punkt i samma rymd.
• Närbelägna punkter representerar likartade begrepp
Vektorrum-sökning bland besöksorsaker
• Buksmärta– --Buksmärta sedan en vecka.:0.500– --Hö-sidiga buksmärtor.:1.000– --Söker pga buksmärtor.:0.707– --Centrala buksmärtor.:0.707– --Inkommer för akut insättande högersidiga buksmärtor.@@31-årig kvinna med
astmatiska besvär och psoriasisartrit. Genomgått cholecystektomi och har därefter haft återkommande besvär med subcostala högersidiga smärtor. Man har prövat ........ på misstanke om sfinkterdysfunktion -97 utan förbättring. MRCP nov -99 invändningsfri. SÖkt senast juli -00.:0.144
– --Extrabesök med tanke på att pat har buksmärtor korrilerat till födointaget. Har även talat med dietist.@@:0.236
– --Buksmärtor, kräkningar, nedsatt allmäntillstånd.:0.500– --Buksmärtor. Kräkningar. Ileus?:0.577– --Överrem från Medicinsidan p g a buksmärtor.:0.447– --Buksmärta.:1.000
Klustring på trigramförekomst
Frisk eller sjuk?
(Datalingvistprogrammet, 2003)
Datorn kan lära sig själv att tolka undersökningar
● µTBL -verktyg för transformation based learning• (Torbjörn Lager 1999)
● ~3000 svar från trombosundersökningar som taggats som pos/neg/osäker (+ / - / ?)
● Automatisk inlärning av tolkningsregler– templates
• tag:A>B <- tag:C@[-1,-2,-3]
• tag:_>_ <- wd:_@[-1] & tag:_@[-1]
● Handskrivna regler (n=104) lite bättre
Cognos
●Webbaserat sökverktyg från IBM – det enda som VGR erbjuder nu
●Lite långsamt, lite begränsat - Går inte att söka över alla datatyper (en fråga per datatyp)●Läkemedel i egen tabell, ej i journaltext
●Ett fåtal sökord med fördefinierade frågor, t.ex. ”Studie”
Sökord med ”rök” (Melior 2004)
Läkaranteckningar Sjuksköterskeanteckningar
Sökord n Sökord n
Socialt 21866 Livsstil 3483
Aktuellt 5136 Anteckning 2237
Bedömning 4614
Anamnes 4260
Tidigare sjukdomar 4257
Anteckning 2059
Bedömning, åtgärd 1431
Tidigare sjukhistoria 1404
(+ytterligare ~6000 förekomster utspridda..)
Winga-projektet: Rökning
● Sökningar i MedÖ, MedS, MedM, Neur, Akut, under vissa sökord (Socialt, Aktuellt, Anamnes..) under tidsperioden 2004-2009
● Allt innehåll sparas som Excel 2002 – filstorlek ofta >50MB, tar mycket lång tid att bara öppna i Excel (5min??)
● Excel-formatet i själva verket XML – kan packas upp med särskilda perl-program → tabell i text, med folderID, dokumentationstidpunkt och text
● Sökning i texten efter fras såsom ”rök” och folderID som tillhör Winga-pat
● Omgivning runt ”rök” bearbetas i script med enkel algoritm (Icke/inte/ej/aldrig resp F.d./ex/X- och några fler mönster.
● Samtliga omnämnanden av rök samlas för viss patient, ofta många, några pathar varit på samtliga medicinkliniker+neurologen..
Sökord med ”rök”2004-11Totalt
Akutmott
Rökdokumentation MedÖS 2012
● totalt 23952 förekomster av "rök" bland melioranteckningar för 10173 olika patienter,
● ...dvs 52% av de 19595 pat som varit aktuella på kliniken (inkl akutbesök/inläggn/mott)
● Automatisk tolkning av textomgivning ger– 8823 ickerökare
– 6834 exrökare
– 8294 rökare
Dokumenterad rökning
● Går riktigt bra att söka efter textfras ”rök”– Totalt ~708 000 förekomster vid
akut+internmedicinkliniker 2004-11
● Förekommer (minst 2ggr) under totalt 370 olika sökord
● Specialiserade sökord såsom ”Tobak”används mycket sällan, dock förekommer ”Livsstil”
● Enstaka falskt positiva (ej tobaksrök) t.ex. ”brandrökexponerad”, ”krök”
Texttolkning - princip● Snäv textomgivning kring ”rök”
– (det ord som innehåller fras + 1 ord före,2 ord efter, inom en mening)
● Enkla reguljära uttryck (empiri) – exrökare:
● X|x|[Ff].?.?d.?|[Tt]id(igare)?|öre detta|[Ss]luta|fram till|ökstopp|ökte
– Ickerökare:● Nej|[Aa]ldrig|[Ii]cke|[Ee]j|inte
– Annars rökare
– Tolkning rätt i ~88%, osäker i ytterligare 5%• (mkt enkel utvärdering)
ickerökare, Tidigare rökare. X-rökare sedan 10 F d rökare. Icke rökande, Icke rökare. Icke rökare. Exrökare. Aldrig rökt. Röker ca 1 Storrökare, och röker. Feströkare. totalt rökstopp. icke rökare. Röker cirka ett Icke rökare. är rökare men har
Journalföring
● Mallar i Melior – urval av sökord som presenteras i viss ordning, dock i praktiken mental mall hos resp läkare..
● Läkare dikterar det mesta, skrivs in av sekreterare. Val av sökord lite skakigt:
● Ex Tidigare sjukdomar (MedÖ 2011-11):– ca 700 / 2000 börjar med /Nuvarande sjukd i någon
variant
Blodtryck, Längd, Vikt
● Mätvärden i läkemedelsmodul
● Bltr även i journal, men under olika sökord påolika kliniker 988/989 resp 1088/1089...
● Heltal / text nästan likvärdigt (ingen stor vinst idag med kontrollerad datatyp)
Blodtryck
Digit preference (Syst BT)
SBT – akut+medklinikern=898383
Många andra källor
• Journal som Melior bara en av många möjliga datakällor
• Specialsystem t.ex. PAF, Remus på klinfys, CR på lab ofta ännu bättre lämpade för datasammanställning (mer avgränsade ämnen)