bioinformatika, mint a mesterséges intelligencia és a ... · 2. post-processing of genetic data...

72
1 Egészségügyi informatika és biostatisztika Health informatics and biostatistics Antal Péter Computational Biomedicine (Combine) workgroup Department of Measurement and Information Systems, Budapest University of Technology and Economics

Upload: others

Post on 05-Jul-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

1

Egészségügyi informatika és biostatisztikaHealth informatics and biostatistics

Antal Péter

Computational Biomedicine (Combine) workgroupDepartment of Measurement and Information Systems,

Budapest University of Technology and Economics

Page 2: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Áttekintés

Kurzus

Biostatisztika

Bioinformatika

Kemoinformatika

Egészségügyi-klinikai

informatika

Page 3: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Témák és beosztás

3

1. szeptember 8. Eü adatok, adatelemzési folyamat. AP

2. szeptember 15. Az R adatelemzési nyelv alapjai I. GA

3. szeptember 22. Az R adatelemzési nyelv alapjai II. GA

4. szeptember 29. Schönherz Kupa

5. október 6. Orvosi döntéstámogatás. AP

6. október 13.

Biostatisztikai alapok I. Statisztikai minta, mintavételezés, statisztikai

erő számítása, populációk összehasonlítása. HG

7. október 20.

Biostatisztikai alapok II: hipotézistesztelés és konfidencia-

intervallumok, gyakori statisztikai tesztek. HG

8. október 27. Biostatisztikai alapok III: Túlélési elemzés. GA

9. november 3. Biostatisztikai alapok IV: a bayesi megközelítés. GA

10. november 10. Hálózati medicina és rendszerbiológia. HG

11. november 17. Egészségügyi informatikai rendszerek. AP

12. november 24.

13. december 1.

Biomarker kutatás: biomarker típusok, a jegykiválasztási probléma. A

többszörös hipotézistesztelési probléma és megoldásai. AP

14. december 8. HF Bemutatás AP

Page 4: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Jegyzetek/tananyagok

• Dinya-Solymosi: Biometria a klinikumban, feladatok megoldása R-

környezetben, 2016

• Decsi: A bizonyítékokon alapuló orvoslás

– http://www.tankonyvtar.hu/hu/tartalom/tamop425/0054_bizonyitekokon_alapulo/bizonyitekokon_alapulo_

104_104.html

• Fidy-Makara: Biostatisztika

– http://www.tankonyvtar.hu/hu/tartalom/tkt/biostatisztika-2/adatok.html

• Sándor-Ádány: Biostatisztika

– http://www.tankonyvtar.hu/hu/tartalom/tamop425/0054_biostatisztika/adatok.html

• Dinya: Biostatisztika az egészségügyben

– http://www.tankonyvtar.hu/hu/tartalom/tamop412A/2011_0015_biostatisztika_az_egeszsegugyben/adato

k.html

• Sándor: A biostatisztika matematikai alapjai

– http://www.tankonyvtar.hu/hu/tartalom/tamop425/0019_1A_Biostatisztika_es_epidemiologia/adatok.html

• Izsák-Pfeil: Biostatistics

– http://www.tankonyvtar.hu/hu/tartalom/tamop412A/2011-

0064_70_biostatistics_probability_theory_statistics/adatok.html

• Antal et al.:Bioinformatika

– http://www.tankonyvtar.hu/hu/tartalom/tamop412A/2011_0079_antal_bioinformatika/adatok.html

Page 5: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

KOBAK: Bioinformatics

1. DNA genotyping and

sequencing

2. Post-processing of genetic data

3. Protein modeling

4. Homology modeling

5. Functional effect of genetic

variants

6. Gene regulatory networks

7. Genetic association studies

8. Gene expression studies

9. Biomarker analysis

10.Network science

11.Systems modeling

12.Causal inference in biomedicine

13.Text-mining in biomedicine

14.Study design

15.The biomedical big data

16.Data and knowledge fusion

17.Bayesian encyclopedia

18.Bioinformatic workflow systems

19.Drug discovery for personalized

medicine

20.Metagenomics

Page 6: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

6

Computational Biomedicine

COMBINE munkacsoport

http://bioinformatics.mit.bme.hu/

Team

Ádám AranyBence BolgárAndrás GézsiGábor HullámBalázs HuszárPéter MarxAndrás MillinghofferPéter SárközyGergely TemesiPéter Antal

Page 7: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Bevezető áttekintés

• Modern nagy és átfogó egészségügyi adathalmazok

• Példa.uk: A UK Biobank adatbázis

• Példa.hu: Elektronikus Egészségügyi Szolgáltatási Tér

• Modern nagy és átfogó egészségügyi tudásbázisok

7

Page 8: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

An era of a new health care?

8

Page 9: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Watson?

The Science Behind an Answer

• http://www-03.ibm.com/innovation/us/watson/what-is-watson/science-behind-an-answer.html

Page 10: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Orvosi döntéstámogató és

szakértői rendszerek

Watson for Oncology – assessment and advice cycle

www.avanteoconsulting.com/machine-learning-accelerates-cancer-research-discovery-innovation/

Page 11: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Factors behind the new health care

• New measurements?

– Ultimate diagnostics?

• New theories?

– Unified theory of medicine?

– Unified theory of artificial intelligence?

• New therapies?

– Preventions?

– Drugs?

– Anti-aging, rejuvenation?

Page 12: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

1965, Gordon Moore, founder of Intel:

„The number of transistors that can be

placed inexpensively on an integrated

circuit doubles approximately every two

years ”... "for at least ten years"

11/17/2017 A.I. 12

Computing power: Moore’s Law

Integration and

parallelization wont

bring us further. End

of Moore’s law?

Page 13: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

• Financial transaction data, mobile phone data, user

(click) data, e-mail data, internet search data, social

network data, sensor networks, ambient assisted living,

intelligent home, wearable electronics,...

13

The „big” data

Gadgets

InternetMoore’s

law

“The line between the virtual

world of computing and our

physical, organic world is

blurring.” E.Dumbill: Making

sense of big data, Big Data,

vol.1, no.1, 2013

Factors:

Page 14: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

14

Definitions of „big data”

M. Cox and D. Ellsworth, “Managing Big Data for Scientific

Visualization,” Proc. ACM Siggraph, ACM, 1997

The 3xV: volume, variety, and velocity (2001).

The 8xV: Vast, Volumes of Vigorously, Verified, Vexingly

Variable Verbose yet Valuable Visualized high Velocity Data

(2013)

Not „conventional” data: „Big data is data that exceeds the

processing capacity of conventional database systems. The

data is too big, moves too fast, or doesn’t fit the strictures of

your database architectures. To gain value from this data,

you must choose an alternative way to process it (E.Dumbill:

Making sense of big data, Big Data, vol.1, no.1, 2013)

Page 15: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

11/17/2017 A.I. 15

Carlson’s Law for Biological Data

Sequencing

costs per mill.

base

Publicly

available

genetic data

NATURE, Vol 464, April 2010

• x10 every 2-3 years

• Data volumes and

complexity that IT has

never faced before…

Page 16: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

The new health care:

personalized medicine

16

Lander, E.S., Linton, L.M., Birren, B., Nusbaum, C., Zody, M.C., Baldwin, J., Devon, K.,

Dewar, K., Doyle, M., Fitzhugh, W. and Funke, R., 2001. Initial sequencing and analysis of

the human genome. Nature, 409(6822), pp.860-921.

Venter, J.C., Adams, M.D., Myers, E.W., Li, P.W., Mural, R.J., Sutton, G.G.,

Smith, H.O., Yandell, M., Evans, C.A., Holt, R.A. and Gocayne, J.D., 2001.

The sequence of the human genome. Science, 291(5507), pp.1304-1351.

Page 17: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Szekvenálási módszerek:

generációk• First Generation sequencing technology:

– automated capillary sequencing machines

• Second Generation sequencing:

– short reads: from something we sequence

once, to something we sequence again and

again.

• Third Generation sequencers:

– sequence single molecules of DNA in real-

time, directly individual DNA molecules

Page 18: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Első generációs

• Láncterminálós kapilláris kép

• Csarnokban robotizált kép

• Esetleg BAC szétosztási séma HGP-ben

Page 19: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

2. generációs

• Széttöréses technika

• Szekrény

• 1000$

Page 20: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Nanopore MinION MkI

Page 21: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Dávid és Góliát

Illumina Miseq

Iontorrent PGM

Nanopore MinION

Page 22: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Oxford Nanopore MinIon

• Hossz: 1000-2000, fedés: ∞

• Reagens: 0

• Mintaelőkészítés: ?

• Amortizáció: ???

Újgenerációs szekvenálás

• Piroszekvenálás

• Félvezető alapú szekvenálás

• Nanotechnológia alapú szekvenálás

• Biotechnológiai alapú szekvenálás

• …

Illumina HiSeq X Ten Sequencer: az 1. 1000$ genom

• Hossz: 100-200, fedés: x10

• Reagens: 797$

• Mintaelőkészítés: 55$-65$

• Amortizáció: 137$ mintánként

Page 23: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Nanopore MinION MkI

Protein Nanopórus Tethering

A DNS szál leolvasása

Szekvenálásra Előkészített

DNS szál

Szekvencia

Page 24: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Bioinformatikai területek

Strukturális modellezés

Biológiai szekvencia elemzés

Orvosbiológiai adatelemzés

Genetikai adottságok (genome)

Gén/génszabályozók (transcriptome)

Fehérjék (proteome)

Kismolekulák (metabolome)

Klinikai tulajdonságok

Tulajdonságok (phenome)

?

Page 25: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Data: „Big” data in life sciences

Page 26: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Nagy orvosbiológiai adattömegek

26

Page 27: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

M.Swan: THE QUANTIFIED SELF: Fundamental Disruption in

Big Data Science and Biological Discovery, Big data, Vol 1.,

No. 2., 2013 27

Big health data streams

Page 28: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

28

The „omic” definition of „big

data”.. [data] is often big in relation to the

phenomenon that we are trying to

record and understand. So, if we are

only looking at 64,000 data points,

but that represents the totality

or the universe of

observations. That is what

qualifies as big data. You do

not have to have a hypothesis

in advance before you collect

your data. You have collected all

there is—all the data

there is about a

phenomenon.

Page 29: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Biomedical omic data/big data

Genome(s), epigenome, microbiome

Phenome (disease, side effect)

Transcriptome

Proteome

Metabolome

Environment&life style

Drugs

2010<: “Clinical phenotypic assay”/drugome: open clinical trials, adverse drug

reaction DBs, adaptive licensing, Large/scale cohort studies (~100,000 samples)

Moore’s law Carlson’s law

Page 30: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

30

„Big data, big hype”

Lack of results,

problems,

„Boom”

„Hype”

Criticism, re-evaluation

Application

Technology

trigger

Present?

Page 31: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Nyílt adat

• FAIR data

– Findability

– Accessibility

– Interoperability

– Reusability

31

Jelen

https://www.elsevier.com/connect/10-aspects-of-highly-effective-

research-data

Page 32: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Publikációk száma

32

Little Science, Big Science, by

Derek J. de Solla Price, 1963

0

200000

400000

600000

800000

1000000

1200000

1950 1960 1970 1980 1990 2000 2010

Number of annual papers

0

5000

10000

15000

20000

25000

1950 1960 1970 1980 1990 2000 2010

Number of "pediatrics" papers

Page 33: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Knowledge: Linked open data

33Linking Open Data cloud diagram 2017, by Andrejs Abele, John P. McCrae, Paul

Buitelaar, Anja Jentzsch and Richard Cyganiak. http://lod-cloud.net/

Page 34: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

34

E-science, data-intensive science,

the fourth paradigm

Page 35: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Nyílt tudás

M. Gerstein, "E-publishing on the Web: Promises,

pitfalls, and payoffs for bioinformatics,"

Bioinformatics, 1999

M. Gerstein: Blurring the boundaries between

scientific 'papers' and biological databases,

Nature, 2001

P. Bourne, "Will a biological database be different from a

biological journal?," Plos Computational Biology,

2005

M. Gerstein et al: "Structured digital abstract makes

text mining easy," Nature, 2007.

M. Seringhaus et al: "Publishing perishing? Towards

tomorrow's information architecture," Bmc

Bioinformatics, 2007.

M. Seringhaus: "Manually structured digital abstracts: A

scaffold for automatic text mining," Febs Letters,

2008.

D. Shotton: "Semantic publishing: the coming revolution

in scientific journal publishing," Learned Publishing,

2009

35

Szemantikus adattárak - Szemantikus publikálás

Williams, Antony J., et al. "Open PHACTS: semantic interoperability

for drug discovery." Drug discovery today, 2012

Dumontier, Michel, et al. "Bio2RDF release 3: a larger connected

network of linked data for the life sciences, EUR-WS, 2014.

[OPENBEL:]Hofmann-Apitius, Martin, et al. "Towards the taxonomy of

human disease." Nature reviews. Drug discovery, 2015

Page 36: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

E D. Green et al. Nature 470, 204-213 (2011) doi:10.1038/nature09764

Accomplishments of genomics research

Page 37: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Vocabularies, taxonomies,

ontologies• Medical Subject Headings (MeSH)

• Unified Medical Language System (UMLS)

• The Open Biological and Biomedical

Ontologies

• ... translation:

37http://www.ihop-net.org/UniPub/iHOP/

Page 38: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Egészségügyi informatikai 1x1

• Egészségügyi makromodellek és szereplők– Népesség, szolgáltató, finanszírozó, állam

• Biztosítás és finanszírozás

• Egészségügyi intézmények

• Teljesítménymérés és minőségbiztosítás (hasznosság)

• Egészségügyi adatgazdák

• Egészségügyi adatkezelés szabályozása

• Az elektronikus kórlap és betegrekord

• Kódrendszerek

• Orvosi tudásreprezentáció

• Epidemiológiai vizsgálatok

Page 39: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Egészségügyi intézmények

Ágazati felügyelet

Minisztérium,

KSH

Tulajdonos,

fenntartó

Önkormányzat,

kormányzati,

egyházi szerv,

magántulajdonos

Finanszírozó

beteg

háziorvos

szakrendelő

kórház

Klinika,

országos

intézet

Page 40: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Egészségügyi adatgazdák• Nyilvántartott (regisztrált) morbiditás (KSH)

– Kötelezően előírt betegségbejelentések• Tuberkolózis, nemi betegségek

• Ételmérgezések,

• Foglalkozási betegségek és mérgezések

• üzemi balesetek

• Halálos vagy személyi sérüléssel járó balesetek

• Veleszületett fejlődési rendellenességek

• Daganatos betegségek

– Betegségregiszterek• Országos vagy helyi

• rák, infarktus,stroke,..

– Egészségügyi intézmények adatszolgáltatásai, statisztikai jelentései• Háziorvosok

• üzemorvosok, iskolaorvosok

• Tüdőgondozók

• Bőr- és nemibeteg-gondozók

• Pszichiátriai gondozók

• Alkoholgondozók

– Egészségbiztosítási Pénztár adatai• Táppénzes morbiditás

• Rokkantsági esetek

• Egészségügyi intézmények teljesítményfinanszírozásához adatok

• Rejtett morbiditás (jéghegy csúcsa jelenség)

• Szempontok– A bejelentések teljessége

– Egységes általános kódrendszer (pl. Betegségek Nemzetközi Osztályozása)

– Egységes szakmai betegségspecifikus kódrendszer

Page 41: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Adattárolás

• Adattulajdonos: – betegadatok tulajdonosa a beteg

– És egyes célzott vizsgálatoknál?

– adathordozó?

• Személyközpontú tárolás– Tulajdonosnál minden.

– Hozzáférésvédett (?)

– Lokális hozzáférhetőség (mentőben is)

– Integrálhatóság (egészségügyi+szociális adatok: gyógyszertámogatás...)

• Központi adatbázison alapuló tárolás– Globális hozzáférhetőség (archiválás)

– Statisztikai elemezhetőség

– Nagy kapacitásigény

Page 42: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Egészségügyi adatkezelés

szabályozása• Szempontok

– Személyiségi jogok (adatvédelem)• Információs önrendelkezési jog

• Egészségügyi azonosító (nem összekapcsolható)

– Közérdekű adatok

– Adatbiztonság

• Dilemmák– Személyiségi jogok vs. közegészségügyi érdek

– Felvilágosítás joga vs. állapotromlás kockázata

– Kié az adat (információ) és a lelet (információ hordozó, származtatott tudás,..)?

• Alapelvek– Médiafüggetlen, egységes szabályozás

– Személyis adatok védelme, információs önrendelkezési jog

– Gyógyítás segítése

– közegészségügyi érdek

– Adatszeparáció és integrálás csak törvény alapján

– A betegnek tudnia kell a kötelező adatfelvételekről, azok • Céljáról

• Jogalapjáról

• Elérhetőségéről

– A betegnek joga van minden egészségügyi adatáról másolatot kapni (lehet tartalmi kivonat)

– Az anonimizált/deperszonalizált adatok közcélúak és nyilvánosak

Page 43: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Egészségügyi adatkezelés jogi környezet

• Nemzeti– Törvények

• 1992. évi LXIII. törvény a személyes adatok védelméről és közérdekű adatok nyilvánosságáról

• 1997. évi XLVII. törvény az egészségügyi és a hozzájuk kapcsolódó személyes adatok kezeléséről

• 1997. évi CLIV. törvény az egészségügyről (betegek jogai)

• 1997. évi XLVI. törvény a statisztikáról

– Rendeletek• Országos Statisztikai Adatgyűjtő Program (OSAP), évente

• Nemzetközi– 1947. évi Nürnbergi Kód

– 1964. évi Helsinki Deklaráció, több módosítás/kiegészítés

– 1993./2002. WHO: International Ethical Guidelines for Biomedical Research Involving Human Subjects

– 1996 Health Insurance Portability and Accountability Act (US)

Page 44: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

A Nürnbergi Kód alapelvei

(A Nürnbergi Kódban 10 pontjában részletezve)

• A vizsgálati személyeket csak kielégítő felvilágosítás után tett beleegyező nyilatkozat alapján lehet a kísérletekbe bevonni.

• A vizsgálatoknak megbízható állatkísérletes alapokon kell nyugodniuk.

• A kísérleteket szakképzett személyeknek kell végezniük, és a veszélyeztetést, illetve a testi és lelki szenvedést a lehető legalacsonyabb szinten kell tartani. Olyan vizsgálatokba nem lehet embereket bevonni, melyeknek előre meghatározhatóan maradandó károsodás vagy halál a kimenetele.

• A vizsgált személynek lehetőséget kell biztosítani a vizsgálat során arra, hogy a vizsgálatot leállíttathassa, amennyiben úgy érzi, hogy elérte a pszichés és fizikális megterhelés olyan fokát, mely számára a vizsgálat folytatását lehetetlenné teszi.

Page 45: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Adatvédelem

• Személyhez köthető egészségügyi információk védelme

• Hatókör: egészségügyi intézmény, alkalmazott kutató

• „Azonosító”: 18 db, név,..IP cím, biometrikus azonosítók + statisztikai beazonosíthatóság

• Azonosíthatlan adatoknál– Nincs korlátozás a használaton és terjesztésen

• Limitált beazonosíthatóságnál (pl. recept azonosító)– A személytől írásos beleegyezés nem szükséges

– De az intézmény és a vizsgálat/kutató között kell

• Beazonosítható adatgyűjtésnél írásos beleegyezés szükséges– Cél, eljárás, gyűjtött adat, tárolás, összekapcsolás (jövőbeli

felhasználást 2% ellenzi)

– Értelmezhetőség

Page 46: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Az elektronikus betegrekord

• Elektronikus betegrekord– alapellátásban: elektronikus karton

– fekvőbetegellátásban: elektronikus kórlap

• Hippokratész: betegség lefolyásának feljegyzése az okok kiderítése miatt

• <1900: időorientált betegrekord

• 1920: „minimális adatok”– Panaszok,

– vizsgálati eredmények,

– vizsgálati és terápiás tervek keveréke

• 1960: problémaorientált megközelítés a SOAP-ban– S: szubjektív betegérzet/vélemény

– O: objektív, orvosi fizikális vizsgálati eredmény

– A (assesment): vizsgálatok eredményei elemzésekkel, konklúziókkal

– P (plan): diagnosztikai és terápiás terv

Page 47: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Az elektronikus betegrekord

• Cél

– Közvetlen betegellátás

– Egészségügyi menedzsment

– Kutatás, oktatás

• Célok dimenziói

– Populáció: Egyén, helyi, országos, emberi

– Idő: vészhelyzet, emberi léptékű, „történelmi”

– Helyszín: orvos, osztály, intézmény,...

– Feladat: prevenció, diagnosztika, terápia, szervezés

Page 48: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Betegrekord típusok és feladatok

• Típus– Időorientált

– Forrásorientált

– Problémaorientált

• Feladatok– Dokumentáció

• Biobankbeli mintaazonosító

• Nyers mérési adat

• Utófeldolgozott adat

• (közel) természetes nyelvi leírás

• specifikus kódok

• Általános kódok– Betegellátáshoz

– Statisztikához

– Szervezéshez

– Finanszírozáshoz

– Személyes prevenció

• Feladatok’– Betegellátás

• Diagnosztika (tünetek)

• Betegség

• Beavatkozások

– Kórházi menedzsment• Tevékenységek követése

• Költségelemzések

• Belső finanszírozás

• Tervezés

– Kutatási feladatok• Biológiai

• Klinikai

• Gyógyszerkutatások

Page 49: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Kódrendszerek

• Kódrendszerek, taxonómiák, ontológiák

• Cél– Konzisztens leírás vs. információ döntéshez

• Cél’– Betegellátás

• Diagnosztika (tünetek)

• Betegség

• Beavatkozások

– Kórházi menedzsment• Tevékenységek követése

• Költségelemzések

• Belső finanszírozás

• Tervezés

– Finanszírozás

– Kutatási feladatok• Induktív

– Statisztikai

– Oksági

• Deduktív

BAJ: absztrakciós szintek, szempontok + méret, konzisztencia

Page 50: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Adatok személyre szabott gyógyászathoz

és gyógyszerfejlesztéshez <1980

• Örökölt genetikai háttér– Családi kórtörténet

– Fenotipikus jegyek

– Citogenetikai vizsgálatok

• Szerzett genetikai háttér– Fenotipikus jegyek

• Egészségügyi adatok– Papíralapú, nem standard

• Életviteli leírók– szakértő-vezérelt, papíralapú, nem standard

• Környezeti leírók– szakértő-vezérelt, papíralapú, nem standard

Page 51: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Adatok személyre szabott gyógyászathoz

és gyógyszerfejlesztéshez ~2010

• Örökölt genetikai háttér– +korábbiak

– Elszigetelt családfák

– SNP és CNV profilok

• Szerzett genetikai háttér– +korábbiak

– CGH profilok

• Egészségügyi adatok– Elektronikus, nem standard, intézményvezérelt

• Életviteli leírók– szakértő-vezérelt, elektronikus, nem standard

• Környezeti leírók– szakértő-vezérelt, elektronikus, nem standard

Page 52: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Adatok személyre szabott gyógyászathoz

és gyógyszerfejlesztéshez ~2020<

• Örökölt háttér (The Personal Genomes/Gaia Genome project)– Populációs családfák

– Teljes szekvencia

– Epigenetikai profilok

• Szerzett genetikai háttér– Teljes szekvencia

• Egészségügyi adatok– Elektronikus, standard szemantikai, személyes

• Életviteli leírók– Hosszan tartó, (otthoni) fiziológiás mérések

– Metabolikus profilok

– Elektronikus, standard szemantikai, személyes

• Környezeti leírók– Elektronikus, standard szemantikai, személyes

Page 53: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

UK Biobank

53

UK Biobank is a national and international health resource with unparalleled

research opportunities, open to all bona fide health researchers. UK Biobank

aims to improve the prevention, diagnosis and treatment of a wide range of

serious and life-threatening illnesses – including cancer, heart diseases,

stroke, diabetes, arthritis, osteoporosis, eye disorders, depression and forms

of dementia. It is following the health and well-being of 500,000 volunteer

participants and provides health information, which does not identify

them, to approved researchers in the UK and overseas, from academia and

industry. Scientists, please ensure you read the background materials before

registering. To our participants, we say thank you for supporting this

important resource to improve health. Without you, none of the research

featured on this website would be possible.

Page 54: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Large-scale cohorts in UK

54

UK Biobank:

• 1million< adults

• aged 40-69,

• 2006-2036<

• genes x lifestyle x environment

diseases

• open 2012-

Page 55: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

UKBiobank: incidences

55

PLOS Medicine | DOI:10.1371/journal.pmed.1001779 March 31, 2015

Page 56: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

UKB: baseline assessment

56

PLOS Medicine | DOI:10.1371/journal.pmed.1001779 March 31, 2015

Page 57: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

UKB:

57

PLOS Medicine | DOI:10.1371/journal.pmed.1001779 March 31, 2015

Page 58: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

UKB: publications

58

0

20

40

60

80

100

120

2002 2004 2006 2008 2010 2012 2014 2016 2018

Number of annual papers

2017

Yang, Jian; Zeng, Jian; Goddard, Michael E; Wray, Naomi R; Visscher, Peter M

Concepts, estimation and interpretation of SNP-based heritability Journal Article

In: Nature Genetics, 2017.

Abstract | Links | BibTeX | Tags: 12514, genetics, heritability

Suinesiaputra, A; Sanghvi, MM; ans Paiva, Aung JM N; Zemrak, F; Fung, K; Lukaschuk, E; Lee, AM; Carapella, V; Kim, YJ; Francis, J; Piechnik, SK; Neubauer, S;

Greiser, A; Jolly, MP; Hayes, C; Young, A; Petersen, SE

Fully-automated left ventricular mass and volume MRI analysis in the UK Biobank population cohort: evaluation of initial results. Journal Article

In: International Journal of cardiovascular imaging, 2017.

Abstract | Links | BibTeX | Tags: cardiovascular, featured, imaging

Gupta, Ramyani P; Strachan, David P

Ventilatory function as a predictor of mortality in lifelong non-smokers: evidence from large British cohort studies Journal Article

In: 2017.

Abstract | Links | BibTeX | Tags: 214, featured, smoking

Yates, Thomas; Zaccardi, Francesco; Dhalwani, Nafeesa N; Davies, Melanie J; Bakrania, Kishan; Celis-Morales, Carlos A; Gill, Jason M R; Franks, Paul W; Khunti,

Kamlesh

Association of walking pace and handgrip strength with all-cause, cardiovascular, and cancer mortality: a UK Biobank observational study Journal Article

In: European Heart Journal, 2017.

Abstract | Links | BibTeX | Tags: handgrip strength, Walking pace

Wigmore, EM; Clarke, TK; Howard, DM; Gibson, MJ Adams LS Hall Zeng Y J; Davies, G; Fernandez-Pujals, AM; Thomson, PA; Hayward, C; Smith, BH; Hocking, LJ;

Padmanabhan, S; Deary, IJ; Porteous, DJ; Nicodemus, KK; McIntosh, AM

Do regional brain volumes and major depressive disorder share genetic architecture? A study of Generation Scotland (n=19 762), UK Biobank (n=24 048) and the

English Longitudinal Study of Ageing (n=5766). Journal Article

In: Translational Psychiatry, 2017.

Abstract | Links | BibTeX | Tags: 4844, brain, depression, genetics

http://www.ukbiobank.ac.uk/published-papers/

Page 59: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Disease-gene network

L.A.Barabási:PNAS, 2007, The human disease network

Page 60: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Genetic overlap - comorbidity

www.pnas.orgcgidoi10.1073pnas.0704820104

A.Rzhetsky et al.: genetic overlap among

complex human phenotypes

Page 61: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

The diseasome using real

epidemiological data

Corrected for

multiple hypothesis

testing

Page 62: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Effect of systems-based approach

A pairwise association network

vs.

A Bayesian network based map

(edge posterior map)

Page 63: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Elektronikus Egészségügyi

Szolgáltatási Tér (EESZT)

63

https://e-egeszsegugy.gov.hu/fooldal

Page 64: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

EESZT szabályozás

• Az EESZT-re vonatkozóan 2018 augusztus 6-án az alábbi jogi szabályozás található

meg:

• Törvényi szint:

• EESZT általános szabályok:

• az egészségügyi és a hozzájuk kapcsolódó személyes adatok kezeléséről és

védelméről szóló 1997. évi XLVII. törvény (Eüak.) III/A. fejezet,

• Eüak. 36. §-a a működés megindulásáról,

• Eüak. 38. § egyes bekezdései a felhatalmazásokról,

• a személyazonosító jel helyébe lépő azonosítási módokról és az azonosító kódok

használatáról szóló 1996. évi XX. törvény 23. § k), l), m) pont a TAJ szám

működtető általi több célból történő kezeléséről,

• elektronikus vény:

• Eüak. 14/A. § (1a)-(1d) bekezdés, (2a) bekezdés az elektronikus vény törvényi

szabályairól,

• kötelező egészségbiztosításról szóló 1997. évi LXXXIII. törvény 18/A. §

• Rendeleti szint:

• az Elektronikus Egészségügyi Szolgáltatási Térrel kapcsolatos részletes szabályokról

szóló 39/2016. (XII. 21.) EMMI rendelet (EESZT rendelet)

• …..

64

Page 65: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

EESZT

65

Page 66: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

EESZT: célok

66

Page 67: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

EESZT a „gyakorlatban”

67

Page 68: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

EESZT: „kódtörzsek”

68

Itt a jelenleg használatban levő nyilvános kódtörzseket érheti el. Az

egészségügyben számos kódolt adatot használnak. Az adatok felhasználását

és értelmezését eddig megnehezítette, hogy az egyes kódtörzsek jelentősen

eltérő formátumban, különböző ágazati szervezetek honlapján kerültek

publikálásra. Ezért az EESZT-ben egységesen tesszük elérhetővé a több

egészségügyi szereplő által is használt kódtörzseket, azok érvényességi

idejével együtt.

A nyilvános kódtörzsek publikálása időrendi sorrendben történik, így Önnek a

legfrissebb verzió jelenik meg. Az adatok frissítése a rendszerbe érkező

információk szerint, törzsenként változó időszakonként történik.

Kulcsszóra szűrve kereshet a listák között. A MEGNYITÁS gombra kattintva

érheti el a kívánt törzsadatok listáját, az adatokat pedig a LETÖLTÉS

gombra kattintva töltheti le Excel-táblaként. A VISSZA gomb használatával

visszatérhet a kezdőoldalra, és újabb szűrést indíthat.

Page 69: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

EESZT:

MENTA

69

Page 70: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Személyre szabott medicina?

70

Page 71: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Direct2customer genetics

71

Page 72: Bioinformatika, mint a mesterséges intelligencia és a ... · 2. Post-processing of genetic data 3. Protein modeling 4. Homology modeling 5. Functional effect of genetic variants

Összefoglalás

• Adat- és tudáshalmozódás az orvosbiológában

• Nagyléptékű molekuláris biológiai adatgyűjtés

– Magyarországon nincs még publikálva teljes genomi szélességű vizsgálat

• Nagyléptékű klinikai (kutatási szintű) adatgyűjtés

• Magyarországon nincs nagyléptékű kohorsz

72