applying sw mikel_egana

Download Applying sw mikel_egana

If you can't read please download the document

Upload: mikel-egana-aranguren

Post on 30-Jun-2015

658 views

Category:

Documents


0 download

TRANSCRIPT

  • 1. Aplicacin de la Web Semntica en Biologa Molecular Mikel Egaa Aranguren [email_address] http://mikeleganaaranguren.com http://tinyurl.com/2u6vhqe

2.

  • Informacin en Biologa Molecular 3. Life Sciences Semantic Web (LSSW) 4. Open Biological and Biomedical Ontologies -OBO- (!LSSW) 5. Por qu no se aplica la LSSW? 6. Conclusiones

Aplicacin de la Web Semntica en Biologa Molecular 7. Aplicacin de la Web Semntica en Biologa Molecular Informacin en Biologa Molecular 8. Aplicacin de la Web Semntica en Biologa Molecular Informacin en Biologa Molecular

    • Secuencias 9. Datos de expresin 10. Relaciones evolutivas 11. Estructuras 12. Interacciones 13. ...
    • Obtencin de informacin
    • Explotacin de informacin
    • High throughput, ... ->
    • Datos Informacin Conocimiento

14.

  • ... por la naturaleza misma de la informacin biolgica
      • Compleja (Y no se puede abstraer!) 15. Cambiante 16. Producida por muchos agentes diferentes 17. Grandes volmenes 18. Crecimiento acelerado (ej. high throughput)
  • ... por cmo hemos representado la informacin biolgica
      • Diferentes recursos, diferentes esquemas 19. Crisis de identidad 20. Para humanos, no para mquinas (Anotaciones, literatura, ... ) 21. ...

Aplicacin de la Web Semntica en Biologa Molecular Informacin en Biologa Molecular 22. Aplicacin de la Web Semntica en Biologa Molecular Informacin en Biologa Molecular It is quite depressive to think that we are spending millions in grants for people to perform experiments, produce new knowledge, hide this knowledge in a often badly written text and then spend some more millions trying to second guess what the authors really did and found Teresa K. Attwood, Douglas B. Kell, Philip McDermott, James Marsh, Steve R. Pettifer, and David Thorne. Calling international rescue: knowledge lost in literature and data landslide! The Biochemical journal, 424(3):317333, December 2009. 23.

  • Q708Y0Saccharomyces cerevisiae
    • Ortlogos de Q708Y0 enSchizosaccharomyces pombe 24. Si algun ortlogo esta en el ncleo (O partes del ncleo!), las protenas que interaccionan con l por fosforilacin 25. Obtener los procesos de regulacin en los que participan esas protenas 26. Afecta alguno de esos procesos al ciclo celular?Cul?

Aplicacin de la Web Semntica en Biologa Molecular Informacin en Biologa Molecular 27. Aplicacin de la Web Semntica en Biologa Molecular Informacin en Biologa Molecular

    • Grandes volmenes de informacin desperdigados en la web

28. Aplicacin de la Web Semntica en Biologa Molecular Life Sciences Semantic Web 29. Aplicacin de la Web Semntica en Biologa Molecular Life Sciences Semantic Web

  • Web Semntica

30. Aplicacin de la Web Semntica en Biologa Molecular Life Sciences Semantic Web

  • Ontologa

31. Aplicacin de la Web Semntica en Biologa Molecular Life Sciences Semantic Web

  • Biologa Molecular (Bioinformtica)
    • Necesidades muy concretas de gestin de informacin 32. Muchos usuarios dispuestos a crear contenido semntico
  • Test case perfecto para la Web Semntica
    • W3C Health Care and Life Sciences Interest Group 33. http://www.w3.org/blog/hcls

34. Aplicacin de la Web Semntica en Biologa Molecular Life Sciences Semantic Web Benjamin M. Good and Mark D. Wilkinson. The life sciences semantic web is full of creeps! Brief Bioinform, 7(3):275286, September 2006.

  • Globally unique and resolvable names for biological entities 35. Consistent standards for data representation 36. Consistent standards for knowledge representation 37. Standard interface definitions for data retrieval and processing

38. Aplicacin de la Web Semntica en Biologa Molecular Benjamin M. Good and Mark D. Wilkinson. The life sciences semantic web is full of creeps! Brief Bioinform, 7(3):275286, September 2006.

  • Globally unique and resolvable names for biological entities: LSID(?) 39. Consistent standards for data representation: RDF 40. Consistent standards for knowledge representation: OWL 41. Standard interface definitions for data retrieval and processing:Semantic Web Services

Life Sciences Semantic Web 42. Aplicacin de la Web Semntica en Biologa Molecular

  • LSID (Life Sciences Identifiers): URNs
    • urn:lsid:ipni.org:names:30000959-2
  • URIs
    • Bio2RDF (BANFF manifesto)
      • http://tinyurl.com/39m9qru
    • HCLS IG
      • http://www.w3.org/2001/sw/hcls/notes/uris/
    • Neurocommons
      • http://neurocommons.org/page/URIs
  • Shared Names
      • http://neurocommons.org/page/Shared_names

Life Sciences Semantic Web 43. Aplicacin de la Web Semntica en Biologa Molecular

  • RDF (Resource Description Framework)
    • Standard para representar datos en la WS
    • http://www.w3.org/RDF/
    • SPARQL para consultas
    • http://www.w3.org/TR/rdf-sparql-query/

Life Sciences Semantic Web 44. Aplicacin de la Web Semntica en Biologa Molecular

  • RDF (Resource Description Framework)

Life Sciences Semantic Web 45. Aplicacin de la Web Semntica en Biologa Molecular

  • Bio2RDFhttp://bio2rdf.org/

Life Sciences Semantic Web 46. Aplicacin de la Web Semntica en Biologa Molecular

  • Linking Open Drug Data (LODD)http://esw.w3.org/HCLSIG/LODD
    • Ganador del triplify challengehttp://triplify.org/Challenge/2009

Life Sciences Semantic Web 47. Aplicacin de la Web Semntica en Biologa Molecular

  • BioGatewayhttp://www.semantic-systems-biology.org/biogateway

Life Sciences Semantic Web

      • Erick Antezana, Ward Blond, Mikel Egaa, Alistair Rutherford, Robert Stevens, Bernard De Baets, Vladimir Mironov, Martin Kuiper. BioGateway: a semantic systems biology tool for the life sciences. BMC bioinformatics 2009, 10(Suppl 10):S11

48. Aplicacin de la Web Semntica en Biologa Molecular

  • OWL (Web Ontology Language)

Life Sciences Semantic Web 49. Aplicacin de la Web Semntica en Biologa Molecular

  • OWL (Web Ontology Language)
    • Autodescriptivo (self-descriptive)
      • datos + esquema en el mismo idioma
    • OWA (Open World Assumption)
      • el conocimiento en biologa molecular es necesariamente incompleto
    • Semantica monotnica 50. UNA (Unique Name Assumption)
      • diferentes entradas en diferentes recursos se refieren a la misma entidad

Life Sciences Semantic Web 51. Aplicacin de la Web Semntica en Biologa Molecular

  • OWL (Web Ontology Language)
    • Inferencia (Reasoning) completa y eficiente
      • Consultas 52. Clase-subclase 53. Individuo -> clase 54. Consistencia
    • URIs para entidades 55. Editores (Protg, TopBraid composer, )
    • APIs (OWL API, ...) 56. Razonadores (Pellet, FaCT++, Racer, )

Life Sciences Semantic Web 57. Aplicacin de la Web Semntica en Biologa Molecular

  • Uso de OWL
    • Vocabulario comn
      • almacenar/integrar/reusar conocimiento
    • Inferir conocimiento no evidente 58. Clasificacin de informacin 59. Consultas expresivas 60. Generacin de hiptesis 61. Consistencia de la informacin 62. Al representar un dominio el razonador nos dice las contradicciones que cometemos: nos obliga a definirnos 63. Mantenimiento de conocimiento

Life Sciences Semantic Web 64. Aplicacin de la Web Semntica en Biologa Molecular

  • BioPAXhttp://www.biopax.org/

Life Sciences Semantic Web 65. Aplicacin de la Web Semntica en Biologa Molecular

  • Cell Cycle Ontologyhttp://www.semantic-systems-biology.org/cco 66. Erick Antezana, Mikel Egaa, Ward Blond, Aitzol Illarramendi, Iaki Bilbao, Bernard De Baets, Robert Stevens, Vladimir Mironov, and Martin Kuiper. The cell cycle ontology: an application ontology for the representation and integrated analysis of the cell cycle process. Genome Biology, 10(5):R58+, 2009

Life Sciences Semantic Web 67. Aplicacin de la Web Semntica en Biologa Molecular

  • OBIhttp://obi-ontology.org

Life Sciences Semantic Web 68. Aplicacin de la Web Semntica en Biologa Molecular

  • PhosphaBasehttp://www.bioinf.manchester.ac.uk/phosphabase/

Life Sciences Semantic Web 69. Aplicacin de la Web Semntica en Biologa Molecular

  • MGEDhttp://mged.sourceforge.net/

Life Sciences Semantic Web 70. Aplicacin de la Web Semntica en Biologa Molecular Life Sciences Semantic Web

  • A prototype KB for the Life Sciences 71. http://www.w3.org/TR/hcls-kb/

72. Aplicacin de la Web Semntica en Biologa Molecular Life Sciences Semantic Web

  • A prototype KB for the Life Sciences 73. http://www.w3.org/TR/hcls-kb/

74. Aplicacin de la Web Semntica en Biologa Molecular Open Biological and Biomedical Ontologies (OBO) 75. Aplicacin de la Web Semntica en Biologa Molecular Open Biological and Biomedical Ontologies

  • OBO Foundryhttp://www.obofoundry.org/
    • Open 76. Common shared syntax 77. Unique identifier space 78. Versions 79. Delineated content 80. Definitions 81. OBO Relation Ontology 82. Well documented 83. Users 84. Collaboratively

85. Aplicacin de la Web Semntica en Biologa Molecular Open Biological and Biomedical Ontologies

  • OBO Foundry

86. Aplicacin de la Web Semntica en Biologa Molecular Open Biological and Biomedical Ontologies

  • Gene Ontologyhttp://geneontology.org/
    • TheGene Ontology Consortium. Gene Ontology: tool for the unification of biology. Nature Genet. (2000) 25: 25-29
    • Michael Bada, Robert Stevens, Carole Goble, Yolanda Gil, Michael Ashburner, Judith A. Blake, J. Michael Cherry, Midori Harris, and Suzanna Lewis. A Short Study on the Success of the Gene Ontology . Web Semantics: Science, Services and Agents on the World Wide Web, 1(2):235240, 2004.
    • Vocabulario controlado para describir la funcin molecular, el componente celular y el proceso biolgico de genes (Gene Products)

87. Aplicacin de la Web Semntica en Biologa Molecular Open Biological and Biomedical Ontologies

  • Gene Ontology:~ 32.500 trminos en una estructurais_a ,part_of ,regulates( + , - )

88. Aplicacin de la Web Semntica en Biologa Molecular Open Biological and Biomedical Ontologies

  • Gene Ontology
    • Integracin de recursos(anotaciones)
      • Gene Ontology Annotation (GOA)
    • Explotacin de la estructura
      • Ontological analysis of gene expression data: current tools, limitations, and open problems.Bioinformatics. 2005 Sep 15;21(18):3587-95. Epub 2005 Jun 30.

89. Aplicacin de la Web Semntica en Biologa Molecular Open Biological and Biomedical Ontologies

  • Otras ontologas importantes: ChEBI, Cell Type, Sequence Ontology, Phenotype Ontology, UberOntology, 90. Meta Ontologas
    • Basic Formal Ontology (BFO) 91. OBO Relation Ontology (RO)
  • OBO Foundry tiene mucho contenido de relativamente alta calidad, pero 92. la mayora de las ontologas OBO son muy pobres axiomticamente 93. OBO format

94. Aplicacin de la Web Semntica en Biologa Molecular Open Biological and Biomedical Ontologies

  • OBO Format
    • No tiene una definicin semntica clara: Qu quieren decir las expresiones en OBO?
      • Mikel Egaa Aranguren, Sean Bechoffer, Phillip Lord, Ulrike Sattler and Robert Stevens. Understanding and using the meaning of statements in a bio-ontology: recasting the Gene Ontology in OWL. BMC Bioinformatics 2007, 8:57
    • Para usar inferencias, traducir a OWL
      • Christine Golbreich, Matthew Horridge, Ian Horrocks, Boris Motik, andRob Shearer. OBO and OWL: Leveraging semantic web technologies for the life sciences. ISWC 2007, 4825:169-182, 2007
    • o usar razonadores ad hoc:
      • OBO Edit reasoner 95. OBD-SQL reasoner 96. OBO Language (OBOL)

97. Aplicacin de la Web Semntica en Biologa Molecular Open Biological and Biomedical Ontologies

  • OBO Format

98. Aplicacin de la Web Semntica en Biologa Molecular Open Biological and Biomedical Ontologies

  • OBO format

99. Aplicacin de la Web Semntica en Biologa Molecular Por qu no se aplica LSSW? 100.

  • Problema general en bioinformtica: los bilogos crean sus propias soluciones artesanalmente y con afn de publicar
    • Carole Goble, The Seven Deadly Sins of Bioinformatics:
    • http://tinyurl.com/6nvoe4
  • OBO es un ejemplo ms de artesana
    • Cuando surgi GO, OWL no exista (y mucho menos Protg) 101. OWL es anti-intuitivo (ej. OWA, !UNA, )

Aplicacin de la Web Semntica en Biologa Molecular Por qu no se aplica LSSW? 102. Aplicacin de la Web Semntica en Biologa Molecular Por qu no se aplica LSSW?

  • Carole Goble and Chris Wroe. The montagues and the capulets. Comparative and functional genomics, 5(8):623 - 632, 2004
  • Pragmatists
  • Aesthetics
  • Philosophers
  • LifeScientists Capulets
  • KR Montagues
  • A means to an end Content providers
  • Theoreticians
  • The end Mechanism providers
  • Spiritual guides
  • Endurants, Perdurants, Being, Substance, Event

103.

  • Las ontologas se disean para consumo humano (ej. Muchos axiomas enterrados en anotaciones en GO)
  • La prioridad es la integracin de recursos, no la representacin de conocimiento

Aplicacin de la Web Semntica en Biologa Molecular Por qu no se aplica LSSW?

  • Axiomas expresivos en OWL
  • Reasoning resultn
  • OWL es difcil pero merece la pena
  • Aprender a usar la potencia de OWL

104. Ingeniera ontolgica vs. ingeniera software DEXA 2010 (Deusto). Philosophy Goes Information Technology - A Critical Reflection on Ontologies. Nick Falkner, University of Adelaide, Australia.Aplicacin de la Web Semntica en Biologa Molecular Por qu no se aplica LSSW? 105. Aplicacin de la Web Semntica en Biologa Molecular Conclusiones 106.

  • Para que LSSW se implante
    • IDs (Shared Names?) 107. Bio-ontologas axiomticamente ricas (ms funcionalidades): best practices (Ontology Design Patterns, )
      • Mikel Egaa, Alan Rector, Robert Stevens, Erick Antezana. Applying Ontology Design Patterns in bio-ontologies. EKAW 2008, LNCS 5268, pp. 7-16
    • Bio-ontologasconsensuadas :
      • Upper Level Ontology 108. RO
    • Menos Realism: bio-ontologas como medio, no como fin.
      • Phillip Lord and Robert Stevens. Adding a little reality to building ontologies for biology. PLoS ONE, 5(9):e12258, 2010.

Aplicacin de la Web Semntica en Biologa Molecular Conclusiones 109.

  • Para que LSSW se implante:
    • Herramientas
      • OBO se adopt por OBO-Edit!
    • Reasoning eficiente, predecible, y comprensible
    • Demostracin de beneficios inmediatos de reasoning
      • Consultas 110. Generacin de hiptesis 111. Mantenimiento

Aplicacin de la Web Semntica en Biologa Molecular Conclusiones 112.

  • Reasoning comprensible
    • http://owl.cs.manchester.ac.uk/explanation/

Aplicacin de la Web Semntica en Biologa Molecular Conclusiones 113. Aplicacin de la Web Semntica en Biologa Molecular Conclusiones

  • Reasoning para mantenimiento

http://www.gong.manchester.ac.uk/odp/html/Normalisation.html 114. Aplicacin de la Web Semntica en Biologa Molecular Open Biological and Biomedical Ontologies

  • Reasoning para mantenimiento y consultas
  • Gene Ontology Next Generation (GONG): ms axiomas con mnimo esfuerzo 115. Mikel Egaa Aranguren, Chris Wroe, Carole Goble, Robert Stevens. In situ migration of handcrafted ontologies to Reason-able Forms. Data & Knowledge Engineering 2008, 66, 147-162

116.

  • Life Sciences Semantic Web: 117. Killer app de Semantic Web?

Aplicacin de la Web Semntica en Biologa Molecular Conclusiones 118. Aplicacin de la Web Semntica en Biologa Molecular Para saber ms ... 119.

  • Bio-ontologies SIG at ISMB (Intelligent Systems for Molecular Biology)http://www.bio-ontologies.org.uk/ 120. SWAT4LS (Semantic Web Applications and Tools for Life Sciences)http://www.swat4ls.org/ 121. ICBO (International Conference on Biomedical Ontology)http://icbo.buffalo.edu/

Aplicacin de la Web Semntica en Biologa Molecular Para saber ms ... 122. Aplicacin de la Web Semntica en Biologa Molecular Para saber ms ...

  • EBI (European Bioinformatics Institute)http://www.ebi.ac.uk/ 123. NCBO (National Center for Biomedical Ontology)http://www.bioontology.org/ 124. Journal of Biomedical Semantics http://www.jbiomedsem.com/ 125. Semantic Systems Biologyhttp://www.semantic-systems-biology.org/ 126. Repositorios:
    • http://bioportal.bioontology.org/ 127. http://obo.sf.net/ 128. http://www.ebi.ac.uk/ontology-lookup/

129. Aplicacin de la Web Semntica en Biologa Molecular Mi trabajo en todo esto (Hasta ahora) 130. Aplicacin de la Web Semntica en Biologa Molecular Mi trabajo en todo esto (hasta ahora)

  • Hacer SW ms fcil a los bilogos
    • Ontology Design Patterns 131. OPPL 2 132. GONG 133. Tutoriales OWL
  • Construir recursos que usan SW
    • Cell Cycle Ontology 134. BioGateway 135. OGO
  • http://mikeleganaaranguren.wordpress.com/publications/

136. Aplicacin de la Web Semntica en Biologa Molecular Agradecimientos 137. Aplicacin de la Web Semntica en Biologa Molecular Inspiracin para esta presentacin

  • Michel Dumontier 138. Jesualdo Toms Fernndez Breis 139. Carlos Tejo 140. Erick Antezana 141. Phil Lord 142. Robert Stevens