reunión anual del tdwg san petersburgo, septiembre 2005

49
www.unav.es/unzyec/mzna/ Sumario de la Reunión Anual del TDWG, 2005 Sep. 11-18, ZIN & BIN, San Petersburgo, RU A. H. Ariño, Universidad de Navarra Reunión anual del TDWG San Petersburgo, septiembre 2005 Resumen

Upload: nitara

Post on 15-Jan-2016

30 views

Category:

Documents


0 download

DESCRIPTION

Reunión anual del TDWG San Petersburgo, septiembre 2005. Resumen. Historia del TDWG (20 años) Frank Bisby. 1985: DB botánica en Reading [y Zootron cumple 3 años]. Sept: TDWG-I, Ginebra Entra en IUBS 1989: Canarias - PowerPoint PPT Presentation

TRANSCRIPT

  • Reunin anual del TDWGSan Petersburgo, septiembre 2005Resumen

  • Historia del TDWG (20 aos) Frank Bisby

    1985: DB botnica en Reading [y Zootron cumple 3 aos]. Sept: TDWG-I, GinebraEntra en IUBS1989: Canarias1990: Delphi: GPSIS, IOPI. La mitad de los asistentes fundan GBIF. El ltimo da se empieza a hablar de montar un sistema de BD comn.1992: Jalapa2004 ChristchurchSe intenta cambiar el nombre para que incluya eclogos y biomoles, pero falla. Sigue TDWG.

  • Domingo 11/9 (ZIN)09:30 Structure of Descriptive Data (SDD)11:00 Coffee 11:30 Natural Collections Descriptions/TDWG Executive Meeting13:00 Lunch14:30 Taxonomic Concept Exchange Standard (TCS)16:00 Coffee16:30 Protocol Developers group19:30 Evening Reception

  • Lunes 12/9 (BIN)TDWG Standards Walter Berendsohn10:00 Welcome by the Chair10:05 Welcome by the Host Institute (Zoological Institute of the Russian Academy of Sciences)Standards Procedure Walter Berendsohn10:10 Stan Blum: Report of the Procedures Subgroup and current procedure for voting on the proposed standards10:20 Lee Belbin: An overview of current practice in other Standardization Bodies10:40 Discussion11:00 CoffeeProposed standards for ratification (I) Stan Blum11:30 Gregor Hagedorn: SDD (Structured Descriptive Data) 12:15 Jessie Kennedy: TCS (Taxonomic Concept Exchange Standard) 13:00 LunchProposed standards for ratification (II) Adrian Risson14:30 Stan Blum: Darwin Core (Core Biological Collection Data) 14:45 Walter Berendsohn: ABCD-Schema (Access to Biological Collection Data) 15:30 Discussion of standards for collection data 16:00 CoffeeAnnouncement and Presentation of Emerging Standards Walter Berendsohn16:30 Markus Dring: TAPIR (TDWG Access Protocol for Information Retrieval) 16:40 Donald Hobern and Ricardo Pereira: GUIDs (Globally Unique Identifiers) 16:50 Bob Morris: Imaging/Multimedia17:00 Steve Kelling: Observational Data 17:10 Geospatial data 17:20 Economic Botany17:30 Anna Weitzman: Literature 17:40 Further standard initiatives

  • Martes 13/9 (ZIN)Sesiones paralelas pre-caf:Biodiversity Informatics for taxonomic research in RussiaOleg Pugachev Data exchange formats, protocols and their integration (I)Sally HinchcliffeSesiones paralelas post-caf: Application design and Tools for taxonomic researchAnna Weitzman Data exchange formats, protocols and their integration (II)Sally Hinchcliffe Posters/DemostracionesSesiones paralelas vespertinas:Biodiversity data applicationsAlexander Ryss Taxonomic ontologies, identifiers and schemasNeil Thomson

  • Mircoles 14/9ExcursinGBIF Data Provider TrainingBanquete

  • Jueves 15/9 (BIN)Enhancing the efficiency of data mobilisationGregor Hagedorn 11:00 CoffeeTools for the improvement of data quality and their application Arthur Chapman13:10 LunchTDWG perspectives and the global biodiversity networkWalter Berendsohn16:00 CoffeeThe Species 2000 and ITIS Catalogue of Life: assembling and disseminating the wholeDmitri Geltman

  • Viernes 16/9 (ZIN)Sesin Ejecutiva (British Council) Walter Berendsohn Report of the Chair of the Executive CommitteeTreasurer's reportElection of officersResult of ballots on standardsTDWG meetings 2006 and 2007Future of TDWG: Interaction with the TDWG/GBIF ProjectOther Business12:00 Lunch13:30 Computer Demonstrations 14:30 Plenary SessionInstitute of Distributed Taxonomy16:00 Coffee16:30 Break-out GroupsGutenbergImage/MultimediaSDD

  • Sbado 17/9 (ZIN)ObservationGeoreferencing SDD Natural Collections DescriptionsSpatial Data

  • 87 presentaciones1. Experience exporting and importing SDD 1.02. An ontological approach to the organisation of biological information3. HERBIS is the Erudite Recorded Botanical Information Synthesizer: electronic data publication from herbarium specimens a click away4. The PBI Solanum project an international collaboration to monograph Solanum5. ABCD the proposed standard XML schema for Access to Biological Collection Data6. Twenty years of TDWG: no more the travelling tea-party!7. Completing the Catalogue of Life: phase 2 of the programme.8. The Darwin Core 29. Graphic identification tool applied to West African trees10. CHRONOS Systems approach to the development of paleobiological taxonomic databases and dictionaries11. Towards best practice in georeferencing - Project BioGeomancer12. Data quality tools for use in georeferencing natural history location data - Project BioGeomancer13. Detecting spelling errors in taxonomic databases14. A standards-based structure for supporting the exchange of biocollections data15. WDC-MARE / PANGAEA Publication of observational data on the base of persistent identifiers (DOI)16. A first TAPIR implementation - the BioCASe PyWrapper serves a new protocol.17. Make the tapir work. Practical potential of the TDWG Access Protocol for Information Retrieval (TAPIR)18. Website and web application design for biodiversity informatics applications: incorporating the stakeholders19. MorphBank: The requirements and implementation of a digital image phylogenetic database20. Databases of the dendrological collection of PABGI21. RMCA collaborator of the Belgian Generalized Natural Sciences Online and Spatial Information System project GNOSIS22. Reducing the pain of digitising herbaria and sharing data23. Open Source for species identification: an application of SVG (Scalable Vector Graphics) to a web based version of IDAO24. Electronic collection of agricultural crops, their wild-growing relatives and pest organisms within the Former Soviet Union25. An Internet-based information resource on the family Dolichopodidae (Insecta: Diptera)26. Structured Descriptive Data (SDD) version 1.027. Remote annotation in a distributed access system - How to provide feedback?28. Machine Learning for Extracting Darwin Core Data from Museum Labels29. Development of GBIF data services30. Using the Catalogue of Life in GBIF31. The Gordon and Betty Moore Foundation grant for the GBIFTDWG partnership32. A machine learning environment for the automatic mark-up of taxonomic descriptions with XML33. Modularisation of the TDWG XML standards34. AlgaTerra: calibrating micro algal information on the Internet35. EOL: a database application for presenting results of taxonomic revisions on the web.36. The Catalogue of Life Web-services37. Workflow as a Metaphor for Biodiversity Problem-Solving38. The contribution of monitoring data to information about biodiversity39. The Taxonomic Concept Schema: an XML standard for exchanging taxonomic names and concepts40. ABCDEFG a draft Extension For Geosciences to the ABCD XML schema41. Databases on the Supersite of the Zoological Institute Web-portal Beetles (Coleoptera) and Coleopterists42. Half a million species: the Catalogue of Life Annual and Dynamic Checklists43. Database Habitats of East Fennoscandia.44. Databases of the information storage and retrieval system of the Herbarium MSKH: Hortus Botanicus Centralis - Info

  • 87 presentaciones45. Internet and XML-based program tools for the everyday work of taxonomists46. The bird monitoring data exchange schema47. The catalogue of the World Ocean Ophiuroidea (Echinodermata) from the collection of samples of the Institute of Oceanology RAN (Laboratory of Bottom Fauna)48. ZOOCOD - the data standard for the building taxonomic tables and representation of multilevel hierarchies in the relation databases49. Database Weed Plants in Russia Flora results and perspectives50. FloraWeb the German Web Flora51. World Database of Fleas (Insecta: Siphonaptera): SIPHONAPTERA): experience of morphological analysis52. The Royal Museum for Central Africa in the era of biodiversity informatics53. Tropicos in taxonomic toil: daucus or ferula?54. Integrated search on taxonomic databases55. SPICE protocol and SPICE system56. The CIDOC Conceptual Reference Model (CRM), a core-ontology for information integration57. Distribution maps of Russian Umbelliferae simple technique of electronic view58. Legacy Infrastructure Network for Natural Environments (LINNE)59. Concept of a simple database providing storage and management of the information on regional fauna and flora60. Spatial modelling of plant species potential habitats61. Information technology tools in biodiversity research: basic results and trends62. A Web-based collaborative environment for building the Cypriniformes Tree of Life63. Species 2000 Metadatabase: practicality and dreams64. Introducing SPIDA-web: An automated identification system for biological species65. On the standards of taxonomic description in Nematoda66. The revision of the genus Bursaphelenchus Fuchs (Nematoda: Parasitaphelenchidae) and analysis of the phylogeny and evolution with the use of the information technology tools67. ALTER-Net - An Object Oriented Approach to Ecological and Biodiversity Data Networking68. Serving Our Audiences: What teachers want from a tree of life visualization69. Illustrated catalogue of the types of plant taxa of the Vir Herbarium (Wir)70. Access rights management and access control for BioCASE71. SDD and the Key to Life72. Natural Collections Descriptions (NCD): a standard for describing entire collections.73. Collections of digital iconographic pictures of plants to decides taxonomic questions on living collections in Russian and Chinese botanical gardens74. Using TAPIR views for integrating Biodiversity data sources into existing standard applications75. Mapping equivalences: the role of a name server in providing access to real-world biodiversity datasets76. Database of the herbaceous perennial plants of the Polar-Alpine Botanical Garden used outdoors in the Northern Territories introduction experiments77. Services for improving integrity in federated taxonomic information systems78. Usable georeferencing infrastructure: preliminary lessons with BioGeomancer79. Pitfalls and prospects for spatially challenged occurrence data80. Making TAPIR data providers BioMOBY services: first steps.81. Data exchange formats: experience from the National Biodiversity Network82. Taxon names in multiscript languages83. OBIS continues its global expansion through content, standard, and service development85. TROPICOS: Next Generation - The newest version of the global plant taxonomic data source86. Interactive visualizations of taxonomic/phylogenetic trees and ecological networks87. Metadata for specimen taxonomic surrogates

  • 103 participantes

  • Asuntos ms relevantesOrganizacin y administracinEstndaresVotaciones de estndares listosRetirada de la propuesta de DC2Propuestas de nuevos estndaresPropuesta de nuevos grupos de trabajoMeta-TDWGHistoriaBeca de la Fundacin MooreContrato de un equipo tcnicoNombre del TDWGGBIF y TDWGDesarrollo tcnico actualProtocolos/wrappersTAPIRABCDSPICEServiciosToLCoLITISSPIDA-WebHerramientasGeorreferenciacinGNOSISEOLHERBISCuestiones cientficasGUID, LSIDTCSInformacin georreferenciadaBioGeoMancerImgenes, multimediaENBI-ImagesCatlogos y bases de datos desarrolladasGeneralesOBISMorphBankTROPICOSParticularesFilogenia y sistemticaMetadatos y ontologasNCDCIDOCDOIRedes colaborativasALTER-NetLINNEPerspectivas de futuro

  • Estndares, Protocolos y Sopas de Letras

  • ESTNDARES en TDWGStan Blum: ProcedimientosRevisin: El comit de estndares prepara una propuesta para el comit ejecutivo que se distribuye al menos 60 das antes de la reunin anual; el borrador est desde 180 das antes. En la reunin se discute y se reparten papeletas; luego se vota durante varias semanas.Lee Balvin: Nuevo proyecto de estndaresnuevo proyecto de trabajo colaborativo gracias a una beca de la fundacin Moore. Se ha contratado un gerente, un ingeniero de sistemas y un programador (Ricardo Pereira). Tareas:Revisar los estndares de trabajo del TDWG (TDWG, CODATA, GGF, IEEE, etc.)Analizar otros estndares, incluyendo GBIFPoner cosas en comn con la gente reunida en San PetersburgoElaborar un estndar de buenas prcticas que se har circular entre los miembros. Deber estar listo a finales de abril de 2006.

  • SDD Greg Hagedorn, Bob MorrisSDD promueve la codificacin de taxones, como en DELTA (SDD es una especie de actualizacin de DELTA-II) (matrices taxon/carcter)Se recomienda una estandarizacin, aunque son los cientficos los que los definen:SDD NO intenta estandarizar la terminologa, sino que es un marco para que los bilogos realicen esa estandarizacin.No publica datos taxonmicos no estructuradosSe incluyen datos descriptivos y ontologas:definiciones de trminosdefiniciones de caracteres y estadosSDD utiliza una descripcin con lenguaje natural (XML) y generacin dinmicaSDD propone:Caracteres (~ variables): cualitativos, cuantitativos, estadsticas...Conceptos (~ rboles): organizacin de los caracteresModificadores (~ mtodos estandarizados de extensin): frecuencia, probabilidad, localizacin...

  • Darwin Core 2 (DC2) Stan BlumEstado de la cuestin:La georreferenciacin que se exiga en la nueva versin no iba a estar disponibleLos campos de localidad no son obligatoriosToda la georreferenciacin pasa a ser una extensinLas fechas se convierten en margen de fechas (de a)Se abre un espacio para una futura definicin de GUIDLos campos temporales pasan a ser ISO pero se expresan en das julianosLos atributos de DiGIR se han eliminadoCon todo esto, se abre una discusin y el resultado esla retirada de DC2 de la propuesta! No parece que est an en condiciones de pasar a ser un estndarSe replantea volver a proponerlo para la siguiente reunin una vez que se hayan acordado los asuntos anteriores y se haya designado un arquitecto para el sistemaLa georreferenciacin parece el principal escollo, aunque deben acomodarse muchas otras cuestiones planteadas en esta reunin

  • ABCD-Schema 2.0 Walter BerendsohnPrescinde del concepto de taxn (queda para el TCS?)ExtensibleCon gestin de IPRCompatible con DC a travs de 47 elementosEuropa est usndolo para una red de 180 BD conectadasEl estndar el el esquema XML (NO la documentacin)

  • TAPIR Markus DringDesarrollo:Javier de la Torre, Steven Perry, Robert Gales, Renato De Giovanni, Markus Dring, Donald HobernSirve a BioCASE y a DiGIR a travs de wrappers desarrollados en Berlin y KansasDe momento, una nica URL para un GET que:Pide datos a un proveedor (p.ej. GBIF)Traduce con XML, XLST a las especificaciones de otro proveedor (p.ej. KML)Recupera la nueva informacin (p.ej. Google Earth)Toda aplicacin que pueda trabajar con XML y un esquema definido es un posible cliente TAPIRGBIF usa TAPIR como el proveedor central de XMLNegociaciones para que TAPIR pase a ser el servicio para BioMOBY (biologa molecular)http://ww3.bgbm.org/protocolwiki/http://jarvis.local/tapir/pywrapper.cgi

  • TCS Jessie KennedyTaxonomic Concept SchemaTrata de resolver la guerra principal entre nombres y conceptos en taxonoma, y una batalla secundaria sobre la historia de los nombresPropuesta actual para el CONCEPTO taxon:Nombre+autor+ao+segn(nombre,publicacin,ao)+definicinIncluye una lista taxonmica conceptual

    http://www.soc.napier.ac.uk/tdwg/index.php

  • Bibliografa Anna WeizmannLa bibliografa est ausente de los estndares del TDWGSe contemplan tres niveles:Microcitacin (lnea de cita)Gutenberg CoreModelo completo (con frontispicio, TDC, tratamiento taxonmico, etc.)Est bastante verde aunque se ha organizado dos grupos de trabajo para microcitas y GC, y para el modelo completo (Chuck Miller, Donald, Whitebread, Stan, etc.)

  • Servicios y Servidumbres

  • Servicios de GBIF: anlisis Donald HobernDemuestra la integracin de muchos estndares (DiGIR, BioCASE, DC, ABCD, CoL)peroLa interfaz es slo HTMLCapacidad de bsqueda limitadaModelo de datos (UDDI) inadecuadoPobre tratamiento de la homonimiaEl XML acta como una caja negrapor tanto...El portal va a moverse hacia una segunda generacinhttp://wiki.gbif.org/dadi/wiki/wikka.php

  • HERBIS Reed Beaman En el mundo hay del orden de 1G ejemplares de museo, con 1,5M especiesProcesndolas a 10 minutos por especimen, salen 166m horas = 21M das = 833kpax/aoEn Chania se propuso usar la imagen del herbario para extraer los datos de las etiquetas: HERBIS es un OCR inteligente que lo haceUsa OCR, NHR y NLPSe plantea ponerlo como web serviceExige resoluciones de escaneo de 300 dpi para OCR y 600 dpi en tipos o e-prstamos; TIFF o LL JP2KSignifica imgenes de 22 MpxUsa PostgreSQL, Tomcat, AXIS/SOAPhttp://www.herbis.org/

  • CIDOC Christian Ore, Heinz LampeCIDOC gestiona la documentacin musestica del ICOM (Comit Internacional de Museos)Describe los metadatos de las colecciones que se deben almacenarIncluye objetos en muchos niveles; si cumplen una serie de condiciones, pasan a otro nivelEjemplo: Objeto biolgico+informacin adecuada=holotipoTiene aspecto de mapa conceptual

  • LITCHI Richard WhiteObjetivo: Automatizacin de tareas taxonmicasModelizacin del conocimiento y de las reglas de integridadBasado en webCompara listas para buscar inconsistencias, duplicaciones, sinonimias,etc.

  • Georreferenciacin Arthur ChapmanDocumento de Buenas Prcticas BioGeoMancerPrincipios:Exactitud (radio de incertidumbre)Eficacia: probabilidad de acertar con el objeto correctoEficiencia: cantidad de trabajo necesario para obtener buenos datos geogrficosFiabilidad: grado de consistenciaAccesibilidadTransparenciaActualizacinRelevanciaOperativo, pero est siendo refinado. Por ejemplo: el radio de incertidumbre puede ser reducido enmascarando reas imposibles (costas)http://www.biogeomancer.org/

  • Georreferenciacin (II) John WieczorekSe propone usar BioGeoMancer para georreferenciar aceptablemente las BD con datos geogrficos no estructurados. Secuencia:Interpretacin de los datos literales: anlisis de expresin, NLP:Interpretacin de los tipos de localidades (50% feature, 21% locality not recorded, 17% offset from feature,)Puede no haber delimitadores, puntuacin: interpretacin por reglasLas referencias de localidad pueden ser inexactas (punto/rea): construccin de descriptorInterpretacin espacial final

  • Georreferenciacin (III) Renato DeGiovanni Escenario 1: BD no georreferenciadaA BGM para interpretar los datos; la georef. Vuelve a la BDEscenario 2: BD georreferenciadaA un validador. Se ha preparado un marco Java para GBIF.Resultados: Etiquetas XML que pueden pegarse al registro, a sus partes, o a toda la BDTests en desarrollo:Deteccin de errores:Inconsistencias: lat/long con regiones; con elevacin; con hbitat; fechas con recolector o itinerario, etc.Outliers:Por jacknife inverso (estadstico)Por distribucin esperada del taxon

    http://cvs.sourceforge.net/viewcvs.py/gbif/DataTester/http://georef22.peabody.yale.edu/bg/workbench.jsp

  • Errores de deletreo en las BD taxonmicas Richard White

    Algoritmos para detectar errores cuando NO se dispone de vocabularios (agudo en las BD taxonmicas)Se buscan parejas de nombres similares (ILDIS, MARINE, SP2K, PMA, CNIP) contra controles con errores conocidosSe buscan caracteres invlidosProximidades fonticas (obviamente, agudo en ingls pero no en otros idiomas): SoundeX, PhoniXAlgoritmos de transformacin y n-gramasLlaves maestras (comodines): como un digest de la palabraTienen muchos falsos positivos. Mxima tasa de errores en los invertebrados

  • Imagen digitalArturo H. ArioPosibilidad de usar imgenes en sustitucin de los ejemplaresRequerimientos mnimos de calidad para uso cientficoRequisitos de metadatosCasos especialesManual ENBI de buenas prcticas para imagen digital de series tipoCombinacin bancos de imgenes-datos alfanumricos: nuevos slots para DiGIR (GBIF) Interaccin con anotacin remota (Morris)

  • Redes de Pesca

  • LINNE Reed BeamanObjetivo: Taxonoma -> MegacienciaRenacimiento de la sistemtica por los estudios de biodiversidad; creacin de infraestructuras de informacinLINNE: Ciberlaboratorio para taxonoma:Modernizacin de coleccionesVerificaciones y puestas al daEnlace entre laboratoriosTrabajo virtual

  • ALTER-NetKathyn SchantzRed para integrar datos biolgicos y ecolgicos sobre biodiversidadOrientada a objetosIncluye ontologasLas ontologas incluyen actores (gente, instituciones)Especfica de dominios

  • Base de Datos de Bases de Datos

  • TROPICOS Chuck MillerArquitectura de informacin botnica (1M nombres, 100K artculos, 50K autores)Incluye referencias digitalizadas (BOTANICUS) (182 vols, 82000 pgs, 2500 pgs/semana)

    http://mobot.mobot.org/W3T/Search/vast.htmlwww.botanicus.org

  • Sp2000 Catalogue of Life Yuri RoskovEstado en 2005:527 K sp414 K syn253 K nombres vulgares24 DBCobertura completa: 2011Actual/Estimaciones:Virus: 2kArchaea: 105Bacterias: 6kProtos: 6k/80kHongos: 27k/72kPlantas: 50k/270kAnimales: 130k/1344kConstruida a partir de varias DB pero ahora se encajan en ITISAcaba de pasar (diciembre) de listas anuales a listas dinmicas

  • MorphBank Gregg Riccardi

    Depsito fiable y seguro de imgenes taxonmicas, material digital y la informacin asociadaSoporta matrices de imgenes para taxonomaEsquema relacional: las imgenes estn asociadas a los especmenes, asociados a especies, etc.Diversos proyectos lo estn usandoPermite anotacionesPermite relaciones explcitas entre objetosUsa la jerarqua de ITIS

  • Tomates Verdes Crudos

  • GUIDs Donald HobernSe ha establecido una lista de correo y se prev un workshop en febrero de 2006 en DurhamHay en marcha una discusin sobre qu camino seguir (LSID, DOI, etc.)Polarizacin entre partidarios de GUID y TCSProyecto por la Fundacin MooreTarea principal: Desarrollar GUIDs para cada registroSe establece un grupo de trabajoSe ha abierto una discusin electrnicaBorrador para Abril de 2006Final: Julio 2006

  • Reunin EjecutivaMinutas 2004 listas; se apruebanEstndares:No se aceptarn ms en formato no electrnicoNo se crean nuevos grupos hasta que se haya desarrollado la nueva estructura del TDWGVotacin de recomendacin:ABCD: 27/2/1SDD: 26/1/3TCS: 23/4/3EstructuraCon la Moore se va a desarrollar un proyecto de infraestructura (TIP)Cuentas52 miembros123 participantes NZ, 103 RUNuevos cargosTodos los votos a favor de la juntaTDWG 2006,2007Ofertas: Baton Rouge; St. Louis; Rolling (NC); INRA (FR),Bratislava [convocatoria definitiva: BMG, St. Louis]Secretara del TIPRedefinicin de nombre y objetivos: International Working Group on Taxonomic DatabasesSe convertir en una Sociedad InternacionalSe mantendr como WG en IUBS