metodologías de las humanidades digitales y aplicación ... · metodologías de las humanidades...
TRANSCRIPT
Metodologías de las humanidades digitales y aplicación sobre un corpus (de textos) de revistas americanistas
estudio preliminar
Anna SvenssonBiblioteca de la Universidad de Göteborg
IX ENCUENTRO DE CENTROS ESPAÑOLES DE REDIAL"Fondos y recursos iberoamericanos para las humanidades digitales"
Sevilla 29 y 30 de octubre de 2015
GOTHENBURG UNIVERSITY LIBRARY
HUMANITIES LIBRARY)
Objetivos
• Informe de REDIAL sobre revistas americanistas para el congreso CEISAL 2016
• Con América Latina Portal Europeo tenemos un corpus de más de 30 000 artículos
• Explorar métodos de análisis de contenidos con herramientas informáticas como minería de textos, análisis de redes sociales y visualizaciones
• Explorar el app para Zotero, Paper Machines, que funciona como un mostrador de diferentes herramientas aplicables a textos completos
América Latina Portal Europeo como corpus
Formatos posibles:
Excel, CodeGen, CSV, Microsoft Word 2000, JSON, LaTEx, MediaWikiTable, OpenDocument Spreadsheet, OpenDocument Text, PDF, PHP array, Texte Texy!, XML, YAML.
Herramientas probadas
Excel Pivot (estadística y visualización), NodeXL (análisis de redes), Sci2 (análisis de redes, temas, geografías), Wordle (nubes de palabras)
*********************************
DiRT Directory: sitio de herramientas http://dirtdirectory.org/
CLARIN (Common Language Resources and Technology Infrastructure) http://www.clarin.eu/
Analizar metadatos bibliográficos:América Latina Portal Europeo como corpus
• Problemas con datos entrados en campos equivocados
• Problemas con nombres entrados en formas diferentes
• Variedad de exhaustividad de los datos
• Dependiente de la herramienta utilizada para el análisis, varios datos en el mismo campo tiene diferentes consecuencias
La cantidad de registros puede equilibrar estas variedades dependiente de la selección que se quiere analizar?
Ejemplos herramientas y problemas con los datos
Utilizando Excel Pivot (que nos serviría para visualizar estadística) se manifiesta que hay necesidad de separar datos en algunos campus:
28
30
44
69
87
104
111
125
206
219
231
245
246
400
471
499
666
697
850
973
1288
1708
1757
2762
3969
4626
4698
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
Guyana
Belice
Jamaica
Guadalupe
Guayana francesa
Martinica
Honduras
Panamá
El Salvador
Costa Rica
Puerto Rico
República Dominicana
Haití
Paraguay
Nicaragua
Guatemala
Ecuador
Uruguay
Bolivia
Venezuela
Colombia
Chile
Perú
Cuba
Brasil
Argentina
México
Núm. palabras claves geográficas 1990-2014 > 25
Excel Pivot
Wordle
Núm. de palabras geográficas total (27249) del corpus del Portal
Wordle
Palabras de los títulos originales de los artículos
Wordle
Palabras de los títulos originales de los artículos en inglés
NodeXL corpus del Portal
Artículos de Manuel Alcántara Sáez y Flávia Freidenberg incluyendo co-autores por revista (nombres separados y corregidos)
NodeXL idiomas del corpus del Portal por revistas
En rojo Anuario de Estudios Americanos
Sci2 visualizando redes: co-autoría
Autores de América Latina Hoy
Autores aparecen como diferentes si los nombres no son uniformes
Paper Machines analizando textos completos
App para Zotero
Ejemplo:América Latina Hoy
(443 textos) y Journal of Latin American Studies
(452 textos)1991-2010895 artículos excluyendo reseñas y editoriales
Mapping Heatmap
Ambas revistas
América Latina Hoy
Nubes
América Latina Hoy
Journal of Latin American Studies
Nubes por tiempo ambas revistas
Topic modelling
Journal of Latin American Studies
Topic modelling
Journal of Latin American Studies
Topic modelling
América Latina Hoy
Topic modelling
América Latina Hoy
Topic modelling
Ambas revistas
Phrase Net
Journal of Latin American Studies
DBPedia
América Latina Hoy
Ngram Viewer
Ejemplo de Google Books https://books.google.com/ngrams/info
Para seguir?
• Cuáles análisis serían interesante para el Informe?
• Cuáles herramientas? Cómo podemos aplicar crítica de fuente a estas herramientas?
• Cómo podemos colaborar con los datos accesibles para adaptarlos a diferentes herramientas y/o mejorar la calidad de los datos?
• Podemos tomar partes del contenido pensado para el informe y escribir un artículo para el Anuario Americanista Europeo y su volumen sobre los Estudios Latinoamericanos Europeos?