linked data

15
FACULTAD DE INGENIERÍA ARQUITECTURA Y URBANISMO ESCUELA DEINGENIERÍA DE INGENIERIA INDUSTRIAL “LINKED DATA Y SU ALINEACION CON EL GOBIERNO DE TI” CURSO: REDES DE COMPUTADORAS II DOCENTE: ING. CARRIÓN BARCO GILBERTO AUTORES : MONTEJO PIZARRO WILLIAN PARRA SERQUEN JORGE

Upload: jorge-antonio-parra-serquen

Post on 24-Jan-2015

106 views

Category:

Documents


0 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Linked data

FACULTAD DE INGENIERÍA ARQUITECTURA Y URBANISMO

ESCUELA DEINGENIERÍA DE INGENIERIA INDUSTRIAL

“LINKED DATA Y SU ALINEACION CON EL

GOBIERNO DE TI”

CURSO:

REDES DE COMPUTADORAS II

DOCENTE:

ING. CARRIÓN BARCO GILBERTO

AUTORES :

MONTEJO PIZARRO WILLIAN

PARRA SERQUEN JORGE

PIMENTEL, 25 Junio del 201

Page 2: Linked data

LINKED DATA

INTRODUCCION

La revolución provocada por el fenómeno de la Web 2.0 ha hecho que ahora cualquier

persona, independientemente de sus conocimientos técnicos, pueda publicar

información en la Web. Como consecuencia, nos encontramos ante un escenario

caracterizado por la masificación de contenidos en la Red, precisando el ser humano

de algún tipo de intermediario “inteligente” capaz de extraer, procesar y localizar de

forma autónoma la información requerida. La nueva “Web de los Datos”, también

conocida como “Web 3.0” o “Web Semántica”, sienta los cimientos de este futuro

inmediato, creando una red de nodos con información multidisciplinar que puede ser

explorada por aplicaciones software sin necesidad de la intervención humana. La

iniciativa Linked Open Data (LOD), impulsada por Tim Berners Lee (creador de la Web),

define los mecanismos que dan forma a esta nueva Internet, en la que los datos ya no

están cautivos en silos propietarios, sino que pueden ser libremente compartidos y

reutilizados por agentes software. Un nodo de la red Linked Data se caracteriza

porque, además de mantener los datos propios de su dominio de interés, define

enlaces a otros con información relacionada o complementaria.

Page 3: Linked data

LA INICIATIVA DE LINKED OPEN DATA

El modo en el que la información se publica en Internet ha sufrido una profunda

evolución durante los últimos años. Desde las primeras publicaciones de datos en la

Web a principios de los 90, basadas en textos estáticos, hasta los actuales modelos de

publicación de la información basados en blogs, redes sociales y foros, se puede

afirmar que han cambiado no solo las tecnologías sino también los paradigmas

subyacentes. La Web actual se basa en un diseño sencillo, accesible e intuitivo para el

ser humano. Este interpreta la información presentada en pantalla y accede a nuevos

datos mediante una serie de hiperenlaces incluidos en el documento que está

consultando.

Resulta paradójico que la principal razón del éxito de la Web se haya convertido en

uno de los principales desafíos a resolver a la hora de evolucionar cara a un nuevo

modelo de acceso a la información en el que el ser humano, abrumado por la ingente

cantidad de datos disponibles en la Red, precisa de un intermediario (un agente

software) que se encargue de explorar la Web, descubrir y procesar los datos buscados

y presentarlos finalmente en un entorno amigable.

La “Web de los Documentos”, accesible y entendible únicamente por el ser humano, se

convierte así en la “Web de los Datos”, accesible y entendible también por las

máquinas. Para hacer realidad la “Web de los Datos” es preciso definir un mecanismo

que permita a los agentes software “interpretar” (manipular simbólicamente) la

información disponible en Internet. La primera y más básica especificación en este

sentido definida por el W3C es el modelo RDF.

Una declaración RDF toma la forma de una tripla compuesta de un sujeto, un objeto, y

un predicado que determina la relación que une sujeto y objeto.

RDF garantiza la interoperabilidad sintáctica de los datos, queda por resolver el

problema de la interoperabilidad semántica de los mismos. Para ello es preciso

establecer un consenso sobre el significado concreto de los términos (nombre de

conceptos y relaciones) que existen en un dominio particular.

Page 4: Linked data

La Web Semántica dispone de un instrumento específico para realizar esta labor, la

ontología, entendiendo como tal una “especificación explícita de una

conceptualización”, que puede ser descrita formalmente mediante la especificación

RDFS o bien, si la potencia semántica de esta no es suficiente, mediante OWL, ambas

especificaciones basadas en RDF definidas por el W3C.

Desde un punto de vista tecnológico existen básicamente dos estrategias para la

publicación de la información en esta nueva Web. La primera, más continuista, pasa

por enriquecer las páginas web existentes, expresadas en HTML, con anotaciones RDF

(utilizando las directrices establecidas en la especificación RDF), que aportan contexto

e información procesable por un ente automatizado al documento. Esta aproximación,

aunque sencilla en su concepción, incrementa la complejidad en la creación y

mantenimiento de las páginas web, por lo que en los últimos años ha ganado fuerza

una iniciativa alternativa: Linked Open Data.

La iniciativa Linked Data basa su funcionamiento en tecnologías y estándares

ampliamente aceptados, cimentándose en 4 principios básicos:

1. Utiliza de URI como nombres para objeto de información.

2. Utilización del protocolo HTTP para que las personas pueda buscar esos

nombres.

3. Cuando alguien busque un URL, proporcionar información útil, utilizando las

normas (RDF,SPARQL).

4. Incluir enlaces a otras entidades mediante URI para potenciar el

descubrimiento de nuevos elementos de información que puedan ser

relevantes para el usuario.

Page 5: Linked data

EVOLUCION DEL CRECIMIENTO DEL LINKED DATA.

Mayo 2007

Julio 2009

Page 6: Linked data

Setiembre 2011

CREACIÓN Y PUBLICACIÓN DE UN NODO LINKED DATA

En este apartado se describe el proceso de creación de un nodo Linked Data orientado

a la publicación

En este proceso se realizan los siguientes pasos:

A. Definir la terminología (ontología)

El primer paso consiste en definir la ontología que identifica los términos (en

particular los nombres de los conceptos y de las relaciones) que se van a utilizar

para describir la información a publicar.

En la actualidad existen multitud de bases de datos y otro tipo de registros

electrónicos que almacenan información nutricional de alimentos. Por tanto,

para el desarrollo de la ontología es conveniente realizar un estudio previo de

los esquemas utilizados en estos registros, basándonos en nuestro caso en la

USDA (Database for Nutrition Information).

B. Populación

Page 7: Linked data

Consiste en recopilar la información que se desea exponer a través del nodo Linked Data y registrarla en formato RDF haciendo uso de los términos identificados en la ontología.

Para ello se ha creado un script semiautomatizado encargado de:

1. Extraer la información de interés del catálogo de la USDA.2. Identificar potenciales conflictos.3. expresar dicha información en forma de triplas RDF.4. Almacenar los datos en un almacén RDF (en nuestro caso se ha utilizado

el Virtuoso Universal Server20).

C. Configuración del nodo

Linked Data no define un patrón concreto para asignar un nombre único (una

URI) a los recursos, por lo que cada nodo puede seleccionar el esquema que

considere más conveniente. En nuestro caso, el patrón seleccionado combina

un prefijo común (el espacio de nombres propio del nodo), seguido de un sufijo

que identifica la clase del recurso y su identificador USDA.

D. Vinculación con otros nodos

Tras configurar nuestro nodo hemos alcanzado los tres primeros principios

básicos de los cuatro establecidos en Linked Data, restando el establecimiento

de relaciones con otras entidades. Uno de los procedimientos más comunes

para realizar esta labor es el record linkage, proceso definido en la literatura

especializada como la “identificación y relación de diferentes registros en

fuentes de datos heterogéneas que hacen referencia al mismo objeto en el

mundo real”.

GOBIERNO DE TI

Page 8: Linked data

“El gobierno de las TI es el alineamiento

estratégico de las TI con la organización de

forma tal que se consigue el máximo valor de

negocio por medio del desarrollo y

mantenimiento de un control y

responsabilidades efectivas, gestión del

desempeño y gestión de riesgos de las TI”.

Es el conjunto de acciones que realiza el área

de TI en coordinación con la alta dirección

para movilizar sus recursos de la forma más eficiente en respuesta a requisitos

regulatorios, operativos o del negocio.

Constituye una parte esencial del gobierno de la empresa en su conjunto y aglutina la

estructura organizativa y directiva necesaria para asegurar que TI soporta y facilita el

desarrollo de los objetivos estratégicos definidos.

Garantiza que:

TI está alineada con la estrategia del negocio.

Los servicios y funciones de TI se proporcionan con el máximo valor posible o

de la forma más eficiente.

Todos los riesgos relacionados con TI son conocidos y administrados y los

recursos de TI están seguros.

LINKED DATA ALINEADO CON EL GOBIERNO DE TI

El gobierno de las TI está demostrando su efectividad y rendimiento a la hora de

obtener el máximo valor de las TI para las organizaciones. El 65% de los responsables

TI que ya han implantado estos sistemas reconocen que son efectivos o muy efectivos.

La publicación de la norma ISO 38500 en 2008, ha supuesto un gran respaldo para el

reconocimiento de la importancia de los sistemas de gobierno de las TI y se ha

convertido en un referente y un excelente punto de partida para la implantación de

estos sistemas.

Los objetivos principales de la norma ISO 38500 son:

Asegurar que, si la norma es seguida de manera adecuada, las partes

implicadas (directivos, consultores, ingenieros, proveedores de hardware,

auditores, etc.), puedan confiar en el gobierno corporativo de TIC.

Page 9: Linked data

Informar y orientar a los directores que controlan el uso de las TIC en su

organización.

Proporcionar una base para la evaluación objetiva por parte de la alta dirección

en el gobierno de las TIC.

Gobierno corporativo de TI Norma ISO 38500

El Gobierno de TI y la norma ISO/IEC 38500 proporcionan un marco de principios para

que la dirección de las organizaciones los utilice al evaluar, dirigir y monitorizar el uso

de las tecnologías de la información y comunicaciones (TIC) con el objetivo de cumplir

con los siguientes 6 principios u objetivos:

Responsabilidad: Todo el mundo debe comprender y aceptar sus

responsabilidades en la oferta o demanda de TI. La responsabilidad sobre una

acción lleva aparejada la autoridad para su realización.

Estrategia: La estrategia de negocio de la organización tiene en cuenta las

capacidades actuales y futuras de TI. Los planes estratégicos de TI satisfacen las

necesidades actuales y previstas derivadas de la estrategia de negocio.

Adquisición: Las adquisiciones de TI se hacen por razones válidas, basándose

en un análisis apropiado y continuo, con decisiones claras y transparentes. Hay

un equilibrio adecuado entre beneficios, oportunidades, costes y riesgos.

Rendimiento: Las TI están dimensionadas para dar soporte a la organización,

proporcionando los servicios con la calidad adecuada para cumplir con las

necesidades actuales y futuras.

Conformidad: La función de TI cumple todas las legislaciones y normas

aplicables. Las políticas y prácticas al respecto están claramente definidas,

implementadas y exigidas.

Factor Humano: Las políticas, prácticas y decisiones de TI demuestran respecto

al factor humano, incluyendo las necesidades actuales y emergentes de todo el

personal involucrado.

Redes Temáticas del Gobierno de TI

Red Temática de Linked Data de España.

La red temática española de Linked Data se creó en enero del 2011 con el

objetivo de facilitar el intercambio y transferencia de conocimientos en el área

de la Web de Datos (también conocida como Linked Data o, en español, Red de

Page 10: Linked data

Datos Enlazados), entre grupos de investigación nacionales asociados a

Universidades, Centros Tecnológicos, administraciones públicas y empresas.

La red, dirigida por Oscar Corcho del Ontology Engineering Group, fue

financiada durante los años 2011 y 2012 por el Ministerio de Ciencia e

Innovación, inicialmente, y luego por la Secretaría de Estado de Investigación,

Desarrollo e Innovación, dependiente del Ministerio de Economía y

Competitividad. A pesar de no contar con financiación a partir del año 2013, sus

actividades se seguirán realizando con la colaboración de los miembros activos.

Red Temática de Linked Data del Reino Unido

Después de los problemas recientes y eventos que afectan las

implementaciones piloto del Gobierno del Reino Unido Linked Data, pensé que

sería útil proporcionar una actualización en nombre del Gobierno del Reino

Unido Vinculado del Grupo de Trabajo de Datos - Equipo de inicio rápido, que

tuvo su primera reunión el lunes.

En primer lugar, un problema en el servidor interrumpe el acceso a los

depósitos de origen de varios de los conjuntos de datos de Linked Data y los

datos vinculados API páginas finales de fuente para los conjuntos de datos

como http://education.data.gov.uk y http://transport.data. gov.uk .

En segundo lugar, Talis Systems Ltd, que alojan varios de los data.gov.uk activos

Linked Data ha anunciado el inminente cierre de su servicio de hosting.

Se está trabajando para restablecer estos servicios. Estamos transfiriendo los

datos y el frente API asociada termina de utilizar un conjunto de software de

código abierto que se ejecutan en la infraestructura cloud de productos

básicos.

Page 11: Linked data

Conceptos del Tema:

RDF:

Es un modelo de datos para los recursos y las relaciones que se puedan establecer

entre ellos. Aporta una semántica básica para la este módulo de datos que puede

representarse mediante XML.

TRIPLE:

Es una relación entre el sujeto, propiedad y un objeto.

SPARQL:

Es un lenguaje de consulta sobre RDF, que permite hacer búsquedas sobre los recursos

de la web Semántica utilizando fuentes de datos.

URL:

Es un localizador de recursos uniforme (uniform resource locator), es una secuencia de

caracteres, de acuerdo a un formato modélico y estándar, que se usa para nombrar

recursos en Internet para su localización o identificación.

WEB SEMANTICA:

Es una Web extendida, dotada de mayor significado en la que cualquier usuario en

Internet podrá encontrar respuestas a sus preguntas de forma más rápida y sencilla

gracias a una información mejor definida