dimensión (instancia) dado un esquema s, una dimensión de tipo Ƭ ∈ d es una tupla d = (c d, ⊏...
TRANSCRIPT
Dimensión (instancia)Dado un esquema s, una dimensión de tipo Ƭ ∈ d es una tupla D = (CD,⊏)
donde:
CD = {Cj, j = 1,…,k}
es un conjunto de categorías (niveles)
Cada categoría Cj tiene un único tipo de categoría correspondiente Cj ,es decir,
se tiene una función Type(Cj) = CjSignatura Type: CD CƬ
• Una categoría (o nivel) Cj es un conjunto de valores de tipo Cj
• ⊏ es un orden parcial en ∪j Cj
(unión de los valores de todas las categorías)
• De ahora en adelante se escribirá Dim en vez de ∪j Cj
• Ej: Sea una dimensión LOCATION de tipo Ƭloc dada por Dloc = (Cloc, ⊏)
donde Cloc = {Coordinate, Roadway, District, City, Province, Country, IPAddres, Cell,⊤}
Donde, por ejemplo:
Type(Coordinate) = Ccoordinate,
Type(Roadway) = Croadway, etc.
• Dado un par de valores (ei, ej) ∈ Ci x Cj tal que Type(Ci) ⊏Ƭ Type(Cj ),
ei ⊏ ej significa que ei está totalmente incluido en ej
Ej: Si Ccity ⊏ Cprovince ,
Type(City) = Ccity ,
Type(Province) = Cprovince ,
(city12, province23) ∈ City x Province
entonces: city12 ⊏ province23
Ƭ loc
city12
province23
La definición anterior se generaliza así:
• Dado un par de valores (ei, ej) ∈ Ci x Cj tal que Type(Ci) ⊏ Type(Cj ),
ei ⊏d ej significa que ei está parcialmente incluido en ej
• d representa el grado de inclusión: d ∈ [0;1]– Si d = 1, la inclusión es total
– Si d = 0, indica que ei podría estar incluido en ej
(P)Ƭ
Algunas reglasSupóngase que Ci ⊏Ƭ Cj ⊏Ƭ Ck y que
Type(Ci) = Ci ,
Type(Cj) = Cj ,
Type(Ck) = Ck
entonces se cumple que
∀(ei, ej, ek) ∈ Ci x Cj x Ck :
Inclusión total
a) Transitividad f-to-f (full to full)
((ei ⊏1 ej) ∧ (ej ⊏1 ek) (ei ⊏1 ek))
Gráficamente:
ekeiej
Supóngase que Ci ⊏ Cj ⊏ Ck , entonces:
b) Transitividad p-to-f (partial to full)
∀d ∈ [0;1)
((ei ⊏d ej)∧(ej ⊏1 ek) (ei ⊏d ek))
Gráficamente:
(P)Ƭ
(P)Ƭ
ej
ek
ei
Nótese que si ej está contenido totalmente en ek y ei tiene unaparte en ej, entonces obligatoriamente ei tendrá una partecontenida en ek que como mínimo será d
d
c) Transitividad f-to-p (full to partial)
∀d ∈ [0;1)
((ei ⊏1 ej)∧(ej ⊏d ek) (ei ⊏0 ek))
Gráficamente:
ekei
Nótese que si ei está contenido totalmente en ej y ej tiene unaparte en ek, no necesariamente ei tendrá una partecontenida en ek (safe approach)
ej
d
d) Transitividad p-to-p (partial to partial)
∀ d1,d2 ∈ [0;1) x [0;1)
((ei ⊏d1 ej)∧(ej ⊏d2 ek) (ei ⊏0 ek))
Gráficamente:
ej ekei
Nótese que si ei está contenido parcialmente en ej y ej tiene unaparte en ek, entonces no se puede asegurar que ei tengauna parte contenida en ek (safe approach nuevamente)
d2d1
• Considérese el siguiente ejemplo donde se aplican las reglas de transitividad anteriores para deducir las relaciones entre otros niveles:
¡Imprecisión!
a) Tipo y b) dimensión (instancia) Ƭloc
a) b)
En la Figura b) las líneas punteadas indican los valores inferidos (no indican inclusión parcial)
Hechos• Para definir formalmente los hechos sea
ei ⊑1 ej ≡ (ei ⊏1 ej )∨(ei = ej )• Sea un conjunto de hechos F de tipo f y
sea una dimensión D = (CD, ⊏(P) ). • Una relación hecho-dimensión se define
como R ⊆ F x Dim
• Cada hecho debe estar relacionado con al menos un valor de cada dimensión
• Un hecho f ∈ F se dice que es caracterizado por un valor de dimensión ek: f ⇝ ek
Si ∃ei ∈ Dim ((f, ei) ∈ R ∧ ei ⊑1 ek))
• Esta definición se extiende para inclusión parcial así:
• Un hecho f ∈ F se dice que es 0-caracterizado por un valor de dimensión ek: f ⇝0 ek
Si ∃ei ∈ Dim (((f, ei) ∈ R) ∧ (ei ⊑d ek) ∧
(d < 1))
• Y es 1-caracterizado: f ⇝1 ek
Si ∃ei ∈ Dim (((f, ei) ∈ R) ∧ (ei ⊑1 ek))
Dpto Z
Camino 33
f8
d = 0.6
f8 ⇝0 País W
Dpto K
f4
d = 1
f4 ⇝1
Ejemplos de caracterización 0 y 1
(f8, Camino 33) ∈ R (f4, Dpto K) ∈ R
Relaciones entre hechosy los valores de una dimensión
A
B
C
E
D
Las letras rojas en mayúscula simbolizan hechos
A 0 City1⇝
D ⇝1 City1
Las flechas punteadas indican los valores inferidos
Algunas propiedades del modeloSea un objeto multidimensional (MO)
M= {s, F, DM, RM} donde:
- s = (f, d) donde:
f es un tipo de hechos
d = {Ƭi, i = 1, ..., n} es un conjunto de tipos
de dimensiones
- F es un conjunto de hechos de tipo f
- DM = {Di, i = 1, ..., n} es un conjunto de dimensiones cada una de tipoƬi
- RM es un conjunto de relaciones de hechos-dimensiones: RM = {Ri, i = 1, ..., n}
• Por ejemplo, si hay n dimensiones entonces RM se compone de n relaciones* donde se detalla como los hechos se relacionan con los valores de cada una de las n dimensiones
* Aunque la cardinalidad de RM podría ser mayor al número de dimensiones si hay un hecho que, por ejemplo, está asociado más de una vez con una misma dimensión.
Algunas propiedades
Dadas dos categorías Ci y Cj donde
Cj ∈ Anc(P) (Ci) se dice que la
transformación de Ci a Cj es de tipo onto si:
∀ej ∈ Cj (∃(ei,d) ∈ Ci x [0;1] (ei ⊏d ej ))Informalmente: todos los elementos del nivel superior (j) están relacionados con al menos un elemento del nivel inferior (i)Gráficamente:
País 1 País 2
Dpto z Dpto w Dpto k
País 3
Dpto a Dpto c
Dpto b
Dpto d
La transformación de Dpto a País es onto porque todo paísse compone de al menos un Dpto.
Otro ejemplo: Día a Mes es onto porque todo mes se componeal menos de un día
Sean las categorías Ci, Cj y Ck donde
Ci ⊏ Cj ⊏ Ck se dice que la transformación
de Cj a Ck es covering con respecto a Ci si:
∀(ei,d) ∈ Ci x [0;1] (∀ek∈ Ck ((ei ⊏d ek )
∃(ej,di,dj) ∈ Cj x [0;1] x [0;1] ((ei ⊏ ej) ∧
(ej ⊏ ek ))))
(P)Ƭ
(P)Ƭ
di
dj
Informalmente: para todo elemento del nivel
i (el más inferior) que esté relacionado con
un elemento del nivel k (el más superior de
los tres) deberá existir el “puente” a través
de algún elemento del nivel j.
Gráficamente:
Carretera 99
Coordenada 124
Distrito 876
Coordenada 843
Debido a que no todas lascoordenadas están relacionadascon alguna carretera y dado que algunas de ellas se relacionandirectamente con un distrito,la transformación de carretera a distrito con respecto a coordenadano es covering.
En la dimensión tiempo, en las categorías año, mes y día la transformación de mes a año es coveringcon respecto a día
Dadas dos categorías Ci y Cj donde
Cj ∈ Anc(P) (Ci) se dice que la
transformación de Ci a Cj es estricta si:
∀(ei,di1,di2) ∈ Ci x [0;1] x [0;1] (∀(ej1, ej2 ) ∈
Cj x Cj ((ei ⊏ ej1 ) ∧ (ei ⊏ ej2 )
((ej1 = ej2 ) ∧ (di1= di2 ))))
di1 di2
Informalmente: un elemento de un nivel
inferior solo puede tener un elemento
“padre” en un nivel superior específico.
Gráficamente:
11 Ago 1998
Agosto de 1998
14 Ago 1998 29 Oct 1997
Octubre de 1997
La transformación de Día a Mes es estricta(un día solo pertenece a un mes específico)
• Se dice que una jerarquía es de agregación estricta si es estricta (todas las transformaciones son estrictas) o si se cumple que: si Cj ∈ Anc(P) (Ci) y el mapeo de Ci a Cj es no estricto entonces
Anc(P) (Cj) = ∅; de lo contrario es de agregación no estricta
Gráficamente:
Carretera 99
Distrito 876
Coordenada 843
Carretera 89
Distrito 806
Como la transformación de Coordenada a Carretera esno estricta y como Anc(P) (Carretera) = {Distrito} ≠ entonces la jerarquía∅es de agregación no estricta.
La jerarquía Día, Mes y Año es de agregación estricta porquees estricta (todas sus transformaciones son estrictas).
• Se dice que una dimensión está normalizada si todas sus jerarquías son onto, covering y de agregación estricta.
• Una dimensión normalizada facilita y evita ambigüedades en la agregación de los hechos.
• Se proponen técnicas para normalizar una dimensión. Por ejemplo, si una jerarquía no es covering, se pueden introducir elementos artificiales (placeholders) para cubrir los “puentes” faltantes, si una jerarquía no es onto se pueden introducir hijos artificiales, etc.
• Se dice que un objeto multidimensional está normalizado si todas sus dimensiones están normalizadas y si:
∀Ri ∈ RM (((f,e) ∈ Ri) (e ∈ ⊥ ))
Es decir, todos los hechos se relacionan
solo con elementos pertenecientes al nivel
más inferior (⊥) de cada dimensión.
Di