dimensión (instancia) dado un esquema s, una dimensión de tipo Ƭ ∈ d es una tupla d = (c d, ⊏...

Dimensión (instancia)Dado un esquema s, una dimensión de tipo Ƭ ∈ d es una tupla D = (CD,⊏)

donde:

CD = {Cj, j = 1,…,k}

es un conjunto de categorías (niveles)

Cada categoría Cj tiene un único tipo de categoría correspondiente Cj ,es decir,

se tiene una función Type(Cj) = CjSignatura Type: CD CƬ

• Una categoría (o nivel) Cj es un conjunto de valores de tipo Cj

• ⊏ es un orden parcial en ∪j Cj

(unión de los valores de todas las categorías)

• De ahora en adelante se escribirá Dim en vez de ∪j Cj

• Ej: Sea una dimensión LOCATION de tipo Ƭloc dada por Dloc = (Cloc, ⊏)

donde Cloc = {Coordinate, Roadway, District, City, Province, Country, IPAddres, Cell,⊤}

Donde, por ejemplo:

Type(Coordinate) = Ccoordinate,

Type(Roadway) = Croadway, etc.

• Dado un par de valores (ei, ej) ∈ Ci x Cj tal que Type(Ci) ⊏Ƭ Type(Cj ),

ei ⊏ ej significa que ei está totalmente incluido en ej

Ej: Si Ccity ⊏ Cprovince ,

Type(City) = Ccity ,

Type(Province) = Cprovince ,

(city12, province23) ∈ City x Province

entonces: city12 ⊏ province23

Ƭ loc

city12

province23

La definición anterior se generaliza así:

• Dado un par de valores (ei, ej) ∈ Ci x Cj tal que Type(Ci) ⊏ Type(Cj ),

ei ⊏d ej significa que ei está parcialmente incluido en ej

• d representa el grado de inclusión: d ∈ [0;1]– Si d = 1, la inclusión es total

– Si d = 0, indica que ei podría estar incluido en ej

(P)Ƭ

Algunas reglasSupóngase que Ci ⊏Ƭ Cj ⊏Ƭ Ck y que

Type(Ci) = Ci ,

Type(Cj) = Cj ,

Type(Ck) = Ck

entonces se cumple que

∀(ei, ej, ek) ∈ Ci x Cj x Ck :

Inclusión total

a) Transitividad f-to-f (full to full)

((ei ⊏1 ej) ∧ (ej ⊏1 ek) (ei ⊏1 ek))

Gráficamente:

ekeiej

Supóngase que Ci ⊏ Cj ⊏ Ck , entonces:

b) Transitividad p-to-f (partial to full)

∀d ∈ [0;1)

((ei ⊏d ej)∧(ej ⊏1 ek) (ei ⊏d ek))

Gráficamente:

(P)Ƭ

(P)Ƭ

ej

ek

ei

Nótese que si ej está contenido totalmente en ek y ei tiene unaparte en ej, entonces obligatoriamente ei tendrá una partecontenida en ek que como mínimo será d

d

c) Transitividad f-to-p (full to partial)

∀d ∈ [0;1)

((ei ⊏1 ej)∧(ej ⊏d ek) (ei ⊏0 ek))

Gráficamente:

ekei

Nótese que si ei está contenido totalmente en ej y ej tiene unaparte en ek, no necesariamente ei tendrá una partecontenida en ek (safe approach)

ej

d

d) Transitividad p-to-p (partial to partial)

∀ d1,d2 ∈ [0;1) x [0;1)

((ei ⊏d1 ej)∧(ej ⊏d2 ek) (ei ⊏0 ek))

Gráficamente:

ej ekei

Nótese que si ei está contenido parcialmente en ej y ej tiene unaparte en ek, entonces no se puede asegurar que ei tengauna parte contenida en ek (safe approach nuevamente)

d2d1

• Considérese el siguiente ejemplo donde se aplican las reglas de transitividad anteriores para deducir las relaciones entre otros niveles:

¡Imprecisión!

a) Tipo y b) dimensión (instancia) Ƭloc

a) b)

En la Figura b) las líneas punteadas indican los valores inferidos (no indican inclusión parcial)

Hechos• Para definir formalmente los hechos sea

ei ⊑1 ej ≡ (ei ⊏1 ej )∨(ei = ej )• Sea un conjunto de hechos F de tipo f y

sea una dimensión D = (CD, ⊏(P) ). • Una relación hecho-dimensión se define

como R ⊆ F x Dim

• Cada hecho debe estar relacionado con al menos un valor de cada dimensión

• Un hecho f ∈ F se dice que es caracterizado por un valor de dimensión ek: f ⇝ ek

Si ∃ei ∈ Dim ((f, ei) ∈ R ∧ ei ⊑1 ek))

• Esta definición se extiende para inclusión parcial así:

• Un hecho f ∈ F se dice que es 0-caracterizado por un valor de dimensión ek: f ⇝0 ek

Si ∃ei ∈ Dim (((f, ei) ∈ R) ∧ (ei ⊑d ek) ∧

(d < 1))

• Y es 1-caracterizado: f ⇝1 ek

Si ∃ei ∈ Dim (((f, ei) ∈ R) ∧ (ei ⊑1 ek))

Dpto Z

Camino 33

f8

d = 0.6

f8 ⇝0 País W

Dpto K

f4

d = 1

f4 ⇝1

Ejemplos de caracterización 0 y 1

(f8, Camino 33) ∈ R (f4, Dpto K) ∈ R

Relaciones entre hechosy los valores de una dimensión

A

B

C

E

D

Las letras rojas en mayúscula simbolizan hechos

A 0 City1⇝

D ⇝1 City1

Las flechas punteadas indican los valores inferidos

Algunas propiedades del modeloSea un objeto multidimensional (MO)

M= {s, F, DM, RM} donde:

- s = (f, d) donde:

f es un tipo de hechos

d = {Ƭi, i = 1, ..., n} es un conjunto de tipos

de dimensiones

- F es un conjunto de hechos de tipo f

- DM = {Di, i = 1, ..., n} es un conjunto de dimensiones cada una de tipoƬi

- RM es un conjunto de relaciones de hechos-dimensiones: RM = {Ri, i = 1, ..., n}

• Por ejemplo, si hay n dimensiones entonces RM se compone de n relaciones* donde se detalla como los hechos se relacionan con los valores de cada una de las n dimensiones

* Aunque la cardinalidad de RM podría ser mayor al número de dimensiones si hay un hecho que, por ejemplo, está asociado más de una vez con una misma dimensión.

Algunas propiedades

Dadas dos categorías Ci y Cj donde

Cj ∈ Anc(P) (Ci) se dice que la

transformación de Ci a Cj es de tipo onto si:

∀ej ∈ Cj (∃(ei,d) ∈ Ci x [0;1] (ei ⊏d ej ))Informalmente: todos los elementos del nivel superior (j) están relacionados con al menos un elemento del nivel inferior (i)Gráficamente:

País 1 País 2

Dpto z Dpto w Dpto k

País 3

Dpto a Dpto c

Dpto b

Dpto d

La transformación de Dpto a País es onto porque todo paísse compone de al menos un Dpto.

Otro ejemplo: Día a Mes es onto porque todo mes se componeal menos de un día

Sean las categorías Ci, Cj y Ck donde

Ci ⊏ Cj ⊏ Ck se dice que la transformación

de Cj a Ck es covering con respecto a Ci si:

∀(ei,d) ∈ Ci x [0;1] (∀ek∈ Ck ((ei ⊏d ek )

∃(ej,di,dj) ∈ Cj x [0;1] x [0;1] ((ei ⊏ ej) ∧

(ej ⊏ ek ))))

(P)Ƭ

(P)Ƭ

di

dj

Informalmente: para todo elemento del nivel

i (el más inferior) que esté relacionado con

un elemento del nivel k (el más superior de

los tres) deberá existir el “puente” a través

de algún elemento del nivel j.

Gráficamente:

Carretera 99

Coordenada 124

Distrito 876

Coordenada 843

Debido a que no todas lascoordenadas están relacionadascon alguna carretera y dado que algunas de ellas se relacionandirectamente con un distrito,la transformación de carretera a distrito con respecto a coordenadano es covering.

En la dimensión tiempo, en las categorías año, mes y día la transformación de mes a año es coveringcon respecto a día

Dadas dos categorías Ci y Cj donde

Cj ∈ Anc(P) (Ci) se dice que la

transformación de Ci a Cj es estricta si:

∀(ei,di1,di2) ∈ Ci x [0;1] x [0;1] (∀(ej1, ej2 ) ∈

Cj x Cj ((ei ⊏ ej1 ) ∧ (ei ⊏ ej2 )

((ej1 = ej2 ) ∧ (di1= di2 ))))

di1 di2

Informalmente: un elemento de un nivel

inferior solo puede tener un elemento

“padre” en un nivel superior específico.

Gráficamente:

11 Ago 1998

Agosto de 1998

14 Ago 1998 29 Oct 1997

Octubre de 1997

La transformación de Día a Mes es estricta(un día solo pertenece a un mes específico)

• Se dice que una jerarquía es de agregación estricta si es estricta (todas las transformaciones son estrictas) o si se cumple que: si Cj ∈ Anc(P) (Ci) y el mapeo de Ci a Cj es no estricto entonces

Anc(P) (Cj) = ∅; de lo contrario es de agregación no estricta

Gráficamente:

Carretera 99

Distrito 876

Coordenada 843

Carretera 89

Distrito 806

Como la transformación de Coordenada a Carretera esno estricta y como Anc(P) (Carretera) = {Distrito} ≠ entonces la jerarquía∅es de agregación no estricta.

La jerarquía Día, Mes y Año es de agregación estricta porquees estricta (todas sus transformaciones son estrictas).

• Se dice que una dimensión está normalizada si todas sus jerarquías son onto, covering y de agregación estricta.

• Una dimensión normalizada facilita y evita ambigüedades en la agregación de los hechos.

• Se proponen técnicas para normalizar una dimensión. Por ejemplo, si una jerarquía no es covering, se pueden introducir elementos artificiales (placeholders) para cubrir los “puentes” faltantes, si una jerarquía no es onto se pueden introducir hijos artificiales, etc.

• Se dice que un objeto multidimensional está normalizado si todas sus dimensiones están normalizadas y si:

∀Ri ∈ RM (((f,e) ∈ Ri) (e ∈ ⊥ ))

Es decir, todos los hechos se relacionan

solo con elementos pertenecientes al nivel

más inferior (⊥) de cada dimensión.

Di

dimensión (instancia) dado un esquema s, una dimensión de tipo Ƭ ∈ d es una tupla d = (c d, ⊏...

Documents