la normal multidimensional y distribuciones...

21
Versi´on preliminar, 16 de octubre de 2018 Cap´ ıtulo 3 La normal multidimensional y distribuciones asociadas 3.1. Resumen ejecutivo de ´ algebra lineal ................ 2 3.2. La normal multidimensional ....................... 3 3.2.1. Polinomios cuadr´aticos y funciones de densidad ....... 3 3.2.2. La normal multidimensional ...................... 4 3.3. Distribuciones asociadas a la normal multidimensional 16 3.3.1. Ladistribuci´on χ 2 (n) (chi-cuadrado con n grados de liber- tad) ......................................... 16 3.3.2. Distribuci´on F n,m con n y m grados de libertad ....... 18 3.3.3. Distribuci´on t n de Student ....................... 20 3.3.4. Distribuci´on de Rayleigh ......................... 22 Los vectores normales (que siguen una distribuci´on normal multidimensional) desempe˜ nan un papel central en los modelos probabilistas en los que se apoya la modelizaci´ on matem´ atica de la inferencia estad´ ıstica que iremos desarrollando en cap´ ıtulos posteriores. En este cap´ ıtulo estudiamos diversas propiedades de estos vectores normales (apartado 3.2), as´ ı como algunas distribuciones de probabilidad (unidimensionales) asociadas y de utilidad como las distribuciones χ 2 (chi-cuadrado), las distribuciones t de Student y las distribuciones F de Fisher (apartado 3.3). El estudio de la normal multidimensional se apoya en ciertas cuestiones de ´ alge- bra lineal, en concreto de formas cuadr´ aticas, que recordamos telegr´aficamente en la primera secci´ on. El lector interesado en el detalle de las demostraciones puede consultar el cap´ ıtulo 8. 1

Upload: others

Post on 26-Mar-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: La normal multidimensional y distribuciones …verso.mat.uam.es/~pablo.fernandez/cap3-EstadI-oct18.pdfVersi´ onpreliminar,16deoctubrede2018 2 Cap´ıtulo 3. La normal multidimensional

Version

preliminar,16

deoctubre

de2018

Capıtulo 3

La normal multidimensional ydistribuciones asociadas

3.1. Resumen ejecutivo de algebra lineal . . . . . . . . . . . . . . . . 2

3.2. La normal multidimensional . . . . . . . . . . . . . . . . . . . . . . . 3

3.2.1. Polinomios cuadraticos y funciones de densidad . . . . . . . 3

3.2.2. La normal multidimensional . . . . . . . . . . . . . . . . . . . . . . 4

3.3. Distribuciones asociadas a la normal multidimensional 16

3.3.1. La distribucion χ2(n) (chi-cuadrado con n grados de liber-tad) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

3.3.2. Distribucion Fn,m con n y m grados de libertad . . . . . . . 18

3.3.3. Distribucion tn de Student . . . . . . . . . . . . . . . . . . . . . . . 20

3.3.4. Distribucion de Rayleigh . . . . . . . . . . . . . . . . . . . . . . . . . 22

Los vectores normales (que siguen una distribucion normal multidimensional)desempenan un papel central en los modelos probabilistas en los que se apoya lamodelizacion matematica de la inferencia estadıstica que iremos desarrollando encapıtulos posteriores.

En este capıtulo estudiamos diversas propiedades de estos vectores normales(apartado 3.2), ası como algunas distribuciones de probabilidad (unidimensionales)asociadas y de utilidad como las distribuciones χ2 (chi-cuadrado), las distribuciones tde Student y las distribuciones F de Fisher (apartado 3.3).

El estudio de la normal multidimensional se apoya en ciertas cuestiones de alge-bra lineal, en concreto de formas cuadraticas, que recordamos telegraficamente enla primera seccion. El lector interesado en el detalle de las demostraciones puedeconsultar el capıtulo 8.

1

Page 2: La normal multidimensional y distribuciones …verso.mat.uam.es/~pablo.fernandez/cap3-EstadI-oct18.pdfVersi´ onpreliminar,16deoctubrede2018 2 Cap´ıtulo 3. La normal multidimensional

Version

preliminar,16

deoctubre

de2018

2 Capıtulo 3. La normal multidimensional y distribuciones asociadas

3.1. Resumen ejecutivo de algebra lineal

A. De matrices simetricas y ortogonales

Una matriz A = (aij) (cuadrada, de dimensiones n × n) se dice simetrica sicoincide con su matriz traspuesta: AT = A. Es decir, si aij = aji para cada i �= j.

Se dice que una matriz O es ortogonal si OT = O−1. Las columnas (o las filas)de O son vectores perpendiculares (dos a dos) y de norma 1.

Toda matriz A simetrica se orto-diagonaliza. Es decir, la matriz A, de dimensionesn×n, tiene autovalores reales, en R

n hay una base ortonormal de autovectores de A,y A se puede escribir en la forma

A = ODOT ,

donde

O es una matriz ortogonal cuyas columnas son los autovectores de A,

D es matriz diagonal, cuya diagonal contiene los autovalores λ1, . . . , λn de A.

Vease el teorema 8.16, llamado espectral, y aledanos. Ademas (vease la proposi-cion 8.2), det(A) =

∏nj=1 λj .

B. De formas cuadraticas

Una matriz simetrica A se dice definida positiva si la forma cuadratica asociadaes definida positiva, es decir, si

xTAx > 0 , para todo x �= 0 .

Un par de caracterizaciones alternativas de ser definida positiva son las siguientes:

Una matriz simetrica A es definida positiva si y solo si sus autovalores son(estrictamente) positivos. Vease el teorema 8.27.

Una matriz simetrica A es definida positiva si y solo si admite una raız cuadradano singular: es decir, si A se factoriza en la forma

A = RTR

para una cierta matriz cuadrada R no singular. Consultese la proposicion 8.39.

Finalmente, un par de propiedades utiles:

Si la matriz A es simetrica y definida positiva, su inversa A−1 es asimismosimetrica y definida positiva: los autovalores de A−1 son los recıprocos de losde A. Vease la proposicion 8.30.

Si A es una matriz simetrica y definida positiva y si B es una matriz no singular,entonces

BTAB

es asimismo simetrica y definida positiva. Consultese el lema 8.25.

notas de estadıstica I – 16 de octubre de 2018 – jose l. fernandez y pablo fernandez

Page 3: La normal multidimensional y distribuciones …verso.mat.uam.es/~pablo.fernandez/cap3-EstadI-oct18.pdfVersi´ onpreliminar,16deoctubrede2018 2 Cap´ıtulo 3. La normal multidimensional

Version

preliminar,16

deoctubre

de2018

3.2. La normal multidimensional 3

3.2. La normal multidimensional

Comenzamos dando respuesta a la pregunta de cuando e−H(x1,...,xn), donde H esun polinomio cuadratico en las variables x1, . . . , xn, es una funcion de densidad. Estadiscusion nos llevara a la definicion de la normal multidimensional (seccion 3.2.2).

3.2.1. Polinomios cuadraticos y funciones de densidad

Todo polinomio H(x) en las variables x = (x1, . . . , xn) de grado 2 (polinomiocuadratico) se escribe en la forma

(3.1) H(x) = xTAx− 2xTb+ c , para todo x ∈ Rn ,

donde A es una matriz simetrica n × n, b es un vector (columna), b ∈ Rn, y c es

una constante, c ∈ R. Aquı, el factor −2 aparece por pura estetica.

Supongamos que det(A) �= 0. Entonces, tomando

m = A−1 b y d = c− bTA−1b,

podemos reescribir (3.1) como

(3.2) H(x) = (x−m)TA(x−m) + d , para todo x ∈ Rn .

Esta reescritura se conoce como completar cuadrados.

� Nota 3.2.1. En el caso n = 1, tenemos que H(x) = ax2 − 2bx + c. Si a �= 0, entonces tomamosm = b/a y d = c− b2/a para escribir

H(x) = a(x− b/a)2 + (c− b2/a),

que nos da la usual formula cuadratica para resolver la ecuacion de segundo grado.

Nos preguntamos ahora: dado un polinomio cuadratico H de la forma (3.1),

¿cuando es f(x) = e−H(x) una funcion de densidad en Rn?

La presencia de la exponencial nos garantiza que f ≥ 0 en todo Rn, ası que, para

que f sea funcion densidad, solo se requiere que∫Rn f(x) dx = 1.

Diagonalizamos y escribimos A = OTDO, donde O es ortogonal y D es diagonal.Recordemos que det(A) �= 0, de manera que A no tiene autovalores nulos.

Usando la representacion de la ecuacion (3.2), que |det(O)| = 1, y cambios devariable naturales, calculamos∫

Rn

f(x) dx =

∫Rn

e−H(x) dx = e−d

∫Rn

e−(x−m)TA(x−m) dx = e−d

∫Rn

e−xTAx dx

= e−d

∫Rn

e−(Ox)TD(Ox) dx = e−d

∫Rn

e−xTDx dx

= e−d

∫−∞

· · ·∫ ∞

−∞e−

∑nj=1 λjx

2j dx1 · · · dxn = e−d

n∏j=1

∫R

e−λjx2dx .

notas de estadıstica I – 16 de octubre de 2018 – jose l. fernandez y pablo fernandez

Page 4: La normal multidimensional y distribuciones …verso.mat.uam.es/~pablo.fernandez/cap3-EstadI-oct18.pdfVersi´ onpreliminar,16deoctubrede2018 2 Cap´ıtulo 3. La normal multidimensional

Version

preliminar,16

deoctubre

de2018

4 Capıtulo 3. La normal multidimensional y distribuciones asociadas

Si algun λj fuera negativo, la integral ya serıa infinita. Supongamos entonces queλ1, . . . , λn > 0. Es decir, que la matriz A es (simetrica y) definida positiva. Entonces,como∫

R

e−λx2dx

[√2λx=y]=

1√2λ

∫R

e−y2/2 dy =

√2π√2λ

=

√π

λ, para todo λ > 0 ,

se tiene que ∫Rn

f(x) dx = e−d πn/2√∏nj=1 λj

= e−d πn/2√det(A)

.

Ası que para que f(x) sea funcion de densidad, ha de ser de la forma

(3.3) f(x) =

√det(A)

πn/2e−(x−m)TA(x−m).

donde A es una matriz simetrica definida positiva.

� Nota 3.2.2. Si det(A) = 0, entonces e−H(x) nunca puede ser funcion de densidad. Veamos porque. Ahora, observese, no podemos completar cuadrados para eliminar el termino lineal. Ası queusamos (3.1) y argumentamos como sigue:∫

Rn

e−H(x) dx = e−c

∫Rn

e−xTAx+2xTb dx = e−c

∫Rn

e−xTOTDOx+2xTb dx

[y=Ox]= e−c

∫Rn

e−yTDy+2yTOTb dy[h:=OTb]

= e−c

∫Rn

e−yTDy+2yTh dy

= e−cn∏

j=1

∫R

e−λjy2j+2yjhj dyj .

Como algun λj es nulo, la integral en la correspondiente variable yj vale +∞, sea cual sea el valordel correspondiente hj .

3.2.2. La normal multidimensional

Dados

un vector m ∈ Rn;

y una matriz V de dimensiones n× n simetrica y definida positiva,

decimos que el vector (columna, aleatorio) X sigue una distribucion normal multi-dimensional (de dimension n) con parametros m y V , lo que denotaremos por

X ∼ N (m, V ),

si, para todo x ∈ Rn, su funcion de densidad viene dada por

(3.4) fX(x) =1

(2π)n/21√

det(V )e−

12 (x−m)T V −1 (x−m)

notas de estadıstica I – 16 de octubre de 2018 – jose l. fernandez y pablo fernandez

Page 5: La normal multidimensional y distribuciones …verso.mat.uam.es/~pablo.fernandez/cap3-EstadI-oct18.pdfVersi´ onpreliminar,16deoctubrede2018 2 Cap´ıtulo 3. La normal multidimensional

Versionpreliminar,

16deoctubrede2018

3.2. La normal multidimensional 5

En esta expresion, x es un vector columna. Notese que en el exponente aparece lamatriz V −1, y no la matriz V . El caso n = 1 nos da la habitual expresion (2.19) parala densidad de la normal unidimensional con m = μ ∈ R y V = σ2 > 0.

A los parametros m y V nos referiremos como

el vector de medias

y la matriz de covarianzas

de X. En el teorema 3.1 se justifica esta terminologıa.

� Nota 3.2.3. Observe, lector, que esta es la expresion general que se ha obtenido en la ecuacion (3.3)con A = 1

2V −1. Esta forma de escribir la funcion de densidad anticipa que es la matriz V = (2A)−1

la que directamente tiene ese papel de matriz de covarianzas (y que el vector m es un vector demedias).

En lo que sigue utilizaremos repetidamente la siguiente descomposicion. Como Ves simetrica y definida positiva, la podremos escribir como

V = UUT,

con U una cierta matriz no singular. Observese que det(V ) = det(U)2.

La matriz U no es una raız cuadrada de V , en la terminologıa del apartado 3.1.Pero como

V −1 = (U−1)TU−1,

resulta que U−1 es una raız cuadrada de V −1.

Con estas observaciones, podemos reescribir la densidad fX dada en (3.4) en laforma alternativa

(3.5) fX(x) =1

(2π)n/21

|det(U)| e−12 ‖U−1(x−m)‖2

� Nota 3.2.4. Re-comprobacion de que fX es funcion de densidad.

Por (3.3) ya sabemos que fX es funcion de densidad. Pero usemos (3.5) para recomprobarlo. Elcambio de variables x = m+ Uy nos da que∫

x∈Rn

fX(x) dx = |det(U)|∫y∈Rn

fX(m+ Uy)dy

= |det(U)| 1

(2π)n/2

1

|det(U)|∫y∈Rn

e−12‖y‖2dy =

( 1

(2π)1/2

∫ ∞

−∞e−

12y2

dy)n

= 1.

El siguiente resultado describe completamente al vector aleatorio X, sus margi-nales y la relacion entre ellas.

Teorema 3.1 Si X ∼ N (m, V ), entonces cada una de las variables Xj componentesde X es una variable normal. De hecho,

Xj ∼ N (mj , vjj) , 1 ≤ j ≤ n ,

notas de estadıstica I – 16 de octubre de 2018 – jose l. fernandez y pablo fernandez

Page 6: La normal multidimensional y distribuciones …verso.mat.uam.es/~pablo.fernandez/cap3-EstadI-oct18.pdfVersi´ onpreliminar,16deoctubrede2018 2 Cap´ıtulo 3. La normal multidimensional

Versionpreliminar,

16deoctubre

de2018

6 Capıtulo 3. La normal multidimensional y distribuciones asociadas

y ademas

cov(Xi,Xj) = vij , para 1 ≤ i �= j ≤ n .

En otras palabras, las marginales de X son variables normales, y ademas se tieneque E(X) = m y cov(X) = V , como anticipabamos al comienzo de esta seccion. Lademostracion del teorema 3.1 aparece mas adelante.

Antes, en los apartados A y B siguientes, obtenemos varias propiedades utiles deun vector aleatorio X ∼ N (m, V ). Observese primero que

X ∼ N (m, V ) si y solo si X−m ∼ N (0, V ),

como se comprueba con un simple cambio de variables.

A. Normal multidimensional estandar

Si Y ∼ N (0, I) (donde I denota la matriz identidad) se dice que Y sigue unanormal (multidimensional) estandar.

Este caso particular es muy especial (por sus propiedades y su relevancia).

Proposicion 3.2 El vector aleatorio Y ∼ N (0, I) si y solo si las componentes Yj

de Y son variables normales estandar (unidimensionales) e independientes.

Hacemos notar que el teorema 3.1 nos darıa para este caso que las componentes Yj

son normales, y que E(Y) = 0 y Cov(Y) = I. Pero aquı, atencion, las componentesson ademas independientes.

Demostracion. Si Y ∼ N (0, I), entonces

(3.6) fY(y) =1

(2π)n/2e−

12y

T·y =1

(2π)n/2e−

12∑n

j=1 y2j =

n∏j=1

( 1√2π

e−12 y

2j

).

Ası que la funcion de densidad conjunta se factoriza (lo que nos da la independencia,por la observacion (2.7)) en un producto de funciones de densidad, cada una de lascuales es la de una normal (unidimensional) estandar (lo que nos da las marginales).

La prueba de la implicacion en el otro sentido consiste en recorrer la formula (3.6)de derecha a izquierda. �

Si las componentes de un vector Y cualquiera son independientes, entonces sontambien incorreladas. Esto ocurre siempre. En el caso en el que Y ∼ N (0, I), valetambien el recıproco: el que las componentes sean incorreladas implica tambien queson independientes. Asombroso.

� Nota 3.2.5. Una version mas general de la proposicion 3.2 reza ası: Y ∼ N (m, D), donde D es unamatriz diagonal con entradas d1, . . . , dn positivas en la diagonal, si y solo si las componentes Yj de Yson normales N (mi, di) independientes. La demostracion es analoga a la de la proposicion 3.2.

notas de estadıstica I – 16 de octubre de 2018 – jose l. fernandez y pablo fernandez

Page 7: La normal multidimensional y distribuciones …verso.mat.uam.es/~pablo.fernandez/cap3-EstadI-oct18.pdfVersi´ onpreliminar,16deoctubrede2018 2 Cap´ıtulo 3. La normal multidimensional

Version

preliminar,16

deoctubre

de2018

3.2. La normal multidimensional 7

� Nota 3.2.6. Por insistir sobre el tema: si las componentes de Y = (Y1, . . . , Yn)T son normales

(estandar) independientes, entonces Y ∼ N (0, I).

Sin embargo, puede ocurrir que X = (X1, . . . , Xn)T cumpla que E(X) = m, que cov(X) = V , y

que las Xj sean normales, y que a pesar de eso el vector X no siga una normal multidimensional deparametros m y V . Esto es, el recıproco del teorema 3.1 no es cierto en general.

Si por ejemplo X es una variable normal, el vector (X,−X) (cuyas componentes son normales)no es un vector aleatorio normal. Otro ejemplo: sea X una variable normal estandar y sea a > 0.Definimos Y (en el mismo espacio que X) como Y = X donde |X| > a y como Y = −X donde|x| ≤ a. La variable Y es normal estandar, pero (X,Y ) no sigue distribucion normal.

B. Tipificacion

Proposicion 3.3 Sea V una matriz simetrica y definida positiva. Escribimos V =UUT (esto es, U−1 es raız cuadrada de V −1).

Se tiene queX ∼ N (m, V ) ⇐⇒ X = m+ UY,

donde Y es una normal estandar, Y ∼ N (0, I).

� Nota 3.2.7. En el caso n = 1, tenemos que si X ∼ N (μ, σ2), entonces X = μ+σY , con Y ∼ N (0, 1),como ya sabıamos.

Usaremos constantemente la parte de “representacion” del teorema anterior: todovector X ∼ N (m, V ) se puede escribir como m+UY, con Y ∼ N (0, I). La “tipifica-cion” de X consistirıa en la transformacion inversa, en escribir Y = U−1(X−m).

Demostracion. Sea X ∼ N (m, V ), y llamemos Y = U−1(X−m). Consideremos latransformacion lineal de R

n en Rn dada por

y → x = m+ U y .

EntoncesfX(x)|det(U)| = fY(y).

Por la ecuacion (3.5) de fX tenemos que

fY(y) =1

(2π)n/21

|det(U)| |det(U)| e−‖y‖2/2 =1

(2π)n/2e−‖y‖2/2 ,

es decir, que Y ∼ N (0, I).

Invirtiendo los pasos del argumento anterior, se deduce que si X = m+U Y, conY ∼ N (0, I), entonces X ∼ N (m, V ). �

C. Demostracion del teorema 3.1

Usaremos en esta demostracion la proposicion 3.3 y el hecho de que cualquiercombinacion lineal de variables normales independientes es una variable normal (pro-posicion 2.11).

notas de estadıstica I – 16 de octubre de 2018 – jose l. fernandez y pablo fernandez

Page 8: La normal multidimensional y distribuciones …verso.mat.uam.es/~pablo.fernandez/cap3-EstadI-oct18.pdfVersi´ onpreliminar,16deoctubrede2018 2 Cap´ıtulo 3. La normal multidimensional

Version

preliminar,16

deoctubre

de2018

8 Capıtulo 3. La normal multidimensional y distribuciones asociadas

Sea X ∼ N (m, V ). Probamos primero que las componentes son variables norma-les. Escribimos, siguiendo la proposicion 3.3,

X = m+ UY,

donde V = UUT e Y ∼ N (0, I).

Leyendo esta relacion componente a componente, tenemos que, para 1 ≤ j ≤ n,

(�) Xj = mj +

n∑k=1

ujk Yk ,

lo que nos da, usando la proposicion 2.11 (pues las Yk son normales independientes),que cada Xj es normal.

Queda determinar los parametros de esas normales, y las covarianzas entre ellas.

Observese que, como UUT = V , se tiene que

n∑k=1

u2jk = vjj , para 1 ≤ j ≤ n , yn∑

k=1

uik ujk = vij , para 1 ≤ i �= j ≤ n ,

donde las entradas de V se escriben como vij , y las de U como uij .

De (�) se deduce inmediatamente que

E(Xj) = mj y V(Xj) =

n∑k=1

u2jk = vjj ,

pues cada Yk ∼ N (0, 1). En cuanto a las covarianzas, tenemos que, para 1 ≤ i �= j ≤ n,

cov(Xi,Xj) = E((Xi −mi)(Xj −mj)

)= E

[( n∑k=1

uik Yk

)( n∑�=1

uj� Y�

)]= E

[ n∑k=1

n∑�=1

uik uj� YkY�

]=

n∑k=1

n∑�=1

uik uj�E(YkY�) =

n∑k=1

uik ujk = vij ,

puesto que E(YkY�) = 0 salvo cuando k = �; en este caso, E(Y 2k ) = 1 (recuerdese

que las variables Yj son normales estandar independientes).

Esta segunda parte de la demostracion, en terminos matriciales (y en un par delıneas), se escribe como sigue: primero,

E(X) = E(m+ UY) = m+ UE(Y) = m.

Para las varianzas y covarianzas, usando la expresion (2.11), tenemos por un ladoque

I = Cov(Y) = E(Y · YT),

y por otro,

Cov(X) = E((X −m) · (X−m)T) = E((UY) · (UY)T) = E(UY · YTUT)

= U E(Y · YT)UT = UUT = V.

¡Voila!

notas de estadıstica I – 16 de octubre de 2018 – jose l. fernandez y pablo fernandez

Page 9: La normal multidimensional y distribuciones …verso.mat.uam.es/~pablo.fernandez/cap3-EstadI-oct18.pdfVersi´ onpreliminar,16deoctubrede2018 2 Cap´ıtulo 3. La normal multidimensional

Version

preliminar,16

deoctubre

de2018

3.2. La normal multidimensional 9

D. Propiedades adicionales

Siguen ahora unos cuantos corolarios de los resultados anteriores, que registramospara su uso posterior.

Lema 3.4 (Cambio de escala y traslacion) Sea X un vector normal aleatorioX ∼ N (m, V ), sea B una matriz n× n no singular y sea h ∈ R

n.

Entonces, el vector aleatorio Z dado por

Z = h+BX .

sigue una N (h+Bm, BV BT).

Demostracion. Basta escribir, usando la proposicion 3.3, y con Y ∼ N (0, I), que

Z = h+BX = h+B(m+ UY) = h+Bm+ (BU)Y.

La prueba termina usando la parte recıproca de la misma proposicion 3.3, puesBU(BU)T = BUUTBT = BVBT. �

Lema 3.5 (Rotacion) Si Y es una variable normal (multidimensional) estandar ysi O es una matriz ortogonal, entonces Z = OY es, asimismo, normal (multidimen-sional) estandar.

Demostracion. Se sigue del lema 3.4 y de que OOT = I. �

Proposicion 3.6 Si X ∼ N (m, V ) y si a = (a1, a2, . . . , an)T ∈ R

n es un vector nonulo, entonces

aTX = a1X1 + a2X2 + · · ·+ anXn

es una variable normal (unidimensional), que viene especificada por su esperanza

E( n∑

j=1

ajXj

)=

n∑j=1

aj mj = aTm ,

y su varianza

V( n∑

j=1

ajXj

)=

n∑j=1

a2j vjj +∑

1≤i �=j≤n

aiaj vij = aTV a .

Notese que V(∑n

j=1 ajXj) = aTV a > 0, pues V es definida positiva y a �= 0.

Demostracion. EscribiendoX = m+ UY ,

tenemos que(�) aT

X = aTm+(aTU

)Y .

notas de estadıstica I – 16 de octubre de 2018 – jose l. fernandez y pablo fernandez

Page 10: La normal multidimensional y distribuciones …verso.mat.uam.es/~pablo.fernandez/cap3-EstadI-oct18.pdfVersi´ onpreliminar,16deoctubrede2018 2 Cap´ıtulo 3. La normal multidimensional

Version

preliminar,16

deoctubre

de2018

10 Capıtulo 3. La normal multidimensional y distribuciones asociadas

En virtud de la proposicion 2.11, se tiene que(aTU

)Y es una variable normal. Por

tanto, por (�) se tiene que aTX es una variable normal. Como E(Y) = 0, es claro que

E(aTX) = aTm .

Por otro lado,

V( n∑

j=1

ajXj

)=

n∑j=1

a2j V(Xj) +∑

1≤i �=j≤n

aiaj cov(Xi,Xj) =n∑

j=1

a2j Vjj +∑

1≤i �=j≤n

aiaj Vij .

� Nota 3.2.8. ¡Atencion! No es cierto que las combinaciones lineales de variables normales (definidasen un mismo espacio de probabilidad, por supuesto) hayan de ser normales. Por ejemplo, si Xes variable normal estandar e Y = −X, entonces Y tambien es normal estandar, pero la sumaX + Y ≡ 0 no es una variable normal.

Corolario 3.7 Si Y ∼ N (0, I) y si a = (a1, . . . , an)T ∈ R

n es un vector no nulo,entonces la combinacion lineal

aTY = a1Y1 + · · ·+ anYn

es una variable normal (unidimensional), que viene especificada por los valores desu esperanza y su varianza:

E( n∑

j=1

ajYj

)= 0 y V

( n∑j=1

ajYj

)=

n∑j=1

a2j .

Esta es de nuevo, la proposicion 2.11 que, ¡atencion!, ya hemos usado en la de-mostracion del teorema 3.1.

E. La normal bidimensional

La normal bidimensional aparece con particular frecuencia. Pongamos que (X,Y )es normal bidimensional, y que X e Y (que son variables normales) estan tipificadas:E(X) = E(Y ) = 0 y V(X) = V(Y ) = 1.

Recordemos que la distribucion de (X,Y ) esta determinada por su vector demedias, que en este caso es m = 0, y su matriz V , que en este caso tiene unos en ladiagonal:

V =

(1 ρρ 1

)El registro ρ es la covarianza de X e Y , que en este caso (tipificado) es tambien elcoeficiente de correlacion de X e Y dado por ρ = E(XY ) . Observese que ρ ∈ (−1, 1).

El determinante de V es det(V ) = 1− ρ2. La matrix V −1 es

V −1 =1

1− ρ2

(1 −ρ−ρ 1

)notas de estadıstica I – 16 de octubre de 2018 – jose l. fernandez y pablo fernandez

Page 11: La normal multidimensional y distribuciones …verso.mat.uam.es/~pablo.fernandez/cap3-EstadI-oct18.pdfVersi´ onpreliminar,16deoctubrede2018 2 Cap´ıtulo 3. La normal multidimensional

Version

preliminar,16

deoctubre

de2018

3.2. La normal multidimensional 11

Como (x y

)V −1

(xy

)=

1

1− ρ2(x2 + y2 − 2ρxy) ,

la funcion de densidad f(X,Y ) de (X,Y ) viene dada por

(3.7) f(X,Y )(x, y) =1

2π√

1− ρ2exp

(− 1

2

x2 + y2 − 2ρxy

1− ρ2

).

Las figuras que siguen muestran el aspecto de esta funcion de densidad para tresvalores de ρ:

ρ = −60% ρ = 0% ρ = 60%

� Nota 3.2.9. Observese que si (U,V ) son variables normales estandar independientes y ρ ∈ (−1, 1),entonces

X = U e Y = ρU +√

1− ρ2 V

conforman un vector aleatorio (X,Y ) de normales estandar y con correlacion ρ. Alternativamente,si escribimos ρ = cos(2θ) para un cierto angulo θ ∈ (0, π), entonces las variables

X = cos(θ)U + sen(θ)V e Y = cos(θ)U − sen(θ)V

dan un vector aleatorio (X,Y ) de normales estandar y con correlacion ρ.

En el caso general, no tipificado, la funcion de densidad de la normal bidimen-sional es

f(X,Y )(x, y)

=1

2π σ1σ2√

1− ρ2exp

(− 1

2(1−ρ2)

[ (x−μ1)2

σ21

+ (y−μ2)2

σ22

− 2ρ (x−μ1)(y−μ2)σ1 σ2

]).(3.8)

Ahora, X ∼ N (μ1, σ21), Y ∼ N (μ2, σ

22), y las variables X e Y tienen correlacion ρ.

En la terminologıa general de (3.4),

m =

(μ1

μ2

)y V =

(σ21 ρ σ1σ2

ρ σ1σ2 σ22

).

notas de estadıstica I – 16 de octubre de 2018 – jose l. fernandez y pablo fernandez

Page 12: La normal multidimensional y distribuciones …verso.mat.uam.es/~pablo.fernandez/cap3-EstadI-oct18.pdfVersi´ onpreliminar,16deoctubrede2018 2 Cap´ıtulo 3. La normal multidimensional

Version

preliminar,16

deoctubre

de2018

12 Capıtulo 3. La normal multidimensional y distribuciones asociadas

F. Proyeccion de normal (multidimensional)

Supongamos que X ∼ N (m, V ) es normal multidimensional de dimension n. Yahemos visto que cada una de las coordenadas Xj de X es una variable normal. Vamosa comprobar ahora que cualquier proyeccion de X sobre un subespacio de dimensioninferior (no solo de dimension 1) es asimismo una variable normal multidimensional.

Para 1 ≤ k ≤ n, seleccionamos un (sub)conjunto de k ındices J = {j1, j2, . . . , jk},con 1 ≤ j1 < j2 < · · · < jk ≤ n. Consideramos el vector mJ = (mj1 , . . . ,mjk) (quese obtiene al seleccionar en m las coordenadas mj con j ∈ J) y la matriz VJ , dedimensiones k×k, que se obtiene de V quedandonos unicamente con filas y columnasetiquetadas con ındices de J .

El objeto de interes es el vector XJ = (Xj1 ,Xj2 , . . . ,Xjk)T de dimension k.

Proposicion 3.8 Con las notaciones anteriores, y para cualquier subconjunto deındices J de tamano k, si X ∼ N (m, V ), entonces XJ ∼ N (mJ , VJ).

El caso k = 1 es el de una unica coordenada, que ya ha sido probado (teore-ma 3.1). El caso k = n es la propia X; aquı no hay nada que probar.

Demostracion. La comprobacion de que el vector de medias de XJ es mJ y quela matriz de covarianzas de las variables que conforman XJ es VJ es inmediata:son, simplemente, las varianzas y covarianzas que tenıan como parte del vector X

original. Lo que resta, pues, es comprobar que XJ es una normal multidimensionalde dimension k.

Sin perdida de generalidad1, para esta verificacion podemos suponer y suponemosque m = 0, que k = n− 1 y que jk = n− 1. Es decir, suponemos que X ∼ N (0, V )y queremos ver que (X1,X2, . . . ,Xn−1)

T es normal. Conviene observar que si V = I,es decir si X es normal estandar, el resultado es inmediato.

Escribamos X = U Y, donde U es no singular (y UUT = V ), y donde Y ∼ N (0, I).

Por la proposicion 3.6, cualquier combinacion lineal

a1X1 + · · ·+ an−1Xn−1

(en la que no todos los coeficientes sean nulos) es una variable normal. Esto nos dice,en particular, que las variables X1,X2, . . . ,Xn−1 son linealmente independientes2.

Sean Z1, Z2, . . . , Zn−1 obtenidas de X1,X2, . . . ,Xn−1 mediante ortonormaliza-cion de Gram-Schmidt: es decir, con el mismo argumento que en Gram-Schmidtlogramos que

1Es decir, si comprobamos este caso, tenemos el caso general. Es evidente que podemos suponerque el vector de medias es nulo. Y si comprobamos que la proyeccion sobre una dimension menoses una normal, bastara iterar el argumento para proyecciones en menos dimensiones. Por ultimo,escoger la ultima coordenada para proyectar obedece, simplemente, a razones de estetica tipografica.

2La independencia lineal de variables aleatorias se define de manera analoga a la del algebralineal: la unica combinacion lineal de las variables que la variable aleatoria nula es la que tiene todoslos coeficientes 0.

notas de estadıstica I – 16 de octubre de 2018 – jose l. fernandez y pablo fernandez

Page 13: La normal multidimensional y distribuciones …verso.mat.uam.es/~pablo.fernandez/cap3-EstadI-oct18.pdfVersi´ onpreliminar,16deoctubrede2018 2 Cap´ıtulo 3. La normal multidimensional

Versionpreliminar,

16deoctubrede2018

3.2. La normal multidimensional 13

cada Zj sea combinacion lineal de X1,X2, . . . ,Xj ;

para cada 1 ≤ j ≤ n− 1 se tenga que E(Zj) = 0 y que E(Z2j ) = V(Zj) = 1;

si 1 ≤ i < j ≤ n− 1, entonces E(Zi Zj) = 0.

Notese que como cada Zi es combinacion lineal de Y1, Y2, . . . , Yn, y como estasson variables independientes, del corolario 3.7 se deduce que cada Zj es una variablenormal. Escribamos matricialmente esas combinaciones lineales:⎛⎜⎝ Z1

...Zn−1

⎞⎟⎠ = M

⎛⎜⎝Y1...Yn

⎞⎟⎠para cierta matriz M de dimensiones (n− 1)×n, cuyas filas son ortonormales, puespor construccion E(ZiZj) = δij , para 1 ≤ i, j ≤ n − 1. (La notacion δij es la deltade Kronecker: δij vale 1 si i = j y 0 en el resto de los casos).

Anadimos a M una ultima fila (de norma 1 y perpendicular a las anteriores) para

formar una matriz ortogonal M . Obtenemos⎛⎜⎜⎜⎝Z1...

Zn−1

Zn

⎞⎟⎟⎟⎠ = M

⎛⎜⎝Y1...Yn

⎞⎟⎠ ,

donde surge una variable aleatoria adicional Zn. Por el lema 3.5, como M es una ma-triz ortogonal, el vector (Z1, . . . , Zn)

T es un vector normal multidimensional estandar,es decir, las Zj son normales (unidimensionales) estandar independientes.

Y, por consiguiente, y esto es clave, (Z1, Z2, . . . , Zn−1)T ∼ N (0, In−1).

Sea A la matriz (n−1)× (n−1) que nos da la ortonormalizacion Gram-Schmidt:

A

⎛⎜⎝ X1...

Xn−1

⎞⎟⎠ =

⎛⎜⎝ Z1...

Zn−1

⎞⎟⎠ .

La matriz A es triangular inferior y, sobre todo, no singular, porque los Zj sonlinealmente independientes.

Por consiguiente,

A−1

⎛⎜⎝ Z1...

Zn−1

⎞⎟⎠ =

⎛⎜⎝ X1...

Xn−1

⎞⎟⎠ ,

y por el lema 3.4, por ejemplo, obtenemos, como conclusion, que (X1, . . . ,Xn−1)T es

un vector normal. �

Como complemento, registramos el siguiente:

notas de estadıstica I – 16 de octubre de 2018 – jose l. fernandez y pablo fernandez

Page 14: La normal multidimensional y distribuciones …verso.mat.uam.es/~pablo.fernandez/cap3-EstadI-oct18.pdfVersi´ onpreliminar,16deoctubrede2018 2 Cap´ıtulo 3. La normal multidimensional

Version

preliminar,16

deoctubre

de2018

14 Capıtulo 3. La normal multidimensional y distribuciones asociadas

Corolario 3.9 Supongamos que el vector aleatorio X sigue una normal multidimen-sional de dimension n, con parametros X ∼ N (m, V ). Sea 1 ≤ k ≤ n, y consideremosuna matriz A de dimensiones k × n y de rango maximo. Definimos el vector Z (dedimension k) como Z = AX. Entonces, Z = N (Am, AV AT).

Observese que el caso k = 1 de este resultado es la proposicion 3.6, que analizacombinaciones lineales de las componentes de X, y que el caso k = n es el lema 3.4sobre transformaciones lineales de vectores normales.

Ademas, la proposicion 3.8 es tambien un caso particular, en el que la matriz A essimplemente la que representa la proyeccion sobre las coordenadas correspondientesal conjunto de k ındices prefijado.

Demostracion. La comprobacion de los parametros es directa:

E(Z) = E(AX) = AE(X) = Am,

Cov(Z) = E[(Z−Am) · (Z−Am)T

]= E

[(A(X−m) · (A(X −m))T

]= AE

[((X−m) · (X −m)T

]AT = ACov(X)AT = AV AT.

Queda, pues, verificar que Z es un vector normal de dimension k. Veamos. Tomamosla matriz A y la ampliamos, anadiendo n − k filas al final de la misma, de maneraque la matriz ampliada, que llamaremos A, sea invertible (usamos aquı que A es derango maximo). Tenemos entonces que

Z = AX,

donde Z es un vector aleatorio de dimension n cuyas primeras k componentes coin-ciden con las de Z. Por el lema 3.4, sabemos que Z es un vector normal, pues X loes, y A es invertible. Pero ahora Z se obtiene a partir de Z por una proyeccion (eneste caso, sobre las primeras k coordenadas). Usando la proposicion 3.8, concluimosque Z es un vector normal. �

Ejemplo 3.2.1. Sean Y,X1,X2, . . . ,Xn variables normales estandar independien-tes. Para ρ ∈ (0, 1), definimos el vector aleatorio Z = (Z1, . . . , Zn)

T mediante

(�) Zj =√ρ Y +

√1− ρXj

para cada j = 1, . . . , n.

El vector Z = (Z1, . . . , Zn)T se puede escribir como

⎛⎜⎜⎜⎝Z1

Z2...Zn

⎞⎟⎟⎟⎠ =

⎛⎜⎜⎜⎝√ρ

√1− ρ 0 0 · · · 0√

ρ 0√1− ρ 0 · · · 0

......

.... . .

. . ....√

ρ 0 0 0 · · · √1− ρ

⎞⎟⎟⎟⎠⎛⎜⎜⎜⎜⎜⎝

YX1

X2...Zn

⎞⎟⎟⎟⎟⎟⎠ ,

donde la matriz, a la que llamaremos A, es de dimensiones n× (n+ 1).

notas de estadıstica I – 16 de octubre de 2018 – jose l. fernandez y pablo fernandez

Page 15: La normal multidimensional y distribuciones …verso.mat.uam.es/~pablo.fernandez/cap3-EstadI-oct18.pdfVersi´ onpreliminar,16deoctubrede2018 2 Cap´ıtulo 3. La normal multidimensional

Version

preliminar,16

deoctubre

de2018

3.2. La normal multidimensional 15

Aplicando el corolario 3.9, con X = (Y,X1,X2, . . . ,Xn) ∼ N (0, In+1), se deduceque el vector Z sigue una normal N (A0, AIAT) = N (0, V ), donde la matriz V tieneentradas

vij =

{1, si i = j,

ρ, si i �= j.

Para comprobar este hecho podemos calcular el producto matricial AAT, o alter-nativamente, calcular las medias, varianzas y covarianzas “a mano”, usando (�), laindependencia de las variables Y,X1, . . . ,Xn, y el que son normales estandar. Porun lado,

E(Zj) = E(√ρ Y +

√1− ρXj) =

√ρE(Y ) +

√1− ρE(Xj) = 0,

V(Zj) = V(√ρ Y +

√1− ρXj) = ρV(Y ) + (1− ρ)V(Xj) = ρ+ (1− ρ) = 1,

mientras que

E(ZiZj) = E((√ρ Y +

√1− ρXi)(

√ρ Y +

√1− ρXj)

)= ρE(Y 2) +

√ρ(1−ρ)E(Y )E(Xi) + +

√ρ(1−ρ)E(Y )E(Xj) + (1−ρ)E(Xi)E(Xj)

= ρ

Lo interesante de la transformacion descrita en (�) es que las variables Z1, . . . , Zn

resultantes son normales estandar, conjuntamente son una normal multidimensional,y ademas la correlacion entre cualesquiera dos de ellas es fija e igual ρ (un valorpositivo). ♣

� Nota 3.2.10. Resumimos en esta nota los resultados obtenidos hasta aquı sobre combinacioneslineales de variables normales (que conjuntamente son una normal multidimensional), junto conalgun caso adicional que no se ha contemplado. Partimos de un vector X = (X1, . . . , Xn)

T quesigue una normal n-dimensional con parametros X ∼ N (m, V ). Consideramos una matriz A dedimensiones k × n y definimos el vector Z (de dimensiones k × 1) como Z = AX.

En esta situacion se tiene que el vector de medias de Z es E(Z) = Am y la matriz de va-rianzas/covarianzas es Cov(Z) = AV AT. Ademas, salvo en el caso en el que alguna fila de A seanula, tenemos que todas las coordenadas Zj son variables aleatorias normales. Todo esto esta en laproposicion 3.6.

En cuanto a la posible normalidad del vector Z, hemos visto (corolario 3.9) que si 1 ≤ k ≤ n ysi A es de rango maximo (k, en este caso), entonces Z es un vector normal.

Quedan dos casos por analizar: cuando 1 ≤ k ≤ n y A no es de rango maximo, y cuando k > n.Observese que, en ambas situaciones, el rango de A es menor que k. En cualquiera de estos casos,Z nunca es un vector normal.

La razon es que, como el rango de A es menor que k, existe una combinacion lineal (concoeficientes no todos nulos) de las variables Z1, . . . , Zk que es igual a 0. La proposicion 3.6 impideentonces que Z = (Z1, . . . , Zk)

T sea un vector normal.

notas de estadıstica I – 16 de octubre de 2018 – jose l. fernandez y pablo fernandez

Page 16: La normal multidimensional y distribuciones …verso.mat.uam.es/~pablo.fernandez/cap3-EstadI-oct18.pdfVersi´ onpreliminar,16deoctubrede2018 2 Cap´ıtulo 3. La normal multidimensional

Version

preliminar,16

deoctubre

de2018

16 Capıtulo 3. La normal multidimensional y distribuciones asociadas

3.3. Distribuciones asociadas a la normal multidimen-sional

Describimos ahora unas cuantas familias de distribuciones de probabilidad (uni-dimensionales) asociadas a la normal multidimensional (o a colecciones de normalesindependientes), que usaremos a menudo en los capıtulos venideros.

3.3.1. La distribucion χ2(n) (chi-cuadrado con n grados de libertad)

Decimos que Z es una variable χ2 con n grados de libertad si

Z = X21 + · · ·+X2

n ,

donde X1, . . . ,Xn son variables normales estandar independientes. Escribiremos queZ ∼ χ2

n. El sımbolo χ2 se lee ��chi cuadrado�� o ��ji cuadrado��.

Observese que la variable Z toma valores en [0,+∞).

A. Media y varianza

Media:

(3.9) E(Z) = n

Basta observar que E(X2j ) = 1, para cada Xj .

Varianza:

(3.10) V(Z) = 2n

Veamos. Si X es una normal estandar, resulta que E(X4) = 3 (nota 2.3.4), ypor tanto V(X2) = E(X4)−E(X2)2 = 3− 1 = 2. Ahora argumentamos:

• Como Z es una suma de variables independientes, se tiene que

V(Z) =

n∑j=1

V(X2j ) = nV(X2) = 2n.

• Alternativamente, desarrollando el cuadrado,

E(Z2) = E(( n∑

j=1

X2j

)2)= E

( n∑j=1

X4j +

∑i �=j

X2i X

2j

)= nE(X4) + n(n− 1)E(X2)2 = 3n + n(n− 1) = n(n+ 2) ,

y, por tanto, V(Z) = E(Z2)−E(Z)2 = n(n+ 2) − n2 = 2n.

En realidad ya obtuvimos estos dos momentos en la seccion 2.3.4, aprovechandolos calculos generales para las distribuciones Gamma; vease el apartado siguiente.

notas de estadıstica I – 16 de octubre de 2018 – jose l. fernandez y pablo fernandez

Page 17: La normal multidimensional y distribuciones …verso.mat.uam.es/~pablo.fernandez/cap3-EstadI-oct18.pdfVersi´ onpreliminar,16deoctubrede2018 2 Cap´ıtulo 3. La normal multidimensional

Version

preliminar,16

deoctubre

de2018

3.3. Distribuciones asociadas a la normal multidimensional 17

B. Funcion de densidad

La funcion de densidad de Z ∼ χ2n viene dada para x > 0 por

(3.11) fZ(x) = cn xn/2−1 e−x/2 =

1

Γ(n/2)

1

2n/2xn/2−1 e−x/2

(para x ≤ 0 es fZ(x) = 0). El valor de la constante cn se obtiene de exigir que∫fZ = 1 (recuerdese la proposicion 2.14).

La comprobacion de (3.11) es directa, usando las propiedades de la familia devariables Gamma: si X1 es normal estandar, entonces, por el ejemplo 2.2.4,

fX21(x) =

1√2π

1√xe−x/2.

Comparando con la funcion de densidad (2.22) de las variables Gamma, observamosque X2

1 ∼ gamma(1/2, 1/2).

Por la proposicion 2.15 sobre suma de variables Gamma independientes,

una variable χ2n es una variable gamma(1/2, n/2),

lo que nos da directamente (3.11) usando de nuevo la formula (2.22).

� Nota 3.3.1. (Re)comprobacion por induccion de la expresion para la densidad fZn de la χ2n. Pon-

gamos Zn = X21 + · · · + X2

n, donde las Xj son normales estandar independientes. Damos siem-pre las fZn solo en x ∈ (0,+∞) (fuera valen 0). Para n = 1 ya lo hemos visto (ejemplo 2.2.4):fZ1(x) =

1√2π

1√xe−x/2 = c1 x

1/2−1e−x/2.

De n a n+ 1:

fZn+1(x) =

∫ ∞

0

fZn(y) fZ1(x− y) dy =

∫ x

0

fZn(y) fZ1(x− y) dy

= cnc1

∫ x

0

yn/2−1 e−y/2 (x− y)−1/2 e−(x−y)/2 dy

[cambio y = xu]= cn c1 e−x/2 xn/2+1

∫ 1

0

un/2−1(1− u)−1/2 du

= cn c1(∫ 1

0

un/2−1(1− u)−1/2du)

︸ ︷︷ ︸=cn+1

e−x/2 xn/2+1 .

notas de estadıstica I – 16 de octubre de 2018 – jose l. fernandez y pablo fernandez

Page 18: La normal multidimensional y distribuciones …verso.mat.uam.es/~pablo.fernandez/cap3-EstadI-oct18.pdfVersi´ onpreliminar,16deoctubrede2018 2 Cap´ıtulo 3. La normal multidimensional

Version

preliminar,16

deoctubre

de2018

18 Capıtulo 3. La normal multidimensional y distribuciones asociadas

Mas adelante necesitaremos los valores de las esperanzas de ciertas trasformacio-nes adicionales de una chi cuadrado:

Lema 3.10 Sea Z ∼ χ2n y sea α ∈ R. Entonces

(3.12) E(Zα) = 2αΓ(n/2 + α)

Γ(n/2)

siempre que n/2 + α > 0.

En particular, para todo n ≥ 3,

E(1/Z) =1

n− 2.

(Para n = 1, 2 la esperanza E(1/Z) es infinita).

Y para todo n ≥ 1,

E(√Z) =

√2Γ((n + 1)/2)

Γ(n/2).

Demostracion. Usando la expresion (3.11) de la funcion de densidad de la χ2n y

las propiedades de la funcion Gamma de Euler,

E(Zα) =1

Γ(n/2)

1

2n/2

∫ ∞

0tα+n/2−1 e−t/2 dt

=1

Γ(n/2)

2α+n/2−1

2n/22

∫ ∞

0uα+n/2−1 e−u du = 2α

Γ(n/2 + α)

Γ(n/2). �

� Nota 3.3.2. Si Z ∼ χ2n, entonces la variable

√Z recoge el resultado de sortear un punto en R

n, demanera que sus coordenadas se sortean con normales estandar independientes, y medir su distanciaal origen. El lema 3.10 nos dice que, en media, esa distancia es

√2Γ((n+ 1)/2)/Γ(n/2). Por ejemplo,

si n = 2, la distancia media al origen de los puntos generados con este procedimiento es√

π/2 ≈ 1.25.

En tres dimensiones, esa distancia media es 2√

2/π ≈ 1.596. Usando la aproximacion de Stirling, se

puede comprobar que E(√Z) ∼ √

n cuando n → ∞. Vease el ejercicio 3.8.

3.3.2. Distribucion Fn,m con n y m grados de libertad

Para enteros n,m ≥ 1, del cociente

Z =(X2

1 +X22 + · · ·+X2

n)/n

(Y 21 + Y 2

2 + · · · + Y 2m)/m

,

donde X1,X2, . . . ,Xn, Y1, Y2, . . . , Ym son normales estandar (completamente) inde-pendientes, se dice que sigue la distribucion Fn,m. Escribiremos que Z ∼ Fn,m. Es-tas distribuciones F se conocen como de Fisher, de Snedecor, o de Fisher–Snedecor.

Observese que Z toma valores solo en (0,+∞), y que

Z =Un/n

Vm/m

donde Un y Vm son independientes y Un ∼ χ2n y Vm ∼ χ2

m.

Observese que si Z ∼ Fn,m entonces 1/Z ∼ Fm,n.

notas de estadıstica I – 16 de octubre de 2018 – jose l. fernandez y pablo fernandez

Page 19: La normal multidimensional y distribuciones …verso.mat.uam.es/~pablo.fernandez/cap3-EstadI-oct18.pdfVersi´ onpreliminar,16deoctubrede2018 2 Cap´ıtulo 3. La normal multidimensional

Version

preliminar,16

deoctubre

de2018

3.3. Distribuciones asociadas a la normal multidimensional 19

A. Media y varianza

Sea Z ∼ Fn,m.

Si m ≥ 3, la esperanza de Z es

E(Z) =m

m− 2,

pues por (3.9) y el lema 3.10, E(Z) = E(Un/n)E(m/Vm) = E(m/Vm) =m/(m− 2) .

Si m = 1, 2, entonces E(Z) = +∞.

Si m ≥ 5, entonces

V(Z) =2(m+ n− 2)m2

n(m− 4)(m− 2)2,

que se obtiene usando la expresion anterior para E(Z), junto con que E(U2n) =

n(n+ 2) y que E(1/V 2m) = 1/((m − 2)(m− 4)) .

Si m ≤ 4, entonces V(Z) = +∞.

B. Funcion de densidad

La funcion de densidad de una variable Z ∼ F (n,m) es, para x > 0,

fZ(x) =n

m

Γ((n+m)/2)

Γ(n/2)Γ(m/2)

(nx/m)n/2−1

(1 + (nx/m))(n+m)/2.

� Nota 3.3.3. Esta formula se sigue de que si U,V son independientes y U ∼ χ2n y V ∼ χ2(m),

entonces, para x > 0

fU/V (x) =Γ((n+m)/2)

Γ(n/2)Γ(m/2)

xn/2−1

(1 + x)(n+m)/2.

Para ver esto, consideremos el cambio de variables A = U/V y B = V :

f(A,B)(a, b)1

v= fU (u)fV (v) ,

es decir,f(A,B)(a, b) = bfU (ab)fV (b) .

Por tanto,

fA(a) =

∫ ∞

0

bfU (ab)fV (b) db = cncm an/2−1

∫ ∞

0

b(n+m)/2−1e−b(1+a)/2db

= cncman/2−1

(1 + a)(n+m)/2

∫ ∞

0

y(n+m)/2−1e−y/2dy

=cncmcn+m

an/2−1

(1 + a)(n+m)/2=

Γ((n+m)/2)

Γ(n/2)Γ(m/2)

an/2−1

(1 + a)(n+m)/2.

notas de estadıstica I – 16 de octubre de 2018 – jose l. fernandez y pablo fernandez

Page 20: La normal multidimensional y distribuciones …verso.mat.uam.es/~pablo.fernandez/cap3-EstadI-oct18.pdfVersi´ onpreliminar,16deoctubrede2018 2 Cap´ıtulo 3. La normal multidimensional

Versionpreliminar,

16deoctubre

de2018

20 Capıtulo 3. La normal multidimensional y distribuciones asociadas

3.3.3. Distribucion tn de Student

Fijamos n ≥ 2. Sean Y y Zn dos variables aleatorias independientes, Y condistribucion normal estandar y Zn con distribucion χ2

n. Se dice que el cociente

tn :=Y√Zn/n

sigue una distribucion t de Student con n grados de libertad. Escribiremosque tn ∼ stu(n).

Contraviniendo la regla de denotar las variables aleatorias con mayusculas, perosiguiendo la tradicion, usamos tn para denotar variables de Student.

� Nota 3.3.4. Observese que si tn ∼ stu(n), entonces t2n ∼ F (1, n).

A. Media y varianza

Para la esperanza de tn: como numerador y denominador son independientes yE(Y ) = 0 tenemos que

E(tn) = 0 .

Para la varianza: si n ≥ 3,

V(tn) = E(t2n) = nE(Y 2)E(1/Zn) = nE(1/Zn) =n

n− 2,

apelando al lema 3.10. Si n = 1, 2, la varianza V(t2) = +∞.

B. Funcion de densidad

La funcion de densidad de una tn ∼ stu(n) es

(3.13) ftn(t) = Dn

( 1

1 + t2/n

)(n+1)/2, donde Dn =

1√nπ

Γ(n+12 )

Γ(n2 ).

notas de estadıstica I – 16 de octubre de 2018 – jose l. fernandez y pablo fernandez

Page 21: La normal multidimensional y distribuciones …verso.mat.uam.es/~pablo.fernandez/cap3-EstadI-oct18.pdfVersi´ onpreliminar,16deoctubrede2018 2 Cap´ıtulo 3. La normal multidimensional

Version

preliminar,16

deoctubre

de2018

3.3. Distribuciones asociadas a la normal multidimensional 21

� Nota 3.3.5. He aquı el calculo de esta funcion de densidad. La funcion de densidad f conjunta de(Y,Zn) es

f(y, z) =( 1√

2πe−y2/2

)( 1

Γ(n/2)

(12

)n/2

zn/2−1e−z/2)= Cn e−y2/2 zn/2−1e−z/2 ,

donde Cn = 1√2π

1Γ(n/2)

(12

)n/2.

Hacemos el cambio de variables (y, z) a (w, t){w = z,

t = y/√

z/n.

Como el jacobiano de esta transformacion es |∂(w, t)/∂(y, z)| = 1/√

z/n , tenemos que la funcionde densidad conjunta de W y tn viene dada por

fW,tn(w, t)

∣∣∣∣∂(w, t)

∂(y, z)

∣∣∣∣ = f(y, z) ,

que despejando la y y z en terminos de w y t dice

fW,tn(w, t) = (Cn/√n)w(n−1)/2 e−

w2(1+t2/n).

Si fijamos t e integramos respecto de w (haciendo el cambio r = w2(1 + t2/n)), para ası conseguir la

densidad marginal de tn, obtenemos que

ftn(t) =[(Cn/

√n) Γ(n+1

2) 2(n+1)/2

]( 1

1 + t2/n

)(n+1)/2

= Dn

( 1

1 + t2/n

)(n+1)/2

,

donde Dn = 1√nπ

Γ(n+12

)/Γ(n2) .

notas de estadıstica I – 16 de octubre de 2018 – jose l. fernandez y pablo fernandez