3 probabilidad y estadistica en hidrologia1
DESCRIPTION
HidrologiaTRANSCRIPT
07/09/2014
C.L.V.P. 2014 1
PROBABILIDAD Y ESTADISTICA EN HIDROLOGÍAEN HIDROLOGÍA
C.L.V.P. - 2014
Un proceso probabilístico en hidrologíaconsiste en un conjunto de variables al azar;es decir, variables (eventos) que tomanvalores en una secuencia a través del tiempo(horas, días, meses, años). Estos eventospueden ser muestreados en forma discreta opueden ser muestreados en forma discreta ocontinua.
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 2
En hidrología, se trabaja con eventosnaturales irrepetibles registrados enperiodos de tiempo corto, a diferenciade otras ciencias que trabajan conregistros que se pueden reproducirregistros que se pueden reproducirpor experimentación.
C.L.V.P. - 2014
DATOS HIDROMETEREOLÓGICOS
Existen varios tipos de datos usados en la hidrología:ste a os t pos de datos usados e a d o og a
Datos históricos de eventos naturales registradoscronológicamente en forma discreta ó continua. Sonseries de tiempo producto de observaciones y que sepierden si no se registran en el momento de suocurrencia. A este tipo pertenecen la gran mayoríade los datos hidrológicos e hidrometeorológicos.
Levantamiento de datos hidrológicos en áreas, como porl f d d d l d d d b áejemplo profundidad y calidad de aguas subterráneas,
infiltración o sedimentación en ríos. Son datos de campoque se toman esporádicamente y no necesariamente, enforma secuencial.
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 3
DATOS HIDROMETEREOLÓGICOS
Medidas en laboratorio, como lo sonconductividades hidráulicas o calidad de aguas.
Registro simultáneo de un evento (lluvia-caudal)en dos localidades geográficas diferentes, duranteun determinado período de tiempo (generalmente4 ó 5 años) usados para transferir información ó
l d ó dcorrelacionar datos con propósitos diversos, comolo son análisis de caudales.
C.L.V.P. - 2014
DATOS HIDROMETEREOLÓGICOS
Calidad homogeneidad y consistencia de los datosCalidad, homogeneidad y consistencia de los datos
Los datos hidrológicos deben ser independientes,homogéneos y lo más representativos posible de lapoblación. En la recolección de datos de lluvias en unacuenca, por ejemplo, las estaciones deberán serlocalizadas en sitios estratégicos cuya cobertura totaldeberá representar la misma. Las fuentes de los erroresen datos hidrológicos observados pueden ser: en elen datos hidrológicos observados pueden ser: en elsensor (error del registro del dato in situ),en latransmisión del dato, en el registro en la estación derecepción, en el procesamiento y análisis de los datos.
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 4
DATOS HIDROMETEREOLÓGICOS
Calidad, homogeneidad y consistencia de los datos
Dentro de los errores, se consideran errores al azar yerrores sistemáticos. Los primeros están siempre en losdatos, generalmente se distribuyen alrededor delverdadero valor y la desviación estándar se usa paradeterminar la magnitud de los desvíos. Los segundoscrean inconsistencias o diferencias en un sólo sentido
l ó l l d d ben relación al valor medio que deben serdetectadas y corregidas. Existen diversas técnicas, comolas curvas de masa doble para corregir inconsistencias.
C.L.V.P. - 2014
DATOS HIDROMETEREOLÓGICOS
Calidad homogeneidad y consistencia de los datosCalidad, homogeneidad y consistencia de los datos
Otro tipo de datos a tener en cuenta son los nohomogéneos o datos afectados por algún efecto, nonecesariamente hidrológico que repentinamente cambiala tendencia normal de una serie de registros. La nohomogeneidad puede ser producida por un efectoantrópico, fácilmente detectable e incluso pronosticado,antrópico, fácilmente detectable e incluso pronosticado,como lo es una presa en un río, la cual produce haciaaguas abajo descargas no homogéneas que no puedenser consideradas conjuntamente con los caudalesvírgenes del río aguas arriba del embalse.
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 5
DATOS HIDROMETEREOLÓGICOS
Variables aleatorias
Una variable aleatoria X(t) tiene una cierta distribuciónprobabilística. Esa distribución determina la posibilidadde que una determinada observación X, de la variable,caiga dentro de un rango especificado de X. Sí, porejemplo la precipitación media de enero, en un lugar, esd l d b ó b b lí d í blde 50 mm, la distribución probabilística podría establecerque pueda estar en el rango entre 40 y 60 milímetros.
C.L.V.P. - 2014
DATOS HIDROMETEREOLÓGICOS
Series de Tiempo
Una serie de tiempo se define, en hidrología, comola magnitud de un evento observado en formadiscreta a intervalos de tiempo, dt, promediados en eseintervalo o registrados en forma continua en un tiempo,t, por ejemplo caudales medios, diarios, promedio decaudales instantáneos a través de un intervalo discretocaudales instantáneos a través de un intervalo discretode 1 día, o caudales instantáneos registrados en formacontinua durante todos los instantes de cada día.
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 6
PARÁMETROS ESTADÍSTICOS
Medidas de tendencia hacia un valor central de la serie
Promedio aritmético o media aritmética (µ) es elprimer momento alrededor del origen. Aunque dainformación sobre la muestra, este parámetro nocaracteriza completamente a una variable aleatoria. Si lamuestra es pequeña y contiene valores extremos (altos obajos) el promedio no será un parámetro real en relacióncon la población. Se calcula mediante la expresión:con la población. Se calcula mediante la expresión:
C.L.V.P. - 2014
PARÁMETROS ESTADÍSTICOS
Medidas de tendencia hacia un valor central de la serie
Promedio geométrico: se calcula con la siguienteexpresión:
nng xxxxx ...*** 321
_
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 7
PARÁMETROS ESTADÍSTICOS
Mediana (M): es el valor de la variable que deja con igualprobabilidad de ocurrencia (0.50) los valores abajo y arribade ella, por lo tanto, la mediana resulta atractiva, en elcaso de series que se apartan de la normal.
Moda: es el valor de la variable que ocurre conModa: es el valor de la variable que ocurre conmayor frecuencia.
C.L.V.P. - 2014
PARÁMETROS ESTADÍSTICOS
En hidrología se tienen frecuentemente muestras dedistintos tamaños N1, N2, N3... NR y se necesita obtener elpromedio ponderado de todas ellas, así:
k
iii xN
1_
*
k
ii
ip
Nx
1
1
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 8
PARÁMETROS ESTADÍSTICOS
Medidas de Dispersión
Las medidas de dispersión miden como los valores de unavariable se dispersan alrededor del valor central o mediaaritmética de la serie; es decir, representan una distribuciónalrededor de un valor medio.
Desviación media (σM): Es la media aritmética del valorabsoluto de los errores. Se calcula con la siguienteexpresión:p
N
xxN
ii
M
1
_
C.L.V.P. - 2014
PARÁMETROS ESTADÍSTICOS
Desviación estándar (σ): Es el parámetro de dispersión másDesviación estándar (σ): Es el parámetro de dispersión másusado en hidrología, se llama también desviacióncuadrática. Es la raíz cuadrada de la varianza y tiene lasunidades de X.
1
2
1
_
N
xxN
ii
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 9
PARÁMETROS ESTADÍSTICOSLa varianza: es el cuadrado de la desviación estándar (σ2 ) yes el segundo momento alrededor de la media. Sus unidadesson el cuadrado de las unidades de la variable. En general, es
i di d i di t d l di tá l lun indicador que indica cuanto cerca de la media está el valorde la variable. Si teóricamente todos los valores fueran igual ala media, la varianza sería cero.
La ecuación de la varianza se puede también expresardesarrollando el trinomio cuadrado perfecto del numerador.
2
1
_
2
xxN
ii
1N
C.L.V.P. - 2014
PARÁMETROS ESTADÍSTICOS
Covarianza. Cuando se analiza la varianza de dos (X, Y) ómás variables (X, Y, Z). En el caso de dos variables, lacovarianza es la media aritmética del producto de loserrores de X, e Y, y se expresa mediante la siguienteecuación:
N
N
iii yyxx
NYXCv
1
__
*1
,
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 10
PARÁMETROS ESTADÍSTICOS
Coeficiente de variación: es el cociente entre la desviaciónestándar y el promedio, X . Es adimensional.
_
xCv
C.L.V.P. - 2014
PARÁMETROS ESTADÍSTICOS
El coeficiente de asimetría (g): Es el tercer momentoalrededor de la media Describe la distribución de los datosalrededor de la media. Describe la distribución de los datosalrededor de media. Es una medida de la simetría. Unadistribución simétrica tiene un coeficiente de asimetría iguala cero cuando los datos se distribuyen alrededor de lamedia; negativo cuando la distribución de los datos tienemayor sesgo a la izquierda y positivo cuando tiene mayorsesgo a la derecha, según como se desvíe hacia valoresbajos o altos con relación a la media. Es un parámetro muyusado en estudios regionales, se calcula con la expresión:usado en estudios regionales, se calcula con la expresión:
31
3_
*2*1
*
NN
xxNg
N
ii
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 11
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN DE VARIABLES DISCRETAS
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN BINOMIAL
La distribución discreta binomial de probabilidad seaplica a poblaciones que sólo tienen dos eventosdiscretos y complementarios. Una condición esencialpara esta aplicación es la independencia de eventossucesivos (observaciones o experimentos) y las
b b l d d d dprobabilidades constantes p y q de cada ensayoindividual. Esta condición se debe verificar con los datosa utilizar.
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 12
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN BINOMIAL
La función de probabilidad acumulada es:
xnxx qp
x
nP
**)(
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN BINOMIAL
D dDonde:
x es el número de veces que ocurre el evento.
P(x) es la probabilidad de ocurrencia x = 0, 1, 2 .... etc.
n es el tamaño de la muestra (número de observacionesindependientes o casos posibles).
m es el número de eventos
q es la probabilidad de no excedencia, dada por:
q = 1 - p
p es la probabilidad de excedencia, calculada mediante laexpresión:
m
np
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 13
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN BINOMIAL
es el número combinatorio de n valores tomados de x, seevalúa así:
x
n
! !!
!
xnx
n
x
n
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN BINOMIAL
El valor esperado (promedio):
La varianza:
El coeficiente de asimetría:
pnx *_
qpn **2
pqg
**
El coeficiente de kurtosis:
qpn **
3
**
**61
qpn
qpk
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 14
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN DE POISSON
Un caso interesante se presenta cuando el tamaño de lamuestra, n, es muy grande y tiende a infinito, mientras quela probabilidad, p, muy pequeña y tendiente a cero, perosu producto, m, es un número positivo, entonces se tiene lafunción de densidad de probabilidad discreta de Poisson:
!)( x
emp
mx
x
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN DE POISSON
El valor esperado (promedio):
La varianza:
l f d í
mx _
m2
g1
El coeficiente de asimetría:m
g
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 15
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN DE VARIABLES CONTINUAS
Las distribuciones continuas se caracterizan porque F(x) esabsolutamente continua. Por consiguiente F(x) tiene comoderivada:
)()´( xfxF
La función de distribución de probabilidad es F(x)
ó
x
dxxfxF )()(dx
xdFxf
)()(
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN DE VARIABLES CONTINUAS
La derivada f(x) se denomina función de densidad deprobabilidad y los valores de x para los cuales f(x) > 0 sonel dominio de la variable aleatoria x.
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 16
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN DE VARIABLES CONTINUAS
En el cálculo de probabilidades de eventos mayores, lavariable x, puede representarse por el promedio x, más unincremento dx, de ese valor medio:
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN DE VARIABLES CONTINUAS
La magnitud de dx depende de la dispersión característica de la distribución de x, del intervalo de recurrencia y otros parámetros estadísticos. Es posible entonces representar a dx como el producto de la desviación estándar y de un factor de frecuencia k, así:
ó*_
kxx *kx
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 17
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN DE VARIABLES CONTINUAS
Di idi d l l di li l l d h ié d lDividiendo por el valor medio para generalizar el resultado haciéndolaadimensional es:
ó__ *1x
kx
x
*1 k
x
Pero coeficiente de variación de x, es:
ó_
xCv
vC
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN DE VARIABLES CONTINUAS
Luego, se obtiene la ecuación general del análisis defrecuencia propuesta por Chow (1964):
vCkx
x*1_
vCkx
*1
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 18
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN DE VARIABLES CONTINUAS
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN DE VARIABLES CONTINUAS
Establecido a priori un valor de grado de confianza (80% 82% 85%Establecido, a priori, un valor de grado de confianza, (80%, 82%, 85%ó 95%), para cada uno corresponderá un nivel de significancia. OMM(1982) sugiere tomar como aceptable un grado de confianza del 80%.
El factor más significativo que afecta esta banda, es el grado deconfianza que se desee establecer. Se usa frecuentemente el 95%, perovalores entre 70% y 95% son comunes en el diseño hidrológico.
• El tamaño de la muestra con la que se computó la curva defrecuencia, afecta el ancho de la banda. A mayor tamaño de muestra,disminuye el intervalo.
• La probabilidad de excedencia afecta la amplitud del intervalo; elLa probabilidad de excedencia afecta la amplitud del intervalo; elintervalo es menor para valores promedios y se hace mayor en laspuntas (probabilidades mayores y menores).
• El coeficiente de asimetría afecta el intervalo de confianza. Laasimetría afecta el error estándar, por lo tanto el ancho de la bandaaumenta con el aumento del valor absoluto de la asimetría.
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 19
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN NORMAL
La distribución normal (Gaussiana) surge del teorema dellímite del valor central, el cual establece que una variablealeatoria x está normalmente distribuida con el promedio µy la desviación estándar σ. La función de distribución deprobabilidad (frecuencia acumulada) proporciona laprobabilidad de que X sea menor o igual a x así:
dx
xxXF
x
2
2
*2exp*
2*
1)(
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN NORMAL
Distribución típica normalC.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 20
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN NORMAL
La función de densidad de probabilidad, está dada por:
2
2
2exp*
2*
1)(
x
xf
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN LOGNORMAL DE DOS PARÁMETROS DISTRIBUCIÓN LOGNORMAL DE DOS PARÁMETROS
También se la denomina función de Galton (estudiada porGalton en 1875). Es una distribución donde la variable x sereemplaza por su logaritmo (ln x), siendo en este caso surango sólo de valores positivos de (x > 0), lo cual en lahidrología es una ventaja sobre la normal.
La función de densidad de probabilidad es:
2
*2
1exp
2**
1
y
y
y
y
xxf
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 21
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN LOGNORMAL DE DOS PARÁMETROS
Donde y es el logaritmo natural de x: y = ln (x)
σy es la desviación estándar de y.
µy es el promedio de y se calcula así:
_)ln(y
N
xy
N es el número de datos de la muestra.
yNy
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN LOGNORMAL DE DOS PARÁMETROS
Los parámetros estadísticos de x Chow (1954) se calculan con las siguientes expresiones:
El valor esperado (promedio):
2exp
2y
yx
Mediana:
2exp
exp
2y
x
x
yx
M
M
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 22
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN LOGNORMAL DE DOS PARÁMETROS DISTRIBUCIÓN LOGNORMAL DE DOS PARÁMETROS
Desviación estándar:
El coeficiente de asimetría:
21
2 1exp* y
3*3 CCg
El coeficiente de variación:
3 vv CCg
21
2 1exp yvC C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN LOGNORMAL DE DOS PARÁMETROS DISTRIBUCIÓN LOGNORMAL DE DOS PARÁMETROS
El factor de frecuencia, k , se puede calcular con laecuación siguiente (Chow, 1964)
k
e
ek
y
yyy
1
1
2
1
2*
2
2
yy
yy
kyy
yyk
*_
_
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 23
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN LOGNORMAL DE TRES PARÁMETROS
La distribución log normal se puede generalizar para casosen que el límite inferior de la misma no sea cero, en estecaso se introduce un tercer parámetro que lo sustituya (x-β). La función de densidad de probabilidad toma la forma:
2ln1 x
2*2
lnexp
2**
1)(
y
y
y
x
xxf
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN LOGNORMAL DE TRES PARÁMETROS
Donde β es el límite inferior, x la variable. Si el límiteinferior, β, se conoce a priori, la variable x, se reemplazapor (x-β) y se procede como en la lognormal de dosparámetros. Cuando el límite inferior no se conoce, este sedetermina por los métodos de estimación de parámetros.
La distribución lognormal se usa corrientemente enhidrología para variables como precipitación, caudal y otrasmedidas desde base cero cuyo límite superior esmedidas desde base cero, cuyo límite superior esdesconocido.
La práctica hidrológica ha definido que la distribuciónlognormal se ajusta bien para numerosas variablesasimétricas que se toman encima de un valor de base(series de duración parcial).
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 24
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIONES TIPO PEARSON
E t f i d b bilid d j t bi iEstas funciones de probabilidad se ajustan bien a variasdistribuciones, la ecuación general que define la distribuciónacumulada (Chow, 1964) es:
D d b0 b1 b2 t t d b
dxxbxbb
xaxF
2210 **
exp)(
Donde a, b0, b1 y b2 son constantes que se debendeterminar experimentalmente.
En hidrología se usan distribuciones pertenecientes a estafamilia de funciones, es decir, son casos especiales de lageneral.
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN GAMMA DE UN PARÁMETRO
La función de densidad de probabilidad es:
f(x) = 0 para x < 0
Donde α es el parámetro de forma. Si α no es entero, el
xxExpxxf 0**
1)( 1
producto Γ se obtiene de tablas que se encuentran enla literatura Si es entero y positivo, el producto seevalúa mediante la expresión:
!1 C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 25
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN GAMMA DE UN PARÁMETRO
Los parámetros estadísticos de la distribución son:(Yevjevich 1972)
Promedio:
Varianza:
xx 0;_
2
Coeficiente de asimetría:
2
g
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN GAMMA DE UN PARÁMETRO DISTRIBUCIÓN GAMMA DE UN PARÁMETRO
La función de distribución gamma de un parámetroconverge para valores elevados de hacia la distribuciónnormal ( > 30) y se puede integrar para valores enterosde
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 26
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN GAMMA DE DOS PARÁMETROSDISTRIBUCIÓN GAMMA DE DOS PARÁMETROS
La función de densidad de probabilidad de esta distribución,se obtiene sustituyendo en la ecuación de la distribuciónGama de un parámetro, x por x/β, así:
xparax
Expxxf 0*1
)( 1
0*0)( xparaxf
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN GAMMA DE DOS PARÁMETROS
Donde es el parámetro de forma ( > 0) y β el parámetrode escala (β > 0). El producto: Γ se evalúa mediante lasiguiente expresión:
!1 !1
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 27
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN GAMMA DE DOS PARÁMETROS
Los parámetros estadísticos para x son:
Promedio:
Varianza:
*
22 *
Coeficiente de asimetría:
2
gC.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN GAMMA DE DOS PARÁMETROS
Función de densidad de probabilidad de dos parámetros (Yevjevich,1972) para =2 y tres valores de β
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 28
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN PEARSON III (GAMMA DE TRESÁPARÁMETROS) (KENDALL, 1969)
La función densidad es:
para x ≥ E
Donde: Γβ es la función gamma de β
ExPExP
xf 01
0 exp*)(
β g β
β, Po, y E son los parámetros de la distribución. Se calculanmediante las expresiones:
xp 0
22
g *
_
xxE C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN LOG PEARSON III
Es la distribución Pearson III, pero usada con los logaritmosde los valores de la muestra. Es una distribución muy usadaen Estados Unidos y recomendada por el USWRC (1976). Adiferencia de las ecuaciones de lognormal que usanlogaritmos naturales, esta distribución usan los logaritmosen base 10 (log).
La función de densidad de probabilidad es:
EPEP **1
Donde y = log x; para log x >= E
x
EyPEyPxf o *exp*)( 0
1
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 29
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN LOG PEARSON III
β, Po, y E son los parámetros de la distribución. Se calculandi t l imediante las expresiones:
*
22
0y
yg
P
Siendo: β Γ la función gamma de β , σy la desviación estándarde y, g el coeficiente de asimetría de y.
*_
yyE
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDADDISTRIBUCIÓN LOG PEARSON III
El USWRC (1976) recomienda esta distribución para definir seriesanuales de crecidas. Últimamente ha sido bastante cuestionadaa ua es de c ec das Ú t a e te a s do basta te cuest o adaesta metodología, aunque conviene tenerla presente en el diseñohidrológico.
Para calcular el coeficiente de frecuencia, k, de la distribución Log-Pearson III (para caudales máximos anuales), la ecuaciónrecomendada (USWRC, 1976) es:
Donde: x es la media de los logaritmos decimales de x.
x es la desviación estándar de los logaritmos
kxQLog x *)(_
x gdecimales de x
k es el factor de frecuencia que es función delcoeficiente de asimetría de los logaritmos decimales de
los caudales máximos medios diarios anuales y de laprobabilidad de excedencia
Log(Q) es el logaritmo decimal del caudal Q en m3/s
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 30
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIÓN LOG PEARSON III
El cálculo del coeficiente de frecuencia, para una muestra de n valores,se realiza mediante el uso de los siguientes parámetros estadísticos:
Promedio:
Desviación estándar:
C fi i t d i t í
N
xx
)log(_
)1(
)log(2_
N
xx
x
Coeficiente de asimetría:
Si se trabaja con asimetría g=0, la distribución log Pearson III es igual alog-normal.
3
3
21
)log(
xNN
xxNg
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
Distribución General de Valores Extremos (GEV)
Las tres formas de distribución de valores extremos soncasos especiales de la distribución general de valoresextremos (Jenkinson, 1955). La función de distribuciónacumulada es:
Donde k μ y son parámetros a determinar Luego:
kx
kxF
1
*1exp)(
Donde k, μ y son parámetros a determinar. Luego:
Si k = 0, es la distribución tipo I (Gumbel).
Si k < 0, es la distribución tipo II (Frechet).
Si k > 0, es la distribución tipo III (Weibull).
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 31
DISTRIBUCIONES DE PROBABILIDAD
Distribución Tipo I (Gumbel)
L f ió d di t ib ió l d (Y j i hLa función de distribución acumulada es: (Yevjevich,1972)
Donde es el parámetro de forma y β el parámetro delocalización (valor central).
Haciendo uso de una variable reducida, y:
xxXF *expexp)(
La función de distribución queda:
xy *
yeeyxXF expexp)(C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
Distribución Tipo I (Gumbel)
Cuando x o y tienden a +∞ ó a -∞ F(x) tiende a 0 ó aCuando x o y tienden a +∞ ó a ∞, F(x) tiende a 0 ó a1, respectivamente. Los valores de y β, estánvinculados a la media (μ) y a la desviación estándard (σ)por valores constantes o variables según sea eltamaño de la muestra. Conocidos μ y σ los valores de y β son:
281.1
*45.0
La asimetría es constante: (g=1.139)
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 32
DISTRIBUCIONES DE PROBABILIDAD
Distribución Tipo I (Gumbel)
Para calcular el coeficiente de frecuencia k de laPara calcular el coeficiente de frecuencia, k, de ladistribución Gumbel tipo I (valores extremos), partiendo dela ecuación de densidad de probabilidad de Gumbel, (Chow,1964) lo expresa como:
1
lnln*6
R
R
T
Tk
Donde γ es la constante de Euler igual a 0.57721 (Kreyszic,1964).
TR es el tiempo de recurrencia o período de retorno en años.
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
Distribución Tipo I (Gumbel)
Despejando el período de retorno, TR , se tiene:
Pero se sabe que:
6
*expexp1
1
kTR
vCkx
*1q
Cuando:
v
x_
kCxx v *11_
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 33
DISTRIBUCIONES DE PROBABILIDAD
Distribución Tipo I (Gumbel)Distribución Tipo I (Gumbel)
Luego, en la ecuación anterior, cuando k = 0, TR = 2.33años que es el tiempo de retorno que el U. S. GeologicalSurvey toma para la creciente anual (U. S. GeologicalSurvey, 1960).
Desde el punto de vista del diseño hidrológico se trabaja con tablas de valores de k, Para ello se debe definir la “variable reducida” (Linsley et al., 1975).
La distribución de probabilidad de una variable que puede ser igualada o excedida es:
yeexP1)(
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
Distribución Tipo I (Gumbel)
Donde y es la variable reducida. El valor de y se relacionacon los datos por la siguiente ecuación (Chow et al., 1994)
Donde: x es el promedio de la serie de datos.
xn
nyyxx
_
p
σx es la desviación estándar de x.
σn, yn son funciones de la longitud del registro (ver tabla siguiente).
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 34
DISTRIBUCIONES DE PROBABILIDAD
Distribución Tipo I (Gumbel) N (años) yn n
20 0 52 1 0620 0,52 1,06
30 0,54 1,11
40 0,54 1,14
50 0,55 1,16
60 0,55 1,17
70 0,55 1,19
80 0,56 1,19
Valores de yn y σn en función dela longitud del registro, N, enaños.
80 0,56 1,19
90 0,56 1,20
100 0,56 1,21
150 0,56 1,23
200 0,57 1,24
∞ 0,57 1,28C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
Distribución Tipo I (Gumbel)
El l d l i bl d id t lEl valor de la variable reducida se encuentra con lasiguiente ecuación:
La tabla de valores de k, se calcula así: se obtiene primerolos valores de y para diferentes períodos de retorno, (TR)
1
lnlnR
R
T
Ty
los valores de y para diferentes períodos de retorno, (TR)mediante la ecuación anterior. Luego, con la longitud delregistro, N (en años), se obtienen en la tabla anterior, yn,σn y los valores de k que figuran en la Tabla siguiente.
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 35
DISTRIBUCIONES DE PROBABILIDADDistribución Tipo I (Gumbel)Valores de k para la distribución Gumbel de valores extremos Tipo I (Adaptada de Linsley et al, 1975).
TR (años)
Probabilidad ocurrencia
Variable reducida
y
Longitud del registro, N (años)
20 30 40 50 100 200 ∞y 20 30 40 50 100 200 ∞
1.58 0.63 0.000 -0.492 -0.482 -0.476 -0.473 -0.464 -0.459 -0.450
2.00 0.50 0.367 -0.417 -0.152 -0.155 -0.156 -0.160 -0.162 -0.164
2.33 0.43 0.579 0.052 0.038 0.031 0.026 0.016 0.010 0.001
5 0.20 1.500 0.919 0.866 0.838 0.820 0.779 0.755 0.719
10 0.10 2.250 1.62 1.54 1.50 1.47 1.40 1.36 1.30
20 0.05 2.970 2.30 2.19 2.13 2.09 2.00 1.94 1.87
50 0.02 3.902 3.18 3.03 2.94 2.89 2.77 2.70 2.59
100 0.01 4.600 3.84 3.65 3.55 3.49 3.35 3.27 3.14
200 0.005 5.296 4.49 4.28 4.16 4.09 3.93 3.83 3.68
400 0.0025 6.000 5.15 4.91 4.78 4.56 4.51 4.40 4.23
500 0.002 6.01 5.36 5.10 4.97 4.87 4.66 4.54 4.40
1000 0.001 6.91 6.03 5.73 5.58 5.48 5.25 5.11 4.95
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
Distribución Tipo II (Cauchy o Frechet)
Cuando el límite inferior es cero (0 < x < ∞) y tomandolos logaritmos de x, se tiene una distribución de usopráctico, que es un caso especial de Frechet (LogGumbel).
t
syxXF expexp)(
Donde:
)ln(),ln(),ln( tsxy
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 36
DISTRIBUCIONES DE PROBABILIDAD
Distribución Tipo II (Cauchy o Frechet)
La distribución, se ajusta con el uso de un factor defrecuencia k, que es igual al que se usa para Gumbel,estableciendo el límite inferior cero. Se usa al igual queGumbel para valores extremos. No deben usarse paraseries de duración parcial sino sólo para anualesseries de duración parcial, sino sólo para anuales.
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
Distribución Tipo III (Weibull) (Chow, 1964)
Cuando existe un límite superior la ecuación deprobabilidad acumulada es:
Donde: x ≤ E, en el rango de -∞ < x < E
k
E
ExxXF
exp)(
k es el factor de frecuencia , k > 0.
E es calculado mediante la siguiente expresión:
θ es el mayor valor esperado de E kE
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 37
DISTRIBUCIONES DE PROBABILIDAD
Distribución Tipo III (Weibull) (Chow, 1964)
Esta distribución se usa para análisis de frecuencia decaudales bajos (sequías). Los análisis de caudales bajosresultan importantes en el aprovechamiento, regulación deríos y estudio de descargas de contaminantes.
A diferencia del estudio de frecuencia de crecidas, donde seusan caudales instantáneos, en caudales bajos esconveniente establecer promedios de 1 semana o 1 mes óuna estación según se especifique. O sea, se hacereferencia a caudales bajos de duración D días para cadañ hid ló i P t áli i i d laño hidrológico. Para este análisis, se recomiendan la
distribución Log-Pearson III y Weibull donde en lugar deusar la probabilidad de excedencia se usa la de noexcedencia. Esto es importante porque el evento de tiempode retorno de x años (TR) es el valor que no debe serexcedido.
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
Distribución de Wakeby
Esta distribución fue introducida en los análisis de losvalores de caudales máximos por Houghton. Comodefine Houghton en su trabajo, esta distribución es unadistribución “parent” (madre u origen de las otras). Esuna distribución de 5 parámetros que supera a lastradicionales de dos o tres parámetros, de modo que semuestra más flexible sobretodo en relación con laseparación de la cola derecha y de la izquierda de lap y qdistribución.
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 38
DISTRIBUCIONES DE PROBABILIDAD
Di t ib ió d W k bDistribución de Wakeby
La función inversa de distribución de probabilidad es:
Donde F es la variable uniforme (0, 1), F = F(x), a, b, cd i i i i i
eFcFax db 1*1*
y d son siempre positivas y e a veces es positiva.(Houghton, 1978).
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDAD
Distribución de Wakeby
Esta distribución fue introducida en los análisis de losvalores de caudales máximos por Houghton. Comodefine Houghton en su trabajo, esta distribución es unadistribución “parent” (madre u origen de las otras). Esuna distribución de 5 parámetros que supera a lastradicionales de dos o tres parámetros, de modo que semuestra más flexible sobretodo en relación con laseparación de la cola derecha y de la izquierda de lap y qdistribución.
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 39
DISTRIBUCIONES DE PROBABILIDAD
Aplicaciones frecuentes en diseño hidrológico
Las funciones de distribución de variables aleatorias tienen unaLas funciones de distribución de variables aleatorias tienen unafuerte aplicación en diseño hidrológico. Una distribución deprobabilidad es una función que representa la probabilidad deocurrencia de una variable aleatoria. Esto significa que el ajuste delos datos de una muestra de una variable hidrológica permitedescribir en forma compacta, la función y sus parámetros,explicando mediante ellos, el comportamiento a esperar de lavariable hidrológica.
Si una variable hidrológica x se obtiene por medio de una muestrade una población, el procedimiento común en estadística, esprimero seleccionar la función de distribución que mejor ajuste. Estaselección se hace mediante la experiencia adquirida en eltratamiento de la misma variable en otros lugares o situacionestratamiento de la misma variable, en otros lugares o situacionesconocidas (caudales de los ríos, lluvias en un lugar) o también porconsideraciones físicas (régimen hidrológico, condicionesmeteorológicas) o simplemente por ensayo y error. Actualmente,esto es posible con el uso de la computación y los programasexistentes que permiten hacerlo con facilidad y rapidez. El segundopaso, es estimar los parámetros de esa distribución por métodos deajuste para finalmente calcular los límites de confianza y realizar laspruebas de bondad de ese ajuste.
C.L.V.P. - 2014
DISTRIBUCIONES DE PROBABILIDADResumen de las Funciones de Distribución de Probabilidad más usadas en Hidrología
Tipo de Distribución Utilización Observaciones
Binomial Variables discretas Eventos si – no
Poisson Variables discretas Si al probabilidad es pequeña y el número de eventos N grandenúmero de eventos N, grande
Normal (Gauss) Variable continua Records extensos de lluvia y cuadales medios de largos intervalos (1 año, 2 años, 5 años, 10 años)
Log-Normal de 2 parámetros y de 3 parámetros
Variable continua Precipitación, caudales anuales.Series de duración parcial
Gamma de 2 parámetros Variable continua Frecuencia de caudales y lluvias.Generación de hidrogramas sintéticos
Tipo I (Gumbel) Valores extremos Valores extremos de caudales
Tipo II (Frechet) Valores extremos,limite inferior cero
Log – Gumbel en un caso especial de tipo II.
Tipo III (Weibull) Existe un limitesuperior (E)
Valores mínimos de caudales o lluvias
General de Valores Extremos (GEV)
Incluye los Tipo I, II y III
Determinación del tipo de distribución más conveniente
Wakeby Es de uso general Explica el “Efecto de Separación”
Exponencial Semilogaritmica Series de duración parcial
Log-Pearson III Variable continua Caudales y lluvias máximas anuales.C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 40
AJUSTE DE LA DISTRIBUCIÓN. ESTIMACIÓN DE PARÁMETROS
Después que los datos han sido ordenados y depuradosel principal objetivo de la inferencia estadística es laestimación de los parámetros de la función dedistribución de probabilidad.
Cuanto más confiable sea la estimación de losparámetros en la muestra, mejor y más confiable será lainformación que se puede extraer del análisisq pestadístico. Si los datos son buenos a mayor número deellos más cercano se estará de la verdadera distribución.
C.L.V.P. - 2014
AJUSTE DE LA DISTRIBUCIÓN. ESTIMACIÓN DE PARÁMETROS
Los métodos de ajuste son de dos clases: analíticos ygráficos. El cálculo analítico con resultado analítico-gráfico es incluido en los software actuales. En general elcálculo de parámetros para ajuste de la curva dedistribución se hace por tres métodos analíticos: elmétodo de los momentos; el método de mínimos
é ácuadrados y método de máxima verosimilitud.
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 41
AJUSTE DE LA DISTRIBUCIÓN. ESTIMACIÓN DE PARÁMETROS
Métodos Analíticos
Los métodos descritos a continuación, son los ajustesanalíticos de un conjunto de datos a una curva dedistribución de probabilidad.
C.L.V.P. - 2014
AJUSTE DE LA DISTRIBUCIÓN. ESTIMACIÓN DE PARÁMETROS
Método de los Momentos
Por este método introducido por Pearson, se establecen relaciones entre los N parámetros de la distribución seleccionada y los n primeros momentos de la muestra. Así para cada parámetro , β, ..n tendrá una ecuación:
...., 11 iif
....,
....
....,
....,
1
12
11
kkN
jj
ii
fN
f
f
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 42
AJUSTE DE LA DISTRIBUCIÓN. ESTIMACIÓN DE PARÁMETROS
Método de los mínimos cuadrados
E t ét d d hid l í ól j tEste es un método muy usado en hidrología, no sólo para ajustarfunciones de distribución, sino también curvas de caudales en ríos(relación h/Q), ecuaciones de regresión de correlaciones entreestaciones de caudales, ajuste de curvas de intensidad–duración–frecuencia de lluvias, etc. Por este método se calcula una línea deregresión (en lo posible recta) para ajustar los datos graficados. Lalínea que se obtiene puede no representar exactamente ladistribución teórica, pero, en general puede producir un ajuste igualo mejor que el método de los momentos.
Basado en este método Chow (1951) propuso un método general deajuste de análisis de frecuencias hidrológicas, mediante un factor deajuste de análisis de frecuencias hidrológicas, mediante un factor defrecuencia.
El ajuste de una distribución se puede hacer, ya sea a una de lasconocidas distribuciones de frecuencia de probabilidad o a cualquierotra curva empírica que la observación del gráfico de los valores dela variable pueda sugerir. En el caso de una función:
C.L.V.P. - 2014
AJUSTE DE LA DISTRIBUCIÓN. ESTIMACIÓN DE PARÁMETROS
Método de los mínimos cuadrados
En el caso de una función:
Los datos deben ser ajustados mediante la mejorestimación de los parámetros , β, . El métodominimiza la suma de los desvíos al cuadrado de losvalores observados y los calculados, así:
...),,;( xfy
y ,
N N
iii xfyyyS1
2
1
2 ,...,,;
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 43
AJUSTE DE LA DISTRIBUCIÓN. ESTIMACIÓN DE PARÁMETROS
Método de los mínimos cuadrados
Donde: xi e yi son las coordenadas de los datosobservados y N el número de datos (tamaño de lamuestra). La línea dada por la función f(x, , β, ...)debe también ser minimizada y por lo tanto, todas lasprimeras derivadas parciales con respecto a , β , deben ser cero: Por lo tanto:
NN
...;0; 1
2
1
2
N
ii
N
ii yyyy
C.L.V.P. - 2014
AJUSTE DE LA DISTRIBUCIÓN. ESTIMACIÓN DE PARÁMETROS
Método de los mínimos cuadrados
d d bDe estas derivadas se obtienen n ecuaciones paraencontrar n parámetros. Como, en general se trata deajustar a una recta de la forma:
O en forma logarítmica, si es el caso, los parámetros yβ se encuentran como:
xy *
__
** yxNyxN
__
1
2_2
1
*
xy
xNx
yxNyx
N
ii
iii
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 44
AJUSTE DE LA DISTRIBUCIÓN. ESTIMACIÓN DE PARÁMETROS
Método de los mínimos cuadradosMétodo de los mínimos cuadrados
Para el caso de una ecuación cuadrática de la forma:
Se plantean tres ecuaciones para determinar los tresparámetros a, b, c:
2** xxy
N
i
N
i
N
i xxNy 2***
N
ii
N
ii
N
ii
N
iii
N
ii
N
ii
N
ii
N
iii
iii
xxxyx
xxxyx
1
4
1
3
1
2
1
2
1
3
1
2
11
111
****
****
C.L.V.P. - 2014
AJUSTE DE LA DISTRIBUCIÓN. ESTIMACIÓN DE PARÁMETROS
Método de Máxima VerosimilitudMétodo de Máxima Verosimilitud
Por este método se determinan los valores de losparámetros en forma de obtener la función deverosimilitud. Si se tiene una función de densidad deprobabilidad f(x; ; β ...) de una variable continua x conlos parámetros , β... a ser estimados, el productoinfinito o función de verosimilitud de una muestra de Nvalores de una variable continua x es:
N
iixfL
1
...),;(
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 45
AJUSTE DE LA DISTRIBUCIÓN. ESTIMACIÓN DE PARÁMETROS
Método de Máxima Verosimilitud
Si la variable es discreta y la función de probabilidadacumulada es: Pi (x; , β) la función de verosimilitud esel producto:
Como uno alcanza su máximo valor, para ciertos valores de , β,..., se aplican logaritmos; luego la ecuación es:
N
iii xPL
11 ...),;(
, β, , p g ; g
N
ii
N
ii xfxfLLn
11
...,;ln...,;ln
C.L.V.P. - 2014
AJUSTE DE LA DISTRIBUCIÓN. ESTIMACIÓN DE PARÁMETROS
Método de Máxima Verosimilitud
De sus derivadas parciales en , β,...igualadas a cero, seobtienen las funciones de máxima verosimilitud queserán tantas ecuaciones como parámetros a determinar:
...;0)ln(
;0)ln(
LL
El método da mejores resultados para muestras grandes En este caso, provee la mejor estimación de los parámetros, aunque su aplicación práctica resulta la más compleja que otros métodos.
C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 46
TEST DE BONDAD DE AJUSTE
Una curva de frecuencia desarrollada a través de unamuestra de datos, se supone que es la mejor estimaciónde la curva de frecuencia de la población.
La aplicación de los test de bondad de ajuste adeterminadas distribuciones, puede ayudar a seleccionaraquella que mejor represente a la distribución defrecuencia de la población. Si bien, se han mencionadocriterios generales, obtenidos de la experienciahidrológica para seleccionar una determinadadistribución de frecuencia, no existen verdaderosdistribución de frecuencia, no existen verdaderosacuerdos en este sentido y lo cierto es, como loestablece el USWRC (1982), “ninguna distribución es lamejor para todos los criterios, luego el juicio delhidrólogo resulta fundamental”.
C.L.V.P. - 2014
TEST DE BONDAD DE AJUSTE
Test de Ji-cuadrado (2)
Este método se usa tanto para verificar distribuciones depprobabilidad, ya sean distribuciones continuas con grupos de datosexpresados como frecuencia absolutas de intervalos de clase ocomo frecuencias absolutas en distribuciones discretas. Es unmétodo para métrico que se evalúa mediante la expresión:
N
i i
ii
pn
pnf
1
22
*
)*(
En esta ecuación n es el número de intervalos de clase paravariables discretas o el número de eventos para variablescontinuas, fi son las frecuencias absolutas observadas de cadaevento (o de cada intervalo de clase) y pi es la probabilidad de loseventos (o de los intervalos) calculados con la ecuación a verificarp(x, α, β, γ...).C.L.V.P. - 2014
07/09/2014
C.L.V.P. 2014 47
TEST DE BONDAD DE AJUSTE
Test de Kolmogorov-Smirnov (K-S)
El método Kolmogorov-Smirnov (K-S) se usa cuando no se verifican El método Kolmogorov Smirnov (K S) se usa cuando no se verifican parámetros de una distribución previa y se trabaja con una distribución acumulada.
En este método se determina la máxima desviación entre la posición degraficación experimental (Pxi) la distribución acumulada teórica (F(x)). Sise tiene una muestra de n datos x1, x2, x3....xn en orden ascendente odescendente y sus posiciones de graficación dadas por P(xi) = m/n+1, seobtiene el gráfico de una preseleccionada distribución empírica. Luego,F(x) el verdadero valor de la distribución teórica la máxima diferencia sedefine como:
Donde Do, es el valor de la máxima desviación entre la curva experimental y la teórica. En algunos casos, este valor puede corresponder a la cola de la distribución donde el ajuste no es tan necesario.
)()(max0 ixPxFD
C.L.V.P. - 2014