análisis de datos en física de partículas · 2013. 6. 5. · funciones de una variable aleatoria...

18
J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 1 Análisis de Datos en Física de Partículas Sección de Posgrado Facultad de Ciencias Universidad Nacional de Ingeniería C. Javier Solano [email protected] http://compinformatidf.wordpress.com/ Página del curso: http://compinformatidf.wordpress.com/2013/04/13/ curso-analisis-estadistico-de-datos-en-fisica-de-particulas-mf708/

Upload: others

Post on 02-Feb-2021

2 views

Category:

Documents


0 download

TRANSCRIPT

  • J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 1

    Análisis de Datos en Física de Partículas

    Sección de PosgradoFacultad de CienciasUniversidad Nacional de Ingeniería

    C. Javier [email protected]://compinformatidf.wordpress.com/

    Página del curso:http://compinformatidf.wordpress.com/2013/04/13/curso-analisis-estadistico-de-datos-en-fisica-de-particulas-mf708/

  • Análisis de Datos en Física de Partículas: Capítulo 2

    1 Teorema de Probabilidad de Bayes, Variables aleatorias, y pdfs2 Funciones de r.v.s, Valores de expectación, propagación de errores3 Catálogo de pdfs4 El método de Monte Carlo5 Test estadísticos: conceptos generales6 Test statistics, métodos multivariantes7 Tests Bondad de ajuste (goodness-of-fit)8 Parámetros de estimación, maximum likelihood9 Mas de maximum likelihood10 Método de mínimos cuadrados (least squares)11 Intervalo de estimación, establecimiento de límites12 Parámetros molestos (nuisance), incertidumbres sistemáticas13 Ejemplos de aproximación Bayesiana

    J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 2

  • Funciones de una variable aleatoria

    J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 3

    Una función de una variable aleatoria es en sí misma una variable aleatoria.

    Supongamos que x sigue una pdf f(x), consideremos una función a(x).

    ¿Que es la pdf g(a)?

    dS = región del espacio x para el cuala está en [a, a+da].

    Para el caso de variable con inversaúnica esto simplemente es

  • Funciones sin inversa única

    J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 4

    Si inversa de a(x) no es única,incluir todos los intervalos dx en dSque corresponden a da:

    Ejemplo:

  • Funciones de mas de una r.v.

    J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 5

    Considerar r.v.s y una función

    dS = región del espacio-x entre (hyper)superficies definidas por

  • Funciones de mas de una r.v. (2)

    J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 6

    Ejemplo: r.v.s x, y > 0 siguen pdf conjunta f(x,y),

    considerar la función z = xy. ¿Qué es g(z)?

    (Convolución de Mellin)

  • Más en la transformación de variables

    J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 7

    Considerar un vector aleatorio con pdf conjunta

    Formar n funciones linealmente independientes

    Para las que las funciones inversas existan.

    Entonces la pdf conjunta del vector de funciones es

    donde J es el

    determinante Jacobiano:

    Por e.g. integra sobre componentes que no queremos.

  • Valores de expectación

    J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 8

    Considerar r.v. continuo x con pdf f(x).

    Definir valor de expectación (medio) como

    Notación (frecuente): ~ “centro de gravedad” del pdf.

    Para una función y(x) con pdf g(y),

    (equivalente)

    Variancia:

    Notación:

    Desviación Standard:

    σ ~ ancho del pdf, mismas unidades que x.

  • Covariancia y correlación

    J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 9

    Definir covariancia cov[x,y] (tambien usar notación matricial Vxy) como

    Coeficiente de correlación (adimensional) definido como

    Si x, y, independiente, i.e., , entonces

    → x e y, ‘no correlacionados’

    N.B. lo contrario no siempre es cierto.

  • Correlación (cont.)

    J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 10

  • Propagación de errores

    J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 11

    que cuantifican los errores de medición en xi.

    Suponer que medimos un conjunto de valores

    y que tenemos las covariancias

    Ahora considerar la función

    ¿Cual es la variancia de

    El camino difícil: usar pdf conjunta para hallar la pdf

    entonces de g(y) hallar V[y] = E[y2] − (E[y])2.

    Frecuentemente impráctico, puede ni siquiera ser bien conocido.

  • Propagación de errores (2)

    J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 12

    Suponer que tenemos

    en la práctica sólo estimaciones dadas por la medida

    Expandir a 1st orden en una serie de Taylor como

    desde que

    Para hallar V[y] necesitamos E[y2] y E[y].

  • Propagación de errores (3)

    J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 13

    Poniendo los ingredientes juntos da la variancia de

  • Propagación de errores (4)

    J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 14

    Si los xi no están correlacionados, i.e., entonces esto

    Similar para un conjunto de m funciones

    O en notación matricial donde

    se convierte en

  • Propagación de errores (5)

    J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 15

    La formulae de ‘propagación de errores’ nos da las covariancias de un conjunto de funciones en términos de las covariancias de las variables originales.

    Limitaciones: exacta solo si lineal.Aproximación falla si función es nonlineal sobre una región comparableen tamaño al σi.

    N.B. No hemos dicho nada acerca de la pdf exacta del xi,

    por ejemplo, que no tiene que ser gaussiano.

    x

    y(x)

    σx

    σy

    xσx

    ?

    y(x)

  • Propagación de errores – casos especiales

    J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 16

    Esto es, si los xi no son correlacionados:

    añadir errores cuadráticamente para la suma (o diferencia), añadir errores relativos cuadráticamente para el producto (o radio).

    Pero correlaciones pueden cambiar esto completamente...

  • Propagación de errores – casos especiales (2)

    J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 17

    Considerar con

    Ahora supongamos ρ = 1. Entonces

    i.e. para 100% de correlación, error en la diferencia→ 0.

  • Terminando Capítulo 2

    J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 18

    Conocemos como determinar el pdf de una funcion de una r.v.

    una variable, inversa única:

    también vimos inversa no-única y caso multivariante.

    Conocemos como describir un pdf usando

    valores de expectación (media, variancia),covariancia, correlación, ...

    Dada una función de una variable aleatoria, conocemos comohallar la variancia de la función usando propagación de errores.

    También para matriz covariancia en caso multivariante;basado en aproximación lineal.