estadistica univariada

Post on 12-Jul-2015

6.194 Views

Category:

Technology

2 Downloads

Preview:

Click to see full reader

TRANSCRIPT

ESTADÍSTICA

SANDRA JIMENA JÁCOME VELASCOFisioterapeuta

Esp. Docencia universitariaEsp. Epidemiología general

Candidato Mg. Educación superiorsamimena@gmail.com

QUE ES ESTADÍSTICA

La estadística es un método científico de operar con los datos e interpretarlos.

Arte de decisión frente a una incertidumbre

AREAS DE APLICACIÓN

Es aplicable a cualquier campo en el cual se hacen observaciones

Gobierno: economía, inventarios, censos

Salud

Seguros

Juegos del azar

Comercio

Industria

Educación

TIPOS DE ESTADÍSTICA

ESTADÍSTICA DESCRIPTIVA O DEDUCTIVA: Método para obtener conclusiones de un conjunto de datos tomados de un colectivo o de una muestra, sin generalizarlos al colectivo

ESTADÍSTICA INFERENCIAL O INDUCTIVA O INFERENCIA ESTADÍSTICA: Método y conjunto de técnicas que buscan obtener información sobre un colectivo mediante un procedimiento metódico de los datos tomados de una muestra perteneciente al colectivo

CONCEPTOS CLAVES

Población o universo o colectivo: conjunto de elementos, medidas, individuos u objetos que tienen una característica común

Parámetro: medida que describe una población

Estadística: medida que describe una muestra

Datos: medidas, valores o características susceptibles de ser observados y contados

Variables

VARIABLES

Característica que puede tener diferentes valores en los distintos elementos o individuos de un conjunto. Se clasifican según

TIPO: Cuantitativa o cualitativa

CLASE: Discreta o continua

ESCALA: Nominal, Ordinal, De intervalo, de razón

UNIDAD 1: DISTRIBUCIONES DE

FRECUENCIA

DISTRIBUCIONES DE FRECUENCIA

Definición

Elementos para la construcción de tablas de frecuencia

Elaboración de tablas de frecuencia

Graficas de la distribución de frecuencia

Histogramas

Definición: distribución de frecuencia

Representación estructurada en forma de tabla, de toda la información que se ha recogido sobre la variable que se estudia

Elementos Para La Construcción De Tablas De Frecuencia

X= valores que puede tomar una variable

n= número de veces que se repite cada valor

F= % porcentaje que la repetición da cada valor supone sobre el total

Elaboración de tablas de Frecuencia

Variable(valor)

Frecuencia absoluta

Frecuencia relativa

simple acumulada simple acumulada

X1 n1 n1 f1=n1/n f1

X2 n2 n1+n2 f2=n2/n f1+f2

total n Sumatoria n (Σn)

100 Sumatoria f (Σf)

Ejemplo: medida de altura de grupo de niños

Estudiante estatura Estudiante estatura Estudiante Estatura

Pedro 1,25 Erica 1,23 Esteban 1,21

Juan 1,28 Lorena 1,26 Jaime 1,29

Martha 1,27 Patricia 1,30 Amparo 1,26

Lucy 1,21 Jimena 1,21 Camilo 1,22

Eduardo 1,22 Olga 1,28 Manuel 1,28

Pablo 1,29 Rosa 1,30 Esther 1,27

Santiago 1,30 Rodrigo 1,22 Mariela 1,26

David 1,24 Alejando 1,25 Mauricio 1,23

Jose 1,27 Miguel 1,20 Jairo 1,22

Stella 1,29 Edith 1,28 Orlando 1,21

Al construir una tabla de frec. De la anterior variable quedaría

Variable(valor)2

Frecuencia absoluta

Frecuencia relativa

Simple Acumulada Simple Acumulada

1,20 1 1 3,3% 3,3%

1,21 4 5 13,3% 16,6%

1,22 4 9 13,3% 30%

1,23 2 11 6,6% 36,6%

1,24 1 12 3,3% 40%

1,25 2 14 6,6% 46,6%

1,26 3 17 10% 56,6%

1,27 3 20 10% 66,6%

1,28 4 24 13,3% 80%

1,29 3 27 10% 90%

1,30 3 30 10% 100%

Total 30 30 100% 100%

Graficas de la distribución de frecuencia

El objetivo de los gráficos es facilitar la lectura e interpretación de los resultados de una variable.

Se elaboran según el tipo de variable y la población a la cual va dirigida

Loa tipos de gráficos mas frecuencia utilizados son: gráficos de línea, gráficos de barra, pictogramas, tortas o diagramas de pastel o circulares e histogramas.

Ejemplos de gráficos

0102030405060708090

1er trim. 2dotrim.

3er trim.4to trim.

Este

Oeste

Norte

0

50

100

1ertrim.

2dotrim.

3ertrim.

4totrim.

casos dediarrea

1er trim.

2do trim.3er trim.

4to trim.

0

5

10

15

20

25

30

35

40

45

1,22

1,23

1,24

G. De barras

Histograma

G. De Circular, pastel, tortaG. De línea

Pictograma

Vivienda por ciudades en 2007 =1000000

Bogotá

PopayánCali

Uso – elección tipo de gráfico

*Los pictogramas son gráficos de dibujos utilizados para comparaciones que impacten visualmente, llamando la atención del público en general

G. circulares: para distribuciones porcentuales, con variables cuyos valores asignados (posibles respuestas) no superan cuatro opciones (Ej: M-F, Alto-medio-bajo)

G. de barra: para presentar valores de variables cualitativas o cuantitativas discretas con valores asignados de tres o mas posibilidades (Ej: estrato 1, 2, 3, ,4, 5, 6)

Histogramas: para presentar valores de variables cuantitativas continuas con valores asignados de dos o mas posibilidades (Ej: talla, peso)

G. de línea: para presentar series de datos acumulativos (Ej ventas, producción) o datos instantáneos (Ej: tº, inventarios)

UNIDAD 2: MEDIDAS DE TENDENCIA CENTRAL

MEDIDAS DE TENDENCIA CENTRAL

También llamadas medidas de posición central. Permiten conocer algunas características de una serie de datos.La tendencia central se refiere al punto medio de una distribución Son: La media aritmética, la mediana, la moda, media geométrica y media armónica

La Media Aritmética

También conocida como promedio XEquivale a la suma de sus valores dividido por su númeroN=número de observacionesX=valor de cada observaciónX=media aritmética, media o X barra

X=ΣX

N

Ventajas y desventajas de la media

Es la medida de tendencia central mas estable, fluctúa menos que la moda o la mediana

Es útil para establecer comparaciones entre los grupos, aunque en algunas ocasiones no es la mas indicada

Media geométrica

Es la raíz índice N del producto de N términosMd geométrica = N X1X2…XNEs útil en el cálculo de tasas de crecimiento.Ej: 2,4,6,12,18 Mdgeométrica= 5 (2)(4)(6)(12)(18) =

Media armónica HEs el recíproco de la media aritmética, de los recíprocos de los números de la serie 1 + 1 ……1 1 = X1 X2 Xn H NEj. Un Fisioterapeuta recupera un paciente en 6 días y otro en 8 días. El rendimiento representativo del rendimiento de los dos Ft. Es 1 + 11 = 6 8 = 1= 7 = H 2 H 48

La mediana (Md o Mdn)Valor que divide una distribución de datos ordenados en dos mitades, deja por arriba un número de términos igual al que deja por debajo Es el término del medio del conjunto de datos. Punto de un escala numérica por arriba y por abajo del cual se encuentran el 50% de los datos. No toma en cuenta los valores cuantitativos de los puntajes individuales, ni se ve afectada por los valores extremosMd=N+1 2

Cálculo de mediana a partir de datos no agrupados: en primer lugar es necesario organizarlos ya sea de manera ascendente o descendente. Si el conjunto de datos contiene un número par de elementos, el de en medio es la mediana. Si hay un número par de observaciones la mediana es el promedio de los dos elementos de en medio

Ej: 7,8,8,10,12,19,23 Med=10

3,4,4,5,16,19,25,30 Med= (5+16)/2 =

Ventajas y desventajas de la mediana

Los valores extremos no afectan a la mediana tan intensamente como a la media

La mediana es fácil de entender y se pude calcular partir de cualquier tipo de datos, incluso para valores cualitativos.

Es necesario organizar los datos previamente, lo que implica consumo de tiempo

Moda

Valor numérico mas frecuente en una distribución. Es la mas sencilla de las medidas de tendencia central, no se calcula, se determina mediante una inspección de una distribución de frecuencias

Ventajas y desventajas de la moda

Es rápido y sencillo de obtener

Es inestable, tiende a fluctuar ampliamente de una muestra a otra aunque provenga de la misma población

Se utiliza poco, excepto para la descripción de valores típicos en mediciones de escala nominal

Curva de un distribución de frecuencias y las medidas de tendencia central

Media

MedianaMediana

Moda

Punto de equilibrio. Semejante a un centro de gravedadDivide el área bajo la curva en dos partes igualesEs el pico de la curva o mayor ordenada

Simetría

En una distribución simétrica las tres medidas de tendencia central son idénticas. Si la distribución se torna asimétrica, la moda sigue igual, pero la mediana y la media se corren en dirección de la asimetría.La asimetría es positiva hacia la derecha y negativa hacia la izquierda

En la asimetría positiva, la mediana aumenta por el mayor número de frecuencias hacia la derecha, y la media aumenta mas

En las asimetrías negativas ocurre lo contrario

S

UNIDAD 3: MEDIDAS DE DISPERSIÓN

DEFINICIÓN

Información que permite apreciar la dispersión de los valores alrededor de las medidas de tendencia central

Grado en que los resultados se desvían uno de otro

CUALES SON

RANGO

CUARTIL

DECIL

DESVIACIÓN MEDIA

VARIANZA

DESVIACIÓN TÍPICA O ESTÁNDAR

RANGO

Diferencia entre los límites superior e inferior

Es la medida de dispersión mas fácil de obtener, pero es poco utilizada, debido a que es muy influenciable por la presencia de valores extremos de poca frecuencia, lo que lleva a operaciones erróneas

Sólo toma dos valores por lo que es una medida bastante inestable

CUARTILES

Sirven para conocer los intervalos dentro de los cuales quedan proporcionalmente distribuidos los términos de una distribución

Al dividir la distribución de frecuencias en 4 partes iguales, cada una contendrá el mismo número de observaciones (25% del total)

Un cuartil es el punto de separación de los valores

El primer cuartil corresponde al 25% (Q1)

El segundo cuartil (Q2) coincide con la mediana y corresponde al 50% de los valores

El tercer cuartil (Q3) separa el 75% de las observaciones que quedan debajo de el

DECILES

En vez de dividir la distribución en 4 partes iguales, se divide en 10 partes iguales, se tienen 9 puntos de división

El primer decil corresponde al valor por debajo del cual está el 10% de las observaciones y así sucesivamente

Desviación media

Es la media aritmética de los valores absolutos de las desviaciones de las variables respecto a la media aritméticaDM=Sumatoria X-X NEs una medida bastante objetiva, cuanto mayor sea

su valor mayor es la dispersión de los datos, pero no proporciona una relación matemática precisa entre su magnitud y la posición de un dato dentro de la distribución

Permite comparar varios resultados

Ej: desviación promedio de disparos en el tiro al blanco de un jugador respecto a otro

No toma los signos negativos

Varianza

S² es la media aritmética de los cuadrados de las desviaciones respecto a la media aritmética

S²= Sumatoria (X-X) ²

N

Al elevarla al cuadrado se omiten los valores negativos de los datos, pero mide la dispersión en el valor al cuadrado

Ej si es centímetros, mide en centímetros cuadrados

Desviación típica o estándar

Es la más importante de todas las medidas de dispersión

Conociendo la desviación estándar es posible ubicar la posición de una observación respecto a una serie de observaciones

Resume la magnitud promedio en que los valores individuales se desvían de la media

La desviación estándar o típica es la raíz cuadrada de la varianza

S= √ S²

ESTADISTICA DESCRIPTIVA EN

SPSS

Generalidades

Recuerda que el SPSS (Stadistical pack for social sciences) para windows es un programa de computador que se utiliza para realizar una gran variedad de análisis estadísticos, así como gráficos y tablas

Creando la base de datos

En la pantalla que ves a continuación, encontrarás en la esquina inferior izquierda dos pestañas, una que dice vista de variables y otra vista de datos.

Elige la vista de variables, para comenzar a crear la estructura de la base de datos

Como observaste en la dispositiva anterior, ya se creo una base de datos. Revisemos los pasos: Columna

1. Nombre: escribe un nombre como lo recuerdes. Máximo 8 caracteres

2. Tipo: Elije la pestaña de clasificación de variable según su naturaleza o tipo. Las variables numéricas equivalen a las cuantitativas y las de cadena equivalen a las cualitativas

Si elegiste una variable numérica escribe el número de anchura (Números enteros) que requieras y el número de decimales que posean tus datos a registrar. Recuerda que el número de anchura siempre debe ser mayor que el número de decimalesSi elegiste una variable de cadena escribe el número de caracteres (Números de letras que posee) que posean tus datos a registrar.

Automáticamente te aparecerán llenas las dos columnas siguientes

3. Etiqueta: Escribe aquí el nombre con el cual quieres que te salgan los título de las variables en los resultados. Puedes escribir como desees, es decir mayúscula sostenida, inicial, minúscula, caracteres especiales, etc…

4 Valores: En ésta columna se abre una ventana donde escribes los valores de la variable, si los tiene. Ej: la variable sexo o género se puede codificar con el número 1 (Masculino) y el 2 (Femenino). Entonces en la ventana de valor escribes el número 1 y en etiqueta de valor escribes masculino, añadir. Así realizas con los demás valores y cuando finalices le das la orden aceptar

5 Perdidos: Aquí determinas aquellos valores que vas a llamar perdidos según los valores asignados. Ej: en la variable “vida” las etiquetas de valor indican que los números o códigos o, 8 y 9 equivalen a 0 No procede8 No sabe9 No respondeLos cuales se tomarán como valores perdidos del sistema y se señalan en perdidos

6 y 7 Columnas y alineación: éstas dos columnas se utilizan para definir el número de columnas y hacia donde quieres que se alineen los datos

8 Medida: esta columna permite seleccionar la escala en que se clasifica la variable, la cual en el programa SPSS puede ser

Escala: de intervalo y de razón

Ordinal: ordinal

Nominal: nominal

!LISTA LA ESTRUCTURA DE LA BASE DE DATOS¡

Ahora pasa a la pestaña vista de datos ubicada en la esquina inferior izquierda y empieza a digitar los datos

ESTADÍSTICA DESCRIPTIVA

Recuerda lo revisado en clase sobre medidas de tendencia central, medidas de dispersión y gráficosDecide la variable a analizar, recuerda guiarte por tu cuadro de clasificación de variables y según la naturaleza o tipo y medida, elije los procedimientos estadísticos a realizar

Pasos

Elije la opción “Analizar” ubicada en la barra superior de la pantalla

Elije la opción “Estadísticos descriptivos”

Elije la opción Frecuencias

Aparecerá una nueva ventana llamada “Frecuencias” y en la parte izquierda aparece el listado de variables a los cuales les puedes aplicar los procedimientos estadísticos predeterminados.

Elije la variable a trabajar, selecciónala con el ratón y pásala con la fecha a la ventana derecha

Selecciona la opción “mostrar tablas de frecuencia”

Selecciona la pestaña “Estadísticos”

Aparecerá una nueva ventana donde te ofrece las opciones de estadísticos que según el tipo y medida de variable el programa te permite realizar

Selecciona la o las opciones deseadas y finalizas con la opción “Continuar”

Selecciona la pestaña “Gráficos” si deseas que éstos aparezcan en los resultados

Aparecerá una nueva ventana donde te ofrecen tres opciones de gráficos mas utilizados

Selecciona el tipo de gráfico mas adecuado según el tipo de variable

Si elijes gráficos de barras o de sectores (Tortas) se activará la opción valores del gráfico, elije preferiblemente porcentajes, recuerda que es lo que puedes comparar

Si elijes la opción histogramas se activará la opción “Con curva normal”. Esta opción se revisará en clases posteriores

Finaliza con la opción “Continuar”

Aparecerá una nueva pantalla con los resultados de los procesos solicitados anteriormente

Esta nueva pantalla aparece con el nombre visor de SPSS y la extensión SPO

Puedes utilizar igualmente la opción “Analizar”, “Estadísticos descriptivos”, “Descriptivos” para aquellas variables numéricas

Igualmente aparecerá una nueva ventana donde encuentras las variables numéricas, selecciona la variable a analizar y la pestaña “opciones”

En la nueva ventana elije las medidas estadísticas que necesites y oprimes “Continuar”

Aparecerá una nueva pantalla con los resultados: visor de SPSS con extensión SPO

Otra forma de trabajar estadística descriptiva con SPSS, es cruzando dos variables para identificar como se distribuyen en un mismo análisis, sin establecer relación entre éstas

Un ejemplo es identificar como es la distribución de la edad de una población según el género

Elije la opción “Analizar”, “Estadísticos descriptivos”, “tablas de contingencia”

Aparecerá una nueva ventana donde te aparecen las variables en el lado izquierdo y en el lado derecho aparece las opciones “filas” y abajo “columnas”

Selecciona en “Filas” aquella variable que sea independiente

Selecciona en “Columnas” aquellas variables que sean dependientes

Selecciona la opción “Mostrar los gráficos de barra agrupadas”Selecciona la pestaña “casillas”Elije la opción “Frecuencias”: observadas“Porcentaje”: filas o columnas y total (si quieres determinar los porcentajes en filas y/o columnas y totales)Selecciona la pestaña “continuar”Selecciona la pestaña “Aceptar”Nuevamente aparecerá la pantalla de resultados en el visor de SPSS con extensión SPO

Guardalo…

Puedes guardarlo con el nombre que desees

Elije la pestaña superior izquierda: “Archivo”, “Guardar como” y le asignas el nombre y ubicación deseado

También puedes seleccionar con el botón izquierdo del ratón una tabla o gráfico y con el botón derecho le dices “copiar” y luego lo pegas en word o donde quieras

Recuerda que previo a guardarlo en Word, debes realizar los cambios de forma, color, trama, entre otros, de los gráficos, dándole doble clic sobre el gráfico, aparecerán varias opciones de cambio, elije y modifica como mas te guste y se adapte a las necesidades

FINALIZASTE LOS CONCEPTOS BÁSICOS DE ESTADÍOSTICA

UNIVARIADA

BIBLIOGRAFÍA

PORTUS Govinden, Lincoyán. Curso práctico de estadística. Ed. McGraw Hill. Colombia, 1991

MILTON, J. Susan. Estadística para bilogía y ciencias de la salud. Ed. McGraw Hill 3.ed. España, 2001

MENDEZ, Ignacio y cols. El protocolo de investigación. México, 1991

MANUAL DE SPSS PARA WINDOWS

top related