estadísticas y definiciones básicas (cap. i) · es utilizada para la colección de datos tales...
TRANSCRIPT
Estadísticas y definiciones Estadísticas y definiciones Estadísticas y definiciones Estadísticas y definiciones básicas (Cap. I)básicas (Cap. I)básicas (Cap. I)básicas (Cap. I)
Mat. 298Mat. 298Mat. 298Mat. 298
Prof. Gaspar Torres RiveraProf. Gaspar Torres RiveraProf. Gaspar Torres RiveraProf. Gaspar Torres Rivera
1.1 Estadísticas
Es utilizada para la colección de datos tales como e l número de accidentes de tráfico, matriculados, núme ro de pacientes que entran a una clínica.Estadísticas se define como una característica de u n conjunto de datos, por ejemplo el promedio aritméti co, la desviación estándar, coeficiente de correlación, en tre otras. Se puede referir a la metodología estadístic a y su otras. Se puede referir a la metodología estadístic a y su teoría. Es el área que utiliza técnicas y procedimie ntos para coleccionar, organizar, analizar, interpretar y presentar datos y sus hallazgos. Estadísticas como colección de métodos para la planificación de experimentos, obtener datos, analizarlos, interpretarlos y presentar conclusiones basados en los datos. (Triola, 1992).
1.1 Estadísticas
Tareas del estadístico1. Dirigir el diseño de un experimento o encuesta.
Planificar. Reducir el nivel de “bias”.2. Analizar los datos. Analizar la variación de cierta s
características numéricas y no numéricas para características numéricas y no numéricas para determinar si las diferencias son significativas.
3. Presentar e interpretar los resultados. Evaluar s i las aseveraciones son basadas en probabilidades, ya que estas facilitan el proceso de toma de decisiones. Resultados confiables (Mainland, 1963).
¿Son los resultados de los análisis de datos aplica bles a otras poblaciones o grupos?
1.1 Estadísticas
Asignar las definiciones de significancia estadística y significancia práctica . (Popham)
Ejemplos: La efectividad de una droga puede tener c ierto efectos en un grupo de estudio pero estos resultado s efectos en un grupo de estudio pero estos resultado s (efectos): ¿pueden ser generalizados a la población definida o otras?
Estudios de densidad en los huesos pueden tener com o referencia a la población de mujeres pero ¿es aplic able a los hombres?
El uso de las estadísticas
Estadística Descriptiva
Estadística Inferencial
Formular inferencias o conclusiones basadas en un Formular inferencias o conclusiones basadas en un conjunto de información. Generalizar para la poblaci ón del estudio (interés).
El uso de las estadísticas
Metodología estadística1. ¿Cómo los investigadores prueban que una droga es
efectiva para contrarrestar una epidemia?2. ¿Cuán efectivo es el tratamiento para reducir el riesgo
de un ataque al corazón?3. ¿Qué cantidad o uso de contraceptivos (oral) necesi ta 3. ¿Qué cantidad o uso de contraceptivos (oral) necesi ta
para desarrollar probablemente “thromboembolism”?
Se estudian varios casos:Caso 1: Fumar durante el embarazo (Simpson, 1957)
El uso de las estadísticas
Las estadísticas aumentan el nivel de eficiencia y precisión, o sea minimizan los gastos utilizando los recursos disponibles y necesarios.
¿Por qué estudiamos las Estadísticas?
1. Es esencial para entender y realizar investigación en el área de las Ciencias.
2. Las preguntas de investigación son esenciales.
3. Se establece un Protocolo para el estudio.3. Se establece un Protocolo para el estudio.
4. Revisar y entender los artículos de revistas profesionales.
5. Validez y confiabilidad.
Fuentes de Datos
Definición de VariableTipos de VariablesDefinición de DatosTipos de Datos
Dos tipos de investigaciones:• No experimental (Encuestas, estudios de casos,
estudios de correlaciones, estudios longitudinales, etc)• Experimentos (Grupos de control, Investigación con un
grupo)Importancia de la investigación: Facilitar el enten dimiento,
descripción y explicación, predicción.
Fuentes de DatosDefinicionesGrupo experimental (E)Grupo de control (C)
Pruebas clínicasEs un experimento que generalmente es considerado c omo Es un experimento que generalmente es considerado c omo el mejor método para evaluar la efectividad de una droga experimental o un tratamiento nuevo. Pruebas antes-después.En las pruebas clínicas se requiere la aleatoriedad y el “blinding” (los sujetos e investigadores desconocen c uál es el grupo de control y el experimental). Ej. The Salk Vaccine Clinical Trial (Polio)
Poblaciones y muestrasSelección apropiada de muestrasDefiniciones:PoblaciónMuestra
Propósito del muestreo: Representatividad de la pob lación
Ejemplo de un caso clásico: Literary Digest (1936)Encuesta por correo:Elecciones Landon contra Roosevelt
Poblaciones y muestrasSelección apropiada de muestrasDefiniciones:ParámetroEstadístico (a)Muestra aleatoriaMuestra conveniente
En un experimento realizado con una nuevadroga, se determinó el pulso cardiacode 142 pacientes antes de administrárseles ladroga experimental, y una vez más 5 minutosdespués se descubrió que su pulso cardiaco seredujó en promedio en 8.12 pulsaciones . Los
Ejemplo 1Ejemplo 1
redujó en promedio en 8.12 pulsaciones . Losexpertos señalaron que la droga experimentalreduce el pulso cardiaco promedio de la poblaciónN= 4000 pacientes en 9.13 pulsaciones.
Ejemplo 1Población: N=4000 pacientes (medidas)Muestra: n=142 pacientes seleccionadosaleatoriamenteVariable: Reducción del pulso cardiacoParámetro: Reducción promedio del pulso Parámetro: Reducción promedio del pulso cardiaco de la población (µ=9.13 pulsaciones)Estadístico (a): Reducción promedio del pulso cardiaco de la muestra (8.12 pulsaciones)
128.=x
La guardia municipal de un pueblo de P.R.está interesada en el porcentaje deconductores de autos que portan su licencia(sí=1, no=0). Se instaló un puesto deverificación en una carretera principal, y se
Ejemplo 2Ejemplo 2
verificación en una carretera principal, y sedetiene al conductor de cada séptimo automóvil. Suponga que normalmente que 12800 autos pasan por el puesto de verificación. Se seleccionaron 400 autos para estimar el porcentaje de conductores que portan su licencia.
En el estudio se encontró que 300 de 400 portan su licencia de conducir.Determinar:
Población:
Muestra:
Variable:
Parámetro:
Estadístico(a):
Ejemplo 2Población:N=12800 conductores de autos que pasan por esa carreteraMuestra: n=400 conductores de autos seleccionados aleatoriamente (sistemático)Variable:porta o no porta su licencia de Variable:porta o no porta su licencia de conducirParámetro:porcentaje de la población de conductores que porta su licencia (P) Estadístico(a):porcentaje de la muestra de conductores que porta su licencia (p=300/400=0.75=75%)
Ejemplo 2 : Una psicóloga desea determinar si el tiempo promedio tarda un conductor adulto en reaccionar a una situación de urgencia, es en realidad el estándar (0.56 s), como la han afirmado otros estudios. Ella seleccionó una muestra aleatoria de 35 conductores adultos de una N=1000 conductores adultos de una ciudad. Encontró un tiempo promedio de 0.59 s.tiempo promedio de 0.59 s.
Determinar:
Población:
Muestra:
Variable:
Parámetro:
Estadístico(a):
Ejemplo 2 : En un estudio de aviofobia , un psicólogo afirma que el 30% de todas las mujeres temen volar en avión. Si 54 de 200 mujeres, que constituyen una muestra aleatoria, afirman que temen volar en avión, entonces la diferencia entre el parámetro y el estadístico no es significativa.
Determinar:Determinar:
Población:
Muestra:
Variable:
Parámetro:
Estadístico(a):
Puesto que el hígado es el principal lugar para el metabolismo de los fármacos, se espera que los pacientes con enfermedades del hígado tengan dificultades en la eliminación de fármacos. Uno de tales fármacos es la fenilbutazona. Se realiza un estudio de la respuesta del sistema a este fármaco. Se estudian tres grupos: controles normales, pacientes con cirrosis hepática y pacientes con hepatitis activa crónica. A cada sujeto se le suministra 19 mg de fenilbutazona por cada kg de peso. Basándose en los análisis de sangre se determina para cada uno el tiempo de máxima concentración en plasma (en horas). Se obtienen los datos:
Normal Cirrosis Hepatitisobtienen los datos:
Normal Cirrosis Hepatitis
4.0 22.6 16.6
30.6 14.4 12.1
26.8 26.3 7.2
37.9 13.8 6.6
13.7 17.4 12.5
49.0 15.1
6.7
20.0
Prueba no paramétricaPrueba no paramétrica FunciónFunción Prueba Prueba paramétricaparamétrica
Eficiencia de la prueba Eficiencia de la prueba no paramétrica con no paramétrica con
una población normaluna población normal
Prueba de signoPrueba de signo Demostrar diferencia Demostrar diferencia entre dos muestras entre dos muestras dependientesdependientes
Prueba t o zPrueba t o z 0.630.63
Prueba de rangos con signo Prueba de rangos con signo de Wilcoxonde Wilcoxon
Demostrar diferencia Demostrar diferencia entre dos muestras entre dos muestras dependientesdependientes
Prueba t o zPrueba t o z 0.950.95
Prueba U de MannPrueba U de Mann--WhitneyWhitney Demostrar diferencias Demostrar diferencias entre dos muestras entre dos muestras independientesindependientes
Prueba t o zPrueba t o z 0.950.95
Prueba H de KruskalPrueba H de Kruskal--WallisWallis Demostrar si más de dos Demostrar si más de dos muestras provienen de muestras provienen de
ANOVA ANOVA 0.950.95muestras provienen de muestras provienen de poblaciones idénticaspoblaciones idénticas
0.950.95
Correlación de rangos Correlación de rangos (Spearman)(Spearman)
Demostrar si hay relación Demostrar si hay relación significativa entre dos significativa entre dos variables variables
Correlación Correlación lineal de lineal de Pearson Pearson
0.910.91
ChiChi--SquareSquare Contraste entre dos o Contraste entre dos o más grupos con respecto más grupos con respecto a datos de escalas a datos de escalas nominales nominales
Análisis de Varianza de Análisis de Varianza de FriedmanFriedman
Aplica a diseños de Aplica a diseños de mediciones repetidas o mediciones repetidas o pareadas (más de dos pareadas (más de dos grupos de mediciones) grupos de mediciones)
ANOVA para ANOVA para mediciones mediciones repetidas repetidas (muestras (muestras dependientes)dependientes)
Poblaciones y muestras¿Por qué seleccionamos muestras?
Razones para seleccionar muestras1. Es imposible seleccionar la población completa2. Costo3. Otros
Poblaciones y muestrasSelección de muestras
Razones para seleccionar muestras aleatorias1. No permite el “bias” o el sesgo.2. Ayuda a convencer a la gente para que la técnica o
prueba estadística se conduce apropiadamente.3. Es la base de la teoría de la Estadística Inferen cial.
Metodología de la Selección de MuestreoMuestras por convenienciaMuestreo sistemáticoMuestreo estratificado (estratos)Muestreo por conglomerados
Poblaciones y muestrasSelección de muestras aleatorias
SPSS1. Menu 2. Data Box3. Select cases4. Random samples of cases5. Select
Datos incompletos o que faltanTécnica: Carry-forward analysis or Last Observation carry-forward (LOCF) de Ting (2000)
DiseñoSe refiere al plan o estrategia concebida para responder a las preguntas de investigación (Christensen, 1980). Se refiere al método de investigación que utiliza el investigador para buscar contestación a las interrogantes que investiga.
Experimental: Experimento puro, Solomon, Factorial, Cruzados, Cuasiexperimental
No experimental: Transversal (Descriptivo, Correlacional), Longitudinal (tendencia, cohorte, panel).
InvestigaciónPermite mejorar las ciencias de la conducta
humana de las siguientes maneras:
• Facilita el entendimiento• Descripción y explicación. Tomar decisiones.• Predicciones (predecir consecuencias de esas • Predicciones (predecir consecuencias de esas
prácticas y situaciones).
Investigación
No experimental- investigaciones de campo o enlas condiciones naturales donde se manifiestanlos fenómenos que se investigan . No semanipulan los fenómenos que se estudian paraobservar y medir sus reacciones . Descriptivos yobservar y medir sus reacciones . Descriptivos ylos históricos.•Encuestas- investigaciones que se concentranen recoger datos de una población, sobre untema específico y conocido para losparticipantes. (Survey Reseach)
• Estudio de casos- investigación profunda sobre unfenómeno, de existencia real, con el objetivo dedescubrirlo y entenderlo en todos sus aspectos.<Históricos, observación, historia de vida>•Estudio de correlaciones- investigaciones dirigidasa determinar estadísticamente si existe relaciónentre variables.•Estudios longitudinales - investigaciones que se•Estudios longitudinales - investigaciones que sehacen por períodos de tiempo para determinarcambios sobre el fenómeno que se estudia(tendencias, cuestionarios, entrevistas).• Investigaciones ex post facto - dirigida a identificarlas causas de un fenómeno contemporáneodespués que éste se produce.
La investigación no experimental es cualquierinvestigación en la que resulta imposiblemanipular variables o asignar aleatoriamentea los sujetos o las condiciones (Kelliher,1979) .Ventajas. Constituyen un medio eficiente y efectivopara obtener datos acerca de un problema depara obtener datos acerca de un problema deinterés.. Es realista y ofrece un atractivo intrínsecopara la solución de proeblemas. Rara vez suelen considerarse artificial.
Nota: Investigación cualitativa-noexperimental descriptiva. Ej. Etnografía
Desventajas
. Resulta débil en su capacidad parapresentar relaciones causales.. Su propósito no es dilucidar las relacionesde causa y efecto .. Pueden darse casos de interpretaciones. Pueden darse casos de interpretacionesfallidas, ya que trabaja con grupos existentes.
Investigación experimental -se conduce paradeterminar causa y efecto . El investigadormanipula la variable independiente (unasituación, evento o condición) para observar ymedir la reacción en otra situación, evento ocondición .• Investigación con grupo de control C• Investigación con grupo de control C
• Investigación con un grupo - investigación antes– después (pareadas).
•Ejemplo : Mediciones repetidas o cruzadas
EncuestaEstudio de los efectos de la explosión de la Bomba Atómica en Hiroshima y en Nagasaki.X= RadiaciónEste tratamiento no fue controlado o asignado.
ExperimentalExperimentalVeterans Administration Cooperative Study (1963)N=523 sujetos con hipertensión de 16 hospitales de VeteranosTratamiento -Administración de medicamentos orales para la hipertensión, reducir los niveles de presión sanguínea.
Placebo - droga que no tiene efecto en la presión sanguínea.
Estudio Retrospectivo (Estudio de casos)Comparación de los hábitos de fumar de mujeres que tuvieron bebés prematuros contra mujeres que tuvieron bebés cumpliendo con el término de que tuvieron bebés cumpliendo con el término de tiempo.
Estudio Prospectivo (The Framingham Study, 1948)Estudio de “cohortes” o grupos de evolución
CVD=Muertes enfermedades cardiovascularesMuestra: 5209 mujeres y hombres de 30-62 años“Cohortes”- Grupos generacionales (segundo y tercer grupo generacional)
Experimentos clínicosEvaluar la efectividad de una nueva droga o método. Las muestras tienen que ser seleccionadas aleatoriamente. El no hacerlo conduce al “bias” o sobreestimación de la eficacia del tratamiento.
Además para reducir el “bias” se dividieron en grupos de control (C) y experimental (E)
Experimental (Efectividad de la droga contra el Polio, Salk (1954))Grupo de control-200,000 niñosGrupo experimental - 200,000 niños Grupo experimental - 200,000 niños Grupo E recibió la droga experimental mientras el Grupo C recibió una sustancia de sal en agua.Estudio doble ciego - para evitar el problema de que niños que provienen de familias con recursos económicos altos recibieran mejor tratamiento.
Ventajas de los diseños experimentales. Método poderoso disponible para probar las hipótesisacerca de las relaciones de causa-efecto entre lasvariables.. Permite inferir las relaciones causales entrefenómenos.
DesventajasDesventajas. Es poco práctico e imposible en algunas situacionesde investigación.. Aleatoriedad y aplicación de tratamientos en losdistintos grupos.. Los sujetos pueden cambiar su comportamiento alsaber que participan en un estudio provocandocambios.
Diseños cuasiexperimentales. Se manipula la variable independiente (tratamiento).. Carece de una de dos propiedades del diseñoexperiemental: aletoriedad & grupo de control.
Ventajas. Son prácticos.. Brindan información útil para generalizar .. Brindan información útil para generalizar .. Ambientes naturales.
Desventajas. Pueden surgir varias hipótesis rivales que compitancon la hipótesis de manipulación experimental de losresultados observados.
Escalas de MediciónCaracterísticas matemáticas de una variable en elproceso de medición. 1. Nominal - clasifica en categorías o no
numéricas. Los datos de nivel nominal son relacionados con variables cualitativas (código postal, género, S.S., ID, etnicidad,…). Son postal, género, S.S., ID, etnicidad,…). Son mutuamente exclusivas.
2. Ordinal- clasifica las categorías en orden, una respecto con la otra. No se pueden calcular diferencias. Ej. Ranking, Clase Social (4 Alta 3 Media 2 Trabajadora 1 Pobre). No podemos decir que el 4 es el doble de 2. No son permitidas las operaciones +, -, x, .÷
3. Intervalo - las variables son medidas numéricamente. Se calculan diferencias entre valores pero no existe un punto de partida inherente (cero relativo). Ej. Escalas de temperaturas grados C y F. El cero no significa ausencia de una característica medida. característica medida.
4. Razón- se define igual que la de intervalo pero tiene un cero absoluto. Cero significa ausencia total de una característica medida. Ej. Peso, estatura, edad, nivel de colesterol, …
Nota: Las operaciones aritméticas son importantes ( 3,4).
Resumen Escalas de Medición (Coughlin)
Característica Nominal Ordinal Intervalo Razón
Mutuamente exclusivos
√ √ √ √
Orden √ √ √√ √ √
Escala estandarizada
√ √
Cero significativo o
absoluto
√
Procedimientos estadísticos y el nivel de medición de su variable (Coughlin)
Procedimiento Estadístico
Variable Nominal Ordinal Intervalo Razón
Nominal √ Cuidado Error Error
Ordinal “Go” √ Error Error
Intervalo/Razón Necesita codificar los datos (SPSS)
√ √
Resumen de las Escalas de Medición en el texto: Research Methods and Statistics: A Critical Thinking Approach (Jackson, 2003)
Nominal Ordinal Intervalo Razón
Ejemplos EtnicidadReligión
RankingGrado (nota)
Temperatura SalarioPeso
Género Likert EstaturaTiempo
Propiedades IdentidadNo rankingNo implica cantidad
IdentidadMagnitud
Distancias no son
significativas
IdentidadMagnitud
Cada unidad tiene el tamaño
Cero relativo
IdentidadMagnitud
Cada unidad tiene el tamaño
Cero absoluto
Resumen de las Escalas de Medición en el texto: Research Methods and Statistics: A Critical Thinking Approach (Jackson, 2003)
Nominal Ordinal Intervalo Razón
Aritmética Orden ranking Operaciones básicas
Operaciones básicasbásicas básicas
Estadísticas Moda Chi-Square
ModaMediana
Pruebas de ranking
ModaMediana
Promediot-test
ANOVA
ModaMediana
Promediot-test
ANOVA
Variables cuantitativas1. Discretas (conteo)2. Continuas (medición)
Nota: La variable continua no tiene huecos o interrupciones en su representación recta numérica
Ejercicio:Identificar el tipo de variable numérica (continua o discreta) o no numérica:1. Ocupación en un hospital2. Número de años en la Universidad3. Clase Social: Alta Media Pobre3. Clase Social: Alta Media Pobre4. Edad5. Lugar de nacimiento6. S.S.7. ID8. GPA9. Estado Civil
Ejercicio:Identificar el tipo de variable numérica (continua o discreta) o no numérica:
10. Género11. Tipo sanguíneo (A, B, O, AB)11. Tipo sanguíneo (A, B, O, AB)12. Presión Sistólica13. Índice de Masa Corporal14. Promedio15. Tiempo16. Método de pago (tarjeta, efectivo, cheque,…)17. Nivel de Burnout de los policías