estadistica descriptiva tema 05 tablas y datos agrupados

12

Click here to load reader

Upload: ivan-fernando-suarez-lozano

Post on 18-Jul-2015

37.670 views

Category:

Education


4 download

TRANSCRIPT

Page 1: ESTADISTICA DESCRIPTIVA TEMA 05 TABLAS Y DATOS AGRUPADOS

ESTADISTICA I

TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS

Iván Fernando Suarez Lozano

ÍNDICE.

TABLAS DE DATOS. ........................................................................................................................... 2

TABLAS DE FRECUENCIAS ............................................................................................................... 2

DATOS AGRUPADOS. ........................................................................................................................ 4

BIBLIOGRAFÍA .................................................................................................................................. 11

Page 2: ESTADISTICA DESCRIPTIVA TEMA 05 TABLAS Y DATOS AGRUPADOS

ESTADISTICA I

TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS

Iván Fernando Suarez Lozano

TABLAS DE DATOS.

El fin principal de un cuadro o tabla estadística es presentar datos de tal manera que el

lector pueda encontrar fácilmente las diferencias. Sirve para condensar la información

obtenida.

Las tablas por tanto permiten organizar la información para que esta pueda comprenderse de

manera clara. Si por ejemplo deseamos analizar los resultados de una votación, podemos

organizar los datos en una tabla de la de la siguiente forma:

Ejemplo 1:

CANDIDATO TOTAL

CANDIDATO 1 3

CANDIDATO 2 5

CANDIDATO 3 8

CANDIDATO 4 3

Ejemplo 2.

COLOR TOTAL

ROJO 2

AZUL 4

AMARILLO 2

VERDE 6

TABLAS DE FRECUENCIAS

Cuando el tamaño de la muestra y el recorrido de la variable son pequeños, por ejemplo si

tenemos una muestra de las edades de 5 personas, solo organizamos las edades de manera

ascendente ó descendente.

Page 3: ESTADISTICA DESCRIPTIVA TEMA 05 TABLAS Y DATOS AGRUPADOS

ESTADISTICA I

TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS

Iván Fernando Suarez Lozano

Edad de los 5 miembros de una familia: 5, 8, 16, 38, 45

Por el contrario, cuando el tamaño de la muestra es grande y el recorrido de la variable es

pequeño (Recorrido se define como la resta entre el dato superior y el inferior), y

adicionalmente los datos se repiten podemos hacer una tabla de frecuencias (también

conocida como datos no agrupados).

Por ejemplo, si preguntamos el número de personas que trabajan en un grupo de 50 familias

obtenemos la siguiente tabla:

Personas Activas en 50 familias

2 1 2 2 1 2 4 2 1 1

2 3 2 1 1 1 3 4 2 2

2 2 1 2 1 1 1 3 2 2

3 2 3 1 2 4 2 1 4 1

1 3 4 3 2 2 2 1 3 3

Podemos observar que la variable X toma valores comprendidos entre 1 y 4, por lo que

podemos realizar una tabla en la que resumamos y agrupemos estos datos de la siguiente

forma:

Personas

Activas

Número de Familias

1 16

2 20

Page 4: ESTADISTICA DESCRIPTIVA TEMA 05 TABLAS Y DATOS AGRUPADOS

ESTADISTICA I

TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS

Iván Fernando Suarez Lozano

3 9

4 5

Total Personas 50

La tabla también puede ser presentada como:

Xi fi

1 16

2 20

3 9

4 5

Total 50

Donde Xi representa la variable que se ha medido y fi el número de veces que esta se repite,

a esta connotación le llamamos también Frecuencia absoluta, la cual es el número de veces

que aparece un determinado valor en un estudio estadístico. Debe prestarse mucha

atención al uso de fi pues esta expresión debe contener la letra en minúscula.

DATOS AGRUPADOS.

Cuando el tamaño de la muestra y el recorrido de la variable son grandes, los datos se

organizan en tablas de datos agrupados. Suponga que se tiene la siguiente información

recopilada de una muestra cualquiera

207 165 340 206 155 178 171 149 135 419 268 413 456

218 499 322 168 126 131 214 138 329 402 469 123 423

385 269 121 214 326 222 224 212 123 193 442 219 272

Page 5: ESTADISTICA DESCRIPTIVA TEMA 05 TABLAS Y DATOS AGRUPADOS

ESTADISTICA I

TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS

Iván Fernando Suarez Lozano

230 294 257 362 418 473 144 182 337 353 182 343 430

233 313 346 432 171 227 322 480 278 243 168 465 187

297 226 343 459 213 392 205 345 431 298 371 307 156

381 350 365 324 423 381 431 360 166 363 386 381 354

196 472 159 181 309 120 481 263 142 454 363 146 337

414 469 250 252 493 296 240 138 364 214 238 364 135

180 268 268 382 386 458 351 393 158 141 125 140 306

185 307 284 395 445 439 388 500 407 316 491 439 299

Si organizáramos la información en una tabla de frecuencias tendríamos:

Xi fi

120 1

121 1

123 2

125 1

126 1

131 1

135 2

138 2

140 1

141 1

142 1

144 1

146 1

149 1

155 1

156 1

158 1

159 1

Xi fi

165 1

166 1

168 2

171 2

178 1

180 1

181 1

182 2

185 1

187 1

193 1

196 1

205 1

206 1

207 1

212 1

213 1

214 3

Xi fi

218 1

219 1

222 1

224 1

226 1

227 1

230 1

233 1

238 1

240 1

243 1

250 1

252 1

257 1

263 1

268 3

269 1

272 1

Xi fi

278 1

284 1

294 1

296 1

297 1

298 1

299 1

306 1

307 2

309 1

313 1

316 1

322 2

324 1

326 1

329 1

337 2

340 1

Xi fi

343 2

345 1

346 1

350 1

351 1

353 1

354 1

360 1

362 1

363 2

364 2

365 1

371 1

381 3

382 1

385 1

386 2

388 1

Xi fi

392 1

393 1

395 1

402 1

407 1

413 1

414 1

418 1

419 1

423 2

430 1

431 2

432 1

439 2

442 1

445 1

454 1

456 1

Page 6: ESTADISTICA DESCRIPTIVA TEMA 05 TABLAS Y DATOS AGRUPADOS

ESTADISTICA I

TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS

Iván Fernando Suarez Lozano

Xi fi

458 1

459 1

Xi fi

465 1

469 2

Xi fi

472 1

473 1

Xi fi

480 1

481 1

Xi fi

491 1

493 1

Xi fi

499 1

500 1

Evidentemente, la variable estadística tiene un recorrido muy grande, lo cual dificulta el

análisis de la información, por ello debemos organizar la información de manera tal que nos

permita realizar un análisis adecuado de la información.

Para ello vamos a organizar los datos agrupándolos en intervalos definidos, de igual

amplitud.

PASO 1.

Hallar el recorrido ó rango de los datos, esto se hace restando el dato mayor con el menor.

Rango= 500 – 120 = 380

PASO 2.

Determinar el numero de intervalos ó marcas de clase de los datos. Para ello existen varios

métodos

Método 1.

2� ≥ � ; donde K es el numero de marcas de clase (ó intervalos a definir), y n el

número total de datos.

Para nuestro caso n=143, por tanto necesitamos un numero K, tal que al elevar 2 a

este numero el resultado sea mayor ó igual a 143. El valor de K seria 8 puesto que

2� = 256 ≥ 143.

Método 2.

√� Cuando el valor de n no es grande. Para nuestro caso: √143 = 11,96

Page 7: ESTADISTICA DESCRIPTIVA TEMA 05 TABLAS Y DATOS AGRUPADOS

ESTADISTICA I

TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS

Iván Fernando Suarez Lozano

Método 3.

� = 1 + 3,22 × log �; resolviendo: � = 1 + 3,22 × log 143 = 7,94

De los tres métodos distintos podemos observar que el valor más adecuado será 8,

por tanto el numero de marcas de clase será 8.

PASO 3.

Hallar el ancho del intervalo de las marcas de clase. El calculo lo realizamos dividiendo el

rango (dato mayor menos dato menor) entre el numero de marcas de clase calculado (K).

� =�����

�=380

8= 47,5

Se aconseja que el valor del ancho de la marca de clase, en este caso 47,7 tenga el mismo

numero de decimales que los datos. Para nuestro ejemplo entonces, aproximamos 47,5 a 48.

PASO 4.

Determinar los nuevos limites.

Cuando se ha modificado el ancho del intervalo debemos también modificar los limites

reales, pues la ecuación expuesta en el paso 3 debe nuevamente coincidir.

� =��� !

�= 48 × 8 = 384=Nuevo rango

Pero el rango anterior es 380, por tanto debemos modificar los limites para que el nuevo

rango sea igual a 384, para debemos analizar cada uno de los limites.

Calculo de Limite inferior.

Page 8: ESTADISTICA DESCRIPTIVA TEMA 05 TABLAS Y DATOS AGRUPADOS

ESTADISTICA I

TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS

Iván Fernando Suarez Lozano

Nuevo limite inferior (NLI)

"#$ =%&

';

donde LI es el limite inferior.

"#$ =%&

'=

()*

�= 15

cuando esta división es exacta, no hacemos modificación alguna en el limite, por tanto el este

seguirá siendo 120.

Calculo de limite superior

Al igual que el calculo del limite inferior.

"#+ =#+

,=500

8= 62,5

Cuando tenemos estos datos, donde la división no es exacta, debemos:

Para el limite inferior aproximarlo a un dato más bajo, y cuando es el limite superior

aumentarlo al dato superior más próximo.

Para este caso, sabemos que el rango aumento de 380 a 384, es decir aumento una

diferencia de 4 unidades. Sabiendo que el limite inferior no lo modificaremos, solo nos queda

aumentar en 4 unidades el limite superior, decir aumentarlo de 500 a 504.

Calculamos nuevamente:

"#+ =#+

,=504

8= 63

Observemos una forma de comprobar nuestros cálculos:

El nuevo rango (384) debes ser resultado de la diferencia de los nuevos limites 504-120=384,

por tanto se cumple.

El ancho del intervalo debe ser igual a 48, resultado del nuevo rango sobre el numero de

marcas de clase.

� =�����

�=384

8= 48

Page 9: ESTADISTICA DESCRIPTIVA TEMA 05 TABLAS Y DATOS AGRUPADOS

ESTADISTICA I

TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS

Iván Fernando Suarez Lozano

Una vez analizada esta información, podemos realizar nuestra tabla de datos agrupados.

PASO 5.

Seleccionamos el limite inferior, 120 para nuestro ejemplo y le sumamos 48:

120+48=168

Nuestra primera marca de clase será

xi

120 ≤ xi < 168

Si continuamos con este proceso tendremos

xi

120 ≤ xi < 168

168 ≤ xi < 216

216 ≤ xi < 264

264 ≤ xi < 312

312 ≤ xi <

360

360 ≤ xi <

408

408 ≤ xi < 456

456 ≤ xi < 504

Por ultimo solo queda contar el número de datos existentes entre los intervalos.

Page 10: ESTADISTICA DESCRIPTIVA TEMA 05 TABLAS Y DATOS AGRUPADOS

ESTADISTICA I

TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS

Iván Fernando Suarez Lozano

Ejemplo 2:

Calcule la tabla de datos agrupados teniendo en cuenta los siguientes datos.

Limite inferior: 34

Limite superior: 235

Numero de datos: 156.

PASO 1:

Calculo del rango: 235 − 34 = 201

PASO 2:

Calculo del numero de marcas de clase

2� ≥ �; para este caso K=8

Con otro método

� = 1 + 3,22 × log 156 = 8,06

Por tanto utilizaremos el valor de 8

PASO 3.

Calculo del ancho del intervalo.

� =�����

�=201

8= 25,125

Si hacemos que a sea igual a 26, entonces el nuevo rango tendrá que ser igual a 208.

Page 11: ESTADISTICA DESCRIPTIVA TEMA 05 TABLAS Y DATOS AGRUPADOS

ESTADISTICA I

TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS

Iván Fernando Suarez Lozano

PASO 4.

Calculo de los nuevos limites.

"#+ =%&

'=

./

�= 4,25;

como el resultado debe dar como residuo cero, tenemos que aproximar, hacia abajo, el limite

inferior a el numero que permite una división exacta. El numero que mejor se aproximará

será 32, por tanto:

"#+ =#$

,=32

8= 4

Para el limite superior.

"#+ =#+

,=235

8= 29,375

Igual que el calculo anterior, aumentamos el limite superior hasta un numero que nos permita

obtener una división exacta, aumentamos de 235 a 240.

"#+ =#+

,=240

8= 30

Probamos

Rango = 240 – 32 = 208

� =�����

�=208

8= 26

Los dos resultados son favorables.

BIBLIOGRAFÍA

ANDERSON, D. R., SWEENEY, D. J., & WILLIAMS, T. A. (2008). ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA (10a Edición ed.). (S. R. CERVANTES GONZÁLEZ, Ed.) México D.F., México: CENGAGE Learning. CIRO MARTÍNEZ, B. (2001). ESTADÍSTICA BÁSICA APLICADA. Santa Fe de Bogotá: Eco ediciones. LIND, D. A., MARCHAL, W. G., & MASON, R. D. (2004). ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA (11 ed.). (F. D. CASTRO PEREZ, M. CUPA LEÓN, Edits., & M. D. HANO ROA, Trad.) Bogotá D.C., Colombia: ALFAOMEGA.

Page 12: ESTADISTICA DESCRIPTIVA TEMA 05 TABLAS Y DATOS AGRUPADOS

ESTADISTICA I

TABLAS Y CUADROS – PRESENTACIÓN DE LOS DATOS

Iván Fernando Suarez Lozano

MENDENHALL, W. (1990). ESTADISTICA PARA ADMINISTRADORES (1era ed.). (N. GREPE P, Ed., & D. VALCKX VERBEECK, Trad.) México D. F., México: Grupo Editorial Iberoamérica S.A. de CV. Muñoz, D. R. (s.f.). http://www.eumed.net/cursecon/libreria/drm/1a.htm. Ramis, M. D. (s.f.). http://www.monografias.com/trabajos10/esta/esta.shtml.