clase 2 - cdf y estadística gráfica
TRANSCRIPT
CUADROS DE DISTRIBUCIÓN DE FRECUENCIA
ESTADÍSTICA GRÁFICA
Ing. Alina Valverde Urtecho
En la estadística se trabaja generalmente con una gran cantidad de datos los cuales por facilidad de análisis y cálculos se organizan y resumen en cuadros o tablas estadísticas. Aún cuando un cuadro o tabla de datos se construye a libre criterio de quien lo ejecuta, generalmente es común el seguir algunas pautas que de alguna forma homogenizan criterios y ayudan a los fines didácticos.
1. TABLAS O CUADROS DE DISTRIBUCIÓN DE FRECUENCIAS (CDF)
2. PARTES DE UNA TABLA O CUADRO DE DISTRIBUCION DE FRECUENCIAS (CDF)
Las partes de un CDF son las siguientes:
1. Número del cuadro de frecuencias en forma correlativa.2. Título: Especificar la variable y la muestra en estudio.
(Distribución de “muestra” según “variable de estudio”)3. Encabezado o conceptos.4. Cuerpo o contenido del cuadro de frecuencias5. Pie de Cuadro: Nota de pie (no siempre es necesaria), Fuente,
Elaboración.
2. PARTES DE UNA TABLA O CUADRO DE DISTRIBUCION DE FRECUENCIAS: (CDF)
3. ELEMENTOS PARA CONSTRUIR UN CDF:
Para construir un cuadro de frecuencias se utilizan los siguientes elementos:
1. Valor de la variable Xi: Los valores de la variable o datos se representan por Xi. Ejm: Si se tienen 50 datos sus valores correspondientes no agrupados se representan como X1, X2, X3, ....., X50
2. Intervalos de clase: Los intervalos son subconjuntos de la recta real que están definidos por un límite menor o inferior Li y un límite mayor o superior Ls.
3. Frecuencia absoluta simple (fi):Está constituida por el número de veces que se repite un valor. En el caso de intervalos es el número de observaciones comprendidas en dicho intervalo. Estas frecuencias siempre son enteros positivos y además la suma de todos ellos es el tamaño de la muestra “n”.
3. ELEMENTOS PARA CONSTRUIR UN CDF:
n
fihi
4. Frecuencia Relativa hi ó hi%: Indica la relación o proporción existente entre la frecuencia absoluta simple y el número total de datos. e expresa en tanto por uno (hi) o en tanto por ciento (hi%). Así:
5. Frecuencia absoluta acumulada (Fi): Resulta de la suma de las frecuencias cuyas marcas de clase son iguales o menores a la marca de clase del intervalo dado o considerado, es decir:
F1 = f1
F2 = f1 + f2
F3 = f1 + f2 + f3
.........................Fk = f1 + f2 + f3 + ....... + fk
100(%) xn
ifhi
3. ELEMENTOS PARA CONSTRUIR UN CDF:
6. Frecuencia Relativa Acumulada Hi ó Hi%: Resulta de la suma de las frecuencias relativas simples hasta la frecuencia del intervalo considerado. Así:
H1 = h1
H2 = h1 + h2
…….H5 = h1 + h2 + h3 + h4 + h5
7. Marca de Clase (Xi): Es el promedio de los valores correspondientes a los límites inferior y superior de cada uno de los intervalos determinados.
Tipos de Cuadros de acuerdo a la variable
Gráfico Estadístico
Un gráfico o diagrama es una representación pictórica con el objeto de ilustrar los cambios que se realizan en una variable.
Sirve también para comparar visualmente dos o más variables similares o relacionadas.
Un gráfico transmite de manera casi instantánea: hechos, cantidades y comportamientos de variables.
Los gráficos estadísticos son representaciones de información que existe en el mundo, en ningún caso es una ficción que surge de la imaginación del artista, el gráfico es la expresión artística de datos reales y observados.
Partes de un Gráfico
1. Numeración:Para dar una numeración ordenada de los gráficos.
2. Título:Expresa el contenido del gráfico y por lo general, es igual o parecido al título del cuadro estadístico que sirvió de referencia. Aquí se señala la muestra en estudio y la variable.
3. Diagrama:Esta dado por el propio dibujo, y representa el comportamiento de los datos.
4. Escalas y/o leyendas:Son indicadores donde se precisa la correspondencia entre los elementos del gráfico y la naturaleza de las medidas representadas.
5. Fuente:Indica el origen de los datos estadísticos que se están presentando en el gráfico
6. Elaboración
TIPOS DE GRÁFICOS DE ACUERDO A LA VARIABLE
1. Gráfico de Barras
o Este gráfico es utilizado para describir datos referentes a una variable CUALITATIVA (Nominal u Ordinal).
o También se utiliza para representar data de variables tipo cuantitativo discreto.
o Está constituido por un conjunto de rectángulos separados convenientemente.
o No tienen un ancho apropiado, depende del investigador y tiene como altura la respectiva frecuencia (fi, hi%).
o Dentro de estas tenemos:Barras Simples (cuadros simples)Barras dobles (cuadro de doble entrada)Barras múltiples (cuadros de múltiple entrada)
2. Gráfico Sectorial o Circular
o Se utilizan cuando se tiene información de una variable cualitativa.
o Se trata de un círculo, cuya área se divide en sectores proporcionales a las
partes integrantes de un total.
o Para la representación es necesario establecer primero el porcentaje de
cada elemento, respecto del total.
o Se utilizan cuando se tiene información de una variable cualitativa.
o Fáciles de entender.
o El área de cada modalidad debe ser proporcional a la frecuencia.
3. Pictograma
4. Gráfico de Bastones
Este gráfico es utilizado para describir datos referentes a una variable discreta.
Está constituido por un conjunto de segmentos perpendiculares al eje de la variable, en cada uno de los valores discretos de la variable y con una altura proporcional a su frecuencia (absoluta fi o relativa hi%).
También es utilizado para graficarlas con las frecuencias Fi y Hi.
5. Gráfico de Escalones
Este gráfico es utilizado para describir datos referentes a una variable discreta.
Está constituido por un conjunto de segmentos horizontales al eje de la variable, con una altura proporcional a su frecuencia acumulada (absoluta Fi o relativa Hi%).
6. Histograma de Frecuencias
o Este gráfico es utilizado para describir datos referentes a variables continuas, que por lo general se agrupan en tablas de frecuencias con intervalos.
o Está formado por un conjunto de rectángulos continuos cuya base es la amplitud interválica y como la altura la respectiva frecuencia (fi, Fi, hi%, Hi%)
7. Polígono de Frecuencias
o Este gráfico sirve para representar datos de variables continuas.o Se construye uniendo con una línea poligonal los puntos medios
o marcas de clase (Xi) superiores de cada intervalo.o Esta se grafica teniendo en cuenta las frecuencias simples y las
acumuladas.o Si se considera la Fi o Hi% se obtiene la OJIVA.
Polígono de frecuencias para el Nº de Años de Funcionamiento de 48 Estaciones Hidrométricas.
0
2
4
6
8
10
12
14
16
*1 *7 *13 *19 *25 *31 *37 *43 *49
Años de funcionamiento
Ojiva del Nº de años de funcionamiento de 48 Estaciones Hidrométricas
0
10
20
30
40
50
60
[-2 - 4> [4 - 10> [10 - 16> [16 - 22> [22 - 28> [28 - 34> [34 - 40> [40 - 46]
Años de funcionamiento
Nº d
e es
taci
ones
4 10 16 22 28 34 40 46 46
EJEMPLO 1:
Con la finalidad de mejorar la calidad de atención en una clínica local, se ha formulado la siguiente pregunta a 45 pacientes atendidos durante una semana: “¿Cómo califica Ud. la calidad de atención recibida: muy buena, buena, aceptable, mala o muy mala. Se realiza el conteo de las variables: o Muy buena ///// o Buena ///// ///// ///// / o Aceptable ///// ///// // o Mala ///// /// o Muy mala ////
a) Construir un cuadro de distribución de frecuencias completo.b) Interprete f2, F3, h1%, H2%
c) Construya los gráficos pertinentes
1ro Identificar la variable de estudio: calidad de atención recibida.2do Tipo de variable: cualitativa ordinal.3ro Construir el CDF
Pasos parte a):
Número de TasaPacientes (fi) Porcentual (hi%)
Muy Buena 5 5 11.11 11.11
Buena 16 21 35.56 46.67
Aceptable 12 33 26.67 73.33
Mala 8 41 17.78 91.11
Muy Mala 4 45 8.89 100.00
Total 45 100.00
Calidad de Atención
Fi Hi%
Cuadro N°1: Distribución de 45 pacientes atendidos durante una semana según la calidad de atención recibida.
Fuente: Información obtenida de las encuestasElaboración: Estudiantes
b) Interpretar:f2: De los 45 pacientes atendidos, 16 de ellos califican la calidad de atención recibida como buena.
H2%: Del total de los pacientes atendidos, el 46.67% califican la calidad de atención recibida como muy buena y buena.
10/04/2023 Ing. Alina Valverde Urtecho 21
5
16
12
8
4
02468
1012141618
Muy Buena Buena Aceptable Mala Muy Mala
Nro
de
paci
ente
s
Categoría
Gráfico N°1.1: Distribución de 45 pacientes atendidos durante una semana según la calidad de atención recibida
Fuente: Información obtenida de los testElaboración: Estudiantes
Parte c) Gráfico de Barras
10/04/2023 Ing. Alina Valverde Urtecho 22
11%
36%
27%
18% 9%
Gráfico N°1.2: Distribución de 45 pacientes atendidos durante una semana según la calidad de atención recibida
Muy Buena
Buena
Aceptable
Mala
Muy Mala
Fuente: Información obtenida de los testElaboración: Estudiantes
Gráfico Circular
EJEMPLO 2:
A continuación se presenta una base de datos respecto al número de hijos en una muestra de 20 familias residentes en la ciudad de Cajamarca.
6 5 4 4 3 3 4 4 5 5 4 5 6 2 4 3 4 6 5 3
a) Construir un cuadro de distribución de frecuencias completo.b) Interprete f2, F3, h1%, H2%
c) Construya los gráficos pertinentes
1ro Identificar la variable de estudio: número de hijos.2do Tipo de variable: cuantitativa discreta.3ro Construir el CDF
Pasos parte a):
Fuente: Información obtenida de las encuestasElaboración: Estudiantes
b) Interpretar:F3: De las 20 familias residentes en la ciudad de Cajamarca, 12 de ellas tienen entre 2 y 4 hijos.
h1%: Del total de las familias residentes en la ciudad de Cajamarca, el 20% de ellas tienen 3 hijos.
Cuadro N°2: Distribución de 20 familias residentes en la ciudad de Cajamarca según el número de hijos
Número de
Familias (fi)
2 1 1 5.00 5.00
3 4 5 20.00 25.00
4 7 12 35.00 60.00
5 5 17 25.00 85.00
6 3 20 15.00 100.00
Total 20 100.00
N° Hijos Fi Hi%hi%
1
4
7
5
3
0
1
2
3
4
5
6
7
8
2 3 4 5 6
Nro
de
fam
ilias
Nro de hijos
Gráfico N°2.1: Distribución de 20 familias residentes en la ciudad de Cajamarca según el número de hijos
Fuente: Base de datosElaboración: Estudiantes
Parte c) Gráfico de BASTONES
Frecuencias Absolutas Simples
1
5
12
17
20
0
5
10
15
20
25
2 3 4 5 6
Nro
de
fam
ilias
Nro de hijos
Gráfico N°2.2: Distribución de 20 familias residentes en la ciudad de Cajamarca según el número de hijos
Frecuencias Absolutas Acumuladas
Fuente: Base de datosElaboración: Estudiantes
10/04/2023 Ing. Alina Valverde Urtecho 26
Fuente: Base de datosElaboración: Estudiantes
Gráfico de BARRAS
0
1
2
3
4
5
6
7
8
2 3 4 5 6
Nro
de
fam
ilias
Nro de HIjos
Gráfico N°2.3: Distribución de 20 familias residentes en la ciudad de Cajamarca según el número de hijos
EJEMPLO 3:
A continuación se presentan los montos en soles correspondientes a las compras de 40 clientes de la Distribuidora Regional del Norte.
370 445 320 460 540 379 420 570 348 470 315 365 470 390 430 303 437 530 380 540 305 475 598 382 310 320 415 590 490 580 355 475 570 395 560 330 360 530 405 485
a) Construir un cuadro de distribución de frecuencias completo.b) Interprete f2, F3, h1%, H2%, X3
c) Construya los gráficos pertinentes
Pasos:1ro Identificar la variable de estudio: montos de las compras.2do Tipo de variable: cuantitativa continua. INTERVALOS
R = Valor máximo - Valor mínimo
K = 1 + 3.322 log ( n )
A = R / K
Este valor siempre es un número entero (Redondeo)
3) Determinar la amplitud interválica “A”
Este valor está en función de la estructura de la base de datos (tomar el inmediato superior)
1) Hallar el Rango ( R):
2) Determinar el número de intervalos( K)
4. Calcular las marcas de clase :
5. Determinar los intervalos y finalmente construir el cuadro
Fuente: Información obtenida de los testElaboración: Estudiantes
Intervalos Número de
soles Clientes (fi)
[ 303 - 353 > 8 8 20.00 20.00 328.00
[ 353 - 403 > 9 17 22.50 42.50 378.00
[ 403 - 453 > 6 23 15.00 57.50 428.00
[ 453 - 503 > 7 30 17.50 75.00 478.00
[ 503 - 553 > 4 34 10.00 85.00 528.00
[ 553 - 603 ] 6 40 15.00 100.00 578.00
Total 40 100.00
Fi Hi%hi% Xi
Cuadro N°3: Distribución de 40 clientes de la Distribuidora “Regional del Norte” de acuerdo al monto de su compra en soles
Rango: R = 598 – 303 = 295 soles
Nro de intervalos: Amplitud:K = 1 + 3.322*log(40) = 6.322 A = R/K = 295/6 = 49.16K = 6 (redondeo matemático) A = 50 (redondeo al mayor)
b) Interpretar
o f2: De los 40 clientes, 9 de ellos realizaron una compra por un monto entre 353 y menos de 403 soles.
o F3: De los 40 de clientes, 23 de ellos realizaron una compra por un monto entre 303 y menos de 453 soles.
o h1%: Del total de clientes, el 20% de ellos realizaron una compra por un monto entre 303 y menos de 353 soles.
o H2%: Del total de clientes, el 42.5% de ellos realizaron una compra por un monto entre 303 y menos de 403 soles.
o X3: 6 clientes realizaron una compra promedio por un monto de 428 soles.
10/04/2023 Lic. Anhelí Ramírez Mendocilla 31
10/04/2023 Ing. Alina Valverde Urtecho 32
20% 23%
15% 18%
10%
15%
0%
5%
10%
15%
20%
25%
353 403 453 503 553 603
303 353 403 453 503 553
% d
e cli
ente
s
Intervalo (monto de su compra)
Gráfico N°3.1: Distribución de 40 clientes de la Distribuidora "Regional del Norte" de acuerdo al monto
de su compra en soles
Fuente: Información obtenida de los testElaboración: Estudiantes
Frecuencias Relativas
10/04/2023 Ing. Alina Valverde Urtecho 33
20%43%
58%75%
85%100%
0%
20%
40%
60%
80%
100%
120%
353 403 453 503 553 603
303 353 403 453 503 553
% d
e cli
ente
s
Intervalo (monto de su compra)
Gráfico N°3.2: Distribución de 40 clientes de la Distribuidora "Regional del Norte" de acuerdo al monto
de su compra en soles
Fuente: Información obtenida de los testElaboración: Estudiantes
Frecuencias Relativas Acumuladas
10/04/2023 Ing. Alina Valverde Urtecho 34
20%23%
15%
18%
10%
15%
0%
5%
10%
15%
20%
25%
278 328 378 428 478 528 578 628
% d
e cl
ient
es
Marca de Clase
Gráfico N°3.3: Distribución de 40 clientes de la Distribuidora "Regional del Norte" de acuerdo al monto
de su compra en soles
Frecuencias Relativas
Fuente: Información obtenida de los testElaboración: Estudiantes
20%
43%58%
75% 85% 100%
0
0.2
0.4
0.6
0.8
1
1.2
303 353 403 453 503 553 603
253 303 353 403 453 503 553
% d
e cli
ente
s
Intervalo (monto de su compra)
Gráfico N°3.4: Distribución de 40 clientes de la Distribuidora "Regional del Norte" de acuerdo al monto
de su compra en soles
Fuente: Información obtenida de los testElaboración: Estudiantes
Frecuencias Relativas Acumuladas