informe aed geoestadistica
TRANSCRIPT
-
8/17/2019 Informe Aed Geoestadistica
1/23
ANALISIS EXPLORATORIO DE DATOS
INTRODUCCION
Para poner en práctica lo aprendido en el curso de geoestadística
específcamente a nuestro tema el análisis exploratorio de datos se
ha llevado acabo el presente trabajo que es una aplicación que
revalidara la teoría ,se basa en el análisis de una data real de una
yacimiento de muestras obtenidas del sondaje de sus exploraciones
llamado la data de toromocho en alusión al nombre de la unidad
minera en un campo de estudio real en minería se lleva a cabo los
procedimientos que se detallaran más adelante aunque de una
manera más completa y más minuciosa así este trabajo es una
aproximación a menor escala del trabajo que se realiza en la minería
en materia del análisis de sus datos de exploración y que es un
primordial que se haga lo más preciso posible una mal análisis dará
malos resultados y por ende signifcara el racaso de las operaciones
de una unidad minera por ello la importancia del muestreo y el
análisis e interpretaciones que se haga con estos datos que si bien es
un análisis más estadístico que geoestadistico ayuda en el propósito
de lograr establecer la manera como están distribuidas las leyes en el
yacimiento para poder hacer una buena estimación de los recursos
así el análisis exploratorio de datos constituye la
etapa inicial en el proceso deestimación de reservas que
luego seguirán en otros
procedimientos como el
variograma para su
posterior riging!
-
8/17/2019 Informe Aed Geoestadistica
2/23
"ig! la data analizada proviene de las muestras del sondaje
EJEMPLO APLICATIVO DEL ANALISIS EXPLORATORIODE DATOS
Para ello utilizaremos primeramente el #xcel para la evaluación de los datos
del sondaje y posteriormente el spss, este sot$are estadístico %ediante
este programa de análisis estadístico se busca evaluar la calidad y
consistencia de los datos, determinar la distribución de las variables en
estudio en nuestro caso la ley del cobre y detectar los valores atípicos para
su posterior modifcación! &os aclara aun más el panorama y tener unamejor visión de nuestra distribución de nuestros datos para ellos tenemos
'( )(*( *++%+-.+ la cual posee la inormación de los sondajes
realizados pero nuestro análisis estará basado en el archivo (//(0/ para
nuestra evaluación de leyes!
"ig! Podemos apreciar los datos del sondaje de la )(*( *++%+-.+
-omo podemos notar la data toromocho posee inormación (//(0/,.#()#, P-", /12#0 y un archivo de topograía, estos son el resultado de
la exploración minera y base del proyecto en general se detalla en cinco
planillas de datos3
4 Puntos de ubicación espacial de los sondajes 5.#()#!csv6!
4 7normación de las leyes del mineral 5(//(0/!csv6!
4 7normación geológica 5'7*.+!csv6!
4 )atos topográfcos 5/12#0!csv6!
4 -oordenadas de la zona 5P1&*+/ 8P/!csv6!
-
8/17/2019 Informe Aed Geoestadistica
3/23
-
8/17/2019 Informe Aed Geoestadistica
4/23
fg! (preciamos los ;::< datos que procesaremos para nuestro análisis
estadístico
-
8/17/2019 Informe Aed Geoestadistica
5/23
Para tener una idea de cómo está distribuido vemos las leyes de cu se hizo
distribuciones agrupando los datos y observándolos en un gráfco lo mismo
se hizo pero ordenando las muestras de menor a mayor!
)e esta manera podemos notar como están distribuidas las leyes así comoya podemos notar la presencia de los outliers valores atípicos que salen al
hacer los análisis pero que debemos determinar si estos lo son realmente o
si son solo errores de muestreo o mal digitados o mal analizados como
muchas veces puede suceder para ello se debe volver a analizar y
posteriormente eliminarlos o hacer las correcciones del caso!
(demás Podemos apreciar la gran cantidad de datos que vamos a procesar
a continuación el análisis estadístico con #xcel con la fnalidad de calcular
los parámetros para su distribución!
-
8/17/2019 Informe Aed Geoestadistica
6/23
(hora haremos el análisis respectivo para ello contaremos con las
herramientas estadísticas3
"ig! +bservamos los datos a partir del cual haremos el análisis estadístico
.allamos el rango el dato máximo menos el mínimo, el criterio de stuges
para hallar el numero de intervalos =9>?!?@Alog& obtenemos
redondeando 9B clases o intervalos tambiCn hallamos la amplitud o periodo
de cada clase
"ig! %uestra las demás medidas de dispersión de la estadística clásica de la
data toromocho
-
8/17/2019 Informe Aed Geoestadistica
7/23
"ig! %uestra la tabla de distribución de recuencias de la data toromocho!
-
8/17/2019 Informe Aed Geoestadistica
8/23
9 @ ? B D E F ; < 9: 99 9@ 9? 9:
D::
9:::
9D::
@:::
@D::
?:::
?D::
B:::
histograma- ley CU
re!"e#!ia
+btenemos los siguientes resultados sea calculado cada clase con sus
respectiva amplitud hasta completar el dato máximo para las 9B clases se
halla el Gi o promedio de cada clase además de su recuencia es decir la
cantidad de datos entre intervalo de clase lo cual al sumar debemos llegar alos ;::< datos obtenido hallamos tambiCn el hi y .i que son recuencia
relativa simple y recuencia relativa acumulada respectivamente las cuales
para confrmar que el cálculo ue bien hecho debe llegar a la unidad!
(demás de otros datos que se calculan por deecto para los diagramas de
análisis pero que son de vital importancia para hacer una buena distribución
de los datos de la data! (demás se calcula la media y la varianza para
calcular tambiCn el coefciente de asimetría y el de urtosis para la
completa interpretación del histograma
"ig! .istograma de recuencias de la data toromocho
-
8/17/2019 Informe Aed Geoestadistica
9/23
INTERPRETACIONES
#ste grafco nos da los resultado así podemos apreciar la cantidad de cores
con su respectiva ley por lo que podemos apreciar de la clase 9 es decir delintervalo de :!::@ a :!?@9 tenemos ?B?: muestras, de la clase @ de
intervalo de :!?@9 a :!E?< tenemos @;;? muestras y la clase ? de intervalo
de :!E?< a :!
-
8/17/2019 Informe Aed Geoestadistica
10/23
urtosis (c=F,BB@D es decir es mayor a tres lo que hace nos indica que su
distribución es de mayor altura que la distribución normal! (demás tenemos
una distribución log normal!
"ig! *ipos de distribución de acuerdo a su coefciente de asimetría,
asimCtrica sesgada a la derecha, simCtrica y asimCtrica sesgada al aizquierda
"ig! (nálisis de distribución segIn el coefciente de asimetría
#l sesgo a su vez me indica que los datos tienen una simetría positiva!
(demás se muestra claramente que tiene una distribución log normal para
luego normalizarlo a fn de tener una distribución normal con un error de
estimación confable que puede ser del
-
8/17/2019 Informe Aed Geoestadistica
11/23
"ig! *ipos de distribución segIn el coefciente de urtosis
*al como de nuestra distribución se obtuvo una 'eptocIrtica es decir de un
coefciente de asimetría mayor a ? que indica que la distribución tiene
mayor altura que la distribución normal!
#l otro análisis consiste en hacer el diagrama de cajas y bigotes o K+G P'+*
"ig! )iagrama de cajas y bigotes grafco representativo
"ig! #jemplo de grafca de cajas
#ste ejemplo cualquiera representativo nos ayudara a comprender lo que se
busca con este diagrama de cajas que nos permite conocer la localizaciones
centro de los datos, su dispersión 5el rango intercuartilico6, la simetría de la
distribución y la más primordial la existencia de datos que se desvían del
patrón general 5datos atípicos6 los outliers!
Para este análisis necesitamos los datos siguientes datos mínimo, máximo
el primer y el tercer cuartil así como la mediana con estos datos que se
obtienen con #xcel obtenemos la gráfca aunque al procesarlo en el #xcel no
-
8/17/2019 Informe Aed Geoestadistica
12/23
se logra visualizar los outliers cosa por la que necesitamos de la ayuda del
spss!
(quí henos considerado usar tambiCn las otras variables del cu lo que son el
-1/, -1-& 0 -1 que son el cobre soluble, cianurado y recuperable
respectivamente para un análisis más amplio del diagrama de cajas aunque
nuestro interCs se centra en el cu total
-1 -1/ -1-& -1
:
:!9
:!@
:!?
:!B
:!D
:!E
:!F
"ig! 8rafca de cajas y bigotes en #xcel de la data toromocho
(unque quizá la desventaja del procesamiento en #xcel es que no se puedever los outliers por algIn motivo por ello tambiCn se trabajó con el sot$are
-
8/17/2019 Informe Aed Geoestadistica
13/23
estadístico en el cual se puede apreciar el diagrama de cajas con el objetivo
de visualizar los outliers!
EVALUACI$N DE LA MORMALIDAD DE
LOS DATOS-omo obtuvimos una distribución log normal de leyes de -u entonces lo
siguiente es normalizar nuestros datos es decir llevarlos a una distribución
normal para ello se lleva a cabo el estudio de la normalidad existen diversos
mCtodos para la evaluación de la normalidad de un conjunto de datos para
nuestro caso se creyó conveniente usar un mCtodo sencillo y practico como
es el mCtodo grafco es hacer el diagrama de cuantiles5LLMplot6 que
detallaremos pero cabe resaltar que tambiCn se normaliza con el contraste
de hipótesis o Prueba de normalidad de Nolmogorov que es un poco más
tediosa pero con el diagrama de cuantiles de orma gráfca podremos
normalizar nuestra distribución!
%R&ICO DE CUANTIL '((-PLOT) EN EXCEL
'a construcción de este grafco de probabilidad normal se realiza a travCs
de los cuantiles de la normal estándar, de orma que aceptaremos la
hipótesis de normalidad de nuestros datos siempre que los puntos en el
grafco tengan un comportamiento Osufcientemente rectilíneo
8ráfco LML nos permite comparar los cuantiles obtenidos de la muestra
con los de la distribución teórica! #ste gráfco sirve para determinar si un
conjunto de datos se ajusta a una distribución normal! 'a normalidad de losdatos será perecta cuando los puntos estCn sobre la línea recta
"ig!
%uestra los tipos de grafcas de cuantiles o gráfcos de probabilidad normal
-
8/17/2019 Informe Aed Geoestadistica
14/23
'os elementos undamentales de este grafco de probabilidad son los
Opuntos de posición grafca 5plotting positions6 aplicado a nuestra data
toromocho y siguiendo nuestro análisis exploratorio de datos se sigue los
siguientes pasos3
Primero disponemos de un conjunto de datos las ;::< muestras del sondajeGi 5i=9, @,?,Q;::
-
8/17/2019 Informe Aed Geoestadistica
15/23
"ig! %uestra el diagrama de cuantiles
INTERPRETACION
)e acuerdo al estudio de la normalidad vemos que nuestro resultado ue
una distribución PlaticIrtica es decir presenta una urtosis dierente a la
normal en este caso es menor de ?!
#s importante destacar que esta representación de dispersión de estos
datos es para lograr la normalidad de los datos lo cual se logra cuando los
puntos están sobre una línea recta además de que hay ciertos parámetros
que considera este mCtodo de grafca de cuantiles que otros no toman en
cuenta pero que al fn de cuentas buscan la normalidad de los datos!
-
8/17/2019 Informe Aed Geoestadistica
16/23
AN&LISIS EN SOT*ARE ESTADISTICO SPSS
#l sot$are 7K% /P// el cual utilizaremos para hacer el análisis de nuestros
datos! #ste procesa de una manera sencilla rápida y es muy completa ya
que te calcula todos los parámetros para la evaluación de la distribución con
solo cargar la data en el programa! (l dar inicio al spss se nos abrirá una
ventana elegimos la opción introducir datos aceptamos!
"ig! el sot$are spss en $in F ?@ bits
Primero hacer el cargado de nuestro datos los ;::< lo cargamos en la
ventana donde se indica variable y ponemos la opción variable numCrica
-
8/17/2019 Informe Aed Geoestadistica
17/23
"ig! -argado de los ;::< datos en variable numCrico spss
-omo nuestro caso es univariable solo una variable los datos de las leyes de
-1 entramos a la opción analizar luego explorar seleccionamos la variable
seleccionamos y arrastramos la data y entramos a cargado de resultados y
de orma sencilla nos dará los siguientes resultados3
"ig! %uestra de los resultado con cada parámetro estadístico
'a opción explorar nos da un conjunto de datos sobre las leyes de -1 que
suministramos al spss! #ste programa nos da de orma inmediata cada uno
de los datos calculados de la tabla de distribución de recuencias mostradasanteriormente con el #xcel entre ellos tenemos el rango, la media, el
-
8/17/2019 Informe Aed Geoestadistica
18/23
mínimo, el máximo, la varianza, la desviación estándar, la asimetría la
urtosis, la desviación típica entre otras medidas de dispersión estadística
relacionadas a la variable cu!
(demás viene anexado a esto una gráfca de tallos y hojas aunque no es
motivo de nuestro estudio pero vale la pena aclarar que el programa da estegrafca por deecto, además no es muy conocido y utilizado alumnos en la
evaluación de análisis exploratorio a nivel de minería en el análisis de leyes
de mineral, no es sino es otra orma de distribución de los datos
básicamente nos permite obtener simultáneamente una distribución de
recuencias de la variable y su representación gráfca! Para construirlo basta
separar en cada dato el Iltimo dígito de la derecha 5que constituye la hoja6
del bloque de ciras restantes 5que ormará el tallo6!
"ig! %uestra el diagrama de tallos y hojas herramienta adicional del spss
-
8/17/2019 Informe Aed Geoestadistica
19/23
"ig! %uestra los resultados con sus ubicaciones en el diagrama de cajas con
spss
(ntes de analizar a nuestro ejemplo primeramente analicemos que
inormación nos aporta el diagrama de cajas en el spss que es casi similar al
#xcel pero que la dierencia está en la manera de analizarlo el spss es más
completo y permite la observación de los outliers!
#n este sot$are ya se puede observar los outliers el cual era el objetivo
para el análisis del diagrama de cajas y bigotes, estos valores atípicos queescapan como datos aislados para luego hacer el análisis respectivo que se
hacer ante el tratamiento de outliers!
-
8/17/2019 Informe Aed Geoestadistica
20/23
"ig! %uestra el diagrama de cajas y bigotes blox plot en spss de la data
toromocho
)e esta manera se puede confrmar los resultados del spss si comparamos
veremos que concuerda con la data toromocho pues si vemos en la clase 9B
teníamos un outliers de ley B!BEB que claramente se puede ver en la parte
alta superior del diagrama asimismo de la clase ; de leyes entre @!@?? a
@!DD@ teníamos @ posibles outliers que tambiCn podemos visualizar justo
entre este intervalos de leyes seguido de la clase F de leyes entre 9!
-
8/17/2019 Informe Aed Geoestadistica
21/23
CONCLUSIONES
-
8/17/2019 Informe Aed Geoestadistica
22/23
#l (#) análisis exploratorio de datos es de vital importancia en la minería
para la estimación de reservas porque es básicamente la interpretación del
muestreo, punto iniciador del Cxito o racaso de una operación minera! #ste
análisis es más estadístico pero con el sC quC hace las inerencias deltratamiento de estos datos, hacer la distribución, el organizarlos y
procesarlos de orma correcta es undamental y nos garantizara el Cxito de
la secuencia de actividades mineras con efciencia!
Para eso este análisis estadístico de las muestras recogidas de los datos de
campo recolectadas de los sondajes, en nuestra ejemplo de aplicación de la
data toromocho la cual se analizó las muestras se organizó la inormación yse hizo el análisis estadístico obteniCndose una distribución de leyes de
cobre log normal como era de esperar pues es normal en ciencias de la
tierra este tipo de distribución! Pero la cual debemos normalizar páralo que
se utilizó el diagrama de cuantiles esta grafca de probabilidad normal lo
cual estima a una distribución normal mediante una recta además de ello
mediante el grafco de cajas y bigotes se pudo observar los datos atípicos
los outliers los cuales serán evaluados para su tratamiento todo el presente
análisis se realizó en #xcel y en el sot$are spss para la aplicación de
nuestra data de leyes de cu de toromocho!
K7K'7+8("7(
-
8/17/2019 Informe Aed Geoestadistica
23/23
+++,mae,".m,es/,,,istri0"!io#es,,,/DISTRI1UCI2N345LO%,o!
htt.6//+++,s!ielo,!l/s!ielo,.h.7.i8S59:;-
545