ciencias de datos con r: fundamentos estadísticos figuritas.… · figuritas. vamos a resolver la...

Post on 23-Jul-2020

7 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Ciencias de Datos con R:

Fundamentos Estadısticos

Daniela Rodriguez (drodrig@dm.uba.ar)Mariela Sued (marielasued@gmail.com)

2018

¿Que espera de la materia?

Mejorar mis conceptos teoricos sobre estadıstica

Tener mınimas herramientas de programacion

Ampliar mis conocimientos en estadıstica y programacioncon R

Aprender rudimentos de programacion

Tener R como lenguaje de progamacion para estadistica.

Otras preguntas

Carrera de Doctorado:

43% Biologıa14 % Quımica10 % Computacion

Indique el lenguaje de programacion que mejor maneja:25 % Ninguno

¿Que es R?

R es un lenguaje de programacion.

Fue disenado para el analisis de datos y la elaboracion degraficos.

Software libre, corre en diferentes sistemas operativos.

Interaccion por linea de comandos (reglas de sintaxis).

https://www.r-project.org/

Pagina de R

¿Que es Rstudio?Es un entorno amigable donde ejecutar R.

https://www.rstudio.com/

Rstudio: Pantalla

Pantalla de Rstudio

Console: Ejecuta comandos y muestra los resultados.

Editor: Aca se escribe lo que se quiere ejecutar (script)

History - Environment

Files - Plots - Packages - Help - Viewer

R como calculadora

2+79*3potencia ?62/3sqrt(4)log(1)exp(1)cos(pi)

Asignacion - Creacion de objetos.

Podemos darle nombre a las cosas y asociarles un valor. Estose llama asignar un valor a una variable.

< −

< − se consigue con el menor, seguido del guion.

pepe< − 3: crea el objeto pepe y le asigna el valor 3.

vector prueba < − c(1,2,4): crea el objeto vector pruebay le asigna los valores 1,2 y 4.

Vectores

c(a,b,c) crea vector concatenando a,b,crep (a,n) repite a n-veces

seq(1:n) equivale a 1:n (1, 2, 3, . . . , n)seq(a,b,by=c) (a, a+ c, a+ 2c, . . . ) hasta b

x[4] selecciona la cuarta coordenada del vector xx[c(2,5)] selecciona la segunda y quinta coordenada del vector xlength(x) calcula la longitud del vector x

Tarea 1 - Graficos

xx< −c(1, 2, 3, 4, 5, 6, 7)yy< −c(1, 4, 9, 16, 25, 36, 49)plot(xx,yy)

Tarea 1 - Graficosxx< −c(1, 2, 3, 4, 5, 6, 7)yy< −c(1, 4, 9, 16, 25, 36, 49)plot(xx,yy)

Grafico en el continuo

Grafico en el continuo

xxcont<−seq ( 0 , 7 , by =0.01)#armo g r i l l a#n e c e s i t o ahora e l e v a r cada e l e m e n t o a l cuadrado .nxx<−l e n g t h ( x x c o n t )yycont<−r e p (NA, nxx )f o r ( i i n 1 : nxx ){y y c o n t [ i ]<− x x c o n t [ i ] ˆ 2}

p l o t ( xxcont , yycont , t y p e=” l ”)

Bucles: for

Bucles que se utiliza para repetir cierta accion. Es util siconocemos de antemano el numero de veces que hay que

repetir la accion (iteraciones).

for (val in sequence){statement}

Tarea 2: Analisis Matematico I - Biologıa

Practica 5: Regla de L’Hospital - Estudio de funciones

Sea f(x) = 15x4 − 32x3 + 23x2 − 8x+ 17.

Calcule

f(−1) =f(−0.8) =f(−0.5) =

Funcion - Ejemplo

f u n c i o n 1<−f u n c t i o n ( mongo ){

s a l i d a <−15∗mongoˆ4−32∗mongoˆ3+23∗mongoˆ2−8∗mongo+17

r e t u r n ( s a l i d a )}

#l l a m o a l a f u n c i o nf u n c i o n 1 (−0.8)

Funcion

Es un tipo de construccion que permite encerrar un pedacitode codigo, para realizar una misma tarea en diferentes

situaciones

NombreFuncion<−f u n c t i o n ( argumentos ){c u e r p o f u n c i o nr e t u r n ( )}

#l l a m o a l a f u n c i o nNombreFuncion ( v a l o r e s pa ra l o s argumentos )

Graficamos:

Grafique f(x) = 15x4−32x3+23x2−8x+17 para x en [−1, 1]

Tarea 3:

Sea g(x) =

{x2 si x ≤ 12x− 1 si x > 1

Implemente una funcion funciong que dado un numerodevuelva el valor de la funcion g en ese numero.

Grafique la funcion g(x) para x ∈ [−13, 14].

Tarea 3:

Sea g(x) =

{x2 si x ≤ 12x− 1 si x > 1

Implemente una funcion funciong que dado un numerodevuelva el valor de la funcion g en ese numero.

Grafique la funcion g(x) para x ∈ [−13, 14].

Estructura de control: if

Permite ejecutar una serie de instrucciones si se cumple ciertacondicion.

i f ( t e s t e x p r e s s i o n ) {s t a t e m e n t}

i f ( t e s t e x p r e s s i o n 1 ) {s t a t e m e n t 1} e l s e i f ( t e s t e x p r e s s i o n 2 ) {s t a t e m e n t 2} e l s e {s t a t e m e n t 4}

Estructura de control: if

Permite ejecutar una serie de instrucciones si se cumple ciertacondicion.

i f ( t e s t e x p r e s s i o n ) {s t a t e m e n t}

i f ( t e s t e x p r e s s i o n 1 ) {s t a t e m e n t 1} e l s e i f ( t e s t e x p r e s s i o n 2 ) {s t a t e m e n t 2} e l s e {s t a t e m e n t 4}

Album de Figuritas

Album Vacıo

Compramos Figuritas

Album Lleno

Completando el album:

Album con 640 figuritas.

Cada figurita se imprime en cantidades iguales y sedistribuye aleatoriamente.

Cada paquete incluye 5 figuritas.

¿Que preguntas podemos plantear?

¿Cuantos paquetes hay que comprar para llenar el album?

EN PROMEDIO, ¿cuantos paquetes hay que comprarpara llenar el album?

¿Que chances tengo de completar el album si puedocomprar a lo sumo 800 paquetes?

Completando el album:

Album con 640 figuritas.

Cada figurita se imprime en cantidades iguales y sedistribuye aleatoriamente.

Cada paquete incluye 5 figuritas.

¿Que preguntas podemos plantear?

¿Cuantos paquetes hay que comprar para llenar el album?

EN PROMEDIO, ¿cuantos paquetes hay que comprarpara llenar el album?

¿Que chances tengo de completar el album si puedocomprar a lo sumo 800 paquetes?

Completando el album:

Album con 640 figuritas.

Cada figurita se imprime en cantidades iguales y sedistribuye aleatoriamente.

Cada paquete incluye 5 figuritas.

¿Que preguntas podemos plantear?

¿Cuantos paquetes hay que comprar para llenar el album?

EN PROMEDIO, ¿cuantos paquetes hay que comprarpara llenar el album?

¿Que chances tengo de completar el album si puedocomprar a lo sumo 800 paquetes?

Completando el album:

Album con 640 figuritas.

Cada figurita se imprime en cantidades iguales y sedistribuye aleatoriamente.

Cada paquete incluye 5 figuritas.

¿Que preguntas podemos plantear?

¿Cuantos paquetes hay que comprar para llenar el album?

EN PROMEDIO, ¿cuantos paquetes hay que comprarpara llenar el album?

¿Que chances tengo de completar el album si puedocomprar a lo sumo 800 paquetes?

Simplificacion: se venden figuritas individualmente.

Album con 6 figuritas.

Cada figurita se imprime en cantidades iguales y sedistribuye aleatoriamente.

Compramos figuritas de a una.

EN PROMEDIO, ¿cuantas figuritas hay que comprar parallenar el album?

Compremos figuritas y...¡a experimentar!

¿Como podemos experimentar sin comprar figuritas?

Simplificacion: se venden figuritas individualmente.

Album con 6 figuritas.

Cada figurita se imprime en cantidades iguales y sedistribuye aleatoriamente.

Compramos figuritas de a una.

EN PROMEDIO, ¿cuantas figuritas hay que comprar parallenar el album?

Compremos figuritas y...¡a experimentar!

¿Como podemos experimentar sin comprar figuritas?

Simplificacion: se venden figuritas individualmente.

Album con 6 figuritas.

Cada figurita se imprime en cantidades iguales y sedistribuye aleatoriamente.

Compramos figuritas de a una.

EN PROMEDIO, ¿cuantas figuritas hay que comprar parallenar el album?

Compremos figuritas y...¡a experimentar!

¿Como podemos experimentar sin comprar figuritas?

TODOS PENSANDO y CIERRE PARA ALBUM CON 6FIGURITAS

Vamos a resolver la guıa.

Operadores

Aritmeticos Comparativos Logicos

+ Adicion == Igual a & Y logico- Substraccion != Diferente de ! NO logico∗/ Multiplicacion Division <,> Menor que, Mayor que | O logico

Funciones

Funciones matematicas Funciones estadısticas

sqrt(x) Raız de x mean(x) Mediaexp(x) Exponencial de x sd(x) Desviolog(x) Logaritmo natural de x var(x) Varianzalog10(x) Logaritmo base 10 median(x) Medianalength(x) Numero de elementos quantile(x,p) Quantilessum(x) Suma los elementos de x max(x) El maximoprod(x) Producto de los elementos min(x) El mınimosin(x) Seno summary(x) Resumencos(x) Coseno sort(x) Ordena (creciente)tan(x) Tangenteround(x,n) redondea a n dıgitoscumsum(x) calcula las sumas acumuladaschoose(n, k) calcula en combinatorio

Use variable < − value to assign a value to a variable inorder to record it in memory.

Objects are created on demand whenever a value isassigned to them.

The function length gives the number of elements in avector

Use object[i] to select a the i-th element from object.

Use from:to to specify a sequence that includes theindices from from to to.

All the indexing and subsetting that works on data framesalso works on vectors.

Use # to add comments to programs.

Use apply to calculate statistics across the rows orcolumns of a data frame.

Use plot to create scatterplot visualizations. content...

Graficos

plot(x,y) grafica los pares x vs. y - help(plot)hist(x) realiza un histograma con los valores del vector x - help(hist)

boxplot(x) realiza un boxplot con los valores del vector x - help(boxplot)barplot(x) realiza grafico de barras de x - help(barplot)

pie(table(x)) realiza grafico de torta de la tabla de x - help(pie)par(mfrow = c(1, 2)) particiona el entonrno grafico

Dos referencias

http://cms.dm.uba.ar/academico/materias/1ercuat2016/probabilidades y estadistica C/

http://cms.dm.uba.ar/academico/materias/1ercuat2016/estadisticaQ/practicas

Bucles

Hay dos tipos de bucles dependiendo de si conocemos deantemano el numero de veces que hay que repetirlo

(iteraciones).

La construccion for es muy util especialmente cuando sesabe el total de trabajo a realizar (por ejemplo sumartodos los elementos de un vector).

El while tambien permite recorrer, pero es mas flexiblerespecto a cuando dejar de hacerlo.

El while ofrece mas posibilidades para elegir condicionesde corte del ciclo. interesantes.

while

while (condition){statement}

Comparaciones

< menor

<= menor o igual

> mayor

>= mayor o igual

== igual

!= diferente

Combinando comparaciones

Tambien se pueden compbinar distintas condiciones utilizandooperadores logicos

& se usa x & y. Solo da TRUE cuando x y y son TRUE

or Da TRUE cando alguna de las dos condiciones (o lasdos) es TRUE.

top related