manual1 sas

158
Software de Análisis Estadístico SAS Jessica Paola Vargas Castro 1 Luis Felipe Patiño Oquendo 2 Cindy Carolina Lugo Rozo 3 Viviana Oquendo julio de 2013 Resumen: El uso de los software econométricos en la última década han trascendido para los profesionales como una herramienta útil para el análisis estadístico y económico, así, tareas que tomaban horas se trabajan en segundos y el profesional en su disciplina puede emitir un análisis más rápidamente y con una clara visión de lo que ocurre con los datos que trabaja. Este documento pretende guiar en el manejo del software SAS (Statistical Analysis Software) tanto en la parte técnica como en la parte aplicativa. Palabras Clave: Software, econometría, series de tiempo, análisis gráfico, pronóstico, datos panel, regresión. JEL: Statistical Analysis Software SAS Abstract: The use of econometric software in the last decade have transcended for professionals as a useful tool for statistical analysis and economic, as well, tasks that took hours are worked in seconds and the professional in their 1 Estudiante de economía de la Facultad de Ciencias Económicas de la Universidad Nacional de Colombia, y monitor junior del grupo capacitaciones de la Unidad de Informática y Comunicaciones de la Facultad de Ciencias Económicas durante. Correo Electrónico: [email protected] 2 Estudiante de ingeniería eléctrica de la Facultad de Ingeniería de la Universidad Nacional de Colombia, y monitor junior del grupo capacitaciones de la unidad de informática y comunicaciones de la Facultad de Ciencias Económicas durante. Correo Electrónico: [email protected] 3 Estudiante de economía de la Facultad de Ciencias Económicas de la Universidad Nacional de Colombia, y monitor junior del grupo mejor gestión de la Unidad de Informática y Comunicaciones de la Facultad de Ciencias Económicas durante. Correo Electrónico: [email protected]

Upload: lcoaguilap

Post on 16-Sep-2015

61 views

Category:

Documents


5 download

DESCRIPTION

xx

TRANSCRIPT

  • Software de Anlisis Estadstico SAS

    Jessica Paola Vargas Castro1

    Luis Felipe Patio Oquendo2

    Cindy Carolina Lugo Rozo3

    Viviana Oquendo

    julio de 2013

    Resumen:

    El uso de los software economtricos en la ltima dcada han trascendido para

    los profesionales como una herramienta til para el anlisis estadstico y

    econmico, as, tareas que tomaban horas se trabajan en segundos y el

    profesional en su disciplina puede emitir un anlisis ms rpidamente y con

    una clara visin de lo que ocurre con los datos que trabaja. Este documento

    pretende guiar en el manejo del software SAS (Statistical Analysis Software)

    tanto en la parte tcnica como en la parte aplicativa.

    Palabras Clave:

    Software, econometra, series de tiempo, anlisis grfico, pronstico, datos panel,

    regresin.

    JEL:

    Statistical Analysis Software SAS

    Abstract:

    The use of econometric software in the last decade have transcended for

    professionals as a useful tool for statistical analysis and economic, as well,

    tasks that took hours are worked in seconds and the professional in their

    1 Estudiante de economa de la Facultad de Ciencias Econmicas de la Universidad

    Nacional de Colombia, y monitor junior del grupo capacitaciones de la Unidad de

    Informtica y Comunicaciones de la Facultad de Ciencias Econmicas durante. Correo

    Electrnico: [email protected] 2 Estudiante de ingeniera elctrica de la Facultad de Ingeniera de la Universidad

    Nacional de Colombia, y monitor junior del grupo capacitaciones de la unidad de

    informtica y comunicaciones de la Facultad de Ciencias Econmicas durante. Correo

    Electrnico: [email protected] 3 Estudiante de economa de la Facultad de Ciencias Econmicas de la Universidad

    Nacional de Colombia, y monitor junior del grupo mejor gestin de la Unidad de

    Informtica y Comunicaciones de la Facultad de Ciencias Econmicas durante. Correo

    Electrnico: [email protected]

  • INV- Software de Anlisis Estadstico SAS /2013-I

    2

    discipline can issue further analysis quickly and a clear vision of what happens

    to the data that works. This document is intended to guide the management of

    SAS software (Statistic Analysis Software) in both the technical and on the

    applicative.

    Keywords:

    Software, econometrics, time series, graphic analysis, quality control, forecast

  • INV- Software de Anlisis Estadstico SAS /2013-I

    3

    Director Unidad Informtica:

    Henry Martnez Sarmiento

    Tutor Investigacin:

    Viviana Mara Patio Oquendo

    Coordinadores:

    Jasmin Guerra Crdenas

    Juan Carlos Tarapuez Roa

    Coordinador Servicios Web:

    John Jairo Vargas

    Analista de Infraestructura y

    Comunicaciones:

    Diego Alejandro Jimnez Arvalo

    Analista de Sistemas de Informacin:

    Vctor Hugo Ramos Ramos

    Estudiantes Auxiliares:

    Ahumada Avendao Fredy Esteban

    Alvarado Castillo Paola Alejandra

    Alzate Gaitn Paola Andrea

    Andrade Martnez David Ricardo

    Caldern Espitia Walter Helberth

    Cano Daz Alberto

    vila Ibez Diego Fernando

    Enciso Castao Julin David

    Gonzlez Mayorga Cesar Felipe

    Gisa Daz Carlos Eduardo

    Hernndez Carvajal Miguel ngel

    Hurtado Casas Andrs Felipe

    Leyva Daz Daniel Felipe

    Lugo Rozo Cindy Carolina

    Malangn Carvajal Laura Juliana

    Martnez Cortes Nicols

    Miranda Hernndez Ncolas

    Montes Parra Mayerli Andrea

    Moreno Urin Germn Yesid

    Oquendo Patio Viviana Mara

    Patio Oquendo Luis Felipe

    Pineda Estupian Andrs Javier

    Rojas Martn Daniel Francisco

    Rubiano Rojas Mario Andrs

    Vargas Castro Jessica Paola

    Este documento es resultado de un trabajo

    conjunto y coordinado de los integrantes de

    la Unidad de Informtica y Comunicaciones

    de la Facultad de Ciencias Econmicas de la

    Universidad Nacional de Colombia.

    Esta obra est bajo una licencia reconocimiento no comercial 2.5

    Colombia de CreativeCommons. Para ver una copia de esta licencia,

    visite http://creativecommons.org/licenses/by/2.5/co/ o enve una carta a

    CreativeCommons, 171second street, suite 30 San Francisco, California

    94105, USA.

  • INV- Software de Anlisis Estadstico SAS /2013-I

    4

    Software de Anlisis Estadstico SAS

    1. Contenido

    2. Introduccin ............................................................................................................... 6

    2.1. Caractersticas generales del software .............................................................. 6

    2.1.1. Requerimientos del sistema para Linux(Official Page, Statistical Analysis

    Software SAS, 2013) .................................................................................................. 6

    2.1.2. Requerimientos del sistema para Windows(Official Page, Statistical

    Analysis Software SAS, 2013) ................................................................................... 6

    2.1.3. Comparacin del software con otros software estadsticos ........................ 7

    2.1.4. Listado de funciones del programa SAS(Universidad Complutense de

    Madrid, 2013) ............................................................................................................ 7

    2.1.5. Aplicabilidad de SAS ................................................................................... 8

    2.2. Lenguaje de programacin ................................................................................. 8

    2.2.1. Acerca del lenguaje de programacin(N/A, 2013) ....................................... 8

    2.2.2. Uso del software segn la pgina oficial de SAS(Official Page, Statistical

    Analysis Software, 2013) ........................................................................................... 8

    2.3. Manual SAS ....................................................................................................... 9

    2.3.1. Crear una librera ....................................................................................... 9

    2.3.2. Leer data sets de SAS ............................................................................... 13

    2.3.3. Leer archivos de bases de datos para pc ................................................... 15

    2.3.4. Presentar programas de sas para hosts remotos...................................... 18

    2.3.5. Crear y definir variables ........................................................................... 21

    2.3.6. Usar declaraciones condicionales ............................................................. 21

    2.3.7. Subconjunto de datos ................................................................................ 22

    2.3.8. Trabajo con Fechas y Horas de SAS ......................................................... 23

    2.3.9. Impresin de Datos ................................................................................... 24

    2.3.10. Conteo de datos ...................................................................................... 24

    2.3.11. Tabular datos ......................................................................................... 25

    2.3.12. Consulta de datos .................................................................................. 26

    2.3.13. Unir tablas ............................................................................................. 27

    2.3.14. Crear grficos......................................................................................... 28

    2.3.15. Crear grficos (2) ................................................................................... 29

  • INV- Software de Anlisis Estadstico SAS /2013-I

    5

    2.3.16. Regresin simple y mltiple .................................................................. 31

    2.3.17. ARIMA ................................................................................................... 36

    2.3.18. Datos Panel ............................................................................................ 44

    2.3.19. ODS Graphics Designer......................................................................... 65

    2.4. Clases ............................................................................................................... 71

    2.4.1. Primera Clase ............................................................................................ 71

    2.4.2. Segunda clase Definiciones bsicas para la insercin de variables ...... 72

    2.4.3. Tercera Clase Lgica condicional, fechas y horas, subconjuntos .......... 77

    2.4.3.1. Lgica condicional .................................................................................. 77

    2.4.3.2. Subconjuntos de datos ........................................................................... 81

    2.4.3.3. Fechas y horas con SAS ......................................................................... 83

    2.4.3.6. SAS DATATIME VALUE ...................................................................... 84

    2.4.4. Cuarta clase Regresin simple ............................................................... 86

    2.4.5. Quinta Clase Regresin multiple ........................................................... 90

    2.4.6. Sexta clase - Modelos ARIMA ................................................................. 103

    2.4.7. Sptima clase Datos Panel ................................................................... 119

    2.4.8. Octava clase ODS Graphics Designer .................................................. 140

    3. Conclusiones .......................................................................................................... 155

    4. Referencias ............................................................................................................ 157

  • INV- Software de Anlisis Estadstico SAS /2013-I

    6

    2. Introduccin

    La empresa SAS crea el Statistical Analysis Software (SAS) principalmente como un mtodo

    para la organizacin y control de grandes bases de datos. SAS fue diseado de manera tal que

    respondiera a una recoleccin, transformacin, anlisis y reporte de datos; de manera adecuada

    y eficiente para la organizacin que disponga del software. Sin embargo, pronto el software

    comenz a formarse como uno de los paquetes economtricos ms poderosos del mercado.

    Adems, el software puede generar muchas soluciones de negocio que permiten soluciones de

    software a gran escala para reas como administracin, gestin de recursos humanos, gestin

    financiera, inteligencia de negocios y ms. La ltima versin de SAS fue SAS 9.3 y sali al

    mercado en diciembre de 2011.

    2.1. Caractersticas generales del software

    2.1.1. Requerimientos del sistema para Linux(Official Page, Statistical

    Analysis Software SAS, 2013)

    Sistemas operativos de LINUX:

    Red Hat Enterprise Linux 4 y 5

    SuSE Linux Enterprise Server 9 y 10

    Linux x 64 (siempre y cuando sea por la va de compatibilidad de 32 bits.

    Para esta versin de SAS, los requerimientos del hardware son:

    Intel Pentium 4 o superior o Procesadores XeonClass

    64 Mb de memoria

    Soporte de pantalla de mnimo 256 colores

    2.1.2. Requerimientos del sistema para Windows(Official Page, Statistical

    Analysis Software SAS, 2013)

    SAS 9.1 se puede instalar en prcticamente cualquier sistema operativo de

    Windows:

    Windows 7, Windows Vista, Windows XP, Windows 2000, Windows NT Family.

    Requerimientos mnimos del Hardware

  • INV- Software de Anlisis Estadstico SAS /2013-I

    7

    Intel Pentium II

    Memoria de 256 Mb

    Resolucin de pantalla de 800 * 600 o superior

    Acceso a internet

    2.1.3. Comparacin del software con otros software estadsticos

    En la siguiente pgina se muestra unas amplias tablas de comparacin de gran

    cantidad de Software de anlisis estadstico:

    http://en.wikipedia.org/wiki/Comparison_of_statistical_packages

    Las caractersticas de SAS muestran que el software no es Libre y es de

    licencia propietaria, adems de usar una interfaz grfica CLI/GUI. El software

    como ya se mencion trabaja en los sistemas operativos de Linux y Windows,

    adems de UNIX. No trabaja en BSD y en Mac OS fue terminado.

    En las diferentes tablas tambin aparecen los programas que utilizan varios

    mtodos ANOVA (ANOVA son los diferentes modelos estadsticos que existen)

    en el cual SAS maneja todos los mtodos:

    One way, Two Way, MANOVA, GLM, Mixed Model, Post-host, Latin squares.

    Tambin muestra los diferentes modelos de regresin que existen y los software

    que los manejan. De nuevo SAS es capaz de aplicar todos los mtodos:

    OLS, WLS, 2SLS, NLLS, Logistic, GLM, LAD, Stepwise, Quantitle, Probit, Cox,

    Poisson, MLR.

    La siguiente tabla en la pgina muestra los software que utilizan diferentes

    anlisis de series temporales. SAS maneja todos:

    ARIMA, GARCH, Unit root test, Cointegration test, VAR, Multivariable

    GARCH

    SAS emplea todos los grficos y diagramas que manejan los software

    estadsticos. En estas diferentes tablas se puede concluir que SAS es uno de los

    programas ms completos en el mercado.

    2.1.4. Listado de funciones del programa SAS(Universidad Complutense de

    Madrid, 2013)

    SASAnalytics es la marca registrada que maneja la empresa para integrar

    todo lo que involucra el modelado predictivo y analtico. Entre las funciones del

    programa SAS encontramos:

    Las utilidades de entorno grfico:

    Creacin y manipulacin de libreras de datos SAS (llamados SAS-FILES)

    Importacin/exportacin de datos externos en ficheros ASCII

    Importacin/exportacin de datos externos en ficheros en otros formatos, por

    ejemplo, EXCEL.

  • INV- Software de Anlisis Estadstico SAS /2013-I

    8

    Exportacin de grficos a otros formatos.

    Para estadstica y econometra encontramos:

    Estadstica descriptiva simple

    Regresin y anlisis de varianza y covarianza

    Anlisis de datos cualitativos

    Anlisis discriminante

    Anlisis cluster

    Anlisis de supervivencia

    Scoring (estandarizacin y construccin de variables)

    Imputacin de datos perdidos

    Anlisis de potencia

    Clculo de medidas de distancia

    2.1.5. Aplicabilidad de SAS

    El programa SAS est pensado como un software para el anlisis y manejo de

    datos que busca mejorar la gestin empresarial, por su capacidad de organizacin y

    anlisis. SAS desea que los usuarios del software puedan facilitar su proceso de

    toma de decisiones utilizando modelos predictivos, descriptivos, de simulacin y

    optimizacin. Con ello se busca llegar a la solucin de los problemas cotidianos del

    entorno econmico y fomentar el desarrollo interno de los agentes que usen el

    software. En esa medida, en la Universidad Nacional, son las carreras afines al

    entorno econmico y en general carreras que trabajan con bases de datos, las que

    pueden aprovechar las opciones que ofrece SAS; especialmente las carreras de la

    Facultad de Ciencias Econmicas.

    2.2. Lenguaje de programacin

    2.2.1. Acerca del lenguaje de programacin(N/A, 2013)

    El lenguaje de programacin que utiliza SAS fue diseado por el mismo SAS. Su

    sintaxis est inspirada en la de PL/I (lenguaje propuesto por IBM en 1970), este

    opera en primera instancia sobre tablas de datos. Estas tablas de datos las puede

    leer, transformarlas, combinarlas, resumirlas, crear informes, entre otras cosas. El

    ncleo del lenguaje incluye Pasos data que permiten realizar operaciones sobre las

    filas de un conjunto de datos, procedimientos de manipulacin de datos que

    permiten ordenar tablas, enlazarlas, etc., un intrprete de SQL, un superlenguaje

    de macros.

    2.2.2. Uso del software segn la pgina oficial de SAS(Official Page, Statistical

    Analysis Software, 2013)

  • INV- Software de Anlisis Estadstico SAS /2013-I

    9

    Cualquier software informtico que pueda descargarse o que de cualquier otra

    forma est disponible en esta pgina Web se encuentra sujeto a una licencia que

    puede ser la del contrato escrito de licencia suscrito entre usted y SAS o la licencia

    click-on que usted acepta en el momento de descarga o uso. El software al que cualquiera de estas dos licencias le sea de aplicacin se encuentra, salvo pacto en

    contrario, sujeto nicamente a los trminos de su contrato de licencia asociado.

    En cualquier caso, si ni una licencia escrita o una click-on estn disponibles, el uso que usted haga del software se encontrar sujeto a las siguientes condiciones:

    1) No podr usar, reproducir, grabar, modificar, publicar, comunicar pblicamente

    o distribuir ningn software disponible a travs de esta pgina Web sin el previo

    consentimiento expreso y por escrito de SAS

    2) Se le reconoce una licencia personal, no exclusiva, para usar dicho software

    sujeto a las restricciones indicadas ms arriba

    3) Dicho software se encuentra sujeto a todas las Garantas y Limitaciones de

    responsabilidad que se establecen a continuacin

    4) Salvo expresamente garantizado en otro lugar, SAS Institute Inc. y sus

    otorgantes de licencias se reservan todos los derechos, ttulos e intereses en

    relacin a dicho software.

    2.3. Manual SAS

    Como mtodo de autoexploracin del software SAS se estableci que a partir del

    software y su respectivo manual, se iran encontrando las diferentes funciones del

    programa y con base en estas se realizara la estructura del curso de acuerdo a los

    diferentes tems encontrados y a la experiencia en la unidad sobre estos tipos de

    software y el mejor procedimiento para dictar un curso libre. A continuacin se

    presenta la primera parte del manual de SAS con los siguientes tems:

    o Crear una Librera

    o Leer data sets de SAS

    o Leer archives de bases de datos para PC

    o Presentar programas de SAS para host remotos.

    2.3.1. Crear una librera

    Antes de iniciar con SAS file, generalmente se debe definir primero una librera de

    SAS, esto con el fin de mostrarle a SAS donde se encuentra el archivo. Usted ha

    creado ya una biblioteca SAS interactivamente mediante la ventana de la nueva

    biblioteca. Otra forma de definir una biblioteca SAS es utilizando una instruccin

    LIBNAME. Esta declaracin LIBNAME permite 4 cosas:

  • INV- Software de Anlisis Estadstico SAS /2013-I

    10

    Identifica una Librera SAS a SAS.

    Asocia un motor con la librera

    Permite asociar especificaciones con la librera

    Asigna un libref (nombre de referencia de la librera) a ella misma.

    A gran ventaja del comando LIBNAME es que puede almacenarla en un programa

    de SAS, as, se puede referenciar la librera automticamente cuando se enve el

    programa. Una vez que se asigna a la libref, usted puede leer, crear o actualizar

    archivos en una biblioteca SAS:

    libref.filename

    En el nombre de dos niveles, libref es el nombre de la biblioteca SAS que contiene

    el archivo y nombre_de_archivo es el nombre del mismo archivo. Un perodo separa

    la libref y el nombre de archivo. En el nombre de dos niveles, libref es el nombre de

    la biblioteca SAS que contiene el archivo y filename es el nombre del mismo

    archivo. Un perodo separa la libref y el filename.

    Si se tienen las licencias de 1 o ms productos de SAS diferentes, es posible crear una

    librera SAS que referencie relaciones de DBMS database, schema, server, o grupos de

    tablas y vistas.

    Mtodo de Point and Click

    Se puede crear una librera mediante:

    1. Clic en View > Explorer.

    2. Clic en File > New.

  • INV- Software de Anlisis Estadstico SAS /2013-I

    11

    3. En la ventana de New Library, especifique la informacin para la nueva

    librera. Si usted quiere sea creada en el comienzo de cualquier sesin de SAS, haga

    clic en Enable at startup.

    4. Clic OK.

    EJEMPLO 1

    Asignacin de un libref a archivos de referencia SAS

    Suponga que usted quiere definir una librera SAS para referenciar una carpeta en el

    entorno operativo de Windows que contiene algunos SAS data sets. Luego usted

    quiere crear un nuevo data set, imprimirlo e imprimir un data set existente en la

    misma librera. El siguiente programa define la librera Sales y referencia los

    archivos SAS con esta librera.

    Usted puede copiar y enviar este programa en SAS. Sin embargo, es necesario

    editar el directorio en el estado LIBNAME (est en rojo) para referenciar un directorio

    existente en su entorno operativo.

    /*************************************/

    /* define SAS library */

    /*************************************/

    libname sales 'c:\salesdata\sas\2002';

    /*************************************/

    /* create new data set from raw data */

    /*************************************/

    data sales.quarter1;

    length Department $ 7 Site $ 8;

    input Department Site Quarter Sales;

    datalines;

    Parts Sydney 1 4043.97

    Parts Atlanta 1 6225.26

    Parts Paris 1 3543.97

    Repairs Sydney 1 5592.82

    Repairs Atlanta 1 9210.21

    Repairs Paris 1 8591.98

    Tools Sydney 1 1775.74

    Tools Atlanta 1 2424.19

    Tools Paris 1 5914.25

    ;

    run;

    /*************************************/

    /* print new data set */

    /*************************************/

    proc print data=sales.quarter1;

    run;

    /*************************************/

    /* print existing data set */

    /*************************************/

    proc print data=mylib.productsales;

    run;

  • INV- Software de Anlisis Estadstico SAS /2013-I

    12

    EJEMPLO 2

    Ahora suponga que usted quiere imprimir tambin una tabla Oracle y una tabla DB2.

    El siguiente programa muestra cmo puede especificar declaraciones LIBNAME con

    los motores de SAS/ACESS y opciones apropiadas. Despus de asignar un libref a

    DBMS, es posible referenciar estas tablas y vistas como SAS data sets, usando los

    nombres estndar two-level SAS.

    Mientras usted pueda definir cualquier nmero de librefs in SAS, usted puede

    procesar datos desde mltiples recursos DBMS en el mismo programa de SAS.

    Debido a que esta es una gua rpida para principiantes, no es posible copiar y correr

    este programa como se muestra. Sin embargo es posible modificarlo para trabajar con

    tablas DBMS que usted pueda acceder.

    /*************************************/

    /* define SAS library for Oracle */

    /*************************************/

    libname myorlib oracle user=scott password=tiger

    path="blunzer:v7" schema=hrdept;

    /*************************************/

    /* define SAS library for DB2 */

    /*************************************/

    libname mydblib db2

    noprompt="user=testuser;

    password=testpass;database=testdb";

    /*************************************/

    /* print Oracle table */

    /*************************************/

    proc print data=myorlib.all_employees;

    where state='CA';

    run;

    /*************************************/

    /* print DB2 table */

    /*************************************/

    proc print data=mydblib.customers;

    where state='CA';

    run;

    /*************************************/

    /* clear librefs */

    /*************************************/

    libname myorlib clear;

    libname mydblib clear;

  • INV- Software de Anlisis Estadstico SAS /2013-I

    13

    REFERENCIAS

    Ac puede encontrar ms informacin acerca de crear libreras.

    Documentacin en Help SAS:

    1. En SAS, click Help SAS Help and Documentation.

    2. Expanda SAS Products Base SAS.

    3. Expanda SAS Language Concepts SAS Files Concepts SAS Data

    Libraries y mire los tpicos de inters

    4. Expand SAS Language Dictionary Dictionary of Language Elements

    Statements y click LIBNAME statement y LIBNAME Statement,

    SAS/ACCESS.

    5. Expanda Using SAS Software in Your Operating Environment, luego en la

    seccin de su entorno operativo. Expanda Using SAS Files y vea los tpicos

    relacionados con las libreras de SAS

    Preguntas en el soporte tcnico Frequently Asked Questions

    Programas in SAS help:

    1. En SAS, click Help SAS Help and Documentation.

    2. Expand Learning to Use SAS y click Sample SAS Programs.

    3. Clic Base SAS y mire los programas de inters

    2.3.2. Leer data sets de SAS

    Tal vez quiera crear un nuevo data set desde un data set existente. En Create an run

    SAS programas, haya visto ejemplos de DATA step que lee existiendo data sets usando

    una declaracin SET. Leyendo un data set en un DATA step es ms simple que leyendo

    los datos en bruto debido a que el trabajo de describir y convertir los datos ya se han

    hecho.

    Ahora, cuando usted usa un data sets existente o subsets creados desde SAS data sets,

    usted puede hacer ms eficiente el uso de los recursos del computador que si usara los

    datos en bruto (raw data) o si est trabajando con data sets largos. Leer menos

    variables significa que SAS crea un program data vector ms pequeo, y leyendo menos

    observaciones significa que existen menos iteraciones para el DATA step que se crean.

    Usted puede leer desde uno o ms data set, combinar y modificar datos en diferentes

    maneras, por ejemplo usted puede:

    Combinar 2 o ms input data sets para crear un output data ser

    Fusionar datos desde 2 o ms data sets para crear un output data set

    Actualizar un archivo master basado en las grabaciones de transaccin.

    En el caso ms simple usted lee datos desde un solo SAS data set:

  • INV- Software de Anlisis Estadstico SAS /2013-I

    14

    Como las principales herramientas para leer, combinar y modificar data sets, usted

    puede usar cuatro declaraciones: SET, MERGE, MODIFICY y UPDATE. Para procesar

    los datos y crear un data set de salida, puede usar una programacin adicional de

    declaraciones SAS en el paso DATA.

    Esta tarea se centra en la lectura de un nico conjunto de datos SAS utilizando la

    sentencia SET.

    EJEMPLO

    Cuando usted lee data sets de SAS, el gran poder del paso de programacin DATA est

    disponible para usted. Los siguientes ejemplos muestran algunos caminos fciles para

    usar la declaracin SET para leer una existente data set.

    Usted puede copiar y enviar estos programas en SAS. En los datos de

    Mylib.ProductSales fue creado por Work with SAS data sets. Si no se cre, vuelva

    a la tarea definir la librera y crear un data set antes de cargar estos

    programas que aparecen a continuacin

    /*************************************/

    /* read a data set and subset */

    /*************************************/

    data canada;

    set mylib.productsales;

    if country='CANADA';

    run;

    /*************************************/

    /* read a data set, subset, and */

    /* create new variables */

    /*************************************/

  • INV- Software de Anlisis Estadstico SAS /2013-I

    15

    data canada2;

    set mylib.productsales;

    if country='CANADA';

    Total_Variance=actual-predict;

    Forecast=actual*1.15;

    run;

    /*************************************/

    /* read a subset using direct access */

    /*************************************/

    data product_sample;

    do obsnum=1 to 100 by 2;

    set mylib.productsales point=obsnum;

    if _error_ then abort;

    output;

    end;

    stop;

    run;

    REFERENCIAS

    Documentation, publications, and FAQs

    Documentacin en SAS help:

    1. En SAS, click Help< SAS Help and Documentation.

    2. Expanda SAS Products< Base SAS< SAS Language Concepts.

    3. Expand DATA Step Concepts< Reading, Combining, and Modifying SAS Data

    Sets y mire los tpicos de interes

    4. Expand SAS System Concepts< Rules for Words and Names in the SAS

    Language y mire los tpicos de interes.

    5. Expand SAS Products< Base SAS< SAS Language Dictionary< Dictionary of

    Language Elements< SAS Data Set Options y mire los topicos de interes

    Preguntas en working with SAS data sets en SAS Technical Support's Frequently

    Asked Questions

    Ejemplos de programas

    programs in SAS help:

    1. En SAS, click Help< SAS Help and Documentation.

    2. Expand Learning to Use SAS y click Sample SAS Programs.

    3. Click Base SAS y vea Starting with SAS Data Sets, Chapter 4.

    2.3.3. Leer archivos de bases de datos para pc

  • INV- Software de Anlisis Estadstico SAS /2013-I

    16

    Si usted tiene un archivo de base de datos ya sea en hojas de clculo de Microsoft Excel,

    Lotus o archivos de Microsoft Access, puede usar SAS para importar estos archivos y

    crear data sets de SAS. Una vez haya obtenido el archivo en SAS, es posible procesarlos

    como usted lo necesite en SAS. Tambin es posible exportar archivos de SAS a un

    nmero de formatos diferentes para PC.

    Para leer bases de datos de PC, puede usar el procedimiento IMPORT. PROC IMPORT

    lee el archivo de entrada y los convierte a un data set de SAS, con las variables SAS

    definidas en base a los registros de entrada. Usted puede controlar los resultados con

    opciones y declaraciones que estn especificadas en el recurso de entrada de datos

    (input data).

    PROC IMPORT slo est disponible en Windows, OS/2, OpenVMS, and UNIX

    Usted debe tener la interfaz SAS/ACCESS para archivos de PC licenciados para leer

    archivos de datos de la PC. Sin embargo, an sin la interfaz SAS/ACCESS para

    archivos de PC puede importar y exportar archivos externos limitados (archivos que

    contienen columnas de valores de datos que estn separados por un delimitador como

    un espacio en blanco o una coma).

    Mtodo de Click and Point

    Si usted tiene la interfaz SAS/ACCESS para archives de PC licensiados, puede

    importar bases de datos usando Import Wizard:

    1. En SAS, click File< Import Data.

    2. Cuando el Import Wizard se abre, siga las instrucciones para importar datos.

    Usted puede ver y salvar el cdigo PROC IMPORT que el Import Wizard genera

    EJEMPLO

    Suponga que usted quiere importar 2 archivos, a ua hoja de clculo de Microsoft Excel y

    a una tabla de Access. El siguiente programa le muestra cmo leer datos usando

    opciones especficas para el archivo dado, crea data sets e imprime el nuevo data sets.

    Debido a que esta es una gua rpida para principiantes, no es posible copiar y correr

    este programa como se muestra. Sin embargo usted puede modificarlo para trabajar con

    bases de datos de PC a las que pueda acceder.

    /*************************************/

    /* import the Excel file */

    /*************************************/

    proc import datafile="c:\myfiles\Accounts.xls"

    out=sasuser.accounts sheet="Prices";

    getnames=no;

    run;

    /*************************************/

  • INV- Software de Anlisis Estadstico SAS /2013-I

    17

    /* print part of the new data set */

    /*************************************/

    proc print data=sasuser.accounts(obs=10);

    run;

    /*************************************/

    /* import the Access file */

    /*************************************/

    proc import table="customers"

    out=sasuser.cust dbms=access;

    uid="userid";

    pwd="mypassword";

    database="c:\myfiles\east.mdb";

    wgdb="c:\winnt\system32\security.mdb";

    run;

    /*************************************/

    /* print part of the new data set */

    /*************************************/

    proc print data=sasuser.cust(obs=5);

    run;

    REFERENCIAS

    Mire estos recursos online para aprender ms a cerca de como leer bases de datos de

    PC.

    Documentacin, publicaciones y FAQs

    Documentacin en SAS help

    1. En SAS, click Help< SAS Help and Documentation.

    2. ExpandA SAS Products< Base SAS< SAS Procedures< Procedures.

    3. Click The IMPORT Procedure y vea los tpicos de interes

    4. Si usted est interesado en exporter datos a bases de datos de PC, click The

    EXPORT Procedure.

    PROC IMPORT documents desde SAS Technical Support Documents

    product-specific documentacin para PC File Formats en SAS Online Product

    Documentation

    Otras publicaciones en SAS Documentation, incluyendo Your SAS Technology Report

    Preguntas sobre on PROC IMPORT en SAS Technical Support's Frequently Asked

    Questions

    Ejemplos de programas

  • INV- Software de Anlisis Estadstico SAS /2013-I

    18

    programs in SAS help:

    1. En SAS, click Help< SAS Help and Documentation.

    2. Expanda SAS Products< Base SAS< SAS Procedures.

    3. Clic The IMPORT Procedure.

    4. Clic Examples: IMPORT Procedure.

    2.3.4. Presentar programas de sas para hosts remotos

    El servicio de cmputo de SAS le da un fcil acceso a muchas de los recursos remotos en

    su red desde una sola sesin local de SAS. SAS/CONNECT ofrece acceso a recursos

    remotos en 2 formas, sincrnicos y asincrnicos. Con el proceso sincrnico, usted espera

    los resultados del proceso remoto antes de estar disponibles para continuar el proceso

    local. Con el proceso asincrnico, usted inmediatamente recupera el control para

    continuar el proceso local mientras el trabajo remoto se ejecuta, y usted puede obtener

    los resultados despus.

    El acceso remoto le ayuda eficazmente usando todos los recursos informticos de la

    organizacin. Los servicios informticos tambin le permiten tener ventaja en el

    Output Delivery System (ODS) en SAS para cambiar el formato y la apariencia en la

    salida de SAS que es generada en un host remoto.

    Las declaraciones de SAS/CONNECT GIGNON, SIGNOGG, RSUBMIT, y

    ENDRSUBMIT lo conectan para presentar declaraciones a un host remoto desde una

    sesin en un host local. Usted puede incluir estas declaraciones en un programa de SAS

    y hacer al mismo tiempo los procesos locales y remotos en un solo programa de SAS.

    Usted debe tener la licencia de SAS/CONNECT para presentar programas de SAS en

    host remotos.

  • INV- Software de Anlisis Estadstico SAS /2013-I

    19

    EJEMPLO

    Suponga que usted quiere llevar a cabo algn tipo de procesamiento en un host remoto,

    descargue lo resultante del data set, cree un data set permanente en el host local, e

    imprima un reporte sobre el host local. El siguiente ejemplo ilustra cmo poner todas

    estas caractersticas en un solo programa.

    Debido a que esta es una gua rpida para principiantes, no es posible copiar y correr

    este programa como se muestra. Sin embargo usted puede modificarlo para trabajar con

    archivos remotos a los cuales pueda acceder

    /*************************************/

    /* prepare to sign on */

    /*************************************/

    options comamid=netbios remote=netpc;

    libname lhost 'c:\sales\reg1';

    /*************************************/

    /* sign on and download data set */

    /*************************************/

    signon;

    rsubmit;

    libname rhost 'd:\dept12';

    proc sort data=rhost.master

    out=rhost.sales;

    where gross > 5000;

    by lastname dept;

    run;

    proc download data=rhost.sales

    out=lhost.sales;

    run;

    endrsubmit;

    /*************************************/

    /* print data set in local session */

    /*************************************/

    proc print data=lhost.sales;

    run;

    REFERENCIAS

    Vea estor recursos online para aprender ms acerca de cmo presentar programas

    remotos de SAS

    Documentacin, publicaciones y FAQs

    Documentacin en SAS help:

    1. En SAS, click Help< SAS Help and Documentation.

    2. Expand SAS Products< SAS/CONNECT< Communications Access Methods.

    3. Expanda los tpicos de interes en SAS/CONNECT.

  • INV- Software de Anlisis Estadstico SAS /2013-I

    20

    SAS/CONNECT and SAS/SHARE documents desde SAS Technical Support

    Documents

    product-specific documentation SAS/CONNECT in SAS Online Product

    Documentation

    Otras publicaciones en SAS para Documentation, incluyendo Your SAS Technology

    Report

    Preguntas sobre SAS/CONNECT wn SAS Technical Support's Frequently Asked

    Questions

    Ejemplos de programas

    programas en SAS help:

    1. En SAS, click Help< SAS Help and Documentation.

    2. Expand Learning to Use SAS< Sample SAS Programs.

    3. Click SAS/CONNECT y mire los programas de interes

    Programas en SAS Online Samples:

    SAS/CONNECT Software: Usage and Reference, Version 6, Second Edition

    Siguiendo lo estipulado, se continu con el mtodo de autoexploracin del software SAS. Se

    estableci que a partir del software y su respectivo manual, se iran encontrando las diferentes

    funciones del programa y con base en estas se realizara la estructura del curso de acuerdo a

    los diferentes tems encontrados y a la experiencia en la unidad sobre estos tipos de software y

    el mejor procedimiento para dictar un curso libre. A continuacin se encuentra la ltima parte

    de este manual introductorio de SAS.

    o Crear y Definir variables

    o Usar declaraciones condicionales

    o Subconjunto de Datos

    o Trabajo con Fechas y Horas de SAS

    o Impresin de datos

    o Conteo de Datos

    o Tabular Datos

    o Consulta de Datos

    o Unir Tablas

    o Crear Grficos

    o Crear Grficos (2)

    Adjunto a este informe se encuentra el manual completo. No se archiva ac debido a que es

    muy extenso, simplemente se pondr la explicacin de cada tema omitiendo los ejemplos y sus

    respectivas referencias

  • INV- Software de Anlisis Estadstico SAS /2013-I

    21

    2.3.5. Crear y definir variables

    A menudo, cuando usted trabaja con data sets, es muy til crear nuevas variables o

    variables que estn basadas en los valores de otras variables existentes. Estas nuevas

    variables pueden contener los resultados de las funciones de SAS, valores

    condicionalmente asignados, o valores totales de valores de otra variable.

    Usted puede crear variables en un paso DATA mediante las siguientes maneras:

    Usando una declaracin asignada

    Leyendo datos con la declaracin INPUT en un paso DATA

    Especificando una nueva variable en una declaracin FORMAT o

    ONFORMAT

    Especificando una nueva variable en una declaracin LENGHT

    Especificando una nueva variable en una declaracin ATTRIB

    Cuando usted crea variables usando declaraciones asignada, usted puede tomar

    ventaja de SAS functions y SAS expressions.

    2.3.6. Usar declaraciones condicionales

    En los pasos DATA de los programas, usted probablemente querr usar lgica

    condicional para procesar algunas observaciones pero otras no.

  • INV- Software de Anlisis Estadstico SAS /2013-I

    22

    Para ejecutar una declaracin SAS para observaciones que cumplan condiciones

    especificas, usted puede usar:

    Declaraciones IF-THEN/ELSE para programas con algunas declaraciones

    condicionales

    Un grupo SELECT cuando usted tiene una serie larga de condiciones que son

    mutuamente exclusivas

    Subconjuntos de declaraciones IF, sin una clausula THEN, para continuar el

    procesamiento solo de las observaciones o registros que cumplan la condicin

    que es especificada en la clausula IF.

    Para construir expresiones en declaraciones, usted puede utilizar los siguientes

    operadores comparativos:

    Tambin puede utilizar estos operadores lgicos

    2.3.7. Subconjunto de datos

    A menudo usted necesita trabajar slo con subconjuntos de un data set de SAS. Por lo

    que necesita seleccionar observaciones, variables o inclusive ambas.

    En el paso DATA, usted tiene un nmero de herramientas para subconjuntos de

    datos. Usted puede usar:

  • INV- Software de Anlisis Estadstico SAS /2013-I

    23

    Subconjuntos de declaraciones IF para seleccionar slo aquellas observaciones

    que cumplan una condicin especfica

    Construcciones IF-THEN/ELSE con declaraciones DELETE y OUTPUT para

    borrar o seleccionar observaciones que permitan una condicin,

    respectivamente

    DROP= y KEEP= opciones de data set y DROP y KEEp declaraciones para

    bajar o mantener determinadas variables

    Declaraciones WHERE para seleccionar slo las observaciones que cumplan

    una condicin especfica (en determinadas condiciones).

    EN los pasos PROC, las declaraciones WHERE son la herramienta ms comn para

    seleccionar observaciones que cumplan una condicin especfica.

    sta tarea se enfoca en la escritura de los pasos DATA usando subconjuntos de

    declaraciones IF, las opciones DROP= y KEEP= de data set y las declaraciones DROP

    y KEEP.

    2.3.8. Trabajo con Fechas y Horas de SAS

    SAS almacena las fechas y horas como nmeros nicos, exclusivos para que pueda

    utilizarlas en programas como cualquier otra variable numrica:

    Un SAS date value es un valor que representa el nmero de das entre enero 1 de

    1960 y una fecha especificada. SAS puede realizar clculos con fechas que van desde

    el ao 1582 a 19.900 AD. Fechas antes de Enero 1 de 1960, son nmeros negativos,

    despus de las fechas son nmeros positivos.

    Un SAS time value es un valor que representa el nmero de segundos transcurridos

    desde la medianoche del da actual. Los valores SAS time value son entre 0 y 86400.

    Un SAS datetime value es un valor que representa el nmero de segundos entre enero

    1 de 1960 y una hora / minuto / segundo dentro de un plazo determinado.

  • INV- Software de Anlisis Estadstico SAS /2013-I

    24

    Para trabajar con valores date, time y datetime usted puede utilizar las siguientes

    herramientas:

    Informats lee un valor, tal como un reloj de tiempo o un calendaro, el cual

    puede ser de varias longitudes, y luego convierte los datos o un valor data,

    time datetime.

    Formats presenta un valor reconocido por SAS, tal como un valor time o date,

    como un dato del calendario o un tiempo de reloj de varias longitudes.

    Functions realize operaciones sobre valores date, time, y datetime de SAS.

    2.3.9. Impresin de Datos

    Para listar la informacin en un data set, usted puede crear un reporte usando el

    procedimiento PRINT. Luego, usted puede mejorar el reporte con declaraciones

    adicionales y opciones para crear reportes como se muestra ms abajo. Usted puede

    crear una variedad de reportes que van desde una simple lista a un gran reporte de

    datos completamente personalizado adems de clculos totales y subtotales de una

    variable numrica.

    Metodo Point-and-Click

    Si usted tiene licensia de SAS/STAT, usted puede crear listas de reportes usando una

    interfaz point-and-click.

    Usted puede ver y guardar el cdigo PROC PRINT que genera Analyst.

    2.3.10. Conteo de datos

    Cuando usted analiza sus datos, es posible que usted necesite determinar qu valores

    de una variable estn distribuidos a travs de los datos. Para ello, usted puede crear

    tablas de frecuencia, la cual muestra la distribucin de los valores de la variable,

    tanto con los porcentajes de un total como el conteo de data.

  • INV- Software de Anlisis Estadstico SAS /2013-I

    25

    El procedimiento FREQ en Base SAS crea un solo sentido de la tabla de frecuencias,

    dos sentidos y n sentidos de tablas de contingencia. Tambin puede calcular medidas

    de asociacin y de acuerdo, organiza la salida por variables de estratificacin.

    Esta tarea estar enfocada en usar PROC FREQ para realizar anlisis bsicos de

    datos.

    Mtodo de Point-and-Click

    Si usted tiene licencia de SAS/STAT, usted puede crear tablas de frecuencias usando

    una interfaz point-and-click.

    1. En SAS, click Solutions< Analysis< Analyst.

    2. Cuando Analyst se abra, click File< Open by SAS Name para agregar al

    proyecto

    3. Luego click Statistics< Descriptive< Frequency Counts para crear tablas de

    frecuencias.

    Usted puede ver y salvar el cdigo PROC FREQ que genera Analyst.

    2.3.11. Tabular datos

    El procedimiento TABULATE le da el poder y la flexibilidad para resumir los datos en

    forma de tabla. Usted puede crear una variedad de tablas que van desde simples a

    muy personalizados, incluyendo tablas de una, dos, y tres dimensiones que muestran

    cualquier de los nmeros de una estadstica descriptiva. Usted puede:

  • INV- Software de Anlisis Estadstico SAS /2013-I

    26

    Modificar virtualmente cualquier caracterstica de una tabla

    Calcular porcentajes

    Producir reportes integrados sin clasificar datos

    Resumir datos y producir un reporte en un paso

    Generar tablas mltiples en un paso

    PROC TABULATE calcula muchas de las mismas estadsticas que son calculadas por

    otros procedimientos estadsticos descriptivos tales como MEANS, FREQ, y REPORT

    Mtodo de Click-and-Point

    Si usted tiene licencia de SAS/STAT, usted puede crear reportes tabulares usando una

    interfaz point-and-click.

    1. En SAS, click Solutions< Analysis< Analyst.

    2. Cuando Analyst se abre, click File< Open by SAS Name para agregar datos al

    proyecto.

    3. Luego click Reports< Tables para crear un reporte tabular

    Usted puede ver y salvar el cdigo PROC TABULATE que genera Analyst.

    2.3.12. Consulta de datos

    Structured Query Language (SQL) o Lenguaje de Consulta Estructurado es un

    lenguaje estandarizado, ampliamente utilizado que recupera y actaliza datos en

    tablas y grficas basadas en estas tablas. Si usted est familiarizado con SQL, usted

    puede crear rpidamente consultas en SAS usando el procedimiento SQL en Base

    SAS.

    PROC SQL es la implementacin SAS de SQL. Cuando usted quiere examinar

    relaciones entre valores de datos, un subconjunto de datos o calcular valores el

    procedimiento SQL provee un camino fcil flexible para analizar sus datos. Usando

    PROC SQL, usted puede:

    Recuperar y manipular datos que estn almacenados en tablas o grficas.

    Crear tablas, vistas e ndices en las columnas de las tablas.

    Crear variables macro de SAS que contienen valores de las filas de los

    resultados de una consulta

  • INV- Software de Anlisis Estadstico SAS /2013-I

    27

    Agregar o modificar los valores de datos en la columna de una tabla o

    instertas y borrar filas. Usted tambin puede modificar la tabla misma

    aadiendo, modificando o degradando columnas.

    Mandar declaraciones DBMS-SQL a un sistema de administracin de base de

    datos (DBMS) y recuperar datos DBMS

    Usted puede usar elementos del lenguaje SAS como declaraciones globales, opciones

    del data set, funciones, y formatos con PROC SQL slo si usted puede con otros

    procedimientos SAS. De todas maneras, ya que PROC AQL implementa Lenguaje de

    consulta estructurado, funciona de forma diferente a otros procedimientos BASE SAS.

    Esta tarea se enfoca en recuperar datos desde una sola tabla (data set).

    Mtodo de Point-and-Click

    Usted puede unir tablas usando una interfaz point-and-click.

    1. En SAS, click Tools< Query.

    2. Use la ventana SQL Query para realizar uniones.

    Usted puede ver y salvar el cdigo PROC SQL que la ventana de Consulta SQL

    genera

    Mtodo Point-and-Click

    Usted puede crear consultas SQL usando una interfaz point-and-click

    1. En SAS, click Tools< Query.

    2. Use la ventana SQL Query para crear consultas.

    Usted puede ver y salvar el cdigo PROC SQL que la ventana SQL Query genera

    2.3.13. Unir tablas

    Si usted ley CONSULTA DE DATOS, usted observ maneras para consultar una

    sola tabla usando PROC SQL. Sin embargo, usted necesita datos a menudo desde

    tablas separadas. Cuando usted especifica mltiples tablas, vistas, o expresiones de

    consulta en la clausula FROM, PROC SQL, las procesa para formar una tabla. La

    tabla resultante contiene datos de cada una de las tablas contribuyentes. Estas

    consultas se les llaman como JOINS.

    Conceptualmente, cuando usted especifica dos tablas, PROC SQL compara cada fila

    de la tabla A con todas las filas de la tabla B para producir una tabla interna o

    intermedia conocida como el CARTESIAN PRODUCT. El producto cartesiano

    (CARTESIAN PRODUCT) de tablas largas puede ser enrome, por lo que usted quiere

    enviar datos declarando el tipo de unin. A continuacin se muestran dos tipos de

    uniones.

  • INV- Software de Anlisis Estadstico SAS /2013-I

    28

    Inner joins retorna una tabla resultante por todas las filas en una tabla que

    tiene una o mas filas que coincidan en la otra tabla o las otras tablas.

    Outer Joins son inner joins que son aumentadas con filas que no

    coinciden con cualquier fila de la otra tabla en la unin. ExistenEst 3

    tipos de outer joins: left, right, and full.

    Esta tarea se enfoca principalmente en unir tablas.

    2.3.14. Crear grficos

    Una manera efectiva para examinar las relaciones entre variables es graficando sus

    valores. Para producir grficos nicos o superpuestos, usted puede usar:

    El procedimiento PLOT en Base SAS para visualizar datos rpidamente

    El procedimiento GPLOT en el software SAS/GRAPH para producir con

    calidad grficos de presentacin que incluyen colores y varias fuentes.

    En adicin, usted puede crear una salida PROC GPLOT usando el SAS/GRAPH

    Control for ActiveX, el cual que le permite incrustar grficos interactivos en pginas

    web y documentos OLE.

    La sintaxis para los dos procedimientos es muy similar, aunque PROC GPLOT ofrece

    un nmero adicional de funciones de formato. Esta tarea le muestra ambos caminos

    para crear varios tipos de grficos.

    Usted debe tener la licencia de SAS/GRAPH para crear grficos usando PROC

    GPLOT.

  • INV- Software de Anlisis Estadstico SAS /2013-I

    29

    Mtodo de Point-and-Click

    a) Si usted tiene licenciado SAS/GRAPH, puede crear grficos con calidad de

    presentacin usando una interfaz point-and-click

    1. En SAS, click Solutions< Reporting< Graph-N-Go.

    2. Click en el icono New SAS Data Set y seleccione datos para el grfico

    3. Haga clic en el cono para escoger el grfico que desee y colquelo en el rea de

    trabajo. Luego haga docle clic en el objeto del grfico, seleccione los datos y

    especifique las variables y las opciones del grfico.

    Usted puede ver y salvar el cdigo de PROC GPLOT que genera Graph-N-Go

    b) Si usted tiene licenciado SAS/GRAPH y SAS/GRAPH, tambin puede crear

    grficos usando Analyst Application

    1. En SAS, click Solutions< Analysis< Analyst.

    2. Cuando Analyst se abra, click File< Open by SAS Name para agregar los

    datos al proyecto.

    3. Luego haga clic en Graphs y escoja el tipo de grfico que quiere crear

    Usted puede ver y salvar el cdigo PROC GPLOT que Analyst genera

    2.3.15. Crear grficos (2)

    Usted puede usar el procedimiento CHART en Base SAS para producir

    Barras grficas horizontales y verticales

    Grficos de bloques

    Grficos circulares

    Mapas estelares

    Estos tipos de graficos muestran valores de una variable estadstica asociada con

    sus valores. La variable graficada puede ser numerada o caracterizada.

  • INV- Software de Anlisis Estadstico SAS /2013-I

    30

    PROC CHART es una buena herramienta para visualizar datos rpidamente, pero si

    usted necesita producir grficos de presentacin con calidad que incluyan varios

    colores y fuentes, usted puede usar el software SAS/GRAPH. El procedimiento

    GCHART en SAS/GRAPH produce los mismos tipos de grficos que PROC CHART

    hace, As como un grfico de dona. En adicin, usted puede crear salidas PROC

    GCHART usando el SAS/GRAPH Control for ActiveX, el cual lo conecta con grficos

    interactivos en pginas web y documentos OLE.

    Como usted puede ver, la sintaxis para PROC CHART y PROC GCHART es muy

    similar. Esta tarea le muestra ambos caminos para crear varios tipos de grficos.

    Usted debe tener la licencia de SAS/GRAPH para crear grficos usando PROC

    GCHART.

    Mtodo de Click-and-Point

    Si usted tiene licenciado SAS/GRAPH, usted puede crear grficos de presentacin con

    calidad usando una interfaz point-and-click.

    1. En SAS, click Solutions< Reporting< Graph-N-Go.

    2. Click en el cono New SAS Data Set o en New MDDB y seleccione los datos

    para el grfico.

    3. Haga clic en el cono del grfico que desee y colquelo en el rea de trabajo.

    Luego haga clic en el objeto del grfico, seleccione los datos y especifique las

    variables y las opciones del grfico..

    Usted puede ver y salvar el cdigo PROC GCHART que genera Graph-N-Gos.

    Si usted tiene licenciado SAS/GRAPH y SAS/STAT, tambien puede crear grficos

    ustando Analys Application

  • INV- Software de Anlisis Estadstico SAS /2013-I

    31

    1. En SAS, click Solutions< Analysis< Analyst.

    2. Cuando Analyst se abra, click File< Open by SAS Name para agregar datos al

    proyecto

    3. Luego haga clic en Graphs< Bar Chart o Graphs< Pie Chart para crear un

    grfico

    Usted puede ver y salvar el cdigo PROC GCHART que genera Analyst.

    Siguiendo lo estipulado, se continu con el mtodo de autoexploracin del software SAS. Ya que

    en este punto ya no era muy til seguir el manual de SAS (que es bastante extenso) se decidi

    proseguir con regresiones simples, mltiples y series de tiempo. Con respecto a series de

    tiempo, aun no se ha completado la revisin de literatura puesto que es muy extensa e inclusive

    posee ms de un captulo dedicado a esto. A continuacin se encuentra lo referente a Regresin

    (Declaracin REG) y lo encontrado de series de tiempo (Declaracin ARIMA

    2.3.16. Regresin simple y mltiple

    Considere una variable respuesta Y que puede ser predicha por una funcin polinomial

    de una variable regresiva X. Usted puede estimarB0, el intercepto B1, la pendiente

    debida a X y X2, la pendiente debida a X2 en:

    Esto para las observaciones

    Considere el siguiente ejemplo de las tendencias de crecimiento de la poblacin. La

    poblacin de USA desde 1970 a 2000 se ajusta a funciones de tiempo lineales y

    cuadrticas. Debe tener en cuenta que el trmino cuadrtico YearSq es creado en el

    paso DATA, esto se debe hacer ya que los efectos polinmicos como Year*Year no

    pueden ser especificados en la declaracin MODEL en PROC REG. Los datos son los

    siguientes:

    dataUSPopulation;

    inputPopulation @@;

    retainYear 1780;

    Year = Year+10;

    YearSq = Year*Year;

    Population = Population/1000;

    datalines;

    3929 5308 7239 9638 12866 17069 23191 31443 39818 50155

    62947 75994 91972 105710 122775 131669 151325 179323 203211

    226542 248710 281422

    ;

    ods graphics on;

    procreg data=USPopulation plots=ResidualByPredicted;

    varYearSq;

    model Population=Year / r clm cli;

    run;

  • INV- Software de Anlisis Estadstico SAS /2013-I

    32

    La opcin de datos garantiza que el procedimiento utiliza el conjunto de datos deseado.

    Cualquier variable que se puede agregar al modelo pero que no est incluido en el

    primer modelo de declaracin debe aparecer en la declaracin VAR.

    A continuacin se muestra el anlisis de varianza y los parmetros estimados:

    El modelo estadstico F es significante (F=228.92, p

  • INV- Software de Anlisis Estadstico SAS /2013-I

    33

    residuo se muestra en un grfico impreso. Los residuos estudentizados siguen una

    distribucin T y pueden ser usados para identificar observaciones de salida o extremas.

    Los asteriscos (*) que se extienden ms all de las lneas de trazos indican que el

    residuo es ms de 3 errores estndar desde 0. Muchas observaciones tienen residuos

    estudentizados que son absolutos y son ms que 2, podran indicar un modelo

    inadecuado. Cooks D es una medida del cambio en los valores predichos a la supresin

    de esa observacin desde el data set, por lo que se mide la influencia de la observacin

    de los coeficientes de regresin estimados.

  • INV- Software de Anlisis Estadstico SAS /2013-I

    34

    La siguiente tabla muestra las estadsticas residuales. Un acuerdo bastante estrecho

    entre la estadstica PRESS y la Suma de Cuadrados Residuales indica que el MSE es

    una medida razonable de la exactitud predictiva del modelo ajustable (Neter,

    Wasserman, and Kutner 1990).

    Las representaciones grficas son de gran ayuda en la interpolar la informacin en la

    tabla de Estadstica de Salida. Cuando usted habilita los grficos ODS, el

    procedimiento REG produce un set por defecto de los grficos de diagnstico que son

    apropiados para el anlisis solicitado.

  • INV- Software de Anlisis Estadstico SAS /2013-I

    35

    Estos son los grficos que se muestran:

    Las graficas residual y studentized residual versus el valor predicho muestra

    un patrn cuadrtico.

    La grafica studentized versus leverage parece indicar que existen 2 puntos de

    datos alejados. Sin embargo, el grfico de la distancia Cooks D versus el numero de observaciones revela que estos 2 puntos estn en los puntos finales

    de los aos 1790 y 2000. Estos puntos se muestran con una aparente lejana

    porque la salida del modelo lineal desde la lnea por debajo del comportamiento

    cuadrtico en los datos se muestran ms fuertes en esos puntos finales.

    El grfico del cuantil normal de los residuos y el histograma residual nos son

    consistentes con la asuncin de los errores Gaussianos. Esto ocurre ya que

    como los propios residuos todava contienen el comportamiento cuadrtico, este

    no es capturado por el modelo lineal.

    El grfico de la variable dependiente contra el valor predicho exhibe una forma

    cuadrtica alrededor del grado 45 en la lnea que representa un ajuste perfecto

    El grfico Residual-Fit (RF) consiste en un grfico de cuantiles lado-a-lado de los ajustes centrales y los residuos muestran que la dispersin en los residuales

    no es mejor que la dispersin de los ajustes centrado. Para modelos

  • INV- Software de Anlisis Estadstico SAS /2013-I

    36

    inapropiados, la dispersin de los residuos es a menudo mejor que la dispersin

    del ajuste centrado. En este caso, el grfico RF muestra que el modelo linear en

    efecto, captura la tendencia creciente de los datos, y por lo tanto cuenta con

    gran parte de la variacin en la respuesta.

    2.3.17. ARIMA

    Introduccin

    ARIMA es referenciado normalmente como modelos BOX and Jenkins

    La declaracin ARIMA provee un set de herramientas para la identificacin de modelos

    de series de tiempo univariadas, estimacin de variables, pronsticos, por ultimo ofrece

    una gran flexibilidad en los tipos de modelos ARIMA y ARIMAX que pueden ser

    analizados.

    El diseo de PROC ARIMA sigue muy de cerca la estrategia de Box-Jenkins para el

    modelamiento de series de tiempo con caractersticas para la identificacin, estimacin

    y chequeo de diagnsticos, y pasos de pronosticacin del mtodo Box-Jenkins

    LAS 3 ETAPAS DEL MODELAMIENTO ARIMA

    El anlisis realizado por PROC ARIMA est dividido en 3 etapas, que corresponden a

    las etapas descritas en Box y Jenkins

    1) En la etapa de Identificacin, se utiliza la declaracin IDENTIFY para

    especificar la serie respuesta e identificar el modelo candidato ARIMA para

    ello. La declaracin IDENTIFY lee series de tiempo que son usadas en

    declaraciones despus, posiblemente diferencindolas y computando auto

    correlaciones, auto correlaciones inversas, auto correlaciones parciales y

    correlaciones cruzadas. Los test estacionarios pueden ser realizados para

    determinar si es necesario diferenciar es necesario. El anlisis de la declaracin

    de salida IDENTIFY usualmente sugiere uno o ms modelos ARIMA que

    pueden ser ajustados. Las opciones le permiten activar test para la

    identificacin estacionaria y tentativa de los ordenes ARIMA.

    2) En la etapa de estimacin y chequeo de diagnsticos, se usa la declaracin

    ESTIMATE para el modelo ARIMA para ajustar la variable especificada en la

    declaracin IDENTIFY y estima los parmetros de ese modelo. La declaracin

    ESTIMATE tambin produce estadsticas de diagnstico para ayudar a juzgar

    el modelo adecuado. Los test de significancia para parmetros estimados estima

    indica si algunos trminos en el modelo pueden ser innecesarios. ayudaen la

    comparacin deeste modelo paralos dems. Estadsticas de Goodness-of-fit

    ayuda en la comparando estos modelos con otros. Los tests de residuos de ruido

    blanco indican si las series de residuos contiene informacin adicional que

    puede ser usada por un modelo ms complejo. La declaracin OUTLIER provee

    otra herramienta muy til para chequear si el modelo actualmente estimado

    tiene en cuenta todas las variaciones en las series. Si los tests de diagnstico

    indica problemas con el modelo, puede tratar de implementar otro modelo y

    luego repetir las etapas de estimacin y de chequeo de diagnsticos.

  • INV- Software de Anlisis Estadstico SAS /2013-I

    37

    3) En la etapa de pronstico, se usa la declaracin FORECAST para pronosticar

    valores futuros de las series de tiempo y tambin para generar intervalos de

    confianza para estos pronsticos desde el modelo ARIMA producido por la

    declaracin ESTIMATE.

    Estas tres etapas son explicadas e ilustradas a travs de un ejemplo extendido en las

    siguientes secciones.

    ETAPA DE IDENTIFICACIN

    Suponga que usted tiene una variable llamada SALES que quiere pronosticar. El

    siguiente ejemplo ilustra el modelamiento ARIMA y su pronosticacin utilizando un

    data set simulado TEST que contiene una serie de tiempo SALES generada por el

    modelo ARIMA (1,1,1). La salida produce este ejemplo que est explicado en las

    prximas secciones. A continuacin se muestra las series de SALES en la figura.

    procsgplot data=test;

    scatter y=sales x=date;

    run;

    USANDO LA DECLARACIN IDENTIFY

    Primero debe especificar el data set de entrada en la declaracin PROC ARIMA. Luego

    debe usar una declaracin IDENTIFY para leer y analizar en las series SALES las

    propiedades de correlacin. Para hacer esto se utilizan las siguientes declaraciones.

  • INV- Software de Anlisis Estadstico SAS /2013-I

    38

    procarima data=test ;

    identifyvar=sales nlag=24;

    run;

    Estadstica Descriptiva La declaracin IDENTIFY primero imprime estadsticas descriptivas para las series

    SALES. Esta parte de la declaracin IDENTIFY muestra lo siguiente:

    The ARIMA Procedure

    Name of Variable = sales

    Mean of Working Series 137.3662

    Standard Deviation 17.36385

    Number of Observations 100

    Grficos de funciones de Autocorrelacin

    La declaracin IDENTIFY despus produce un panel de grficos usados para el

    anlisis de auto-correlacin y de tendencia. El panel contiene los siguientes grficos:

    El grfico de series de tiempo de las series de SALES

    El grfico de muestra de la funcin de auto-correlacin (ACF)

    El grfico de muestra de la funcin inversa de autocorrelacin (IACF)

    El grfico de la muestra de la funcin parcial de auto-correlacin (PACF)

    Este anlisis de correlacin se muestra a continuacin.

    Estos grficos de funciones de auto-correlacin muestra el grado de correlacin con los

    valores pasados de las series como una funcin de nmeros de periodos en el pasado

    (que es el lag) en el que se calcula la correlacin.

  • INV- Software de Anlisis Estadstico SAS /2013-I

    39

    La opcin NLAG= controla el numero de lags para los que se muestran las auto-

    correlaciones. Por defecto, las funciones de auto-correlacin son graficadas para lag 24.

    Existe otra seccin que habla de la funcin inversa de correlacin:

    TheInverseAutocorrelationFunction en la pgina 234.

    Para examinar estos grficos, usted puede determinar si las series son estacionarias o

    no estacionarias. En este caso una inspeccin visual del grfico de la funcin de auto-

    correlacin indica que las series SALES no es estacionaria, desde que ACF decae muy

    despacio. Para un test ms formal, use la opcin STATIONARITY= (pgina 207).

    Test White Noise (Ruido Blanco)

    La ltima parte de la declaracin de salida IDENTIFY es el chequeo del ruido blanco.

    Esto es un test estadstico aproximado de las hiptesis que no son auto-correlacionadas

    en las series hasta un desfase dado y que son significativamente diferentes a 0. Si esto

    es verdad para todos los lags, entonces no hay informacin en las series para el modelo,

    y ningn modelo ARIMA se necesita para las series.

    Las auto-correlaciones son chequeadas en grupos de 6, y el nmero de lagas chequeados

    dependen de la opcin NLAG=. Esto se muestra en lo siguiente:

    En este caso, la hiptesis de ruido blanco es rechazada de manera fuerte, donde se

    espera que las series no sean estacionarias. El valor p para el test de las primeras seis

    auto-correlaciones es impreso como

  • INV- Software de Anlisis Estadstico SAS /2013-I

    40

    La segunda declaracin produce la misma informacin que la primera, pero con el

    cambio que en SALES va desde un periodo al otro, en lugar del total de SALES en cada

    periodo. Las estadsticas sumatorias de salida de esta declaracin IDENTIFY se

    muestra a continuacin. Note que el periodo de diferenciacin se da como 1. Y una

    observacin se pierde a travs de la operacin de diferenciacin:

    Los grficos de auto-correlacin se muestran a continuacin.

    El grado de auto-correlacin decae rpidamente en este grfico, indicando que el cambio

    en SALES es una serie de tiempo estacionaria.

  • INV- Software de Anlisis Estadstico SAS /2013-I

    41

    EJEMPLOS DE ARIMA

    PRIMER EJEMPLO: Modelo IMA simulado

    Este ejemplo ilustra los resultados de un procedimiento ARIMA para un caso donde los

    modelos reales son conocidos. UN modelo de promedio mvil integrado se utiliza para

    esta ilustracin.

    Los siguientes DATA step generan una muestra pseudo-aleatoria de 100 periodos del

    procedimiento ARIMA(0.1.1); :

    title1 'Simulated IMA (1, 1) Series';

    data a;

    u1 = 0.9; a1 = 0;

    do i = -50 to 100;

    a = rannor( 32565 );

    u = u1 + a - .8 * a1;

    if i > 0 then output;

    a1 = a;

    u1 = u;

    end;

    run;

    El siguiente procedimiento de declaraciones ARIMA identifica y estima el modelo:

    /*-- Simulated IMA Model --*/

    procarima data=a;

    identifyvar=u;

    run;

    identifyvar=u(1);

    run;

    estimate q=1 ;

    run;

    quit;

    El grfico de anlisis de correlacin de series de salida en la primera declaracin se

    muestra a continuacin. La salida muestra el comportamiento de la muestra de la

    funcin de auto-correlacin cuando el proceso no es estacionario. Note que en este caso

    las auto-correlaciones estimadas no son muy altas, incluso en pequeos lags. La no

    estacionalidad es reflejada en un patrn de auto-correlaciones significativas que no

    declinan rpidamente con el lag creciente, no en el tamao de las auto-correlaciones.

  • INV- Software de Anlisis Estadstico SAS /2013-I

    42

    La segunda declaracin de IDENTIFY diferencia las series. Los resultados se muestran

    a continuacin. Esta salida muestra la auto correlacin, su inversa y la funciones

    parciales de auto-correlacin tpicas del proceso MA(1)

  • INV- Software de Anlisis Estadstico SAS /2013-I

    43

    La declaracin ESTIMATE ajusta un modelo ARIMA (0,1,1) a los datos simulados. Note

    que en este caso, el parmetro estimado es razonablemente cercano a los valores usados

    para generar la base de datos simulada.

    . El grfico de anlisis de los residuos no muestra un modelo inadecuado (son los

    correspondientes a lo seguido de lo que aparece a continuacin).

    Los resultados de la declaracin ESTIMATE son:

    Y los grficos son:

  • INV- Software de Anlisis Estadstico SAS /2013-I

    44

    2.3.18. Datos Panel

    El procedimiento PANEL analiza una clase de modelos lineales economtricos que

    comnmente surgen cuando se combinan series de tiempo y datos transversales. Este

    tipo de datos agrupados en series de tiempo con datos transversales son normalmente

    referidos como DATOS PANEL. Ejemplos tpicos de datos panel incluyen observaciones

    a travs del tiempo en hogares, pases, empresas comercio entre otras. Por ejemplo, en

    el caso del caso de los datos de las encuestas sobre los ingresos familiares, el panel se

    crea mediante una encuesta en varias ocasiones a los mismos hogares en diferentes

    perodos de tiempo (aos).

    Los modelos de datos panel pueden ser agrupados en diferentes categoras dependiendo

    de la estructura del trmino de error. El procedimiento PANEL utiliza las siguientes

    estructuras de error y los mtodos correspondientes para analizar datos:

    Modelos de un camino y de dos caminos (one-way y two-way)

    Modelos de Efectos Fijos y Efectos Aleatorios

    Modelos auto-regresivos

    Modelos de media mvil

    Un modelo de un-camino depende slo de la seccin transversal a la que pertenece la

    observacin. El modelo de dos-caminos depende tanto de la seccin transversal como del

    periodo de tiempo a la que pertenece la observacin.

    Los modelos son referidos como Modelos de efectos fijos si los efectos no son aleatorios o

    modelos de efectos aleatorios si son lo contrario.

    Si los efectos son fijos, los modelos son esencialmente modelos de regresiones con

    variables Dummy que corresponden a los efectos especficos. Para modelos de efectos

    aleatorios, la estimacin por mnimos cuadrados ordinarios es el mejor estimador lineal

    (OLS). Los modelos EA (efectos aleatorios) usan un enfoque de dos etapas. En la

    primera etapa, los componentes de varianza son calculados usando mtodos descritos

    por Fuller y Batteste (1974), Wansbeek and Kapteyn (1984), Wallace and Hussain

    (1969), or Nerlove (1971). En la segunda etapa los componentes de varianza son usados

    para estandarizar los datos, y se realiza una regresin de mnimos cuadrados ordinarios

    (OLS).

    Dos tipos de modelos en el procedimiento PANEL se acomodan en una estructura auto-

    regresiva: El mtodo Parks estima un modelo auto-regresivo de primer orden con

    correlaciones contemporneas, y el estimador panel dinmico estima un modelo auto-

    regresivo con variables dependientes retrasadas.

    El mtodo Da Silva estima un proceso de error de media mvil de la varianza del

    componente mixto. Los parmetros de regresin son estimados usando un estimador de

    ltimos cuadrados de dos pasos genralizados (GLS)

    PRIMER EJEMPLO: Analizano la demanda para bienes liquidos

    En este ejemplo, las ecuaciones para bienes lquidos son estimadas. La funcin de

    demanda para los depsitos de demanda es estimada bajo tres estructuras de error

  • INV- Software de Anlisis Estadstico SAS /2013-I

    45

    mientras las ecuaciones de demanda para los depsitos de tiempo y acciones de ahorro y

    prstamo (S&L) se calculan utilizando el mtodo de Parks. El data para siete estados

    (CA, DC, FL, IL, NY, TX, Y WA) son seleccionados de 49 estados. Busque Feige (1964)

    para la descripcin de los datos. Todas las variables son transformadas por un

    logaritmo natural. El data set A se muestra acontinuacin:

    data a;

    length state $ 2;

    input state $ year d t s y rd rt rs;

    label d = 'Per Capita Demand Deposits'

    t = 'Per Capita Time Deposits'

    s = 'Per Capita S & L Association Shares'

    y = 'Permanent Per Capita Personal Income'

    rd = 'Service Charge on Demand Deposits'

    rt = 'Interest on Time Deposits'

    rs = 'Interest on S & L Association Shares';

    datalines;

    CA 1949 6.2785 6.1924 4.4998 7.2056 -1.0700 0.1080 1.0664

    CA 1950 6.4019 6.2106 4.6821 7.2889 -1.0106 0.1501 1.0767

    CA 1951 6.5058 6.2729 4.8598 7.3827 -1.0024 0.4008 1.1291

    CA 1952 6.4785 6.2729 5.0039 7.4000 -0.9970 0.4492 1.1227

    CA 1953 6.4118 6.2538 5.1761 7.4200 -0.8916 0.4662 1.2110

    CA 1954 6.4520 6.2971 5.3613 7.4478 -0.6951 0.4756 1.1924

    DC 1949 6.6587 6.1879 4.4893 7.1570 -0.9999 0.4545 1.1234

    DC 1950 6.6666 6.5555 4.9999 7.2222 -1.0000 0.4897 1.0054

    DC 1951 6.5058 6.2729 4.8598 7.3827 -1.0024 0.4008 1.1291

    DC 1952 6.4785 6.2729 5.0039 7.4000 -0.9970 0.4492 1.1227

    DC 1953 6.4118 6.2538 5.1761 7.4200 -0.8916 0.4662 1.2110

    DC 1954 6.4520 6.2971 5.3613 7.4478 -0.6951 0.4756 1.1924

    Los ltimos datos me los invent para qu la simulacin corriera

    Como se muestra en las siguientes declaraciones, el Procedimiento SORT es usado para

    ordenar los datos en el formato requerido para las series de tiempo cruzadas

    transversalmente, luego el Procedimiento PANEL analiza los datos:

    proc sort data=a;

    by state year;

    run;

    proc panel data=a;

    model d = y rd rt rs / fuller parks dasilva m=7;

    model t = y rd rt rs / parks;

    model s = y rd rt rs / parks;

    id state year;

    run;

    Las elasticidades de ingreso de los activos liquidos son mejores que 1 excepto para el

    depsito de la elasticidad de ingreso de la demanda (0,692757) estimada por el mtodo

    Da Silva. En las tres primeras salidas, el coeficiente estimado (-0.29094, -0.43591 y -

    0.27736) del depsito de demanda (RD) implica que los depsitos de demanda

    aumentan significativamente a medida que se reduce el cargo de servicio es reducido.

  • INV- Software de Anlisis Estadstico SAS /2013-I

    46

    LA elasticidad del precio (0.227152 y 0.408066) para los depsitos de tiempo (RT) y las

    acciones de asociacin S&L tienen el signo esperado Por lo tanto un aumento en la tasa

    de inters de los depsitos a plazo o de acciones de S & L incrementar la demanda de

    activos lquidos correspondientes. Los depsitos de demanda y las acciones S&L

    aparece para ser sustitutos (observe las salidas 2, 3 y 5). Los depsitos a plazo son

    tambin sustitutos de acciones S & L en la ecuacin de demanda de depsitos a plazo

    (salida 4), mientras estos activos liquidos son independientes el uno al otro en la salida

    5 (el coeficiente estimado en RT -0.02705). Los depsitos de demanda y los depsitos a

    plazo parecen ser dbiles complementos en la salida 3 y 4, mientras las elasticidades

    cruzadas entre depsitos a la vista y depsitos a plazo no son significativos en las

    salidas 2 y 5

  • INV- Software de Anlisis Estadstico SAS /2013-I

    47

    SALIDA 1. La demanda de depsitos a la vista, Mtodo de Fuller-Battese

  • INV- Software de Anlisis Estadstico SAS /2013-I

    48

    SALIDA 2. La demanda de depsitos a la vista, el mtodo deParks

  • INV- Software de Anlisis Estadstico SAS /2013-I

    49

    SALIDA 3. La demanda de depsitos a la vista, el mtodo de DaSilva

  • INV- Software de Anlisis Estadstico SAS /2013-I

    50

    SALIDA 4. La demanda de depsitos a plazo, Mtodo de Parks

  • INV- Software de Anlisis Estadstico SAS /2013-I

    51

    SALIDA 5. La demanda de Ahorro y Prstamo Acciones, Mtodo de Parks

    EJEMPLO 2. Datos de costos de una Aerolnea: Modelo

    Esta base de datos es citada constantemente, ya que mide costos, precios de entrada y

    las tasas de utilizacin de seis aerolneas por un periodo de 14 aos (1970-1984). Este

    ejemplo analiza las transformaciones logartmicas del costo, precio y cantidad, y la

    medida de utilizacin de la capacidad en bruto (sin ligaritmo). Se especula el siguiente

    modelo:

    Donde son los efectos transversales puros y son los efectos de tiempo. El modelo

    actual especulado no es lineal en las variables originales. Se podra ver como la

    siguiente forma:

  • INV- Software de Anlisis Estadstico SAS /2013-I

    52

    La data y las declaraciones preliminares de SAS son:

    data airline;

    input Obs I T C Q PF LF;

    label obs = "Observation number";

    label I = "Firm Number (CSID)";

    label T = "Time period (TSID)";

    label Q = "Output in revenue passenger miles (index)";

    label C = "Total cost, in thousands";

    label PF = "Fuel price";

    label LF = "Load Factor (utilization index)";

    datalines;

    1 1 1 1140640 .952757 106650 .534487

    2 1 2 1215690 .986757 110307 .532328

    3 1 3 1309570 1.091980 110574 .547736

    4 1 4 1511530 1.175780 121974 .540846

    5 1 5 1676730 1.160170 196606 .591167

    6 1 6 1823740 1.173760 265609 .575417

    7 1 7 2022890 1.290510 263451 .594495

    8 1 8 2314760 1.390670 316411 .597409

    9 1 9 2639160 1.612730 384110 .638522

    10 1 10 3247620 1.825440 569251 .676287

    11 1 11 3787750 1.546040 871636 .605735

    12 1 12 3867750 1.527900 997239 .614360

    13 1 13 3996020 1.660200 938002 .633366

    14 1 14 4282880 1.822310 859572 .650117

    15 1 15 4748320 1.936460 823411 .625603

    16 2 1 569292 .520635 103795 .490851

    17 2 2 640614 .534627 111477 .473449

    18 2 3 777655 .655192 118664 .503013

    19 2 4 999294 .791575 114797 .512501

    20 2 5 1203970 .842945 215322 .566782

    21 2 6 1358100 .852892 281704 .558133

    22 2 7 1501350 .922843 304818 .558799

    23 2 8 1709270 1.000000 348609 .572070

    24 2 9 2025400 1.198450 374579 .624763

    25 2 10 2548370 1.340670 544109 .628706

    26 2 11 3137740 1.326240 853356 .589150

    27 2 12 3557700 1.248520 1003200 .532612

    28 2 13 3717740 1.254320 941977 .526652

    29 2 14 3962370 1.371770 856533 .540163

    30 2 15 4209390 1.389740 821361 .528775

    31 3 1 286298 .262424 118788 .524334

    32 3 2 309290 .266433 123798 .537185

    33 3 3 342056 .306043 122882 .582119

    34 3 4 374595 .325586 131274 .579489

    35 3 5 450037 .345706 222037 .606592

    36 3 6 510412 .367517 278721 .607270

    37 3 7 575347 .409937 306564 .582425

    38 3 8 669331 .448023 356073 .573972

    39 3 9 783799 .539595 378311 .654256

  • INV- Software de Anlisis Estadstico SAS /2013-I

    53

    40 3 10 913883 .539382 555267 .631055

    41 3 11 1041520 .467967 850322 .569240

    42 3 12 1125800 .450544 1015610 .589682

    43 3 13 1096070 .468793 954508 .587953

    44 3 14 1198930 .494397 886999 .565388

    45 3 15 1170470 .493317 844079 .577078

    46 4 1 145167 .086393 114987 .432066

    47 4 2 170192 .096740 120501 .439669

    48 4 3 247506 .141500 121908 .488932

    49 4 4 309391 .169715 127220 .484181

    50 4 5 354338 .173805 209405 .529925

    51 4 6 373941 .164272 263148 .532723

    52 4 7 420915 .170906 316724 .549067

    53 4 8 474017 .177840 363598 .557140

    54 4 9 532590 .192248 389436 .611377

    55 4 10 676771 .242469 547376 .645319

    56 4 11 880438 .256505 850418 .611734

    57 4 12 1052020 .249657 1011170 .580884

    58 4 13 1193680 .273923 951934 .572047

    59 4 14 1303390 .371131 881323 .594570

    60 4 15 1436970 .421411 831374 .585525

    61 5 1 91361 .051028 118222 .442875

    62 5 2 95428 .052646 116223 .462473

    63 5 3 98187 .056348 115853 .519118

    64 5 4 115967 .066953 129372 .529331

    65 5 5 138382 .070308 243266 .557797

    66 5 6 156228 .073961 277930 .556181

    67 5 7 183169 .084946 317273 .569327

    68 5 8 210212 .095474 358794 .583465

    69 5 9 274024 .119814 397667 .631818

    70 5 10 356915 .150046 566672 .604723

    71 5 11 432344 .144014 848393 .587921

    72 5 12 524294 .169300 1005740 .616159

    73 5 13 530924 .172761 958231 .605868

    74 5 14 581447 .186670 872924 .594688

    75 5 15 610257 .213279 844622 .635545

    76 6 1 68978 .037682 117112 .448539

    77 6 2 74904 .039784 119420 .475889

    78 6 3 83829 .044331 116087 .500562

    79 6 4 98148 .050245 122997 .500344

    80 6 5 118449 .055046 194309 .528897

    81 6 6 133161 .052462 307923 .495361

    82 6 7 145062 .056977 323595 .510342

    83 6 8 170711 .061490 363081 .518296

    84 6 9 199775 .069027 386422 .546723

    85 6 10 276797 .092749 564867 .554276

    86 6 11 381478 .112640 874818 .517766

    87 6 12 506969 .154154 1013170 .580049

    88 6 13 633388 .186461 930477 .556024

    89 6 14 804388 .246847 851676 .537791

    90 6 15 1009500 .304013 819476 .525775

    ;

  • INV- Software de Anlisis Estadstico SAS /2013-I

    54

    data airline;

    set airline;

    lC = log(C);

    lQ = log(Q);

    lPF = log(PF);

    label lC = "Log transformation of costs";

    label lQ = "Log transformation of quantity";

    label lPF= "Log transformation of price of fuel";

    run;

    Las siguientes declaraciones ajustan el modelo

    proc panel data=airline printfixed;

    id i t;

    model lC = lQ lPF LF / fixtwo;

    run;

    Primero, se puede ver la descripcin del modelo en la primera salida. Es un modelo de

    efectos ajustados two-way. Ac existen 6 observaciones transversales y quince

    observaciones de tiempo

    Base de datos de costos de Aerolneas-Descripcin del Modelo

    El R cuadrado y los grados de libertad se pueden ver en la siguiente tabla. En el hueco,

    se ve un largo R cuadrado, por lo que es un ajuste razonable. Los grados de libertad

    para la estimacin son 90 menos 14 variables dummy menos 5 variables dummy

    transversales y 4 regresores:

    Estadsticas Ajustadas de Los costos de la Aerolnea

    El test F para efectos ajustados se muestra en la siguiente tabla. Evaluando la

    hiptesis que dice que no hay efectos no ajustados, usted puede rechazar fcilmente la

  • INV- Software de Anlisis Estadstico SAS /2013-I

    55

    nulidad da las agrupaciones. Hay efectos de grupo, o efectos de tiempo, o ambas. El

    test es altamente significativo. OLS no darn resultados razonables

    Test para Efectos Ajustados

    Observando los parmetros, se ve un patrn ms complicado. La mayora de los efectos

    transversales son altamente significativos (con excepcin de CS2). Esto quiere decir que

    las secciones transversales son significativamente diferentes de la sexta seccin

    transversal. Muchos de los efectos de tiempo muestran significancia, pero este no es

    uniforme. Se ve como que la significancia puede ser impulsada por un largo efecto en el

    periodo 16, desde los primeros seis efectos de tiempo son negativos y de una magnitud

    similar. Las variables dummy de tiempo disminuyen en tamano y pierden

    significancia desde el periodo 12. Existen muchas causas a las cuales se le puede

    atribuir esta decada de los efectos del tiempo. El perodo de tiempo de los datos se

    extiende por los embargos de petrleo OPEP y la disolucin de la Junta de Aeronutica

    Civil (CAB). Estas tos fuerzas son dos posibles razones para