el diseño de la investigación social

Upload: tania

Post on 09-Jul-2015

1.177 views

Category:

Documents


8 download

TRANSCRIPT

!!la

fiMiiiii&!@4. II!!!B'~~

1.

la ciencia en las ciencias sociales

1.

Introduccin

Este libro trata de la investigacin en las ciencias sociales y tiene un objetivo prctico: disear investigaciones que generen inferencias vlidas sobre la vida social y poltica. Nos centramos en la ciencia poltica, pero nuestro argumento es aplicable a disciplinas como la sociologa, la antropologa, la historia, la economa y la psicologa, as como a reas que no se consideran una disciplina, como las tcnicas periciales, la investigacin en temas de educacin y el razonamiento clnico. Nuestra obra no se ocupa de la filosofa de las ciencias sociales, ni tampoco es un manual para tareas especficas de la investigacin como el diseo de encuestas, la realizacin del trabajo de campo o el anlisis de datos estadsticos. En realidad, trata del diseo de la investigacin: de cmo plantear preguntas y .moldear los estudios acadmicos para extraer inferencias descriptivas y causales vlidas. Por lo tanto, se sita en un zona intermedia entre las abstractas polmicas filosficas y las tcnicas prcticas para centrarse en la lgica intrnseca que subyace en toda investigacin social cientfica.

1.1 Dos formas de investigar, una sola lgica inferencialNuestro principal objetivo es relacionar las tradiciones de 10 que se suele denominar investigacin cuantitativa y cualitativa mediante una misma lgica inferencial. Ambas tendencias parecen bastante diferentes y, de he-

g;'131Jl;YlfQ;~~:

.11:;;>~~~

.~~

":;t~

,_no'; ';_,:"~i:;:;~:.i;,:~~C~.~~ -)L.;~..

~l"?-r_'

.... '~~

....,..~~r~....~ .. .... , ~.,.,.,.~~

cendencia que tiene para la comunidad cientfica una empresa investigadora. Lo ideal sera que todos los proyectos de investigacin de las ciencias sociales cumplieran dos condiciones. En primer lugar, un proyecto de investigacin tiene que plantear una pregunta importante para el mundo real. El tema ha de ser relevante para la vida poltica, social o econmica, para entender algo que afecte de manera significativa a la vida de muchas personas o para comprender o predecir acontecimientos que pudieran resuitar dainos o beneficiosos (vase Shively, 1990, p. 15). En segundo lugar, un proyecto de investigacin tiene que hacer una aportacin concreta a Lo escrito en un rea acadmica identificable, aumentando la capacidad colectiva de dar explicaciones cientficas verifzcables a algn aspecto del mundo. Esta segunda condicin no supone que todas las investigaciones que aporten algo a nuestra reserva de explicaciones para las ciencias sociales pretendan en realidad hacer inferencias causales. En ocasiones, la situacin del conocimiento en un determinado campo hace que se precisen muchos datos y descripciones antes de afrontar el reto de dar una explicacin. A veces, la aportacin de un proyecto slo es la inferencia descriptiva, mientras que en otras el objetivo ni siquiera es hacer tal inferencia, sino nicamente observar de cerca ciertos acontecimientos o hacer un resumen de hechos histricos. Sin embargo, en este caso se cumple nuestra segunda condicin, porque tales acontecimientos son un requisito imprescindible para la explicacin. La primera condicin dirige nuestro inters al mundo real de los fenmenos polticos y sociales, y tambin a cmo se registran los acontecimientos y problemas actuales e histricos que configuran la vida de las personas. Determinar si una pregunta de investigacin cumple dicho criterio es algo principalmente social. La segunda condicin nos sita en la biblografia acadmica de las ciencias sociales, es decir, en las perplejidades intelectuales que no se han planteado todava, en las que estn por resolver, as como en las teoras y mtodos cientficos de que se dispone para resolverlas. A los politlogos no les resulta dificil encontrar un objeto de estudio que cumpla la primera condicin. A lo largo de los ltimos cuatrocientos aos diez guerras importantes se han cobrado la vida de casi treinta millones de personas (Levy, 1985, p. 372); algunas guerras limitadas, como las que libraron los Estados Unidos y Vietnam del Norte, o Irn e Irak, han producido cada una un nmero de vctimas cercano al milln; del mismo modo, si hubiera una guerra nuclear, sta podra eliminar a miles de millones de seres humanos. La mala gestin de los polticos, tanto en el mbito nacional como en el internacional, ha generado -como en los aos treintaprivaciones econmicas de carcter global y crisis regionales y locales, tal como lo demuestran las trgicas experiencias de gran parte de frica y Amrica Latina durante los aos ochenta. En general, las variaciones entre pases en lo tocante a instituciones polticas se relacionan con las diversas condiciones de la vida ordinaria, las cuales se reflejan en la diferente esperanza de vida o mortalidad infantil que tienen pases con un grado de desa-

!~' ,

rrollo econmico similar (Russett, 1978, pp. 913-28). Dentro de los Estados Unidos, la eficacia de los programas que combaten la pobreza o la desarticulacin social parece haber variado de forma considerable. No cabe duda de que ser importante toda investigacin que contribuya, aunque sea de forma marginal, al conocimiento de estos problemas. Aunque los cientficos sociales tienen muchas cuestiones significativas que investigar, las herramientas para entenderlas son escasas y poco elaboradas. Hay muchos escritos sobre la guerra o el sufrimiento en las sociedades que poco contribuyen a la comprensin de tales problemas porque no lbs describen de forma sistemtica"o no hacen inferencias causaies o descriptivas vlidas. Las ideas brillantes pueden mejorar la comprensin al aportar nuevas e interesantes hiptesis, pero la brillantez no es un mtodo de investigacin emprica. Todas las hiptesis han de ser contrastadas empricamente antes de que hagan una aportacin al conocimiento. Este libro no da consejos sobre cmo ser brillante. Sin embargo, lo que s puede hacer es recalcar la importancia de que la investigacin se lleve a cabo de manera que constituya una aportacin al conocimiento. Nuestro segundo criterio para elegir una pregunta de investigacin, hacer una aportacin, significa explcitamente que hay que situar el diseo del estudio dentro del marco de la bibliografia cientfica existente. Esto garantiza que el investigador comprende el estado de la cuestin y reduce al mnimo la posibilidad de repetir lo que ya se ha hecho. Tambin garantiza que el trabajo sea importante para otros, aumentando as el xito del conjunto de la comunidad acadmica. Se puede hacer una aportacin explcita a lo escrito sobre el tema de varias maneras. A continuacin se enumeran algunas de ellas:l. Eligiendo una hiptesis que los estudiosos consideren importante en la bibliografia pero de la que no se haya realizado un estudio sistemtico. Si encontramos pruebas a favor o en contra de la hiptesis, estaremos haciendo una aportacin. Eligiendo una hiptesis aceptada en la bibliografia que sospechemos es falsa (o creamos que no se ha demostrado adecuadamente) e investigando si realmente lo es o si otra teora es correcta. Intentando resolver o presentando ms una polmica que est presente en lo quiz que toda esa polmica careca de Diseando investigaciones que arrojen por la bibliografia. pruebas a favor de uno de los bandos en escrito hasta el momento; demostrando fundamento desde el principio. iuz o evaluen premisas no cuestionadas

2.

3.

4. 5. 6.

Sealando que en la bibliografa no se ha concedido atencin a un asunto importante y proceder a continuacin a aportar a ese campo un estudio sistemtico. Sealando que las teoras o pruebas relativas a cierto objetivo en un campo podran aplicarse a otro para solucionar un problema existente, pero aparentemente alejado.

"F1,-:lt~J

E~'tJ;!:d~de

~Q

"~,'~:~tigac~5n socia.~~7:.':R'""...n'~ ..,.-:t~.=-"""t".,:

_3.~

c:a:::a .~n ((lS

~J;;;i(j;j5 50c:a~25

,..~~,-'::I~,J."""~'''-'':;~'''-'~~~~=';I\,;UI:::''''''''''~~'=''~._'.L":'Cto-.:-~:~;"-e.~~=J:.;.;;~\l

Si nos preocupamos demasiado por hacer una aportacin a la bibliografa acadmica sin prestar cierta atencin a asuntos importantes para el mundo real, correremos el riesgo de formular preguntas insignificantes desde el punto de vista poltico. Por el contrario, centrarse en el contexto poltico actual sin preocuparse de hasta qu punto un problema social es susceptible de investigarse sistemticamente dentro del marco de un cuerpo de conocimiento conduce a trabajos descuidados que poco aaden a una comprensin profunda. Nuestros dos criterios para elegir preguntas de investigacin no son necesariamente opuestos. A largo plazo, la comprensin de los fenmenos del mundo real aumenta con la elaboracin y evaluacin de hiptesis explicativas que propugna el mtodo cientfico. Sin embargo, de forma ms inmediata, puede haber contradiccin entre lo que es til desde el punto de vista prctico y lo que finalmente tiene valor. Por ejemplo, Mankiw (1990) seala que la teora macroeconmica y la macroeconoma aplicada se apartaron considerablemente la una de la otra en los aos setenta y ochenta: modelos cuya incoherencia terica se haba demostrado siguieron utilizndose para hacer pronsticos sobre la economa estadounidense, mientras que los nuevos modelos tericos, concebidos para corregir esos fallos, continuaron teniendo un carcter especulativo y no se desarrollaron lo suficiente como para realizar predicciones ajustadas con ellos. Cuando un investigador elige un tema, puede parecer que los criterios de aplicabilidad al mundo real y aportacin al progreso cientfico son opuestos. Algunos investigadores comenzarn con un problema del mundo real que sea muy significativo socialmente, como la amenaza de guerra nuclear, la disparidad de ingresos entre hombres y mujeres o la transicin a la democracia en Europa del Este. Otros quiz partan de un problema intelectual planteado en la bibliografa de las ciencias sociales: la contradiccin entre diversos estudios experimentales de tomas de decisin en condiciones de incertidumbre o la existente entre diversas teoras de voto referidas a las elecciones para el Congreso estadounidense y los ltimos resultados en las urnas. Evidentemente, no hay una distincin estricta entre los criterios. Algunas preguntas de investigacin responden a los dos desde el principio, pero, a la hora de disear el estudio, los investigadores suelen comenzar estando ms cerca de uno que de otro 4. Independientemente del punto de partida, el proceso de disear una investigacin para dar respuesta a una pregunta debe cumplir nuestras dos condiciones, y es evidente que la direccin de este movimiento depender de dnde comience. Si lo que nos motiva es una perplejidad cientfica, tendremos que preguntamos cmo hacer que el objeto de la investigacin sea ms relevante para asuntos importantes del mundo real: por ejemplo, cmo podra un experimento de laboratorio dilucidar mejor las elecciones estratgicas de los decisores del mundo real o las consecuencias que, para el comportamiento, puede tener esta teora. Si partimos de un problema real, ten-

..

'~

~, ..'diI-.,"-~"""'~' ~.''''''''~''''''_''''''''''''':.~ ....,,,;,,,,,_,,.,,,,,,,,,,,,,', .....o.::... ,_"",,, ""'"" :. ..lJ

El (tlseo de .a

ir'ile~;:~'~1i~)=;oj;;1 ~~Ji:~~l,

,... c-=~

.;, _

-....:._. ~ ..._ ....'.'.'__ ~-..:-.::-',;;.;.-.:.:..' __ = .:;....;.:.:---~:;.,.:-" ..

..,,:'

' .. ~.':

.. :.;

'~"::

i;...!l 4: ;:."us.:t;

investigacin a la que se aplican. Para facilitar su presentacin, todos los modelos algebraicos van precedidos de descripciones verbales a las que siguen recuadros con una notacin matemtica normalizada. Aunque no lo recomendamos, los recuadro s pueden saltarse sin que se pierda el hilo argumenta!.

4.

Un modelo formal sobre Larecogida de datos

Antes de formalizar nuestra presentacin de las inferencias descriptiva y causal -los dos objetivos principales de la investigacin socia1-, desarrollaremos un modelo para la recogida y resumen de datos que es bastante sencillo, pero que resulta eficaz para analizar los problemas inferenciales. Nuestro modelo algebraico no es tan formal como los estadsticos, aunque s clarifica nuestras ideas y facilita su transmisin. Con la expresin recogida de datos hacemos alusin a una gran variedad de mtodos, entre los que se incluye la observacin general y la participante, las entrevistas en profundidad, las encuestas a gran escala, la historia basada en fuentes secundarias, os experimentos aleatorios, la etnografa, el anlisis de contenido y cualquier otro mtodo que sirva para reunir datos fiables. La regla ms importante para toda recogida de datos es dejar claro cmo se han creado y de qu manera hemos accedido a ellos. Toda informacin que recojamos tiene que concretar las consecuencias observables de nuestra teora. Desarrollar una nueva pregunta de investigacin puede ayudarnos, pero no servir para responder a la primera si no es una consecuencia observable de ella. Hacemos modelos con los datos por medio de variables, unidades y observaciones. Un ejemplo sencillo es la renta anual de cuatro personas diferentes. Los datos pueden representarse simplemente mediante cuatro cantidades: 9.000,22.000, 2l.000 Y 54.292 dlares. En el caso ms general, podramos etiquetar la renta de las cuatro personas (numeradas del 1 al 4) como Y, Yl' Y3 e Y4 Una variable codificada para dos entrevistas no estructuradas podra utilizar los valores participativo, cooperador o intransigente, y se etiquetara como y e Y2' En estos ejemplos la variable es y, las unidades son los individuos, y las observaciones, los valores de las variables en cada unidad (renta en dlares o grado de cooperacin). El smbolo y se denomina variable porque su valor cambia en cada unidad y, en general, puede representar cualquier cosa cuyo valor se vaya alterando en un conjunto de unidades. stas, dado que se puede recabar informacin en un perodo de tiempo o en diferentes secciones de un rea, pueden ser personas, pases, organizaciones, aos, elecciones o dcadas y, con frecuencia, alguna combinacin de estas u otras unidades. Las observaciones pueden ser numricas, verbales, visuales o cualquier otro tipo de datos empricos.

;~i~"'i

'-1

~ ~

Supongamos, por ejemplo, que nos interesa estudiar las organizaciones internacionales desde 1945. Antes de recoger los datos hay que decidir qu resultados se quiere explicar. Podramos intentar comprender la influencia en 1990 del factor tamao sobre la actividad de las organizaciones internacionales (que se clasificara por su campo de accin o por el propio tipo de organizacin), los cambios en eltamao agregado de la actividad de dichas organizaciones desde 1945 o las transformaciones ocurridas en su actividad desde esa fecha que hubieran tenido que ver con la distribucin de ese factor. Entre las variables que miden la actividad de las organizaciones internacionales podramos incluir el nmero de pasesque.pertenecen a ellas en un momento dado, la cantidad de tareas que desempean o la magnitud de sus presupuestos y de su personal. En estos ejemplos, las unidades de anlisis seran las organizaciones internacionales, sus campos de accin, el nmero de pases miembros y perodos de tiempo como aos, quinquenios o dcadas. En la fase de recogida de datos no se aplica ninguna regla para determinar qu variables se recogen, cuntas unidades debe haber, si stas deben ser ms numerosas que las variables o cul es el mejor mtodo para medir las ltimas. El nico criterio es que, en cada caso, nosotros pensemos que lo que hacemos es importante. Cuando tenemos una idea ms clara de cmo van a utilizarse los datos, la regla es intentar encontrar tantas consecuencias observables de una teora como sea posible. Como subrayamos en el captulo 1, la investigacin emprica puede utilizarse tanto para evaluar hiptesis previas como para plantear otras que no se haban barajado anteriormente, pero si sirve para el segundo propsito, hay que recoger nuevos datos para evaluar las nuevas hiptesis. A partir de nuestro anlisis debe quedar claro que en la mayora de las obras que se denominan estudios de caso se miden numerosas variables de muchos tipos diferentes de unidades. Aunque estas investigaciones no suelen utilizar ms de un puado de casos, el nmero total de observaciones es, generalmente, inmenso. Por lo tanto, es esencial distinguir entre nmero de casos y de observaciones. El primero puede tener cierto inters para ciertos fines, pero el ltimo es importante para evaluar la cantidad de informacin que un estudio aporta a la resolucin de una pregunta terica. Por consiguiente, reservamos la n habitual para referimos nicamente al nmero de observaciones y no al de casos. Slo de forma ocasional, como cuando las observaciones individuales sean parcialmente dependientes, distinguiremos entre informacin y nmero de observaciones. El uso de esta ltima expresin procede del rnuestreo de encuestas, en el que n es el nmero de personas que hay que entrevistar; sin embargo, nosotros la utilizaremos de forma mucho ms general. En realidad, nuestra definicin de observacin coincide exactamente con lo que Harry Eckstein (1975, p. 85) denomina caso. Como seala este autor: Un estudio de seis elecciones generales en Gran Bretaa puede ser, pero no tiene por qu, un estudio en el que n = 1. Podra ser otro en el que n = 6 o tambin n = 120.000.000.

l ti'i:;.e?io

'32

L2i: i:-~'-;-::.~S~:}j'\:I;;"_,,,,~;;,::;.. . .., "';""."1':"~~~I'-..:n"..Al"'''''-,:~'':"':r~~~z.;:=tt:~'''''"

L~:i

'i1ri;:~::,::~~:.'i:::1 J:2S~;[.,:;'~\:~

"","".;:,n-~_",,-~,=.,...a.=-~"'_"'._=-I':..L~..,..~-r:-.:!.:"~..l!&-=~l'.:~''',.'~.''~'''''-

Todo depende de si el objeto de estudio son los sistemas electorales, las elecciones o los votantes. La ambigedad sobre lo que constituye un "individuo" (de ah el "caso") slo puede evitarse si nos ocupamos de las medidas de entidades concretas, y no de las propias entidades. De este modo, un "caso" puede definirse tcnicamente como un fenmeno del que slo sealamos e interpretamos una nica medida en cada variable pertinente. La nica diferencia con nuestro uso es que, desde que Eckstein escribi su artculo, los investigadores han continuado utilizando la palabra caso para referirse a un estudio de caso completo, que todava tiene una definicin bastante imprecisa. Por lo tanto, siempre que sea posible utilizaremos la palabra caso como lo hacen la mayora de los autores y reservaremos el trmino observacin para hacer referencia a las medidas de una o varias variables en una sola unidad. En el resto del captulo queremos mostrar de qu manera conceptos como el de variable y unidad pueden hacer que abordemos de forma ms clara el diseo de una investigacin, incluso cuando no sea apropiado utilizar medidas cuantitativas para resumir la informacin de que dispongamos. La cuestin que planteamos es: cmo podemos hacer inferencias descriptivas sobre la historia tal como fue sin perdemos en un mar de datos irrelevantes? Dicho de otro modo, cmo separar lo esencial de 10 efimero?

. vo. es exponer caractersticas apropiadas de stos mediante un formato "til5 por ejemplo, la media muestral, o promedio, es un estadstico:_ 1 Y = -ni (y

+ y,- + ...+ y)

11

= -nf:t y '"

1 "

en el que Ly es una manera cmoda de escri.bir y + Y2 + Y3 + ... + Y,,- Otro estadstico es el mximo muestral, que se etiqueta como ...vm[lX :Ymax =i=\

Mximo (Y'Y2'

..

,y)

(2.1)

La media muestral de las cuatro cifras de renta del ejemplo del apartado 4 (9. ,22.000,21.000 y 54.292 dlares) es 26.573 dlares, mientras que el 000 mximo muestral es 54.292. Podemos resumir los datos originales que contienen cuatro cifras mediante las dos cantidades que representan, respectivamente, la media y el mximo muestrales. Tambin podemos calcular otras caractersticas de la muestra, como el mnimo, la mediana, la moda o la varianza. Cada resumen de este modelo reduce todos los datos (cuatro cifras en este ejemplo simple o lo que conocemos de algn aspecto de la historia eur.opea en el anterior) a un nico nmero. Comunicarse mediante resmenes suele ser ms fcil y tiene ms sentido para el lector que utilizar todos los datos originales. Evidentemente, si, en nuestro conjunto de datos slo hubiera cuatro nmeros, no tendra mucho sentido utilizar cinco resmenes diferentes y sera ms sencillo presentar las cuatro cantidades originales. Interpretar un estadstico suele ser ms fcil que comprender todo un conjunto de datos, pero siempre se pierde informacin al describir una gran cantidad de nmeros utilizando unos pocos. Qu normas rigen el resumen de los pormenores histricos? La primera es que los resmenes deben centrarse en los resultados que queremos describir o explicar. Si lo que nos interesa es el crecimiento de la organizacin internacional media, no sera muy inteligente centrarse en las Naciones Unidas; pero si 10 que nos importa es cmo influye el mayor o menor tamao en la distribucin de dichas organizaciones, las Naciones Unidas seran seguramente una de las unidades en las que tendramos que centramos. La ONU no es una organizacin representativa, pero s es importante. Para estudiar la tpica organizacin internacional desde el punto de vista estadstico examinaramos valores medios (de presupuestos, cometidos, nmero de miembros, etc.), pero para comprender el abanico de actividades tendramos que examinar la varianza. El segundo precepto, igualmente evidente, es que un resumen tiene que simplificar la nji:mnacin de que disponemos. En trminos cuantitativos, esto significa que siempre hay que utilizar menos estadsticos sintetizadores que unidades hay en los datos originales, porque, de no ser as, podra ser ms fcil presentar los datos originales sin~.

5.

El resumen de Los pormenores

histricos

Despus de recoger los datos, el primer paso de cualquier anlisis es resumiros. Los resmenes pueden describir una gran cantidad de datos pero no estn directamente relacionados con la inferencia. Como, en realidad, lo que nos interesa es generalizar y explicar, un resumen de los datos que van a explicarse suele ser un buen punto de partida, pero no constituye un objetivo suficiente para la investigacin en las ciencias sociales. Resumir es necesario, ya que, como nunca podemos decir todo lo que sabemos sobre un conjunto de acontecimientos, no tendra sentido intentar hacerlo. Los buenos historiadores comprenden cules son los datos cruciales y, por lo tanto, en vez de perderse en digresiones, realizan estudios que subrayan lo esencial. Para entender la historia europea de los primeros quince aos del siglo XIX, quiz necesitemos comprender ciertos principios de estrategia militar tal como lo hizo Napolen e, incluso, saber qu coma su ejrcito si su avance dependa de los vveres que encontraba a su paso; pero puede que sea irrelevante conocer el color del pelo de Napolen o si prefera los huevos fritos a los cocidos. Los buenos textos histricos suelen incluir, aunque no se limiten a ello, un sucinto resumen verbal de gran cantidad de pormenores histricos. Nuestro modelo para el proceso de resumen de os detalles histricos es un estadstico, con el que se expresan datos de forma abreviada. Su objeti-

~Jt~~~

~ l }! ~

65;;j,~

'2~ LJ 'i::T;i:rE:~l~::a1'2S':.:~-t:~~!ia . ~t -:i~s~::n de\3

in'feE-':'~gat:~f~n ;1;~at

__

'''-~'''",,=''''''''"~~~{';''';J:.-:=;;~';~:!ol''

.. nI.'i''~'~t''~~;i'.,;,,,-.:""';;:>:::':;'t=';':"~~_:"~,.,L;"":;'=:G,:u;;,:;;;;n..-=Y...l'!'=~:"!,"'l:i.~;~;:r..:w-~,,W;l"~l""-I!):!'V:;;::';~-=t'."'="_ ~

,::!,..:,r,:;:;s:==m;;!.."*,,-~.J~.:7lI~!~~;la."'::'.1II.~~h~~~""'~7J.","=,.;;,.o::~,Ik-"'t=~.::.l!t:-.~~"l:I.~~-=~~'X-~=~

ningn tipo de resumen . La sntesis que utilicemos tambin ha de ser lo suficientemente simple como para que nuestro pblico pueda entenderla. Ningn fenmeno puede resumirse de manera perfecta, de manera que las normas que dictan 10 que es adecuado dependen de nuestros propsitos y del pblico. Por ejemplo, un artculo cientfico sobre guerras y alianzas podra incluir datos sobre 10.000 observaciones. En este trabajo, estara justificado que hubiera resmenes que utilizaran cincuenta nmeros; sin embargo, incluso para un experto, cincuenta indicadores separados podran resultar incomprensibles si no existe otro resumen. Para impartir una clase sobre esta materia a uno de los primeros cursos de licenciatura, tres cifras seran ms que suficiente.

..c_.__._. . .. -_.--. _..

6.

la inferencia descriptiva

La inferencia descriptiva es un proceso mediante el cual se comprende un fenmeno no observado a partir de un conjunto de observaciones. Por ejemplo, en las elecciones britnicas de 1979 nos podra interesar cmo cambia en cada circunscripcin el voto a los partidos Conservador, Laborista y Socialdemcrata. Lo ms probable es que tengamos varias hiptesis que evaluar; sin embargo, lo que observamos realmente son las elecciones a la Cmara de los Comunes de ese ao en 650 circunscripciones. Podramos pensar ingenuamente que, al registrar qu porcentaje de votos y escaos recibieron los conservadores en cada circunscripcin, estamos observando de forma directa su fuerza electoral. Sin embargo, la poltica siempre conlleva un cierto margen para lo aleatorio y lo impredecible, al igual que el conjunto de la vida social y toda investigacin cientfica 7. Supongamos que por un sbito descuido (o como deferencia hacia las ciencias sociales) el Parlamento Britnico hubiera decidido celebrar elecciones cada semana en 1979 y supongamos tambin (de forma contrafctica) que stas fueran independientes unas de otras. Aunque el apoyo subyacente a los conservadores se mantuviera constante, cada repeticin semanal no registrara el mismo nmero de votos por partido en cada circunscripcin. Podra cambiar la situacin climatolgica, surgir epidemias, la gente podra tomar sus vacaciones, y todo ello afectara a la participacin en las elecciones y a su resultado. Adems, podran producirse acontecimientos fortuitos en el contexto internacional o aparecer escndalos en los medios de comunicacin; aunque estas contingencias no tuvieran importancia a largo plazo, s podran influir en los resultados semanales. De este modo, numerosos acontecimientos transitorios podran producir resultados electorales ligeramente diferentes. Despus de todo, nuestra observacin de cualquiera de estas elecciones no sera una medida perfecta de la fortaleza de los conservadores. Por poner otro ejemplo, supongamos que nos interesa la intensidad del conflicto entre los israeles (polica y residentes) y los palestinos en las co-

munidades de los territorios ocupados por Israel en Cisjordania. Los informes oficiales de ambos bandos parecen sospechosos o estn censurados, de manera que decidimos llevar a cabo nuestro propio estudio. Quiz podamos verificar la intensidad general del conflicto en diferentes comunidades mediante entrevistas en profundidad o participando en actividades familiares o de otros colectivos. Si hacemos ambas cosas durante una semana en cada una de las comunidades, nuestras conclusiones sobre la intensidad del conflicto en ellas reflejarn en parte los acontecimientos que, por casualidad, sucedan en el periodo en que visitamos esos enclaves. Aunque nuestro es_.,. __ ',... _ tudio se llevara a cabo durante un ao, tampoco-podramos conocer perfectamente el verdadero nivel de conflictividad, aunque s se reducira la incertidumbre sobre l. En estos ejemplos, puede decirse que la varianza del voto conservador en diferentes circunscripciones o la del conflicto en las comunidades cisjordanas surge de dos factores separados: de diferencias sistemticas y no sistemticas. En el ejemplo electoral, las primeras incluyen caractersticas fundamentales y predecibles de las circunscripciones, como las diferencias ideolgicas, de renta, de organizacin de la campaa o las referentes al apoyo tradicional a cada partido. En hipotticas repeticiones semanales de las mismas elecciones se mantendran las mismas diferencias sistemticas, pero variaran las no sistemticas, como son los cambios producidos en la participacin por las condiciones climatolgicas. En el ejemplo de Cisjordania, se consideraran diferencias sistemticas las profundas divergencias culturales entre israeles y palestinos, su conocimiento mutuo y las pautas de segregacin geogrfica de la vivienda. Si pudiramos comenzar nuestra semana de observacin en doce ocasiones distintas, estas diferencias sistemticas entre comunidades seguiran influyendo en la intensidad del conflicto observado. Sin embargo, las no sistemticas, como los atentados terroristas o los ejemplos de brutalidad policial israel, no seran predecibles y slo afectaran a la semana en que ocurrieran. En general, con las tcnicas inferenciales apropiadas, podemos conocer la naturaleza de las diferencias sistemticas, aunque sea con la ambigedad que est presente en un conjunto de datos de la vida real por las diferencias no sistemticas o aleatorias que contiene. Por lo tanto, uno de los objetivos fundamentales de la inferencia es distinguir entre el componente sistemtico y el no sistemtico dentro de los fenmenos que estudiamos. El sistemtico no es ms importante que el que no lo es, y nuestra atencin no debera centrarse en uno a costa del otro. Sin embargo, en las ciencias sociaies resulta fundamental diferenciarlos. Una de las formas de abordar la inferencia es considerar el conjunto de datos recogido como uno ms de los que son posibles, al igual que los resultados reales de las elecciones britnicas de 1979 son slo uno de los muchos conjuntos de resultados posibles en diferentes das hipotticos en los que las elecciones podran haber tenido lugar, o del mismo modo que una semana

~~;":Ilfij".1;. 6-7~'lqj

~~~~

~t di~~e(~~;G

:;:!;

~nvf.~st~(r;:t:in:';:;'-:'::-;;

_~

L

H)'f~::ren~_':i.1t!"'~.~ .; ..;-h. d..~;;l{;.;.i.~;:.""'.",,""'~~~=~.

~"j.~'.l-;:>~"w::a'':O: .. 'I!,;;.~ 'r'"'''''''~,'''~la'''''''~=ln!,:L'I~O';''~.,.~=~~~~--,

t3

":i;"i:'?nf_-:3

l~~1.::~;1jt:;!a

de qu variables explicativas se encuentren disponibles y de cules se incluya en el anlisis. Con las variables explicativas apropiadas el mundo es completamente predecible.

V(Y)

=

a-;{

(2.3)

en donde (la letra griega sigma) indica lo que se obtiene al aplicar el operador de varianza a la variable aleatoria Y. Vivir en una comunidad de , Cisjordania en la que hubiera un alto grado de conflictividad entre israeles y palestinos no sera agradable, pero vivir en un lugar en el que los valores del conflicto registraran una elevada varianza y, por tanto, fueran muy impredecibles, podra ser peor. En cualquier caso, ambas situaciones pueden tener un inters considerable para los investigadores acadmicos. Para comprender mejor estas cuestiones distinguimos dos puntos de vista fundamentales sobre la variacin aleatoria 11, que constituyen los dos extremos de una gradacin. Aunque hay un nmero significativo de investigadores que se siente cmodo en cada uno de esos extremos, la mayora de los politlogos tienen puntos de vista que, de alguna manera, se sitan entre ambos polos.

cr

Punto de vista 1: un mundo probabilstico La variacin aleatoria existe tanto en la naturaleza como en los mundos social y poltico, y nunca podr eliminarse. Aunque midiramos todas las variables sin cometer errores, registrramos todos los datos (en vez de slo una muestra) e incluyramos toda variable explicativa concebible, nuestros anlisis no podran hacer nunca predicciones perfectas. Un investigador puede dividir el mundo en componentes aparentemente sistemticos y no sistemticos y mejorar con frecuencia sus predicciones, pero nada de lo que haga para analizar los datos podr reducir de manera significativa el grado de variacin no sistemtica que existe en diversas partes del mundo emprico.

Punto de vista 2: un mundo determinista La variacin aleatoria slo representa la parte del mundo que no podemos explicar. La divisin entre variacin sistemtica y estocstica la impone el investigador, y depende

Estos puntos de vista diferentes producen diversas ambigedades en las inferencias de cada rea de investigacin 12 Sin embargo, en la mayora de ellas ambas perspectivas pueden considerarse equivalentes desde el punto de vista de la observacin. Esto es especialmente cierto si, con el punto de vista 2, partimos de la base de que al menos ciertas variables explicativas seguirn sin conocerse. De este modo, la equivalencia desde el punto de vista de la observacin- tiene lugar cuando dichas variables desconocidas del punto de vista 2 se convierten, en el punto de vista 1, en la interpretacin de la variacin aleatoria. Al carecerse de cualquier consecuencia observable con la que distinguir entre ellos, elegir uno u otro depende ms de la fe o de la creencia que de la verificacin emprica. Por poner otro ejemplo, en ambos puntos de vista determinar si un acontecimiento poltico o social concreto es el resultado de un proceso sistemtico o no sistemtico depende de las opciones que tome el investigador. Usando el punto de vista 1 podemos clasificar provisionalmente un efecto como sistemtico o como no sistemtico, pero, a menos que logremos encontrar otro conjunto de datos (o incluso un solo caso ms) con el que comprobar la persistencia de un efecto o pauta, ser muy difcil hacer una apreciacin correcta. Si usamos la versin ms extrema del punto de vista 2, no podremos ms que describir los datos, ya que juzgar incorrectamente que un acontecimiento es estocstico o sistemtico es imposible o irrelevante. Una versin ms realista de esta perspectiva acepta que el punto de vista 1 puede considerar de forma correcta o incorrecta que una pauta es aleatoria o sistemtica, pero deja cierta libertad para decidir cul ser objeto de examen en cada estudio concreto y cul seguir sin explicarse. En este sentido, al comenzar cualquier anlisis, todas las observaciones son consecuencia de fuerzas no sistemticas. Por tanto, a nosotros nos corresponde demostrar que esos acontecimientos o procesos son el resultado de fuerzas sistemticas. Decidir si un acontecimiento o proceso no explicado es UIl hecho realmente aleatorio o si procede simplemente de variables explicativas an no identificadas queda para futuras investigaciones. Este argumento se aplica con igual fuerza a la investigacin cualitativa que a la cuantitativa. La primera suele ser histrica, pero es de extrema utilidad para las ciencias sociales cuando tambin es explcitamente inferencial. Para conceptualizar las variables aleatorias de las que proceden las observaciones e intentar hacer una estimacin de sus caractersticas sistemticas --en vez de limitarse a resumir los pormenores histricosno es preciso recoger datos a gran escala. De hecho, uno de los rasgos que definen a un buen historiador es su capacidad para distinguir, en la situacin que describe, los aspectos sistemticos de los circunstancial es. Por lo tanto,

'~~7'~1!~!~

-)1' ;-:-:'

'l.

, 1. ;-::)J:~"!2~~~--:il !~.?,:t'1nth~

~ ,~':.l {~isef1'\) >'1=_"'1I% ~.~ ..

,

',& nV~_;t.irp3~1.')r:~~::~:-;:1..:x-~-.r~'_n~.,....atI::-'~~~~~=.,-~~-+ .,.,-

..~.(._-"..l!'~-.-.,

esta defensa de la inferencia descriptiva no es en absoluto una critica a los estudios de caso o al trabajo del historiador. Lo que queremos decir es que, en las ciencias sociales, cualquier tipo de investigacin tendra que cumplir los principios inferenciales bsicos que se analizan en este libro. Demostrar que existen caractersticas sistemticas ser ms dificil con algunos tipos de datos, pero no deja de ser importante hacerla. Como ejemplo de los problemas de la inferencia descriptiva en la investigacin histrica, supongamos que nos interesaran los resultados de los encuentros en la cumbre que mantuvieron los Estados Unidos y la Unin Sovitica entre 1955 y 1990. Nuestro fin ltimo es respondel: a una pregunta de tipo causal: en qu condiciones y en qu medida condujeron esas reuniones a una mayor cooperacin? Para contestar a esta pregunta hay que resolver ciertas cuestiones difciles del anlisis causal, especialmente las relacionadas con la direccin que toma la causalidad dentro de un conjunto de variables relacionadas de forma sistemtica 13 Sin embargo, en este apartado, nos limitamos a tratar los problemas de la inferencia descriptiva. Supongamos que hemos ideado una forma de calibrar -mediante anlisis histricos, expertos en encuestas, recuento de acontecimientos cooperativos o conflictivos, o combinando estas tcnicas de medicinen qu medida se registr despus de cada cumbre un aumento de la cooperacin entre las superpotencias y que tenemos ciertas hiptesis sobre las condiciones en las que aumenta la cooperacin, que se relacionan con cambios de poder, con los ciclos electorales en los Estados Unidos, con la situacin econmica en cada pas y con el grado de cumplimiento de las expectativas previas de ambos bandos. Supongamos tambin que esperamos poder explicar el nivel subyacente de cooperacin en cada ao, relacionndolo de alguna manera con la presencia o ausencia de una cumbre en el perodo anterior, as como con nuestros propios factores explicativos. Lo que observamos (aunque nuestros ndices de cooperacin sean perfectos) es nicamente el grado de cooperacin que se da realmente en cada ao. Cuando se observen niveles de cooperacin altos en los aos posteriores a la celebracin de las cumbres, no sabremos, sin un estudio ms profundo, si hay una relacin sistemtica entre ambos factores. Con un pequeo nmero de observaciones, podra ser que asociar las cumbres a la cooperacin reflejara una aleatoriedad debida a una incertidumbre fundamental (buena o mala suerte, segn el punto de vista 1) o a variables explicativas no identificadas por el momento (segn el punto de vista 2). Entre estas ltimas variables se incluyen las fluctuaciones climatolgicas que podran producir malas cosechas en la Unin Sovitica, as como los cambios en el equilibrio militar o en los mandatarios, circunstancias que podran explicar las transformaciones en el grado de cooperacin. Si se identifican, estas variables sern explicaciones alternativas -variables omitidas que ' podran recogerse o examinarse para evaluar su influencia en el resultado de la cumbre. Si no se identifican, pueden considerarse acontecimientos no

.~

1'f';

t)

*1

:~ ij.~;

~t.

i1~ $

'&

3

~~

-'.eJ :~,

;;~~'e

-o!

sistemticos que podran explicar el alto grado de cooperacin observado entre las superpotencias. Para aportar pruebas que contradigan la posibilidad de que haya acontecimientos aleatorios (variables explicativas no identificadas) que expliquen la cooperacin observada, podramos considerar muchos otros aos. Ser extremadamente improbable que los acontecimientos y procesos aleatorios, al ser por definicin no persistentes, produzcan una cooperacin diferente en los aos en que haya cumbres y en los que no las haya. De nuevo, llegamos a la conclusin de que slo mediante pruebas repetidas en diferentes contextos (aos, en este caso) podremos decidir si es mejordefinir una pauta como sistemtica o como resultante de las consecuencias-pasajeras de procesos aleatorios. - .. _. - -Suele ser difcil distinguir entre procesos sistemticos y no sistemticos. Desde el punto de vista de las ciencias sociales, una epidemia de gripe que ataque con mayor virulencia a los votantes de clase obrera que a los de clase media es un acontecimiento impredecible (no sistemtico) que, en una reproduccin hipottica de las elecciones de 1979, disminuira los votos laboristas. Sin embargo, la persistencia de un componente diferenciador de clase en la incidencia de una discapacidad sera un efecto sistemtico que reducira la media de votos laborista en muchas reproducciones. En las elecciones estadounidenses, el hecho de que un candidato venza a otro por su personalidad o por un lapsus lngnae ocurrido en un debate televisado podra ser un factor aleatorio que quiz hubiera influido en las probabilidades de cooperacin entre la URSS y los Estados Unidos durante la Guerra Fra. Sin embargo, si la principal promesa electoral hubiera sido la de reducir la tensin con los soviticos, las constantes victorias de los candidatos conciliadores hubieran sido un factor sistemtico que explicara las probabilidades de cooperacin. Los factores sistemticos son persistentes y sus consecuencias se repiten cuando tienen un valor determinado. Los no sistemticos son transitorios: no podemos predecir su impacto. Sin embargo, esto no significa que los sistemticos representen constantes. Las promesas electorales de una campaa pueden ser un factor sistemtico a la hora de explicar el comportamiento electoral, pero esto no significa que dichas promesas no cambien. En el resultado de unas elecciones, la constante de las promesas electorales es su efecto y, si es variable, cambia de forma predecible. Cuando las relaciones sovitico-estadounidenses eran buenas, puede que prometer polticas conciliadoras ganara votos en las elecciones de los Estados Unidos; cuando eran malas, quiz ocurriera lo contrario. Del mismo modo, la climatologa puede ser un factor aleatorio (si los cambios intermitentes e impredecibles tienen consecuencias tambin impredecibles) o una caracterstica sistemtica (si el mal tiempo produce siempre menos votos para los candidatos que estn a favor de polticas conciliadoras). En pocas palabras. resumir los pormenores histricos es un importante paso intermedio en el proceso de utilizacin de os datos, pero tambin te-

~:;f6jn

:E!;.:;'~sr~~) dG

,.;;1 'TJ'2;,t:;,~i;C,:,i;

""I;'d[...;;;...,1..k'_'.".'''''::' . ,'.. .w ~,,-"'C.-.:A1.!!~~~~~:\"J..r-~.~

!1i

i_:supongamos, por ejemplo, que quisiramos hacer una estimacin de f.L l; e~uacin (2.2,) ~ que d~cidiramos util~zar la media c.~moestimador, ;\ f-:'? = y,. En un umco conjunto de datos, y es la proporcion de votos la- ,1

irbori:t;sL

en la media de todas las circunscripciones, n = 650 (o el niveL ll las comunidades de Cisjordania-)-. Sin embargo, muestral se convierte en una funcin de 650 variables aleatorias, en un nmero infinito de reproducciones

y = 2.:

1,!? >.-..;f

7.2

Eficiencia

~~:.' ,~~ ,;:y

Generalmente, no tenemos una oportunidad para aplicar nuestro estimador a un gran nmero de aplicaciones esencialmente idnticas. En realidad, excepto en algunos cuidados experimentos, slo lo aplicamos una vez. En este caso, la falta de sesgo es importante, pero quisiramos estar ms seguros de que la nica estimacin que hacemos se acerca al valor correcto. La eficiencia proporciona una manera de distinguir entre estimadores no se sgados. De hecho, este criterio tambin puede ayudamos a diferenciar estimadores alternativos con un reducido nivel de sesgo (en general, un estimador muy sesgado debe descartarse sin siquiera evaluar su eficiencia). La eficiencia es un concepto relativo que se mide calculando la varianza del estimador en las reproducciones hipotticas. En los estimadores no sesgados, cuanto menor es la varianza, ms eficiente (mejor) es el estimador. Una varianza pequea es mejor porque nuestra nica estimacin probablemente estar ms cerca del verdadero valor del parmetro. No nos interesa la eficiencia de un estimador muy sesgado porque, en esta situacin, la presencia de una varianza reducida har improbable que la estimacin se acerque al valor verdadero (porque la mayora de tales estimaciones constituirn un apretado conglomerado cercano al valor equivocado). Como describimos posteriormente, nos interesa la eficiencia si el sesgo es pequeo, y quiz a veces estemos dispuestos a admitir un pequeo sesgo a cambio de una mayor eficiencia. Supongamos de nuevo que nos interesara hacer una estimacin del nivel medio de conflictividad entre palestinos e israeles en Cisjordania y que estuviramos evaluando dos mtodos: una sola observacin de una nica comunidacL elegida como tpica, y observaciones similares de, por ejemplo, 25 comunidades. Parece evidente que 25 observaciones son mejores que una sola, siempre que se haga el mismo esfuerzo en la primera que en cada una de las 25. Vamos a demostrar precisamente por qu es as, Este resultado explica por qu debemos observar tantas consecuencias de nues-

~~'., ::~.

;~ti

~!';.

~~J~

rt.i:icas de las eLecciones en cada circunscripcin. De este modo, la media J t.muestral tambin se convierte en una variabLe aleatoria. En algunas repro- j rducciones hipotticas. Y ~roducir re~uL~ados electorales q~: se ace~quep; ~ f .. a JL y en otras ocasiones estos se alejaran de ella. La cuestin es Sl Y sera ~ ~. acertada, es decir, igual a JL en la media de estas reproducciones hipotti- ~ ~,~as. Para hallar la respuesta utilizamos de nuevo la operacin del valor es- j f'perado, que nos permite determinar la media del infinito nmero de hipo- ~ I";t~ti~as elec:iones. Las regLas de la expectativa nos permiten reaLizar Los ~ ~slgulentes clculos: 1 ~~. ','1n ~

n

t Y;, si se considerar-s1

hipo- ~A

~r;I;,.~!?,'_,_ 11:,.".t"li.

~~l'.

,tr ._... ~.:.'.':~::.'..,~_,...'iJ'I.".

un n grande (n = 25) Y que representa el nivel medio de conflictividad encontrado en 25 estudios separados de una semana de duracin en diversas comunidades de Cisjordania. Ambos estimadores, si se utilizan apropia. damente, no estn sesgados. Si el mismo modelo es cierto, el estimador de la observacin nica tendr una varianza de v,(y. ) = 0-2 Esto quiere decir nprca que habramos elegido una circunscripcin que consideramos tpica, la cual, no obstante, se vera afectada por variables aleatorias. La varianza del gran estimador n es V(Y) = rr/25, o sea, la de la media muestra!. De este modo, el estimador de la observacin nica es veinticinco veces ms variable (menos eficiente) que .el que se. obti@necuando n = 25.De ah que obtengamos el resultado evidente de que es mejor tener ms observaciones. Ms interesantes son las condiciones en las que un estudio muy detallado de nuestra nica comunidad pudiera arrojar resultados tan buenos como los de la investigacin que utiliza un n grande. Esto quiere decir que, aunque siempre son preferibles los estudios con ms observaciones (si se dispone de los medios para recogeras), hay situaciones en las que un nico estudio de caso (como siempre, con muchas observaciones) es mejor que otro que se basa en ms observaciones que, por separado, no son ni tan detalladas ni tan ciertas. En igualdad de condiciones, nuestro anlisis demuestra que cuantas ms observaciones haya, mejor, porque as disminuye la variabilidad (y, por tanto, la ineiciencia). De hecho, la coherencia es una propiedad que consiste en que a medida que aumenta el nmero de observaciones, la variabilidad se acerca a cero y la estimacin es igual al parmetro que estamos intentando calcular 14. Sin embargo, es frecuente que las condiciones no sean las mismas. Supongamos, por ejemplo, que cualquier medida individual de un fenmeno que estemos estudiando se vea influida por factores que aumenten la probabilidad de que se aleje del valor verdadero (o sea, que la varianza del estimador es alta), y SUpongamos que tenemos alguna idea -quiz por otros estudios- de cules pueden ser dichos factores. Supongamos, adems, que nuestra capacidad de observar y corregir esos factores disminuye sustancialmente a medida que aumenta el nmero de comunidades estudiadas (aunque slo sea porque carecemos del tiempo y del conocimiento suficientes para corregir esos factores en un nmero elevado de observaciones). Nos enfrentamos entonces al dilema de elegir entre un estudio de caso que tiene observaciones adicionales dentro del propio caso y 25 casos que contienen cada uno slo una observacin. Si nuestro caso nico slo tiene una observacin, ser evidentemente inferior al estudio de 25 observaciones. Sin embargo, los investigadores que utilizan estudios de caso disfrutan de considerables ventajas, que se entienden mejor al formalizarlas. Por ejemplo, podramos comenzar por seleccionar cuidadosamente nuestra comunidad con el fin de aseguramos de que es especialmente representativa del resto del pas o de que entendemos la rela-

~

,~.~

.ein que tiene con las dems. Podramos preguntar a unos pocos residentes . "e'leer informes de prensa para comprobar si es una comunidad media o si alzn factor no sistemtico ha hecho que esta observacin sea atpica; despodramos ajustar el nivel de conflictividad observado par,a hacer una estimacin del nivel medio, .L, que se registra en Cisjordania. Esta sera la parte ms difcil del estimador del estudio de caso, y habra que tener cuidado de que no se nos colara el sesgo. Una vez que estamos razonablemente seguros de haberlo minimizado, podramos centramos en aumentar la eficiencia. Para hacerlo, podramos pasar muchas semanas en la comuni~. .dad, llevando a cabo numerosos estudios independientes. Podr~amos entre- vistar a lderes comunitarios, leer los peridicos, acompaar a una familia en su vida diaria y utilizar otras tcnicas para recabar informacin. Mediante tales procedimientos, podramos conseguir muchas ms de 25 observaciones dentro de esta nica comunidad y producir un estudio de caso que, al igual que el de las 25 comunidades, no estuviera sesgado y que fuera ms eficiente que ste. Consideremos otro ejemplo: supongamos que estamos realizando un estudio sobre el problema internacional que plantean las drogas y que necesitamos calcular el porcentaje de tierra cultivable de una determinada regin del mundo en el que se ha plantado cocana. Supongamos, adems, que podemos elegir entre dos mtodos: un estudio de caso de un solo pas o una investigacin a gran escala de tipo estadstico que se ocupe de todos los pases de la regin. Parece mejor estudiar toda la regin, pero hay que sealar que, para optar por esta alternativa, es necesario (por razones prcticas) utilizar los datos que proporcionan los gobiernos de la zona a un organismo de la ONU. Se sabe que estas cifras tienen poca relacin con las pautas reales de cultivo, ya que las preparan los ministerios de asuntos exteriores y se basan en consideraciones relativas a las relaciones pblicas. Supongamos tambin que, mediante visitas que observaran de cerca un pas, podramos corregir las estimaciones de su gobierno para acercarlas ms a las cifras verdaderas. Qu mtodo elegiramos? Quiz decidamos estudiar slo un pas, o quiz dos o tres; tambin podramos analizar uno en profundidad y utilizar nuestros resultados para re interpretar, y por tanto mejorar, los datos gubernamentales de los otros pases. La eleccin tendra que basarse en qu datos responden mejor a nuestras preguntas. Por poner un ejemplo ms, supongamos que estamos estudiando la Comunidad Europea y queremos hacer una estimacin del grado de regulacin que se espera produzcan en un sector de toda la Comunidad las acciones de la Comisin y del Consejo de Ministros. Podramos recabar informacin en un gran nmero de normativas adoptadas formalmente por el sector industria! en cuestin, codificarlas segn su severidad y, posteriormente, hacer una estimacin de la severidad media de una normativa. Si recogemos datos sobre 100 normativas que muestren, en principio, un rigor similar, la varianza de nuestro clculo ser el resultado de dividir la de cualquiera de las

;:S

tL:~~78.fJ

"~~~~9.r-;;~~

:~7~9:.~ts~;Q k...:.:i~,.~~!l

~ rris:2r;;)~ ~~.~

~!et.c ~..,.,.~""",

TlP;'~~;"~Jlf>~:,C!"l: St.:(j~~~~~~ .u~~=~~,;:u : ;.;.'.;,;.=;:~.

~~~'~.Y.c.;x ~-~~-""'-''''''''''"~M-~.!.

':i" .

= - 2 ncr n=

i,'.'.;:~'

o2/n

fEn el ejemplo anterior n = 650, de manera que la varianza del estimador t."de este n grande es 02/650, Y la del estimador del estudio de caso es 02. I:.,t,a estimaci~~ estadstic~ ser pre!eri?le por su eficiencia,. a menos qu.e (.'podamos utilizar correcciones cualitativas del error aleatorio para reducir ~ ..Iavarianza del estimador del estudio de caso mediante un factor que val- 1 t ga, al menos, 650. ~~~~~~~.,;r.=':';~?'f-;-"-'>"':C;t~"~TI~-~._'>:""~,,:;:';'::'l!n.:5.-=!:';~".C:::Z~I:;-:.iq:::;j;.~'.:."":..:Ml~~~"\~-~:;'~"4."I.;~~ii:;.~

go y eficiencia. En cualquier conjunto grande de observaciones que no est sesgado, la media muestral de las dos primeras tampoco lo estar, y 10 mismo OCurre con la media muestral de todas ellas. Sin embargo, al utilizar slo dos observaciones se prescinde de informacin sustancial; esto no afecta a la falta de sesgo, pero s reduce considerablemente la eficiencia. Si no utilizamos tambin el criterio de eficiencia, careceremos de reglas formales para elegir entre un estimador y otro.

C::i diseilo

!~, '.!:i

1

~J.f;5t2fF~:~'; ;3!).~-:::, :;--.,.;.~'''~,'AU,.".1?_..~"",""""'a ".,,',,>.11\1 l ...,"\'":..~":t'.tll:\:'~;IlI:-:tk~'l~::'.~~~l(o'I,"',!>!!~,!.'~~~.:"~(:~i!_:"';'7:;;'

~

=o2/n =02/650 .

:1. .'

~~

.,:' Esta varianza es la misma que la de la media muestral porque 0,01 no :1 : cambia (tiene una varianza cero) en las diferentes muestras. Del mismo ;1 tmOdo, se calcula la varianza de e como sigue 15: ~ ~..~.I

=

E(~ t Y) - E(O,Ol)n

i',~,

V( e)

=

v( Y1

1

+ Y2) 2 .

~

'1 J'J;1

= .L - 0,01

l 1es~

= -

41

[V(Y1) + V(Y2)]

1J

4.1

Tambin podemos indicar, mediante timador e no est sesgado:

un clculo similar, que el segundo

~.

" 202,j

" ~1;~,

=-

4= 02/2

\

d

lE

~ 2!m~~,11

Ll:IU~~cs:.~~~;::.~'E"'::;;",!"""""'",."':;;,;:~,,,~~~~~s.;a;;:,,;~':X~r:r:"1!Z'=-;;~..rr.::;:~~~~.m:..~~!:'.:lT~.:.:..tt.'3!lE~~

83,~,'l'~'~~

~.~ 'lisr:

=-~=~~"..~~~=~=,~..::...--c:.~~:.:..:..~~~_~~_

e

~lB ::)

lr~.'.~s-~ :~ac;nn

3-;C':1l. ~~~=:"~'::;l:!,,::r-~.. .,~~O.'::>.~'I!.~>..::-::-'!-_'~.;.;.-;:..:.:t...;;::;:::.:.",.:,~,.;,._.:::;-"'-:~ ~.,{!.,.'" .~. _-t;;.t~~":d~~~';;"~. 'C" ....

... '~T~:t;flt:17~ . ::~r:::~-;,;; .; C1.-~:.. ':z..;;.-:;"~---'~.;.~~":=_,~~,,:",:;,:,,,:,,',.,~;''-.o_':i:::>.~~.;:,-l>.-':;;:J.>.~,,e'tl!~la:.:l"""';;;;l;i

,m;',O,l;>t, .i.!.l'::'!'!."itf!!'.' :,,,::.~~'!'A":-;;::.71ii":,~:::"::s.H;';','f'BZlIrz=xl~~~~,:'m'M'I!S:~~i.~~~~""':!;".,;;Z"a:>n:;;:;:.!:;;.;_'Y..:K'.'l:.\.t:;~.!Z"~~,'Q!;'2.:.;.c~",~_""~!!,,~~j::I.:_~;:a.."'9'"J

Supongamos que nos interesa saber si el Partido Demcrata va a ganar las prximas elecciones presidenciales en los Estados Unidos y que preguntamos a 20 estadounidenses adultos elegidos al azar a qu partido piensan votar (en este sencillo ejemplo de seieccin aleatoria elegimos a los encuestados entre todos los estadounidenses adultos y cada uno de ellos tiene las mismas posibilidades de ser seleccionado). Supongamos que alguien ha realizado un estudio similar con 1,000 ciudadanos; acaso tendramos que incorporar esas observaciones adicionales a las nuestras para constituir una nica estimacin que se basara en 1.020 encuestados? Si las nuevas observaciones hubieran sido seleccionadas aleatoriamente, al igual que las primeras veinte, sera fcil decidir incorporar esos datos a los nuestros: con las nuevas observaciones el estimador sigue sin estar sesgado y ahora es mucho ms eficiente, Sin embargo, supongamos que slo 990 de las 1.000 nuevas observaciones fueran resultado de una seleccin aleatoria de la poblacin de Estados Unidos y que las otras diez fueran congresistas demcratas que hubieran sido incluidos, sin querer, en os datos, despus de haberse hecho la muestra aleatoria. Supongamos adems que nos damos cuenta de que se han incorporado dichas observaciones a nuestros datos pero que desconocemos cules son y que, por tanto, no podemos elirninarlas. Ahora sabemos que,

1~