tema 4 aprendizaje.pdf
DESCRIPTION
TEMA 4 APRENDIZAJETRANSCRIPT
-
PSICOLOGIA APRENDIZAJE ADELINE TEMA 4 2014
1
TEMA 4: PRINCIPIOS BASICOS DEL CONDICIONAMIENTO OPERANTE
Palabras claves: CASTIGO, ENTRENAMIENTO DE OMISION, CLASE DE ESTIMULO, CLASE DE RESPUESTA, CONDUCTA SUPERSTICIOSA, CONTRASTE CONDUCTUAL, CONTROL POR EL ESTIMULO, DERIVA INSTINTIVA, DEVALUACION DEL REFORZADOR, INDEFENSION APRENDIDA, ESCAPE, EVITACION, EXTINCION, MARCADO, REFORZAMIENTO
POSITIVO
I ANTECEDENTES HISTORICOS Teora evo : variacin y seleccin tb se aplican al comportamiento. Darwin
Lo plantea en Skinner The Behavior of Organisms
Reforzador como elemento seleccionador
A THORNDIKE Y LA LEY DEL EFECTO Primer en estudiar CO, lo llam aprendizaje por ensayo-error
Conexin E-R se fortaleza si satisfaccin del animal => CONEXIONISMO
Paradigma / Concepcin hedonista E-R
Cajas problemas: medida de latencia de escape
Ley del Efecto: las respuestas que van acompaadas o inmediatamente seguidas de satisfaccin se
conectaran ms firmemente con la situacin, de manera que cuando sta vuelva a presentarse, volvern
las R con ms probabilidad.
ENSAYO DISCRETO
B ANALISIS EXPERIMENTAL DEL COMPORTAMIENTO DE SKINNER Reflejos se pueden estudiar como conductas: conducta se regula tanto por C respondiente (reflejos) que CO
Relaciones funcionales entre conducta / consecuencias.
OPERANTE: cap del indiv para operar sobre su ambiente
INSTRUMENTAL: conducta como instrumento para obtener el reforzador
Introdujo innovacin: respuesta que sujeto pueda ejecutar repetidamente sin intervencin experimentador
Caja de Skinner: medida de tasa de respuesta
OPERANTE LIBRE
II DEFINICION DE CONDICIONAMIENTO OPERANTE Conductas operantes resultados de las consecuencias que han tenido en el pasado (# estmulos que las
provoquen) => son (# Elicitadas) EMITIDAS
= proceso que da lugar a que la proba de una respuesta se vea modificada por sus consecuencias CO
Organismos aprenden a obtener consecuencias favorables / eliminar desfavorables. Puede dar lugar a aparicin de respuestas nuevas
A LA CONTINGENCIA DE TRES TERMINOS Contingencia respuesta/reforzador/estimulo (consecuencia depende presentacin respuesta).
En presencia de un especifico, el se presentar si y solo si la ESTIMULO REFORZADOR RESPUESTA
operante sucede.
-
PSICOLOGIA APRENDIZAJE ADELINE TEMA 4 2014
2
1 ESTIMULO DISCRIMINATIVO
NO provocan aparicin respuesta sino que de un reforzador potencial si se ejecute la sealan la presencia
conducta (informa al sujeto de cuando ha de responder).
: reforzar una operante en una situacin pero no en otra. Reforzamiento DIFERENCIAL
Las consecuencias de las RO establecen el control que ejercen los ED.
Si consecuencia => reforzada, proba operante apetitiva aumenta
Si consecuencia reforzante => (E), proba no hay Estimulo Delta disminuye
CONTROL POR EL ESTIMULO: E precedentes de una conducta pueden controlar su ocurrencia.
2 RESPUESTA
Se define por los efectos que provoca en el ambiente (FUNCION y no forma)
Si una respuesta produce mismo efecto que otra, hablamos de la misma operante.
La conducta puede tener # topografas que tienen la misma funcin.
CLASE DE RESPUESTA: cualquier forma de ejecutar conducta con funcin similar.
3 REFORZADOR
Se define en funcin de los efectos que tiene sobre la conducta.
Cualquier suceso o evento que, al hacerse contingente con una respuesta, cambia su proba de aparicin
en un futuro.
a REFORZAMIENTO CONDICIONADO
Conducta humana controlada por eventos cuyos efectos . dependen de la historia de reforzamiento
REFORZAMIENTO CONDICIONADO o SECUNDARIO: un estmulo originalmente no reforzante adquiere cap
de reforzar mediante asociacin repetida con otro previamente reforzante.
Resultados expe contradictorios: con procesos de extincin, los reforzadores condicionados pueden perder
rpidamente su efectividad. Pero resultados no concluyentes acerca de la duracin del RefC.
B ACLARACIONES
1 REFORZADOR REFORZAMIENTO
Evento = (si consecuencia apetitiva), (si consecuencia aversiva) reforzador castigador
Proceso = (si aumenta proba) / (si disminuye proba) reforzamiento castigo
2 RESPUESTA DISCRETA OPERANTE LIBRE
: una respuesta por ensayo, VD = Ensayo discreto requieren mucho trabajo y tiempo. latencia,
: emisin respuesta ilimitada, VD = Operante libre , sin manip expe. tasa resp
3 TOPOGRAFIA FUNCION
: propiedades o caractersticas fsicas (secuencia de movimientos) Topografa o forma de respuesta
Est relacionada con las contingencias de reforzamiento (consecuencias R pueden modif su forma)
Control del reforzador puede estar limitado por topografa.
: relacin respuesta con estmulos antecedentes y las consecuencias de las misma. Funcin
4 INSTANCIA DE RESPUESTA Y CLASE DE RESPUESTA
: todas las formas en las que la ejecucin de una conducta puede llevar a funcin similar. Clase de respuesta
: unidad mnima de conducta, ocurrencia particular y especfica de resp. Instancia de respuesta
5 INTERACCIONES CLASICAS Y OPERANTES EN CONTROL CONDUCTA
CC = pasivo CO = activo
Para reforzar o castigar conducta es necesario su ocurrencia.
-
PSICOLOGIA APRENDIZAJE ADELINE TEMA 4 2014
3
Para hacer aumentar una conducta de baja ocurrencia, podemos usar el (CC AUTOMOLDEAMIENTO
apetitivo excitatorio: una vez que EC (luz por ej.) provoca resp, se somete a control operante
haciendo que el EI solo se presente si se ejerce accin con la ocurrencia del EC, que se convierte en
ED).
Ciertas respuestas inicialmente CC pueden posteriormente caer bajo control operante.
Por qu esta relacin?
Acontecimientos ambientales actan sobre sistemas neurofisio de forma global y no uno concreto.
Pero neurobio, ambos tipos de aprendizaje podran estar mediados por # meca al nivel celular.
III PROCEDIMIENTOS BASICOS DEL CO : los que tienen un patrn temporal identificables, bajo condiciones Procesos conductuales reproducibles
objetivamente especificadas, y reproducibles en diferentes individuos.
CONTINGENCIA POSITIVA: cuando respuesta es seguida de consecuencia
CONTINGENCIA NEGATIVA: cuando respuesta elimina o previene consecuencia
A AUMENTAR CONDUCTAS: REFORZAMIENTO POSITIVO, ESCAPE Y EVITACION REFORZAMIENTO POSITIVO o ENTRENAMIENTO DE RECOMPENSA
Cuando consecuencia apetitiva contingente con respuesta => aumento fuerza respuesta
Se puede emplear el moldeamiento o mtodo de aproximaciones sucesivas para conseguir
establecer la respuesta.
ESCAPE Y EVITACION = eliminacin o detencin de un evento aversivo => aumento fuerza de respuesta Escape = impide el suceso de un evento aversivo Evitacion Procedimientos de REFORZAMIENTO NEGATIVO
B DISMINUIR CONDUCTAS: CASTIGO Y ENTRENAMIENTO DE OMISION CASTIGO O CASTIGO POSITIVO
Cuando consecuencia aversiva contingente con respuesta => disminucin fuerza respuesta
Para poder castigar una respuesta antes ha tenido que ser reforzada
ENTRENAMIENTO DE OMISION O CASTIGO NEGATIVO
Cuando se elimina o previene consecuencia apetitiva => disminucin fuerza respuesta
EFECTOS COLATERALES DE LOS PROCEDIMIENTOS AVERSIVOS
El control aversivo de hacer que disminuyan las conductas no es una forma fiable
Tiene que no impiden que en un futuro la conducta vuelva a ocurrir efectos emocionales
Se puede y dar lugar a que se inhiban las conductas deseables asociar con otros E
Asociacin con castigo quien ejecuta
-
PSICOLOGIA APRENDIZAJE ADELINE TEMA 4 2014
4
C LA EXTINCION EN EL REFORZAMIENTO POSITIVO Procedimiento: cuando respuesta previamente reforzada se deja de reforzar.
Da lugar a disminucin frecuencia o intensidad de la respuesta y disminucin gradual de su ejecucin.
Existe RECUPERACION ESPONTANEA
Fenmeno del : aumento de la tasa de resp al dejar de presentar reforzador. ESTADILLO DE EXTINCION
de la respuesta: aumenta oportunidades para reinstaurar reforzamiento. AUMENTO DE LA VARIABILIDAD
Tras la extincin => frustracin que da lugar a (agresin) RESPUESTAS EMOCIONALES INCONDICIONADAS
La tasa de respuesta durante sesiones de extincin = ndice de la RESISTENCIA A LA EXTINCION.
Las que hayan sido reforzadas en pocas ocasiones (parcial/intermitente) se extinguen de forma lenta
Las que hayan sido reforzadas muchas veces (continuo) resisten menos a la extincin
EFECTO DEL SOBREENTRENAMIENTO EN LA EXTINCION
EFECTO DE REFORZAMIENTO PARCIAL explicado por procesos de . generalizacin y discriminacin
Discriminacin entre reforzamiento y extincin ms fcil y rpida si reforzamiento continuo
Generalizacin de situacin de reforzamiento intermitente a la de extincin
Contacto con las contingencias (ms inmediato en caso de reforzamiento continuo)
: reforzamiento parcial da lugar a que resultado aprendizaje sea esperar Teora de la frustracin
ausencia de reforzamiento / continuo: no hay nada que motive sujetos a seguir emitiendo
respuestas
Otras variables que influyen en la persistencia de la respuesta:
MAGNITUD DEL REFORZADOR: si alta y continua, disminuye la resistencia (# intermitente)
INMEDIATEZ DE LA RECOMPENSA: si demora baja, aumenta la resistencia
OLVIDO: con el tiempo la conducta disminuye.
Extincin: posibilidad de emitir respuesta sigue disponible # olvido
Es un aprendizaje nuevo
: disminucin del control que las claves contextuales tienen sobre la Recuperacin espontanea
conducta con el paso del tiempo.
: recup respuesta extinguida en Renovacin contexto diferente al de extincin
: cuando vuelves a situar sujetos Restauracin en contexto original de la extincin
: Restablecimiento de la fase de adquisicin => exposicin no contingente con el reforzador
reaparece la conducta extinguida sin que sta d lugar al reforzador.
IV FENOMENOS DEL CO
A CONDUCTA SUPERSTICIOSA Experimento de la supersticin de : Skinner reforzamiento accidental.
Palomas tenan pautas de comportamiento que parecan indicar que su conducta controlaba un
reforzador entregado sin contingencias.
REFORZAMIENTO ACCIDENTAL / ADVENTICIO: la alta proba de ocurrencia de esta conducta le
confiere una alta proba de ser reforzada en el futuro.
: otra interpretacin con registro ms minucioso. Staddon y Simmelhag
: las que tienen lugar en Conductas de INTERIN medio del intervalo
: las que ocurren Conductas TERMINALES y prximas en el tiempo a la aparicin al final del intervalo
del reforzador
No vara entre los animales: son simplemente respuestas emitidas de forma innata cuando proba de
reforzamiento es baja.
La entrega de comida parece influir solo en las respuestas terminales, no relacionado con
reforzamiento accidental.
-
PSICOLOGIA APRENDIZAJE ADELINE TEMA 4 2014
5
Algunas conductas supersticiosas estaran explicadas por el y otras por reforzamiento accidental de Skinner mecanismos que tendran que ver con . conductas innatas
Es ms probable que desarrollen conductas supersticiosas las personas que tienen gran necesidad de control Herrstein
Supersticiones (expe propia anterior) idiosincrticas Supersticiones sociales tpicas
B DERIVA INSTINTIVA Y RELEVENCIA EN CI Permite el CI condicionar de la misma manera cualquier tipo de respuesta? NO
entre respuestas y reforzadores: hay R que son ms difciles de condicionar RELEVENCIA o PERTINENCIA cuando se utilizan ciertos tipos de reforzadores.
: a veces surgen conductas tpicas de las especies que interfieran con las RO. Marion y Keller Breland DERIVA INSTINTIVA
C CAMBIOS EN CANTIDAD Y CALIDAD RECOMPENSA: CONTRASTE CONDUCTUAL CONTRASTE CONDUCTUAL: la efectividad de un reforzador puede verse modificada por la expe previa con el
mismo reforzador cuando ste es de magnitud o calidad diferente. (Todo es relativo!) Efecto Crespi
Estudio de : Mellgren
Contraste conductual POSITIVO o NEGATIVO
Puede tb depender del (+ o -) estado afectivo previo
D CONTROLABILIDAD CONSECUENCIAS AVERSIVAS E INDEFENSION APRENDIDA Cuando sumisin a situaciones en las que se tiene poco o ningn control.
: Seligman y Maier
Escape: emitiendo la respuesta requerida poda impedir la presentacin de descarga.
Acoplado (expe): conducta no tena consecuencias sobre descargas.
Confinado: misma situacin pero no reciba tratamiento.
Generacin de en grupo acoplado de que la en las expectativa conducta no tiene ningn efecto
: consecuencias negativas HIPOTESIS DE LA INDEFENSION APRENDIDA
El mejor tratamiento es ubicar sujeto en una situacin en la que es imposible fallar.
Se puede prevenir: una primera exposicin a descargas controlables es una inmunizacin que bloquea el
desarrollo de la indefensin aprendida cuando se presentan descargas inescapables.
-
PSICOLOGIA APRENDIZAJE ADELINE TEMA 4 2014
6
E EFECTOS DEMORA DEL REFORZADOR: EL MARCADO Demora del reforzamiento cuando existe un periodo de tiempo entre la respuesta y la entrega del reforzador
Puede disminuir, aumentar o no modificar la conducta en funcin de las circunstancias y de otros
parmetros.
Importante tener una lnea base estable antes de imponer una demora.
Considerarlo como . proceso dinmico
PROCEDIMIENTO DE MARCADO: presentar un E contingente a la respuesta convierte esa respuesta en un
evento significativo. Marcar la respuesta hace que esta se pueda diferenciar de otros eventos durante la
demora.
Si pasan por el brazo negro reciben una bolita de comida en la caja meta.
Para marcar los animales, se le trasladaban cogindolos del brazo a la caja de demora.
Para los animales del grupo control, solo se abra la puerta hacia la caja de demora, sin manip.
Los animales del grupo marcado mostraron mayor nmero de elecciones correctas (90%).
El marcado facilita el recuerdo en memoria
F DEVALUACION DEL REFORZADOR Se (sin contingencia con conducta). asocia el reforzador a un estmulo de naturaleza contraria
1 fase 2 fase 3 fase
Palanca A Sabor naranja Sin cambio Sin cambio
Palanca B Sabor fresa Emparejamiento con sustancia aversiva
Disminucin respuesta operante
Colwill y Rescorla
1 fase 2 fase 2 fase
Grupo expe Palanca = comida Cadena = agua
Inyeccin cloruro de litio Disminucin respuesta operante
Grupo control Palanca = comida Cadena = agua
Sin cambio Sin cambio
A veces se puede automatizar la conducta si practica masiva
: modificada por el valor de sus consecuencias Accin instrumental
no dependen del valor actual del reforzador Hbitos:
1 fase 2 fase Fase prueba
Grupo 1 100 RO reforzadas Inyeccin cloruro litio Disminucin RO
Sin inyeccin Sin cambio
Grupo 2 500 RO reforzadas Inyeccin cloruro litio Sin cambio
Sin inyeccin Sin cambio
Conductas compulsivas como bsqueda de droga (mas rigidas, menos deliberadas) dependeran de
mecanismos de aprendizaje diferentes.