complemento a: pavlov y skinner -...

Complemento a: Pavlov y Skinner

Prof. Eddie Marrero

Historia de la Psicología

Depto. Ciencias Sociales

UPR,Mayaguez

Aprendizaje porCondicionamiento Clásico (CC)

Introducción

Pavlov: estudia el proceso de salivación como parte de la digestión� Experimentos fisiológicos con mediciones

y control sistemático

� Resultados inesperados

� De problema a empresa investigativa y formulación teórica: es posible aprender a emitir respuestas reflejas ante estímulos no naturales

Conceptos Básicos

Repuesta refleja natural o incondicionada - es una respuesta automática, no aprendida (natural) que se emite ante estímulos naturales específicos.

� Ej. comida en la boca – salivar

En este caso se dice que la respuesta de salivar es natural ante el estímulo de la comida, a sea, que esa respuesta no es aprendida.

Conceptos Básicos (cont.)

Según la teoría, lo que se puede es aprender a salivar ante estímulos no naturales.

Ej. El sonido de una campana

Esto es posible pareando el estímulo no natural (o condicionado) con el estímulo natural o incondicionado (Ej. parear sonido de la campana y comida).

Con el tiempo, se saliva solo de oír la campana. En este caso se dice que la respuesta de salivar es una respuesta condicionada o sea, aprendida

Tipos de pareos entre EI - EC

Demorado – el EC se presenta ligeramente

antes que el EI; por un momento coinciden y

luego se deja de mostrar el EC.

Este es el tipo de pareo más efectivo porque

el EC se convierte en un anticipador del EI.

EC

EI=====>RI


Simultáneo - se presentan simultáneamente el EC y el EI.

Este tipo de pareo es menos efectivo que el demorado.

La fuerza del EC es menor porque queda opacado por el EI.

Al ser simultáneos el EC no sirve para predecir el EI.

EC

EI ====> RI


de huella - En este se presenta el EC primero y luego el EI.

Entre el primero y el segundo se deja pasar algún tiempo, de manera que no coincidan.

Este tipo de pareamiento tiene muy poco efecto

EC

EI =====> RI


Retrospectivo - La presentación del EC se hace después del EI.

Con este tipo de pareo no se logra aprendizaje alguno.

EI =======> RI

EC

Otros conceptos relacionados

Generalización - La respuesta condicionada se emite

ante estímulos que se parecen al EC (Ej. campana -

timbre)

Discriminación - La respuesta condicionada se emite

ante ciertos estímulos pero no ante otros (Ej. elipses

vs. Círculos y neurosis experimental)

Extinción - La respuesta condicionada desaparece

por razón de que cesa el pareamiento entre el EC y

el EI. Hay técnicas para lograr la extinción que se

aplican en psicoterapia

Otros conceptos relacionados

Recuperación espontánea - Luego de haberse

logrado la extinción es posible que la repuesta

condicionada reaparezca.

� Si por casualidad esa reaparición esta acompañada del EI la

extinción se hace posteriormente más difícil.

Condicionamiento de segundo orden: Es cuando un

EC sirve de base para una nueva respuesta

condicionada.

� Ej. El perro puede aprender a salivar ante el sonido de la

campana y hasta de solo ver la campana.

Aversión Gustativa

Es una situación de condicionamiento clásico

particular en la que un solo evento resulta suficiente

para producir la RC.

La respuesta es una de nauseas, mareos y vómitos

ante una comida que puede haber estado dañada o

que no es compatible con el organismo.

Luego, la reacción aversiva puede surgir de solo ver,

oler, probar o imaginar la comida en cuestión.

� Presentar ejemplos

Aprendizaje por CondicionamientoOperante (CO)

Introducción

No todas nuestras conductas se basan en respuestas reflejas como es la base del condicionamiento clásico.

De hecho, la mayor parte de nuestras conductas parecen ser producto de nuestra voluntad (Ej. levantarnos para ir a la universidad, tomar o no un taxi que nos lleve, copiar o no lo que se dice en clase, por mencionar solo algunos ejemplos sencillos).

La pregunta fundamental es: ¿cómo adquirimos y mantenemos los diferentes patrones de conductas que llevamos a cabo día a día?

Para los llamados “conductistas” adquirimos y preservamos todas nuestras conductas como resultado de las consecuencias ambientales de los mismos. Examinemos esta idea.

Trasfondo histórico:

Experimentos de Thorndike

Trasfondo histórico:

Experimentos de Thorndike

Explicar sus experimentos con gatos:

� el concepto de jaula – problema

� los comportamientos exitosos tienden a repetirse

� el gato pasa más tiempo cerca de la salida

� presiona en diferentes lugares con su pata a ver

que efecto tiene

� luego de varios días su conducta dentro de la

jaula se limita a aquellas acciones más efectivas

para salir de la misma

La ley del efecto

En un determinado ambiente, aquellas

conductas o respuestas que sean

seguidas de consecuencias

beneficiosas tenderán a repetirse,

mientras que aquellas respuestas que

no tengan consecuencias alguna o

consecuencias desfavorables tenderán

a no repetirse.

El conductismo según

expuesto por B.F. Skinner:

Conceptos fundamentales

Respuesta (Re)- Cualquier conducta que lleva a cabo un

organismo en un determinado ambiente ya sea por casualidad o

inducido a hacerlo

Refuerzo (Rf)- Cualquier evento ambiental que aumenta la

probabilidad de que una conducta se repita

Estimulo discriminativo (Ed)- Cualquier evento ambiental que

este dentro de las capacidades preceptúales de un organismo y

que le sirve de señal para emitir una conducta.

Respuesta operante (Ro) - Cualquier conducta cuya expresión

ha quedado bajo el control de un estimulo por causa de un

refuerzo


De lo anterior se puede construir el siguiente algoritmo:

Ed -------> Ro

Rf

el cual puede ser leída de la siguiente forma: nuestras conductas se producen ante determinados estímulos por causa de un refuerzo. O dicho de otra forma, todos nuestros comportamientos consistentes se expresan ante determinadas señales porque han sido reforzados.


Lo más importante del algoritmo señalado es que permite: explicar, predecir y controlar. Por ejemplo, permite decir que una determinada conducta se expresa en un determinado momento por causa de un refuerzo. Además, si quiero controlar la expresión de la conducta debo presentar el estimulo discriminativo; si esta presente el estimulo discriminativo puedo predecir la aparición de la respuesta. También, si tengo control del refuerzo puedo controlar la conducta ya sea para que se manifieste o para eliminarla (eliminando el refuerzo). Parece complicado… y lo es!


Al modelo de condicionamiento operante

también aplican los conceptos de:

� generalización

� discriminación

� extinción

� recuperación espontánea

Explicar estos conceptos con el ejemploclásico de la caja de Skinner

Programas de refuerzo

Se refiere a la manera en que se puede administrar el refuerzo

respecto a la conducta deseada.

Los programas de refuerzo se dividen a base de tiempo

(intervalo) o de cantidad (razón) y si son fijos o variables. La

combinación de cada categoría da como resultado cuatro

programas de refuerzo

Fijo Variable

Intervalo x x

Razon x x


Intervalo fijo - aquí el refuerzo se da luego de transcurrido un

tiempo fijo tras emitir la respuesta. Por ejemplo:

� 2.5 horas de trabajo, 15 minutos de receso.

� Otro ejemplo: 2 horas de estudio, 2 horas de descanso

(incluyendo juego o TV).

Intervalo variable - El refuerzo se da tras espacios variables de

tiempo luego de manifestarse la conducta. Por ejemplo:

� 15 minutos de estudio, media hora de juego; otro día, media

hora de estudio, media hora de descanso (la cantidad de

tiempo de estudio se refuerza de manera variable)


razón fija - El refuerzo se da luego de ocurrir la conducta un

número fijo de veces. Por ejemplo:

� 12 piezas terminadas, se paga por las mismas.

� Otro ejemplo: aprendizaje asistido por computadoras: se

refuerza cada vez que el aprendiz conteste correctamente.

razón variable - El refuerzo se da luego de ocurrir la conducta

un número variable de veces. Por ejemplo:

� las tragamonedas: el refuerzo (ganar) se produce luego de

un numero variable de veces de repetirse la conducta

(jugar), a veces gana a los 3 intentos, luego a los diez, luego

a los 2, luego a los 15, luego a los 30, luego a los 2 y así

variablemente.


Cada programa de refuerzo resulta mas

practico para distintas circunstancias. Sin

embargo, en términos generales podemos

decir que los programas variables producen

conductas mas difíciles de extinguir ya que

suscitan el fenómeno "expectativa", esto es,

continuar repitiendo la conducta esperando

que “en algún momento” el refuerzo aparezca

Refuerzo Primario y Secundario

Refuerzo primario - Es aquel que adquiere su capacidad de actuar como refuerzo por estar directamente relacionado a la satisfacción de las necesidades naturales del organismo (ej. alimento, contacto, afecto)

Refuerzo secundario - Es aquel que adquiere su capacidad de fungir como refuerzo porque el organismo lo ha relacionado con la adquisición de refuerzos primarios. Porejemplo: el dinero.

Refuerzo negativo

En términos básicos, se define el refuerzo negativo como aquella situación en que la remoción de algoaumenta la probabilidad de que ocurra una conducta. Por ejemplo: � una “campana” suena y no cesa hasta que se pone el cinturon

� digamos que un profesor establece que la evaluación de un curso se hará basado en la calificación obtenida en 4 exámenes de los cuales 3 son parciales y uno es final general. Luego, establece la siguiente condición: si al momento del final su promedio en la clase es de sobre 90%, pues esta eximido de tomar el final. Así, la potencial remoción del final aumentara la probabilidad de que ocurra la conducta de “estudiar intensamente”.

� Pague antes del 15 de abril y evite recargos y penalidades

Refuerzo negativo

El refuerzo negativo se diferencia del refuerzo positivo en que en el refuerzo positivo se da algo mientras que en el negativo se quita algo. Sin embargo, en ambos casos lo que se da o lo que se quita, tiene como consecuencia aumentar la probabilidad de que una determinada conducta se repita.

Esto diferencia al refuerzo negativo del castigo.

El castigo

En términos generales podemos decir que el castigo

reviste dos cualidades principales (que a su vez lo

diferencian del refuerzo positivo y del negativo).

� Primero - El castigo es en si un evento que resulta

desagradable (doloroso, lastimoso) a quien lo

recibe.

� Segundo - El propósito fundamental del castigo es

evitar que una conducta se repita; o sea que, el

castigo no incentiva conductas sino que quiere

reprimirlas.

El castigo

Dentro del condicionamiento operante (básicamente skinneriano) no se recomienda el castigo como estrategia de modificación de conducta porque el mismo puede tener efectos secundarios no deseados; entre ellos:

� No siempre queda claro cual es la conducta que se quiere reprimir.

� Como resultado de lo anterior puede suceder que se repriman otras conductas que no son supuestamente las deseadas (Ej. un padre castiga a su hijo porque interrumpe sus conversaciones, como resultado el hijo se desarrolla como una persona poco comunicativa).

� No necesariamente deja claro cuales son las conductas alternas que se quieren promover (pues las mismas no se están reforzando).

� Puede promover la conducta violenta y agresiva.

� La conducta se evita solo en presencia de quien castiga

complemento a: pavlov y skinner -...

Documents