Condicionamiento Operante: Experimentos de Skinner y Aprendizaje
Clasificado en Psicología y Sociología
Escrito el en español con un tamaño de 4,65 KB
Aprendizaje por Ensayo y Error
Las Cajas de Skinner
En el tipo de condicionamiento llamado operante o de ensayo y error, el sujeto no se limita a reaccionar ante unos estímulos, sino que debe utilizar su conducta para operar sobre el entorno.
El representante más famoso de esta corriente fue B.F. Skinner, inventor de las conocidas cajas de Skinner, diseñadas específicamente para el condicionamiento de animales. Estas cajas constaban de diversos mecanismos. Se introducía un animal en la caja y se observaba su comportamiento: al principio, el animal actuaba al azar y tocaba todos los dispositivos sin ninguna estrategia aparente. Sin embargo, al presionar una palanca determinada, se abría una compuerta y caía una porción de comida (refuerzo). Según aumentaba el número de ensayos, disminuía el número de pruebas al azar del animal hasta que, finalmente, aprendía a presionar la palanca solo cuando tenía hambre, prescindiendo de las demás conductas exploratorias.
Skinner dedujo que las leyes del aprendizaje animal son muy similares a las humanas. Esto le llevó a experimentar en áreas humanas, como la conducta social y lingüística, lo que provocó un gran rechazo en ciertos círculos intelectuales de la época.
Mecanismos para Modificar la Conducta según Skinner
Con el fin de modificar la conducta, Skinner identificó y utilizó los siguientes mecanismos:
- Refuerzos: Estímulo que aumenta la probabilidad de que una conducta vuelva a ser realizada. Pueden ser:
- Positivos: Se otorga una recompensa (algo agradable) después de que se ha llevado a cabo la conducta adecuada.
- Negativos: Se elimina o suprime algo desagradable para el organismo cuando el sujeto ha llevado a cabo la conducta deseada.
- Castigos: Estímulo que disminuye la probabilidad de que una conducta vuelva a ser ejecutada. Pueden ser:
- Positivos: Una conducta se acompaña de la presentación de un estímulo doloroso o desagradable para el sujeto.
- Negativos: Como resultado de una conducta, se retira o pierde algo agradable para el sujeto.
Es importante reconocer cuál es el estímulo discriminativo: aquel estímulo específico que señala al organismo cuándo su respuesta operante será reforzada.
Programas de Refuerzo
Los programas de refuerzo son técnicas diseñadas para que un organismo adquiera o abandone un tipo de conducta mediante la distribución estratégica de los refuerzos durante el proceso de aprendizaje. Es evidente que se consiguen mejores resultados y una mayor persistencia de la conducta si no se refuerzan todas las respuestas adecuadas (refuerzo continuo), sino solamente una parte de ellas (refuerzo intermitente). Los tipos principales de programas de refuerzo intermitente son:
- Programas de razón fija: Se administra el refuerzo después de un número fijo y predeterminado de respuestas adecuadas.
- Programas de razón variable: El refuerzo se entrega después de un número variable de respuestas, que fluctúa alrededor de un promedio establecido. Este promedio puede aumentar progresivamente.
- Programas de intervalo fijo: El refuerzo se administra por la primera respuesta adecuada que ocurre después de que ha transcurrido un intervalo de tiempo fijo desde el último refuerzo.
- Programas de intervalo variable: El refuerzo se administra por la primera respuesta adecuada después de un período de tiempo cuya duración varía aleatoriamente alrededor de un promedio. Como en los programas de razón variable, este promedio puede aumentar progresivamente.
Generalización, Discriminación e Indefensión Aprendida
Además de la adquisición de conductas, en el condicionamiento operante se observan fenómenos como la generalización (responder de manera similar a estímulos parecidos al discriminativo) y la discriminación (aprender a responder solo ante el estímulo discriminativo específico).
Un fenómeno relevante es la indefensión aprendida, que guarda ciertas similitudes con la depresión humana. Consiste en que, cuando un organismo experimenta que, haga lo que haga, no recibe ningún refuerzo o no puede evitar un castigo inevitable, deja de intentar aprender o escapar y adopta una actitud pasiva ante la situación.