- Condicionamiento instrumental
-
En psicología, el condicionamiento instrumental es una forma de aprendizaje en la que la consecuencia (el estímulo reforzador) es contingente a la respuesta que previamente ha emitido el sujeto, regulando su posterior probabilidad de ocurrencia. El vocablo, introducido por Edward Thorndike, sugiere que la conducta sirve de "instrumento" para conseguir un fin. El nombre que B.F. Skinner dio posteriormente a este tipo de aprendizaje fue condicionamiento operante, elegido porque implica que la conducta simplemente "opera" sobre el medio sin alusión a intenciones, a diferencia del término "instrumental", cuyo significado no dejó satisfecho a Skinner. Fue él precisamente el primero en distinguir entre este tipo de condicionamiento y el condicionamiento clásico.
Contenido
Distinción entre condicionamiento clásico y operante
- En el condicionamiento clásico la asociación se da entre un estímulo condicionado y uno incondicionado. En el condicionamiento instrumental, la asociación se da entre las respuestas y las consecuencias que se derivan de ellas.
- En el condicionamiento clásico, el estímulo incondicionado no depende de la respuesta del sujeto, mientras que, en el operante, las consecuencias dependen de la respuesta del sujeto.
- En el condicionamiento clásico, la respuesta del sujeto es involuntaria, mientras que en el instrumental es generalmente voluntaria.
La distinción entre ambos condicionamientos para los conductistas más radicales es tanto operativa como de procesos:
- Operativa, ya que el reforzador depende de la respuesta, de la conducta, por tanto.
- Procesual, estando implicado en un caso el sistema nervioso autónomo y en el otro el sistema nervioso central. Esta diferencia no ha sido demostrada experimentalmente.
Estímulos
Lo verdaderamente importante en este tipo de condicionamiento es la respuesta generada ante el estímulo. Cualquier proceso de condicionamiento instrumental admite el uso de estímulos que en condicionamiento pavloviano podrían clasificarse como condicionados, incondicionados o neutros, ya que el análisis no se concentra en ellos sino en las consecuencias de las respuestas, que son las que determinan la probabilidad de que la conducta se repita o no.
En el condicionamiento instrumental los estímulos incondicionados se usan igual que en el pavloviano. El estímulo incondicionado (EI) es el resultado que sigue a la respuesta (por ejemplo comida, descargas eléctricas...)
También se usan estímulos condicionados (EC), estímulos relativamente inocuos sin significado o poder específico, al menos al comienzo del entrenamiento.
El estímulo discriminativo es un estímulo neutro que indica cuándo la respuesta puede conducir o no a la consecuencia deseada. Es decir, el estímulo discriminativo indica si el reforzador está disponible. Por oposición, el estímulo delta es el estímulo que no estuvo presente cuando la respuesta fue reforzada, y por lo tanto no da información sobre la disponibilidad del reforzador.
Respuestas
La respuesta incondicionada (RI) es la provocada por el EI de forma refleja y que viene determinada por él.
La respuesta condicionada (también llamada respuesta instrumental) suele ser distinta a la RI, siendo bastante arbitraria.
Fases
Las fases de un experimento de condicionamiento instrumental son esencialmente las mismas que en el caso del condicionamiento clásico:
- Adquisición
- Extinción
Programas de reforzamiento
Un programa de reforzamiento es una regla sobre la administración del reforzador. Existen programas de reforzamiento de dos tipos: de razón (en función de la respuesta) y de intervalo (en función del tiempo), y cada uno admite una administración fija o variable.
- En un programa de razón fija se administra un reforzador cada cierto número de respuestas. Un programa RF1, por ejemplo, da un reforzador por cada respuesta. El RF2 da un reforzador por cada dos respuestas.
- El programa de razón variable administra reforzadores cada cierto número de respuestas. Pero en este caso, este número no es fijo, sino que varía alrededor de un promedio. RV3 da una respuesta cada 2, 3 ó 4 respuestas, aproximadamente (y aleatoriamente).
- Un programa de intervalo fijo implica un período siempre igual durante el cual no hay disponibilidad del reforzador, período que se inicia justo después de la presentación de la respuesta criterio (es decir, aquella de interés). El hecho de que el sujeto emita o no respuesta alguna durante el transcurso del intervalo no modifica el ritmo de administración de los reforzadores.
- El programa de intervalo variable hace que el período durante el cual no está disponible el reforzador cambie alrededor de un promedio.
Por lo general, los programas de tasa (razón) producen una adquisición más rápida, pero fácilmente extinguible una vez suspendida la administración de reforzadores; y los de intervalo producen una adquisición más estable y resistente a la extinción.
Tipos
Existen cuatro procedimientos o tipos de condicionamiento instrumental:
- Condicionamiento de recompensa o Reforzamiento positivo: Es un tipo de condicionamiento que provoca una conducta que se obtiene a través de un refuerzo positivo. Premio que incrementa la probabilidad de que la conducta se repita. Un ejemplo, es cuando tus padres te dicen que te van a comprar una bicicleta, si apruebas todas las asignaturas.
- Entrenamiento de omisión: Forma de castigo que consiste en retirar el estímulo positivo de una conducta. El objetivo de la omisión es provocar la extinción de la respuesta. Un ejemplo podría ser cuando un profesor deja de calificar con buenas notas las respuestas memorísticas en los exámenes, de este modo, se extinguiría la conducta de estudiar de forma memorística.
- Castigo: Consiste en la presencia desagradable. Skinner castigaba a sus ratas con una pequeña corriente eléctrica, cuando estas pulsaban la palanca.
- Escape y [[evitación] o Reforzamiento negativo] (Aunque distintos, ambos se consideran dentro del mismo procedimiento, ya que ambos implican la no ocurrencia del estímulo incondicionado aversivo.): Es necesario que la persona reciba un estímulo negativo constante y que se pueda eliminar, tan sólo, con una conducta. Por ejemplo, un niño al ver golosinas se pone a llorar para que su madre le compre. La madre al ver las quejas del niño decide comprarle al niño esas golosinas para que se calle.
Bibliografía
Campos, L. (1972). Diccionario de Psicología del aprendizaje. México: Editorial Ciencia de la Conducta.
Wikimedia foundation. 2010.