18/1/08

CONDICIONAMIENTO OPERANTE


CONDUCTISMO II: CONDICIONAMIENTO OPERANTE

Autores:Jorge Ateca , Juan Fernández, Fidel Martínez,
José M. Ramos


ÍNDICE

1. Conducta instrumental:
- Introducción
- Primeras investigaciones
- Elementos fundamentales

2. Skinner. El condicionamiento operante.
- Introducción
- Ejemplo.
3. Clases de condicionamiento operante:
- Introducción
- Refuerzo positivo
- Refuerzo negativo
- Ejemplos
4. Programas de refuerzo:
- Tipos
- Ejemplos
5. Implicaciones educativas:
- Posiciones adoptadas por los profesores
- Técnicas para cambiar la conducta

CONDICIONAMIENTO INSTRUMENTAL
La conducta instrumental se da cuando al repetir una serie de consecuencias, el individuo lo generaliza y actúa como si fuera un acto reflejo, pero no se nace con él, sino que se aprende con la repetición.
Uno de los primeros conductistas fue Skinner, el cual, basa su teoría en el análisis de las conductas observables e hizo una división de conductas en dos partes:
1. Reflejas: Son conductas que se dan, automáticamente cuando aparece un estimulo, de forma inconsciente.
2. Operantes: Son conductas que se dan, en presencia de estímulos incondicionados.
Skinner creía que la mayoría de las conductas humanas eran operantes (estirar las piernas, cambiarse de silla, levantar la mano…) esto son conductas voluntarias y claramente observables.
El pensaba todo, esto porque según él, la mayoría de los actos reflejos eran aprendidos con anterioridad. (frenar cuando el semáforo esta en rojo) para el esto no es una conducta refleja porque tuvimos que aprender con anterioridad su significado.
Skinner piensa que las respuestas del ser humano son muy complejas y amplias, y que no pueden explicarse de manera tan sencilla como hace el condicionamiento clásico.
Primeras investigaciones del condicionamiento instrumental
Antes de Skinner había teorías que decían que las respuestas reflejas se pueden condicionar, como hizo Pavlov (con la reflexología) a partir de un estimulo neutro, más un estimulo incondicionado, si se repite varias veces, se consigue una respuesta incondicionada.
Watson (con el conductismo) parte de la base de Pavlov, Wundt… para él, el único aspecto importante de forma científica son las respuestas observables y rechaza la introspección y el método psicológico.
Elementos fundamentales del condicionamiento instrumental
a) La respuesta instrumental:
Reforzamiento de una respuesta existente: los participantes no tienen que aprender la respuesta comprendida en la tarea, sino la manera de cómo hacer la prueba.
La teoría de los sistemas de conducta, cuando a un animal se le priva de comida y se encuentra en una situación en que es posible hallar alimento, se activa su sistema alimentario. Se superpone un procedimiento de condicionamiento instrumental en este sistema de conducta. La naturaleza de otras respuestas que surgen durante el transcurso del entrenamiento dependerá de los componentes conductuales del sistema alimentario que se activen por medio del procedimiento de condicionamiento instrumental.
De acuerdo con el enfoque, podrían predecirse las respuestas que aumentarían con reforzamiento alimentario si se estudia lo que hacen los animales cuando se activa su sistema alimentario en ausencia de condicionamiento instrumental.
b) El reforzador instrumental:
La cantidad y la calidad de un alimento líquido son cambiadas varias veces de características. Los alimentos en la calidad y la cantidad del reforzador producen tasas más elevadas de respuesta. En las situaciones de operante libre, sin embargo, los efectos de la magnitud del reforzador son más complejos y dependen del programa de refuerzo utilizado, pero también de otros factores.
Las modificaciones en la calidad o la cantidad, los efectos de una cantidad y un tipo particular de reforzador dependen de la cantidad y calidad de los reforzadores que el individuo ha experimentado con anterioridad.

c) La relación de respuesta y reforzador:
Para una conducta instrumental eficaz, hace falta que haya relación entre respuesta y reforzador, esta relación consiste en realidad en dos factores independientes:
 La medición del tiempo entre la respuesta y el reforzador
 La causalidad, medida en que la respuesta instrumental es necesaria y suficiente para la presentación del reforzador.
Existen dos formas de facilitar el aprendizaje con reforzamiento demorado:
 proporcionar un reforzador secundario o condicionado inmediatamente después de la respuesta instrumental
 marcar la respuesta instrumental objetivo de alguna manera para hacerla distinguible de las otras actividades.

EL CONDICIONAMIENTO OPERANTE

Es una teoría psicológica del aprendizaje que explica la conducta voluntaria del cuerpo, en su relación con el medio ambiente, basados en un método experimental. Es decir, que ante un estímulo, se produce una respuesta voluntaria, la cual puede ser reforzada de manera positiva o negativa provocando que la conducta operante se fortalezca o se debilite. Esta teoría parte de la ley del efecto de Thorndike (las conductas placenteras tienden a repetirse y las dolorosas no). A partir de esta ley, formulo la suya propia del condicionamiento operante, diciendo: “Si a una conducta determinada le sigue un refuerzo, incrementa la probabilidad de que se emita esa conducta”.


Lo anteriormente dicho se puede explicar mediante el experimento de la caja de Skinner. Este siempre experimentó con animales. Pues bien, introdujo una rata en el interior de una caja, está dentro tenía una palanca que cuando se accionaba provocaba que cayera el alimento dentro de ella. La rata que había sido privada de alimento durante varias horas, primeramente se irá moviendo de un lado hacia otro de la caja picoteando y rasgando las paredes. En algún momento y por casualidad, la palanca será accionada por el animal, lo que provocará que en ese mismo instante caiga el alimento al interior de la caja. La rata repetirá la acción durante varias veces, hasta comprobar que el hecho de bajar la palanca le trae como recompensa el alimento. Por lo tanto esta acción la irá repitiendo con mayor frecuencia.
Con este ejemplo queda demostrada la ley del condicionamiento operante, y a que la rata al ver que al realizar la acción de bajar la palanca (conducta), le trae como consecuencia el alimento (refuerzo), por lo tanto se incrementa la posibilidad de que se siga emitiendo esa conducta.
CLASES DE CONDICIONAMIENTO OPERANTE
A continuación abarcaremos todo lo que se relaciona con las clases de condicionamiento operante.
Como estamos viendo, la palabra “refuerzo” es palabra clave en el planteamiento de Skinner, y este puede ser definido como el estímulo que al aumentar o desaparecer, aumenta la posibilidad de una respuesta. Entonces una serie de estas acciones refuerzan la conducta en un sentido positivo o negativo.

Los refuerzos se pueden clasificar teniendo en cuenta dos tipos de estímulos cualitativamente distintos, los estímulos positivos (recompensas) y los negativos (aversivos) y las diferentes posibilidades de relacionarlos con un comportamiento.

Refuerzo positivo

Este tipo de refuerzo provoca que la presencia de ellos aumente la posibilidad de una conducta, es decir, que añadir un estímulo al entorno trae consigo que esa respuesta aumente o se repita en el futuro.
El refuerzo positivo incorpora una conducta nueva, aumenta una existente o elimina una conducta inapropiada.

Distinguimos aquí:

- Apetitivo: Se ofrece un estímulo positivo a una persona en el momento en que realiza una conducta deseada.
- Omisión: Se retira el estímulo positivo ante la presencia de una conducta.

Ejemplos de condicionamiento positivo:
-Un alumno al finalizar su disertación de psicología, obtiene las felicitaciones del profesor y los aplausos objetivos de sus compañeros. Aquí las felicitaciones y aplausos son refuerzos positivos, ya al resultar gratificante para el alumno este refuerzo, su respuesta será estudiar con más dedicación aun, para el próximo trabajo.
-Si María le dice a Pedro que lo quiere mucho más después de haberle regalado chocolates, la consecuencia de la conducta de Pedro, será tan gratificante para él, que su conducta se verá reforzada a que aumente o se repita en el futuro.


Refuerzo negativo

Se llama refuerzos negativos al aumento de probabilidad de una conducta, como consecuencia de la omisión de un estímulo.
A diferencia del refuerzo positivo, aquí se omite o retira un estímulo que antecede a la respuesta o conducta, y como consecuencia aumenta dicha conducta.
La omisión de la respuesta o conducta no basta para que se refuerce negativamente la conducta, sino que será fundamentalmente que a través de la respuesta se elimine dicho estímulo de un entorno.
En resumen, el refuerzo negativo a través de la respuesta o conducta, elimina el estímulo aversivo que le precede, por lo tanto se da un incremento a la conducta que causo la eliminación o desaparición de este estímulo.
Hay ocasiones en que este tipo de refuerzos son interesantes para motivar a personas a realizar cosas que le resultan difíciles como; aceptar dinero no hará que un joven se zambulla en agua fría, pero el hecho de quedar o hacer el ridículo delante de sus amigos puede ser aversivo para que el sujeto desee eliminarlo y acepte el reto y termine realizando la conducta negada.

Distinguimos aquí:

- Condicionamiento de escape: Sucede cuando se aplica un castigo, es cuando se aprende a dar una respuesta que elimina o hace desaparecer una situación que resulta desagradable.
- Condicionamiento de evitación: Sucede cuando se eliminan o reducen estímulos que anteriormente han estado seguidos de estímulos aversivos.
- Condicionamiento de castigo: Consiste en presentar un estímulo aversivo o retirar un reforzador inmediatamente después de una conducta, disminuyendo o eliminando la probabilidad de repetición de dicha conducta. Existe la posibilidad que el individuo, según las condiciones del ambiente vuelva a reincidir en su conducta.

Ejemplos de condicionamiento negativo:
- Estudiar de manera responsable para pasar las asignaturas sin problemas y así eximirse de las pruebas de repetición. De manera clara se entiende que el refuerzo exime de la prueba, y la diferencia con el refuerzo positivo, es que aquí se esta eliminando (eximir de la prueba) algo del entorno.
- Una persona al presentar fuerte dolores de cabeza, toma algún analgésico que haga desaparecer esa molestia. Acá, el estimulo (dolor de cabeza) que antecede a la conducta, es eliminado tomando un analgésico.
- Aceptar un billete de dinero no hará que un joven se zambulla en agua fría, se pare sobre un par de patines, monte en motocicleta o se interne en una caverna, pero el ridículo ante sus amigos, lo que ellos pueden decirle a manera de insulto o evocando a la cobardía, puede ser lo suficientemente aversivo para que el sujeto desee eliminarlo y acepte el reto y termine realizando la conducta negada.
Programas de Refuerzo
Los programas de reforzamiento son “reglas”, que determinan cuando seguirá la entrega o presentación contingente de un reforzador a la presentación de una respuesta o conducta. Existen diferentes tipos de programas de reforzamiento, de los cuales, definiremos los más significativos.
PROGRAMA DE REFORZAMIENTO CONTINUO: Se llama a este tipo de programa, cuando el refuerzo es manifestado en cada momento de ser producida una respuesta. Ejemplo:-Cuando en una clase, un alumno levanta la mano para dar su opinión, el profesor pronuncia su nombre dándole la palabra.

PROGRAMA DE REFORZAMIENTO PARCIAL O INTERMITENTE:

Este reforzamiento se da cuando son reforzadas solo algunas de las conductas emitidas por el organismo, no todas. En la vida cotidiana, en el colegio, universidad, etc., se dan estos tipos de programas. Ejemplo:-Cuando llamamos a una persona por teléfono, y esa persona no se encuentra, la conducta no ha sido reforzada; no queriendo decir con ello que no ocurra la próxima vez.Según los experimentos realizados por Skinner, los programas de reforzamiento parcial, son bastante estables y mantienen la conducta por periodos más largos que los programas de reforzamiento continuo.Los programas de reforzamiento parcial o intermitente, pueden programarse teniendo en cuenta el número de respuestas o también el tiempo que transcurre. Por lo tanto hay que tomar en consideración:
Programa de razón
Programa de intervalo
PROGRAMA DE RAZÓN:

Estos programas consideran el número de respuestas antes de presentar un reforzador, es decir, el reforzador depende de la conducta del organismo en base al número de respuestas de este.Este programa se subdivide en dos:Razón fija: Que es cuando el reforzamiento se da cada vez que el sujeto cumple con un determinado número de repuestas que se ha establecido de antemano. Ejemplo:-Si se le dice a un vendedor, que por cada diez helados que venda, uno será para el, la razón fija será 10.Razón variable: los reforzamientos ocurren después de una cantidad variable de respuestas, no después de un número fijos. Esta cantidad difieren de reforzamiento en reforzamiento. Ejemplo :-Si al mismo vendedor se le dice ahora, en base a un establecimiento previo de la cantidad variable, que se le dará el reforzamiento (dar el helado) cuando venda el primer helado, el segundo reforzamiento le será dado cuando venda el tercer helado, el tercero cuando venda el cuarto y el cuarto cuando venda ocho. Así el valor de la razón variable se designa por el promedio de estas, (1-3-4-8) cuya suma seria 16 en este caso, siendo el promedio cuatro
PROGRAMA DE INTERVALO:

son aquellos que toman la cantidad de tiempo transcurrido antes de proporcionar el reforzador. Los programas de intervalo se definen en función del tiempo, pero se refuerzan en base a la primera respuesta que se obtiene luego de transcurrido el tiempo previsto; es decir, el reforzamiento, cualquiera que sea el programa seguido (de razón o de intervalo) siempre debe ser consecuencia de una respuesta. Existen dos tipos de programas de intervalo:Intervalo fijo: que son aquellos en donde se establece un intervalo, donde al término de este, se refuerza la primera respuesta que se emita.Intervalo variable: es cuando se establece un determinado intervalo variable, por ejemplo 2-4-7; y en donde se refuerza la primera conducta transcurrido el tiempo. Ejemplo : -Si el intervalo es 2-4-7 se reforzara la primera conducta transcurridos los dos primeros minutos, luego se refuerza la primera conducta pasados cuatro minutos y finalmente se reforzará la primera conducta pasados siete minutos. El promedio de estos será el valor del intervalo variable
Otros programas de reforzamiento:
PROGRAMA DE REFORZAMIENTO MULTIPLE:

Consiste de dos o más programas independientes, los cuales se presentan al organismo en forma sucesiva, cada uno de ellos en presencia de un estímulo característico. Los programas múltiples son programas combinados, en los que se agrega un estímulo discriminativo característico.
PROGRAMA CONCURRENTE:

Están formados, también, por dos o más programas. A diferencia del múltiple, los programas no son sucesivos, sino simultáneos; es decir, que el sujeto puede emitir dos respuestas distintas que se refuerzan simultáneamente por programas independientes, pero paralelos en el tiempo. Los reforzamientos previstos en cada programa son independientes entre sí. Este tipo de programa se utiliza cuando se desea reforzar más de una respuesta a la vez, como ocurre en los programas de conducta social.
PROGRAMA DE CONJUGADO O PROPORCIONAL:

En estos programas, se establece una proporción entre cierta medida de la conducta e cierta medida del reforzamiento. Por lo general, estas medidas están dadas por la frecuencia del reforzamiento, pero también pueden seguir propiedades tales como la magnitud de la respuesta y la magnitud del reforzamiento. En este programa, cuanto más responde el sujeto, más reforzamiento recibe, hay una proporción directa entre conducta y reforzamiento. La relación también puede ser inversa; dependiendo de los propósitos del programa. Es adecuado permitir al sujeto establecer el criterio de reforzamiento a través de la propia emisión de su conducta. Por ejemplo: si un niño realiza dos ejercicios de matemáticas, recibe un caramelo; si realiza cuatro, recibe dos caramelos, etc.


IMPLICACIONES EDUCATIVAS

Skinner al poner de manifiesto a través de su condicionamiento operante que la conducta humana es manipulable, logro que su teoría fuera introducida en la educación para el proceso enseñanza-aprendizaje.
Los educadores tienen una marcada influencia de la teoría conductista operante, ya que para ellos el comportamiento de los estudiantes es una respuesta a su ambiente pasado y presente, en la cual todo ese comportamiento es aprendido. Por lo tanto cualquier problema de conducta es el reflejo de los refuerzos que dicho comportamiento ha tenido.
Como la teoría de los refuerzos tiene que ver con el control de las conductas, los maestros deben proveer a los educandos un ambiente adecuado para el refuerzo de las conductas deseadas. Por consiguiente las conductas no deseadas que el alumno tenga en el aula, pueden ser modificadas utilizando los principios básicos del control de estas explicados anteriormente en el presente trabajo.
Las posiciones más comunes adoptadas por los profesores en los establecimientos, son las siguientes:
o Todo estudiante necesita ser calificado con notas, estrellitas, y otros incentivos como motivación para aprender y cumplir con los requisitos escolares.
o Cada estudiante debe ser calificado en base a los estándares de aprendizaje, que la profesora traza para todos los estudiantes por igual.
o El currículo debe estar organizado por materias de una manera cuidadosamente y en secuencia y detallado.
Algunas técnicas para cambiar las conductas no deseadas del alumno en el establecimiento serian:
· Refuerzo de las conductas deseadas, que de esta manera competirá con la conducta no deseada hasta reemplazarla por completo.
· Debilitar las conductas no deseadas eliminando los refuerzos de estas.
· La técnica de la "saturación" que implica envolver a un individuo en la misma conducta no deseada, de manera repetitiva hasta que el individuo se sienta hastiado del comportamiento.
· Cambiando la condición del estímulo que produce la conducta no deseada, influenciando al individuo a tomar otra respuesta a dicho estimulo.
· Usando castigos para debilitar a conducta no deseada.
Una de los más importantes aportes a la educación es cuando se aplica un aprendizaje programado. En donde la materia a impartir, se separa en partes simples y se empieza por ejemplo; preguntando cosas en que el alumno tiene conocimiento, ante cuya respuesta (conducta) se le refuerza con felicitaciones o puntaje para el examen final. Así de a poco y ante la conducta del alumno por esforzarse y estudiar mejor, se van introduciendo preguntas con un mayor grado de dificultad, reforzando las correctas.

No hay comentarios: