Por Caitlin Coberly

Los reforzadores secundarios y el uso de un clicker como reforzador secundario han aparecido en varias ocasiones en nuestros intercambios en línea. No sé de dónde viene todo este alboroto, pero pensé aprovechar esta oportunidad para tratar el tema.

Un breve recordatorio

Un reforzador secundario es algo que se asocia con un reforzador primario –algo que satisface una necesidad biológica, como comida, agua o sexo– en la mente del perro a través de la asociación. Es la campana de Pavlov. Básicamente, es el sonido de la máquina de goma de mascar justo antes que esta caiga. Es el abrelatas en la comida de gato o el sonido de la bolsa de premios. Es algo que pasa casi todas las veces que un premio está a punto de ser entregado, y pasa a significar “cosas buenas” y “sentimientos agradables” en la mente del perro. (Para aquellos enfocados neurológicamente, causa una liberación de dopamina, un neurotransmisor endógeno, altamente adictivo “para sentirse bien”).

Podemos usar este proceso en la mente del perro para crear reforzadores secundarios que podamos usar en lugar de comida. Por ejemplo, le puedo pedir a mi perro que venga, APLAUDO, y luego le doy un premio. Si el aplauso es seguido de un premio consistentemente, entonces el aplauso en sí mismo comienza a sentirse bien, y ya no tengo que seguirlo de un premio cada vez.

Ve este excelente video de Ken Ramírez de la Academia de Karen Pryor, trabajando con una beluga usando reforzadores secundarios.

https://www.facebook.com/watch/?v=472840233268625

Lo que a menudo no mencionamos sobre los reforzadores secundarios es que deben ser mantenidos. Para que el reforzador secundario mantenga su valor de “hacer sentir bien”, debe ocasionalmente ser seguido de un reforzador primario.

Una pequeña nota al margen: algunas cosas pueden ser enseñadas como reforzadores secundarios y no necesitar nunca ser emparejadas con comida de nuevo, porque tanto la interacción y el juego social son reforzadores primarios. Por lo que, si incorporas reforzadores secundarios a las sesiones de juego, el animal está obteniendo un reforzador primario simultáneamente, tu atención y la diversión.

El entrenamiento con marcador (o entrenamiento con clicker) parece similar al reforzador secundario en la superficie. Marcamos, o hacemos clic, cuando el perro hace la conducta deseada para indicar que viene el reforzador. Entonces el perro hace la conducta correcta, hacemos un sonido y el perro obtiene un premio. ¡Es exactamente la misma secuencia!

Por lo tanto, es exactamente lo mismo, ¿cierto?

No exactamente. Aquí es cuando la semántica juega un papel. Tiene que ver con nuestra intención. Un marcador es una indicación de que viene un reforzador. Provoca liberación de químicos de “sentirse bien” en el cerebro como lo discutimos anteriormente. Se inician todos los mismos procesos. Queremos que diga “esaconducta hace que sucedan cosas buenas.” En contraste, un reforzador secundario es un indicador que un reforzador primario pudiera venir. Usamos reforzadores secundarios para decir “estoy participando e interactuando, y es probable que más cosas buenas sucedan”.

Aquí está la diferencia crítica. Cuando intencionalmente usamos un reforzador secundario, pretendemos crear una respuesta emocional que no siempre estará emparejada con un reforzador primario. Esto está bien. Sabemos que los reforzadores secundarios permanecerán sólidos relativamente bien si regularmente son combinados con un reforzador primario.La fuerza de esa respuesta emocional dependerá de la frecuencia con la que el (reforzador) secundario está emparejado con el primario, así como de cuánto quiere el animal el reforzador primario.

En contraste, se pretende que un marcador actúe como indicador de que el animal hizo la conducta deseada y va a recibir una recompensa.

¿Son críticasesas diferencias? Para las personas comunes, tal vez no. No va a causar daño a tu perro si ocasionalmente olvidas marcar una conducta deseada, o si emparejas un reforzador secundario con un primario cuando no era tu intención.

Entonces, ¿por qué tanto alboroto?

En primer lugar, un entrenador profesional debería tener cuidado con los términos, especialmente aquellos términos que tienen un significado formal. Los reforzadores primarios y segundarios han sido cuidadosamente definidos en la literatura científica. En contraste, el entrenamiento con marcadores no ha sido tan cuidadosamente definido. Mientras que no es usado de forma extensa en el mundo del entrenamiento animal, ha recibido poca atención en la comunidad científica1 a pesar de haber sido inicialmente propuesto por Skinner en 1951.2 Por lo tanto, mientras que tenemos mucha experiencia usando marcadores, no tenemos conocimiento formal sobre los efectos exactos – incluyendo si el animal entiende o no las diferencias entre un marcador y un reforzador secundario.

En segundo lugar, nuestra intención es importante. Por supuesto, debemos siempre tener cuidado de ser precisos. Hablando de forma práctica, cuando estamos enseñando una conducta nueva, mientras más claros podamos ser, menor frustración tendrá el alumno y más rápido adquirirá destreza. Un marcador es una forma útil de acortar la distancia entre la conducta y la entrega del reforzador. Identifica el momento preciso en que ocurre la conducta correcta, y hace que el proceso sea claro para el alumno. Es más, podemos usar una tasa de refuerzo continua (ej., cada conducta correcta se gana un reforzador primario) para dar absoluta claridad.

En contraste, cuando estamos trabajando con habilidades establecidas, usar el mismo y cansado reforzador una y otra vez se puede convertir en algo aburrido.3 El animal puede escoger, a menos que esté privado de sus necesidades básicas, hacer otra cosa. En tanto le permito al animaldesconectarse de mí, esto indica que he fallado. Mi sesión ideal de entrenamiento está llena de diversión, emoción y anticipación. Al incluir una variedad de reforzadores en mi programa de entrenamiento, puedo mantener el interés del perro, ya que no sabrá de forma exacta qué es lo que va a obtener. Al mezclar mis reforzadores primarios y secundarios estoy, en esencia, haciendo que el patrón del juego sea reforzador en sí.

De forma práctica, ¿Qué significa esto para mi entrenamiento?

Usa tu marcador (clicker o un ¡sí! verbal) cuando enseñes nuevas habilidades para significar: “Sí, ya lo tienes”. Úsalo para querer decir de forma exclusiva que viene un reforzador primario – ya sea una golosina, jugar o algo que tu perro realmente disfrute.

Cuando estás trabajando con conductas ya establecidas, alterna tus reforzadores secundarios (un aplauso corto, un toque, un clic (chasquido de lengua) con reforzadores primarios (típicamente comida), y ¡que sigan los juegos!

Referencias

  1. Dorey, N.R, and Cox, D.J (2018) Function matters: a review of terminological differences in applied and basic clicker training research. PeerJ6:e5621
  2. Skinner, B.F. (1951) How to teach animals. Scientific American 185:6
  3. Bromberg-Martin, E.S. et al (2011) Dopamine in motivational control: rewarding, aversive, and alerting. Neuron 68:5, pp.815-834.

(Traducido por Wen Bautista)