fbpx


La forma más simple de aprendizaje asociativo es condicionamiento pavloviano. A través de este proceso de comportamiento básico, los humanos y otros organismos llegan a apreciar las conexiones confiables que existen entre muchos eventos en el mundo, lo que se llama “textura causal” con ambiente. Una característica clave del condicionamiento pavloviano es que el emparejamiento frecuente de dos estímulos puede ser suficiente para establecer una fuerte asociación entre ellos.

Por lo general, pensamos en el condicionamiento pavloviano como algo que implica reflejos rudimentarios, como parpadear o salivar en las glándulas de la boca. Sin embargo, la conexión entre estímulos también puede provocar reacciones emocionales o afectivas, algunas bastante sutiles y exteriormente imperceptibles para otras.

Muchas de estas sutiles reacciones afectivas son las llamadas “sesgos implícitos“—reflejan una variedad de estereotipos y prejuicios sociales. Por supuesto, nunca querríamos admitir que tenemos sentimientos tan negativos hacia los demás; de hecho, es posible que ni siquiera seamos conscientes de ellos. Sin embargo, las técnicas conductuales altamente efectivas pueden revelar estos sesgos ocultos Prueba de asociación implícita (IAT) es una de esas técnicas.

El IAT pide a las personas que presionen una de las dos teclas de la computadora para clasificar palabras de cuatro categorías: por ejemplo, nombres de mujeres, nombres de hombres, palabras relacionadas con el hogar y palabras relacionadas con la oficina. Cuando las categorías “mujer” y “hogar” se asignan a una tecla, y las categorías “hombre” y “oficina” se asignan a una segunda tecla, las personas responden mucho más rápido que cuando se asignan mujer y oficina a una tecla y esposo y home se asignan a una segunda tecla. Esta marcada diferencia en la velocidad de respuesta indica la presencia de un implícito Sexo sesgo o estereotipo. Desde 1998, el IAT ha brindado una visión única de las muchas creencias desagradables que podemos albergar.

Por supuesto, nadie nace con tales creencias y prejuicios, tienen que aprenderse. Uno de los principales hallazgos del condicionamiento pavloviano es que algunos comportamientos profundamente desadaptativos, como las fobias, pueden surgir de experiencias personales únicas. ¿Podrían derivarse de manera similar muchos de los prejuicios racistas y sexistas más dañinos de la sociedad?

La respuesta parece ser no. Estos y otros sesgos sociales, como la edad, la discapacidad, el peso y la riqueza, son demasiado comunes para ser el resultado de tantas personas diferentes que comparten muchas experiencias comunes. Entonces, ¿de dónde pueden venir esos prejuicios comunes?

Investigación sobre IA y sesgo

Una pista fascinante proviene de una fuente poco probable. Considere estos titulares mordaces de varios comunicados de prensa recientes: “Incluso Inteligencia artificial puede tener prejuicios raciales y de género”. “Los robots entrenados por IA se han vuelto racistas y sexistas”. “Rise of the Racist Robots: cómo la IA está aprendiendo todos nuestros peores impulsos”. “Los robots con inteligencia artificial perpetúan el racismo y el sexismo prejuicio.” ¿Cómo podrían estas frías máquinas de calcular sesgadas y sesgadas?

La respuesta resulta ser simple y reveladora. Los “cerebros” de la mayoría de los dispositivos de IA utilizan algoritmos que han sido programados para detectar covarianzas del mismo tipo que nuestros propios cerebros han evolucionado para detectar en medio del ruido de innumerables estímulos no relacionados.

Se han desarrollado varias pruebas de sesgo para computadoras: una es Prueba de asociación de incrustación de palabras (MORA). Al examinar cientos de miles de millones de palabras en inglés en Internet, se descubrió que algunos pares de palabras estaban más fuertemente incrustados en un marco de lectura de 10 palabras de lo que cabría esperar por casualidad, de forma similar a cómo el IAT usa los tiempos de reacción humanos para detectar asociaciones implícitamente sesgadas. . Es importante destacar que se identificaron WEAT e IAT muy de acuerdo entre sí a una amplia gama de prejuicios humanos, incluido el prejuicio racial.

Estos estereotipos malignos no se limitan a los estímulos verbales. Estímulos visuales y sus firmas verbales también se encontraron fuertes sesgos racistas y sexistas.

En definitiva, los mismos sesgos se pueden encontrar en una amplia gama de estímulos verbales y visuales, tanto por parte de dispositivos artificiales como por parte de adultos. Recitando las famosas líneas de Shakespeare de su obra Julio César, la culpa no es nuestra, sino de nuestras estrellas, aquí, en las innumerables palabras que hemos leído y las imágenes que hemos visto todos los días de nuestras vidas.

Efectos

Estos resultados tienen implicaciones importantes. En primer lugar, independientemente de cuáles hayan sido nuestras experiencias personales (buenas, malas o inofensivas), las fuerzas culturales inevitablemente nos abruman con información estereotipada. Dado este hecho, incluso los currículos más prometedores desarrollados hasta ahora tendrán la difícil tarea de mitigar estos sesgos; una vez que estos esfuerzos terminen, sucumbiremos una vez más a las mismas fuerzas culturales que fomentaron los prejuicios.

En segundo lugar, con base en el primer punto, muchos prejuicios han demostrado ser extremadamente duraderos. Según un análisis detallado del texto, pocos duraron tanto 200 años.

En tercer lugar, sin embargo, hay signos alentadores de que la gravedad de algunos de estos sesgos puede estar disminuyendo; Las actitudes implícitas, medidas a nivel de población con el IAT, cambiaron gradualmente y con el tiempo 2007-2020— en la dirección de reducir las actitudes prejuiciosas. Este estudio analizó los prejuicios contra los homosexuales, la raza, el tono de piel, la edad, la discapacidad y el peso corporal. Curiosamente, el prejuicio que mostró el mayor descenso fue el prejuicio anti-gay. Los prejuicios raciales y de color también disminuyeron, pero en menor medida. Sin embargo, los sesgos por edad, discapacidad y peso no disminuyeron. Los factores culturales que subyacen a estos resultados son sin duda complejos y requieren más estudio.

Finalmente, recientemente se han tomado medidas para sesgar más rápidamente la información textual y visual que puede tener el impacto más negativo en la opinión pública. Se están desarrollando varios enfoques lograr una representación más equitativa de individuos y grupos en los resultados de los programas de IA. Entre ellos se encuentran los intentos de minimizar el impacto de los algoritmos de aprendizaje en atributos sociales sensibles, así como en crear programas de “detección de desplazamiento”. erradicar y eliminar los sesgos tan pronto como se descubran.

Nuestros sistemas sociales han evolucionado durante un período de tiempo muy largo, creando desafíos para superar los prejuicios existentes. extremadamente difícil. Estos prejuicios desgarran el tejido mismo de nuestra sociedad pluralista y aviva las llamas del fanatismo y el desorden. Al reconocer que la IA puede reflejar y respaldar inadvertidamente estos sesgos, ahora podemos predecir de manera más optimista que los esfuerzos innovadores pueden ayudar más rápidamente a minimizar los efectos tóxicos de los sesgos y prejuicios en nuestro comportamiento individual y cultural.

Sin embargo, debemos ser claros acerca de la efectividad potencial de muchos de estos esfuerzos de reprogramación de IA. Se han encontrado prejuicios raciales implícitos en niños de edades comprendidas entre 4 años. Esto plantea la posibilidad de que incluso los niños más pequeños que ven televisión o les leen, puedan adquirir sesgos implícitos, una perspectiva que aún no se ha considerado en los proyectos de reprogramación de la IA.

Tony Greenwald y Mahzarin Banaji me ayudaron amablemente a preparar esta historia.



Source link