En los pasados meses, los chatbots, como ChatGPT, y los generadores de imágenes como Midjourney se han vuelto un fenómeno cultural. Pero la inteligencia artificial (IA) o modelos de “machine learning” llevan tiempo evolucionando.

By the Visual Journalism Team – BBC News – Julio 2023 | Traducción: Alexis Vásquez, para Arte es Ética
¿Cómo aprende una IA?
La clave de todo en el machine learning es un proceso llamado entrenamiento, en el que a un programa informático se le proporciona una gran cantidad de datos –a veces con etiquetas que explican de qué datos se trata– y un conjunto de instrucciones.
La instrucción puede ser algo como: “encuentra todas las imágenes que contengan caras” o, “categoriza estos sonidos”. Luego, el programa buscará patrones en los datos que se le han proporcionado para lograr esta meta. Puede necesitar ayuda durante el proceso – como por ejemplo “esa no es una cara” o “esos dos sonidos son distintos” – pero lo que el programa aprende de los datos y las pistas que se le brindan, se convierte en el modelo IA – y el material de entrenamiento es el que define esas habilidades.
Una forma de ver cómo este proceso de entrenamiento podría crear diferentes tipos de IA es pensar en diferentes animales. Durante millones de años, el entorno natural ha llevado a los animales a desarrollar habilidades específicas; de manera similar, los millones de ciclos que realiza una IA a través de sus datos de entrenamiento moldearán su forma de desarrollarse y darán lugar a modelos de IA especializados.
Veamos algunos ejemplos de esto.
¿Qué son los chatbots?
Piensa en un chatbot como si fuera un loro. Es un imitador y puede repetir las palabras que ha oído con cierta comprensión de su contexto, pero sin un sentido completo de su significado.
Los Chatbots hacen lo mismo –aunque a un nivel más sofisticado– y están a punto de cambiar nuestra relación con la palabra escrita. Pero, ¿cómo es que estos chatbots saben escribir?
Son un tipo de IA conocida como “grandes modelos de lenguaje” (Large Lenguage Models – LLMs) y están entrenadas en enormes volúmenes de texto. Un LLM puede considerar no solo palabras individuales sino oraciones completas y comparar el uso de palabras y frases en un pasaje con otros ejemplos en todos sus datos de entrenamiento.
Usando estos miles de millones de comparaciones entre palabras y frases, es capaz de leer una pregunta y generar una respuesta, como los mensajes de texto predictivo en el teléfono pero a escala masiva. Lo sorprendente de los grandes modelos lingüísticos (LLMs) es que pueden aprender las reglas de la gramática y cómo utilizar las palabras en el contexto correcto, sin asistencia humana.
“En 10 años, creo que tendremos chatbots que trabajarán como expertos en cualquier dominio que quieras. Así que podrás preguntar a un médico experto, a un profesor experto, a un abogado experto lo que necesites y que esos sistemas vayan a hacer cosas por ti.”
Sam Altman – CEO de OpenAI, creadores de ChatGPT
¿Puedo hablar con una IA?
Si has utilizado Alexa, Siri o cualquier otro tipo de sistema de reconocimiento de voz, entonces has estado utilizando IA.
Imagine un conejo con sus grandes orejas, adaptadas para captar las diminutas variaciones del sonido.
La IA graba los sonidos mientras hablas, elimina el ruido de fondo, separa tu discurso en unidades fonéticas –los sonidos individuales que componen una palabra hablada– y posteriormente las compara con una biblioteca de sonidos lingüísticos. Entonces tu discurso se convierte en texto, donde pueden corregirse los posibles errores de escucha durante la grabación antes de que una respuesta sea dada.
Este tipo de IA es conocida como procesamiento del lenguaje natural (natural language processing).
Esta es la tecnología que está detrás de todo, desde decir “sí” para confirmar una transacción bancaria por teléfono, hasta pedirle a tu celular que te informe por el estado del tiempo en los próximos días en la ciudad a la que viajarás.
¿Puede una IA entender imágenes?
¿Alguna vez tu teléfono ha reunido tus fotos en carpetas con nombres como “en la playa” o “salidas nocturnas”?
Entonces has estado utilizando IA sin darte cuenta. Un algoritmo de IA ha descubierto patrones en tus fotos y las ha agrupado por ti. Estos programas han sido entrenados examinando montañas de imágenes, todas ellas etiquetadas con una sencilla descripción.
Si le das a una IA de reconocimiento de imagen, las suficientes imágenes etiquetadas como “bicicleta”, eventualmente empezará a reconocer qué aspecto tiene una bicicleta y en qué se diferencia de un barco o un coche.
A veces, una IA está entrenada para descubrir pequeñas diferencias dentro de imágenes similares. Así es como funciona el reconocimiento facial, encontrando una sutil relación entre los rasgos de tu cara que la hacen distinta y única en comparación con cualquier otro rostro del planeta.
El mismo tipo de algoritmos han sido entrenados con escaneos médicos para identificar tumores potencialmente mortales y pueden analizar miles de escaneos en el tiempo que le tomaría a un profesional tomar una decisión sobre uno solo de ellos.
¿Cómo genera imágenes una IA?
Recientemente el reconocimiento de imágenes ha sido adaptado a modelos de IA que pueden manipular patrones y colores. Estas IAs de generación de imágenes pueden convertir complejos patrones visuales que toman de millones de fotografías y dibujos en imágenes, aparentemente “nuevas”.
Puedes pedirle a estos algoritmos que hagan una imagen fotográfica de algo que no ha ocurrido nunca, por ejemplo, una foto de una persona caminando en la superficie de Marte. O puedes “elegir el estilo” de una imagen a generar: “Haz un retrato del mánager de fútbol Inglés, pintado en el estilo de Picasso”.
Las IA más modernas inician el proceso de generación de esta nueva imagen con una colección de píxeles coloreados al azar. Observa los puntos aleatorios en busca de algún indicio de un patrón que haya aprendido durante el entrenamiento: patrones para construir diferentes objetos. Estos patrones son mejorados, poco a poco, al adicionar más capas de puntos aleatorios, manteniendo aquellos puntos que desarrollan el patrón y descartando otros, hasta que finalmente surge una semejanza.
Si se desarrollan juntos todos los patrones necesarios, como “superficie de Marte”, “astronauta” y “caminando”, se obtiene una nueva imagen.
Como esta “nueva” imagen se construye a partir de capas de píxeles aleatorios, el resultado es algo que, en apariencia, nunca ha existido antes, pero ahora sabemos que sigue basándose en los miles de millones de patrones que aprendió de las imágenes de entrenamiento originales.
La sociedad está empezando a plantearse lo que esto significa para aspectos como los derechos de autor y la ética; de generar “obras de arte” formadas a partir del duro trabajo de artistas, diseñadores y fotógrafos reales.
¿Y los coches autónomos?
Los coches autoconducidos han formado parte de la conversación en torno a la IA durante décadas y la ciencia ficción los ha fijado en el imaginario popular. La IA de autoconducción se conoce como conducción autónoma y los coches están equipados con cámaras, radares y láseres de telemetría.
Piensa en una libélula, con visión de 360 grados y sensores en las alas que le ayudan a maniobrar y hacer constantes ajustes en vuelo. De forma similar, el modelo de IA utiliza los datos de sus sensores para identificar objetos y averiguar si están en movimiento y, en caso afirmativo, de qué tipo de objeto en movimiento se trata: otro coche, una bicicleta, un peatón u otra cosa.
Miles y miles de horas de entrenamiento para entender cómo es una buena conducción han permitido a la IA “ser capaz” de tomar decisiones y actuar en el mundo real para conducir el coche y evitar colisiones.
Puede que los algoritmos de predicción hayan luchado durante muchos años para hacer frente a la naturaleza a menudo impredecible de los conductores humanos, pero los coches sin conductor ya han recopilado millones de kilómetros de datos en carreteras reales. En San Francisco ya transportan pasajeros.
La conducción autónoma es también un ejemplo muy público de cómo las nuevas tecnologías deben superar algo más que obstáculos técnicos. La legislación gubernamental y las normas de seguridad, junto con un profundo sentimiento de ansiedad sobre lo que ocurre cuando cedemos el control a las máquinas, siguen siendo obstáculos potenciales para un futuro totalmente automatizado en nuestras carreteras.
¿Qué sabe una IA sobre mí?
Algunas IA se ocupan simplemente de los números, recopilándolos y combinándolos en volumen para crear un enjambre de información, cuyos productos pueden ser extremadamente valiosos.
Probablemente ya existen muchos perfiles de tu información financiera y social, particularmente de aquellas realizadas vía online, que pueden ser usadas para hacer predicciones sobre tu comportamiento. Tu tarjeta del supermercado sigue tus hábitos y gustos sobre tu compra semanal. Las agencias de crédito vigilan cuánto tienes en el banco, y cuánto debes en tarjetas de crédito. Netflix y Amazon hacen un seguimiento de cuántas horas de contenido sumaste la última noche. Tus redes sociales saben en cuántos videos comentaste hoy.
Y no solo eres tú, esos números existen para todo el mundo, permitiendo a los modelos de IA buscar tendencias sociales. Estos modelos de IA ya están interviniendo en tu vida, desde haciéndote decidir si puedes obtener un préstamo o hipoteca, a influenciar que es lo que comprarás al elegir qué tipo de anuncios publicitarios mostrarte de forma online.
“Tenemos que desarrollar un lenguaje para hablar de cuestiones científicas y tecnológicas sofisticadas. Y una forma de hacerlo es decir: no tienes por qué saber la diferencia entre IA estrecha y generativa, pero deberías poder esperar que los sistemas automatizados utilizados en tu vida sean seguros y eficaces; que tus datos hayan sido protegidos; que en el caso de un sistema utilizado para tomar una decisión sobre tu acceso a una hipoteca -por ejemplo- puedas obtener una explicación sobre cómo se ha obtenido o puedas hablar con alguien, si la decisión no te favorece y quieres más información”.
Alondra Nelson, ex directora en funciones de la Oficina de Política Científica y Tecnológica de EE.UU., que publicó un proyecto de Carta de Derechos de la Inteligencia Artificial en 2022.
¿Podrá la IA hacerlo todo?
¿Sería posible combinar algunas de estas funciones en un único modelo híbrido de IA? Eso es exactamente lo que hace uno de los avances más recientes en IA.
Se llama IA multimodal y permite a un modelo examinar distintos tipos de datos -como imágenes, texto, audio o vídeo- y descubrir nuevos patrones entre ellos.
Este enfoque multimodal fue una de las razones del enorme salto de capacidad que mostró ChatGPT cuando su modelo de IA se actualizó de GPT3.5 (que se entrenaba sólo con texto) a GPT4, que se entrenaba también con imágenes.
La idea de que un único modelo de IA sea capaz de procesar cualquier tipo de datos y, por lo tanto, realizar cualquier tarea, desde traducir entre lenguajes, hasta diseñar nuevos fármacos, es conocida como inteligencia artificial general (AGI – Artificial General Intelligence).
Para algunos esta es la meta final de toda investigación de inteligencia artificial; para otros es el camino a todas esas distopías de ciencia ficción en las que se desencadena una inteligencia tan por encima de nuestro entendimiento, que no somos capaces de controlarla.
¿Cómo se entrena una IA?
Hasta hace poco, el proceso clave para entrenar a la mayoría de las IA se conocía como “aprendizaje supervisado”. Enormes conjuntos de datos de entrenamiento eran etiquetados por humanos y se le pedía a la IA que descubriera patrones en los datos. A continuación, se le pedía que aplicara esos patrones a nuevos datos y que generara una retroalimentación sobre su exactitud.
Por ejemplo, imagina darle a una IA una docena de fotos –seis de ellas etiquetadas como “auto” y seis como “furgoneta” (Imagen 1). Luego se le solicita a la IA que elabore un patrón visual que clasifique a los autos y furgonetas en dos grupos. ¿Qué crees que pasa cuando le pides que categorice esta foto? (Imagen 2).


Desafortunadamente, parece que la IA piensa que es una furgoneta –no es tan inteligente.
Ahora muéstrale esto (Imagen 3).

Y te dice que esto es un auto. Está bastante claro qué ha fallado. A partir del limitado número de imágenes con las que ha sido entrenada, la IA ha decidido que el color es la mejor forma de separar coches y furgonetas.
Pero lo sorprendente del programa de IA es que ha llegado a esta decisión por sí solo, y podemos ayudarle a perfeccionar su toma de decisiones. Podemos decirle que se ha equivocado al identificar los dos nuevos objetos, lo que le obligará a encontrar un nuevo patrón en las imágenes. Pero lo más importante es que podemos corregir el sesgo de nuestros datos de entrenamiento dándole imágenes más variadas.
Con estas dos sencillas acciones juntas, y a gran escala, es como se ha entrenado a la mayoría de los sistemas de IA para que tomen decisiones increíblemente complejas.
¿Cómo aprende la IA por sí sola?
El entrenamiento supervisado es un método increíblemente potente, pero muchos de los recientes avances en IA se han hecho posibles gracias al entrenamiento no supervisado. En términos simples, se trata del uso de algoritmos complejos y enormes conjuntos de datos que permiten a la IA aprender sin guía humana.
ChatGPT es el ejemplo más conocido.
La cantidad de texto en Internet y en libros digitalizados es tan grande que, a lo largo de muchos meses, ChatGPT fue capaz de aprender por sí mismo a combinar palabras de forma significativa, con la ayuda de los humanos para afinar sus respuestas.
Imagina que tienes un montón de libros en otro idioma, algunos de ellos con imágenes. Con el tiempo, te das cuenta de que la misma palabra aparece en una página cuando hay un dibujo o una foto de un árbol, y otra palabra cuando hay una foto de una casa. Además, a menudo había una palabra cerca de esas palabras que podía significar “un” o “el”, y así sucesivamente.
ChatGPT realizó este minucioso tipo de análisis de la relación entre palabras para construir un enorme modelo estadístico que luego puede utilizar para hacer predicciones y generar nuevas frases.
Se basa en enormes cantidades de potencia de cálculo que permiten a la IA memorizar grandes cantidades de palabras (solas, en grupos, en frases y a través de páginas) y luego leer y comparar cómo se utilizan una y otra vez en una fracción de segundo.
¿Debería preocuparme sobre la IA?
Los rápidos avances logrados por los modelos de deep learning en el último año han provocado una oleada de entusiasmo y también un mayor compromiso público con las preocupaciones sobre el futuro de la inteligencia artificial.
Se ha debatido mucho sobre la forma en que los sesgos en los datos de entrenamiento recogidos de Internet -como los discursos racistas, sexistas y violentos o las perspectivas culturales estrechas- conducen a que la inteligencia artificial replique los prejuicios humanos. Otra preocupación es que la inteligencia artificial pueda resolver problemas sin tener plenamente en cuenta la ética o las implicaciones más amplias de sus acciones, creando nuevos problemas en el proceso.
En los círculos de la IA esto se conoce como el “problema del maximizador del clip”, por un experimento del filósofo Nick Bostrom. El filósofo Nick Bostrom imaginó una inteligencia artificial a la que se le pide que cree tantos clips como sea posible, la cual poco a poco depredaría cada recurso natural en el planeta para cumplir su misión, incluida la matanza de seres humanos para utilizarlos como materia prima para fabricar más clips.
Otros afirman que, más que concentrarnos en una IA asesina del futuro, deberíamos preocuparnos mucho más por los problemas inmediatos de cómo la gente podría usar IAs existentes para incrementar la desconfianza en la política y el escepticismo ante todas las formas de medios de comunicación.
En particular, los ojos del mundo están puestos en las elecciones presidenciales de 2024 en Estados Unidos, para ver cómo los votantes y los partidos políticos se enfrentan a un nuevo nivel de desinformación sofisticada. ¿Qué ocurrirá si las redes sociales se inundan de videos falsos de los candidatos presidenciales, creados con IA y cada uno de ellos adaptado para enfadar a un grupo diferente de votantes?
En Europa, la UE está creando una Ley de Inteligencia Artificial para proteger los derechos de sus ciudadanos regulando el despliegue de la IA -por ejemplo, la prohibición de utilizar el reconocimiento facial para rastrear o identificar a personas en tiempo real en espacios públicos-.
Se trata de las primeras leyes del mundo que establecen directrices para el uso futuro de estas tecnologías, fijando los límites de lo que las empresas y los gobiernos podrán y no podrán hacer, pero, como las capacidades de la inteligencia artificial siguen creciendo, es poco probable que sean las últimas.
Créditos de producción:
Escrita por Paul Sargeant
Diseño de Jenny Law, Debie Loizou, Patricia Ofuono y Oli Powell
Desarrollo: Assiz Pereira y Alli Shultes. Pruebas de Jerina Jacob
Dirección de producción: Holly Frampton. Edición adicional de Emma Atkinson y Bella Hurrell. Gracias a Maryam Ahmed por sus consejos sobre los modelos de aprendizaje automático.
Fotos: Getty Images