«Cuando un modelo de IA llegue a contener todo el conocimiento de la humanidad. Lo único que tendrás que hacer es hacerle la pregunta correcta».
Como escribía hace unos días Carlos Santana en su cuenta de Twitter:
Las IA generativas han llegado para quedarse y sus progresos y mejoras se miden en semanas y, cada vez más, en días. Si eres usuario de alguna herramienta generadora de imágenes o de texto basada en IA seguro que en algún momento te has preguntado: ¿Cómo podía vivir yo sin esto antes?
Cuando utilicé Stable Diffusion (herramienta generadora de imágenes por IA) por primera vez, el efecto WOW fue inmediato. También, me surgieron muchas preguntas sobre el futuro al ritmo que mejoraban este tipo de herramientas. Cuando probé ChatGPT hace un par de meses, tuve que dejarlo todo y dediqué un fin de semana a leer todo lo que pude sobre el tema.
Es así como llegué al libro Ten Vision for our future, escrito por Kai-Fu Lee. Ex-presidente de Google China y un referente en el mundo de la IA. En este libro, Kai-Fu Lee visiona el efecto de la Inteligencia Artificial en diferentes áreas de la sociedad en los próximos 20 años: Educación, Trabajo, Transporte...
Pero... ¿Qué es exactamente la IA? ¿Qué tecnologías la hacen funcionar? ¿Cuáles son sus limitaciones? ¿Cuáles son sus usos más prometedores? ¿Cuáles son sus problemas? ¿De qué se alimenta? Y, sobre todo, ¿qué efecto tendrá en Educación en los próximos años?
¡Importante! Esta entrada se basa en ideas que, aunque de forma bastante fundamentada y rigurosa, visionan un futuro a 20 años vista basándose en los últimos avances en una de las innovaciones del campo de la IA y el Machine Learning: el Deep Learning.
¿Quién sabe si durante los próximos años no surgirán más innovaciones disruptoras como el Deep Learning que nos obliguen a re-dirigir la visión de nuevo cada cierto tiempo? De hecho, esto ha ocurrido muchas veces a lo largo de la historia. Esta necesidad humana de visionar el futuro en base a los avances tecnológicos de cada época ha dado resultado a una pequeña corriente de estudio que se ilustra con textos e imágenes muy curiosas generadas en cada época: el paleofuturo.
¿Qué es el Deep Learning?
Para que nos situemos rápidamente, el Deep Learning es una innovación que forma parte del área del Machine Learning que, a su vez, forma parte del campo de la Inteligencia Artificial. Una innovación con un gran objetivo: que las "máquinas" puedan aprender a realizar tareas humanas de forma más o menos automatizada.
En realidad, el Deep Learning es una estrategia teorizada hace 60 años. ¿Por qué ha empezado a despuntar en los últimos años? Porque emplea los datos como combustible y la potencia de computación como motor. Dos elementos que solo se han encontrado en la cantidad y potencias suficientes en los últimos años gracias a los avances en hardware e internet.
Inspirado en las redes neuronales de nuestro cerebro, el Deep Learning son funciones matemáticas complejas que deben ser entrenadas para cumplir con el mayor éxito posible un determinado objetivo.
Pongamos que queremos entrenar a un modelo Deep Learning para que sea capaz de distinguir entre fotografías en las que aparecen personas e imágenes en las que no. Introduciríamos numerosas fotografías con personas etiquetadas como "persona" y numerosas fotografías sin personas etiquetadas como "no persona". El modelo se entrenaría para lograr identificar las características más adecuadas a tener en cuenta para distinguir entre fotografías con personas y sin personas. Es un proceso matemático que ajusta millones de parámetros para maximizar su función-objetivo: identificar correctamente con la mayor probabilidad posible entre fotografías con y sin personas.
Una vez terminado el entrenamiento, este modelo Deep Learning es sencillamente una ecuación matemática gigante que puede empezar a identificar fotografías con o sin personas a las que nunca ha sido expuesto.
Como habrás inferido, estos modelos pueden tener y tienen a día de hoy aplicaciones muy transversales: desde la identificación de la tipología de tumores en pruebas complementarias médicas o el Face ID de Apple hasta el contenido que se muestra en redes sociales como Instagram para maximizar los minutos que pasas en red pasando por los productos recomendados en Amazon según tus compras e historial de búsqueda con el objetivo de maximizar tu gasto en la plataforma.
Ni nuestro cerebro guarda lo que aprendemos como si fuese un disco duro, ni los modelos Deep Learning funcionan realmente como las conexiones neuronales de nuestro cerebro.
Aunque el Deep Learning se inspira en nuestro cerebro, ambos funcionan de forma muy diferente. Como se muestra en la siguiente tabla, los modelos Deep Learning necesitan muchos (pero muchos) más datos para lograr modelizar esa función-objetivo de la que hablábamos antes. No obstante, una vez entrenados sobrepasan a los humanos en tareas como la optimización de procesos, el reconocimiento de patrones y el establecimiento de correlaciones sutiles entre grandes cantidades de datos.
Además, estos modelos necesitan un área concreta de trabajo y una función-objetivo que optimizar. ¿Tienes pocos datos? El modelo no tendrá suficientes ejemplos para realizar correlaciones y entrenarse correctamente. ¿La función-objetivo es demasiado abierta o incluye demasiadas áreas? El modelo "se perderá" y no podrá optimizar la función.
Por otro lado, aunque las personas no pueden analizar grandes cantidades de datos al mismo tiempo como un modelo Deep Learning, si que pueden basarse en la experiencia, en la capacidad de abstracción de conceptos y en el tan infravalorado sentido común para tomar decisiones.
| Cerebro Humano | Deep Learning |
Datos requeridos | Pocos datos | Muchos (pero muchos) datos |
Encontrar una cara entre un millón | Difícil | Fácil |
Personalización al usuario | Difícil | Fácil |
Conceptos abstractos, razonamiento analítico, inferencias, sentido común... | Fácil | Difícil |
Creatividad (intencional) | Fácil | Difícil |
Deep Learning y Procesamiento Natural del Lenguaje
Como te habrás imaginado, el Deep Learning no es único y dentro de esta estrategia se recogen numerosos tipos de algoritmos, modelos y redes neuronales. ¿Te suenan los vídeos Deepfakes en los que la cara y la voz de una persona se sustituye, por ejemplo, por la de un famoso? Eso es Deep Learning montado en algoritmos RGAs. ¿Has probado ChatGPT o te has visto sorprendido por el auto-completar tan preciso de Google Docs o Gmail? Eso es Deep Learning montado en algoritmos de Procesamiento Natural del Lenguaje.
Y es este último tipo de algoritmos, los relacionados con el procesamiento natural del lenguaje, el que desencadenó mi fin de semana de lecturas y, por supuesto, los más prometedores en el mundo de la Educación. ¿Por qué? ¿Cómo funcionan?
Al principio de la entrada, pusimos el ejemplo de la identificación de fotografías de personas por un modelo que había sido entrenado con fotografías etiquetadas con "persona" y "no persona".
Con esta misma estrategia de etiquetado y entrenamiento, se entró en el mundo del lenguaje con aplicaciones en: reconocimiento del habla para subtitular automáticamente vídeos de Youtube, convertir manuscritos a texto o imágenes con texto a texto y convertir texto en habla.
Pero la joya de la corona en el mundo del procesamiento natural del lenguaje son los algoritmos que son capaces de "entender" y "responder" en consecuencia.
Para conseguir esto último, es inviable seguir la estrategia del etiquetado. Sería prohibitivo y extremadamente caro etiquetar todo el lenguaje del mundo. Imagina la gran cantidad de formas que tenemos para expresar usando el lenguaje una misma intención o proposición multiplicado por todas las intenciones y proposiciones posibles en nuestro idioma. Cada variación imaginable para una misma de estas intenciones debería representarse y etiquetarse durante el entrenamiento de este modelo.
Y aquí aparecen los modelos de procesamiento natural del lenguaje no supervisados. Estos modelos, al contar con una cantidad ingente de datos y mucha potencia de computación, son capaces de auto-completar frases y secuencias de texto dadas usando constructos y abstracciones auto-inventadas empleando una red neuronal gigante.
Si escribes: "Más vale pájaro en mano...", el modelo empleará los textos con los que ha sido alimentado y su red neuronal para ofrecerte con casi total probabilidad: "...que ciento volando".
Para que te hagas una idea, GPT3, el modelo detrás de ChatGPT, cuenta con tal cantidad de texto que necesitaríamos medio millón de vidas humanas para poder leerlo.
Con unas pocas indicaciones, este modelo basado en un modelo de procesamiento natural del lenguaje no supervisado, una cantidad de texto ingente, una potencia de computación descomunal y una red neuronal enorme, puede producir poesías, textos filosóficos, entradas de blog, manuales... con diferentes estilos y registros. Por supuesto, también produce líneas de código con las que poder desarrollar aplicaciones o páginas web desde cero.
¿Te imaginas poder conectarlo a Internet y emplearlo para hacer preguntas muy concretas obteniendo como respuesta una búsqueda sintética de todo lo que se sabe sobre ese tema? Mira esto.
Es posible que en unos años un modelo de procesamiento natural del lenguaje contenga todo el conocimiento de la historia de la humanidad. Lo único que tendrás que hacer es hacerle la pregunta correcta...
Evidentemente, estos modelos tienen sus limitaciones y, también, cometen errores. Pero con el conocimiento de la fortalezas y debilidades tanto del Deep Learning como del cerebro humano podemos visionar algunas respuestas a las grandes preguntas de este post: ¿Cómo será enseñar y aprender en la era de la IA? ¿Qué papel jugarán los profesores?
Enseñar y aprender en la era de la IA
¿Puede la IA tener sentido del humor? ¿Puede apreciar el arte, la belleza o el amor? ¿Se puede sentir sola? ¿Puede sentir empatía? ¿Puede disfrutar de la música, enamorarse o llorar? ¿Es la IA realmente creativa? ¿Puede expresar o sentir emociones? ¿Puede tener conciencia?
Estas preguntas representan los grandes retos a los que todavía tendrá que enfrentarse el desarrollo de la IA y, en el caso de que sea posible resolverlos, requerirán de innovaciones con el mismo o mayor impacto que el Deep Learning.
Durante los próximos 20 años, el Deep Learning vencerá a los humanos en cada vez más cometidos, pero habrá todavía tareas en la que el cerebro humano podrá desempeñarse mucho mejor. Aquellos trabajos con alto componente de interacción humana y/o creatividad y pensamiento estratégico favorecerán a los humanos. Por otro lado, las labores rutinarias y en las que la interacción humana no tenga valor, serán fácilmente automatizadas por IA.
Los profesores tenemos que buscar la simbiosis entre las fortalezas de nuestro cerebro humano (la creatividad intencional, el pensamiento estratégico, la empatía, el sentido común...) y las fortalezas de los algoritmos de Inteligencia Artificial descritos anteriormente.
A día de hoy, y aún sabiendo que cada alumno es diferente, la Educación en la práctica suele sustentarse en un modelo de café para todos. Los intentos de salir de este patrón para hacer el aprendizaje más personalizado son caros ya que requieren muchos más recursos.
Algunas partes de la enseñanza como la explicación o la evaluación llegarán (de hecho ya se hace) a automatizarse fácilmente ya que estos algoritmos de Inteligencia Artificial pueden explicar, corregir errores, auto-ajustar el nivel de reto según el ritmo, responder a dudas frecuentes, asignar tareas, deberes, evaluar o calificar de forma automatizada.
Además, podremos llegar a alcanzar niveles de personalización del aprendizaje que ponen los pelos de punta. Imagínate que un alumno no termina de comprender las ecuaciones del tiro parabólico y le pide a su algoritmo que le cree un vídeo ex profeso explicándole este concepto a través de su deporte favorito: el baloncesto. Aunque esto último parece ciencia ficción, las herramientas para lograr hacer esto ya existen a día de hoy.
Por supuesto, la interfaz de esta tecnología avanzará y pasará de un simple chat a un avatar que podremos personalizar con voz, nombre y aspecto y que nos acompañará en todo momento para poder hacerle consultas directamente por voz (la suma de la Realidad Virtual a esta ecuación daría para un post en exclusiva sobre el tema).
Es evidente que los profesores, como humanos que somos, tenemos que tener en cuenta a la clase completa. Sin embargo, el "profesor virtual" podrá prestar atención exclusiva a cada estudiante y hacer uso de la información recabada para ofrecerle la mejor oportunidad de aprendizaje en cada momento. El "profesor IA" deducirá cual es la mejor forma de enseñar geometría a su alumno aunque ese método parezca fallar con el resto. Los "profesores automatizados" harán que aprender sea más efectivo, motivador y divertido.
Pero... ¿y qué haremos los profesores humanos? Los profesores tendremos que poner nuestro cerebro empático y creativo al servicio de nuestros estudiantes como mentores y mediadores entre el "tutor virtual" y nuestros alumnos.
Trabajaremos el pensamiento crítico de los alumnos, su creatividad, la empatía, la colaboración... Los profesores tendremos que centrarnos mucho menos en impartir conocimientos y mucho más en construir inteligencia emocional, habilidades creativas, la personalidad, los valores y la resiliencia de nuestros alumnos.
Los costes de la Educación bajarán y, en principio, esto permitirá a mucha más personas acceder a ella. Las sociedades más ricas podrán reducir la ratio para "convertir" a sus profesores en mentores de grupos reducidos de alumnos.
Por supuesto, tenemos la otra cara de la moneda. Una era en la que el lujo sea contar con un profesor de carne y hueso y, los grupos más pobres, tengan que conformarse con un "algoritmo automatizado".
Pero creo que la Historia siempre invita a ser optimistas.
Komentarji