All posts

OpenAI, Runway ML y KHIPU 2025: Actualízate en minutos

Dos noticias y una experiencia que debes conocer

Fecha

April 2, 2025

Tema

Actualidad

Autor

Michelle Novion Espada

Despedimos marzo y le damos la bienvenida a abril con bastantes novedades… GPUs se han 'derretido' y han estallado conversaciones en torno a los modelos de Inteligencia Artificial Generativa ¿El motivo? Magnates de la IA han anunciado nuevas herramientas relacionadas a la generación de imágenes y videos. Aquí van dos noticias y la experiencia de asistir al KHIPU 2025 para que se actualicen en minutos.

Las discusiones no cesan en RR.SS. y, como es de costumbre, han surgido dos bandos: a favor y en contra de la transformación de imágenes a diversos estilos artísticos. Hablar sobre esta temática y explorar las innovaciones tecnológicas es fundamental, y es que, independientemente de lo dicho, es importante informarse y tener una opinión sobre el crecimiento de estas nuevas herramientas.

OpenAI y el fenómeno Ghibli

Hace una semana OpenAI presentó su nueva capacidad de generación de imágenes, integrada en su modelo multimodal GPT-4o. Y por supuesto, como no se puede esperar menos de uno de los gigantes de la IA, su herramienta explotó las redes sociales con miles de posteos de personas, que convirtieron sus fotografías en ilustraciones al estilo de Studio Ghibli.

Fue tanto el uso de Chat GPT, que el mismo CEO de OpenAI Sam Altman, habló a través de X mencionando que sus GPU se estaban derritiendo y que por ese motivo la capacidad de tomar imágenes y transformarlas, fue suspendida temporalmente para la versión gratuita.

La conversión de imágenes a estilos de arte y su posibilidad de edición, es la capacidad que más ha rugido, pero hay más además del expansivo trend Ghibli. Open AI implementó un nuevo enfoque autoregresivo en la generación de imágenes, logrando mejorar notoriamente su precisión al renderizar texto dentro de las imágenes, todo indica que ya no tendremos más imágenes IA con textos en idioma Simlish, (el idioma de los sims). Y es que no es por nada que el gigante tecnológico ha presentado a su innovación como "el generador de imágenes más avanzado que ha creado hasta ahora".

Runway ML Gen-4

Si los avances de OpenAI fueron novedosos, la empresa británica Runway ML simplemente nos voló la cabeza presentando su nuevo modelo Gen-4 el pasado 31 de marzo. Los cortos de demostración muestran las capacidades impresionantes que alcanza en generación de videos. Mientras observaba un clip de animales caminando por las calles pobladas de Nueva York, la expresión dibujada en mi rostro, era de impacto e incredulidad. Si les soy sincera, parte de mí buscaba errores desesperadamente para sentir que aún puedo determinar entre creaciones realizadas por IA y humanos (no fue así).

Una de las innovaciones más significativas de Gen-4 es su habilidad para generar personajes que mantienen una apariencia coherente a través de diversas condiciones de iluminación, utilizando como base, una única imagen de referencia. Este elemento es importante ya que abre paso a la posibilidad de crear videos que mantienen coherencia visual entre ellos, pudiendo mantener los mismos entornos y logrando la interacción de personajes de forma realista con su ambiente.

La distinción principal entre Gen-4 y su predecesor Gen-3 radica en el formato de entrada para la generación de videos. Mientras Gen-3 destacaba por su potente conversión de texto a video, Gen-4 se especializa en la transformación de imágenes estáticas iniciales en secuencias de video dinámicas y realistas. La mejor parte es que los nuevos cambios no se detienen en la coherencia. Gen-4 también promete un mayor control sobre la cinematografía de los videos. No solo podrás darle vida a una imagen, sino también sugerir el movimiento de la 'cámara' virtual o aplicar estilos visuales. Esta capacidad de dirigir sutilmente la narrativa visual es otro de esos detalles que te dejan pensando qué seremos capaces de realizar con esta tecnología en algunos años más.

Conferencia Khipu 2025

Entre el 10 y 14 de marzo se desarrolló la conferencia KHIPU 2025, uno de los encuentros de inteligencia artificial más importantes de Latinoamérica, que tuvo este año su sede en Santiago.

Asistí a la conferencia el día en donde la temática principal era Feminismo de datos y observé a muchas mujeres del mundo STEM, atentas escuchando y anotando lo que enseñaban dos grandes representantes y académicas del rubro, Catherine D'Ignazio e Ivana Feldfeber. Diría que alrededor del 70% de quienes estaban en el auditorio del CEINA eran mujeres, una escena realmente inspiradora en términos de representación.

Catherine D'Ignazio, desarrolladora de software dedicada a la ética del uso y creación de IA, escritora del libro Data Feminism, planteó un cuestionamiento que me dejó pensando incesantemente: ¿Existe una verdadera necesidad de seguir creando nuevos modelos de Inteligencia Artificial? , ¿quién está realmente solicitando la creación de estas nuevas tecnologías y con qué fin se están creando?, ¿realmente necesitamos mejorar los modelos tal y como los conocemos, para que nuestras fotos se parezcan a las ilustraciones del artista Japonés Miyazaki? ¿Existe la verdadera necesitad de un GPT versión 10 capaz de replicar arte a la perfección? La pregunta es retórica, pero mi apreciación como fan y soñadora de los avances tecnológicos es que independiente del uso vanal que le entreguemos hoy, hay más beneficios que llegarán junto a estos avances.

Lo que sí comparto es el enfoque que le estamos dando al avance de estas tecnologías. Quizás no necesitamos un nuevo GPT, porque el que tenemos funciona perfectamente para lo que lo estamos utilizando. Inspirada por la icónica Fei-Fei Li, comparto el siguiente punto de vista: hay que centrar energías en una IA espacial que entienda nuestro entorno y se complemente con la robótica para así obtener ayuda física, eficiente para los humanos.

D'Ignazio también planteó la necesidad de tomar acción ante los sesgos estudiados que tienen diversos modelos de IA, e hizo un llamado a no solo investigar sobre estos sesgos, sino a tomar acción para revertir o evitar que se produzcan discriminaciones e injusticias que podrían ser aplicadas por las nuevas tecnologías.

La segunda profesional en hablar sobre feminismo de datos fue Ivana Feldfeber, especialista en Ciencia de Datos con perspectiva de género, creadora del software de AymurAI, el cual anonimiza documentos judiciales sobre violencia de género, creando bases de datos abiertas que permiten mejorar la comprensión y el abordaje de la violencia de género en el sistema judicial argentino. Feldfeber planteó que la creación de estas tecnologías que han generado grandes impactos, son realizadas por pocas empresas y el enfoque que se le está otorgando para su crecimiento no es el de solucionar problemas humanitarios, sino el de cumplir necesidades comerciales que benefician a unos pocos.

Es indispensable incentivar la conversación de las nuevas tecnologías, seguir investigando y entrenar el músculo del pensamiento crítico sobre el futuro de la IA. Tenemos excelentes modelos de lenguaje grande, ahora sigamos avanzando y descubramos formas en las que la IA ayude a cubrir necesidades humanitarias que tienen a millones en situaciones complejas. Convirtamos la tecnología actual en un motor que impulsa y revolucione nuestro diario vivir. Porque esa es la idea, ¿no? Trabajar hoy en tecnologías, no solo con el fin de innovar, sino que para crear herramientas que realmente impulsen el bienestar de la humanidad.