09-12-2022 06:34 PM - editado 09-12-2022 07:01 PM
Desde hace ya varias décadas, el ser humano ha tenido un gran interés por crear una inteligencia artificial. La posibilidad de que una máquina pueda aprender, entender y razonar de la misma manera a como lo haríamos nosotros ha sido clave para el desarrollo de grandes hitos que van desde el “Test de Turín”; un procedimiento desarrollado en los 50 y usado para determinar si una máquina es capaz de imitar las respuestas humanas, hasta los primeros robots aspiradores o los asistentes de voz.
En este post @RubénG y yo nos centraremos en las diferentes inteligencias artificiales que han sido presentadas desde 2020 y que han supuesto un antes y un después en la manera en la que percibimos los sistemas de aprendizaje. Además, hablaremos de las polémicas que han causado y sus posibles usos de cara al futuro.
Hasta hace relativamente poco, este mundo parecía frío e inútil, pero la verdad es que en los últimos años, se ha avanzado a pasos agigantados. Para mostrarlo, probaremos uno por uno los principales sistemas inteligentes a los que ya se tiene acceso, mostrando ejemplos de lo que son capaces de hacer.
GPT-3 (año lanzamiento, 2020)
Se trata de una red neuronal desarrollada por OPEN-IA, capaz de reproducir de forma precisa el discurso de los seres humanos. En resumen, puede crear cualquier cosa que tenga estructura de idioma, responder preguntas, escribir ensayos, resumir textos largos, hacer traducciones, tomar notas e incluso crear código de programación en múltiples lenguajes (sí, es capaz de programar). Algunos ejemplos:
“Crea una lista de 5 preguntas en español para mi entrevista con un biólogo marino”
“Escribe un chiste sobre Samsung en español”
“Completa la siguiente oración con 50 palabras: La comunidad Samsung…”
“Haz una lluvia de ideas que combine un móvil Galaxy con el deporte”
Todos estos ejemplos sencillos ya demuestran su gran capacidad para analizar y crear texto, pero lo mejor son sus posibles aplicaciones en el mundo de la programación y el diseño de aplicaciones móviles o web.
Plugins basados en GPT-3 donde se le describe qué se quiere y directamente crea y programa todos los ítems de una web, ya son una realidad.
Clip (año lanzamiento, 2021)
Desarrollada también por OPEN-IA y basada en GPT-3, Clip es una inteligencia artificial capaz de analizar una foto, reconociendo al instante qué es lo que sucede en ella, analizando los diferentes elementos que la componen y clasificando la misma dentro de unos parámetros. De igual manera, dada una sentencia y unas fotografías, es capaz de elegir cuál de ellas la cumple de mejor manera.
CHATGPT (año lanzamiento 2022)
Al igual que Clip, se basada en GPT-3, es una inteligencia artificial que ha sido entrenada para mantener conversaciones con cualquier persona. Entiende preguntas con precisión y es capaz de dar respuestas muy completas y naturales, lo que hace difícil distinguir si el texto es generado por una IA o por un ser humano.
“¿Por qué una jirafa no puede conducir un avión?”
“Explica el concepto del infinito”
DALL-E 2, Stable Diffusion y MidJourney
Son tres de las las Inteligencias Artificiales más populares en generación de imágenes a día de hoy, todas lanzadas este año. La primera de ellas desarrollada también por OPEN-IA y basada en la red GPT-3, de la misma empresa. Gracias a que su arquitectura es de código abierto, otras empresas la usan junto con otras redes para generar sus propios modelos. Este es el caso de Stable Diffusion y MidJourney.
El objetivo de las tres es prácticamente el mismo, el de generar imágenes a partir de sentencias que introduce el usuario, con ligeras diferencias entre ellas. DALL-E 2 genera imágenes muy realistas, Midjourney tiene un toque más artístico y Stable Diffusion ofrece mucho detalle en todo lo que genera. Vamos a verlo introduciendo la misma sentencia y comparando resultados.
“Una casa en una isla en medio del océano, elegante, colores vivos, arte conceptual, imagen 4k, olas rompen contra las rocas”
Por orden DALL-E 2, MidJourmey y Stable Diffusion.
“Una pintura al estilo de Van Gogh de un hombre con un smartphone en las manos”
Por orden DALL-E 2, MidJourmey y Stable Diffusion.
“Cuerpo completo de un astronauta cyborg, flotando sobre la tierra, humo rodeándolo, visuales cinematográficos, arte conceptual”
Por orden DALL-E 2, MidJourmey y Stable Diffusion.
Además de poder generar fotos, DALL-E 2 ofrece herramientas de edición. En el siguiente ejemplo, ha expandido los límites del cuadro “La joven de la perla” de Johannes Vermeer usando sus algoritmos de predicción para generar esta impresionante imagen.
¿Nos pueden ayudar?
Estas imágenes generadas sorprenden por su buena calidad y resultado, esto hace que puedan ser súper útiles para cualquier tarea que requiera de ese tipo de material. Usar imágenes de stock es costoso y encontrar algo concreto puede ser difícil. Con las IAS esto se convierte en algo super barato, rápido y probablemente mucho más apropiado para informes, blogs o webs personales por su comodidad.
Esto ha provocado expectación entre las personas que lo prueban y es entendible, para la gran mayoría parece magia y ver unos resultados tan buenos es fascinante. Al igual que las llamas en una fogata son hipnóticas por sus patrones de luz que nunca se repiten, esto también lo es.
Representar escenas que nadie ha visto antes o que forman parte de nuestra imaginación es placentero, un placer similar a explorar un mundo en un videojuego. Crear obras únicas que solo han sido vistas por la persona que las pide, es una experiencia parecida a visitar un museo personal, lleno de todo aquello que siempre hemos querido materializar y que por falta de técnica o conocimiento no hemos podido hacer. Por otro lado está la constante sorpresa que se genera en el momento en el que una imagen se desvanece para preceder a otra nueva.
Polémicas
Más allá de lo llamativo, la realidad es que el acceso a estas plataformas ha generado cierta inquietud e incertidumbre en el mundo creativo y hay quién considera que el papel del ilustrador, dibujante o incluso del diseñador gráfico, corre el riesgo de ser sustituido. El hecho de que aparezca una herramienta tan potente para generar obras que pueda afectar a la capacidad de que los artistas generen un negocio con sus creaciones, el fácil acceso a estas plataformas a un nivel de calidad altísimo y las pocas barreras que existen para ello, son algunas de las máximas preocupaciones que existen a día de hoy y que han llevado a muchos a pedir que se restrinja o limite su uso.
Otro aspecto muy polémico es el de los derechos de autor. Estos algoritmos han sido entrenados con miles de millones de imágenes hechas por el ser humano, muchas de ellas con derechos de autor (que no se han tenido en cuenta en el proceso). Esto tiene gran importancia en otros sectores, porque ahora cualquiera puede disponer de imágenes en menos de un minuto, para usar dónde y cómo quiera. A día de hoy una obra creada única y exclusivamente por una inteligencia artificial no es considerada objeto de protección intelectual, para ello debe de existir un autor o persona física, aunque lo más probable es que esto cambie en un futuro cercano.
Estamos en un punto en el que la profesión creativa en general va a evolucionar y quizás parte de esta evolución vaya hacia el uso de una IA como otra herramienta más a la hora de desarrollar un trabajo diario.
el 09-12-2022 07:17 PM
el 09-12-2022 07:41 PM
el 09-12-2022 08:03 PM
Muy interesante🙌🏼
el 09-12-2022 08:20 PM
Espectacular post!
Gran trabajo los dos ^^
el 09-12-2022 08:22 PM
Ahora la que está más de moda es ChatGPT y es bestial lo que hace cuando le pides que te haga un trozo de código, o convertir un lenguaje de programación en otro.... me quedo sin trabajo antes de lo que pensaba xDD
el 09-12-2022 08:30 PM
09-12-2022 08:30 PM - editado 09-12-2022 08:31 PM
el 09-12-2022 08:34 PM
el 09-12-2022 08:37 PM