Javi López ⛩️ Profile picture
Comparto tutoriales, herramientas y noticias de IA. Fundador @Magnific_AI 🔥 Guía IAs: https://t.co/JApwm5Tmfo 🗞️ Newsletter: https://t.co/tMELO1P8Wk

Apr 12, 2022, 55 tweets

Mucho se ha hablado estos días de Dalle-2 🤖

No es para menos: es quizás el mayor logro en el campo de la IA hasta la fecha.

Quiero explicaros cómo este y otros modelos de IA moldearán nuestro futuro a pasos de gigante.

Os va a explotar la cabeza 🤯

Hilo largo 🧵👇

El otro día os hacía ya un avance:

Hoy quiero ahondar aún más en las implicaciones a corto, medio y largo plazo. Y en por qué creo que va a ser una tecnología disruptiva que va a cambiar muchas cosas.

No solo hablaré de Dalle-2, sino de la IA en general.

Por si no estabas al tanto: Dalle-2 es una IA que genera dibujos e imágenes de alta calidad a partir de una mera descripción. Parece magia, pero es realidad.

Por ejemplo, Dalle-2 recibió únicamente el texto: "A kid and a dog staring at the stars" y generó esta imagen.

Tremendo.

Antes de entrar en faena, otro par de ejemplos:

1/ "Illustration of independent researchers walking above ground out of mycelium".

2/ "Pastel hopeful and dreamy illustration of a girl blooming out of a lotus flower".

Puedes usar los hashtags #dalle o #dalle2 para ver más.

Dalle-2 no es aún público, pero un selecto grupo de personas relacionadas con @OpenAI ya tienen acceso. Y están publicando hilos con creaciones que cortan el hipo:

Dalle es capaz de crear cualquier cosa que le pidas y esto es una revolución en sí mismo.

Muchos se están centrando en lo que NO puede hacer a día de hoy. Señalando que "no es perfecto del todo", "un ilustrador lo haría mejor"...

Tienen razón. A día de hoy.

(Img. por Dalle-2)

Pero hemos pasado en tal solo un año de un "aguacate-silla" que hasta un niño podría pintar (con Dalle-1) a una ilustración de una calidad que antes nos hubiera parecido ciencia ficción con Dalle-2.

Y esto es solo el principio.

Señalar hoy las imperfecciones de Dalle-2, una tecnología que está aún en pañales, es como mirar a la bombilla de Edison y decir: "Oye, no da mucha luz, la del sol es mejor... y encima está mal soldada".

Y esto va a ir mucho más rápido que los usos de la electricidad.

Estas reacciones son naturales. Lo que los humanos creíamos algo único e inherente a nuestra especie, la creatividad, ahora es terreno también de la IA.

¿Somos capaces de ver las implicaciones? ¿Del impacto profundo que tendrá en nuestro futuro?

(Img. por Dalle-2)

En los inicios de una tecnología es difícil ver las consecuencias, alcance y usos futuros. Algo parecido pasaría al ver estos armatostes en los comienzos de la electricidad.

Un día estamos riéndonos de una silla-aguacate y al siguiente nos ha barrido la ola.

Si en apenas un año Dalle y otros modelos han dado estos saltos. ¿De qué serán capaz en otro año? ¿Y en 10? ¿Y en 50? ¿Hacia qué consecuencias lógicas nos lleva este camino?

Para ahondar en las implicaciones permitidme entrar en el campo de la especulación.

(Img. por Dalle-2)

Voy a intentar no irme por los derroteros de la AGI (Artificial general intelligence: una IA consciente de sí misma), para eso mejor Tim Urban: waitbutwhy.com/2015/01/artifi…

Pero sí, creo que estamos actualmente en la primera de las imágenes.

Y la segunda me asusta. Me da vértigo.

Antes de nada, las bases.

Estos son hoy en día los 3 modelos de IA más avanzados:

1/ GPT-3: genera lenguaje escrito.
2/ PaLM: capaz de razonar como un niño de 9-12 años.
3/ Dalle-2: nuestro Velázquez particular.
4/ Copilot: asistente para desarrolladores.

(Img. por Dalle-2)

Un detalle importante de estos modelos es que mejoran mucho con una simple cuestión de fuerza bruta. Es decir, entrenando el modelo con más datos generará mejores resultados.

Pero los investigadores seguirán iterando no solo en la dirección de fuerza bruta, sino en todas.

Podríamos argumentar que lo que hacen estos modelos no es crear. Que son meros trucos estadísticos.

¿Pero hasta qué punto la creatividad humana no es más que un truco estadístico combinando lo que captan nuestros sentidos para crear algo "nuevo"?

(Img por Dalle-2)

Y si vamos más allá... ¿no son la consciencia e inteligencia humanas también meros trucos estadísticos orquestados por nuestras neuronas?

En realidad, da igual cómo lo llamemos. La IA ya es una realidad. Y ha entrado en una espiral de iteración y mejora continua.

Una de las frases que más vamos a oír en los próximos años en cuanto a creación de contenidos será esta:

"¿Lo has hecho de cero (refiriéndose a una ilustración, un texto, una melodía, etc.) o has usado IA de apoyo?"

(Img. por Dalle-2)

Las implicaciones a más corto plazo de modelos como Dalle-2 serán las de un nuevo set de herramientas de edición brutales.

En pocos años estarán totalmente integradas en nuestro móvil para retoque fotográfico y también en las suites de edición profesionales como Photoshop, etc.

Dalle-2 permite hoy mismo retocar las imágenes al nivel de cambiar cualquier elemento que haya en ellas.

Hasta el extremo de cambiar un perro por un gato y que quede perfectamente integrado.

Pronto no podremos creernos ninguna fotografía (todavía menos, me refiero 🤣).

Cualquiera con un simple móvil podrá "adecentar sus fotos" ya no solo con filtros, sino añadiéndole todo un universo: un árbol, un portal dimensional, a Chiquito de la Calzada...

Algo así será posible en unos años: a partir de una foto movida del móvil, dejarla preciosa a golpe de click y añadirle cualquier elemento que nos dé la gana, como un castillo.

Es más. Podremos girar el castillo y ver cómo se adapta la iluminación.

(Img. retocadas, figurativo)

Dalle-2 permite también ya, a partir de una imagen, crear tantas variaciones de ella como queramos.

¿Te gusta ese icono de stock o esa ilustración de algún artista? Usando Dalle-2 podrás tener una variante de ella, en principio libre de copyright, para usar donde quieras.

También podremos coger un fondo de por ejemplo Monkey Island, dárselo a Dalle y decirle: "genérame algo de ese estilo".

Y chimpún. ¡Peleas como una vaca!

Ya hace cosas parecidas, y en el futuro lo hará mejor.

Ej. real:

¿Cambiarán por tanto las leyes del copyright para poder adaptarse a estos enormes cambios?

El tiempo dirá.

Esta tecnología se va a convertir en el estándar de ilustración, diseño y edición de imágenes.

Es una herramienta que nos abrirá un nuevo horizonte de creatividad y nos permitirá explorar a la velocidad del rayo un set ilimitado de nuevos conceptos e ideas.

(Img. por Dalle-2)

Y no solo dando las indicaciones por texto... ¿te imaginas seleccionar a una persona en una foto y poder moverle los brazos o el cuerpo y que la iluminación se adapten como si fuera 3d? ¿o disfrazarla o cambiarle la ropa? ¿o transformarla en un lagarto?

La aparición de Deep Blue en el ajedrez y AlphaGo en el Go provocó que los jugadores humanos incrementaran su nivel.

A corto plazo creo que veremos algo parecido con los diseñadores, ilustradores y artistas.

(Img. por Dalle-2)

Pero incluso hoy en día, cualquier persona con acceso a Dalle-2 (que insisto, está en pañales), podrá ya utilizar las imágenes resultantes para lo que quiera: iconos, ilustraciones para un libro, etc.

Destruirá empleos. Y creará otros.

En palabras de Sam Altman de @OpenAi:

Y en unos años, conforme mejore... ¿Se podrán generar imágenes e ilustraciones de cero indiscernibles de las del mejor artista humano? ¿Pasaremos de buscar imágenes e ilustraciones o encargarlas a simplemente generarlas al vuelo?

Y de momento solo he hablado del plano visual.

Los modelos de IA impactarán también en los escritores, músicos y resto de creativos.

¿Dónde estarán los límites de lo que podrán generar?

Dando un salto en el tiempo a los próximos 10-50 años, creo que el grueso de los contenidos que consumiremos en el futuro lo generarán las IAs.

Y no solo a las ilustraciones, todo: novelas, películas, videojuegos, música, etc.

¿Imposible?

(Img. por Dalle-2)

¿Una nueva canción con la voz y estilo de Michael Jackson?
¿Una nueva película de Star Wars con actores falsos?
¿Una novela ambientada en el universo de Harry Potter?

Se podrán generar infinitas creaciones, al vuelo, a golpe de un click.

¿Imposible?

Ante un cambio de paradigma semejante, ¿cómo cambiará el mundo?

Ahora muchas personas consumimos un mismo contenido (una canción, un película, una novela).

En el futuro, cada uno tendremos nuestros contenidos exclusivos creados a la carta para nosotros.

(Img. por Dalle-2)

Lógicamente unas cosas vendrán mucho antes que otras.

Por lo que parece el plano visual ha tomado la delantera con Dalle-2.

Pero creo que GPT-4, que está al caer, nos va a dejar con la boca abierta en cuanto a generación de texto se refiere.

¡Este tren va muy rápido!

¿Desaparecerán por tanto los artistas?

No lo creo. De la misma forma que sigue habiendo jugadores de ajedrez/go profesionales aunque las IAs les superen.

Pero creo que el arte quedará para competiciones entre humanos, como objeto de lujo o por mero hobby.

(Img por Dalle-2)

Quizás pasemos a llamar "arte" únicamente a lo que produzca un humano... aunque una máquina podrá hacerlo mejor en el futuro.

Y tendrá valor "artístico" quizás justo por haber sido creado por un humano sin asistencia de una IA.

(Img. por Dalle-2)

¿Y matará la creatividad humana el hecho de que el grueso de los contenidos sean generados por IAs?

No lo creo. Si acaso en un período de transición golpeará nuestro ego. El orgullo humano puede quedar herido: la creatividad no es una cualidad única nuestra.

(Img. por Dalle-2)

Pero finalmente tendremos una universo de creaciones a nuestra disposición con el que poder interactuar.

Más que una herramienta de edición, más que un videojuego, más que una película... Imagina un entorno en el que podrás crear lo que se te antoje con el apoyo de las IAs.

Y esto hará que cambien muchas cosas.

Ya no pagaremos por el contenido creado, sino por dónde se ejecutan estos modelos y el acceso a estos servicios de "streaming".

Todas las empresas (como Adobe) que lancen productos para creadores necesitarán acceso a estos modelos de IA.

Así que o bien tendrán que desarrollarlos y mantenerlos en sus servidores, o bien tendrán que pagar por su uso a OpenAI/Google/NVIDIA/etc.

(Img. por Dalle-2)

A corto y medio plazo, muchas empresas pasarán a ser totalmente dependientes de estas otras empresas que dispondrán de los recursos y capacidad para entrenar los modelos de IA y ofrecer sus servicios (Google/OpenAi/NVIDIA/etc).

Puede que con el tiempo esa ventaja competitiva se suavice, conforme la capacidad de cálculo de los ordenadores siga creciendo.

Sobre todo teniendo en cuenta que lo realmente costoso es entrenar los modelos, no tanto la generación en sí.

Estas empresas necesitarán asegurar su cadena de suministros de ordenadores y su acceso a los chips.

De la misma forma que Tesla compra litio, tendrán que desarrollar sus propios chips o asegurarse el acceso a su compra.

(Img. por Dalle-2)

Otra cosa que quizás ocurrirá será que las webs con contenido generado por usuarios (FreePik, StackOverflow, Reddit, Quora, Unsplash, etc) cambiarán sus términos de uso para cobrar royalties cuando sus datos sean usados para entrenar modelos de IA.

Otra de las implicaciones será la proliferación de fake news.

Imagina vídeos falsos perfectos de un evento como una guerra, de presidentes, políticos, etc...

¿Podrán otros modelos de IA diferenciar los que son reales de los que no? Será una batalla digna de ver.

Y hasta aquí solo habíamos hablado de algunas de las ramas del campo de la IA.

Hay más, mucho más.

La IA tendrá aplicaciones en prácticamente todos los campos importantes: biotecnología, ciencia, robótica/automatismos, educación... Y por supuesto y por desgracia, la guerra.

Hace un año, por ejemplo, un modelo de IA permitió encontrar la solución al plegado de las proteínas un problema que llevaba décadas estudiándose.

computerhoy.com/noticias/life/…

Otro equipo consiguió el récord de secuenciación de ADN: muycomputerpro.com/2022/02/21/ia-…

Saltando 50 años en el futuro, pero todavía sin llegar al punto de Singularidad/AGI (eso da para otro hilo), la IA podrá quizás ayudar a eliminar el cáncer y otras enfermedades.

O directamente a mejorar el genoma humano (y no entro en las implicaciones éticas que esto tiene).

Los gobiernos antes o después se darán cuenta de que tener la infraestructura computacional para entrenar modelos de IA es esencial para la seguridad nacional.

Y no solo eso, deberán asegurarse la supremacía en IA.

China parece tenerlo claro: techwireasia.com/2021/10/china-…

No quiero alargar más el hilo.

De todo esto, a mí lo que me fascina y me apasiona es pensar en cómo la IA va a transformar el futuro de la humanidad.

Y a la vez, si pienso en una futura AGI, me crea un respeto casi reverencial... y algo de miedo.

(Img. por Dalle-2)

La IA ya está aquí. Y viene con fuerza.

Será un agente del cambio de magnitud muy superior a la revolución industrial. Quien no sepa verlo o bien está ciego o bien está mirando para otro sitio.

En cualquier caso, va a ser una época muy interesante.

(Img. por... adivina 🤖😂)

Si te gustan estos temas, anímate a seguir a @dotcsv, @antor, @sama, @kirai, y @nataliavartan.

No todas ellas hablan exclusivamente de IA pero son personas realmente interesantes relacionadas con las vanguardias científicas.

Gracias por leer hasta aquí.

Si te ha gustado y quieres animarme a que escriba más hilos parecidos en el futuro (tengo en mente uno explicando cómo funciona Dalle-2 por debajo y otro sobre AGI), un RT al primer tweet me dará ánimos 🙂👇

¡Muchas gracias!

Aprovecho también para comentaros que estoy escribiendo una novela de ciencia ficción:

🪐 CF «dura». Cierto rigor científico.
☠️ Catástrofes.
👾 Civilizaciones extraterrestres.
🤖 IAs.

Y puedes apuntarte aquí para estar al tanto de lo que publique: getrevue.co/profile/javilop

Share this Scrolly Tale with your friends.

A Scrolly Tale is a new way to read Twitter threads with a more visually immersive experience.
Discover more beautiful Scrolly Tales like this.

Keep scrolling