Desde tu copia ejecuta las 3 primeras celdas en orden. Dale a ▶️ y cuando veas el✔️, ejecuta la siguiente.
Cuando ejecutes la 1ª celda te pedirá conectar y acceso a tu drive. Si a todo.
3⃣ En la siguiente celda, ve al enlace y acepta los términos.
Luego pega tu token de Huggingface y ejecuta la celda.
4⃣ Rellena SUBJECT_NAME con Person.
Y INSTANCE_NAME con tu nombre (si te llamas Elon Musk, entonces no, tiene que ser un nombre que la IA no relacione con nadie)
Luego ejecuta la celda y mientras se está ejecutando sube tus fotos (yo he usado 5, pero cuantas más mejor lo hará)
5⃣ La siguiente celda de [Optional] sáltala, no la ejecutes.
Ahora ejecuta la celda de Start DreamBooth.
*Esta si tardará un buen rato porque está entrenando el modelo.
6⃣ Última celda, ya casi estamos.
En INSTANCE__NAME escribe el nombre que pusiste antes y ejecuta la celda.
Mientras se está ejecutando te saldrá un enlace temporal similar a este: 22222.gradio.app
Y ahí ya puedes acceder a una interfaz para generar tus imágenes
7⃣ NOTA:
Ese enlace es temporal y solo estará disponible durante 72 horas siempre que sigas ejecutando el Colab (la última celda debe estar en ejecución).
Pero Google Colab tiene un uso limitado, así que no lo dejes durante mucho tiempo o se te acabará.
8⃣ PROBLEMAS: Si los resultados son una 💩 puede ser por varios motivos:
- Las imágenes dadas son una mierda (pero las mías también y me funciona)
- Has hecho algo mal en el proceso (revísalo)
- Steps bajos (súbelo a mínimo 50)
- Los prompts dados son una mierda (hay 1 truco ⤵️)
9⃣ TRUCO
Ve a lexica.art busca "Elon Musk" o cualquier otro famoso. Elige una imagen buena, copia el prompt y cambia su nombre por el tuyo.
Y así puedes generar imágenes tan chulas como esta (os vais a hartar de verme la cara, ahora quiero ver las vuestras 🤣)
Han pasado solo 24 horas de este hilo.
Y 3 días desde que salió Whisper.
Y ya existen todas estas herramientas GRATIS creadas con WHISPER:
🔹 Audio a Texto
🔹 Audio a Texto + Traducción
🔹 Enlace de YT a Texto
🔹 Audio a Imagen
🔹 Short con subtítulos
🔸 Grabación de voz y Subir archivo mp3 > Texto:
GPT3 + Whisper (nuevo botón de micrófono)
(es la única que no es del todo gratis, pero se puede probar) beta.openai.com/playground
Esto de la IA va demasiado rápido. Me acuesto por la noche con una idea en la cabeza y cuando me levanto ya han desarrollado 3 ideas parecidas.
Voy a tener que cambiar mi descripción de "Ai, Sleep, SEO and Repeat" por "AI, No Sleep..." 🤣
La IDEA tiene que ver con WHISPER 🗣️
Whisper es una IA de transcripción de Audio a Texto que ha liberado OpenAi recientemente.
En principio, puede que no llame mucho la atención porque esto mismo se puede hacer con el micrófono de Google Docs y con otras aplicaciones desde hace tiempo.
Se puede usar también para extraer subtítulos de Youtube y crear artículos.
Seguro que esta técnica os suena. Ya la explicó hace mucho @chuisochuisez usando la web downsub.com o desde el propio YT en "mostrar transcripción".