Scraping educativo. Episodio 0. En el episodio de hoy, cómo obtener datos de forma periódica de una web SIMPLE para almacenarlos o publicarlos en otro lugar.
- Sin código.
- Con Make. ¿No tienes cuenta? Empieza aquí: make.com/en/register?pc…
¡Vamos al lío!
1/ He decidido empezar con esta web que han publicado en esta cuenta tan interesante para seguir.
Y es que resulta que una de las web de las que beben los datos que publican es www. poolred . com
Procedemos a navegar y analizar la web y descubrimos… 👇🏼
2/ Que huele a rancio. El HTML digo. No nuestro aceite que es el mejor. Más años funcionando que Webarchive. Si observas el código de esta url poolred.com/Publico/Precio… verás un "mensaje oculto". Eso ya te da alguna pista de que no será muy difícil de extraer la información. 👇🏼
3/ El punto álgido viene al descubrir *tablas HTML* Y eso, ya da regustirrinín 😝 Aunque mejor aún es cuando descubres que dentro de la tabla existen etiquetas HTML de tipo SPAN cuyo ID es único. Te piden a gritos que saques la info de allí… con finales educacionales, claro.
👇🏼
4/ Y en este punto, nos ponemos manos a la obra para extraer la info. Lo único que tenemos que hacer es inspeccionar el HTML, buscar el SPAN, copiar el XPATH y hacer una pequeña modificación para obtener el valor de AOVE. Repetimos para AOV y Lampante y los guardamos.
👇🏼
5/ Abrimos Make. ¿Todavía no abriste tu cuenta? 👉🏼 make.com/en/register?pc… 5.1 Creamos un nuevo escenario. 5.2 Agregamos un módulo HTTP y pegamos la url del tuit #2. 5.3 Agregamos 3 módulos XPATH Query. Encadenamos unos a otros y los completamos como en este video…
👇🏼
6/ El resultado final, cuando ejecutas ese escenario lo verás en el siguiente video y es que habrás obtenido el precio del AOV, AOVE y Lampante por tonelada.
¿Qué es lo que faltaría? Seguir agregando módulos para enviar los datos "a otro lugar…".
7/ Conclusión: más o menos eficiente, Make te permite hacer cosas muy interesantes para las que posiblemente tu cabeza no estaba preparada. Lo más importante no es la herramienta sino la #creatividad con la que la empleas para cumplir tus objetivos.
8/ Para los que llegan hasta al final, tres cosas más:
Ya está disponible el nuevo módulo de @OpenAI en @make_hq 🔥🔥🔥 Te explio qué puedes hacer con él: en primer lugar, deberás conectar la cuenta con la clave API. La ORG no es obligatoria. #GPT3 Y recuerda: no es #ChatGPT sino la API openAI GPT-3 😎 #automations
1/ Crear un completado que viene a ser lo que le llamamos "pedirle o preguntar algo", "chutarle un prompt" :) Tienes la posibilidad de pedirle múltiples variantes y además, si quieres que te incluya o no en la respuesta el prompt inicial que le pasaste.
2/ Moderación. La misma API que estaban utilizando en el #ChatGPT. En teoría, deberías pasárselo como entrada antes de convertirlo en un prompt y por ejemplo, poner un router para dejar pasar o no la petición. Podríamos llamarlo directamente, la censura de openaAI :)
Aquí te dejo unos cuantos ejemplos de maquetación #HTML y #CSS con diferentes frameworks o sin ellos con la ayuda del polifacético #ChatGPT …👇
1/ Maquetación de una página "acerca de" genérica con #Bootstrap5 con varios párrafos y una imagen.
2/ Maquetación de una Home generalista para una Startup con #tailwindcss. Algunas pequeñas correcciones ¡y voilá! Obviamente, se trata de un comienzo. Sigamos adelante…
Pues sigue los pasos que te dejo a continuación que no son pocos :) Let's go! 🧵👇
1/ Carpeta para el proyecto. 2/ Grábate un clip de video con webcam + OBS o tu app favorito. Lo + importante:
- Mínimo HD.
- Cámara que se mueva despacio.
- Que no aparezcan elementos nuevos en el plano: objetos o partes de cuerpo.
- Bien iluminado
- 10 seg. de largo aprox…
👇
3/ Escala a 512px de alto y luego recorta tu video a 512x512px con tu app favorita. También puedes hacerlo online con ezgif.com
3.1/ Guarda el video resultante en tu carpeta de proyecto.
No sé si te habrás dado cuenta, pero NO todos los prompts están en lexica.art … ¿Y si te digo que la #iA también te puede ayudar? A mi se me ocurrió lo siguiente… 1/ Abro promptbase.com (de pago) y busco lo que me gusta y que no encontraba free. 👇
2/ Me descargo la fotografía, vuelvo a Lexica y le digo que busque por relevancia de imagen…
Puede ocurrir que la encuentres a la primera o que aún siga sin dar con la clave.
En mi caso, sigo con la investigación y paso al siguiente nivel: Replicate.com
👇
Tratar a cada persona como corresponde es importante a la hora de dirigirte a ella con un determinado mensaje.
En ciertas ocasiones no pedimos muchos datos para no crear fricción durante un proceso de compra y/o registro. Como por ejemplo: el género.
¡API-man al rescate! 👇🏼
1/ Antes de seguir, *PUBLISPAM* apilovers.substack.com Para descubrir API curiosas y algún que otro email eventual.
1.1/ Follow si te interesa el #SEO, #WordPress#Automation#Dev
Disclaimer: dependiendo de tus Workflows, Automatizaciones, etc… podrá serte de >/< utilidad.
👇🏼
2/ Pues resulta que existe una API con un montón de créditos gratuitos para usar libremente que te permite hacer cosas como:
*Name Genderizing* o el proceso para identificar el género de una persona en función de su nombre.
¿Tienes en mente crear algún producto o servicio digital relacionado con generación de imágenes mediante #InteligenciaArtificial? Una buena forma de empezar tu MVP sería con ayuda de API que están muy demandadas aunque mucho menos que las A100 GPUs 80Gb :P ¡Vamos al lío! 🔥🔥🔥
1/ En replicate.com encontrarás un bonito catálogo de modelos para ejecutar en tu ordenador, en la propia web o en formato API. Lo más destacable:
- Stable Diffusion 1.4
- Image2Text.
- Image2Prompt.
- Image Restoration.
- Super resolution.
- Tileable textures.
👇🏼
2/ beta.dreamstudio.ai donde puedes usar la interfaz web para generar imágenes mediante Stable Diffusion 1.5. Si te diriges al apartado de membresía, tienes la compra por volumen sin suscripción y la doc a la API. github.com/Stability-AI/s…
👇🏼