Scraping educativo. Episodio 0. En el episodio de hoy, cómo obtener datos de forma periódica de una web SIMPLE para almacenarlos o publicarlos en otro lugar.
- Sin código.
- Con Make. ¿No tienes cuenta? Empieza aquí: make.com/en/register?pc…
¡Vamos al lío!
1/ He decidido empezar con esta web que han publicado en esta cuenta tan interesante para seguir.
Y es que resulta que una de las web de las que beben los datos que publican es www. poolred . com
Procedemos a navegar y analizar la web y descubrimos… 👇🏼
2/ Que huele a rancio. El HTML digo. No nuestro aceite que es el mejor. Más años funcionando que Webarchive. Si observas el código de esta url poolred.com/Publico/Precio… verás un "mensaje oculto". Eso ya te da alguna pista de que no será muy difícil de extraer la información. 👇🏼
3/ El punto álgido viene al descubrir *tablas HTML* Y eso, ya da regustirrinín 😝 Aunque mejor aún es cuando descubres que dentro de la tabla existen etiquetas HTML de tipo SPAN cuyo ID es único. Te piden a gritos que saques la info de allí… con finales educacionales, claro.
👇🏼
4/ Y en este punto, nos ponemos manos a la obra para extraer la info. Lo único que tenemos que hacer es inspeccionar el HTML, buscar el SPAN, copiar el XPATH y hacer una pequeña modificación para obtener el valor de AOVE. Repetimos para AOV y Lampante y los guardamos.
👇🏼
5/ Abrimos Make. ¿Todavía no abriste tu cuenta? 👉🏼 make.com/en/register?pc… 5.1 Creamos un nuevo escenario. 5.2 Agregamos un módulo HTTP y pegamos la url del tuit #2. 5.3 Agregamos 3 módulos XPATH Query. Encadenamos unos a otros y los completamos como en este video…
👇🏼
6/ El resultado final, cuando ejecutas ese escenario lo verás en el siguiente video y es que habrás obtenido el precio del AOV, AOVE y Lampante por tonelada.
¿Qué es lo que faltaría? Seguir agregando módulos para enviar los datos "a otro lugar…".
7/ Conclusión: más o menos eficiente, Make te permite hacer cosas muy interesantes para las que posiblemente tu cabeza no estaba preparada. Lo más importante no es la herramienta sino la #creatividad con la que la empleas para cumplir tus objetivos.
8/ Para los que llegan hasta al final, tres cosas más:
Tratar a cada persona como corresponde es importante a la hora de dirigirte a ella con un determinado mensaje.
En ciertas ocasiones no pedimos muchos datos para no crear fricción durante un proceso de compra y/o registro. Como por ejemplo: el género.
¡API-man al rescate! 👇🏼
1/ Antes de seguir, *PUBLISPAM* apilovers.substack.com Para descubrir API curiosas y algún que otro email eventual.
1.1/ Follow si te interesa el #SEO, #WordPress#Automation#Dev
Disclaimer: dependiendo de tus Workflows, Automatizaciones, etc… podrá serte de >/< utilidad.
👇🏼
2/ Pues resulta que existe una API con un montón de créditos gratuitos para usar libremente que te permite hacer cosas como:
*Name Genderizing* o el proceso para identificar el género de una persona en función de su nombre.
¿Cómo funciona? 1. Necesitas cuenta en openai.com/api 2. Haces una copia del libro 3. Extensiones > App Script…
👉
4. Ejecutas el Script y le das a aceptar todo. A lo no seguro también. Si te fías, te fías y punto. Lo hice yo y es 100% seguro siempre que no compartas tu copia del libro con personas de no confianza :P 5. Si todo fue bien, ya tienes acceso a las diferentes funcionalidades.
👉…
Aunque en realidad vine a enseñar otra forma de conectar para #NoCode(rs) 👉
En primer lugar para poder hacerlo así, la API REST de tu sitio debe estar accesible. Normalmente lo estará aunque a veces la tengamos capada directa o indirectamente. Para saberlo, entra aquí
¿Sabías que Google tiene disponible un API que te permite consultar las SERP para un país e idioma específico y además, gratis? ¿Sabes que gracias a esta funcionalidad podrías crearte un rank tracker super sencillo para el Top 10 de las SERP? #SEO Te explico a continuación 👉
En primer lugar, tendrás que crear un motor de búsqueda personalizado de Google y puedes hacerlo desde aquí: programmablesearchengine.google.com/cse/all Esta herramienta tienen infinitas posibilidades ya que puedes crear desde un buscador de contenidos para tu web como para otroas webs. Sigamos… 👉
Añadimos nuestra primer búsqueda programable, incorporamos un dominio – no es importante para nuestro objetivo –, elegimos el idioma – tampoco es relevante –, le damos nombre y pulsamos en crear. 👉