Scraping educativo. Episodio 0. En el episodio de hoy, cómo obtener datos de forma periódica de una web SIMPLE para almacenarlos o publicarlos en otro lugar.
- Sin código.
- Con Make. ¿No tienes cuenta? Empieza aquí: make.com/en/register?pc…
¡Vamos al lío!
1/ He decidido empezar con esta web que han publicado en esta cuenta tan interesante para seguir.

Y es que resulta que una de las web de las que beben los datos que publican es www. poolred . com

Procedemos a navegar y analizar la web y descubrimos… 👇🏼
2/ Que huele a rancio. El HTML digo. No nuestro aceite que es el mejor. Más años funcionando que Webarchive. Si observas el código de esta url poolred.com/Publico/Precio… verás un "mensaje oculto". Eso ya te da alguna pista de que no será muy difícil de extraer la información. 👇🏼
3/ El punto álgido viene al descubrir *tablas HTML* Y eso, ya da regustirrinín 😝 Aunque mejor aún es cuando descubres que dentro de la tabla existen etiquetas HTML de tipo SPAN cuyo ID es único. Te piden a gritos que saques la info de allí… con finales educacionales, claro.
👇🏼
4/ Y en este punto, nos ponemos manos a la obra para extraer la info. Lo único que tenemos que hacer es inspeccionar el HTML, buscar el SPAN, copiar el XPATH y hacer una pequeña modificación para obtener el valor de AOVE. Repetimos para AOV y Lampante y los guardamos.
👇🏼
5/ Abrimos Make. ¿Todavía no abriste tu cuenta? 👉🏼 make.com/en/register?pc…
5.1 Creamos un nuevo escenario.
5.2 Agregamos un módulo HTTP y pegamos la url del tuit #2.
5.3 Agregamos 3 módulos XPATH Query. Encadenamos unos a otros y los completamos como en este video…
👇🏼
6/ El resultado final, cuando ejecutas ese escenario lo verás en el siguiente video y es que habrás obtenido el precio del AOV, AOVE y Lampante por tonelada.

¿Qué es lo que faltaría? Seguir agregando módulos para enviar los datos "a otro lugar…".
7/ Conclusión: más o menos eficiente, Make te permite hacer cosas muy interesantes para las que posiblemente tu cabeza no estaba preparada. Lo más importante no es la herramienta sino la #creatividad con la que la empleas para cumplir tus objetivos.
8/ Para los que llegan hasta al final, tres cosas más:

- Si te gustó, dale ❤️ o 🔁

- Publico sobre G. Sheets, Automation, Scraping, WP y Dev. Sí, soy culo de mal asiento. Sígueme si te mola el tema.
- Descarga el escenario 👉🏼 mfacy.s3.eu-west-1.amazonaws.com/precio-aceite-…

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Ángel Cano Ydáñez

Ángel Cano Ydáñez Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @equisele

Oct 25
Tratar a cada persona como corresponde es importante a la hora de dirigirte a ella con un determinado mensaje.

En ciertas ocasiones no pedimos muchos datos para no crear fricción durante un proceso de compra y/o registro. Como por ejemplo: el género.

¡API-man al rescate! 👇🏼
1/ Antes de seguir, *PUBLISPAM*
apilovers.substack.com Para descubrir API curiosas y algún que otro email eventual.
1.1/ Follow si te interesa el #SEO, #WordPress #Automation #Dev
Disclaimer: dependiendo de tus Workflows, Automatizaciones, etc… podrá serte de >/< utilidad.
👇🏼
2/ Pues resulta que existe una API con un montón de créditos gratuitos para usar libremente que te permite hacer cosas como:

*Name Genderizing* o el proceso para identificar el género de una persona en función de su nombre.

👇🏼 Image
Read 8 tweets
Oct 5
Estaba viendo el directo de @chuisochuisez y ha mencionado el script de @Txtetxu1 que publicó el otro día que puedes ver aquí…

🚨Pues resulta que el otro día me puse y ¡joder! me salió un #appscript que en breve estará en el marketplace de add-on… 👉
Soy mú original y lo llame "#GPT3 Tools for #GoogleSheets" Y sí, es #Gratis.

¿Dónde puedes descargarte una copia? Aquí lo tienes: docs.google.com/spreadsheets/d…

¿Cómo funciona?
1. Necesitas cuenta en openai.com/api
2. Haces una copia del libro
3. Extensiones > App Script…
👉
4. Ejecutas el Script y le das a aceptar todo. A lo no seguro también. Si te fías, te fías y punto. Lo hice yo y es 100% seguro siempre que no compartas tu copia del libro con personas de no confianza :P
5. Si todo fue bien, ya tienes acceso a las diferentes funcionalidades.
👉…
Read 5 tweets
Sep 11
Amantes de @integromat @make_hq Hace unos días vi que "Make Connector" para #WordPress está bajo revisión desde el 3 de agosto. Sin embargo, aquí 👉 make.com/en/help/app/wo…, encontrarás "direct link".

Aunque en realidad vine a enseñar otra forma de conectar para #NoCode(rs) 👉
En primer lugar para poder hacerlo así, la API REST de tu sitio debe estar accesible. Normalmente lo estará aunque a veces la tengamos capada directa o indirectamente. Para saberlo, entra aquí

https://{tusitiowebcom}/wp-json/wp/v2/

Si ves algo así vamos bien.
El pretty print de json en #Firefox es nativo. Sin embargo, para verlo así en #Chrome, necesitas instalar: chrome.google.com/webstore/detai…

Si todo va bien hasta aquí, pasemos al escritorio… Crea un administrador aparte, ve a su perfil y localiza "Contraseñas de aplicación"
👉
Read 12 tweets
Feb 28, 2021
¿Sabías que Google tiene disponible un API que te permite consultar las SERP para un país e idioma específico y además, gratis? ¿Sabes que gracias a esta funcionalidad podrías crearte un rank tracker super sencillo para el Top 10 de las SERP? #SEO Te explico a continuación 👉
En primer lugar, tendrás que crear un motor de búsqueda personalizado de Google y puedes hacerlo desde aquí: programmablesearchengine.google.com/cse/all Esta herramienta tienen infinitas posibilidades ya que puedes crear desde un buscador de contenidos para tu web como para otroas webs. Sigamos… 👉
Añadimos nuestra primer búsqueda programable, incorporamos un dominio – no es importante para nuestro objetivo –, elegimos el idioma – tampoco es relevante –, le damos nombre y pulsamos en crear. 👉
Read 17 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us on Twitter!

:(