En el🧵de hoy, te voy a enseñar algunas expresiones regulares simples para que puedas empezar a usarlas ya. Ahorrán mucho tiempo, y dominar algunas te ayudará.
No para posicionar, pero para trabajar de manera más eficiente.
🤷♂️¿Que son las expresiones regulares (REGEX)? 🤷♂️
Sirven para describir cadenas de texto, números y caracteres especiales con el fin de buscarlas o manipularlas.
Se pueden usar en la gran mayoría de las herramientas, como por ejemplo Sheets:
Las REGEX pueden asustar, pero te voy a detallar cuáles son las más comunes y qué hacen.
Usaré regex101.com en mi pantallazos, que te permite validar tus REGEX de manera sencilla.
1. Punto (.)
Representa cualquier carácter.
2. Estrella (*)
Indica que el elemento al que sigue se puede repetir 0 o más veces. Si lo combinamos con el punto, significa "cualquier cadena".
Similar: el más (+) que indica 1 o más veces.
3. Barra vertical (|)
Significa OR. Permite indicar varios valores que puedes estar buscando.
En mis ejemplo, ves que la segunda opción no coincide con mi REGEX porque la extensión (co.uk) no está dentro de mis opciones.
4. Barra invetida (\)
Permite "escapar" un carácter para que se interprete literalmente (no con su significado REGEX).
En mi ejemplo, escapo el punto: quiero un punto sí o sí.
5. Signo de interrogación (?)
Indica que el elemento al que sigue es opcional.
En mi ejemplo, la barra final es opcional, por lo tanto mi REGEX coincide tanto con el primer texto como el tercero.
6. Barra invertida + d (\d)
Indica un carácter númerico.
Si lo combiamos con +, indicamos que queremos una cadena de 1 o varios dígitos.
7. [a-z]
Indica una letra (minúscula).
* si quieremos una letra mayúscula, tenemos que usar [A-Z]
* si queremos una letra mayúscula o minúscula, tenemos que usar [a-zA-Z]
8. {número}
Indica que el elemento al que sigue se repite X veces.
Por ejemplo, si buscamos una URL con 3 números:
** Caso práctico **
Aplicamos todo lo que acabamos de aprender. Tengo tres URLs y quiero capturar los dígitos situado al final de las URLs, si se trata del blog.
No puedo usar \d+ porque capturaría también el número si el contenido no pertenece al blog 🤔
Si modificamos un poco nuestra REGEX, podemos capturar lo que nos interesa.
.* : lo que sea
liligo\.(fr|es): liligo.fr o liligo.es
\/blog\/: carpeta blog
[a-z-]+: palabras separadas por un -
(\d+)\: lo que queremos (por eso usamos paréntesis)
¿Te parece complicado?
Es normal, al inicio aprender las REGEX cuesta . Usa regex101.com para practicar y irás mejorando poco a poco.
Y podrás trabajar de manera más eficiente ⚡️
• • •
Missing some Tweet in this thread? You can try to
force a refresh
Cuando trabajaba en agencia, algunos clientes entraban después de una migración complicada, y una de las primeras tareas siempre era arreglar o implementar redirecciones.
¿Cómo accelerar este proceso que a nadie nos gusta?
Abro corto🧵
Si tienes suerte, puedes definir equivalentes entre tu estructura antigua y nueva usando algo (un elemento de la URL, del código fuente, ...).
Pero no siempre es tan fácil.
Entonces, ¿qué hacemos?
1. Recuperamos un listado de URLs antiguas. Puedes usar el histórico de Google Analytics pero también la API de archive.org:
🤔 ¿Qué podemos aprender de la estrategia On-page de Papernest 🤔
Esta empresa 🇫🇷 ha trabajado bastante bien su SEO y muchas deberían seguir su ejemplo.
Te cuento todo en otro (largo) hilo
⬇️⬇️
Para que tengas un poco de contexto y si no conoces la empresa, Papernest "pretende facilitar las gestiones administrativas que se derivan de realizar una mudanza".
Existe en España también pero me enfocaré en el mercado francés, porque lleva más tiempo allí.
Para una empresa cuya oferta es bastante específica, puede sorprender el número de páginas indexadas.