Post

How to get URL link on X (Twitter) App

On the Twitter thread, click on or icon on the bottom
Click again on or Share Via icon
Click on Copy Link to Tweet
Paste it above and click "Unroll Thread"!
More info at Twitter Help

Diario de un picateclas

@devruso

May 14, 2021 • 24 tweets • 7 min read • Read on X

Scrolly

Sheldon tenía un "Fun with Flags", yo tengo un "Fun with Strings". Por demanda popular, ¡DENTRO HILO! ⬇

Todo empezó hace un porrón de años cuando los arcanos de los 0 y los 1 inventaron la tabla ASCII.
Majestuosa tabla que contenía absolutamente todas las letras, números y símbolos. Todos los
que se les ocurrieron en 1 tarde, quiero decir.

Y todo era maravilloso, porque con 1 byte representábamos cualquier carácter.
Y para medir "la longitud" de una cadena nos bastaba con contar cuántos bytes tenía, porque 1 letra = 1 byte.
Y para pasar de mayusculas a minúsculas sumabas 32 al valor decimal del carácter y pista.

Luego vino una gente muy rara (fuera de yankilandia) y dijo algo de usar tildes, runas, escribir al revés en plan posesión demoniaca. En fin, una flipada del copón...

Unicode al rescate! Ponemos 4bytes por letra y con eso ya podemos crear una tabla ASCII XXL

Y por un momento parecía que todo estaba apañado. Excepto que no, porque eso de meter 4 donde antes cabía solo 1 no termina de funcionar bien, ni siquiera comprando la licencia del Winrar

"Pues hagamos que a veces los caracteres sean de 1 byte, a veces de 4, a veces de 2 o de 3, según por donde sople el viento".

Dicho y hecho! "UTF-8", "UTF-16", "ISO-8859-1" y 9157238 otros "charsets" al rescate! Porque cuantos más estándares, mejor!

Ahora metes "¡Qué mañana llevo!" en tu formulario de React, lo mandas a tu backend de PHP que lo lee como "!Qué manana llevo!" y este lo manda a tu base de datos MySQL que lo guarda como "�Qu� ma�ana llevo!"

"Bueno, pero una vez controlado el tema de charsets y usando el mismo en todos los sitios, todo funciona bien, no?"

Mmm.... casi!

Lo que dije antes, lo de "medir la longitud de las cadenas"... Os vais a reír, pero... resulta que ahora ya no sabemos ni como medirlas, porque...

"a" es 1 byte

"ñ" son 2 bytes

"ƒ" son 3 bytes

el glifo (emoji) "😂" son 4 bytes (1 codepoint)

el glifo "👩‍👩‍👦‍👦" en realidad son 4 glifos "unidos" (👩+👩+👦+👦), que son 4 codepoints unidos con 3 "caracteres de union"), 25 bytes en total (7 codepoints, pero sólo 1 glifo)

Eso ocurre porque Unicode define caracteres que pueden modificar e incluso unir otros caracteres, entre otras cosas...

Gracias a esos "modificadores" la letra "ñ"

(U+00F1, 1 carácter, 1 codepoint, 2 bytes)

también puede representarse como la union del carácter "n"

(U+006E, 1 carácter, 1 codepoint, 2 bytes)

y el carácter "~"

(U+0342, 2 bytes)

➡ "n͂" (1 carácter, 2 codepoints, 4 bytes)

Supongo que nada me impide modificar caracteres varias veces... ¯\_(ツ)_/¯

Ese último garabato que se ve ahi es un único glifo con 16 codepoints y un total de 31 bytes. Si nos ponemos tontos... A̷̢̢̛̛̛̱̳͚̺̙͙̗͎̱̖̲̙̬͚̳̟͔̤̲̻̪͇̪͕͖͓͔̤̟̫̬̙̯̻͙̥̣̝̮̭͓̱̥͇͔̗̗̳̜͚͊̉̐̐̀͋̋͑͐̅̑̆̌̇̂̓̂̅̆̌̈́́́̎̊̏͋̿̎͌̐̎̕̚̕͘͘͜ͅ ...😂

Entonces que miden las funciones tipo strlen()? Miden caracteres? Miden bytes? Miden codepoints? Miden glifos?

Ni nos ponemos de acuerdo en decidir que deberían medir:

"Vale, me queda claro. No se pueden 'medir' cadenas de texto. Pero excepto esto, el resto bien, verdad?"

Pues... tampoco sabemos como convertir entre minúsculas y mayusculas...😂

Verás... La letra "ß" (aleman) ni siquiera tiene mayúscula. No existe!

Pero las funciones "toUpperCase()" de los lenguajes de programación algo deben hacer, así que...

La mayúscula "Σ" griega se convierte en minúscula "ς" únicamente si es la última letra de la palabra, en caso contrario "σ".

En holandés, el dígrafo "IJ/ij" se capitaliza entero, es decir, "IJsland" en vez de "Ijsland".

En hawaiano la "okina" (U+02BB) (visualmente se representa con un apóstrofo) es una consonante que modifica el sonido de la letra que precede. Al capitalizar una palabra con okina, debe ser la letra después de la okina la que se transforme: 'okina -> 'Okina

¿Vamos bien? ¿Seguimos?

Os acordáis de los poseídos que querían escribir al revés? Para esos también hay sitio en Unicode!

Unicode tiene un "carácter" especial llamado "RLM" que modifica la posición de los caracteres adyacentes. Dependiendo de dicha posición, los caracteres pueden ser completamente distintos.

Darle la vuelta a una cadena de texto rompe por completo ese orden.

Vamos con el ejemplo!

Ya hemos visto los caracteres que modifican otros caracteres (la "ñ").

Pongamos que tengo los caracteres "A" y "U+0301" ("tilde en el carácter anterior").

El resultado es "Á".

Pero si le damos la vuelta nos queda "́A", porque el "U+301" no actúa al revés

Por cierto! ¿Os había mencionado que U+202e hace que todos los caracteres que le siguen se pinten visualmente en orden inverso y que todo eso se puede usar con RLM?

• • •

Missing some Tweet in this thread? You can try to force a refresh

This Thread may be Removed Anytime!

Twitter may remove this content at anytime! Save it as PDF for later use!

More from @devruso

Diario de un picateclas

@devruso

Jun 30, 2025

"java es casi tan rápido como c"
"javascript es casi tan rápido como c"
"XYZ es casi tan rápido como c"

Juro por el "C The Programming Language" de K&R (2ª edición) que como lea UNA SOLA VEZ mas algo similar, va a haber sangre, dolor y oscuridad.

DENTRO HILO 🧵

(1/x) Seguro que más de una vez has leído afirmaciones que comparan la velocidad de X o Y lenguaje interpretado con la velocidad de Z lenguaje compilado. Y normalmente esas afirmaciones vienen en pack con palabras como "JIT", "AOT", "VM", "SIMD", "POPO / PIPI" y demás. Y a lo mejor te las crees. A lo mejor, como yo, te pones a invocar a Lucifer para que acabe con media humanidad. Si eres de los primeros, no te preocupes, que aquí estoy para verterte en esa cabezabuque que tienes los conocimientos comprimidos de 2 años de carrera en 40 tuits ;) (dibujos incluidos)

(2/x) Para que este hilo sea digerible por todos los públicos, incluidos los frontenders (porque HARTO me tienen con el "js es casi tan rápido como c", a ver si leyendo este hilo dejan de decir la chorradita...), voy a empezar desde lo más básico. También voy a intentar simplificar algunos conceptos, aunque eso suponga no ser técnicamente 100% correcto. No vengas con el "ACKCHYUALLY" que te monto en el primer tren a Siberia, billete de solo ida.

Read 41 tweets

Diario de un picateclas

@devruso

Feb 8, 2025

Rust en el kernel de Linux y el incesante flujo de drama y dimisiones por parte de gente muy inteligente. ¿Que coj*nes está pasando?

Hilo va 🧵👇

Todo empieza (de manera oficial) cuando Miguel Ojeda publica, en el 2021, un RFC (lkml.org/lkml/2021/4/14…) para (intentar) integrar Rust en el kernel de Linux. Hay ventajas, hay desventajas, hay un poco de todo. El caso es que el RFC recibe un montón de comentarios por parte de muchos stakeholders (Linus incluido).

Y de entre los argumentos a favor, la seguridad (de memoria, en concurrencia, etc...). El RFC de Miguel lo explica bien.

De entre los argumentos en contra están la curva de aprendizaje que los maintainers actuales deberán asumir, el posible coste en tiempo de ejecución que supondrán los wrappers de Rust, y dudas sobre la carga de mantenimiento a largo plazo: lkml.org/lkml/2021/4/22…

Como es normal, hay muchas dudas de como sería un posible kernel donde Rust pueda usarse. Al fin y al cabo el kernel tiene ciertas partes que chocan con la manera en la que funciona Rust.

Ej, fallando en el intento de reservar memoria no debería provocar un abort total (el comportamiento en kernel land es muy distinto del comportamiento en user land, el kernel no puede parar por completo solo porque no se ha podido reservar mas memoria). lwn.net/ml/linux-kerne…

Otro ej, el modelo de memoria de Rust (C11, default en LLVM) difiere mucho del modelo de memoria del kernel (lwn.net/Articles/71862…). Esto es sumamente importante porque hay muchas partes del kernel que comparten estructuras de datos (para evitar duplicar datos, mayor velocidad, etc...). No queda nada claro como Rust va a interactuar con las partes del kernel que comparten estructuras de datos sin usar "unsafe". Pero si usa "unsafe", todas las ventajas de usar Rust se esfuman. Paradójico.

Greg Hartman (mano derecha de Linus) opina que será interesante como Rust va a lidiar con ese problema: lwn.net/ml/ksummit-dis…

Hay maintainers que está totalmente en contra de meter un segundo lenguaje (Rust u otro), y están en contra porque, en el proceso de desarrollo del kernel, cuando haces un cambio que provoca un breaking change en la firma de alguna función, es responsabilidad "tuya" (de quien hace el cambio) arreglar todas las partes que se ven afectadas. Si se introduce un nuevo lenguaje, los maintainers están obligados a aprender ese nuevo lenguaje (para poder arreglar todas las partes). Por otro lado, actualmente existe la posibilidad de compilar el kernel excluyendo ciertas partes (ej, "todavía no he arreglado todas las cosas que he roto con mi cambio, pero quiero poder compilar y ejecutar el kernel para asegurarme que por lo menos mi cambio realmente funciona, y una vez que lo haya comprobado, me encargaré de parchear el resto de cosas"), pero los wrappers de Rust harían eso imposible (lwn.net/ml/linux-kerne…).

En última instancia, la posición de Linus con respecto a Rust en el kernel es, cito, "on the whole I don't hate it". (Importante. Volveré a esto en un rato) lwn.net/ml/linux-kerne…

Read 8 tweets

Diario de un picateclas

@devruso

Sep 30, 2024

Hoy quiero contaros sobre Dante Agileni, un devrel italiano de la Edad PreIA, autor de La Divina Techcomedia.
Dentro hilo 🧵⬇️

En su obra narra un viaje a través de las tres etapas de la evolución profesional de un empleado en nuestro sector:

* el Infierno (carrerum profesionalum plenum)
* el Purgatorio (lo mismum, pero con mas responsabilidadum sin incrementun de sueldum)
* el Paraíso (jubilacium)

Sandro Bocetti, diseñador freelance especializado en la creación de bocetos con @Sketch, hizo un fan art basado en la obra de Dante (licencia Creative Commons), el cual usaré a lo largo de este hilo.

Read 34 tweets

Diario de un picateclas

@devruso

Mar 30, 2024

https://twitter.com/devruso/status/1773784129512800536

¿Os acordáis de nuestro amigo Jia Tan, el prota de la historia de ayer?

Acompañadme en este pequeño hilo que cubre el drama de hoy v2 🧵⬇️

https://twitter.com/devruso/status/1773784129512800536

Resulta que xz usa Landlock[0] (una característica en el kernel de linux) para limitar (deliberadamente) sus propias capacidades (para evitar fallos de seguridad).

[0] docs.kernel.org/userspace-api/…

Jia, en uno de sus tantos commits que hizo a lo largo de los últimos 2 años, modificó[1] la manera en la que se usaba landlock por xz

[1] git.tukaani.org/?p=xz.git;a=bl…

Read 21 tweets

Diario de un picateclas

@devruso

Mar 29, 2024

Acompañadme en este pequeño hilo que cubre el drama de hoy 🧵⬇️

La historia empieza con Jia Tan (JiaT75 en github), un maintainer de xz (librería de compresión que se usa en monton de sitios).

El susodicho puja este commit[0] que, mirándolo por encima, no tiene nada raro (un par de archivos de prueba para los unit tests).

[0]: github.com/tukaani-projec…

el paquete con la nueva versión de la librería (que contiene dicho commit) se genera y se distribuye a las distros para las pruebas de validación, integración, etc... lo normal para que los betatesters hagan lo suyo, vaya.

Y aquí es donde entra en escena "Andres Freund".

Read 12 tweets

Diario de un picateclas

@devruso

Jan 18, 2024

JIRA se ha caído. Próximos pasos:

1⃣Crear un ticket para investigar el problema
2⃣Documentar los descubrimientos en el ticket, poner en copia a upper management y al resto del equipo
3⃣Hacer un meeting (mínimo 15 personas) para discutir los descubrimientos
4⃣Asignar

...puntos de historia al ticket (votación con mínimo 15 personas)
5⃣Mover el ticket basandose en su prioridad y puntos
6⃣Esperar a que alguien se lo asigne (porque los equipos AGILE son multifacéticos y todos hacen todo)
7⃣Quien se lo haya asignado tendrá que documentar el

...proceso del fix, todas funcionalidades que afecta el parche, los sistemas en los que se ha de desplegar, etc...
8⃣Mover el ticket a la columna de QA
9⃣Esperar a que QA realice pruebas exhaustivas de todas las funcionalidades que nada tienen que ver con lo que se ha

Read 6 tweets

Support us! We are indie developers!

This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Share this page!

Enter URL or ID to Unroll

Diario de un picateclas

Try unrolling a thread yourself!

More from @devruso

Diario de un picateclas

Diario de un picateclas

Diario de un picateclas

Diario de un picateclas

Diario de un picateclas

Diario de un picateclas

Did Thread Reader help you today?

Don't want to be a Premium member but still want to support us?

Send Email!