¿Qué le pasa a Lewandowski cara a puerta? Nada.
Y así empezaríamos un debate sobre la efectividad del delantero culé, es cierto que estas voces han sido pocas, sobre todo por fallar oportunidades clara, pero es que el delantero polaco es “ideal” para explicar esto de la efectividad. ¿Por qué? Porque tiene un volumen muy alto de tiros y pertenece a esa clase de jugadores que por volumen y calidad ciertos modelos se pueden usar con un sesgo de volumen bajo y se aprecia el sesgo de calidad muy claramente. Veamos algunos datos.
¿Y qué nos dicen estos modelos? Que el jugador polaco mete las oportunidades que tiene, no significa que no falle, significa que si estos modelos en función de las ocasiones que tiene predicen o esperan un volumen de goles dados, el jugador acaba metiendo estos goles cuando alcanza un volumen mínimo y necesario de ocasiones. A veces meterá una ocasión de baja probabilidad, otras fallará una de gran probabilidad, pero, y esto es lo que nos interesa, cuando el volumen en suficiente, estos modelos nos ofrecen información significativa para un jugador.
May 13 • 13 tweets • 8 min read
Se acaban las ligas, llega el verano y con ello los fichajes. Llegan las Fake Metrics al fútbol
Hoy vengo a hablar de las fake metrics un término que ni mucho menos he inventado yo pero que si que creo que hay analizarlo con algo de calma por el bien de nuestra profesión.
¿Pero qué es esto de las fake metrics?
Pues simplemente métricas, que si bien son reales, existen, están ahí, aportan poco valor y/o nula contextualización. Es decir números que dicho sin más “No sirven para nada”.
Acompáñame en este (triste) hilo...
¿Por qué es importante hablar de ellas?
Porque desde mi opinión las fake metrics inundan y colapsan la información y los datos en el fútbol. Pero cuidado, la llegada y el uso de estas fake metrics no tienen un “componente malévolo” como sus primas las fake news que quieren sobre todo manipular una opinión, si no que tienen varios trasfondos que creo que son importantes al menos conocer.
Apr 18 • 4 tweets • 3 min read
El Teorema de Lunin.
Un microrrelato sobre estadística, fútbol y azar
Son las 23:00 y el árbitro acaba de pitar el final de la prórroga, los nervios se apoderan de ambos banquillos, todos han hecho su trabajo, conocen a porteros y probables tiradores, sus patrones, su histórico, la suerte está echada, si es que existe en los penaltis.
Pero algo pasa en el banquillo del Real Madrid. Algo no cuadra. Han visto que Bernardo Silva será tirador, no lo esperaban. Rápidamente el analista Memo* les da el dato que esperaban:
- Ha tirado solo 3 penaltis, y dos fueron por el centro y marcó los 3. 100% de acierto. - comenta Memo.
Por otra parte, Kepa se retira donde nadie le ve y hace una llamada. Al otro lado está Joshua Ann, es el estadístico del club que está viendo el partido desde Madrid.
- ¿Has visto lo de Bernardo? - pregunta el portero suplente.
- Si. En la TV parecía que Pep le decía algo - decía con acento del sur de Londres, más concretamente de Tunbridge Wells.
- ¿Crees que tirará por el centro?
- No se puede saber, que de 3 penaltis haya tirado 2 por el centro no nos ayuda en nada. No es muestra suficiente para que su decisión previa sea significativa, por ahora.
- Pero tu un día dijiste que podrías sacar la probabilidad sin apenas información - replicaba nervioso Kepa buscando una respuesta rápida.
- Si, pero al principio la probabilidad se moverá en unos rangos muy altos. ¿De qué te sirve decirte que el intervalo de credibilidad 5%-95% de que tire por el centro estará entre [0.4-0.9]? De nada. Puede que lo tire o no. Por ahora tenemos poca info.
- Es que dice que se va a quedar en el medio
- Sin problema, como si se tira a un lado. Es su intuición, llámale azar, desde luego estadística ahora mismo no es.
- Se corta la conversación, Kepa alza un dedo de aprobación, Lunin asiente.
Pasan 5’ y Bernardo se dirige al punto fatídico. Lanza y Lunin ha tomado una decisión, se queda parado en el centro. La atrapa sin mayores problemas. Mira al banquillo, sonríe. Conocer sus 3 penaltis previos le ayudó a tomar una decisión, pero estadísticamente no le daba ninguna ventaja previa conocerla. Se la jugó y le salió.
Unos le llaman flor, podría ser de aza(ha)r, pero a veces el fútbol es simplemente eso, fútbol.
* El analista se llama Memo por @MemoNavarro_ que dio el dato de BS ayer y me ha inspirado para este tweet.
** Como siempre algunos nombres tienen un porqué en mis tweets. Escoden un personaje oculto, ¿de quién se trata? ¿por qué?
PD: Un estudio (siguiente tweet) analizando tandas cifraba el % de victoria en un 77% del equipo que tiraba primero lo metía (Foden) y el otro equipo fallaba (Modric).
Os dejo aquí un gráfico marcando % que se fueron dando en la tanda de ayer y el 77% al fallar Modric y como fue cambiando después hasta la victoria del Real Madrid. fivethirtyeight.com/features/a-cha…
Nov 19, 2022 • 17 tweets • 4 min read
Si quieres aprender a programar con #Rstats, hacer visualizaciones como las que veis en RRSS o en informes, cuadros de mando con shiny, conectar con bases de datos externas, aprender métricas avanzadas, etc. En 2023 vuelve "Curso de R para analistas de Fútbol"
Te cuento 🧵
Primero aprenderás a manejarte con las funciones básicas de R en RStudio además de los principales paquetes de manejo de datos.
Nov 19, 2022 • 4 tweets • 2 min read
Cuando hablamos de mundiales a todos se nos viene México'86. Maradona, estadio Azteca, para mí el culmen de un futbolista en un mundial.
¿Pero sabías que el mundial no se iba a disputar en un principio en México?
En 1974 se eligió Colombia! Pero en 1983 y ante la imposibilidad del país elegido de cumplir las exigencias de la FIFA se eligió México.
Jan 16, 2021 • 15 tweets • 4 min read
Ayer lanzamos la 1ª Edición del "Curso de #Rstats para Analistas de Fútbol. Visualizaciones desde 0". Es el 1er paso del track "Objetivo Data Analista" donde adquiriréis las competencias suficientes para trabajar como un buen analista de datos.
ℹ️ objetivoanalista.com/curso-de-r-par…
👇Hilo
El track está basado en lo que yo creo que son los tres pilares de un buen analista:
1⃣ Comunicar correctamente
2⃣ Analizar y contextualizar
3⃣ Extraer Valor
Y para poder explotar estos pilares es importante conocer dos herramientas imprescindibles:
🔧 Programación
🧮Estadística
Apr 18, 2020 • 11 tweets • 4 min read
Durante esta semana os he ido explicando las diferentes maneras de representar y extraer información de los grafos de un equipo basado en sus pases con dos enfoques, el nodo como jugador, y el nodo como zona. Pero hay una tercera, una derivada del nodo-zona, los clusters.
Para los despistados os dejo primero el hilo de los grafos y su explicación bajo el concepto de nodo-jugador:
Muchas veces veis representaciones de grafos de partidos de fútbol, como el de esta imagen, ¿pero qué información podemos obtener más allá de la propia imagen? 👇 Hilo. #BigData#Futbol
Lo primero es definir nodo y conector. Nodo es el jugador, y se posiciona sobre la coordenada promedio donde recibe los pases, y se conecta con otro jugador de A->B y de B->A. Es lo que llamamos bidireccional. Para mi esta conexión es cuando hay 3 pases al menos.
Apr 9, 2020 • 25 tweets • 7 min read
Os dejo una explicación del cuadro de mando y la info que hay y que cosas se pueden analizar. Está en un servidor gratuito por lo que a veces se cae pero no desespereis, a caballo regalado...
Ayer tuve una conversación muy interesante y ha surgido nuevamente el concepto del sesgo de la edad relativa y su influencia en el deporte, sobre todo en deportes como fútbol o atletismo. Veamos qué es esto del sesgo/efecto de la edad relativa.
Y es que nacer en un mes o en otro puede marcar tu futuro en el deporte. Y no por la influencia de los astros, si no más bien por la clasificación en categorías en función del año de nacimiento y el corte de cada categoría como vemos en la imagen y los procesos de selección [1]