Ayer lanzamos la 1ª Edición del "Curso de #Rstats para Analistas de Fútbol. Visualizaciones desde 0". Es el 1er paso del track "Objetivo Data Analista" donde adquiriréis las competencias suficientes para trabajar como un buen analista de datos.
ℹ️ objetivoanalista.com/curso-de-r-par…
👇Hilo
El track está basado en lo que yo creo que son los tres pilares de un buen analista:
1⃣ Comunicar correctamente
2⃣ Analizar y contextualizar
3⃣ Extraer Valor
Y para poder explotar estos pilares es importante conocer dos herramientas imprescindibles:
🔧 Programación
🧮Estadística
El primer curso entra de lleno en el primer punto, comunicación de impacto. Todos veis en rrss, medios, cuerpos técnicos cada vez más visualizaciones, el dato ha llegado, pero no de cualquier manera. Para comunicar bien hay que conocer el qué y el cómo.
En este primer curso abordaremos 5 módulos más 1 módulo extra sorpresa cuando completéis los 5 primeros módulos.
Muchos me diréis, Jesús, ¿por qué R y no Python? No es cuestión de uno u otro, es el primer paso, en el futuro habrá más lenguajes de programación, pero desde mi punto de vista es mejor empezar por R para perfiles no técnicos. Yo empecé a programar con los dos a la vez.
¿Y el big data? El Big data no es lo que os dicen que es, el 99% de las cosas que hay que aprender es análisis, estadística y modelización, que es lo que aprenderéis en el track total, pq si, en próximos cursos habrá Machine Learning, pero realista, el que se hace en la vida real
Los cursos son en formato de total flexibilidad. Todas las clases están pregrabadas, compaginando teoría y práctica a lo largo de más 100 ejercicios, con todo su código accesible para que sigáis las clases, y podáis jugar con el mismo.
Este curso no es ni mejor que otros, es básicamente lo que he aprendido en todo este tiempo, he intentado hacer hincapié en aquello que tuve que hacer por mi cuenta, dedicarle mucho tiempo y dinero...
Como muchos me preguntan un curso de visualización tiene que tener datos para mostrar y un modulo está destinado al escrapeo, pero ojo, de páginas que lo permiten. No se enseñará a hacerlo sobre fbref, no lo permite aunque se pueda, y por tanto está fuera del ámbito.
Aquí os dejo lo que si y lo que no se enseñará en este primer curso, si no que será en próximos cursos. Quiero ser franco con todos, no quiero vender humo.
¿Y el resto de cursos del track? Os los iré desgranando poco a poco, pero en todos las piezas clave serán la estadística y la programación. No tiene sentido aprender ha lanzar un xgBoost si antes no sabes interpretar los coeficientes de una regresión...
Detrás de este proyecto no estoy yo solo, hay grandes amigos/profesionales, que entre todos intentaremos que cojas las habilidades necesarias para ser un buen data analista y me atrevería a decir, en cualquier campo.
Y como os dije, hay un módulo extra, que es fruto nada más de que cada día aprendo algo nuevo y cuando monté el curso no lo había explicado. En este módulo uniremos a understat los entrenadores y usaremos una librería para construir tablas como la de la imagen.
Antes de empezar el curso el 1 de febrero haremos un webinar explicando muchas más cosas, y os mostraré el cuadro de mando final que seréis capaces de montar! Ahí es nada.
Si os interesa, si creeis que le puede interesar a alguien, o solo quieres echarle un cable, comparte 🙏
*a lanzar...ni un tweet sin gazapo... ;)
• • •
Missing some Tweet in this thread? You can try to
force a refresh
Durante esta semana os he ido explicando las diferentes maneras de representar y extraer información de los grafos de un equipo basado en sus pases con dos enfoques, el nodo como jugador, y el nodo como zona. Pero hay una tercera, una derivada del nodo-zona, los clusters.
Para los despistados os dejo primero el hilo de los grafos y su explicación bajo el concepto de nodo-jugador:
Y el hilo del nodo-zona. La idea del nodo-zona es dividir el campo en zonas, yo por ejemplo lo hago con varias matrices, una de 5x5 (25 nodos) y otra de 10x5 (50 nodos)
Aquí os dejo un partido y sus dos grafos con ambas matries y el hilo explicativo:
Muchas veces veis representaciones de grafos de partidos de fútbol, como el de esta imagen, ¿pero qué información podemos obtener más allá de la propia imagen? 👇 Hilo. #BigData#Futbol
Lo primero es definir nodo y conector. Nodo es el jugador, y se posiciona sobre la coordenada promedio donde recibe los pases, y se conecta con otro jugador de A->B y de B->A. Es lo que llamamos bidireccional. Para mi esta conexión es cuando hay 3 pases al menos.
La Densidad, de 0 a 1, siendo 1 cuando todos los jugadores se conectan con el resto. Cuando un equipo tiene una densidad alta hablamos de juego combinativo, y densidad baja juego directo que además podremos ver con conexiones entre nodos de lineas defensivas con nodos de ataque.
Os dejo una explicación del cuadro de mando y la info que hay y que cosas se pueden analizar. Está en un servidor gratuito por lo que a veces se cae pero no desespereis, a caballo regalado...
Ayer tuve una conversación muy interesante y ha surgido nuevamente el concepto del sesgo de la edad relativa y su influencia en el deporte, sobre todo en deportes como fútbol o atletismo. Veamos qué es esto del sesgo/efecto de la edad relativa.
Y es que nacer en un mes o en otro puede marcar tu futuro en el deporte. Y no por la influencia de los astros, si no más bien por la clasificación en categorías en función del año de nacimiento y el corte de cada categoría como vemos en la imagen y los procesos de selección [1]
Este efecto, de edad relativa “consiste en la menor presencia, en un ámbito determinado, de los nacidos en los últimos meses próximos al corte, a partir del cual se clasifica una nueva categoría de edad.” [2]