Hice modelito de machine learning para predecir "Alt Season" próximos 30 días (cuando baja fuerte la dominancia de #BTC y se vuelan las small cap crypto)
Pero el 🧵es para manijear #python y no crypto así que si les interesa hay que leer hasta el final para ver el resultado
A pesar de lo rústico del modelo, tiene un % de aciertos alto, tanto cuando predice que se dará la Alt season, como cuando predice que no
Esto se ve en la llamada "matriz de confusión" que se arma sometiendo al modelo a predecir con datos con los que no fue entrenado
Arranco tomando datos de dominancia de CoinmarketCap y los históricos de precio y volumen de Coingecko, el código python para ambas cosas son un par de líneas como ven
Luego preparo los "features" (que serían los inputs con los que el modelo se entrenará para encontrar la mejor alternativa de esquema de reglas para predecir)
Y el "TARGET" que es el label binario del evento futuro a predecir, en mi caso si la dominancia de #BTC baja un 5% o mas
Como ven es bastante básico, uso simplemente de inputs datos pasados de #BTC de:
- Su dominancia
- Cambios de precio
- El volumen
- La volatilidad
- El ratio μ/σ
Y los calculo con una ventana semanal y mensual
Luego viene el Over Sampling
¿quejeso?
El tema es que quiero predecir si la dominancia va a caer mas del 5% en un mes, y eso no pasa muy seguido, o sea mi muestra de datos está desbalanceada, si entreno el modelo así, va a tener un sesgo a predecir que no habrá nunca Alt Season
Como se imaginarán en #python esto es cuestión de un par de líneas de código nomás y problema resuelto, genero datos con inputs similares a los que tuvieron esa alt season que son los menos (16.54%) para que quede balanceado para entrenar
Y ya tenemos todo casi listo para entrenar un modelo de machine learning
Antes separo primero los datos de entrenamiento de los de validación (los de validación son los datos con los que voy a chequear si se entrenó bien o manda cualquier fruta)
Y ya, entreno mi modelo
El algoritmo que elegí fue "Random Forest" que genera una especie de Arbol de decisiones (pregunta primero por un feature, luego por otro y así hasta terminar decidiendo si es mas probable que haya o no una alt season con esos features)
Osea, encuentra reglas para predecir
Todo esto explicado (resumido) para un hilo de twitter obvio
Bueno, cuestión, ahora que ya el algoritmo generó "las reglas" o preguntas para decidir, lo que hago es pasarle los datos actuales a ver que predice
Entonces? bueno, reflexionemos:
1- Solo el 16.54% de los días pasados había una alt season el mes siguiente
2- El algoritmo acierta el 88% de las veces que predice que habrá alt season
3- Los ultimos 30 días, incluido ayer predijo que habrá alt season mas del 50% de los días
Disclaimer: Es un modelo medio "básico" hay mucho por trabajarle, mi idea era manijear #Python y no manijear crypto small caps, pero seguro capté mas la atención con esto aplicado a algo real
Hago este hilo para reivindicar un concepto que pocos usan pero es bastante util para el planillero de opciones, el market maker y otros
- La parkinson volatility
Es un calculo diferente de la volatilidad que, como se ve en la formula es simplemente una cte por un calculo muy similar al σ² clasico, pero en lugar de los rets logaritmicos de los cierrres usa los mov intradiarios maximos
Mirando simplemente un grafico como este del CEDEAR de XOMD se entiende bien el concepto de lo que captura
Claramente no es una accion muy volatil para nada, pero intradiariamente si lo es (por lo iliquida)
Si estan pensando que se llama "parkinson" volatility, por lo que estan pensando, no, mal ahi ja, es que el pibe al que se le ocurrio usar este concepto se llama Michael Parkinson
Aca les dejo un link con el paper, es de ppios de los 80s, la idea era capturar mejor una medida de volatilidad, mas util para el uso en opciones que depende muchisimo de la volatilidad de su subyacente, fue de la epoca post black & scholes cuando estaba muy en discusion esa medida de riesgo
Primero que nada hay que conseguir los datos actualizados, acá por ejemplo @danielslevi compartió un informe de Morgan Stanley, de donde podríamos sacar los datos, pero se quedó en 2016. Necesitamos una fuente dinámica
1 - DEFICIT
Ambos dicen que van a deficit 0 o superavit:
- Massa subiendo impuestos
- Milei bajando gastos
¿Que te conviene a vos? 👇🏻
Podrás pensar que si se sube impuestos "a los ricos" no te va a afectar, pero pensalo un segundo
Esos impuestos que pagan "los ricos" pueden ser al stock o al flujo
- Si son al flujo, son impuestos por generar guita (negocios), si se los suben, ganan menos, ergo para que la ecuación riesgo/beneficio de igual hay que subir márgenes brutos (pega en precios)
A veces las ideas de portafolio son mucho mas simples de lo que muchos imaginan
Asumamos que uno quiere tener un portafolio de empresas tecnológicas
La pregunta es como elegir digamos 10 empresas del sector para tener una cartera diversificada
Abro 🧵explicando
Si vemos en el gráfico hay 4 cuadrantes tomando de pivote el SP500, el superior derecho, es el que tiene empresas que tanto los últimos 2 años como los últimos 5 años mejores ratios Sharpe que el SP500
El ratio Sharpe es el retorno sobre la volatilidad (riesgo)
O sea que si elegimos simplemente las empresas de ese cuadrante, estaremos usando en el portafolio empresas que a mismo riesgo (volatilidad) tuvieron mejores retornos
O visto al revés, empresas que para los mismos retornos, tuvieron menos riesgo (menos volatilidad)