Post

How to get URL link on X (Twitter) App

On the Twitter thread, click on or icon on the bottom
Click again on or Share Via icon
Click on Copy Link to Tweet
Paste it above and click "Unroll Thread"!
More info at Twitter Help

Carlos Santana

@DotCSV

Dec 26, 2022 • 8 tweets • 3 min read • Read on X

Sé que va a haber un momento en 2023 que da igual lo que esté haciendo o donde esté, recibiré una notificación y se me helará la sangre. Será un momento de pararlo todo y empezar a currar en esto y algo que recordaré por tiempo...

👉 Habrá salido GPT-4

Os cuento cositas [1/n]

Desde que aprendimos el patrón GPT-2 -> GPT-3 -> ...
la versión 4 de la familia GPT ha sido el modelo más anticipado de la historia del Deep Learning, y ahora mismo el hype está bastante alto.

Se dicen cosas como estas 👇

https://twitter.com/Nick_Davidov/status/1606688723265277952?s=20&t=FHG6Apul44vyirdwa9Lt0g

Si algo ha despertado mi curiosidad por GPT-4 es leer este párrafo del blog de Gary Marcus, quien por normal general (y en este artículo no es la excepción) se sitúa en las antípodas de estos Enormes Modelos del Lenguaje. ¿Hay gente probándolo ya? 👀

Si algo impresionó de GPT-3 fue cómo OpenAI logró escalar el tamaño de su modelo frente a sus predecesores. Respecto a GPT-2, la nueva versión aumentó su número de parámetros en >100 veces, hasta los 175 mil millones de parámetros. 🤯

¿Cuánto podría escalar GPT-4? ¿Qué pensáis?

Rumores hablan de esto: un modelo 500 VECES más grande que GPT-3.

...pues no lo creo

Si así fuera tendría miedo de tremenda bestia 😅 Pero creo que lo que vamos a ver es algo más "modesto" quizás un modelo 5 VECES mayor que llegue al BILLÓN de parámetros

https://twitter.com/LinusEkenstam/status/1607102506336911360?s=20&t=hdxWSDqigTmDr3dab4Sgtg

Y es que este año DeepMind con Chinchilla demostró que no hacía falta escalar tanto a estos Enormes Modelos del Lenguaje. Que GPT-3 todavía tenía margen de mejora para ser entrenado más y con más datos sin necesidad de hacerlos MÁS GRANDES. Así que el tamaño no es tan importante.

Sea como sea, tiene pinta de que GPT-4 va a consolidarse como la primera GRAN herramienta de IA que masivamente usaremos para un gran rango de tareas. ChatGPT nos ha mostrado sus posibilidades.

Y si los rumores que llegan desde Silicon Valley son ciertos, lo que viene es grande.

A estas tecnologías se le llaman Enormes Modelos del Lenguaje (LLMs) y si queréis saber por qué es tan interesante hacer a estas IAs cada vez más grandes, en este vídeo se explica muy bien :)

• • •

Missing some Tweet in this thread? You can try to force a refresh

This Thread may be Removed Anytime!

Twitter may remove this content at anytime! Save it as PDF for later use!

More from @DotCSV

Carlos Santana

@DotCSV

Sep 12

🔴 ¡GAUSS, MATEMÁTICAS CON IA!

Surge una nueva compañía, Math Inc, con la noble misión de automatizar con IA los descubrimientos en matemáticas

Su lema: "Solve math, solve everything"

Y ayer presentaron en un blog los resultados de su primera investigación, Gauss, y ojito! 👇

Gauss es un sistema de autoformalización que escribe y verifica automáticamente pruebas en Lean, trabajando ininterrumpidamente durante horas.

Gauss ejecuta el verificador, detecta fallos y propone correcciones -todo en bucles automáticos y a gran escala: Según el anuncio el sistema ha generado ~25k líneas y ~1k teoremas.

El uso de esta herramienta tan potente en combinación con la experiencia de profesionales humanos, ha permitido en 3 semanas desatascar y completar el reto planteado por Terence Tao y Kontorovich, cuyo progreso había quedado encallado tras 18 meses de trabajo humano!

Read 4 tweets

Carlos Santana

@DotCSV

Aug 7

https://twitter.com/OpenAI/status/1953504357821165774/video/1

🔴 ¡OPENAI PRESENTA GPT-5!

Con mejoras incrementales en su inteligencia, un precio muy competente, y una presentación descafeinada que no ha entusiasmado... Os cuento más detalle del nuevo modelo por defecto de ChatGPT

Bye selector de modelos! 🫡

https://twitter.com/OpenAI/status/1953504357821165774/video/1

Antes que nada, si queréis ver todas las conclusiones sobre GPT-5, tenéis resubido el directo que acabamos de finalizar, con la presentación (interesante la primera parte) y mis análisis al principio y al final 👍

youtube.com/live/JxIVgWQSv…

Si eres de los usuarios que no sabía para que servían esos modelos con nombres raros del selector, felicidades! Hoy has recibido un modelo mucho más potente y útil 🎉

En cambio, si sigues la actualidad de la IA, pues sí... esta es una evolución incremental más 👍

Read 13 tweets

Carlos Santana

@DotCSV

Aug 5

🔴 ¡MODELOS OPENSOURCE de OPENAI!

OpenAI ha recordado de donde venía lo de 'open' y acaba de liberar sus nuevos modelos razonadores pensados para realizar tareas agénticas 🔥

> Un modelo de 20B para PC y portátiles
> Un modelo de 120B para datacenters y PCs high-end

Os cuento!

Dice Sam que GPT-OSS (el nombre del modelo) es comparable a o4-mini y capaz de ser ejecutado en tu propio ordenador!

Según creen ellos, es el mejor modelo y más utilizable jamás liberado. Pero eso lo decidirá la comunidad :)

El modelo grande es ejecutable con 80GB de VRAM (poco asequible para la mayoría) y es el modelo comparable con o4-mini.

El modelo mediano es ejecutable con 16GB de VRAM (bastante apto para muchos PCs) y es comparable a o3-mini.

La verdad, que estén regalando modelos tan cercanos a la frontera de capacidades actuales me pone muy optimista ante el margen que OpenAI puede tener internamente :)

Read 13 tweets

Carlos Santana

@DotCSV

Jul 17

🔴 ¡OPENAI presenta CHATGPT AGENT!

La nueva capacidad de ChatGPT de navegar y ejecutar acciones en internet, y razonar durante más tiempo usando las herramientas adecuadas (generación y ejecución de código, generación imágenes, etc.) para cumplir su tarea

Os voy contando! 👇🧵

Primero lo más importante, ¿quienes acceden?

> Usuarios Plus: 40 prompts al mes
> Usuarios Pro: 400 prompts al mes
> Usuarios europeos: jajaj lol

¿Qué es ChatGPT Agent? 🤔

Pensadlo como la evolución natural de ChatGPT, integrando herramientas como Operator (capacidad de navegar por internet) con el resto de habilidades de ChatGPT (conectores a servicios de terceros, generación de imágenes, ejecución de código, etc)

Read 12 tweets

Carlos Santana

@DotCSV

Jun 18

https://twitter.com/midjourney/status/1935377193733079452/video/1

🔴 ¡MIDJOURNEY VIDEO YA DISPONIBLE!

Les ha costado llegar, pero han llegado fuertes!

El modelo de image-to-video de Midjourney ya es una realidad, trayendo esa versatilidad estética que tanto caracteriza a MJ a la generación de vídeo!

¿cómo lo véis? 👀

https://twitter.com/midjourney/status/1935377193733079452/video/1

La verdad es que la experiencia es "muy Midjourney" en el buen sentido de la expresión:

De cualquier imagen puedes generar en 1 minuto 4 animaciones diferentes de 5 segundos a 480p.

Luego, la que te guste, puedes seguir extendiéndola en más generaciones.

De precios, podéis usar el generador de vídeos desde el plan más barato (10$/mes) y cuesta x8 veces más crear un vídeo que una imagen –medido en horas de GPU, que es el sistema de créditos que usa Midjourne

Read 8 tweets

Carlos Santana

@DotCSV

May 17

🔴 ¡OPENAI PRESENTÓ CODEX! (...ayer)

Tras muchas horas sin internet, aquí unas primeras impresiones del nuevo sistema de programación autónoma presentada por OpenAI ayer: CODEX

Un repaso rápido 👇🧵

Para los despistados, Codex es la nueva herramienta agéntica de OpenAI, en este caso orientada a labores de programación: te conectas a tu base de código, puedes hacerle preguntas a la IA, pedirle que te arregle bugs o que implemente nuevas funcionalidades.

Lo interesante de este sistema es que trabajará en lo que le asignes en un rango de tiempo que puede ir de 1 a 30 minutos, trabajando en segundo plano, mientras tú te puedes quedar depurando qué hace o tomándote un café.

La plataforma tiene potencial porque ahora mismo no pretende ser un producto final (de hecho está marcado como research preview) sino un punto de partida para ir automatizando cada vez más las labores de programación y SWE.

Según los modelos sigan haciéndose más rápidos, más capaces y baratos, este tipo de plataformas irán aportando más y más valor.

Además, seguramente Codex se nutra bastante del talento tras la adquisición reciente de Windsurf.

Read 8 tweets

Support us! We are indie developers!

This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Share this page!

Enter URL or ID to Unroll

Carlos Santana

Try unrolling a thread yourself!

More from @DotCSV

Carlos Santana

Carlos Santana

Carlos Santana

Carlos Santana

Carlos Santana

Carlos Santana

Did Thread Reader help you today?

Don't want to be a Premium member but still want to support us?

Send Email!