
Google TurboQuant no frenará la demanda de memoria gracias a la Paradoja de Jevons
El nuevo algoritmo de Google llamado TurboQuant está generando un revuelo considerable en la industria de la IA, con predicciones catastrofistas sobre un colapso inminente en la demanda de memoria. Lo que muchos ignoran, sin embargo, es que el artículo académico que lo respalda fue publicado en abril de 2025, hace casi un año.
¿Qué hace realmente TurboQuant?
Para entender el algoritmo, imaginá que estás escribiendo una historia con memoria de corto plazo muy limitada: cada vez que añadís una palabra nueva, tenés que releer todo lo escrito desde el principio para recordar el contexto. Eso es, en esencia, lo que ocurre con el KV cache (Key-Value cache) en los modelos de inteligencia artificial: una memoria de trabajo que almacena contexto previo para acelerar las inferencias. TurboQuant comprime este KV cache hasta 6 veces, logrando que el modelo subyacente opere hasta 8 veces más rápido, y todo ello sin ninguna pérdida de precisión.
El punto crucial que muchos están pasando por alto: TurboQuant no comprime los pesos del modelo, que en implementaciones de gran escala superan ampliamente al KV cache en volumen. El tamaño del modelo permanece intacto. Lo que sí hace el algoritmo es mejorar la economía de la inferencia en centros de datos, ya sea ampliando la context window de un modelo o permitiendo que menos GPUs atiendan la misma cantidad de usuarios.
La Paradoja de Jevons y el mercado de memoria
Los inversores en acciones de empresas de memoria temen que TurboQuant enfríe la demanda justo cuando los grandes fabricantes arrancan con expansiones de capacidad. Pero esa lectura, según el análisis, subestima un fenómeno económico bien documentado: la Paradoja de Jevons, que sostiene que el consumo de una tecnología aumenta a medida que baja su costo operativo. Dicho de otro modo: hacer que la IA sea más eficiente en memoria no reduce la demanda de memoria, sino que abarata el acceso y dispara el uso.
La situación recuerda al pánico que siguió al lanzamiento del modelo R1 de DeepSeek a principios de 2025, cuando se temía una caída similar en la demanda de recursos de cómputo. Habrá que ver si el mercado vuelve a cometer el mismo error de lectura. El analista Josh Kale lo resumió en un post en X: como reacción instintiva puede entenderse, pero en ningún escenario realista se venderá menos memoria que ayer.
El impacto en los precios de smartphones y electrónicos
La interacción entre esta mayor eficiencia y la Paradoja de Jevons también tiene consecuencias directas para los consumidores: no se espera que la presión alcista en los precios de smartphones y otros dispositivos electrónicos se modere en el corto plazo. La llamada memory chipflation —la inflación derivada del encarecimiento de los chips de memoria— tiene todo para seguir siendo un factor de peso en el mercado de electrónicos de consumo durante los próximos meses.
Fuente: WCCFTech
