¿Cuánta agua utiliza la IA?

¿Cuánta agua utiliza la IA?

Apuesto a que has oído de todo, desde "la IA se bebe una botella de agua cada pocas preguntas" hasta "básicamente son unas gotas". La verdad tiene más matices. La huella hídrica de la IA varía considerablemente según dónde se ejecuta, la duración de la solicitud y cómo un centro de datos refrigera sus servidores. Así que sí, la cifra principal existe, pero está rodeada de una maraña de salvedades.

A continuación, analizo cifras claras y listas para tomar decisiones, explico por qué las estimaciones difieren y muestro cómo los constructores y los usuarios cotidianos pueden reducir el gasto en agua sin convertirse en monjes de la sostenibilidad.

Artículos que quizás te interese leer después de éste:

🔗 ¿Qué es un conjunto de datos de IA?
Explica cómo los conjuntos de datos permiten el entrenamiento de aprendizaje automático y el desarrollo de modelos.

🔗 Cómo la IA predice tendencias
Muestra cómo la IA analiza patrones para pronosticar cambios y resultados futuros.

🔗 Cómo medir el rendimiento de la IA
Desglosa métricas esenciales para evaluar la precisión, la velocidad y la confiabilidad.

🔗 Cómo hablar con la IA
Orienta estrategias de estímulo efectivas para mejorar la claridad, los resultados y la coherencia.


¿Cuánta agua consume la IA? Cifras rápidas que realmente puedes usar 📏

  • Por mensaje, el rango típico actual es de menos de un mililitro para un mensaje de texto mediano en un sistema convencional, hasta decenas de mililitros para una respuesta más larga y de mayor capacidad de procesamiento en otro. Por ejemplo, la contabilidad de producción de Google informa un mensaje de texto mediano de aproximadamente 0,26 ml (incluyendo la sobrecarga de servicio completa) [1]. La evaluación del ciclo de vida de Mistral estima una respuesta del asistente de 400 tokens en aproximadamente 45 ml (inferencia marginal) [2]. El contexto y el modelo son fundamentales.

  • Entrenamiento de un modelo a escala de frontera: puede alcanzar millones de litros , principalmente provenientes de la refrigeración y del agua incorporada en la generación de electricidad. Un análisis académico ampliamente citado estimó aproximadamente 5,4 millones de litros para entrenar un modelo de clase GPT, incluyendo aproximadamente 700.000 litros consumidos in situ para refrigeración, y abogó por una programación inteligente para reducir la intensidad del agua [3].

  • Centros de datos en general: los sitios grandes abarcan cientos de miles de galones por día en promedio en los principales operadores, con picos más altos en algunos campus dependiendo del clima y el diseño [5].

Seamos sinceros: al principio, esas cifras parecen inconsistentes. Lo son. Y hay buenas razones.

 

IA sedienta

Métricas de uso de agua basadas en IA ✅

Una buena respuesta a la pregunta " ¿Cuánta agua consume la IA?" debería cumplir algunos requisitos:

  1. Claridad de límites:
    ¿Incluye solo de refrigeración in situ o también externa utilizada por las centrales eléctricas para generar electricidad? Las mejores prácticas distinguen la extracción de agua del consumo de agua y los alcances 1, 2 y 3, de forma similar a la contabilidad del carbono [3].

  2. Sensibilidad a la ubicación
    El agua por kWh varía según la región y la combinación de redes, por lo que el mismo aviso puede tener diferentes impactos en el agua según dónde se suministre, una razón clave por la que la literatura recomienda una programación que tenga en cuenta el tiempo y el lugar [3].

  3. Realismo de la carga de trabajo:
    ¿Refleja la cifra la mediana de los indicadores de producción , incluyendo la capacidad inactiva y la sobrecarga del centro de datos, o solo el acelerador en pico? Google prioriza la contabilidad completa del sistema (inactividad, CPU/DRAM y sobrecarga del centro de datos) para la inferencia, no solo los cálculos de TPU [1].

  4. Tecnología de refrigeración.
    La refrigeración por evaporación, la refrigeración líquida de circuito cerrado, la refrigeración por aire y las nuevas directa al chip modifican drásticamente la intensidad del agua. Microsoft está implementando diseños destinados a eliminar el uso de agua de refrigeración en ciertas instalaciones de nueva generación [4].

  5. La hora del día y la estación del año
    El calor, la humedad y las condiciones de la red modifican la eficacia del uso del agua en la vida real; un estudio influyente sugiere programar trabajos importantes cuando y donde la intensidad del agua sea menor [3].


Extracción de agua vs. consumo de agua, explicado 💡

  • Extracción = agua extraída de ríos, lagos o acuíferos (parte devuelta).

  • Consumo = agua no devuelta porque se evapora o se incorpora a procesos/productos.

consumen principalmente agua por evaporación. La generación de electricidad puede extraer grandes volúmenes (a veces consumiendo parte de ellos), dependiendo de la planta y el método de refrigeración. Un número fiable de agua de IA etiqueta lo que informa [3].


A dónde va el agua en la IA: los tres cubos 🪣

  1. Alcance 1: refrigeración in situ.
    La parte visible: agua evaporada en el propio centro de datos. Las opciones de diseño, como la evaporación frente al aire o el líquido de circuito cerrado, establecen la base [5].

  2. Alcance 2: generación de electricidad
    Cada kWh puede llevar una etiqueta de agua oculta; la combinación y la ubicación determinan la señal de litros por kWh que hereda su carga de trabajo [3].

  3. Alcance 3: cadena de suministro.
    La fabricación de chips depende del uso de agua ultrapura. No se verá en una métrica "por solicitud" a menos que el límite incluya explícitamente los impactos incorporados (por ejemplo, un ACV completo) [2][3].


Proveedores en cifras, con matices 🧮

  • Google Gemini indica
    un método de servicio completo (incluyendo inactividad y sobrecarga de la instalación). El texto indica un consumo medio de aproximadamente 0,26 ml de agua y aproximadamente 0,24 Wh de energía; las cifras reflejan el tráfico de producción y los límites generales [1].

  • Ciclo de vida de Mistral Large 2
    Un LCA independiente poco común (con ADEME/Carbone 4) revela ~281 000 m³ para entrenamiento + uso temprano y un marginal de inferencia de ~45 mL para una respuesta de asistente de 400 tokens

  • La ambición de Microsoft de no consumir agua en refrigeración
    Los centros de datos de próxima generación están diseñados para consumir cero agua para refrigeración , apoyándose en enfoques directos al chip; los usos administrativos aún requieren algo de agua [4].

  • Escala general del centro de datos
    Los principales operadores informan públicamente que consumen cientos de miles de galones por día en promedio en sitios individuales; el clima y el diseño aumentan o disminuyen los números [5].

  • La línea de base académica anterior
    El análisis seminal de la “IA sedienta” estimó millones de litros para entrenar modelos de clase GPT, y que 10 a 50 respuestas medianas podrían equivaler aproximadamente a una de 500 ml , dependiendo en gran medida de cuándo y dónde se ejecuten [3].


¿Por qué las estimaciones difieren tanto?

  • Diferentes límites.
    Algunas cifras solo consideran la refrigeración in situ ; otras añaden el agua de la electricidad ; los análisis de ciclo de vida (ACV) pueden incluir la fabricación de chips . Manzanas, naranjas y ensalada de frutas [2][3].

  • Diferentes cargas de trabajo
    Un mensaje de texto corto no es una ejecución de código/multimodal larga; los objetivos de procesamiento por lotes, concurrencia y latencia cambian la utilización [1][2].

  • Diferentes climas y redes.
    Enfriamiento evaporativo en una región cálida y árida ≠ enfriamiento aire/líquido en una región fría y húmeda. La intensidad del agua en la red varía considerablemente [3].

  • Metodologías de proveedores:
    Google publicó un método de servicio para todo el sistema; Mistral publicó un ACV formal. Otros ofrecen estimaciones puntuales con métodos dispersos. Una afirmación destacada de "una quinceava parte de una cucharadita" por mensaje fue noticia, pero sin detalles de los límites, no es comparable [1][3].

  • Un objetivo en movimiento
    La refrigeración está evolucionando rápidamente. Microsoft está implementando un sistema piloto de refrigeración sin agua en ciertas instalaciones; su implementación reducirá el consumo de agua en las instalaciones, incluso si la electricidad de entrada aún tiene señal de agua [4].


Qué puedes hacer hoy para reducir la huella hídrica de la IA 🌱

  1. Dimensionar correctamente el modelo.
    Los modelos más pequeños y optimizados para tareas suelen alcanzar la precisión con un menor consumo de recursos. La evaluación de Mistral destaca las sólidas correlaciones entre tamaño y huella, y publica cifras de inferencia marginales para que se puedan razonar las compensaciones [2].

  2. Elija regiones que ahorran agua Prefiera
    regiones con climas más fríos, refrigeración eficiente y redes con menor intensidad de agua por kWh; el trabajo de “IA sedienta” muestra que que tiene en cuenta el tiempo y el lugar ayuda [3].

  3. Desplazar las cargas de trabajo en el tiempo
    Programe el entrenamiento/la inferencia de lotes pesados ​​para horas de uso eficiente del agua (noches más frescas, condiciones favorables de la red) [3].

  4. Solicite a su proveedor métricas transparentes:
    demanda de agua por solicitud , definición de límites y si las cifras incluyen la capacidad ociosa y los gastos generales de las instalaciones. Los grupos de políticas están presionando para que se obligue a la divulgación para que sea posible realizar comparaciones equitativas [3].

  5. La tecnología de enfriamiento es importante.
    Si utiliza hardware, evalúe el enfriamiento de circuito cerrado/directo al chip ; si utiliza la nube, prefiera regiones/proveedores que inviertan en diseños con poco agua [4][5].

  6. Utilizar aguas grises y opciones de reutilización
    Muchos campus pueden sustituir fuentes no potables o reciclar dentro de los circuitos; los grandes operadores describen el equilibrio entre las fuentes de agua y las opciones de enfriamiento para minimizar el impacto neto [5].

Un ejemplo rápido para hacerlo realidad (no es una regla universal): trasladar un trabajo de capacitación nocturno de una región cálida y seca en pleno verano a una región más fresca y húmeda en primavera, y ejecutarlo durante las horas valle, puede modificar tanto el consumo de agua en las instalaciones fuera de ellas (de la red). Ese es el tipo de programación práctica y sencilla que puede generar ganancias [3].


Tabla comparativa: recomendaciones rápidas para reducir el coste del agua en IA 🧰

herramienta audiencia precio Por qué funciona
Modelos más pequeños y adaptados a las tareas Equipos de ML, líderes de productos Bajo-medio Menos procesamiento por token = menos refrigeración + electricidad + agua; comprobado en informes de estilo LCA [2].
Selección de región por agua/kWh Arquitectos de la nube, adquisiciones Medio Cambiar a climas más fríos y redes con menor intensidad de agua; combinar con un enrutamiento que tenga en cuenta la demanda [3].
Ventanas de entrenamiento según la hora del día MLOps, programadores Bajo Las noches más frescas y las mejores condiciones de la red reducen la intensidad efectiva del agua [3].
Refrigeración directa al chip/circuito cerrado Operaciones del centro de datos Medio-alto Evita las torres de evaporación cuando sea posible, reduciendo así el consumo en el sitio [4].
Controles de longitud de mensajes y lotes Desarrolladores de aplicaciones Bajo Limite los tokens fuera de control, procese por lotes de manera inteligente y almacene en caché los resultados; menos milisegundos, menos mililitros [1][2].
Lista de verificación de transparencia de proveedores CTOs, líderes de sostenibilidad Gratis Fuerza la claridad de los límites (en el sitio vs. fuera del sitio) y la generación de informes comparables [3].
Aguas grises o fuentes recuperadas Instalaciones, municipios Medio La sustitución del agua no potable alivia la presión sobre el suministro de agua potable [5].
Asociaciones para la reutilización del calor Operadores, ayuntamientos Medio Una mejor eficiencia térmica reduce indirectamente la demanda de refrigeración y genera buena voluntad local [5].

(El “precio” es flexible por diseño: las implementaciones varían).


Análisis en profundidad: el ritmo de las políticas se hace cada vez más fuerte 🥁

Los organismos de ingeniería exigen la divulgación obligatoria del consumo de energía y agua de los centros de datos para que los compradores y las comunidades puedan evaluar los costos y beneficios. Las recomendaciones incluyen definiciones del alcance, informes a nivel de sitio y directrices de ubicación, ya que sin métricas comparables que tengan en cuenta la ubicación, estamos discutiendo a ciegas [3].


Análisis en profundidad: no todos los centros de datos consumen el mismo 🚰

Existe el mito persistente de que "la refrigeración por aire no consume agua". No es así. Los sistemas con un alto consumo de aire suelen requerir más electricidad , que en muchas regiones transporta agua oculta de la red eléctrica; por el contrario, la refrigeración por agua puede reducir la energía y las emisiones a costa del agua in situ. Los grandes operadores equilibran explícitamente estas ventajas y desventajas en cada planta [1][5].


Análisis profundo: una rápida verificación de la realidad sobre las afirmaciones virales 🧪

Quizás haya visto afirmaciones contundentes que afirman que una sola indicación equivale a "una botella de agua" o, por el contrario, a "solo unas gotas". Mejor postura: humildad con las matemáticas . Los límites creíbles actuales son ~0,26 ml para una indicación de producción mediana con una porción completa de gastos generales [1] y ~45 ml para una respuesta del asistente de 400 fichas (inferencia marginal) [2]. La tan difundida "una quinceava parte de una cucharadita" carece de un límite/método público; trátela como un pronóstico del tiempo sin la ciudad [1][3].


Mini-Preguntas Frecuentes: ¿Cuánta agua usa la IA? De nuevo, en lenguaje sencillo 🗣️

  • Entonces, ¿qué debería decir en una reunión?
    "Según la indicación, varía desde gotas hasta unos pocos sorbos , según el modelo, la longitud y la zona de aplicación. El entrenamiento se lleva a cabo en piscinas , no en charcos". Luego, cite uno o dos ejemplos anteriores.

  • ¿Es la IA especialmente mala?
    Está excepcionalmente concentrada : chips de alta potencia agrupados generan grandes cargas de refrigeración. Pero los centros de datos también son donde la tecnología de mayor eficiencia suele aterrizar primero [1][4].

  • ¿Qué tal si simplemente cambiamos todo a refrigeración por aire?
    Podríamos reducir en la planta , pero aumentar externo mediante electricidad. Los operadores sofisticados consideran ambas opciones [1][5].

  • ¿Qué pasará con la tecnología del futuro?
    Los diseños que eviten el enfriamiento por agua a gran escala serían revolucionarios para el Alcance 1. Algunos operadores están adoptando esta estrategia; la electricidad aguas arriba seguirá transportando una señal de agua hasta que se modifiquen las redes [4].


Observaciones finales: Demasiado largo, no lo leí 🌊

  • Por indicación: considere cantidades desde submililitros hasta decenas de mililitros , según el modelo, la longitud de la indicación y su ubicación. La mediana de la indicación es de ~0,26 ml en una pila principal; ~45 ml para una respuesta de 400 tokens en otra [1][2].

  • Capacitación: millones de litros para modelos fronterizos, lo que hace que la programación, la ubicación y la tecnología de enfriamiento sean fundamentales [3].

  • Qué hacer: dimensionar correctamente los modelos, seleccionar regiones que ahorran agua, trasladar los trabajos pesados ​​a horas más frescas, preferir proveedores que demuestren diseños que ahorran agua y exigir límites transparentes [1][3][4][5].

Metáfora ligeramente defectuosa para terminar: La IA es una orquesta sedienta: la melodía es informática, pero la batería es refrigeración y agua de red. Si afinas la banda, el público sigue escuchando la música sin que se disparen los aspersores. 🎻💦


Referencias

  1. Blog de Google Cloud: ¿Cuánta energía consume la IA de Google? Hicimos los cálculos (metodología + ~0,26 ml de la mediana del mensaje, consumo total). Enlace
    (Documento técnico en PDF: Medición del impacto ambiental de la implementación de IA a escala de Google ). Enlace

  2. Mistral AI: Nuestra contribución a un estándar ambiental global para IA (LCA con ADEME/Carbone 4; ~281.000 m³ de entrenamiento + uso temprano; ~45 mL por respuesta de 400 tokens Enlace

  3. Li et al. - Haciendo que la IA tenga menos sed: Descubriendo y abordando la huella hídrica secreta de los modelos de IA (entrenamiento de millones de litros , con reconocimiento de tiempo y lugar , extracción vs. consumo). Enlace

  4. Microsoft: Los centros de datos de próxima generación no consumen agua para refrigeración (diseños de chip directo que buscan refrigeración sin agua en ciertas ubicaciones). Enlace

  5. Centros de datos de Google: funcionamiento sostenible (compensaciones en la refrigeración por sitio; generación de informes y reutilización, incluidas las aguas grises/recuperadas; órdenes de magnitud del uso diario típico a nivel de sitio). Enlace

Encuentra la última IA en la tienda oficial de AI Assistant

Sobre nosotros

Volver al blog