Seberapa banyak air yang digunakan AI?

Seberapa banyak air yang digunakan AI?

Saya yakin Anda pernah mendengar berbagai pernyataan, mulai dari "AI menghabiskan sebotol air setiap beberapa pertanyaan" hingga "pada dasarnya hanya beberapa tetes". Kenyataannya lebih kompleks. Jejak air AI sangat bervariasi tergantung di mana ia dijalankan, berapa lama pertanyaan yang diberikan, dan bagaimana pusat data mendinginkan servernya. Jadi ya, angka utama itu ada, tetapi angka tersebut berada di dalam serangkaian pengecualian.

Di bawah ini saya akan menjabarkan angka-angka yang jelas dan siap untuk pengambilan keputusan, menjelaskan mengapa perkiraan berbeda-beda, dan menunjukkan bagaimana para pembangun dan pengguna sehari-hari dapat mengurangi penggunaan air tanpa harus menjadi seorang biarawan keberlanjutan.

Artikel yang mungkin ingin Anda baca setelah ini:

🔗 Apa itu dataset AI?
Menjelaskan bagaimana dataset memungkinkan pelatihan pembelajaran mesin dan pengembangan model.

🔗 Bagaimana AI memprediksi tren
Menunjukkan bagaimana AI menganalisis pola untuk memprediksi perubahan dan hasil di masa depan.

🔗 Cara mengukur kinerja AI
Menjelaskan secara rinci metrik-metrik penting untuk menilai akurasi, kecepatan, dan keandalan.

🔗 Cara berbicara dengan AI
Memandu strategi pemberian petunjuk yang efektif untuk meningkatkan kejelasan, hasil, dan konsistensi.


Berapa banyak air yang digunakan AI? Angka-angka cepat yang benar-benar bisa Anda gunakan 📏

  • Per prompt, kisaran tipikal saat ini: dari sub-mililiter untuk prompt teks median pada satu sistem utama, hingga puluhan mililiter untuk respons yang lebih panjang dan membutuhkan komputasi lebih tinggi pada sistem lain. Misalnya, laporan akuntansi produksi Google menunjukkan prompt teks median ~0,26 mL (termasuk biaya overhead penyajian penuh) [1]. Penilaian siklus hidup Mistral memperkirakan balasan asisten 400 token sekitar ~45 mL (inferensi marginal) [2]. Konteks dan model sangat penting.

  • Melatih model skala perbatasan: dapat menghabiskan jutaan liter , sebagian besar dari pendinginan dan air yang digunakan dalam pembangkitan listrik. Analisis akademis yang banyak dikutip memperkirakan ~5,4 juta liter untuk melatih model kelas GPT, termasuk ~700.000 liter yang dikonsumsi di lokasi untuk pendinginan - dan berpendapat untuk penjadwalan cerdas untuk menurunkan intensitas air [3].

  • Pusat data secara umum: lokasi besar mencakup ratusan ribu galon per hari rata-rata di operator besar, dengan puncak yang lebih tinggi di beberapa kampus tergantung pada iklim dan desain [5].

Jujur saja: angka-angka itu terasa tidak konsisten pada awalnya. Memang benar. Dan ada alasan yang bagus untuk itu.

 

AI Haus

Metrik penggunaan air berbasis AI ✅

Jawaban yang baik untuk pertanyaan " Seberapa banyak air yang digunakan AI?" harus memenuhi beberapa kriteria:

  1. Kejelasan batas
    Apakah hanya mencakup pendingin di lokasi , atau juga di luar lokasi yang digunakan oleh pembangkit listrik untuk menghasilkan listrik? Praktik terbaik membedakan pengambilan air vs konsumsi air dan cakupan 1-2-3, serupa dengan akuntansi karbon [3].

  2. Sensitivitas lokasi:
    Konsumsi air per kWh bervariasi menurut wilayah dan campuran jaringan, sehingga perintah yang sama dapat menimbulkan dampak air yang berbeda tergantung di mana perintah tersebut dilayani - alasan utama mengapa literatur merekomendasikan penjadwalan yang mempertimbangkan waktu dan tempat [3].

  3. Realitas beban kerja
    Apakah angka tersebut mencerminkan median produksi , termasuk kapasitas idle dan overhead pusat data, atau hanya akselerator pada puncaknya? Google menekankan akuntansi sistem penuh (idle, CPU/DRAM, dan overhead pusat data) untuk inferensi, bukan hanya perhitungan TPU [1].

  4. Teknologi pendinginan
    Pendinginan evaporatif, pendinginan cairan loop tertutup, pendinginan udara, dan langsung ke chip mengubah intensitas air secara dramatis. Microsoft meluncurkan desain yang bertujuan untuk menghilangkan penggunaan air pendingin untuk situs generasi berikutnya tertentu [4].

  5. Waktu dan musim
    Panas, kelembapan, dan kondisi jaringan listrik mengubah efektivitas penggunaan air dalam kehidupan nyata; sebuah studi berpengaruh menyarankan penjadwalan pekerjaan besar ketika dan di mana intensitas air lebih rendah [3].


Penjelasan tentang pengambilan air vs konsumsi air 💡

  • Pengambilan air = air yang diambil dari sungai, danau, atau akuifer (sebagian dikembalikan).

  • Konsumsi = air yang tidak dikembalikan karena menguap atau digunakan dalam proses/produk.

Menara pendingin terutama mengonsumsi air melalui penguapan. Pembangkitan listrik dapat menarik volume besar (kadang-kadang mengonsumsi sebagiannya), tergantung pada pabrik dan metode pendinginan. Angka AI-air yang kredibel menunjukkan apa yang dilaporkannya [3].


Ke mana air mengalir dalam AI: tiga ember 🪣

  1. Lingkup 1 - pendinginan di lokasi
    Bagian yang terlihat: air yang menguap di pusat data itu sendiri. Pilihan desain seperti penguapan vs. udara atau cairan tertutup menetapkan dasar [5].

  2. Lingkup 2 - pembangkitan listrik
    Setiap kWh dapat membawa label air tersembunyi; campuran dan lokasi menentukan sinyal liter per kWh yang diwarisi beban kerja Anda [3].

  3. Cakupan 3 - rantai pasokan
    Manufaktur chip bergantung pada air ultra-murni dalam fabrikasi. Anda tidak akan melihatnya dalam metrik “per prompt” kecuali batasan tersebut secara eksplisit mencakup dampak yang terkandung (misalnya, LCA lengkap) [2][3].


Penyedia layanan berdasarkan angka, dengan nuansa yang lebih rinci 🧮

  • Google Gemini meminta
    metode penyajian tumpukan penuh (termasuk waktu idle dan biaya overhead fasilitas). Permintaan teks median ~0,26 mL air bersamaan dengan ~0,24 Wh energi; angka-angka tersebut mencerminkan lalu lintas produksi dan batasan komprehensif [1].

  • Siklus hidup Mistral Large 2.
    LCA independen yang langka (dengan ADEME/Carbone 4) mengungkapkan ~281.000 m³ untuk pelatihan + penggunaan awal dan marginal inferensi ~45 mL untuk balasan asisten 400 token

  • Ambisi Microsoft untuk pendinginan tanpa air
    Pusat data generasi berikutnya dirancang untuk tidak mengonsumsi air sama sekali untuk pendinginan , mengandalkan pendekatan langsung ke chip; penggunaan administratif masih memerlukan sejumlah air [4].

  • Skala pusat data umum
    Operator utama secara publik melaporkan rata-rata ratusan ribu galon per hari di masing-masing lokasi; iklim dan desain dapat memengaruhi angka tersebut naik atau turun [5].

  • Dasar akademis sebelumnya,
    yaitu analisis “AI haus” yang penting, memperkirakan jutaan liter untuk melatih model kelas GPT, dan bahwa 10–50 jawaban sedang kira-kira setara dengan 500 mL - sangat bergantung pada kapan/di mana model tersebut dijalankan [3].


Mengapa perkiraan sangat berbeda? 🤷

  • Batasan yang berbeda
    Beberapa angka hanya menghitung pendinginan di lokasi ; yang lain menambahkan air listrik ; LCA dapat menambahkan pembuatan chip . Apel, jeruk, dan salad buah [2][3].

  • Beban kerja yang berbeda.
    Sebuah perintah teks singkat bukanlah eksekusi multimodal/kode yang panjang; pengelompokan, konkurensi, dan target latensi mengubah pemanfaatan [1][2].

  • Iklim dan grid yang berbeda.
    Pendinginan evaporatif di daerah panas dan kering ≠ pendinginan udara/cair di daerah dingin dan lembap. Intensitas air grid sangat bervariasi [3].

  • Metodologi vendor
    Google menerbitkan metode penyajian sistem secara menyeluruh; Mistral menerbitkan LCA formal. Lainnya menawarkan estimasi titik dengan metode yang jarang. "seperlima belas sendok teh" per permintaan menjadi berita utama - tetapi tanpa detail batasan, hal itu tidak dapat dibandingkan [1][3].

  • Target yang terus
    berubah. Pendinginan berkembang pesat. Microsoft sedang melakukan uji coba pendinginan tanpa air di lokasi tertentu; penerapannya akan mengurangi penggunaan air di lokasi meskipun listrik di hulu masih membawa sinyal air [4].


Apa yang dapat Anda lakukan hari ini untuk mengurangi jejak air AI 🌱

  1. Sesuaikan ukuran model.
    Model yang lebih kecil dan disesuaikan dengan tugas seringkali menghasilkan akurasi yang sama sambil menggunakan daya komputasi yang lebih sedikit. Penilaian Mistral menggarisbawahi korelasi yang kuat antara ukuran dan jejak memori - dan menerbitkan angka inferensi marginal sehingga Anda dapat mempertimbangkan pertimbangan timbal balik [2].

  2. Pilih wilayah yang hemat air.
    Lebih baik pilih wilayah dengan iklim yang lebih sejuk, pendinginan yang efisien, dan jaringan dengan intensitas air yang lebih rendah per kWh; penelitian “AI haus” menunjukkan bahwa yang mempertimbangkan waktu dan tempat dapat membantu [3].

  3. Menggeser beban kerja dalam waktu
    Jadwalkan pelatihan/inferensi batch berat untuk jam-jam yang hemat air (malam yang lebih dingin, kondisi grid yang menguntungkan) [3].

  4. Mintalah vendor Anda untuk memberikan metrik yang transparan
    mengenai permintaan air per kebutuhan , definisi batasan, dan apakah angka-angka tersebut mencakup kapasitas menganggur dan biaya overhead fasilitas. Kelompok pembuat kebijakan mendorong pengungkapan wajib untuk memungkinkan perbandingan yang setara [3].

  5. Teknologi pendinginan itu penting.
    Jika Anda menjalankan perangkat keras, evaluasilah pendinginan loop tertutup/langsung ke chip ; jika Anda berada di cloud, pilihlah wilayah/penyedia yang berinvestasi dalam desain pendinginan hemat air [4][5].

  6. Gunakan air abu-abu dan opsi penggunaan kembali.
    Banyak kampus dapat mengganti sumber air non-minum atau mendaur ulang dalam siklus; operator besar menjelaskan penyeimbangan sumber air dan pilihan pendinginan untuk meminimalkan dampak bersih [5].

Contoh singkat untuk membuatnya nyata (bukan aturan universal): memindahkan pekerjaan pelatihan semalaman dari daerah panas dan kering di pertengahan musim panas ke daerah yang lebih sejuk dan lembap di musim semi - dan menjalankannya selama jam-jam di luar jam sibuk yang lebih sejuk - dapat menggeser di lokasi dan di luar lokasi (jaringan). Itulah jenis kemenangan praktis dan tanpa drama yang dapat dihasilkan oleh penjadwalan [3].


Tabel perbandingan: pilihan cepat untuk mengurangi dampak penggunaan air oleh AI 🧰

alat hadirin harga mengapa ini berhasil
Model yang lebih kecil dan disesuaikan dengan tugas. Tim ML, pimpinan produk Rendah–sedang Komputasi yang lebih sedikit per token = pendinginan yang lebih sedikit + listrik dan air; terbukti dalam pelaporan gaya LCA [2].
Pemilihan wilayah berdasarkan air/kWh Arsitek cloud, pengadaan Sedang Beralih ke iklim yang lebih dingin dan jaringan dengan intensitas air yang lebih rendah; dipasangkan dengan perutean yang mempertimbangkan permintaan [3].
Jendela waktu pelatihan dalam sehari MLOps, penjadwal Rendah Malam yang lebih dingin + kondisi jaringan yang lebih baik mengurangi intensitas air efektif [3].
Pendinginan langsung ke chip/sistem tertutup Operasi pusat data Sedang-tinggi Menghindari menara penguapan jika memungkinkan, sehingga mengurangi konsumsi di lokasi [4].
Panjang prompt & kontrol batch Pengembang aplikasi Rendah Batasi token yang tidak terkendali, lakukan pemrosesan secara cerdas, simpan hasil dalam cache; kurangi milidetik, kurangi mililiter [1][2].
Daftar periksa transparansi vendor CTO, pemimpin keberlanjutan Bebas Memperjelas batasan kekuatan (di lokasi vs di luar lokasi) dan pelaporan yang setara [3].
Sumber air limbah rumah tangga atau air daur ulang Fasilitas, kotamadya Sedang Penggantian air yang tidak layak minum mengurangi tekanan pada pasokan air minum [5].
Kemitraan pemanfaatan kembali panas Operator, dewan lokal Sedang Peningkatan efisiensi termal secara tidak langsung mengurangi permintaan pendinginan dan membangun reputasi baik di tingkat lokal [5].

(Harga sengaja dibuat tidak pasti - implementasinya bervariasi.)


Analisis mendalam: desakan kebijakan semakin menguat 🥁

Lembaga-lembaga teknik menyerukan pengungkapan wajib energi dan air pusat data agar pembeli dan masyarakat dapat menilai biaya dan manfaatnya. Rekomendasi mencakup definisi ruang lingkup, pelaporan tingkat lokasi, dan panduan penempatan lokasi - karena tanpa metrik yang sebanding dan mempertimbangkan lokasi, kita berdebat dalam kegelapan [3].


Analisis mendalam: tidak semua pusat data mengonsumsi udara dengan cara yang sama 🚰

Ada mitos yang terus beredar bahwa “pendinginan udara tidak menggunakan air.” Tidak sepenuhnya benar. Sistem yang banyak menggunakan udara seringkali membutuhkan lebih banyak listrik , yang di banyak wilayah membawa air tersembunyi dari jaringan listrik; sebaliknya, pendinginan air dapat mengurangi daya dan emisi dengan mengorbankan air di lokasi. Operator besar secara eksplisit menyeimbangkan pertimbangan ini di setiap lokasi [1][5].


Analisis mendalam: pengecekan realitas singkat terhadap klaim viral 🧪

Anda mungkin pernah melihat pernyataan berani bahwa satu prompt sama dengan “sebotol air,” atau, sebaliknya, “hanya beberapa tetes.” Sikap yang lebih baik: kerendahan hati dengan matematika . Batas kredibel saat ini adalah ~0,26 mL untuk prompt produksi median dengan biaya penyajian penuh [1] dan ~45 mL “seperlima belas sendok teh” yang banyak dibagikan tidak memiliki batasan/metode publik; perlakukan seperti ramalan cuaca tanpa kota [1][3].


Tanya Jawab Singkat: Berapa banyak air yang digunakan AI? Sekali lagi, dalam bahasa yang mudah dipahami 🗣️

  • Jadi, apa yang harus saya katakan dalam rapat?
    “Sesuai petunjuk, jumlahnya berkisar dari beberapa tetes hingga beberapa tegukan , tergantung pada model, durasi, dan di mana pelatihan tersebut berlangsung. Pelatihan membutuhkan banyak waktu , bukan hanya sedikit.” Kemudian sebutkan satu atau dua contoh di atas.

  • Apakah AI itu uniknya buruk? AI
    itu uniknya terkonsentrasi : chip berdaya tinggi yang dikemas bersama-sama menciptakan beban pendinginan yang besar. Tetapi pusat data juga merupakan tempat teknologi efisiensi terbaik cenderung pertama kali hadir [1][4].

  • Bagaimana jika kita memindahkan semuanya ke pendinginan udara?
    Anda mungkin mengurangi di lokasi tetapi meningkatkan penggunaan di luar lokasi melalui listrik. Operator yang berpengalaman mempertimbangkan keduanya [1][5].

  • Bagaimana dengan teknologi masa depan?
    Desain yang menghindari air pendingin dalam skala besar akan menjadi terobosan bagi Scope 1. Beberapa operator bergerak ke arah ini; listrik hulu masih membawa sinyal air sampai jaringan berubah [4].


Catatan Akhir - Terlalu Panjang, Saya Tidak Membacanya 🌊

  • Per prompt: pikirkan sub-mililiter hingga puluhan mililiter , tergantung pada model, panjang prompt, dan di mana ia dijalankan. Prompt median ~0,26 mL pada satu tumpukan utama; ~45 mL untuk balasan 400 token pada tumpukan lain [1][2].

  • Pelatihan: jutaan liter untuk model-model terdepan, menjadikan penjadwalan, penempatan, dan teknologi pendinginan sangat penting [3].

  • Yang harus dilakukan: menyesuaikan ukuran model, memilih wilayah yang hemat air, memindahkan pekerjaan berat ke jam yang lebih sejuk, memilih vendor yang menyediakan desain hemat air, dan menuntut batasan yang transparan [1][3][4][5].

Metafora yang sedikit kurang tepat sebagai penutup: AI itu seperti orkestra yang haus - melodinya adalah komputasi, tetapi drumnya adalah pendingin dan air untuk jaringan listrik. Atur nada bandnya, dan penonton tetap bisa menikmati musik tanpa perlu alat penyiram otomatis menyala. 🎻💦


Referensi

  1. Blog Google Cloud - Berapa banyak energi yang digunakan AI Google? Kami telah menghitungnya (metodologi + ~0,26 mL median prompt, overhead penyajian penuh). Tautan
    (PDF makalah teknis: Mengukur dampak lingkungan dari penyampaian AI dalam skala Google .) Tautan

  2. Mistral AI - Kontribusi kami terhadap standar lingkungan global untuk AI (LCA dengan ADEME/Carbone 4; ~281.000 m³ pelatihan + penggunaan awal; ~45 mL per 400 token , inferensi marginal). Tautan

  3. Li dkk. - Membuat AI Tidak Terlalu "Haus": Mengungkap dan Mengatasi Jejak Air Tersembunyi Model AI (melatih jutaan liter , yang mempertimbangkan waktu dan tempat , pengambilan vs. konsumsi). Tautan

  4. Microsoft - Pusat data generasi berikutnya tidak menggunakan air sama sekali untuk pendinginan (desain langsung ke chip yang menargetkan pendinginan tanpa air di lokasi tertentu). Tautan

  5. Pusat Data Google - Beroperasi secara berkelanjutan (pertimbangan pendinginan per lokasi; pelaporan dan penggunaan kembali, termasuk air daur ulang/air limbah; perkiraan besaran penggunaan harian tipikal di tingkat lokasi). Tautan

Temukan AI Terbaru di Toko Asisten AI Resmi

Tentang Kami

Kembali ke blog