T客邦 May 10, 2024
AI 能源消耗挑戰與解決方案:人工智慧發展的關鍵議題378907493848d0ff664a003362ace0ab

近年來,人工智慧(AI)的崛起引起了廣泛的討論和擔憂,很多人擔心 AI 會造成失業率飆升,而有些樂觀的朋友則戲稱「只要電費貴過饅頭,AI 就永遠不能完全代替人」。

雖然這是句玩笑話,但背後則是實實在在的 AI 能耗問題,越來越多的人擔憂高能耗將成為制約 AI 發展的瓶頸。就在不久前,技術創業者、前 Google 工程師凱爾.柯比特(Kyle Corbitt)在社群媒體 X 上表示,微軟已經遇到了這方面的難題。

AI 到底有多費電?

柯比特稱,訓練 GPT-6 的微軟工程師們正忙著搭建 IB 網路(InfiniBand),把分佈在不同地區的 GPU 連接起來。這項工作很困難,但他們別無選擇,因為如果把超過 10 萬塊 H100 晶片部署在同一個地區,電網就會崩潰。

為什麼這些晶片集中起來會導致電網崩潰的後果呢?讓我們來簡單算一下。

NVIDIA 網站上公布的資料顯示,每塊 H100 晶片的峰值功率為 700W,10 萬塊 H100 峰值功耗最高可達 7000 萬 W。而 X 評論區有能源行業從業者指出,10 萬塊晶片的總能耗將相當於一座小型太陽能或風能發電廠的全部輸出。

除此之外,還要考慮這麼多晶片的配套設施的能耗,包括伺服器和冷卻裝置。這麼多耗電設施,集中在一小片區域,給電網帶來的壓力可想而知。

AI 耗電還只是冰山一角

關於 AI 能耗問題,《紐約客》的報導一度引起廣泛關注。報導估算,ChatGPT 每日耗電量或超過 50 萬千瓦時。

實際上,目前 AI 耗電量雖然看上去是個天文數字,但仍然遠遠不及加密貨幣和傳統的資料中心。而微軟工程師遇到的難題也表明,制約 AI 發展的不僅是技術本身的能耗,還有配套基礎設施的能耗,以及電網的承載力。

國際能源署(IEA)發表的一份報告顯示,2022 年全球資料中心、人工智慧和加密貨幣的耗電量達到 460 TWh,佔全球能耗的近 2%。IEA 預測,在最糟糕的情況下,到 2026 年這些領域的用電量將達 1000 TWh,與整個日本的用電量相當。

但是,報告同時顯示,目前直接投入 AI 研發的能耗遠低於資料中心和加密貨幣。

NVIDIA 在 AI 伺服器市場中佔據約 95% 的占有率,2023 年供應了約 10 萬顆晶片,每年耗電量約為 7.3 TWh。但是在 2022 年,加密貨幣的能耗為 110 TWh,與整個荷蘭的用電量相當。

2022 年與 2026 年,傳統資料心、加密貨幣、AI 資料心的能耗估計值(柱狀圖從下往上依次展示)。可見,目前 AI 耗電量遠低於資料心和加密貨幣。圖片來源:IEA ▲ 2022 年與 2026 年,傳統資料中心、加密貨幣、AI 資料中心的能耗估計值(柱狀圖從下往上依次展示)。可見,目前 AI 耗電量遠低於資料中心和加密貨幣。圖片來源:IEA

冷卻能耗,不容忽視

資料中心的能效通常用能效比(Power Usage Effectiveness)評估,即消耗的所有能源與 IT 負載消耗的能源的比值。能效比越接近於 1,表明資料中心浪費的能源越少。

資料中心標準組織 Uptime Institute 發表的報告顯示,2020 年全球大型資料中心的平均能效比約為 1.59。也就是說,資料中心的 IT 裝置每消耗 1 度電,其配套裝置就消耗 0.59 度電。

資料中心的額外能耗中,絕大部分應用於冷卻系統。一項調查研究顯示,冷卻系統消耗的能量可達資料中心總能耗的 40%。

近些年,隨著晶片更新換代,單台裝置的功率增大,資料中心的功率密度(即單位面積耗電量)不斷提升,對散熱提出了更高的要求。但與此同時,透過改進資料中心設計,就能大幅減少能量的浪費。

因為冷卻系統、結構設計等各方面的差異,不同資料中心的能效比差異很大。Uptime Institute 報告顯示,歐洲國家已經把能效比降到了 1.46,而在亞太地區仍有超過十分之一的資料中心能效比超過 2.19。

世界各國正在採取措施,敦促資料中心實現節能減排的目標。其中,歐盟要求大型資料中心設立餘熱回收裝置;美國政府注資研發更高能效的半導體;中國政府也出台措施,要求資料中心從 2025 年起能效比不高於 1.3,並將可再生能源使用比例逐年上調,到 2032 年達到 100%。

2020 年,全球各地大型資料心的能效比。從左到右依次為:非洲、亞太地區、洲、拉丁美洲、東、俄羅斯及獨聯體國家、美國和加拿大。圖片來源:Uptime Institute ▲ 2020 年,全球各地大型資料中心的能效比。從左到右依次為:非洲、亞太地區、歐洲、拉丁美洲、中東、俄羅斯及獨聯體國家、美國和加拿大。圖片來源:Uptime Institute

 

科技公司用電,節流難開源更難

隨著加密貨幣和 AI 的發展,各大科技公司的資料中心規模不斷擴大。據國際能源署(IEA)統計,在 2022 年美國擁有 2700 座資料中心,消耗了全國用電量的 4%,並預測這一比例到 2026 年將達到 6%。隨著美國東西海岸用地越發緊張,資料中心逐步向愛荷華州、俄亥俄州等中部地區轉移,但這些二線地區原有的產業並不發達,電力供應可能無法滿足需求。

一些技術公司嘗試擺脫電網的束縛,直接從小型核電站購買電能,但這種用電方式和新建核電站都要面臨複雜的行政流程。微軟嘗試使用 AI 輔助完成申請,而 Google 使用 AI 進行運算任務調度,以提高電網運行效率,降低企業碳排放。至於可控核聚變何時投入應用,目前仍然是未知數。

氣候變暖,雪上加霜

AI 的研發需要穩定而強大的電網支援,但隨著極端天氣頻發,許多地區的電網正在變得更加脆弱。氣候變暖會導致更加頻繁的極端天氣事件,不僅造成用電需求激增,加重電網負擔,還會直接衝擊電網設施。IEA 報告指出,受乾旱、降雨不足和提早融雪的影響,2023 年全球水力發電佔比下跌到三十年來的最低值,不足 40%。

天然氣往往被視為向可再生能源轉型過程中的一座橋樑,但它在冬季極端天氣下並不穩定。2021 年,寒潮襲擊美國德州,導致大面積斷電,部分居民家中斷電超過 70 小時。這次災難的一個主要原因就是天然氣管道冰凍,造成天然氣發電廠停擺。

北美電力可靠性委員會(North American Electric Reliability Council,簡稱 NERC)預測,在 2024-2028 年,美國、加拿大有超過 300 萬人口面臨越來越高的斷電風險。

為保障能源安全,同時實現節能減排,許多國家也將核電站視為一種過渡措施。在 2023 年 12 月舉辦的聯合國應對氣候變化委員會第 28 次峰會(COP 28)上,22 個國家簽署聯合聲明,承諾到 2050 年將核能發電能力提升到 2020 年水準的 3 倍。與此同時,隨著中國、印度等國大力推進核電建設,IEA 預測到 2025 年,全球核電發電量將達到歷史新高。

IEA 報告指出:「在變化的氣候模式面前,提高能源多樣化、提升電網跨區域調度能力和採取更加抗衝擊的發電方式將變得越發重要。」保障電網基礎設施,不僅關係到 AI 技術的發展,更是關乎國計民生。

 

 

 

加入T客邦Facebook粉絲團 固定链接 'AI 正在「吸乾」全球電力?耗電問題只是冰山一角,更可怕的事還在後面' 提交: May 10, 2024, 5:30pm CST