<th id="6mqwi"></th>
<ul id="6mqwi"></ul>
<th id="6mqwi"></th>
  • <strike id="6mqwi"></strike>
  • 微軟推出ZeRO++技術(shù) 可顯著減少大模型訓(xùn)練時間和成本-新動態(tài)
    發(fā)布日期: 2023-06-27 16:54:45 來源: IT之家

    6 月 27 日消息,微軟研究人員日前推出了名為 ZeRO++ 的新技術(shù),用于優(yōu)化在訓(xùn)練大型 AI 模型時,容易遇到的數(shù)據(jù)傳輸成本和帶寬限制的難題,可顯著減少大模型訓(xùn)練時間和成本。

    據(jù)悉,ZeRO++ 建立在現(xiàn)有的 ZeRO 傳輸技術(shù)基礎(chǔ)上,并提供增強(qiáng)的通信策略,可提高訓(xùn)練效率,同時減少訓(xùn)練時間和成本。

    為了減少參數(shù)通信量,ZeRO++ 可對權(quán)重進(jìn)行量化,其利用基于塊的量化方法來保持訓(xùn)練精度,這種優(yōu)化的量化過程相對原始 Zero 傳輸技術(shù)更快更準(zhǔn)確。為了能夠盡量減少通信開銷,ZeRO++ 通過在每臺機(jī)器上保持完整的模型副本,以向 GPU 顯存換取通信帶寬。而在梯度通信方面,ZeRO++ 引入了一種名為 qgZ 的新的量化梯度通信方式,可以減少跨節(jié)點的流量和延遲。

    這些改進(jìn)的通信技術(shù)大大減少了通信量,微軟研究人員表示,與 ZeRO 相比,ZeRO++ 減少了高達(dá) 4 倍的通信量,提高了訓(xùn)練吞吐量和效率。當(dāng)在每個 GPU 上使用小批量大小時,在高帶寬集群中,ZeRO++ 相比 ZeRO-3 的吞吐量提高了 28% 至 36%。在低帶寬集群中,與 ZeRO-3 相比,ZeRO++ 實現(xiàn)了均 2 倍的加速,使得大模型訓(xùn)練在更多種類的集群上更為可行。

    IT之家注:IT之家注意到,例如 Turing-NLG、ChatGPT 和 GPT-4 這樣的大型模型,其訓(xùn)練需要跨多個 GPU 設(shè)備占用大量顯存和計算資源,而 ZeRO++ 引入了通信優(yōu)化策略,以克服在低帶寬集群上進(jìn)行訓(xùn)練時原有 ZeRO 傳輸技術(shù)的帶寬限制。目前微軟已經(jīng)放出了相關(guān)技術(shù)文檔,研究人員可以利用 ZeRO++ 更有效地訓(xùn)練模型,在 AI 領(lǐng)域探索新的可能

    關(guān)鍵詞:

    推薦內(nèi)容

    ?
    主站蜘蛛池模板: 日韩人妻无码一区二区三区久久99| 熟妇人妻不卡中文字幕| 国产无遮挡吃胸膜奶免费看 | xxxxx.av| 成人黄动漫画免费网站视频| 四虎成人精品无码| 黄色大片在线播放| 国产福利在线观看| 777精品成人影院| 夜夜爽免费视频| 一区二区不卡久久精品| 成年女人男人免费视频播放| 久久久久九九精品影院| 日韩精品久久无码人妻中文字幕 | 欧美色aⅴ欧美综合色| 人妻免费一区二区三区最新| 精品一区精品二区制服| 品色堂永久免费| 老板轻点好痛好涨嗯啊视频| 国产亚洲精品aa片在线观看网站| 黑人粗大猛烈进出高潮视频| 国产精品99久久免费观看| 91香蕉视频导航| 在线看成品视频入口免| ass日本乱妇bbw| 天堂а√在线官网| japanese老熟妇乱子伦视频| 好硬好爽老师再深点| 一本到在线观看视频| 幻女free性zozozoxxxxx| 一级毛片一级毛片免费毛片| 成人看的一级毛片| 中国高清xvideossex| 成视频年人黄网站免费视频| 中文字幕无码视频专区| 新婚夜被别人开了苞诗岚| 久久久一本精品99久久精品88| 日本三级在线观看中文字| 久久久久亚洲av成人无码| 日本一区二区三区日本免费| 久久久精品久久久久三级|