8 月 27 日消息,字節(jié)跳動(dòng)近期開(kāi)源了一項(xiàng)代號(hào)為 OMGD 的壓縮技術(shù)。這是字節(jié)自研的 GAN(生成對(duì)抗網(wǎng)絡(luò))壓縮算法,在保證生成效果不變的前提下,算力消耗最低可以減少到原來(lái)的 1/46,相比之前業(yè)界的最佳壓縮效果提升一倍多。據(jù)悉,這項(xiàng)技術(shù)的論文已入選國(guó)際計(jì)算機(jī)視覺(jué)會(huì)議 ICCV 2021。

據(jù)悉,GAN 是人工智能領(lǐng)域重要的深度學(xué)習(xí)模型,在圖像生成、音樂(lè)生成和視頻生成等方面應(yīng)用廣泛,還可以提高圖像質(zhì)量,實(shí)現(xiàn)圖像風(fēng)格化、圖像著色等任務(wù)。漫畫(huà)特效等人們常用的短視頻道具,就是通過(guò) GAN 實(shí)現(xiàn)的。
由于 GAN 對(duì)計(jì)算資源和存儲(chǔ)空間的需求巨大,模型難以直接部署到手機(jī)、Pad 等移動(dòng)設(shè)備上,業(yè)界一直在努力改進(jìn) GAN 的壓縮方法。2020 年,麻省理工學(xué)院、Adobe 和上海交通大學(xué)的研究者們提出一種 GAN 壓縮算法,將算力消耗成功減少到 1/21。此次字節(jié)跳動(dòng)提出的 OMGD 方法則進(jìn)一步提升了壓縮能力。
OMGD(Online Multi-Granularity Distillation)意為“在線多粒度蒸餾”。據(jù)字節(jié)跳動(dòng)技術(shù)團(tuán)隊(duì)的論文顯示,該算法能靈活地在訓(xùn)練過(guò)程中優(yōu)化并壓縮 GAN 模型,從而實(shí)現(xiàn)更好的圖像效果和更少的計(jì)算成本。
測(cè)試數(shù)據(jù)表明,OMGD 壓縮算法對(duì) Pix2Pix 和 CycleGAN 這兩種常用的 GAN 解決方案效果顯著。Pix2Pix 和 CycleGAN 主要應(yīng)用于圖像到圖像的“翻譯”,比如將照片轉(zhuǎn)換為繪畫(huà),對(duì)黑白圖片著色等。OMGD 壓縮算法可使其算力消耗分別減少到原來(lái)的 1/40 和 1/46。
目前,OMGD 壓縮算法已在抖音等產(chǎn)品中落地,為用戶(hù)提供更豐富的視頻創(chuàng)作能力。相關(guān)技術(shù)代碼也已發(fā)布在開(kāi)源社區(qū),以幫助從業(yè)者提升 GAN 的創(chuàng)新和應(yīng)用效率。迄今,字節(jié)跳動(dòng)已開(kāi)源了機(jī)器學(xué)習(xí)平臺(tái) Klever、聯(lián)邦學(xué)習(xí)平臺(tái) Fedlearner、高性能分布式訓(xùn)練框架 BytePS 、LightSeq 推理和訓(xùn)練引擎等重磅項(xiàng)目。
節(jié)能環(huán)保是字節(jié)跳動(dòng)一個(gè)重要的技術(shù)研究方向。在不久前的自然語(yǔ)言處理領(lǐng)域國(guó)際頂會(huì) ACL 2021 上,字節(jié)跳動(dòng)的詞表學(xué)習(xí)方案獲得年度唯一的“最佳論文”大獎(jiǎng),該論文同樣極具節(jié)能價(jià)值,相比主流詞表可以節(jié)約 92% 的算力。
特別提醒:本網(wǎng)信息來(lái)自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類(lèi)作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。
相關(guān)推薦
- in域名可以在哪查詢(xún)?查詢(xún)方法一覽
- raksmart日本云服務(wù)器產(chǎn)品優(yōu)勢(shì)
- 逃離平臺(tái)算法:站長(zhǎng)做自媒體的終極目標(biāo)是“流量主權(quán)”
- 從SEO到KOC:老站長(zhǎng)轉(zhuǎn)型自媒體的3個(gè)認(rèn)知大關(guān)
- 個(gè)人網(wǎng)站創(chuàng)業(yè)轉(zhuǎn)型:玩轉(zhuǎn)直播電商,開(kāi)啟流量變現(xiàn)新大門(mén)
- 個(gè)人網(wǎng)站創(chuàng)業(yè)轉(zhuǎn)型:玩轉(zhuǎn)直播電商,開(kāi)啟流量變現(xiàn)新大門(mén)
- 2025 個(gè)人網(wǎng)站創(chuàng)業(yè)新方向:跨界融合,解鎖多元盈利密碼
- AI 浪潮下,個(gè)人網(wǎng)站如何借勢(shì)轉(zhuǎn)型創(chuàng)業(yè)