站長資訊網
        最全最豐富的資訊網站

        距終極夢想更近一步!百度全新PLATO-2展現開放話題人機嗨聊新高度

         

          人與機器在開放領域自由對話這一終極理想,又迎來重大進展。近日,百度全新發布了超大規模模型PLATO-2,在承襲PLATO模型運用隱變量進行多樣化回復生成特性外,模型參數規模上升到16億!能夠就開放話題和人類流暢嗨聊。在對話演示中,PLATO不僅能深聊“去吧去吧,學會了游泳帶我一起”,還會小腹黑“你不怕我把你扔河里么?”,朱朝陽看了都直呼專業。

          這樣的優秀效果同樣反映在公開數據集的測試中,評估結果顯示百度PLATO-2的對話效果全面超越了今年谷歌發布的26億參數模型Meena,以及Facebook發布的27億參數模型Blender,以更少樣本達成了更優的效果。而在中文對話中,更是與微軟小冰拉開了極大差距,這無疑意味著百度PLATO-2將對話智能提升到了全新高度。

        距終極夢想更近一步!百度全新PLATO-2展現開放話題人機嗨聊新高度

          左圖為PLATO-2中文對話演示,右圖為《隱秘的角落》劇照

          如今,智能對話正以肉眼可見的速度成為人們熱愛談論的話題,不管是《向往的生活》里的國民機靈鬼小度,或者是手機里隨叫隨到的“hi,siri!”,我們越來越習慣以語言來和機器進行溝通。但不論是家庭、或是手機端,當下有明確功能性的智能助手對比真正能與人類在開放話題中自由對話仍然有差距。

          針對這一問題,近年來,基于大量語料和超大規模預訓練模型的對話生成技術取得了非常多喜人進展,如谷歌Meena、Facebook Blender等模型依托數十億級的參數和語料,已能模擬生成與人類非常相近的對話。

        距終極夢想更近一步!百度全新PLATO-2展現開放話題人機嗨聊新高度

          但是,龐大的對話語料下隱藏著豐富的信息,同樣的對話語境可以有多種不同的回復,這樣“一對多”問題是當前對話系統面臨的一個重要難點。我們知道,人與人的對話不僅與上下文相關,也和背景知識相關,不論是個人屬性、知識背景、或是價值觀、情緒狀態等。但每段對話背后,對話者的背景知識是模型訓練中難以獲取的,這就給訓練帶來了很大噪音。如谷歌Meena、臉書Blender等一般的編碼-解碼神經網絡不論結構多復雜,仍然是一個“一對一”的函數,直接應用很容易產生大量“哈哈,不知道”這類的安全回復。

          針對這一問題,百度去年發布的PLATO模型和微軟近期發布的OPTIMUS模型中都提到了運用隱變量來建模這種不可見多樣性的方法。百度PLATO更獨特地采用了離散隱變量建模,運用多樣化生成 + 合適度判斷的方式,在三個不同各類型的公開數據集上均取得了SOTA效果。

          此次公布的PLATO-2, 是百度在PLATO工作基礎上的進一步擴展,通過擴展網絡增加訓練數據集,模型的參數規模擴展到了16億。同時,PLATO采取了課程學習的方法,解決大規模參數隱變量網絡訓練的計算消耗問題,逐步優化參數、加快訓練效率。

        距終極夢想更近一步!百度全新PLATO-2展現開放話題人機嗨聊新高度

          PLATO-2模型結構簡圖

          這樣大體量的模型訓練,離不開百度深度學習平臺飛槳強大的并行能力支持。PLATO-2包含中英文兩部分模型。其中,中文模型在12億中文開放域多輪對話數據集上進行訓練,而英文模型則在7億英文開放域多輪數據集上訓練。PLATO-2訓練耗費了64張V100卡共3周的時間,依托了飛槳強大并行能力,包括Fleet并行庫和Recompute等擴展顯存的方式。單個Batch包含52萬Token,訓練過程中約進行了30萬次梯度回傳。

          為了驗證模型效果,百度對PLATO-2進行了全面的靜態和動態評估。靜態評估為利用現有對話從上文預測下文,以及人機對話、兩個模型相互對話形式的中英文動態評估。評測結果顯示,百度PLATO在動態和靜態評估中均明顯超越了微軟DialoGPT, 谷歌Meena和Facebook Blender模型。更在中文上,與微軟小冰在連貫性、信息量、吸引力、人性化

          等維度拉開了極大的差距。

          在對話演示中,也可以明顯看出PLATO不僅在對話內容豐富度上提升明顯,還能夠就一個話題深入聊天并擴展到相關話題。而此前的最佳模型Blender,則會頻繁地轉換話題。

        距終極夢想更近一步!百度全新PLATO-2展現開放話題人機嗨聊新高度

          PLATO-2英文對話演示和Blender使用相同對話種子對比

          基于PLATO-2在對話內容的豐富度和連貫性上展現出了來的高度,有望為智能對話開辟出全新的領域。此外,百度POLATO-2相關英文模型和代碼將在Github中陸續開放,中文模型未來也將開放接口服務。也期待在全球領軍AI企業的共同努力下,我們將離人機自由對話的終極夢想更近一步。

          更多信息請參考:https://github.com/PaddlePaddle/Knover

        特別提醒:本網內容轉載自其他媒體,目的在于傳遞更多信息,并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

        贊(0)
        分享到: 更多 (0)
        網站地圖   滬ICP備18035694號-2    滬公網安備31011702889846號
        主站蜘蛛池模板: 久久精品夜夜夜夜夜久久| 欧美精品在线视频| 欧美激情精品久久久久久久九九九 | 在线精品亚洲| 老湿亚洲永久精品ww47香蕉图片| 久久久久久亚洲精品不卡| 华人在线精品免费观看| 91无码人妻精品一区二区三区L| 中文字幕精品视频| WWW国产精品内射老师| 隔壁老王国产在线精品| 欧美精品丝袜久久久中文字幕| 四虎影视国产精品亚洲精品hd| 久久久久一级精品亚洲国产成人综合AV区| 国产成人精品亚洲日本在线| 成人精品一区二区三区| freesexvideos精品老师毛多| 亚洲精品视频免费| 国产成人精品日本亚洲专| 老司机午夜精品视频资源| 精品无人区麻豆乱码1区2区| 日产精品99久久久久久| 中文字幕日韩精品有码视频| 欧美国产成人精品一区二区三区| 国产午夜精品理论片久久| 人妻少妇精品视频二区| 在线精品亚洲一区二区| 久久国产精品-久久精品| 99视频在线观看精品| 99久久精品日本一区二区免费| 国产亚洲精品岁国产微拍精品| 国产精品单位女同事在线| 久久精品www人人爽人人| 无码aⅴ精品一区二区三区浪潮| 久久精品国产亚洲沈樵| 呦交小u女国产精品视频| 网友偷拍日韩精品| 久久久精品免费国产四虎| 国产精品视频第一区二区三区| 精品一区二区三区免费观看| 9久久9久久精品|