站長資訊網
        最全最豐富的資訊網站

        雅虎公開13.5TB用戶數據 參與人工智能

        雅虎公開13.5TB用戶數據 參與人工智能

          北京時間1月15日上午消息,雅虎周四公布了關于用戶如何使用該公司服務,例如雅虎新聞和雅虎財經的大量數據。此舉是為了給學術界的機器學習研究者提供素材。

          這并不是雅虎首次公布這樣的數據。在雅虎實驗室的Webscope項目中,雅虎曾56次發布這樣的數據,其中涉及廣告、圖片、社交媒體和評級等。此次公布的數據來自2015年的4個月時間,覆蓋了2000萬人,其中包括用戶訪問雅虎網站所使用的設備類型、文章的閱讀情況,以及文章的主題。其他數據還包括用戶的位置、年齡和性別,但這些數據都經過了匿名化處理。

          不過值得指出的是,雅虎此次提供的數據集規模龐大,多達13.5TB。而雅虎此前提供的數據集通常只有1TB。

          加州大學圣迭戈分校電氣和計算機工程教授格特·蘭克利特(Gert Lanckriet)表示:“我對此感到興奮。這是因為,學術界和工業界的這類合作對于更強大人工智能和機器學習技術的研究、設計和開發,現實世界中的大數據處理至關重要。”

          近期,雅虎正在采取措施吸引開發者。例如,雅虎開源了一些算法。這些算法用于對流數據的計算和網頁爬蟲,處理網站上的結構化數據。雅虎此次公布的數據將幫助學術界進一步了解用戶的閱讀習慣,進而對自己的算法進行優化。

          雅虎提供了100行的數據范例,其中包含多種類型的數據,例如股票、學校、政治、體育和明星等。

          雅虎實際上還有更多數據可以分享。雅虎實驗室個性化科學研究總監蘇吉·拉簡(Suju Rajan)表示,她常常需要與PB(1PB=1000TB)級別的數據量打交道,而對雅虎這樣的互聯網公司來說并不少見。不過,PB級別的數據對單一研究者來說很難處理,即使是13TB的數據都已顯得十分龐大。

          雅虎實驗室研究副總裁里卡多·貝扎-耶茨(Ricardo Baeza-Yates)表示:“許多人都沒有能力使用這一數據,但我們認為,通過這種方式我們可以推進相關研究

        特別提醒:本網內容轉載自其他媒體,目的在于傳遞更多信息,并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

        贊(0)
        分享到: 更多 (0)
        網站地圖   滬ICP備18035694號-2    滬公網安備31011702889846號
        主站蜘蛛池模板: 亚洲精品国产日韩无码AV永久免费网| 免费人妻精品一区二区三区| 国产精品无码国模私拍视频 | 久久久久人妻精品一区| 国产精品JIZZ在线观看老狼| 国产精品免费观看调教网| 亚洲国产精品日韩专区AV| 国产色婷婷精品综合在线| 国产精品素人搭讪在线播放| 狼色精品人妻在线视频| 日本Aⅴ大伊香蕉精品视频| 91不卡在线精品国产| 国产精品国产三级专区第1集| 久久国产精品99精品国产| 亚洲AV永久无码精品一区二区| 国产内地精品毛片视频| 精品精品国产高清a毛片牛牛| 国产精品一区二区久久国产| 熟女精品视频一区二区三区| 四虎永久在线精品国产馆V视影院| 国产午夜精品久久久久九九| 亚洲国产精品婷婷久久| 国产精品福利网站导航| 国语精品一区二区三区| 色欲国产麻豆一精品一AV一免费 | 国内精品久久九九国产精品| 国产精品区一区二区三在线播放 | 亚洲精品无码久久不卡| 日本一区二区三区精品国产 | 午夜DY888国产精品影院| 亚洲欧美一级久久精品| 亚洲国产成人精品女人久久久| 久久青青草原精品国产不卡| 久久99精品免费一区二区| 国产亚洲精品不卡在线| 国内精品久久久久久不卡影院 | 99久久精品九九亚洲精品| 四虎国产精品免费久久久| 337P亚洲精品色噜噜| 9re热国产这里只有精品| 国产精品亚洲玖玖玖在线观看|