站長資訊網
        最全最豐富的資訊網站

        hive自帶的函數有哪些

        hive自帶的函數有哪些

        Hive的內置函數

        定義: (推薦學習:phpstorm)

        UDF(User-Defined-Function),用戶自定義函數對數據進行處理。 UDTF(User-Defined Table-Generating Functions) 用來解決 輸入一行輸出多行(On-to-many maping) 的需求。 UDAF(User Defined Aggregation Function)用戶自定義聚合函數,操作多個數據行,產生一個數據行。

        用法:

        1、UDF函數可以直接應用于select語句,對查詢結構做格式化處理后,再輸出內容。

        2、編寫UDF函數的時候需要注意一下幾點:

        a)自定義UDF需要繼承org.apache.hadoop.hive.ql.UDF。

        b)需要實現evaluate函。

        c)evaluate函數支持重載。

        hive的本地模式:

        大多數的Hadoop job是需要hadoop提供的完整的可擴展性來處理大數據的。

        不過,有時hive的輸入數據量是非常小的。在這種情況下,為查詢出發執行任務的時間消耗可能會比實際job的執行時間要多的多。

        對于大多數這種情況,hive可以通過本地模式在單臺機器上處理所有的任務。對于小數據集,執行時間會明顯被縮短。

        如此一來,對數據量比較小的操作,就可以在本地執行,這樣要比提交任務到集群執行效率要快很多。

        配置如下參數,可以開啟Hive的本地模式:

        hive> set hive.exec.mode.local.auto=true;(默認為false)

        hive自帶的函數有哪些當一個job滿足如下條件才能真正使用本地模式:

        job的輸入數據大小必須小于參數:hive.exec.mode.local.auto.inputbytes.max(默認128MB)

        job的map數必須小于參數:hive.exec.mode.local.auto.tasks.max(默認4)

        job的reduce數必須為0或者1

        贊(0)
        分享到: 更多 (0)
        網站地圖   滬ICP備18035694號-2    滬公網安備31011702889846號
        主站蜘蛛池模板: 老湿亚洲永久精品ww47香蕉图片| 青青草97国产精品免费观看| 国产AV国片精品一区二区| 自拍偷自拍亚洲精品第1页| 热久久这里只有精品| 日韩人妻无码精品久久免费一| 精品午夜福利1000在线观看| 欧美精品福利视频| 国产精品视频一区二区噜噜| 亚洲国产成人精品91久久久| 国产精品青草久久久久福利99| 国产精品大白天新婚身材| 日韩精品人妻系列无码专区| 亚洲高清国产拍精品青青草原 | 国产精品亚洲二区在线观看 | 亚洲AV日韩精品一区二区三区| 国产精品毛片一区二区| 欧美精品一本久久男人的天堂| 99视频精品全部在线观看| 乱码精品一区二区三区| 日韩精品国产另类专区| 亚洲精品白浆高清久久久久久| 无夜精品久久久久久| 免费精品国自产拍在线播放| 久久国产成人亚洲精品影院| 国产精品视频九九九| 国产精品无打码在线播放| 国产精品第1页| 精品第一国产综合精品蜜芽| 国产在线精品福利大全| 精品国产AⅤ一区二区三区4区| 精品国产91久久久久久久a| 国内精品久久久久久久coent| 国产精品性爱| 欧美精品一区二区久久| 亚洲精品WWW久久久久久| 亚洲精品乱码久久久久久蜜桃图片| 尤物国精品午夜福利视频| 无码国产精品一区二区免费式芒果| 婷婷精品国产亚洲AV麻豆不片| 日韩精品无码一区二区三区|