课程表

Apache Pig 基础

Apache Pig 诊断运算符

Apache Pig 分组和连接

Apache Pig 合并和拆分

Apache Pig 过滤

Apache Pig 排序

Pig Latin 内置函数

Apache Pig 其他执行模式

工具箱
速查手册

BagToString()函数

当前位置:免费教程 » 大数据/云 » Apache Pig

Pig Latin的  BagToString() 函数用于将包的元素连接成字符串。在连接时,我们可以在这些值之间放置分隔符(可选)。通常,包是无序的,可以使用 ORDER BY 运算符排序。

语法

下面给出了 BagToString() 函数的语法。

  1. grunt> BagToString(vals:bag [, delimiter:chararray])

假设在HDFS目录 /pig_data/ 中有一个名为 date of birth.txt 的文件,如下所示。 此文件包含出生日期。

dateofbirth.txt

  1. 22,3,1990
  2. 23,11,1989
  3. 1,3,1998
  4. 2,6,1980
  5. 26,9,1989

通过关系 dob 将这个文件加载到Pig中,如下所示。

  1. grunt> dob = LOAD 'hdfs://localhost:9000/pig_data/dateofbirth.txt' USING PigStorage(',')
  2. as (day:int, month:int, year:int);

将包转换为字符串

使用 bagtostring() 函数,我们可以将bag中的数据转换为字符串。让我们将 dob 关系分组,组操作将生成含有关系的所有元组的包。

使用Group All运算符将关系 dob 分组,并将结果存储在名为 group_dob 的关系中,如下所示。

  1. grunt> group_dob = Group dob All;

它将产生如下所示的关系。

  1. grunt> Dump group_dob;
  2. (all,{(26,9,1989),(2,6,1980),(1,3,1998),(23,11,1989),(22,3,1990)})

在这里,我们可以观察到一个有所有出生日期的包作为它的元组。现在,让我们使用函数 BagToString() 将包转换为字符串。

  1. grunt> dob_string = foreach group_dob Generate BagToString(dob);

验证

使用 DUMP 运算符验证关系 dob_string ,如下所示。

  1. grunt> Dump dob_string;

输出

它将产生以下输出,显示关系 dob_string 的内容。

  1. (26_9_1989_2_6_1980_1_3_1998_23_11_1989_22_3_1990)
转载本站内容时,请务必注明来自W3xue,违者必究。
 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号