课程表

Apache Pig 基础

Apache Pig 诊断运算符

Apache Pig 分组和连接

Apache Pig 合并和拆分

Apache Pig 过滤

Apache Pig 排序

Pig Latin 内置函数

Apache Pig 其他执行模式

工具箱
速查手册

Apache Pig CONCAT()函数

当前位置:免费教程 » 大数据/云 » Apache Pig

Pig Latin的 CONCAT() 函数用于连接两个或多个相同类型的表达式。

语法

  1. grunt> CONCAT (expression, expression, [...expression])

假设在HDFS目录 /pig_data/ 中有一个名为 student_details.txt 的文件,如下所示。

student_details.txt

  1. 001,Rajiv,Reddy,21,9848022337,Hyderabad,89
  2. 002,siddarth,Battacharya,22,9848022338,Kolkata,78
  3. 003,Rajesh,Khanna,22,9848022339,Delhi,90
  4. 004,Preethi,Agarwal,21,9848022330,Pune,93
  5. 005,Trupthi,Mohanthy,23,9848022336,Bhuwaneshwar,75
  6. 006,Archana,Mishra,23,9848022335,Chennai,87
  7. 007,Komal,Nayak,24,9848022334,trivendram,83
  8. 008,Bharathi,Nambiayar,24,9848022333,Chennai,72

通过关系 student_details 将此文件加载到的Pig中,如下所示。

  1. grunt> student_details = LOAD 'hdfs://localhost:9000/pig_data/student_details.txt' USING PigStorage(',')
  2. as (id:int, firstname:chararray, lastname:chararray, age:int, phone:chararray, city:chararray, gpa:int);

连接两个字符串

我们可以使用 CONCAT() 函数来连接两个或多个表达式。 首先,使用Dump运算符验证 student_details 关系的内容,如下所示。

  1. grunt> Dump student_details;
  2. ( 1,Rajiv,Reddy,21,9848022337,Hyderabad,89 )
  3. ( 2,siddarth,Battacharya,22,9848022338,Kolkata,78 )
  4. ( 3,Rajesh,Khanna,22,9848022339,Delhi,90 )
  5. ( 4,Preethi,Agarwal,21,9848022330,Pune,93 )
  6. ( 5,Trupthi,Mohanthy,23,9848022336,Bhuwaneshwar,75 )
  7. ( 6,Archana,Mishra,23,9848022335,Chennai,87 )
  8. ( 7,Komal,Nayak,24,9848022334,trivendram,83 )
  9. ( 8,Bharathi,Nambiayar,24,9848022333,Chennai,72 )

然后,使用 describe 运算符验证schema(模式),如下所示。

  1. grunt> Describe student_details;
  2. student_details: {id: int, firstname: chararray, lastname: chararray, age: int,
  3. phone: chararray, city: chararray, gpa: int}

在上面的模式中,可以观察到学生的名称使用两个字符值即 firstname lastname 来表示。让我们使用 CONCAT() 函数来连接这两个值。

  1. grunt> student_name_concat = foreach student_details Generate CONCAT (firstname, lastname);

验证

使用 DUMP 运算符验证关系 student_name_concat ,如下所示。

  1. grunt> Dump student_name_concat;

输出

它将产生以下输出,显示关系 student_name_concat 的内容。

  1. (RajivReddy)
  2. (siddarthBattacharya)
  3. (RajeshKhanna)
  4. (PreethiAgarwal)
  5. (TrupthiMohanthy)
  6. (ArchanaMishra)
  7. (KomalNayak)
  8. (BharathiNambiayar)

我们还可以在两个表达式之间使用可选的分隔符,如下所示。

  1. grunt> CONCAT(firstname, '_',lastname);

现在,让我们通过将 student_details 关系中的 '_' 连接学生记录的firstname和lastname,如下所示。

  1. grunt> student_name_concat = foreach student_details GENERATE CONCAT(firstname, '_',lastname);

验证

使用 DUMP 运算符验证关系 student_name_concat ,如下所示。

  1. grunt> Dump student_name_concat;

输出

它将产生以下输出,显示关系 student_name_concat 的内容如下。

  1. (Rajiv_Reddy)
  2. (siddarth_Battacharya)
  3. (Rajesh_Khanna)
  4. (Preethi_Agarwal)
  5. (Trupthi_Mohanthy)
  6. (Archana_Mishra)
  7. (Komal_Nayak)
  8. (Bharathi_Nambiayar)
转载本站内容时,请务必注明来自W3xue,违者必究。
 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号