课程表

Apache Pig 基础

Apache Pig 诊断运算符

Apache Pig 分组和连接

Apache Pig 合并和拆分

Apache Pig 过滤

Apache Pig 排序

Pig Latin 内置函数

Apache Pig 其他执行模式

工具箱
速查手册

Apache Pig SIZE()函数

当前位置:免费教程 » 大数据/云 » Apache Pig

Pig Latin的 SIZE() 函数用于基于任何Pig数据类型计算元素的数量。

语法

下面给出了 SIZE() 函数的语法。

  1. grunt> SIZE(expression)

返回值根据Apache Pig中的数据类型而有所不同。

数据类型
int,long,float,double对于所有这些类型,size()函数返回1。
Char array对于char数组,size()函数返回数组中的字符数。
Byte array对于bytearray,size()函数返回数组中的字节数。
Tuple对于元组,size()函数返回元组中的字段数。
Bag对于包,size()函数返回包中的元组数。
Map对于映射,size()函数返回映射中键/值对的数量。

假设在HDFS目录 /pig_data/ 中有一个名为 employee.txt 的文件,如下所示。

employee.txt

  1. 1,John,2007-01-24,250
  2. 2,Ram,2007-05-27,220
  3. 3,Jack,2007-05-06,170
  4. 3,Jack,2007-04-06,100
  5. 4,Jill,2007-04-06,220
  6. 5,Zara,2007-06-06,300
  7. 5,Zara,2007-02-06,350

通过关系 employee_data 将此文件加载到Pig中,如下所示。

  1. grunt> employee_data = LOAD 'hdfs://localhost:9000/pig_data/ employee.txt' USING PigStorage(',')
  2. as (id:int, name:chararray, workdate:chararray, daily_typing_pages:int);

计算类型的大小

要计算特定列的类型大小,可以使用 SIZE() 函数。让我们计算name类型的大小,如下所示。

  1. grunt> size = FOREACH employee_data GENERATE SIZE(name);

验证

使用 DUMP 运算符验证关系 size ,如下所示。

  1. grunt> Dump size;

输出

它将产生以下输出,显示关系 size 的内容如下。在示例中,我们计算了 name 列的大小。由于它是varchar类型,因此 SIZE() 函数给出每个员工姓名中的字符数。

  1. (4)
  2. (3)
  3. (4)
  4. (4)
  5. (4)
  6. (4)
  7. (4)
转载本站内容时,请务必注明来自W3xue,违者必究。
 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号