课程表

Apache Pig 基础

Apache Pig 诊断运算符

Apache Pig 分组和连接

Apache Pig 合并和拆分

Apache Pig 过滤

Apache Pig 排序

Pig Latin 内置函数

Apache Pig 其他执行模式

工具箱
速查手册

RANDOM()函数

当前位置:免费教程 » 大数据/云 » Apache Pig

RANDOM() 函数用于获取大于或等于0.0且小于1.0的伪随机数(double类型)。

  1. grunt> RANDOM()

假设在 HDFS 目录 /pig_data/ 中有一个名为 math.txt 的文件。此文件包含整数和浮点值,如下所示。

math.txt

  1. 5
  2. 16
  3. 9
  4. 2.5
  5. 5.9
  6. 3.1

通过使用 math_data 关系将此文件加载到Pig中,如下所示。

  1. grunt> math_data = LOAD 'hdfs://localhost:9000/pig_data/math.txt' USING PigStorage(',')
  2. as (data:float);

现在使用 RANDOM() 函数生成math.txt文件内容的随机值,如下所示。

  1. grunt> random_data = foreach math_data generate (data), RANDOM();

上述语句结果将存储在名为 random_data 的关系中。使用Dump运算符验证关系的内容,如下所示。

  1. grunt> Dump random_data;
  2. (5.0,0.6842057767279982)
  3. (16.0,0.9725172591786139)
  4. (9.0,0.4159326414649489)
  5. (2.5,0.30962777780713147)
  6. (5.9,0.705213727551145)
  7. (3.1,0.24247708413861724)
转载本站内容时,请务必注明来自W3xue,违者必究。
 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号