RANDOM()函数
RANDOM() 函数用于获取大于或等于0.0且小于1.0的伪随机数(double类型)。
- grunt> RANDOM()
例
假设在 HDFS 目录 /pig_data/ 中有一个名为 math.txt 的文件。此文件包含整数和浮点值,如下所示。
math.txt
- 5
- 16
- 9
- 2.5
- 5.9
- 3.1
通过使用 math_data 关系将此文件加载到Pig中,如下所示。
- grunt> math_data = LOAD 'hdfs://localhost:9000/pig_data/math.txt' USING PigStorage(',')
- as (data:float);
现在使用 RANDOM() 函数生成math.txt文件内容的随机值,如下所示。
- grunt> random_data = foreach math_data generate (data), RANDOM();
上述语句结果将存储在名为 random_data 的关系中。使用Dump运算符验证关系的内容,如下所示。
- grunt> Dump random_data;
- (5.0,0.6842057767279982)
- (16.0,0.9725172591786139)
- (9.0,0.4159326414649489)
- (2.5,0.30962777780713147)
- (5.9,0.705213727551145)
- (3.1,0.24247708413861724)
转载本站内容时,请务必注明来自W3xue,违者必究。