1.背景

大数据开发的测试环境，很多人不以为然，其实重复的打包，上传，测试虽然每次时间大概也就几分钟，但是积累起了往往会花费很多的时间，但是一个完整的测试环境在生产环境下往往难形成闭环，抛开堡垒机权限不说，hadoop，hive，spark等服务端的权限也会难倒一群英雄好汉，主要是太繁琐了，测试环境的搭建，我这里采用Docker容器，适合多端迁移，而且容器的镜像大小也比虚拟机小很多，难度上说，也只需要掌握几个基础的命令即可，除非想引入K8s等技术，但测试环境完全没必要，Docker环境搭建大数据平台的系列从这里大数据开发-Docker-使用Docker10分钟快速搭建大数据环境,Hadoop、Hive、Spark、Hue、Kafka、ElasticSearch.....[https://blog.csdn.net/hu_lichao/article/details/112125800](https://blog.csdn.net/hu_lichao/article/details/112125800)，环境搭建好了，可能还是会有一些特殊的问题

2.如何解决缺失winutils.exe

在Win操作系统，idea下开发hadoop程序或者Spark程序，那么你肯定会遇到下面的问题

file

之所以出现上面的问题，Spark程序和Hadoop在idea写编写的程序是依赖hadoop的环境的，所以要提前配置好，并且设定HADOOP_HOME ，不一定需要$HADOOP_HOME/bin 到PATH ，后者是给快捷方式用的

file

注意：配置完环境变量后要将idea，退出后重进，不能Restart

3.如何解决java.lang.NoSuchMethodError: org.apache.hadoop.security.authentication.util.KerberosUtil.hasKerberosKeyTab(Ljavax/security/auth/Subject;)Z

错误如下图

file

出现这个问题的原因是版本冲突，即使看起来不那么明显，可能是spark依赖的包中的hadoop和hadoop依赖的版本不一致https://stackoverflow.com/questions/45470320/what-is-the-kerberos-method，具体不一致的问题，可能各有不同，解决难易程度因人而异??????,我的解决方式就是exclude掉spark的低版本hadoop

4.如何解决Exception in thread "main" org.apache.spark.SparkException: Task not serializable

file

这个问题，我是这么遇到的，如下程序：

//        results.foreach(System.out::println); //输出没有序列化
        results.foreach(x -> System.out.println(x));

首先foreach是action算子，需要将task上的数据拉到driver上来遍历显示，就需要序列化，如果习惯了Java的lambda写法，可能会写第一种，第一种写法的问题是没有序列化，序列化是在闭包里完成的，而使用静态方法调用的方式，没有闭包化，所以会报序列化的问题，写成第二种就可以了，System.out是一个final static对象。

    public final static PrintStream out = null;

吴邪，小三爷，混迹于后台，大数据，人工智能领域的小菜鸟。
更多请关注
file

原文链接：http://www.cnblogs.com/hulichao/p/14264995.html

友情链接：直通硅谷　点职佳　北美留学生论坛

如何注册chatgpt，如何使用chatgpt，以及chatgpt无法访问的原因。chatgpt问题总结。

并行Louvain社区检测算法 - orion-orion

《Deep Learning》(深度学习)中文版PDF免费下载

斗地主AI出牌助手--在线调用斗地主AI，实现自动斗地主

ChatGPT 1.0.0安卓分析，仅限国内分享

ChatGPT3.5使用体验

0902-用GAN生成动漫头像

记录：tf.saved_model 模块的简单使用（TensorFlow 模型存储与恢复）

ML.NET教程之客户细分(聚类问题)

人工智能基础推荐文章

【LLM训练系列】NanoGPT源码详解和中文GPT训练实践

解密Prompt系列36. Prompt结构化编写和最优化算法UNIPROMPT

RealNet：从数据生成到模型训练的最新工业异常检测 | CVPR 2024

再探GraphRAG：如何提升LLM总结能力？

AI 大模型时代呼唤新一代基础设施，DataOps 2.0和调度编排愈发重要

QWen2-72B-Instruct模型安装部署过程

AI编程助手那些事儿

FP分数规划在无线通信中的应用

ambari+ bigtop 编译、打包、部署步骤总览

ComfyUI插件：ComfyUI Impact 节点（二）

1.背景

2.如何解决缺失winutils.exe

3.如何解决java.lang.NoSuchMethodError: org.apache.hadoop.security.authentication.util.KerberosUtil.hasKerberosKeyTab(Ljavax/security/auth/Subject;)Z

4.如何解决Exception in thread "main" org.apache.spark.SparkException: Task not serializable

人工智能基础热门文章

人工智能基础推荐文章