返回介绍

Hadoop 集成

发布于 2025-05-02 18:19:19 字数 514 浏览 0 评论 0 收藏

使用 Hadoop 类路径配置 Flink

Flink 将使用环境变量 HADOOP_CLASSPATH 来扩充启动 Flink 组件(如 Client,JobManager 或 TaskManager)时使用的类路径。默认情况下,大多数 Hadoop 发行版和云环境都不会设置此变量,因此如果 Flink 选择 Hadoop 类路径,则必须在运行 Flink 组件的所有计算机上导出环境变量。

在 YARN 上运行时,这通常不是问题,因为在 YARN 中运行的组件将使用 Hadoop 类路径启动,但是在向 YARN 提交作业时,Hadoop 依赖项必须位于类路径中。为此,通常就足够了

export HADOOP_CLASSPATH=`hadoop classpath`

In the shell 。请注意,这 hadoop 是 hadoop 二进制文件,它 classpath 是一个参数,用于打印已配置的 Hadoop 类路径。

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。