【hadoop】集群配置_外汇行情

【hadoop】集群配置

迪丽瓦拉

2024-06-01 19:53:45

0次

设置分发脚本

作用：循环复制文件到所有节点的相同目录下

脚本需要放在声明了全局环境变量的路径

echo $PATH

cd /home/用户
mkdir bin
cd bin
vim xsync#!/bin/bash
#1. 判断参数个数
if [ $# -lt 1 ]
thenecho Not Enough Arguement!exit;
fi#2. 遍历集群所有机器
for host in hadoop102 hadoop103 hadoop104
doecho ==================== $host ====================#3. 遍历所有目录，挨个发送for file in $@do#4. 判断文件是否存在if [ -e $file ]then#5. 获取父目录pdir=$(cd -P $(dirname $file); pwd)#6. 获取当前文件的名称fname=$(basename $file)ssh $host "mkdir -p $pdir"rsync -av $pdir/$fname $host:$pdirelseecho $file does not exists!fidone
donechmod +x xsync
xsync /home/atguigu/bin
将脚本复制到/bin 中，以便全局调用
sudo cp xsync /bin/   
同步环境变量配置（root 所有者）
sudo ./bin/xsync /etc/profile.d/my_env.sh
如果用了 sudo，那么 xsync 一定要给它的路径补全。
source /etc/profile

设置ssh免密登录

【Linux】ssh免密登录_岱宗夫如何、的博客-CSDN博客

部署规划

配置文件

Hadoop 配置文件分两类：默认配置文件和自定义配置文件，只有用户想修改某一默认配置值时，才需要修改自定义配置文件，更改相应属性值（1）默认配置文件：

cd $HADOOP_HOME/share/hadoop

cores-site.xml : 负责全局的配置（common）

hdfs-site.xml：负责hdfs的配置

mapred-site.xml: 负责mapreduce的配置

yarn-site.xml:负责yarn的配置

(2）自定义配置文件： core-site.xml、hdfs-site.xml、yarn-site.xml、mapred-site.xml 四个配置文件存放在 $HADOOP_HOME/etc/hadoop 这个路径上，用户可以根据项目需求重新进行修改配置。

配置集群 core-site.xml

cd $HADOOP_HOME/etc/hadoop

vim core-site.xml



fs.defaultFShdfs://hadoop102:8020hadoop.tmp.dir/opt/module/hadoop-3.1.3/datahadoop.http.staticuser.useratguigu

hdfs-site.xml

vim hdfs-site.xml





dfs.namenode.http-addresshadoop102:9870
dfs.namenode.secondary.http-addresshadoop104:9868

yarn-site.xml

vim yarn-site.xml

日志聚集概念：应用运行完成以后，将程序运行日志信息上传到 HDFS 系统上。


yarn.nodemanager.aux-servicesmapreduce_shuffleyarn.resourcemanager.hostnamehadoop103yarn.nodemanager.env-whitelistJAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CO
NF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAP
RED_HOME
yarn.log-aggregation-enabletrue


 yarn.log.server.url http://hadoop102:19888/jobhistory/logs


yarn.log-aggregation.retain-seconds604800

mapred-site.xml

vim mapred-site.xml




mapreduce.framework.nameyarn

分发配置文件

xsync /opt/module/hadoop-3.1.3/etc/hadoop/

配置workers

vim /opt/module/hadoop-3.1.3/etc/hadoop/workers

hadoop102
hadoop103
hadoop104

注意：该文件中添加的内容结尾不允许有空格，文件中不允许有空行。

xsync /opt/module/hadoop-3.1.3/etc

启动集群

第一次启动需要格式化NameNode

hdfs namenode -format

会产生新的集群id。NameNode和DataNode集群id不一致，会找不到之前的数据。

如果需要格式化Namenode,先停掉namenode 和 datanode 进程，删除所有机器的data和logs目录。

启动HDFS

sbin/start-dfs.sh

在配置了 ResourceManager 的节点（hadoop103）启动 YARN

sbin/start-yarn.sh

Web 端查看 HDFS 的 NameNode http://hadoop102:9870

mapred --daemon start historyserver

Web 端查看 YARN 的 ResourceManager http://hadoop103:8088 配置历史服务器

cd /opt/module/hadoop-3.1.3/etc/hadoop

vim mapred-site.xml


mapreduce.jobhistory.addresshadoop102:10020


mapreduce.jobhistory.webapp.addresshadoop102:19888

xsync $HADOOP_HOME/etc/hadoop/mapred-site.xml

http://hadoop102:19888/jobhistory

来源：Hadoop权威指南 Tom Wbite著

b站尚硅谷

词库加载错误:未能找到文件“E:\highferrum_mysql\Configuration\Dict_Stopwords.txt”。

上一篇：Java管理扩展MBean之MXBean

下一篇：kubernetes实战与源码学习

【hadoop】集群配置

相关内容

热门资讯