【hadoop】集群配置
迪丽瓦拉
2024-06-01 19:53:45
0

 设置分发脚本

作用:循环复制文件到所有节点的相同目录下

脚本需要放在声明了全局环境变量的路径

echo $PATH
cd /home/用户
mkdir bin
cd bin
vim xsync#!/bin/bash
#1. 判断参数个数
if [ $# -lt 1 ]
thenecho Not Enough Arguement!exit;
fi#2. 遍历集群所有机器
for host in hadoop102 hadoop103 hadoop104
doecho ==================== $host ====================#3. 遍历所有目录,挨个发送for file in $@do#4. 判断文件是否存在if [ -e $file ]then#5. 获取父目录pdir=$(cd -P $(dirname $file); pwd)#6. 获取当前文件的名称fname=$(basename $file)ssh $host "mkdir -p $pdir"rsync -av $pdir/$fname $host:$pdirelseecho $file does not exists!fidone
donechmod +x xsync
xsync /home/atguigu/bin
将脚本复制到/bin 中,以便全局调用
sudo cp xsync /bin/   
同步环境变量配置(root 所有者)
sudo ./bin/xsync /etc/profile.d/my_env.sh
如果用了 sudo,那么 xsync 一定要给它的路径补全。
source /etc/profile

设置ssh免密登录

【Linux】ssh免密登录_岱宗夫如何、的博客-CSDN博客

部署规划

 配置文件

Hadoop 配置文件分两类:默认配置文件和自定义配置文件,只有用户想修改某一默认 配置值时,才需要修改自定义配置文件,更改相应属性值 (1)默认配置文件:
cd $HADOOP_HOME/share/hadoop

cores-site.xml : 负责全局的配置(common)

hdfs-site.xml:负责hdfs的配置

mapred-site.xml: 负责mapreduce的配置

yarn-site.xml:负责yarn的配置

(2)自定义配置文件: core-site.xmlhdfs-site.xmlyarn-site.xmlmapred-site.xml 四个配置文件存放在 $HADOOP_HOME/etc/hadoop 这个路径上,用户可以根据项目需求重新进行修改配置。

配置集群 core-site.xml
cd $HADOOP_HOME/etc/hadoop
vim core-site.xml


fs.defaultFShdfs://hadoop102:8020hadoop.tmp.dir/opt/module/hadoop-3.1.3/datahadoop.http.staticuser.useratguigu
hdfs-site.xml
vim hdfs-site.xml




dfs.namenode.http-addresshadoop102:9870
dfs.namenode.secondary.http-addresshadoop104:9868
yarn-site.xml
vim yarn-site.xml
日志聚集概念:应用运行完成以后,将程序运行日志信息上传到 HDFS 系统上。

yarn.nodemanager.aux-servicesmapreduce_shuffleyarn.resourcemanager.hostnamehadoop103yarn.nodemanager.env-whitelistJAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CO
NF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAP
RED_HOME
yarn.log-aggregation-enabletrue


 yarn.log.server.url http://hadoop102:19888/jobhistory/logs


yarn.log-aggregation.retain-seconds604800
mapred-site.xml
vim mapred-site.xml



mapreduce.framework.nameyarn

分发配置文件

xsync /opt/module/hadoop-3.1.3/etc/hadoop/

配置workers

vim /opt/module/hadoop-3.1.3/etc/hadoop/workers
hadoop102
hadoop103
hadoop104
注意:该文件中添加的内容结尾不允许有空格,文件中不允许有空行。
xsync /opt/module/hadoop-3.1.3/etc

启动集群

第一次启动需要格式化NameNode

hdfs namenode -format

会产生新的集群id。NameNode和DataNode集群id不一致,会找不到之前的数据。

如果需要格式化Namenode,先停掉namenode 和 datanode 进程,删除所有机器的data和logs目录。

启动HDFS

sbin/start-dfs.sh
在配置了 ResourceManager 的节点(hadoop103启动 YARN
sbin/start-yarn.sh
Web 端查看 HDFS 的 NameNode http://hadoop102:9870
mapred --daemon start historyserver

Web 端查看 YARN 的 ResourceManager http://hadoop103:8088 配置历史服务器
cd /opt/module/hadoop-3.1.3/etc/hadoop
vim mapred-site.xml

mapreduce.jobhistory.addresshadoop102:10020


mapreduce.jobhistory.webapp.addresshadoop102:19888
xsync $HADOOP_HOME/etc/hadoop/mapred-site.xml
http://hadoop102:19888/jobhistory

来源:Hadoop权威指南 Tom Wbite著

b站尚硅谷

相关内容