本文介绍: Hadoop运行模式主要包括本地模式、伪分布式模式以及完全分布式模式。本地模式:单机运行,主要用于演示官方案例,生产环境使用。伪分布式模式:单机运行,但具备Hadoop集群的所有功能一台服务器模拟一个分布式的环境。完全分布式模式:多台服务器成分布式环境,生产环境使用。至于Hadoop目录结构,主要包括以下几个部分:bin目录存放对Hadoop相关服务hdfsyarnmapred)进行操作脚本etc目录:Hadoop配置文件目录存放Hadoop配置文件

Hadoop运行模式

本地模式

这种模式在一台单机上运行,没有分布式文件系统,而是直接读写本地操作系统文件系统,一般仅用于本地MR程序调试

说明:只是用来演示一下官方案例。生产环境不用。

伪分布式模式

这种模式也是在一台单机上运行,但是具备Hadoop集群的所有功能,一台服务器模拟一个分布式的环境。不同于完全分布式的是,这种模式没用不同的 Java 进程模仿分布式运行中的各类结点 (NameNode,DataNode, ResourceManager,SecondaryNameNode)。

伪分布模式在“单节点集群”上运行 Hadoop,其中所有的守护进程都运行在同一台机器上。该模式在单机模式之上增加了代码调试功能,允许你检查内存使用情况,HDFS 输入输出,以及其他的守护进程交互

说明:少数经费不足的公司用来测试,生产环境不用。

完全分布式模式

真正的分布式,由3个及以上的实体机或者虚拟机组件的机群。表示集群中的节点会被分配成很多种角色,分散在整个集群中。

说明:生产环境使用

Hadoop目录结构

重要目录以及目录作用

配置文件说明

Hadoop 配置文件分两类:默认配置文件自定义配置文件,只有用户修改某一默认配置值时,才需要修改自定义配置文件更改相应属性值。

可以查看官方文档Index of /docs (apache.org)版本号选择自己对应版本查看配置文件配置要求,官方文档中也有伪分布式配置样例

默认配置文件

获取默认文件 文件存放在Hadoop的jar包中的位置
[coredefault.xml] hadoopcommon-2.7.7.jar/coredefault.xml
[hdfsdefault.xml] hadoophdfs-2.7.7.jar/hdfsdefault.xml
[yarndefault.xml] hadoopyarncommon-2.7.7.jar/yarndefault.xml
[mapreddefault.xml] hadoopmapreduceclientcore-2.7.7.jar/mapred-default.xml

自定义配置文件

文件存放路径为:$HADOOP_HOME/etc/hadoop

其中有coresite.xml、hdfssite.xml、yarn-site.xml、mapred-site.xml(文件中是mapred-site.xml.template模板文件需要copy一下把.template后缀删去才能正常使用)、slaves(Hadoop3.x为workers多个配置文件用户可以根据项目需求重新进行修改配置

原文地址:https://blog.csdn.net/qq_61828116/article/details/134699303

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任

如若转载,请注明出处:http://www.7code.cn/show_19295.html

如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱suwngjj01@126.com进行投诉反馈,一经查实,立即删除

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注