• 欢迎访问蜷缩的蜗牛博客 蜷缩的蜗牛
  • 微信搜索: 蜷缩的蜗牛 | 联系站长 kbsonlong@qq.com
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏吧

Hadoop默认端口应用一览

Hadoop 蜷缩的蜗牛 9个月前 (02-02) 277次浏览 已收录

本文转自:《Hadoop 默认端口应用一览

 

Hadoop 集群的各部分一般都会使用到多个端口,有些是 daemon 之间进行交互之用,有些是用于 RPC 访问以及 HTTP 访问。而随着 Hadoop 周边组件的增多,完全记不住哪个端口对应哪个应用,特收集记录如此,以便查询。

这里包含我们使用到的组件:HDFS, YARN, HBase, Hive, ZooKeeper。

组件Daemon端口配置说明
HDFSDataNode50010dfs.datanode.addressdatanode 服务端口,用于数据传输
50075dfs.datanode.http.addresshttp 服务的端口
50475dfs.datanode.https.addresshttps 服务的端口
50020dfs.datanode.ipc.addressipc 服务的端口
NameNode50070dfs.namenode.http-addresshttp 服务的端口
50470dfs.namenode.https-addresshttps 服务的端口
8020fs.defaultFS接收 Client 连接的 RPC 端口,用于获取文件系统 metadata 信息。
journalnode8485dfs.journalnode.rpc-addressRPC 服务
8480dfs.journalnode.http-addressHTTP 服务
ZKFC8019dfs.ha.zkfc.portZooKeeper FailoverController,用于 NN HA
YARNResourceManager8032yarn.resourcemanager.addressRM 的 applications manager(ASM)端口
8030yarn.resourcemanager.scheduler.addressscheduler 组件的 IPC 端口
8031yarn.resourcemanager.resource-tracker.addressIPC
8033yarn.resourcemanager.admin.addressIPC
8088yarn.resourcemanager.webapp.addresshttp 服务端口
NodeManager8040yarn.nodemanager.localizer.addresslocalizer IPC
8042yarn.nodemanager.webapp.addresshttp 服务端口
8041yarn.nodemanager.addressNM 中 container manager 的端口
JobHistory Server10020mapreduce.jobhistory.addressIPC
19888mapreduce.jobhistory.webapp.addresshttp 服务端口
HBaseMaster60000hbase.master.portIPC
60010hbase.master.info.porthttp 服务端口
RegionServer60020hbase.regionserver.portIPC
60030hbase.regionserver.info.porthttp 服务端口
HQuorumPeer2181hbase.zookeeper.property.clientPortHBase-managed ZK mode,使用独立的 ZooKeeper 集群则不会启用该端口。
2888hbase.zookeeper.peerportHBase-managed ZK mode,使用独立的 ZooKeeper 集群则不会启用该端口。
3888hbase.zookeeper.leaderportHBase-managed ZK mode,使用独立的 ZooKeeper 集群则不会启用该端口。
HiveMetastore9083/etc/default/hive-metastore 中 export PORT=<port>来更新默认端口
HiveServer10000/etc/hive/conf/hive-env.sh 中 export HIVE_SERVER2_THRIFT_PORT=<port>来更新默认端口
ZooKeeperServer2181/etc/zookeeper/conf/zoo.cfg 中 clientPort=<port>对客户端提供服务的端口
2888/etc/zookeeper/conf/zoo.cfg 中 server.x=[hostname]:nnnnn[:nnnnn],标蓝部分follower 用来连接到 leader,只在 leader 上监听该端口。
3888/etc/zookeeper/conf/zoo.cfg 中 server.x=[hostname]:nnnnn[:nnnnn],标蓝部分用于 leader 选举的。只在 electionAlg 是 1,2 或 3(默认)时需要。

所有端口协议均基于 TCP。

对于存在 Web UI(HTTP 服务)的所有 hadoop daemon,有如下 url:

/logs
日志文件列表,用于下载和查看

/logLevel
允许你设定 log4j 的日志记录级别,类似于 hadoop daemonlog

/stacks
所有线程的 stack trace,对于 debug 很有帮助

/jmx
服务端的 Metrics,以 JSON 格式输出。

/jmx?qry=Hadoop:*会返回所有 hadoop 相关指标。
/jmx?get=MXBeanName::AttributeName 查询指定 bean 指定属性的值,例如/jmx?get=Hadoop:service=NameNode,name=NameNodeInfo::ClusterId 会返回 ClusterId。
这个请求的处理类:org.apache.hadoop.jmx.JMXJsonServlet

而特定的 Daemon 又有特定的 URL 路径特定相应信息。

NameNode:http://:50070/

/dfshealth.jsp
HDFS 信息页面,其中有链接可以查看文件系统

/dfsnodelist.jsp?whatNodes=(DEAD|LIVE)
显示 DEAD 或 LIVE 状态的 datanode

/fsck
运行 fsck 命令,不推荐在集群繁忙时使用!

DataNode:http://:50075/

/blockScannerReport
每个 datanode 都会指定间隔验证块信息

参考:
http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/hdfs-default.xml
http://blog.cloudera.com/blog/2009/08/hadoop-default-ports-quick-reference/

Hadoop 默认端口应用一览

本文转载自 Hadoop 默认端口应用一览


蜷缩的蜗牛 , 版权所有丨如未注明 , 均为原创丨 转载请注明Hadoop 默认端口应用一览
喜欢 (2)
[]
分享 (0)