Hadoop面试常见问题

余生约 315 字大约 1 分钟大数据组件大数据组件使用指南

hadoop 中常问的就三块,第一:分布式存储(HDFS);第二:分布式计算框架 (MapReduce);第三:资源调度框架(YARN)

请说下HDFS的读写流程

HDFS在读文件时,其中一个块损坏怎么办

HDFS在上传文件时,其中一个DN挂掉怎么办

NameNode在启动时会做哪些操作

Secondary NameNode的工作机制

Secondary NameNode 不能恢复 NameNode 的全部数据,那如何保证 NameNode 数据存储安全

在 NameNode HA 中,会出现脑裂问题吗?怎么解决脑裂

小文件过多会有什么危害,如何避免

请说下 HDFS 的组织架构

请说下 MR 中 Map Task 的工作机制

请说下 MR 中 Reduce Task 的工作机制

请说下 MR 中 Shuffle 阶段

Shuffle 阶段的数据压缩机制了解吗

在写 MR 时,什么情况下可以使用规约

YARN 集群的架构和工作原理知道多少

YARN 的任务提交流程是怎样的

YARN 的资源调度三种模型了解吗