文章链接
算法-大数据相关算法-大数据相关算法
面5笔5现有一个安装 2.6.5 版本的 Hadoop 集群,在不修改默认配置的情况下,存储 200 个每个 200M 的文本文件,请问最终会在集群中产生多少个数据块(包括副本)?
A.200
B.40000
C.400
D.1200
正确答案是 D
【解析】
在默认情况下,HDFS 集群默认存储文件 3 份,并且大文件会按照 128M 的数据块大小进行切割分散存储。所以题目中每个文件分为两块,总数据块有(200 * 2)= 400个。再加上会存储三份,所以 400 * 3 = 1200。