Java开发主流项目完整源码汇总

来源:互联网

2019-01-29 20:12:05

大数据行业热度有增无减,下面是小编整理的一些大数据面试题,希望能够对大家有所帮助。

【大数据面试题】常见的大数据面试题(三)

1、怎么在海量数据中找出重复次数最多的一个?

2、上千万或上亿数据(有重复),统计其中出现次数最多的钱 N 个数据。

3、一个文本文件,大约有一万行,每行一个词,要求统计出其中最频繁出现的前 10 个词,给出思想,给出时间复杂度分析。

4、100w 个数中找出最大的 100 个数。

5、有一千万条短信,有重复,以文本文件的形式保存,一行一条,有重复。 请用 5 分钟时间,找出重复出现最多的前 10 条。

6. 下面哪个程序负责 HDFS 数据存储。

a)NameNode

b)Jobtracker

c)Datanode

d)secondaryNameNode

e)tasktracker

7. HDfS 中的 block 默认保存几份?

a)3 份

b)2 份

c)1 份

d)不确定

8. 下列哪个程序通常与 NameNode 在一个节点启动?

a)SecondaryNameNode

b)DataNode

c)TaskTracker

d)Jobtracker

9. Hadoop 作者

a)Martin Fowler

b)Kent Beck

c)Doug cutting

10. HDFS 默认 Block Size

a)32MB

b)64MB

c)128MB

相关推荐:

【优就业大数据培训】从小白到大咖 打造大数据精英人才

【大数据培训教程】把握时代风口,做大数据架构师

THE END  

声明:本站稿件版权均属中公教育优就业所有,未经许可不得擅自转载。

领取零基础自学IT资源

涉及方向有Java、Web前端、UI设计、软件测试、python等科目,内容包含学习路线、视频、源码等

点击申请领取资料

点击查看资料详情 

收起 


 相关推荐

问题解答专区
返回顶部