大數據行業(yè)熱度有增無減,下面是小編整理的一些大數據面試題,希望能夠對大家有所幫助。
1、怎么在海量數據中找出重復次數最多的一個?
2、上千萬或上億數據(有重復),統計其中出現次數最多的錢 N 個數據。
3、一個文本文件,大約有一萬行,每行一個詞,要求統計出其中最頻繁出現的前 10 個詞,給出思想,給出時間復雜度分析。
4、100w 個數中找出最大的 100 個數。
5、有一千萬條短信,有重復,以文本文件的形式保存,一行一條,有重復。 請用 5 分鐘時間,找出重復出現最多的前 10 條。
6. 下面哪個程序負責 HDFS 數據存儲。
a)NameNode
b)Jobtracker
c)Datanode
d)secondaryNameNode
e)tasktracker
7. HDfS 中的 block 默認保存幾份?
a)3 份
b)2 份
c)1 份
d)不確定
8. 下列哪個程序通常與 NameNode 在一個節(jié)點啟動?
a)SecondaryNameNode
b)DataNode
c)TaskTracker
d)Jobtracker
9. Hadoop 作者
a)Martin Fowler
b)Kent Beck
c)Doug cutting
10. HDFS 默認 Block Size
a)32MB
b)64MB
c)128MB
相關推薦:
更多內容
>>本文地址:http://m.yceu.cn/jiuye/2019/47388.html
聲明:本站稿件版權均屬中公教育優(yōu)就業(yè)所有,未經許可不得擅自轉載。
1 您的年齡
2 您的學歷
3 您更想做哪個方向的工作?