大数据工程师证书考试应该学什么?
1.理解大数据大数据的本质其实是数据,但也包括一些新的特性,数据来源广泛;多样化的数据格式(结构化数据、非结构化数据、Excel文件等。);数据量大(至少TB级别,甚至PB级别);数据增长速度快。
2.大数据需要的技能需要Python语言:写一些脚本的时候会用到。
Scala语言:编写Spark程序的最佳语言,当然也可以选择Python。
阿兹卡班:预定任务的工具。
Hue,Zepplin:任务执行管理和结果查看的图形化工具。
Allluxio,Kylin等。:通过预处理存储的数据来加速操作的工具。
3.必须掌握的技能:HBase(、Kafka、Storm/JStorm、Scala、Python、Spark(Core+Spark SQL+Spark streaming)、辅助小工具(SQOOP/Flueme/OOZIE/Hue)等。).