CCA159 Data Analyst数据分析师认证考试
课程大纲
认证须知
开课计划
学习QQ群
常见问题
认证准备建议:Data Analyst数据分析师培训
考试形式:120分钟;70%通过;解决10~12个客户问题,对于每一个问题,考生必须给出一个满足所有要求的精确的技术解决方案。考生可在群集上使用任何工具或组合使用工具。
考试大纲
技能要求
准备数据
使用ETL准备数据便于查询
l 使用Sqoop将数据从MySQL数据库导入至HDFS中。
l 使用Sqoop将数据从HDFS中导出至MySQL数据库中
l Metstore各表间移动数据
l 在数据分析前,转换数据的值、列及文件形式
为数据提供结构
使用DDL来创建或改变metastore中的数据结构,便于Hive和Impala使用。
l 使用多种数据类型、分隔符、文件类型创建表格
l 使用现有的表格来创建新表,定义模式
l 在metastore中创建分区表以改善查询性能
l 修改表以改变现有模式
l 创建视图以简化查询
数据分析
在Hive和Impala中使用查询语言分析集群中的数据
l 使用SELECT代码包括unions、subqueries准备数据
l 在查询期间计算汇总统计量,包括sums、averages
l 使用join代码在不同数据源间创建查询
l 使用内置功能转换查询输出格式
l 使用窗口功能在行间执行查询