一般来说大数据分析师需要:①会使用Hive的SQL方法HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合;②会一些SPSS modeler基础应用;③使用R语言进行数据集的创建和数据的管理等工作;④用Python来编写网络爬虫程序。