大数据行业五个就业岗位分析介绍
大数据行业是一个很广泛的概念,想要从事大数据行业的小伙伴可以有很多职业方向的选择。下面主要介绍大数据行业中五个就业岗位的介绍和职业规划分析,希望对准备学习或正在学习大数据的小伙伴有所帮助。
1、数据管理专员
数据管理专员其实就是IT技术岗位,工作性质和数据库管理员差不多,它的职位被认为和管理数据以及支持数据管理的设施有关。这个岗位和数据分析联系不大,因此Python和R语言的使用也不需要多么熟练。在工作中有可能会用到SQL语言,以及和Hadoop相关的查询语言,比如Hive和Pig。
要想从事数据管理专员,需要掌握的关键技术有:Apache Hadoop和它的生态系统、ApacheSpark和它的生态系统、SQL以及关系数据库、NoSQL数据库等等。
2、数据工程师
这是一条非分析大数据职业道路。如果说数据管理专员是汽车修理师,那么数据工程师就是汽车工程师。不过不要搞错了,这两个角色都对你的汽车的行驶和持续工作至关重要,对你从A点驾驶到B点同样重要。老实说,数据工程师和上面介绍的数据管理专员所需要的技术和技能是相似的。不过,他们各自在不同的层次理解和使用同样的概念。
3、商业分析师
商业分析师指的是,与数据分析和数据呈现紧密相关的岗位。包括报告、仪表板和任何被称为“商业智能”的东西。 该岗位通常要求与关系数据库和非关系数据库以及大数据框架的交互,商业分析师主要关注从那些或多或少存在的数据中提取信息。 这与机器学习研究者/从业者和以数据为导向的专业人员形成了鲜明的对比,两者都侧重于从数据或数据以外的一些表面信息中获得洞察力。
关于商业分析师的职业规划是,需要掌握并且不断精进以下核心技能:SQL和关系型数据库、NoSQL数据库和数据仓库等等。还有经常会用到商业报告和仪表盘封装技术也是重点,总之报告从本质来讲是没有固定模式的,快速掌握工具的使用是关键。
4、机器学习研究员/从业者
机器学习研究人员和从业者指的是那些制作和使用预测相关工具进行数据利用的从业者。机器学习算法允许以较高的速度应用统计分析,并且那些操作这些算法的人不满足于,让数据以其当前形式呈现出来。数据询问是机器学习爱好者的工作方式,但是具有足够的统计理解,才能知道何时推进的足够远,以及什么时候提供的答案不可信。统计和编程是机器学习研究者和实践者最大的财富。
关于该岗位的职业规划是掌握统计学、代数与演算(从业者的中级水平,研究员的高级水平),以及一定的编程技能,像是Python、C ++或其他一些通用语言。另外还要学习理论,从业者中级水平,研究员要求高级水平。最后还有理解机器学习算法的内部工作原理,算法越多越好,理解得越深入越好。
5、数据导向专业人员
数据管理专业人员和数据工程师关注数据的基础设施。商业分析人员关注从数据中提取事实。机器学习研究者和从业者关注推进和使用相关工具,以利用数据来进行预测和相关分析。这两种角色都是基于算法。数据导向的专业人员主要关注数据本身以及它可以告诉的事实,并不涉及执行任务时所需要的技术或工具。
面向数据的专业人员可能使用上面任何岗位中列出的任何技术,这取决于他们的具体职责。这是与“数据科学”有关的最大的问题之一。该岗位就像是数据世界的万金油:知道如何让一个Hadoop生态系统建立和运行;如何对存储在其中的数据执行查询;如何抽取数据,并且载入到非关系型数据库;如何获取非关系型数据并将其提取到平面文件( flat file);如何在R或Python语言中辨别这个数据;如何在进行初步探索性描述分析后设计特征;如何选择适当的机器学习算法来对数据进行预测分析;如何统计分析所述预测任务的结果;如何将结果可视化,以方便非技术人员使用;如何用刚刚描述的数据处理流水线的最终结果告诉管理人员一个令人信服的事实。