大数据开发、大数据平台开发是一个普通程序员和架构师的区别。大数据开发只需要着眼于某个功能的实现,而大数据平台开发则需要着眼于大局观来规划大数据平台的架构和整体的实现方式,最终促成项目达成。
数据以及逐渐成为了本世纪的“钻石矿”,而大数据就是以“钻石矿”为中心,以数据生产、采集、存储、加工、分析、服务等形成的产业链和经济活动。大数据产业包括数据资源的建设、大数据软硬件产品的开发、销售、租赁活动,还有相关的信息技术服务。大量数据的建模和加工,通过数据分析找到大量看似不相关数据之间的因果关系,并以此来进行统计规律并推测未来的走向,以此来减少试错成本、降低风险,解放很多无效的生产力。
既然大数据形成了一个大的产业,那么必然会形成符合大数据产业结构的人才需求体系,目前大数据人才方向主要分为大数据架构、大数据开发、大数据分析这3个方向。
大家有没有想过为什么会把大数据架构放在前面,而不是将大数据分析、大数据开发放在前面?完成同样一件事情的时候,会出现两类人。一类人是想也不想直接就干,不撞到南墙心不死,另一类人会对这件事做一个充分的评估,然后制定可行性方案,并且在具体实时的过程中不断的对实时的方案进行调优,完成这件事并且形成了一个完整的可复制的体系。
大数据平台开发着眼于大数据的架构,偏重于基建和架构。大数据架构师更多的关注点是在Hadoop、Spark、Storm等这些大数据框架的实现原理、如何部署、如何调优,并且保持稳定性。既要保证这些大数据架构与数据流工具(如Flume、Kafka)、可视化工具巧妙结合,又要保障Hive、PrestoDB、HBase、Cassandra等这些商业应用。大数据架构师首先肯定是要非常理解这些概念,并且能够信手拈来去辩证这些技术组合的技巧,这样才能为大数据收集、开发提供方向,最终才能实现软件、硬件的利用率最大化,提供稳定的服务。
其实大数据开发和大数据架构有很多方向是重合的,区别在于大数据开发主要是开发,而大数据架构主要是应用。大数据开发更为注重的技术的熟练掌控程度,以及如何的快速的实现功能。而大数据架构需要把控的是这个产品能提供什么功能,以及优点、缺点各是什么,并且做出取舍并最终落地到用户的手中。
大数据分析则注重于数据的建模和分析,并且从探索分析数据的方式中找到更多的规律,或者形成基于数据的未来进行预测和预判的手段。
一个完整的大数据平台的搭建并不是一两个人就能实现的。大数据开发向大数据平台开发迈进依赖的可不仅仅是技术,需要更多的是眼光、经验、以及对于市场的敏感程度。
以上个人浅见,欢迎批评指正。
认同我的看法,请点个赞再走,感谢!
喜欢我的,请关注我,再次感谢!