全国统一服务热线

400-035-8011

  • 广州优就业IT培训机构-中心-学校
  • 广州优就业IT培训机构-中心-学校

Spark系统架构解读

Spark系统架构解读

  在大数据技术的学习当中,Hadoop和Spark是重中之重的两个部分,关于Hadoop,之前我们已经介绍过很多了,今天的主题是Spark。作为继Hadoop之后的又一代计算框架,Spark受到重用也是有原因的。今天的大数据培训班分享,我们来对Spark系统架构做一个详细的介绍。

Spark系统架构解读

  Spark性能优势的原因
  Spark是UC Berkeley AMP lab所开源的类HadoopMapReduce的通用并行框架,专门用于大数据量下的迭代式计算。本质上来说,Spark是为了跟Hadoop配合而开发出来的,不是为了取代Hadoop。
  Spark运算比Hadoop的MapReduce框架快的原因是因为Hadoop在一次MapReduce运算之后,会将数据的运算结果从内存写入到磁盘中,第二次Mapredue运算时在从磁盘中读取数据,所以其瓶颈在2次运算间的多余IO消耗.
  Spark则是将数据一直缓存在内存中,直到计算得到较后的结果,再将结果写入到磁盘,所以多次运算的情况下,Spark是比较快的.其优化了迭代式工作负载。
 Spark系统架构
  整个Spark集群中,分为Master节点与worker节点,,其中Master节点上常驻Master守护进程和Driver进程,Master负责将串行任务变成可并行执行的任务集Tasks,同时还负责出错问题处理等,而Worker节点上常驻Worker守护进程,Master节点与Worker节点分工不同,Master负载管理全部的Worker节点,而Worker节点负责执行任务。
  Driver的功能是创建SparkContext,负责执行用户写的Application的main函数进程,Application就是用户写的程序。Spark支持不同的运行模式,包括Local,Standalone,Mesoses,Yarn模式.不同的模式可能会将Driver调度到不同的节点上执行.集群管理模式里,local一般用于本地调试。
  每个Worker上存在一个或多个Executor进程,该对象拥有一个线程池,每个线程负责一个Task任务的执行.根据Executor上CPU-core的数量,其每个时间可以并行多个跟core一样数量的Task。Task任务即为具体执行的Spark程序的任务。
广州优就业IT培训机构,优就业为广大学员提供更加人性化的选课服务,全日制封闭班、周末班、名企直聘班、进阶深造班、实战实训班、全栈高端班、在线直播班,多种班次类型,满足不同人群的学习需求。更联合高校开设学历班,学成后将获得承认的大专、本科学历,满足广大学员对更多技能、更高学历的追求。
  想了解更多内容,可咨询优就业在线客服,现在咨询有机会获得试听课名额,咨询热线电话:400-626-3986

尊重原创文章,转载请注明出处与链接:http://www.mxiao.cn/1514/new/177188/违者必究! 以上就是广州优就业IT培训机构 小编为您整理Spark系统架构解读的全部内容。

推荐课程 / RECOMMENDED COURSE

  • 全链路UI/UE交互设计

  • 广州优就业软件测试培训机构

  • 广州优就业大数据培训班

  • 广州优就业Web前端开发培训班

  • 查看更多>>

定制专属于你的课程

10秒登记,定制专属于你的课程方案

填写下表,让专业老师根据你的性格爱好选择最适合你的。

版权所有:广州优就业IT培训机构

温馨提示:提交留言后老师会第一时间与您联系!热线电话:400-035-8011