0
首页 > 图书详情

Spark:原理、机制及应用

  • 普通会员价:¥39.20
  • 高级会员价:¥38.20
  • 贵宾会员价:¥36.80
定价:¥49.00
作者:刘驰
  • I S B N :978-7-111-52928-6
  • 条码书号:9787111529286
  • 上架日期:2016/3/3
  • 出版日期:2016/3/4
  • 版       次:1-1
  • 出 版 社:机械工业出版社
  • 丛 书 名: 大数据科学丛书
  • 页     数:264    
  • 读者评论(查看)
  • 总浏览(1)次
  • 本月访问(1)次
  • 今日访问(1)次
  • 我要买:
详情描述

内容简介

本书是一本以Spark1.4为基础,详细介绍了Spark技术的概况、内部机制和企业界的应用情况。作者结合国内外众多资料和项目经验,力求深入浅出地讲解Spark技术的生态应用和发展状况,此外还选取了SparkSummit中的典型案例进行解析,为读者全面展现Spark技术在企业界的应用情况。本书适合Spark技术初学者、Spark技术爱好者、Spark运维工程师和开源软件爱好者,也可以作为相关培训学校和大专院校相关专业的教学用书。

目       录

【查看更多】

前       言

前 言

随着互联网与移动终端行业的迅猛发展,企业和个体对数据相关服务需求不断提升,以Apache H..

【查看更多】

作者简介

刘驰

刘驰,博士,现任北京理工大学软件学院教授,软件服务工程系系主任。入选“北京理工大学杰出中青年支持与发展计划”。主持了国家自然科学基金、工信部电子商务集成试点工程等多项国家省部级重点项目。分别于清华大学和英国帝国理工学院获得学士和博士学位,后历任德国电信研究院(柏林)博士后研究员、美国IBM TJ Watson研究中心研究员和IBM中国研究院研究主管。研究方向为:物联网、云计算和大数据技术。

【查看更多】

编辑荐语

Spark是一个高效的分布式计算系统,相比Hadoop,它在性能上比Hadoop要高100倍。Spark提供比Hadoop更上层的API,同样的算法在Spark中实现往往只有Hadoop的1/10或者1/100的长度。
Spark较大的集群来自腾讯——8000个节点,而单个较大的Job分别是阿里巴巴和Databricks——1PB,震撼人心!同时,截止2015年6月,Spark的Contributor比2014年涨了3倍,达到730人;总代码行数也比2014年涨了2倍多,达到40万行。
本书是国内(包括Github社区)较新的基于Spark 1.4版本的技术书籍,涵盖Spark技术的环境搭建、RDD实操应用、内部机制、调优和企业应用等内容,具体如下。
1)基于IntelliJ IDEA的运行、开发和编译环境的详细搭建过程。
2)详细介绍Spark技术基础概念和应用实践。
3)基于Spark 1.4官方文档对Spark四大应用框架进行解读。
4)基于源码深入剖析Spark的资源调度、任务调度和shuffle过程。
5)深入解读近两年Spark峰会和国内企业分享的典型应用案例。
本书的编写系统完整,力争以通俗易懂的语言全方位精细解读Spark技术,本书主要针对大数据技术初学者,包括但不限于大学生、研究生和工程师。此外,Spark应用开发人员、运维工程师和开源软件爱好者也可以将本书作为参考用书。
本书共分为概念、开发、机制和应用四篇,概念篇介绍Spark的背景概念和环境配置方法,开发篇介绍了Spark核心开发、四大应用框架和调优策略,机制篇则对Spark的RDD、调度和shuffle等机制进行解读,应用篇针对Spark在业界的典型应用进行阐述。

我要评价

发表您的评论(温馨提示:要登录后才可以提交评论内容哦)

  • 评论级别:
  • 五星
  • 四星
  • 三星
  • 两星
  • 一星
  • 评论内容:
本书相关资源下载
最近浏览