Hadoop权威指南:大数据的存储与分析(第4版)(修订版)(升级版)
Hadoop权威指南:大数据的存储与分析(第4版)(修订版)(升级版)

本书结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,第Ⅱ部分介绍MapReduce,第Ⅲ部分介绍Hadoop的运维,第Ⅳ部分介绍Hadoop相关开源项目,第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目C

大数据处理框架Apache Spark设计与实现(全彩)
大数据处理框架Apache Spark设计与实现(全彩)

近年来,以ApacheSpark为代表的大数据处理框架在学术界和工业界得到了广泛的使用。本书以ApacheSpark框架为核心,总结了大数据处理框架的基础知识、核心理论、典型的Spark应用,以及相关的性能和可靠性问题。本书分9章,主要包含四部分内容。第一部分大数据处理框架的基础知识(第1~2章):介绍大数据处理框架的基本概念、系统架构、编程模型、相关的研究工作,并以一个典型的Spark应用

Python金融衍生品大数据分析
Python金融衍生品大数据分析

Python在衍生工具分析领域占据重要地位,使机构能够快速、有效地提供定价、交易及风险管理的结果。本书精心介绍了有效定价期权的四个领域:基于巿场定价的过程、完善的巿场模型、数值方法及技术。书中的内容分为三个部分。第一部分着眼于影响股指期权价值的风险,以及股票和利率的相关实证发现。第二部分包括套利定价理论、离散及连续时间的风险中性定价,并介绍Carr-Madan和Lewis这两种流行的傅里叶期权定

大数据架构和算法实现之路:电商系统的技术实战
大数据架构和算法实现之路:电商系统的技术实战

本书介绍了一些主流技术在商业项目中的应用,包括机器学习中的分类、聚类和线性回归,搜索引擎,推荐系统,用户行为跟踪,架构设计的基本理念及常用的消息和缓存机制。在这个过程中,我们有机会实践R、Mahout、Solr、Elasticsearch、Hadoop、HBase、Hive、Flume、Kafka、Storm等系统。如前所述,本书最大的特色就是,从商业需求出发演变到合理的技术方案和实现,因此根据不

文件系统技术内幕:大数据时代海量数据存储之道
文件系统技术内幕:大数据时代海量数据存储之道

《文件系统技术内幕:大数据时代海量数据存储之道》通过理论与实践相结合的方式,深入浅出地介绍了文件系统的概念、原理和具体实现。本书涵盖本地文件系统、网络文件系统、分布式文件系统和对象存储等内容,可以说涵盖了数据持久化文件系统的主要领域。为了使读者更加深入地理解文件系统的原理,本书不仅介绍了文件系统的原理和关键技术,还结合开源项目介绍了文件系统的实现细节。最后,本书介绍了在互联网领域广泛使用的对象存储

Spark快速大数据分析(第2版)
Spark快速大数据分析(第2版)

毋庸置疑,数据已经成为现代化企业的重要资产,大数据分析技术则是企业挖掘数据价值的核心利器。一直以来,Spark就是大数据分析领域的佼佼者,也已经成为一站式大数据分析引擎的事实标准。◎编辑推荐☆Databricks工程师诚意之作,比官方文档更实用的Spark入门教程☆前一版印刷32次,销量超6万册☆新版全面更新,覆盖Spark3.0新特性本书作者均来

大数据技术原理与应用(第2版)
大数据技术原理与应用(第2版)

林子雨,北大博士,厦门大学计算机科学系老师,中国高校首个"数字教师"的提出者和建设者。在数据库、数据仓库、数据挖掘、大数据、云计算和物联网等领域有着十多年的知识积累,对各个领域知识都有比较深入的了解,有比较宽泛的视野。

大数据时代
大数据时代

《大数据时代》是国外大数据研究的先河之作,本书作者维克托•迈尔•舍恩伯格被誉为“大数据商业应用第一人”,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教的经历,早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。维克托•迈尔•舍恩伯格在书中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三

给孩子讲大数据
给孩子讲大数据

主要内容:大数据究竟是什么?它和我们熟知的数字、数学有着怎样的联系?又该如何让孩子听懂大数据、养成新思维、练就高数商呢?《给孩子讲大数据》一书通过回溯数的发展、数据在中外历史重大事件的全方位应用,为孩子轻松打开大数据之门,指引孩子们收获“数商”与数据思维。适读人群:7岁以上小学生、中学生独立阅读;大数据、人工智能兴趣爱好者入门;书籍特色:1.大奖科学

掘金大数据
掘金大数据

在数据横向融合的时代,充分挖掘数据金矿及盘活数据资产,是企业发展和转型的关键所在。电信运营商以其数据特殊性,必将成为大数据领域的领航者、生力军。各行业的大数据从业者要如何从电信业的大数据中挖掘价值呢?本书彻底揭开电信运营商数据的神秘面纱,系统介绍了大数据的发展历程,主要的数据挖掘方法,电信运营商在网络运行及业务运营方面的数据资源特征,基于用户、业务、网络、终端及内在联系的电信运营商大数据分