分  享 
分  享 
源  码 
源  码 
课  程 
课  程 
设  计 
设  计 

[数据库] 【PDF教材】《大数据日知录:架构与算法》张俊林-带书签目录完整版pdf[87MB]

[复制链接]
密探007微信认证 发表于 2017-12-5 11:31:40 | 显示全部楼层 |阅读模式
「智能推荐」
【PDF教材】《大数据日知录:架构与算法》张俊林-带书签目录完整版pdf[87MB] 【PDF教材】《Hadoop大数据分析与挖掘实战》完整pdf扫描版[52MB]
【PDF教材】《实战大数据》鲍亮、李倩-PDF完整版 【PDF教材】《Python金融大数据分析》完整版-中文pdf扫描版[42MB]
【PDF教材】《驾驭大数据》Bill Franks-中文pdf扫描版[41MB] 【PDF教材】《Spark快速大数据分析 [(美)卡劳]》中文pdf版
【PDF教材】《MongoDB大数据处理权威指南(第2版)》 【PDF教材】《大数据技术与应用实践指南》
【PDF教材】《Spark大数据处理 技术、应用与性能优化》 【PDF教材】《迷你书 深入理解大数据:大数据处理与编程实践》中文PDF扫描版[17MB]
【PDF教材】《架构之美-软件架构的艺术》带目录高清扫描PDF版 【PDF教材】《零基础学算法》戴艳 等-PDF高清扫描版(含源代码)
【PDF教材】《大数据挖掘:系统方法与实例分析》带目录书签pdf版[57MB] 【PDF教材】《ODPS权威指南:阿里大数据平台应用开发实践》带目录书签-完整pdf
【PDF教材】《视觉大数据基础与应用》谢剑斌-中文pdf完整版 【PDF教材】《大数据技术原理与应用:概念、存储、处理、分析与应用》高清PDF完整版
【PDF教材】《大数据时代的算法:机器学习、人工智能及其典型实例》刘凡平-PDF高清版 【PDF教材】《大数据治理与服务》张绍华-带目录完整PDF版 [57MB]
【PDF教材】《大数据架构和算法实现之路:电商系统的技术实战》完整PDF扫描版 【PDF教材】《大数据架构商业之路:从业务需求到技术方案》带目录PDF完整版 [74MB]
【PDF教材】《为数据而生:大数据创新实践》完整PDF扫描版 [56MB] 【PDF教材】《大数据之路:阿里巴巴大数据实践》完整PDF扫描版 [97MB]
【PDF教材】《架构真经:互联网技术架构的设计原则》(原书第2版)中文PDF完整版 【PDF教材】《大数据技术原理与应用:概念、存储、处理、分析与应用》(第2版)PDF版
【PDF教材】《图解算法》带书签中文PDF高清版 [139MB]

欢迎加入「奥学网」学霸平台,让自学改变你的世界!

您需要 登录 才可以下载或查看,没有帐号?账号注册

x
【PDF教材】《大数据日知录:架构与算法》张俊林-带书签目录完整版pdf[87MB] - 奥学网

  大数据是当前最为流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为最明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。

  《大数据日知录:架构与算法》从架构与算法角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层出不穷的新架构、新系统等。《大数据日知录:架构与算法》对众多纷繁芜杂的相关技术文献和系统进行了择优汰劣并系统性地对相关知识分门别类地进行整理和介绍,将大数据相关技术分为大数据基础理论、大数据系统体系结构、大数据存储,以及包含批处理、流式计算、交互式数据分析、图数据库、并行机器学习的架构与算法以及增量计算等技术分支在内的大数据处理等几个大的方向。通过这种体系化的知识梳理与讲解,相信对于读者整体和系统地了解、吸收和掌握相关的优秀技术有极大的帮助与促进作用。

  目录

  第0章当谈论大数据时我们在谈什么1

  0.1大数据是什么2

  0.2大数据之翼:技术范型转换4

  0.3大数据商业炼金术6

  0.4“大数据”在路上7

  第1章数据分片与路由9

  1.1抽象模型10

  1.2哈希分片(Hash Partition)11

  1.2.1 Round Robin11

  1.2.2虚拟桶(Virtual Buckets)12

  1.2.3一致性哈希(Consistent Hashing)13

  1.3范围分片(Range Partition)18

  参考文献19

  第2章数据复制与一致性20

  2.1基本原则与设计理念21

  2.1.1原教旨CAP主义21

  2.1.2 CAP重装上阵(CAP Reloaded)23

  2.1.3 ACID原则24

  2.1.4 BASE原则24

  2.1.5 CAP/ACID/BASE三者的关系25

  2.1.6幂等性(Idempotent)26

  2.2一致性模型分类26

  2.2.1强一致性27

  2.2.2最终一致性28

  2.2.3因果一致性28

  2.2.4“读你所写”一致性29

  2.2.5会话一致性29

  2.2.6单调读一致性30

  2.2.7单调写一致性30

  2.3副本更新策略30

  2.3.1同时更新30

  2.3.2主从式更新31

  2.3.3任意节点更新32

  2.4一致性协议32

  2.4.1两阶段提交协议(Two—Phrase Commit,2PC)33

  2.4.2向量时钟(Vector Clock)38

  2.4.3 RWN协议40

  2.4.4 Paxos协议42

  2.4.5 Raft协议45

  参考文献49

  第3章大数据常用的算法与数据结构51

  3.1布隆过滤器(Bloom Filter)51

  3.1.1基本原理52

  3.1.2误判率及相关计算52

  3.1.3改进:计数Bloom Filter53

  3.1.4应用54

  3.2 SkipList55

  3.3 LSM树58

  3.4 Merkle哈希树(Merkle Hash Tree)62

  3.4.1 Merkle树基本原理62

  3.4.2 Dynamo中的应用63

  3.4.3比特币中的应用63

  3.5 Snappy与LZSS算法65

  3.5.1 LZSS算法65

  3.5.2 Snappy67

  3.6 Cuckoo哈希(Cuckoo Hashing)67

  3.6.1基本原理68

  3.6.2应用:SILT存储系统68

  参考文献70

  第4章集群资源管理与调度71

  4.1资源管理抽象模型72

  4.1.1概念模型72

  4.1.2通用架构73

  4.2调度系统设计的基本问题74

  4.2.1资源异质性与工作负载异质性74

  4.2.2数据局部性(Data Locality)75

  4.2.3抢占式调度与非抢占式调度75

  4.2.4资源分配粒度(Allocation Granularity)76

  4.2.5饿死(Starvation)与死锁(Dead Lock)问题76

  4.2.6资源隔离方法77

  4.3资源管理与调度系统范型77

  4.3.1集中式调度器(Monolithic Scheduler)78

  4.3.2两级调度器(Two—Level Scheduler)79

  4.3.3状态共享调度器(Shared—State Scheduler)79

  4.4资源调度策略81

  4.4.1 FIFO调度策略81

  4.4.2公平调度器(Fair Scheduler)81

  4.4.3能力调度器(Capacity Scheduler)82

  4.4.4延迟调度策略(Delay Scheduling)82

  4.4.5主资源公平调度策略(Dominant Resource Fair Scheduling)82

  4.5 Mesos 84

  4.6 YARN87

  参考文献90

  第5章分布式协调系统91

  5.1 Chubby锁服务92

  5.1.1系统架构93

  5.1.2数据模型94

  5.1.3会话与KeepAlive机制95

  5.1.4客户端缓存95

  5.2 ZooKeeper 96

  5.2.1体系结构96

  5.2.2数据模型(Data Model)97

  5.2.3 API 98

  5.2.4 ZooKeeper的典型应用场景98

  5.2.5 ZooKeeper的实际应用103

  参考文献104

  第6章分布式通信106

  6.1序列化与远程过程调用框架107

  6.1.1 Protocol Buffer与Thrift 108

  6.1.2 Avro109

  6.2消息队列110

  6.2.1常见的消息队列系统110

  6.2.2 Kafka 111

  6.3应用层多播通信(Application—Level Multi—Broadcast)114

  6.3.1概述114

  6.3.2 Gossip协议115

  参考文献118

  第7章数据通道120

  7.1 Log数据收集120

  7.1.1 Chukwa121

  7.1.2 Scribe122

  7.2数据总线123

  7.2.1 Databus125

  7.2.2 Wormhole 127

  7.3数据导入/导出128

  参考文献129

  第8章分布式文件系统131

  8.1 Google文件系统(GFS)132

  8.1.1 GFS设计原则132

  8.1.2 GFS整体架构133

  8.1.3 GFS主控服务器134

  8.1.4系统交互行为136

  8.1.5 Colossus 137

  8.2 HDFS 138

  8.2.1 HDFS整体架构139

  8.2.2 HA方案140

  8.2.3 NameNode联盟143

  8.3 HayStack存储系统145

  8.3.1 HayStack整体架构146

  8.3.2目录服务147

  8.3.3 HayStack缓存148

  8.3.4 HayStack存储系统的实现148

  8.4文件存储布局150

  8.4.1行式存储151

  8.4.2列式存储151

  8.4.3混合式存储156

  8.5纠删码(Erasure Code)158

  8.5.1 Reed—Solomon编码159

  8.5.2 LRC编码164

  8.5.3 HDFS—RAID架构166

  参考文献166

  ……

  第9章内存KV数据库168

  第10章列式数据库176

  第11章大规模批处理系统199

  第12章流式计算219

  第13章交互式数据分析240

  第14章图数据库:架构与算法271

  第15章机器学习:范型与架构313

  第16章机器学习:分布式算法337

  第17章增量计算366

  附录A硬件体系结构及常用性能指标378

  附录B大数据必读文献380



 百度网盘 / Download(回复可见):
  The following hidden content members only. Join us 
游客,如果您要查看本帖隐藏内容请回复

 

 

楼 主 推 荐
cckoan 发表于 2017-12-5 13:20:26 | 显示全部楼层
谢谢楼主分享~~~
回复 支持 反对

使用道具 举报

wsASd 发表于 2017-12-9 18:42:54 | 显示全部楼层
晕死也不多加点分
回复 支持 反对

使用道具 举报

bZm 发表于 2017-12-10 08:17:48 | 显示全部楼层
恐惊天上人,何似在人间~~急急急~~~~~~~
回复 支持 反对

使用道具 举报

3m5nc0 发表于 2017-12-14 04:15:48 | 显示全部楼层
支持一下吧
回复 支持 反对

使用道具 举报

wswlive1985 发表于 2017-12-17 02:34:47 | 显示全部楼层
只有一条路不能选择——那就是放弃的路;只有一条路不能拒绝——那就是成长的路。
回复 支持 反对

使用道具 举报

逗比呢 发表于 2017-12-22 14:28:47 | 显示全部楼层
等了1分钟总算可以发言了……
回复 支持 反对

使用道具 举报

iqGsz4 发表于 2017-12-23 08:10:33 | 显示全部楼层
出太阳了,收衣服咯。。。。
回复 支持 反对

使用道具 举报

DRlh1 发表于 2017-12-24 15:33:30 | 显示全部楼层
这个贴不错看了之后就要回复帖子,呵呵
回复 支持 反对

使用道具 举报

ifVZpg 发表于 2017-12-24 18:00:48 | 显示全部楼层
在线等在线等
回复 支持 反对

使用道具 举报

快速回复 收藏帖子 返回列表
加密...

SiteMap|奥学网 ( 闽ICP备12011685号-6 )|随机浏览

闽公网安备35021202000025号

Xtreme-aesthetic Design

© 2012~Now 6SO.SO

快速回复 返回顶部 返回列表