内容简介 · · · · · ·
《持续演进的Cloud Native:云原生架构下微服务最佳实践》从架构、研发流程、团队文化三个角度详细介绍了如何构建Cloud Native。作者长期活跃在研发一线,具有丰富的架构设计经验,也曾亲身经历过很多失败的架构设计,如很多团队在实施微服务架构的时候,只强调拆分服务,根本没有理解微服务架构应该怎么做。《持续演进的Cloud Native:云原生架构下微服务最佳实践》就是想告诉读者,除了拆分服务,还要把哪些事做好,例如基础设施、一致性、性能、研发流程、团队文化等。
《持续演进的Cloud Native:云原生架构下微服务最佳实践》共分为10 章,第1 章从整体上描述了Cloud Native 的起源、组成及原则等;从第2 章到第7 章重点描述了微服务架构、敏捷基础设施及公共基础服务、可用性、可扩展性、性能、一致性等方面的设计实践;第8 章介绍了...
《持续演进的Cloud Native:云原生架构下微服务最佳实践》从架构、研发流程、团队文化三个角度详细介绍了如何构建Cloud Native。作者长期活跃在研发一线,具有丰富的架构设计经验,也曾亲身经历过很多失败的架构设计,如很多团队在实施微服务架构的时候,只强调拆分服务,根本没有理解微服务架构应该怎么做。《持续演进的Cloud Native:云原生架构下微服务最佳实践》就是想告诉读者,除了拆分服务,还要把哪些事做好,例如基础设施、一致性、性能、研发流程、团队文化等。
《持续演进的Cloud Native:云原生架构下微服务最佳实践》共分为10 章,第1 章从整体上描述了Cloud Native 的起源、组成及原则等;从第2 章到第7 章重点描述了微服务架构、敏捷基础设施及公共基础服务、可用性、可扩展性、性能、一致性等方面的设计实践;第8 章介绍了Serverless 和Service Mesh;第9 章介绍了如何构建研发流程;第10 章介绍了如何建设团队文化。
《持续演进的Cloud Native:云原生架构下微服务最佳实践》希望给技术管理者、架构师和有一定基础的技术人员提供帮助,特别是希望改变研发模式,从交付型软件过渡到云服务的传统软件企业开发者,此书将帮助你少走弯路。
作者简介 · · · · · ·
王启军,目前就职于华为公司架构部,负责华为公司的Cloud Native、微服务架构推进落地,前后参与了华为手机祥云4.0、物联网IoT 2.0的架构设计。曾任当当架构师,主导电商平台架构设计,包括订单、支付、价格、库存、物流等。曾就职于搜狐,负责手机微博的研发。十余年的技术历练,也曾作为技术负责人带领过近百人的团队。公众号“奔跑中的蜗牛”的作者。
目录 · · · · · ·
1.1 Cloud Native的起源 1
1.2 Cloud Native的组成 4
1.3 Cloud Native背后的诉求 5
1.4 如何衡量Cloud Native的能力 5
1.5 Cloud Native的原则 6
· · · · · · (更多)
1.1 Cloud Native的起源 1
1.2 Cloud Native的组成 4
1.3 Cloud Native背后的诉求 5
1.4 如何衡量Cloud Native的能力 5
1.5 Cloud Native的原则 6
第2章 微服务架构 11
2.1 微服务架构的起源 11
2.2 为什么采用微服务架构 12
2.2.1 单体架构与微服务架构 12
2.2.2 什么时候开始微服务架构 14
2.2.3 如何决定微服务架构的拆分粒度 14
2.3 微服务设计原则 15
2.4 微服务架构实施的先决条件 17
2.4.1 研发环境和流程上的转变 17
2.4.2 拆分前先做好解耦 18
2.5 微服务划分模式 20
2.5.1 基于业务复杂度选择服务划分方法 20
2.5.2 基于数据驱动划分服务 21
2.5.3 基于领域驱动划分服务 22
2.5.4 从已有单体架构中逐步划分服务 23
2.5.5 微服务拆分策略 24
2.5.6 如何衡量服务划分的合理性 25
2.6 微服务划分反模式 26
2.7 微服务API设计 28
2.7.1 优秀API的设计原则 28
2.7.2 服务间通信——RPC 28
2.7.3 序列化——Protobuf 30
2.7.4 服务间通信——RESTful 33
2.7.5 通过Swagger实现RESTful 36
2.7.6 通过Spring Boot、Springfox、Swagger实现RESTful 41
2.7.7 HTTP协议的进化——HTTP/2 46
2.7.8 HTTP/2和Protobuf的组合——gRPC 48
2.8 微服务框架 53
2.9 基于Dubbo框架实现微服务 54
2.10 基于Spring Cloud框架实现微服务 58
2.11 服务发现场景下的ZooKeeper与Etcd 67
2.12 微服务部署策略 68
2.12.1 服务独享数据库 69
2.12.2 服务独享虚拟机/容器 70
2.13 为什么总觉得微服务架构很别扭 70
第3章 敏捷基础设施及公共基础服务 73
3.1 传统基础设施面临的挑战 73
3.2 什么是敏捷基础设施 74
3.3 基于容器的敏捷基础设施 75
3.3.1 容器VS虚拟机 76
3.3.2 安装Docker 77
3.3.3 部署私有Docker Registry 79
3.3.4 基于Spring Boot、Maven、Docker构建微服务 79
3.3.5 基于docker-compose管理容器 84
3.4 基于公共基础服务的平台化 85
3.5 监控告警服务 86
3.5.1 监控数据采集 87
3.5.2 监控数据接收模式 87
3.5.3 通过时间序列数据库存储监控数据 88
3.5.4 开源监控系统实现Prometheus 88
3.5.5 通过Prometheus和Grafana监控服务 90
3.6 分布式消息中间件服务 96
3.6.1 分布式消息中间件的作用 97
3.6.2 业界常用的分布式消息中间件 98
3.6.3 Kafka的设计原理 99
3.6.4 为什么Kafka性能高 100
3.6.5 Kafka的数据存储结构 102
3.6.6 如何保证Kafka不丢消息 104
3.6.7 Kafka跨数据中心场景集群部署模式 106
3.7 分布式缓存服务 108
3.7.1 分布式缓存的应用场景 109
3.7.2 业界常用的分布式缓存Memcached 110
3.7.3 业界常用的分布式缓存——Redis 111
3.7.4 Redis常用的分布式缓存集群模式 112
3.7.5 基于Codis实现Redis分布式缓存集群 116
3.8 分布式任务调度服务 118
3.8.1 通过Tbschedule实现分布式任务调度 119
3.8.2 通过Elastic-Job实现分布式任务调度 123
3.9 如何生成分布式ID 126
3.9.1 UUID 126
3.9.2 SnowFlake 127
3.9.3 Ticket Server 128
3.9.4 小结 129
第4章 可用性设计 130
4.1 综述 130
4.1.1 可用性和可靠性的关系 130
4.1.2 可用性的衡量标准 131
4.1.3 什么降低了可用性 131
4.2 逐步切换 132
4.2.1 影子测试 132
4.2.2 蓝绿部署 133
4.2.3 灰度发布/金丝雀发布 134
4.3 容错设计 135
4.3.1 消除单点 136
4.3.2 特性开关 136
4.3.3 服务分级 137
4.3.4 降级设计 138
4.3.5 超时重试 139
4.3.6 隔离策略 152
4.3.7 熔断器 153
4.4 流控设计 157
4.4.1 限流算法 157
4.4.2 流控策略 159
4.4.3 基于Guava限流 160
4.4.4 基于Nginx限流 162
4.5 容量预估 163
4.6 故障演练 164
4.7 数据迁移 165
4.7.1 逻辑分离,物理不分离 166
4.7.2 物理分离 166
第5章 可扩展性设计 168
5.1 加机器能解决问题吗 168
5.2 横向扩展 169
5.3 AKF扩展立方体 170
5.4 如何扩展长连接 172
5.5 如何扩展数据库 175
5.5.1 X轴扩展——主从复制集群 175
5.5.2 Y轴扩展——分库、垂直分表 176
5.5.3 Z轴扩展——分片(sharding) 177
5.5.4 为什么要带拆分键 182
5.5.5 分片后的关联查询问题 183
5.5.6 分片扩容(re-sharding) 184
5.5.7 精选案例 187
5.6 如何扩展数据中心 190
5.6.1 两地三中心和同城多活 190
5.6.2 同城多活 191
5.6.3 异地多活 192
第6章 性能设计 194
6.1 性能指标 195
6.2 如何树立目标 195
6.3 如何寻找平衡点 196
6.4 如何定位瓶颈点 197
6.5 服务通信优化 198
6.5.1 同步转异步 198
6.5.2 阻塞转非阻塞 199
6.5.3 序列化 200
6.6 通过消息中间件提升写性能 201
6.7 通过缓存提升读性能 202
6.7.1 基于ConcurrentHashMap实现本地缓存 203
6.7.2 基于Guava Cache实现本地缓存 204
6.7.3 缓存的常用模式 205
6.7.4 应用缓存的常见问题 207
6.8 数据库优化 208
6.8.1 通过执行计划分析瓶颈点 208
6.8.2 为搜索字段创建索引 209
6.8.3 通过慢查询日志分析瓶颈点 210
6.8.4 通过提升硬件能力优化数据库 211
6.9 简化设计 212
6.9.1 转移复杂度 212
6.9.2 从业务角度优化 212
第7章 一致性设计 214
7.1 问题起源 214
7.2 基础理论 215
7.2.1 什么是分布式事务 216
7.2.2 CAP定理 218
7.2.3 BASE理论 219
7.2.4 Quorum机制(NWR模型) 219
7.2.5 租约机制(Lease) 220
7.2.6 状态机(Replicated State Machine) 221
7.3 分布式系统的一致性分类 222
7.3.1 以数据为中心的一致性模型 223
7.3.2 以用户为中心的一致性模型 226
7.3.3 业界常用的一致性模型 229
7.4 如何实现强一致性 230
7.4.1 两阶段提交 230
7.4.2 三阶段提交(3PC) 231
7.5 如何实现最终一致性 232
7.5.1 重试机制 232
7.5.2 本地记录日志 233
7.5.3 可靠事件模式 233
7.5.4 Saga事务模型 235
7.5.5 TCC事务模型 237
7.6 分布式锁 238
7.6.1 基于数据库实现悲观锁和乐观锁 239
7.6.2 基于ZooKeeper的分布式锁 241
7.6.3 基于Redis实现分布式锁 242
7.7 如何保证幂等性 244
7.7.1 幂等令牌(Idempotency Key) 244
7.7.2 在数据库中实现幂等性 246
第8章 未来值得关注的方向 247
8.1 Serverless 247
8.1.1 什么是Serverless 247
8.1.2 Serverless的现状 248
8.1.3 Serverless的应用场景 249
8.2 Service Mesh 250
8.2.1 什么是Service Mesh 250
8.2.2 为什么需要Service Mesh 252
8.2.3 Service Mesh的现状 253
8.2.4 Istio架构分析 255
第9章 研发流程 258
9.1 十二因子 258
9.2 为什么选择DevOps 261
9.3 自动化测试 263
9.3.1 单元测试 263
9.3.2 TDD 264
9.3.3 提交即意味着可测试 265
9.4 Code Review 265
9.4.1 Code Review的意义 265
9.4.2 Code Review的原则 266
9.4.3 Code Review的过程 267
9.5 流水线 267
9.5.1 持续交付 267
9.5.2 持续部署流水线 268
9.5.3 基于开源打造流水线 268
9.5.4 Amazon的流水线 271
9.5.5 开发人员自服务 271
9.6 为什么需要AIOps 272
9.7 基于数据和反馈持续改进 273
9.8 拥抱变化 274
9.9 代码即设计 274
第10章 团队文化 276
10.1 为什么团队文化如此重要 276
10.2 组织结构 278
10.2.1 团队规模导致的问题 278
10.2.2 康威定律 278
10.2.3 扁平化的组织 279
10.2.4 独裁的管理方式还是民主的管理方式 280
10.2.5 民主的团队如何做决策 282
10.3 环境氛围 282
10.3.1 公开透明的工作环境 282
10.3.2 学习型组织 283
10.3.3 减少正式的汇报 284
10.3.4 高效的会议 284
10.3.5 量化指标致死 286
10.4 管理风格 287
10.4.1 下属请假你会拒绝吗 287
10.4.2 为什么你招不到你想要的人 288
10.4.3 得到了所有人的认可,说明你并不是一个好的管理者 291
10.4.4 尽量避免用自己的权力去做决策 291
10.4.5 一屋不扫也可助你“荡平天下” 292
10.4.6 如何留下你想要的人293
10.5 经典案例 294
10.5.1 Instagram的团队文化 294
10.5.2 Netflix的团队文化 294
· · · · · · (收起)
原文摘录 · · · · · ·
-
在传统企业,技术经理接到一个单点登录的功能需求,架构师A大概花了一个星期调研,又花了一个星期编写PPT,在某个内部会议上进行架构决策,会议中各方面领导提出了各种质疑,认为某开源方案缺陷太多,漏洞百出。会后A进行返エ,最终一个月时间オ确定了架构文档,而实际负责开发的可能是工程师B、C、D。A分别对B、C、D进行了大量的解释,B、C、D又给测试人员、运维人员进行了大量的解释。最终这个功能大概花了一个架构师和三个工程师各2个月时间,一个测试人员1个月时间,以及一个运维人员半个月时间。如果架构师的薪资为每月5万元,开发人员每月为2万元,测试人员每月1万元,运维人员每月2万元,那么这个功能预计要花费24万元才能实现 在互联网公司,根据前面的任务拆分,某工程师A领到了单点登录的功能需求,花了一个星期进行调研,认为某开源产品可以满足80%的需求,经过团队内非正式的讨论,最终决定基于开源产品进行改造。A花了一个星期研究源代码,一个星期进行测试,再经过轮内部讨论,然后花一个月时间改造代码,一个月时间测试及上线。整个过程不到三个月时间都是以A为主导,如果这个工程师的能力比较强,薪资大概是5万元,和传统企业的架构师持平,那么这个功能预计要花费15万元。 当然,这只是一个粗略的计算,有人可能会质疑,互联网公司打造研发环境、工具所消耗的费用,同样互联网公司也没有计算技术经理项目经理的管理费用。一个实际的例子,Instagram Video(15秒短视频)从需求到上线花了30个人ー个月的时间,包括iOS和 Andro客户端、服务端,甚至包括市场及推广,在这期间为了解决防抖的问题,甚至花了7天时间收购了一家公司集成进来0 李开复曾经说过:“我们进入了信息社会,这个社会眼工业社会不一样的就是,顶尖オ和普通人オ的差异化不再是20%6、30%了,而是五倍、十倍甚至一百倍的差距。 (查看原文) —— 引自章节:10.1 为什么团队文化如此重要 276 -
并不是只有看书才叫学习,学习充斥在各个角落,例如, Code Review就是一个相互学习的过程。通过如下方式可以建立一个学习型组织。 让团队拥有共同的愿景、目标。NBA最经典的一句话是“永远不要低估一颗总冠军 的心。”当一个团队有了共同的愿景之后,成员就会忘记自己的角色,只要是对 团队有利的就去执行。让团队持续学习。学习不是一次性的,是一个持续的过程。当害怕自己说的话可能 是错误的时候,就应该去学习了团队成员平等、自由。只有拥有平等的氛围,才能换位思考,不以过去成功的经验 轻易否定一些创新性的想法 (查看原文) —— 引自章节:10.1 为什么团队文化如此重要 276
喜欢读"持续演进的Cloud Native:云原生架构下微服务最佳实践"的人也喜欢的电子书 · · · · · ·
喜欢读"持续演进的Cloud Native:云原生架构下微服务最佳实践"的人也喜欢 · · · · · ·
-
- 聚合架构 7.7
-
- 架构师应该知道的37件事 7.8
-
- 分布式服务架构:原理、设计与实战 6.8
-
- 软件架构设计 8.7
-
- 携程架构实践 7.3
-
- 银行信息系统架构 8.0
-
- 微服务设计 8.1
-
- 数字化转型的道与术 6.9
持续演进的Cloud Native:云原生架构下微服务最佳实践的书评 · · · · · · ( 全部 1 条 )
> 更多书评 1篇
论坛 · · · · · ·
在这本书的论坛里发言以下书单推荐 · · · · · · ( 全部 )
谁读这本书? · · · · · ·
二手市场
· · · · · ·
- 在豆瓣转让 有163人想读,手里有一本闲着?
订阅关于持续演进的Cloud Native:云原生架构下微服务最佳实践的评论:
feed: rss 2.0


0 有用 叶左 2021-09-10 14:02:18
全部吃透,年薪百万不是梦
0 有用 君三思 2020-11-23 18:10:06
2020年11月看的。从趋势到技术,再到文化,每章读起来都有感情,作者的境界很深。
0 有用 Breakthen 2019-03-11 23:21:53
很全面的经验之谈,只是限于篇幅,有些章节其实可以再深入一些
0 有用 南阜鸟 2019-10-01 22:53:30
讽刺的是,最后一章所说的种种缺点都是华为有的,而作者在华为
1 有用 啊哈 2019-06-10 15:59:33
2019-03-13 初读; 2019-06-10重读;怎么说呢,大纲还是挺有意思的,要实现云原生需要什么,答曰:第一是基础,即敏捷的基础设置(数据库、缓存、队列、ID 生成 和 CT 调度等),其次是设计方面,体现在:可用性(降级、发布:蓝绿、金丝雀、影子)、可扩展性(扩容、partition)、性能(异步化提升吞吐,书中提到,kafka 的吞吐量是 db 的三四十倍,缓存提升读性能(redis... 2019-03-13 初读; 2019-06-10重读;怎么说呢,大纲还是挺有意思的,要实现云原生需要什么,答曰:第一是基础,即敏捷的基础设置(数据库、缓存、队列、ID 生成 和 CT 调度等),其次是设计方面,体现在:可用性(降级、发布:蓝绿、金丝雀、影子)、可扩展性(扩容、partition)、性能(异步化提升吞吐,书中提到,kafka 的吞吐量是 db 的三四十倍,缓存提升读性能(redis 10w tps),CQRS 等)、一致性(各种模式)等等.. 整体来说,还是太过浅显 ... 当成一个 introduction 中的 introduction 吧 ... (展开)