GitHub - YorkHwang/HA-guide: 高可用架构设计启示

高可用架构设计启示

一、高可用定义

高可用定义高可用：High Availability，简称HA，通过设计减少系统不能提供服务的时间。假设系统一直能够提供服务，我们说系统的可用性是100%。
可用性公式
可用性 = 系统正常可用的时长/系统运行总时长 * 100%
或：
可用性 = （系统运行总时长-系统不可用时长）/ 系统运行时长 * 100%
可用性目标
高可用理想值是：100%
2个9：99%
3个9：99.9%
4个9：99.99%

二、高可用因子

硬件：CPU、内存、硬盘、网卡等硬件状态，机房环境（供电、室温等）
网络：网络丢包抖动，网络故障
流量：流量暴增，例如：热点微博
容量：容量爆满，例如内存、cpu、磁盘逐渐爆满，redis集群内存用完等
依赖：依赖的服务不可用，例如：微服务架构，强依赖基础服务出现故障
程序：程序代码BUG，导致突发故障

三、高可用策略

策略一：扩展实现冗余
按照实际情况评估资源，使用2倍以上的资源，即使垮掉一半也能完全支撑业务。
1. 部署机房：双中心或多中心机房部署，热备、冷备方式部署
2. 应用架构：支持横向分布式扩展，支持集群部署，支持跨机房部署
3. 数据库层：一主多从、读写分离、双集群部署
策略二：故障自动转移
1. 客户端：提供多组IP或域名，失败时重试和自动切机制
2. 代理层：重试或探测自动切
  例如：nginx自动切、backup使用主备，多个Nginx通过keepalived存活探测
3. 服务层：自动剔除下线，
  例如：调用服务发现(Eureka、Dubbo)检查自动剔除
  又如：Eureka 分区（Zone）实现跨机房容灾调用
4. 缓存层：实现主从切换
  例如：redis-sentinal哨兵机制监控主节点是否正常
5. 数据层：主从切换，双集群同步
  例如：mysql主从切换MHA方案，Consul监控并做主从切换
  又如：双集群数据通过otter实现同步，故障时流量自动切正常的一方
6. MQ层：主从切换
  例如：Kafka的每个分区Partition可以有多个副本Replication,且多个Replication分部在不同的Broker，其中有一个Leader和多个Follower，当Leader挂掉，会从同步状态的分区副本isr(in-sync-replica)中重新选择一个Replication作为Leader。
策略三：限流降级隔离熔断
1. 限流计数器、令牌桶、漏桶
  业务层：一般用Google Guava的RateLimiter（令牌桶），分布式情况下需要用redis或zookeeper等作分布式锁
  代理层：Tengine/Nginx限流，Sentinel、Spring Cloud Gateway、Zuul 网关限流
2. 隔离熔断
  Hystrix通过线程池隔离、信号量方式隔离，根据配置参数执行熔断
3. 降级降级方式：自动执行和手动配置
  自动降级：设置超时时长降级，熔断方式降级，例如调用头像服务100毫秒超时。
  通过配置中心下发命令降级
  例如：
  a. 直播聊天弹幕太多，降级为收到自己发的信息（自嗨）和部分聊天消息；
  b. 用户头像服务挂了，调用通过配置不下发头像，但聊天功能可用
策略四：资源弹性伸缩
docker+k8s容器方式，实现自动扩容，当出现大流量或者故障情况时，可以自动按规则进行扩容。
策略五：定期故障演练
制定演练计划，对基础模块和核心业务模块进行故障演练，模拟部分机器、单个机房出现网络故障，检查系统的高可用性，不断优化系统。
策略六：完善监控告警
使用完整的APM系统进行监控，做到自动告警。
1. 硬件层监控：监控运行中服务器硬件状态
2. 网络层监控：监控网络状态和丢包情况
3. 客户端监控：客户端增加埋点，自动上报使用异常情况，根据客户IP、账号等信息定位故障点
4. 代理层监控：网关、nginx
5. 基础中间件：服务注册中心、配置中心、消息队列、分布式缓存、分布式数据库、日志中心（ELK)
6. 服务层监控：服务间调用链（Zipkin、SkyWalking、PingPoint）、服务内存和CPU占用情况、GC情况、系统负载均衡情况，接口QPS和延迟，系统错误日志
策略七：保证代码质量
1. 遵守规范
2. 质量扫描
3. 充分测试
4. 代码审核
策略八：遵守上线规范
对线上服务和数据保持敬畏之心，严格遵守操作流程
1. 准备充分：制定上线计划，准备好checklist，提前通知有关人员
2. 灰度发布：指定灰度计划，更新局部验收确认后全量。
3. 回滚止损：发现问题及时回滚，降低对业务的损失。
4. 验收充分：验收过程要仔细严谨，不能漏掉细节。

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

高可用架构设计启示

一、高可用定义

二、高可用因子

三、高可用策略

About

Uh oh!

Releases

Packages

YorkHwang/HA-guide

Folders and files

Latest commit

History

Repository files navigation

高可用架构设计启示

一、高可用定义

二、高可用因子

三、高可用策略

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Packages