欢迎来到菜鸟SpringCloud实战入门系列(SpringCloudForNoob),该系列通过层层递进的实战视角,来一步步学习和理解SpringCloud。
本系列适合有一定Java以及SpringBoot基础的同学阅读。
每篇文章末尾都附有本文对应的Github源代码,方便同学调试。
实战版本
- SpringBoot:2.0.3.RELEASE
- SpringCloud:Finchley.RELEASE
熔断器Hystrix的使用
熔断器的概念
关于熔断器的解释,这里引用一大段:
熔断器适用于实现快速失败,如果它在一段时间内侦测到许多类似的错误,会强迫其以后的多个调用快速失败,不再访问远程服务器,从而防止应用程序不断地尝试执行可能会失败的操作,使得应用程序继续执行而不用等待修正错误,或者浪费CPU时间去等到长时间的超时产生。熔断器也可以使应用程序能够诊断错误是否已经修正,如果已经修正,应用程序会再次尝试调用操作。
熔断器模式就像是那些容易导致错误的操作的一种代理。这种代理能够记录最近调用发生错误的次数,然后决定使用允许操作继续,或者立即返回错误。 熔断器开关相互转换的逻辑如下图:
熔断器就是保护服务高可用的最后一道防线。
Hystrix特性
1.断路器机制
断路器很好理解, 当Hystrix Command请求后端服务失败数量超过一定比例(默认50%), 断路器会切换到开路状态(Open). 这时所有请求会直接失败而不会发送到后端服务. 断路器保持在开路状态一段时间后(默认5秒), 自动切换到半开路状态(HALF-OPEN). 这时会判断下一次请求的返回情况, 如果请求成功, 断路器切回闭路状态(CLOSED), 否则重新切换到开路状态(OPEN). Hystrix的断路器就像我们家庭电路中的保险丝, 一旦后端服务不可用, 断路器会直接切断请求链, 避免发送大量无效请求影响系统吞吐量, 并且断路器有自我检测并恢复的能力.
2.Fallback
Fallback相当于是降级操作. 对于查询操作, 我们可以实现一个fallback方法, 当请求后端服务出现异常的时候, 可以使用fallback方法返回的值. fallback方法的返回值一般是设置的默认值或者来自缓存.
3.资源隔离
在Hystrix中, 主要通过线程池来实现资源隔离. 通常在使用的时候我们会根据调用的远程服务划分出多个线程池. 例如调用产品服务的Command放入A线程池, 调用账户服务的Command放入B线程池. 这样做的主要优点是运行环境被隔离开了. 这样就算调用服务的代码存在bug或者由于其他原因导致自己所在线程池被耗尽时, 不会对系统的其他服务造成影响. 但是带来的代价就是维护多个线程池会对系统带来额外的性能开销. 如果是对性能有严格要求而且确信自己调用服务的客户端代码不会出问题的话, 可以使用Hystrix的信号模式(Semaphores)来隔离资源.
使用Feign Hystrix
依然使用上一章建立的子模块:Service-Feign
pom文件不需要变化,因为spring-cloud-starter-openfeign已经自带了Hystrix。
修改配置文件application.yml,增加如下:
feign:
hystrix:
enabled: true
在我这里,由于Springboot使用了2.0.3,引入的是openfeign,所以出现了:
起初以为这条指令无法生效,折腾了之后才发现是生效的。
推测是openfeign的问题,不是spring boot 1.X的spring-cloud-starter-feign,IDEA判断失误了。
接着新建类ServiceHiHystrix继承ServiceHi接口,里面实现了失败下的返回信息:
import org.springframework.stereotype.Component;
@Component
public class ServiceHiHystrix implements ServiceHi {
@Override
public String sayHiFromServiceHi(String name) {
return "hello" + name +", this message send failed";
}
}
更改ServiceHi接口,添加上fallback类为刚才新建的类:
@FeignClient(value = "service-hi", fallback = ServiceHiHystrix.class)
大功告成,启动server-feign,eureka-hi和eureka测试:
打开:http://localhost:8765/hello/rude3knife
接着,关掉服务提供者eureka-hi,来模拟服务宕机的情况,重新访问:http://localhost:8765/hello/rude3knife
返回了新建的错误信息。
可视化熔断器监控Hystrix Dashboard和Turbine
Hystrix Dashboard
Hystrix-dashboard是一款针对Hystrix进行实时监控的工具,通过Hystrix Dashboard我们可以在直观地看到各Hystrix Command的请求响应时间, 请求成功率等数据。
我们只需要在上一章中的server-feign模块继续修改,因为上一章已经在该模块加了熔断器。
首先添加依赖:
<dependency>
<groupId>org.springframework.cloud</groupId>
<!--spring boot 1.X:spring-cloud-starter-hystrix-->
<artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.cloud</groupId>
<!--spring boot 1.X:spring-cloud-starter-hystrix-dashboard-->
<artifactId>spring-cloud-starter-netflix-hystrix-dashboard</artifactId>
</dependency>
启动类修改:
@EnableHystrixDashboard
@EnableCircuitBreaker
启动工程访问:
http://localhost:8765/hystrix,将会看到如下界面:
图中会有一些提示:
- Cluster via Turbine (default cluster): http://turbine-hostname:port/turbine.stream
- Cluster via Turbine (custom cluster): http://turbine-hostname:port/turbine.stream?cluster=[clusterName]
- Single Hystrix App: http://hystrix-app:port/hystrix.stream
大概意思就是如果查看默认集群使用第一个url,查看指定集群使用第二个url,单个应用的监控使用最后一个,我们暂时只演示单个应用的所以在输入框中输入: http://localhost:8765/hystrix.stream ,输入之后点击 monitor,进入页面。
如果没有请求会先显示Loading ...,访问http://localhost:9001/hystrix.stream 也会不断的显示ping。
请求服务http://localhost:8765/hello/rude3knife,就可以看到监控的效果了,首先访问http://localhost:8765/hystrix.stream,显示如下:
出错了!
随机谷歌了下问题,网友给出了问题解决方案:
https://blog.csdn.net/ddxd0406/article/details/79643059
答主通过查看源码后给出的解决方案是:
评论区给出更为方便且优雅的方案:
在配置文件中加入management.endpoints.web.exposure.include=*,将端口暴露就不需要声明bean了,访问地址要变一下/actuator/hystrix.stream
于是我们在yml中加入:
# 熔断器DashBoard: actuator在boot2.0调整后开关web端点的配置,*代表开启所有
management:
endpoints:
web:
exposure:
include: "*"
重新运行模块,然后在网址一栏输入:
http://localhost:8765/actuator/hystrix.stream
页面会不停显示Loading,不用慌,不显示Unable to connect to Command Metric Stream.了。显示Loading是因为因为还没有请求过来。
之后我们尝试发一次请求,在地址栏对server-feign的8765端口发送请求:
http://localhost:8765/hello/1232312
再来看之前的页面,大功告成。
到此单个应用的熔断监控已经完成。
Turbine
但是只使用Hystrix Dashboard的话, 你只能看到单个应用内的服务信息, 这明显不够. 我们需要一个工具能让我们汇总系统内多个服务的数据并显示到Hystrix Dashboard上, 这个工具就是Turbine.
在复杂的分布式系统中,相同服务的节点经常需要部署上百甚至上千个,很多时候,运维人员希望能够把相同服务的节点状态以一个整体集群的形式展现出来,这样可以更好的把握整个系统的状态。
注意:
为了演示Turbine,在这里重新新建一个子模块,名为hystrix-dashboard-turbine,创建步骤请看之前的第一章。
创建新模块作为单独的监控节点模块,是因为演示dashboard的时候是耦合在了server-feign中,而Turbine需要同时监控多个服务消费者,把他耦合在一个消费者里显得不合时宜。
创建后,pom.xml中引入:
<dependency>
<groupId>org.springframework.cloud</groupId>
<!--spring boot 1.X:spring-cloud-starter-hystrix-dashboard-->
<artifactId>spring-cloud-starter-netflix-hystrix-dashboard</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-netflix-turbine</artifactId>
</dependency>
启动类中@EnableTurbine和@EnableHystrixDashboard:
import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
import org.springframework.cloud.netflix.hystrix.dashboard.EnableHystrixDashboard;
import org.springframework.cloud.netflix.turbine.EnableTurbine;
@SpringBootApplication
@EnableTurbine
@EnableHystrixDashboard
public class HystrixDashboardTurbineApplication {
public static void main(String[] args) {
SpringApplication.run(HystrixDashboardTurbineApplication.class, args);
}
}
yml中:
server:
# 服务端口号
port: 8767
spring:
application:
# 服务名,即serviceId
name: hystrix-dashboard-turbine
eureka:
client:
serviceUrl:
# 安全认证的服务注册中心地址
defaultZone: http://localhost:8761/eureka
# 熔断器turbine
turbine:
aggregator:
cluster-config: default
cluster-name-expression: new String("default")
app-config: SERVICE-FEIGN, SERVICE-FEIGN-2
代码重点:
- 新模块端口号为:8767
- turbine.appConfig :配置Eureka中的serviceId列表,表明监控哪些服务(这里指定为SERVICE-FEIGN, SERVICE-FEIGN-2,稍后说)
- turbine.aggregator.clusterConfig :指定聚合哪些集群,多个使用”,”分割,默认为default。可使用http://.../turbine.stream?cluster={clusterConfig之一}访问
- turbine.clusterNameExpression :
- clusterNameExpression指定集群名称,默认表达式appName;此时:turbine.aggregator.clusterConfig需要配置想要监控的应用名称;
- 当clusterNameExpression: default时,turbine.aggregator.clusterConfig可以不写,因为默认就是default;
- 当clusterNameExpression: metadata[‘cluster’]时,假设想要监控的应用配置了eureka.instance.metadata-map.cluster: ABC,则需要配置,同时turbine.aggregator.clusterConfig: ABC
完成这些步骤后,我们还需要调整下服务提供者,我们需要两个服务提供者同时运行。
将8765(SERVICE-FEIGN)的服务提供者改为8766,名称改为:SERVICE-FEIGN-2,运行起来,别忘了在运行设置中设置允许多个实例运行。修改后的SERVICE-FEIGN的yml是:
server:
# 服务端口号
port: 8766
spring:
application:
# 服务名,即serviceId
name: service-feign-2
eureka:
client:
serviceUrl:
# 安全认证的服务注册中心地址
defaultZone: http://localhost:8761/eureka
# 熔断器设置
feign:
hystrix:
enabled: true
# 熔断器DashBoard: actuator在boot2.0调整后开关web端点的配置,*代表开启所有
management:
endpoints:
web:
exposure:
include: "*"
运行后结构如图:
我们访问:
访问 http://localhost:8767/turbine.stream
可以看到ping的信息流,这时说明8767正在不断ping指定的两个服务
进行图形化监控查看,输入:http://localhost:8767/hystrix ,返回酷酷的小熊界面,输入: http://localhost:8767/turbine.stream ,然后点击 Monitor Stream ,可以看到出现了监控列表:
咦?为啥只有一个监控呢,说好的聚合监控列表呢。
这里有个坑,或者说是理解上的误区:
监控不同的服务熔断,首先得是不同的rpc调用,也就是消费者的熔断函数要是两个不同的,或者,消费者去调用的是两个不同的服务提供者!这样才会有多个监控表。不然,有何意义?
想明白这一步,你就应该知道怎么把多个表弄出来了。
你需要让消费者有一个:
- 新的消费目标(新的服务提供者)
- 或者是一个新的消费熔断器。
修改server-feign子模块
- ServiceHi接口的调用变为sayHiFromServiceHi2,value也指向另一个服务提供者service-hi-2 (新的消费目标(新的服务提供者))
@FeignClient(value = "service-hi-2", fallback = ServiceHiHystrix.class)
public interface ServiceHi {
/**
* <p>通过Feign伪Http客户端调用service-hi提供的服务</p>
* @author hanchao 2018/5/19 17:59
**/
@GetMapping("/hi/{name}")
String sayHiFromServiceHi2(@PathVariable(value = "name") String name);
}
- 修改熔断器ServiceHiHystrix (新的消费熔断器)
@Component
public class ServiceHiHystrix implements ServiceHi {
@Override
public String sayHiFromServiceHi2(String name) {
return "hello" + name +", this message send failed. By Hystrix.";
}
}
- 当然,随之更改的是HelloController,需要改为
return serviceHi.sayHiFromServiceHi2
@RestController
public class HelloController {
/** 注入服务"service-hi"的Feign客户端ServiceHi */
@Autowired
private ServiceHi serviceHi;
/**
* 调用Feign客户端提供的服务,自带负载均衡
* @param name
* @return
*/
@GetMapping("/hello/{name}")
public String sayHi(@PathVariable String name){
//调用Feign客户端ScheduleServiceHi的接口
return serviceHi.sayHiFromServiceHi2(name);
}
}
这样改完后,重启这个8766的服务消费者
结构依然不变:
我们得到了:
- 上方两排:不同的熔断器
- 下方两排:不同的消费提供者
这里确实比较难理解哈,坑了我好久。
参考
springcloud(四):熔断器Hystrix
http://www.ityouknow.com/springcloud/2017/05/16/springcloud-hystrix.html
springcloud(五):熔断监控Hystrix Dashboard和Turbine
http://www.ityouknow.com/springcloud/2017/05/18/hystrix-dashboard-turbine.html