体会面试7连问

面试官:你好

候选人:你好

大家寒暄一下。。。

(面试官在你的简历上面看到了,呦,有个亮点,就是你在项目里用过MQ,比如说你用过ActiveMQ)

面试官:你在系统里用过消息队列吗?(面试官在随和的语气中展开了面试)

候选人:用过的(此时感觉没啥)

面试官:那你说一下你们在项目里是怎么用消息队列的?

候选人:巴拉巴拉,我们啥啥系统发送个啥啥消息到队列,别的系统来消费啥啥的(很多同学在这里会进入一个误区,就是你仅仅就是知道以及回答你们是怎么用这个消息队列的,用这个消息队列来干了个什么事情?)

比如我们有个订单系统,订单系统会每次下一个新的订单的时候,就会发送时一条消息到ActiveMQ里面去,后台有个库存系统负责获取了消息然后更新库存。

面试官:那你们为什么使用消息队列啊?

(你的订单系统不发送消息到MQ,直接订单系统调用库存系统一个接口,咔嚓一下,直接就调用成功能了,库存就更新了)

候选人:额。。。(楞了一下,为什么?我没怎么仔细想过啊,老大让用就用了),硬着头皮胡言乱语了几句

(面试官此时听你楞了一下,然后听你胡言乱语了几句,开始心里觉得有点儿那什么了,怀疑你之前就压根儿没思考过这问题)

面试官:那你说说用消息队列都有什么优点和缺点?

(面试官此时心里想的是,你的MQ在项目里为啥要用?你没考虑过,那我稍微简单点儿,我问问你消息队列你之前有没有考虑过如果用的话,优点和缺点分别是啥?)

候选人:这个。。。(确实平时没怎么考虑过这个问题啊。。。胡言乱语了)

(面试官此时心里已经更觉得你这哥儿们不行,平时都没什么思考)

面试官:kafka、activemq、rabbitmq、rocketmq都有什么区别?

(面试官问你这个问题,就是说,绕过比较虚的话题,直接看看你对各种MQ中间件是否了解,是否做过功课,是否做过调研)

候选人:我们就用过activemq,所以别的没用过。。。区别,也不太清楚

(面试官此时却是觉得你这哥儿们平时就是瞎用,根本就没什么思考,觉得不行)

面试官:那你们是如何保证消息队列的高可用啊?

候选人:这个。。。我平时就是简单走api调用一下,不太清楚消息队列怎么部署的。。。

面试官:如何保证消息不被重复消费啊?如何保证消费的时候是幂等的啊?

候选人:啥?(mq不就是写入和消费就可以了,哪来这么多问题)

面试官:如何保证消息的可靠性传输啊?要是消息丢失了怎么办啊?

候选人:我们没怎么丢过消息啊。。。

面试官:那如何保证消息的顺序性?

候选人:顺序性?什么意思?我为什么要保证消息的顺序性?

面试官:如何解决消息队列的延时以及过期失效问题?消息队列满了以后该怎么处理?有几百万消息持续积压几小时,说说怎么解决?

候选人:不是,我这平时没遇到过这些问题啊,就是简单用用,知道mq的一些功能

面试官:如果让你写一个消息队列,该如何进行架构设计啊?说一下你的思路

候选人:。。。。。我还是走吧。。。。

小总结

在工作中会用,在面试中不会说,这是非常大的问题,说明平时只是了解某个技术如何用,却不知道底层原理\color{red}在工作中会用,在面试中不会说,这是非常大的问题,说明平时只是了解某个技术如何用,却不知道底层原理在工作中会用,在面试中不会说,这是非常大的问题,说明平时只是了解某个技术如何用,却不知道底层原理 缺少思考\color{red}缺少思考缺少思考 认真看完这篇文章,对于这些基础的问题都有自己的思考

从生活case到生产案例

系统之间直接调用实际工程落地和存在的问题

微服务架构后

链式调用是我们在写程序时候的一般流程,为了完成一个整体功能会将其拆分成多个函数(或子模块),比如模块A调用模块B,模块B调用模块C,模块C调用模块D。但在大型分布式应用中,系统间的RPC交互繁杂,一个功能背后要调用上百个接口并非不可能,从单机架构过渡到分布式微服务架构的通例,

这些架构会有哪些问题?

(1)系统之间接口耦合比较严重

每新增一个下游功能,都要对上游的相关接口进行改造;
举个例子:如果系统A要发送数据给系统B和系统C,发送给每个系统的数据可能有差异,因此系统A对要发送给每个系统的数据进行了组装,然后逐一发送;
当代码上线后又新增了一个需求:把数据也发送给D,新上了一个D系统也要接受A系统的数据,此时就需要修改A系统,让他感知到D系统的存在,同时把数据处理好再给D。在这个过程你会看到,每接入一个下游系统,都要对系统A进行代码改造,开发联调的效率很低。其整体架构如下图:

 

(2)面对大流量并发时,容易被冲垮

每个接口模块的吞吐能力是有限的,这个上限能力如果是堤坝,当大流量(洪水)来临时,容易被冲垮。
举个例子秒杀业务:上游系统发起下单购买操作,就是下单一个操作,很快就完成。然而,下游系统要完成秒杀业务后面的所有逻辑(读取订单,库存检查,库存冻结,余额检查,余额冻结,订单生产,余额扣减,库存减少,生成流水,余额解冻,库存解冻)。

(3)等待同步存在性能问题

RPC接口上基本都是同步调用,整体的服务性能遵循“木桶理论”,即整体系统的耗时取决于链路中最慢的那个接口。比如A调用B/C/D都是50ms,但此时B又调用了B1,花费2000ms,那么直接就拖累了整个服务性能。

 

根据上述的几个问题,在设计系统时可以明确要达到的目标:

1,要做到系统解耦,当新的模块接进来时,可以做到代码改动最小;能够解耦
2,设置流量缓冲池,可以让后端系统按照自身吞吐能力进行消费,不被冲垮;能削峰
3,强弱依赖梳理能将非关键调用链路的操作异步化并提升整体系统的吞吐能力;能够异步

消息中间件就可以完美解决上述问题\color{red}消息中间件就可以完美解决上述问题消息中间件就可以完美解决上述问题

MQ的主要作用

(1)异步。调用者无需等待。
(2)解耦。解决了系统之间耦合调用的问题。

消峰。抵御洪峰流量,保护了主业务

MQ的定义

mq(message queue):面向消息的中间件(message-oriented middleware)是指利用高效可靠的消息传递机制与平台无关的数据交流,并基于数据通信来进行分布式系统的集成。

通过提供消息传递和消息排队模型在分布式环境下提供应用解耦,弹性伸缩,冗余存储、流量削峰,异步通信,数据同步等功能。

发送者把消息发送给消息服务器,消息服务器将消息存放在若干队列/主题topic中,在合适的时候,消息服务器回将消息转发给接受者。在这个过程中,发送和接收是异步的,也就是发送无需等待,而且发送者和接受者的生命周期也没有必然的关系;尤其在发布pub/订阅sub模式下,也可以完成一对多的通信,即让一个消息有多个接受者。
 

MQ的特点

(1)采用异步处理模式

消息发送者可以发送一个消息而无须等待响应。消息发送者将消息发送到一条虚拟的通道(主题或者队列)上;
消息接收者则订阅或者监听该爱通道。一条消息可能最终转发给一个或者多个消息接收者,这些消息接收者都无需对消息发送者做出同步回应。整个过程都是异步的。

案例:

也就是说,一个系统跟另一个系统之间进行通信的时候,假如系统A希望发送一个消息给系统B,让他去处理。但是系统A不关注系统B到底怎么处理或者有没有处理好,所以系统A把消息发送给MQ,然后就不管这条消息的“死活了”,接着系统B从MQ里面消费出来处理即可。至于怎么处理,是否处理完毕,什么时候处理,都是系统B的事儿,与系统A无关。

 

这样的一种通信方式,就是所谓的“异步”通信方式,对于系统A来说,只需要把消息发送给MQ,然后系统B就会异步的去进行处理了,系统A不需要“同步”的等待系统B处理完成,实现了系统A和系统B 之间的解耦。

(2)应用系统之间解耦合

发送者和接受者不必了解对方,只需要确认消息。
发送者和接受者不必同时在线。

(3)整体架构

 

(4)MQ的缺点
两个系统之间不能同步调用,不能实时回复,不能响应某个调用的回复。

MQ的产品种类和对比

MQ就是消息中间件。MQ是一种理念,ActiveMQ是MQ的落地产品。不管是哪款消息中间件,都有如下一些技术维度:

 

MQ产品分类

Kafka:最初由Linkedin公司开发,是一个分布式、分区的、多副本的、多订阅者,基于zookeeper协调的分布式日志系统(也可以当做MQ系统),常见可以用于web/nginx日志、访问日志,消息服务等等,Linkedin于2010年贡献给了Apache基金会并成为顶级开源项目。

RabbitMQ:实现了高级消息队列协议(AMQP)的开源消息代理软件(亦称面向消息的中间件)。RabbitMQ服务器是用Erlang语言编写的,而集群和故障转移是构建在开放电信平台框架上的。所有主要的编程语言均有与代理接口通讯的客户端库。

RocketMQ:RocketMQ是一款分布式消息中间件,最初是由阿里巴巴消息中间件团队研发并大规模应用于生产系统,满足线上海量消息堆积的需求, 在2016年底捐赠给Apache开源基金会成为孵化项目,经过不到一年时间正式成为了Apache顶级项目;早期阿里曾经基于ActiveMQ研发消息系统, 随着业务消息的规模增大,瓶颈逐渐显现,后来也考虑过Kafka,但因为在低延迟和高可靠性方面没有选择,最后才自主研发了RocketMQ, 各方面的性能都比目前已有的消息队列要好,RocketMQ和Kafka在概念和原理上都非常相似,所以也经常被拿来对比;RocketMQ默认采用长轮询的拉模式, 单机支持千万级别的消息堆积,可以非常好的应用在海量消息系统中。

ActiveMQ:Apache ActiveMQ是Apache软件基金会所研发的开放源代码消息中间件;由于ActiveMQ是一个纯Java程序,因此只需要操作系统支持Java虚拟机,ActiveMQ便可执行。

MQ技术维度(共性)

api发送和接受
高可用性
集群和容错配置
持久化 延时发送/定时投送
签收机制

小小面试题 kafka、activemq、rabbitmq、rocketmq都有什么区别?

 

综上,各种对比之后,有如下建议:

一般的业务系统要引入 MQ,最早大家都用 ActiveMQ,但是现在确实大家用的不多了,没经过大规模吞吐量场景的验证,社区也不是很活跃,所以大家还是算了吧,我个人不推荐用这个了;

后来大家开始用 RabbitMQ,但是确实 erlang 语言阻止了大量的 Java 工程师去深入研究和掌控它,对公司而言,几乎处于不可控的状态,但是确实人家是开源的,比较稳定的支持,活跃度也高;

不过现在确实越来越多的公司,会去用 RocketMQ,确实很不错(阿里出品),但社区可能有突然黄掉的风险,对自己公司技术实力有绝对自信的,推荐用 RocketMQ,否则回去老老实实用 RabbitMQ 吧,人家有活跃的开源社区,绝对不会黄。

所以中小型公司,技术实力较为一般,技术挑战不是特别高,用 RabbitMQ 是不错的选择;大型公司,基础架构研发实力较强,用 RocketMQ 是很好的选择。

如果是大数据领域的实时计算、日志采集等场景,用 Kafka 是业内标准的,绝对没问题,社区活跃度很高,绝对不会黄,何况几乎是全世界这个领域的事实性规范