集群 / 分布式 / 微服务 /SOA 是什么?

本贴最后更新于 2013 天前,其中的信息可能已经沧海桑田

集群/分布式/微服务/SOA 是什么?

像我这种技术小白,看到这些词(集群/分布式/微服务/SOA)的时候,感觉就是遥不可及的(高大尚的技术!!)。就好像刚学 Java 面向对象的时候,在论坛上翻阅资料的时候,无意看到"面向切面编程",也认为这是遥不可及的(高大尚的技术!!)。

但真正接触到"面向切面编程"的时候,发现原来就是如此啊,也没什么大不了的。只不过当时被它的名字给唬住了…

不知道各位在刚接触这些名字 集群/分布式/微服务/SOA 的时候,有没有被唬住了呢??

  • 下面我就简单说说这些名词的意思

1.1 什么是集群

以下内容来源维基百科:

计算机集群简称集群是一种计算机系统,它通过一组松散集成的计算机软件和/或硬件连接起来高度紧密地协作完成计算工作。在某种意义上,他们可以被看作是一台计算机。集群系统中的单个计算机通常称为节点,通常通过局域网连接,但也有其它的可能连接方式。集群计算机通常用来改进单个计算机的计算速度和/或可靠性。一般情况下集群计算机比单个计算机,比如工作站或超级计算机性能价格比要高得多

集群技术特点:

  • 通过多台计算机完成同一个工作,达到更高的效率。

  • 两机或多机内容、工作过程等完全一样。如果一台死机,另一台可以起作用。

在维基百科上说得也挺明白的了,我来举个例子吧。

  • 小周在公司写 Java 程序,但公司业务在发展,一个 Java 开发者可能忙不过来,小周有的时候也得请个假呀。于是请了 3y 过去一起做 Java 开发。平时小周和 3y 就写 Java 程序,但 3y 可能有事要回学校一趟。没事,公司还有小周做 Java 开发呢,公司开发还能继续运作。

  • 3y 跟小周都是做 Java 开发

  • 3y 来了,小周的工作可以分担一些。

  • 3y 请假了,还有小周在呢。

我写了一个 910 便利网发布到服务器去了,现在越来越多的人访问了,访问有点慢,怎么办???很简单,(只有充钱才能变强),加配置吧(加 cpu,加内存)。升级完配置之后,访问人数越来越多,于是发现又不禁用啦,在这台机器上加配置已经解决不了了,怎么办???很简单,(只有充钱才能变强),我再买一台服务器,将 910 便利网也发布到新买的这台服务器上去

特点:

  • 这两台服务器都是运行同一个系统--->910 便利网

好处:

  • 本来只有一台机器处理访问,现在有两台机器处理访问了,分担了压力

  • 如果其中一台忘记缴费了,暂时用不了了。没关系,还有另一台可以用呢。

集群:同一个业务,部署在多个服务器上(不同的服务器运行同样的代码,干同一件事)

1.2 什么是分布式

以下内容来源维基百科:

分布式系统是一组计算机,通过网络相互连接传递消息与通信后并协调它们的行为而形成的系统。组件之间彼此进行交互以实现一个共同的目标

我也来举个例子来说明一下吧:

  • 现在公司有小周和 3y 一起做 Java 开发,做 Java 开发一般 jQuery,AJAX 都能写一点,所以这些活都由我们来干。可是呢,3y 对前端不是很熟,有的时候调试半天都调不出来。老板认为 3y 是真的菜!于是让小周专门来处理前端的事情。这样 3y 就高兴了,可以专心写自己的 Java,前端就专门交由小周负责了。于是,小周和 3y 就变成了协作开发

  • 3y 对前端不熟(能写出来),但在调试的时候可能会花费很多时间

  • 小周来专门做前端的事,3y 可以专心写自己的 Java 程序了。

  • 都是为了项目正常运行以及迭代。

我的 910 便利网已经部署到两台服务器去了,但是越来越多的人去访问。现在也逐渐承受不住啦。那现在怎么办啊??那继续充钱变强??作为一个理智的我,肯定得想想是哪里有问题。现在 910 便利网的模块有好几个,全都丢在同一个 Tomcat 里边。

其实有些模块的访问是很低的(比如后台管理),那我可不可以这样做:将每个模块抽取独立出来,访问量大的模块用好的服务器装着,没啥人访问的模块用差的服务器装着。这样的好处是:一、资源合理利用了(没人访问的模块用性能差的服务器,访问量大的模块单独提升性能就好了)。二、耦合度降低了:每个模块独立出来,各干各的事(专业的人做专业的事),便于扩展

特点:

  • 将 910 便利网的功能拆分,模块之间独立,在使用的时候再将这些独立的模块组合起来就是一个系统了。

好处:

  • 模块之间独立,各做各的事,便于扩展,复用性高

  • 高吞吐量。某个任务需要一个机器运行 10 个小时,将该任务用 10 台机器的分布式跑(将这个任务拆分成 10 个小任务),可能 2 个小时就跑完了

分布式:一个业务分拆多个子业务,部署在不同的服务器上(不同的服务器,运行不同的代码,为了同一个目的)

1.3 集群/分布式

集群和分布式并不冲突,可以有分布式集群

现在 3y 的公司规模变大了,有 5 个小伙子写 Java,4 个小伙子写前端,2 个小伙子做测试,1 个小伙子做 DBA。

  • Java,前端,测试,DBA 的关系看作是分布式的

  • 5 个 Java 看作是集群的(前端,测试同理)…

1.4 分布式/微服务/SOA

其实我认为分布式/微服务/SOA 这三个概念是差不多的,了解了其中的一个,然后将自己的理解往上面套就好了。没必要细分每个的具体概念~~(当然了,我很期待有大佬可以在评论区留言说下自己的看法哈)

参考资料:

2、CAP 理论

从上面所讲的分布式概念我们已经知道,分布式简单理解就是:一个业务分拆多个子业务,部署在不同的服务器上

  • 一般来说,一个子业务我们称为节点

如果你接触过一些分布式的基础概念,那肯定会听过 CAP 这个理论。就比如说:你学了 MySQL 的 InnoDB 存储引擎相关知识,你肯定听过 ACID!

首先,我们来看一下 CAP 分别代表的是什么意思:

  • C:数据一致性(consistency)

  • 所有节点拥有数据的最新版本

  • A:可用性(availability)

  • 数据具备高可用性

  • P:分区容错性(partition-tolerance)

  • 容忍网络出现分区,分区之间网络不可达。

下面有三个节点(它们是集群的),此时三个节点都能够相互通信:

imagepng

由于我们的系统是分布式的,节点之间的通信是通过网络来进行的。只要是分布式系统,那很有可能会出现一种情况:因为一些故障,使得有些节点之间不连通了,整个网络就分成了几块区域

  • 数据就散布在了这些不连通的区域中,这就叫分区

imagepng

现在出现了网络分区后,此时有一个请求过来了,想要注册一个账户。

imagepng

此时我们节点一和节点三是不可通信的,这就有了抉择:

  • 如果允许当前用户注册一个账户,此时注册的记录数据只会在节点一和节点二或者节点二和节点三同步,因为节点一和节点三的记录不能同步的。

  • 这种情况其实就是选择了可用性(availability),抛弃了数据一致性(consistency)

  • 如果不允许当前用户注册一个账户(就是要等到节点一和节点三恢复通信)。节点一和节点三一旦恢复通信,我们就可以保证节点拥有的数据是最新版本

  • 这种情况其实就是抛弃了可用性(availability),选择了数据一致性(consistency)

2.1 再次梳理一下 CAP 理论

一般我们说的分布式系统,P:分区容错性(partition-tolerance)这个是必需的,这是客观存在的。

CAP 是无法完全兼顾的,从上面的例子也可以看出,我们可以选 AP,也可以选 CP。但是,要注意的是:不是说选了 AP,C 就完全抛弃了。不是说选了 CP,A 就完全抛弃了!

在 CAP 理论中,C 所表示的一致性是强一致性(每个节点的数据都是最新版本),其实一致性还有其他级别的:

  • 弱一致性:弱一致性是相对于强一致性而言,它不保证总能得到最新的值;

  • 最终一致性(eventual consistency):放宽对时间的要求,在被调完成操作响应后的某个时间点,被调多个节点的数据最终达成一致

可用性的值域可以定义成 0 到 100% 的连续区间

imagepng

所以,CAP 理论定义的其实是在容忍网络分区的条件下,“强一致性”和“极致可用性”无法同时达到

参考资料:

扩展阅读:

转自:https://mp.weixin.qq.com/s/V5tNg9Wvy24bXNEvBw4-2Q

  • B3log

    B3log 是一个开源组织,名字来源于“Bulletin Board Blog”缩写,目标是将独立博客与论坛结合,形成一种新的网络社区体验,详细请看 B3log 构思。目前 B3log 已经开源了多款产品:SymSoloVditor思源笔记

    1083 引用 • 3461 回帖 • 286 关注
  • Java

    Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由 Sun Microsystems 公司于 1995 年 5 月推出的。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。

    3168 引用 • 8207 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...