分布式系统常见的数据分布方式,在分布式系统中，如何生成分布式ID？

你所見即我 • 2022-03-11 07:19:58 • 投稿

分布式ID常见的两种方法就是UUID和snowflake算法（雪花算法）。

UUID是一种本地生成ID的方法，不需要远程调用，高性能、低延时、扩展性好，但是UUID不支持递增。

snowflake算法是twitter开源的分布式ID生成算法，其核心思想是一个long型的ID：1位标识符（始终是0）、41位时间戳毫秒数、10位机器标识码、12位毫秒内序列号，该算法单机每秒内理论上最多可以生成1000*(2^12)的ID，性能高、趋势递增、灵活度高，但snowflake依赖机器的时钟，如果服务器时钟回拨会导致生成重复的ID。

分布式系统常见的数据分布方式,在分布式系统中，如何生成分布式ID？

分布式系统中

分布式系统中的“身份证”即分布式Id且唯一。如何生成分布式系统中的唯一Id？考虑这个问题的时候，我觉得可以从“带着问题去找方案”这个思路去聊聊，也就是说我要生成的这个分布式Id需要满足哪些条件呢？

分布式系统常见的数据分布方式,在分布式系统中，如何生成分布式ID？

分布式Id生成需要满足的条件

全局唯一：这个不用多说了，不然还有什么分布式“身份证”？
高可用：不能有单点故障，小心引起雪崩；
安全：这个Id不能是连续的，否则让非友好人士发现规则，数据爬去、数据预测都会有一定的安全风险；
保证顺序递增：MySQL的Innodb引擎采用B+树算法存储索引数据，为了提高性能，就得要求索引的主键在一定程度上是有序的，这样不管是写入还是查询效率都很好的；
分片支持：可以根据分布式Id得到具体的业务shardingId，方便业务查询；
不要太长：64位存储最佳？

分布式系统常见的数据分布方式,在分布式系统中，如何生成分布式ID？

大家觉得还有哪些场景或者条件需要考虑？欢迎评论区留言讨论~那么基于以上需要考虑的条件，我们日常中都有哪些分布式Id生成方案呢？

数据库生成

优点：简单粗暴，自增Id顺序递增

缺点：只有主库才能生成，容易造成单点故障；性能不足时候，无法扩展；分库分表会有很多麻烦。

UUID

优点：简单直接，无性能问题，真正的全球唯一

缺点：无规则；UUID是字符串，IO传输数据量大，存储空间大，查询效率低；基于UUID分库分表更难。

redis生成

优点：基于内存操作的reids性能比数据库好；可以基于集群做有序的数字Id生成；利于分库分表；

缺点：需要搭建一套高可用redis集群；需要基于集群编写生成Id的方案；

zookeeper生成

和redis类似

业务规则生成

分布式系统常见的数据分布方式,在分布式系统中，如何生成分布式ID？

举例订单号的生成：10_2298765801_1565283246399_781.业务字段用于区分具体的业务，采用2-4位，可以根据不同的系统或者业务自由决定；2.用户Id，最长10位够了吧3.毫秒级时间戳：13位4.随机数：2-4位

个人还是喜欢采用业务规则生成的方案，性能肯定没的说，基于内存计算即可得到，也不存在什么单点故障，哪台机器都可以自己生成，不依赖第三方服务或者应用，也能保证顺序递增。

这样的设计能达到真正的分布式唯一Id吗？能满足上面所说的那些条件吗？大家还有什么好的生成方案？欢迎评论交流，批评指正~

负载均衡和分布式是一个意思吗，有哪些区别？

不是一个意思，下面按照我的理解说一下什么是分布式，什么是集群，如果有理解错误的地方，请大家留言指正。

集群

同一个业务系统，部署在多台服务器上，这个就叫做集群。

集群里面，每一台服务器实现的功能没有差别，代码都是一样的。

比如我有一个系统A，提供一个很简单的接口，根据员工编号查询员工姓名和他的考勤记录。

当有一个系统调用这个接口的时候，我部署一台服务器就够用了。

当有一百个系统调用这个接口的时候，我就部署十台服务器，前面挂一个负载均衡。

这就是集群部署，当一台服务器挂了以后，不影响功能使用。

我接触过的负载均衡软件有Nginx、LB、HAProxy，也有硬件诸如F5。

分布式系统常见的数据分布方式,在分布式系统中，如何生成分布式ID？

分布式

一个业务被拆成多个子业务，部署在多台服务器上，这个就叫做分布式。

分布式里面，每一台服务器实现的功能是有差别的，代码也是不一样的，分布式每台服务器功能加起来，才是完整的业务。

还是这个业务场景，我有一个系统A，提供一个很简单的接口，根据员工编号查询员工姓名和他的考勤记录。

我拆开两个系统：人员管理系统B和考勤系统C，分别部署在两台服务器上。

这个就是分布式。

好处是什么呢？如果有系统D也需要使用人员信息，传统的方式系统A和D都要有人员信息管理功能，意味着两个系统各自维护人员信息，那新入职一个员工，可能要在系统A和D里面都维护；如果是有EFGHI系统都需要人员信息呢？

而分布式解决了这个问题，人员信息单独拎出来是一个系统，维护人员信息，同时对外提供查询服务。

分布式系统常见的数据分布方式,在分布式系统中，如何生成分布式ID？

分布式+集群

很多时候要结合起来一起用。

还是这个业务场景，我有一个系统A，提供一个很简单的接口，根据员工编号查询员工姓名和他的考勤记录。

我拆开两个系统：人员管理系统B和考勤系统C。

那么系统B部署在十台服务器上，系统C部署在十台服务器上；前面分别挂负载均衡；这样保证了每个子业务功能的高可用。

分布式系统常见的数据分布方式,在分布式系统中，如何生成分布式ID？

赞 (0)

你所見即我投稿者

0 0

linux 内核书籍,关于linux内核原理的入门书籍有哪些值得推荐的？

谢小编邀。@云瑄软件回答的已经很全面了，他推荐的几本书都是内核入门经典中的经典。我再推荐几本接触过好书:《linux设备驱动程序》 Jonathan Corbet著，讲内核设备驱动开发，对内核抽象层次，设备原理讲的很细，还...

所見即我
2022-02-17 • 投稿
怎么利用微信公众号进行视频直播,微信公众号里怎么做视频直播？

1、下载安装一款直播APP，如果你已经有了直播软件，可以跳过这一步。这里选择下载了映客直播。先按照提示安装好。2、开直播间。安装好APP后，在APP里面开个直播间，主播和助手先熟悉软件使用方法，做好准备。3、获取...

所見即我
2022-02-24 • 投稿
华为mate10pro怎么样值得买吗,华为mate10和mate10 Pro什么时候买最合适？

不想现在马上就买感请。今年的华为Mate 10、Mate 10 Pro销售情况都十分火爆，不知道是华为供货太少，还是消费者需求太旺盛，直到现在依然没有现货供应，需要抢购，每天10:08分华为官网开卖基本是秒售罄的节奏，想买...

你所見即我
2022-02-24 • 投稿
投稿

目前电脑什么浏览器最好用速度最快，哪种电脑浏览器最好用最快

看你的需求：如果你要求速度，那么Chrome无疑是你不二的选择，谷歌是这类浏览器中比较成熟的一个。但是不支持自定义安装。世界之窗的Chrome也不错，还有我在用的Commodo Dragon。现在360安全浏览器也好用，它打开网...

雾島风起時
2022-04-04
java怎么连接mysql数据库,java客户端怎么连mysql数据库？

最简单的方式就是JDBC，下载一个mysql-connector-java jar包，然后直接导入项目就可连接MySQL数据库，下面我简单介绍一下实现过程，感兴趣的朋友可以尝试一下：1.首先，下载mysql-connector-java jar包（驱动），这...

恩莉尔的裙摆
2022-03-06 • 投稿
扫描仪怎么用扫描仪的使用方法详解，扫描仪如何使用

1、把扫描仪与用USB线电脑连接上，把文件放入扫描仪。2、点击【计算机】，点击打开【扫描仪】。3、在弹出的对话框中选择【扫描仪和照像机向导】，再点击【确定】。4、打开程序后点击下一步。5、然后根据提示选择选择...

卡夫卡的熊
2022-03-31 • 投稿

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 xxx@163.com 举报，一经查实，本站将立刻删除。

发表评论

登录后才能评论