在线不卡日本ⅴ一区v二区_精品一区二区中文字幕_天堂v在线视频_亚洲五月天婷婷中文网站

<menu id="lky3g"></menu>

<pre id="lky3g"><tt id="lky3g"></tt></pre>

<div id="q583h"></div>

數(shù)據(jù)庫主鍵一定要自增嗎？有哪些場(chǎng)景不建議自增？

用戶投稿 ? 2022年6月15日 09:14 ? 社會(huì)

我們平時(shí)建表的時(shí)候，一般會(huì)像下面這樣。

CREATE TABLE `user` ( `id` int NOT NULL AUTO_INCREMENT COMMENT ‘主鍵’, `name` char(10) NOT NULL DEFAULT ” COMMENT ‘名字’, PRIMARY KEY (`id`)) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

出于習(xí)慣，我們一般會(huì)加一列id作為主鍵，而這個(gè)主鍵一般邊上都有個(gè)AUTO_INCREMENT, 意思是這個(gè)主鍵是自增的。自增就是i++，也就是每次都加1。

但問題來了。

主鍵id不自增行不行？

為什么要用自增id做主鍵？

離譜點(diǎn)，沒有主鍵可以嗎？

什么情況下不應(yīng)該自增？

被這么一波追問，念頭都不通達(dá)了？

這篇文章，我會(huì)嘗試回答這幾個(gè)問題。

主鍵不自增行不行

當(dāng)然是可以的。比如我們可以把建表sql里的AUTO_INCREMENT去掉。

CREATE TABLE `user` ( `id` int NOT NULL COMMENT ‘主鍵’, `name` char(10) NOT NULL DEFAULT ” COMMENT ‘名字’, PRIMARY KEY (`id`)) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

然后執(zhí)行

INSERT INTO `user` (`name`) VALUES (‘debug’);

這時(shí)候會(huì)報(bào)錯(cuò)Field ‘id’ doesn’t have a default value。也就是說如果你不讓主鍵自增的話，那你在寫數(shù)據(jù)的時(shí)候需要自己指定id的值是多少，想要主鍵id是多少就寫多少進(jìn)去，不寫就報(bào)錯(cuò)。

改成下面這樣就好了

INSERT INTO `user` (`id`,`name`) VALUES (10, ‘debug’);

為什么要用自增主鍵

我們?cè)?span id="wdkvapu" class="wpcom_tag_link">數(shù)據(jù)庫里保存的數(shù)據(jù)就跟excel表一樣，一行行似的。

user表

而在底層，這一行行數(shù)據(jù)，就是保存在一個(gè)個(gè)16k大小的頁里。

每次都去遍歷所有的行性能會(huì)不好，于是為了加速搜索，我們可以根據(jù)主鍵id，從小到大排列這些行數(shù)據(jù)，將這些數(shù)據(jù)頁用雙向鏈表的形式組織起來，再將這些頁里的部分信息提取出來放到一個(gè)新的16kb的數(shù)據(jù)頁里，再加入層級(jí)的概念。于是，一個(gè)個(gè)數(shù)據(jù)頁就被組織起來了，成為了一棵B+樹索引。

B+樹結(jié)構(gòu)

而當(dāng)我們?cè)诮ū韘ql里聲明了PRIMARY KEY (id)時(shí)，mysql的innodb引擎，就會(huì)為主鍵id生成一個(gè)主鍵索引，里面就是通過B+樹的形式來維護(hù)這套索引。

到這里，我們有兩個(gè)點(diǎn)是需要關(guān)注的：

數(shù)據(jù)頁大小是固定16k
數(shù)據(jù)頁內(nèi)，以及數(shù)據(jù)頁之間，數(shù)據(jù)主鍵id都是從小到大排序的

由于數(shù)據(jù)頁大小固定了是16k，當(dāng)我們需要插入一條新的數(shù)據(jù)，數(shù)據(jù)頁會(huì)被慢慢放滿，當(dāng)超過16k時(shí)，這個(gè)數(shù)據(jù)頁就有可能會(huì)進(jìn)行分裂。

針對(duì)B+樹葉子節(jié)點(diǎn)，如果主鍵是自增的，那它產(chǎn)生的id每次都比前一次要大，所以每次都會(huì)將數(shù)據(jù)加在B+樹尾部，B+樹的葉子節(jié)點(diǎn)本質(zhì)上是雙向鏈表，查找它的首部和尾部，時(shí)間復(fù)雜度O(1)。而如果此時(shí)最末尾的數(shù)據(jù)頁滿了，那創(chuàng)建個(gè)新的頁就好。

主鍵id自增的情況

如果主鍵不是自增的，比方說上次分配了id=7，這次分配了id=3，為了讓新加入數(shù)據(jù)后B+樹的葉子節(jié)點(diǎn)還能保持有序，它就需要往葉子結(jié)點(diǎn)的中間找，查找過程的時(shí)間復(fù)雜度是O(lgn)，如果這個(gè)頁正好也滿了，這時(shí)候就需要進(jìn)行頁分裂了。并且頁分裂操作本身是需要加悲觀鎖的?？傮w看下來，自增的主鍵遇到頁分裂的可能性更少，因此性能也會(huì)更高。

主鍵id不自增的情況

沒有主鍵可以嗎

mysql表如果沒有主鍵索引，查個(gè)數(shù)據(jù)都得全表掃描，那既然它這么重要，我今天就不當(dāng)人了，不聲明主鍵，可以嗎？

嗯，你完全可以不聲明主鍵。

你確實(shí)可以在建表sql里寫成這樣。

CREATE TABLE `user` ( `name` char(10) NOT NULL DEFAULT ” COMMENT ‘名字’) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

看起來確實(shí)是沒有主鍵的樣子。然而實(shí)際上，mysql的innodb引擎內(nèi)部會(huì)幫你生成一個(gè)名為ROW_ID列，它是個(gè)6字節(jié)的隱藏列，你平時(shí)也看不到它，但實(shí)際上，它也是自增的。有了這層兜底機(jī)制保證，數(shù)據(jù)表肯定會(huì)有主鍵和主鍵索引。

跟ROW_ID被隱藏的列還有trx_id字段，用于記錄當(dāng)前這一行數(shù)據(jù)行是被哪個(gè)事務(wù)修改的，和一個(gè)roll_pointer字段，這個(gè)字段是用來指向當(dāng)前這個(gè)數(shù)據(jù)行的上一個(gè)版本，通過這個(gè)字段，可以為這行數(shù)據(jù)形成一條版本鏈，從而實(shí)現(xiàn)多版本并發(fā)控制（MVCC）。有沒有很眼熟，這個(gè)在之前寫的文章里出現(xiàn)過。

隱藏的row_id列

有沒有建議主鍵不自增的場(chǎng)景

前面提到了主鍵自增可以帶來很多好處，事實(shí)上大部分場(chǎng)景下，我們都建議主鍵設(shè)為自增。

那有沒有不建議主鍵自增的場(chǎng)景呢？

mysql分庫分表下的id

聊到分庫分表，那我就需要說明下，遞增和自增的區(qū)別了，自增就是每次都+1，而遞增則是新的id比上一個(gè)id要大就行了，具體大多少，沒關(guān)系。

之前寫過一篇文章提到過，mysql在水平分庫分表時(shí)，一般有兩種方式。

一種分表方式是通過對(duì)id取模進(jìn)行分表，這種要求遞增就好，不要求嚴(yán)格自增，因?yàn)槿∧：髷?shù)據(jù)會(huì)被分散到多個(gè)分表中，就算id是嚴(yán)格自增的，在分散之后，都只能保證每個(gè)分表里id只能是遞增的。

根據(jù)id取模分表

另一種分表方式是根據(jù)id的范圍進(jìn)行分表（分片），它會(huì)劃出一定的范圍，比如以2kw為一個(gè)分表的大小，那0~2kw就放在這張分表中，2kw~4kw放在另一張分表中，數(shù)據(jù)不斷增加，分表也可以不斷增加，非常適合動(dòng)態(tài)擴(kuò)容，但它要求id自增，如果id遞增，數(shù)據(jù)則會(huì)出現(xiàn)大量空洞。舉個(gè)例子，比如第一次分配id=2，第二次分配id=2kw，這時(shí)候第一張表的范圍就被打滿了，后面再分配一個(gè)id，比如是3kw，就只能存到2kw~4kw（第二張）的分表中。那我在0~2kw這個(gè)范圍的分表，也就存了兩條數(shù)據(jù)，這太浪費(fèi)了。

根據(jù)id范圍分表

但不管哪種分表方式，一般是不可能繼續(xù)用原來表里的自增主鍵的，原因也比較好理解，原來的每個(gè)表如果都從0開始自增的話，那好幾個(gè)表就會(huì)出現(xiàn)好幾次重復(fù)的id，根據(jù)id唯一的原則，這顯然不合理。

所以我們?cè)诜謳旆直淼膱?chǎng)景下，插入的id都是專門的id服務(wù)生成的，如果是要嚴(yán)格自增的話，那一般會(huì)通過redis來獲得，當(dāng)然不會(huì)是一個(gè)id請(qǐng)求獲取一次，一般會(huì)按批次去獲得，比如一次性獲得100個(gè)。快用完了再去獲取下一批100個(gè)。

但這個(gè)方案有個(gè)問題，它嚴(yán)重依賴redis，如果redis掛了，那整個(gè)功能就傻了。

有沒有不依賴于其他第三方組件的方法呢？

雪花算法

有，比如Twitter開源的雪花算法。

雪花算法通過64位有特殊含義的數(shù)字來組成id。

雪花算法

首先第0位不用。

接下來的41位是時(shí)間戳。精度是毫秒，這個(gè)大小大概能表示個(gè)69年左右，因?yàn)闀r(shí)間戳隨著時(shí)間流逝肯定是越來越大的，所以這部分決定了生成的id肯定是越來越大的。

再接下來的10位是指產(chǎn)生這些雪花算法的工作機(jī)器id，這樣就可以讓每個(gè)機(jī)器產(chǎn)生的id都具有相應(yīng)的標(biāo)識(shí)。

再接下來的12位，序列號(hào)，就是指這個(gè)工作機(jī)器里生成的遞增數(shù)字。

可以看出，只要處于同一毫秒內(nèi)，所有的雪花算法id的前42位的值都是一樣的，因此在這一毫秒內(nèi)，能產(chǎn)生的id數(shù)量就是 2的10次方 2的12次方，大概400w，肯定是夠用了，甚至有點(diǎn)多了。

但是！

細(xì)心的兄弟們肯定也發(fā)現(xiàn)了，雪花算法它算出的數(shù)字動(dòng)不動(dòng)就比上次的數(shù)字多個(gè)幾百幾萬的，也就是它生成的id是趨勢(shì)遞增的，并不是嚴(yán)格+1自增的，也就是說它并不太適合于根據(jù)范圍來分表的場(chǎng)景。這是個(gè)非常疼的問題。

還有個(gè)小問題是，那10位工作機(jī)器id，我每次擴(kuò)容一個(gè)工作機(jī)器，這個(gè)機(jī)器怎么知道自己的id是多少呢？是不是得從某個(gè)地方讀過來。

那有沒有一種生成id生成方案，既能讓分庫分表能做到很好的支持動(dòng)態(tài)擴(kuò)容，又能像雪花算法那樣并不依賴redis這樣的第三方服務(wù)。

有。這就是這篇文章的重點(diǎn)了。

適合分庫分表的uuid算法

我們可以參考雪花算法的實(shí)現(xiàn)，設(shè)計(jì)成下面這樣。注意下面的每一位，都是十進(jìn)制，而不是二進(jìn)制。

適合分庫分表的uuid算法

開頭的12位依然是時(shí)間，但并不是時(shí)間戳，雪花算法的時(shí)間戳精確到毫秒，我們用不上這么細(xì)，我們改為yyMMddHHmmss，注意開頭的yy是兩位，也就是這個(gè)方案能保證到2099年之前，id都不會(huì)重復(fù)，能用到重復(fù)，那也是真·百年企業(yè)。同樣由于最前面是時(shí)間，隨著時(shí)間流逝，也能保證id趨勢(shì)遞增。

接下來的10位，用十進(jìn)制的方式表示工作機(jī)器的ip，就可以把12位的ip轉(zhuǎn)為10位的數(shù)字，它可以保證全局唯一，只要服務(wù)起來了，也就知道自己的ip是多少了，不需要像雪花算法那樣從別的地方去讀取worker id了，又是一個(gè)小細(xì)節(jié)。

在接下來的6位，就用于生成序列號(hào)，它能支持每秒鐘生成100w個(gè)id。

最后的4位，也是這個(gè)id算法最妙的部分。它前2位代表分庫id，后2位代表分表id。也就是支持一共100*100=1w張分表。

舉個(gè)例子，假設(shè)我只用了1個(gè)分庫，當(dāng)我一開始只有3張分表的情況下，那我可以通過配置，要求生成的uuid最后面的2位，取值只能是[0,1,2]，分別對(duì)應(yīng)三個(gè)表。這樣我生成出來的id，就能非常均勻的落到三個(gè)分表中，這還順帶解決了單個(gè)分表熱點(diǎn)寫入的問題。

如果隨著業(yè)務(wù)不斷發(fā)展，需要新加入兩張新的表(3和4)，同時(shí)第0張表有點(diǎn)滿了，不希望再被寫了，那就將配置改為[1,2,3,4]，這樣生成的id就不會(huì)再插入到對(duì)應(yīng)的0表中。同時(shí)還可以加入生成id的概率和權(quán)重來調(diào)整哪個(gè)分表落更多數(shù)據(jù)。

有了這個(gè)新的uuid方案，我們既可以保證生成的數(shù)據(jù)趨勢(shì)遞增，同時(shí)也能非常方便擴(kuò)展分表。非常nice。

數(shù)據(jù)庫有那么多種，mysql只是其中一種，那其他數(shù)據(jù)庫也是要求主鍵自增嗎？

tidb的主鍵id不建議自增

tidb是一款分布式數(shù)據(jù)庫，作為mysql分庫分表場(chǎng)景下的替代產(chǎn)品，可以更好的對(duì)數(shù)據(jù)進(jìn)行分片。

它通過引入Range的概念進(jìn)行數(shù)據(jù)表分片，比如第一個(gè)分片表的id在0~2kw，第二個(gè)分片表的id在2kw~4kw。這其實(shí)就是根據(jù)id范圍進(jìn)行數(shù)據(jù)庫分表。

它的語法幾乎跟mysql一致，用起來大部分時(shí)候是無感的。

但跟mysql有一點(diǎn)很不一樣的就是，mysql建議id自增，但tidb卻建議使用隨機(jī)的uuid。原因是如果id自增的話，根據(jù)范圍分片的規(guī)則，一段時(shí)間內(nèi)生成的id幾乎都會(huì)落到同一個(gè)分片上，比如下圖，從3kw開始的自增uuid，幾乎都落到range 1這個(gè)分片中，而其他表卻幾乎不會(huì)有寫入，性能沒有被利用起來。出現(xiàn)一表有難，多表圍觀的場(chǎng)面，這種情況又叫寫熱點(diǎn)問題。

寫熱點(diǎn)問題

所以為了充分的利用多個(gè)分表的寫入能力，tidb建議我們寫入時(shí)使用隨機(jī)id，這樣數(shù)據(jù)就能被均勻分散到多個(gè)分片中。

用戶id不建議用自增id

前面提到的不建議使用自增id的場(chǎng)景，都是技術(shù)原因?qū)е碌?，而下面介紹的這個(gè)，單純是因?yàn)闃I(yè)務(wù)。

舉個(gè)例子吧。

如果你能知道一個(gè)產(chǎn)品每個(gè)月，新增的用戶數(shù)有多少，這個(gè)對(duì)你來說會(huì)是有用的信息嗎？

對(duì)程序員來說，可能這個(gè)信息價(jià)值不大。

但如果你是做投資的呢，或者是分析競爭對(duì)手呢？

那反過來。

如果你發(fā)現(xiàn)你的競爭對(duì)手，總能非常清晰的知道你的產(chǎn)品每個(gè)月新進(jìn)的注冊(cè)用戶是多少人，你會(huì)不會(huì)心里毛毛的？

如果真出現(xiàn)了這問題，先不要想是不是有內(nèi)鬼，先檢查下你的用戶表主鍵是不是自增的。

如果用戶id是自增的，那別人只要每個(gè)月都注冊(cè)一個(gè)新用戶，然后抓包得到這個(gè)用戶的user_id，然后跟上個(gè)月的值減一下，就知道這個(gè)月新進(jìn)多少用戶了。

同樣的場(chǎng)景有很多，有時(shí)候你去小店吃飯，發(fā)票上就寫了你是今天的第幾單，那大概就能估計(jì)今天店家做了多少單。你是店家，你心里也不舒服吧。

再比如說一些小app的商品訂單id，如果也做成自增的，那就很容易可以知道這個(gè)月成了多少單。

類似的事情有很多，這些場(chǎng)景都建議使用趨勢(shì)遞增的uuid作為主鍵。

當(dāng)然，主鍵保持自增，但是不暴露給前端，那也行，那前面的話，你當(dāng)我沒說過。

總結(jié)

建表sql里主鍵邊上的AUTO_INCREMENT，可以讓主鍵自增，去掉它是可以的，但這就需要你在insert的時(shí)候自己設(shè)置主鍵的值。
建表sql里的 PRIMARY KEY 是用來聲明主鍵的，如果去掉，那也能建表成功，但mysql內(nèi)部會(huì)給你偷偷建一個(gè) ROW_ID的隱藏列作為主鍵。
由于mysql使用B+樹索引，葉子節(jié)點(diǎn)是從小到大排序的，如果使用自增id做主鍵，這樣每次數(shù)據(jù)都加在B+樹的最后，比起每次加在B+樹中間的方式，加在最后可以有效減少頁分裂的問題。
在分庫分表的場(chǎng)景下，我們可以通過redis等第三方組件來獲得嚴(yán)格自增的主鍵id。如果不想依賴redis，可以參考雪花算法進(jìn)行魔改，既能保證數(shù)據(jù)趨勢(shì)遞增，也能很好的滿足分庫分表的動(dòng)態(tài)擴(kuò)容。
并不是所有數(shù)據(jù)庫都建議使用自增id作為主鍵，比如tidb就推薦使用隨機(jī)id，這樣可以有效避免寫熱點(diǎn)的問題。而對(duì)于一些敏感數(shù)據(jù)，比如用戶id，訂單id等，如果使用自增id作為主鍵的話，外部通過抓包，很容易可以知道新進(jìn)用戶量，成單量這些信息，所以需要謹(jǐn)慎考慮是否繼續(xù)使用自增主鍵。

鄭重聲明：本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng)，不代表本站立場(chǎng)，版權(quán)歸原作者所有，如有侵權(quán)請(qǐng)聯(lián)系管理員(admin#wlmqw.com)刪除。

場(chǎng)景建議數(shù)據(jù)數(shù)據(jù)庫方式時(shí)間機(jī)器用戶算法索引雪花

摩托羅拉驍龍8+新機(jī)再曝：或下個(gè)月來

上一篇 2022年6月15日 09:14

菜鳥：618“預(yù)售極速達(dá)”覆蓋超300城，單量同比增110%

下一篇 2022年6月15日 09:14

ios手游模擬器(手游模擬器ios)
本文主要講的是ios手游模擬器，以及和手游模擬器ios相關(guān)的知識(shí)，如果覺得本文對(duì)您有所幫助，不要忘了將本文分享給朋友。哪個(gè)iOS模擬器能多開手游賬號(hào)？可以推薦個(gè)好用的模擬器給我嗎…
2022年11月27日
0
分享4條發(fā)微商朋友圈的方法(微商朋友圈應(yīng)該怎么發(fā))
對(duì)于微商朋友來說，朋友圈的重要性不言而喻了。那么微商的朋友圈到底該怎么發(fā)呢？為什么同樣是經(jīng)營一個(gè)朋友圈，有的微商看起來逼格滿滿，實(shí)際效果也不錯(cuò)；而有的卻動(dòng)都不動(dòng)就被屏蔽甚至拉黑…
2022年11月27日
0
短視頻策劃內(nèi)容的3個(gè)要點(diǎn)(短視頻策劃內(nèi)容怎么做)
短視頻在制作時(shí)，內(nèi)容框架非常重要。如果直奔主題，然后結(jié)束，聚卓告訴你，這樣的短視頻已經(jīng)過時(shí)了?，F(xiàn)在的短視頻需要框架的，但不是任何框架，它需要一種易于理解和消化的框架。而且，現(xiàn)在大多…
2022年11月27日
0
美團(tuán)第三季度實(shí)現(xiàn)營收626億元，即時(shí)配送訂單量增至50億筆
新京報(bào)訊（記者秦勝南）11月25日，美團(tuán)發(fā)布業(yè)績公告顯示，第三季度營收為626億元，較去年同比增長28.2%，凈利潤為12.2億元。第三季度，美團(tuán)即時(shí)配送訂單數(shù)增長至50億筆。截至…
2022年11月27日
0
個(gè)人怎么做抖音帶貨(個(gè)人做抖音帶貨能賺錢嗎)
抖音如今是大家很熟悉的短視頻平臺(tái)，不過現(xiàn)在的抖音卻不只是短視頻那么簡單，它的功能非常豐富，其中一個(gè)就是可以帶貨，相信很多小伙伴都有在抖音上買過東西，抖音如今的變現(xiàn)能力也是不容小覷的…
2022年11月25日
0
5+3疫情防控從哪天開始算(遼寧疫情防控最新政策)
最近有關(guān)國內(nèi)各地的疫情大家也都有在持續(xù)關(guān)注，目前國內(nèi)各地疫情隔離時(shí)間也根據(jù)二十條防控措施有了新的調(diào)整。那么，5+3疫情防控從哪天開始算？對(duì)于密接的5+3隔離時(shí)間計(jì)算大家還是比較關(guān)心…
2022年11月25日
0
藍(lán)碼怎么變綠碼需要幾天(藍(lán)碼怎么變綠碼需要幾天)
大家都知道健康碼的顏色有紅碼、綠碼、黃碼，近日湖南健康碼上線“藍(lán)碼”，不少小伙伴發(fā)現(xiàn)自己健康碼變藍(lán)了，都想趕緊恢復(fù)綠碼，那么藍(lán)碼怎么變綠碼需要幾天？下面小編為大家?guī)硭{(lán)碼變綠碼需要…
2022年11月25日
0
拼多多百億補(bǔ)貼預(yù)售一般多久發(fā)貨(拼多多百億補(bǔ)貼預(yù)售)
拼多多里面有很多優(yōu)惠活動(dòng)，其中百億補(bǔ)貼活動(dòng)非?；鸨?，一些里面的東西價(jià)格比別的平臺(tái)便宜，質(zhì)量也有保障，還有預(yù)售的活動(dòng)，那么拼多多百億補(bǔ)貼預(yù)售一般多久發(fā)貨？下面小編為大家?guī)砥炊喽喟賰|…
2022年11月25日
0
北京疫情多久能解除封控(北京疫情還要多久結(jié)束)
最近一段時(shí)間北京疫情形勢(shì)備受關(guān)注，馬上就要到年底了，不少人想要去北京辦事，。都非常關(guān)注當(dāng)?shù)匾咔橄嚓P(guān)政策，那么北京疫情多久能解除封控？北京疫情什么時(shí)候恢復(fù)正常生活？下面小編為大家?guī)А?/p>
2022年11月25日
0
年輕人如何創(chuàng)業(yè)給年輕人創(chuàng)業(yè)的三點(diǎn)建議
1、一個(gè)讀者聯(lián)系我，問我是怎么創(chuàng)業(yè)的我回答她：我們一開始其實(shí)很簡單，就是在廣州進(jìn)了3000塊的情趣用品，放在家里車庫，然后在論壇開帖子和加QQ群售賣。服務(wù)好點(diǎn)，有人買給人家送…
2022年11月25日
0

聯(lián)系我們

聯(lián)系郵箱：admin#wlmqw.com
工作時(shí)間：周一至周五，10:30-18:30，節(jié)假日休息