在线不卡日本ⅴ一区v二区_精品一区二区中文字幕_天堂v在线视频_亚洲五月天婷婷中文网站

<menu id="lky3g"></menu>

<pre id="lky3g"><tt id="lky3g"></tt></pre>

<label id="dv9yw"><ol id="dv9yw"></ol></label>

<dfn id="dv9yw"></dfn>

<label id="dv9yw"><tt id="dv9yw"></tt></label>

<pre id="dv9yw"><tt id="dv9yw"></tt></pre>

分庫分表索引設(shè)計(jì)：二級(jí)索引、全局索引的最佳設(shè)計(jì)實(shí)踐

用戶投稿 ? 2022年6月28日 17:28 ? 社會(huì)

主鍵選擇

對主鍵來說，要保證在所有分片中都唯一，它本質(zhì)上就是一個(gè)全局唯一的索引。如果用大部分同學(xué)喜歡的自增作為主鍵，就會(huì)發(fā)現(xiàn)存在很大的問題。

因?yàn)樽栽霾⒉荒茉诓迦肭熬瞳@得值，而是要通過填 NULL 值，然后再通過函數(shù) last_insert_id()獲得自增的值。所以，如果在每個(gè)分片上通過自增去實(shí)現(xiàn)主鍵，可能會(huì)出現(xiàn)同樣的自增值存在于不同的分片上。

比如，對于電商的訂單表 orders，其表結(jié)構(gòu)如下（分片鍵是o_custkey，表的主鍵是o_orderkey）：

CREATE TABLE `orders` ( `O_ORDERKEY` int NOT NULL auto_increment, `O_CUSTKEY` int NOT NULL, `O_ORDERSTATUS` char(1) NOT NULL, `O_TOTALPRICE` decimal(15,2) NOT NULL, `O_ORDERDATE` date NOT NULL, `O_ORDERPRIORITY` char(15) NOT NULL, `O_CLERK` char(15) NOT NULL, `O_SHIPPRIORITY` int NOT NULL, `O_COMMENT` varchar(79) NOT NULL, PRIMARY KEY (`O_ORDERKEY`), KEY (`O_CUSTKEY`) ……) ENGINE=InnoDB

如果把 o_orderkey 設(shè)計(jì)成上圖所示的自增，那么很可能 o_orderkey 同為 1 的記錄在不同的分片出現(xiàn)，如下圖所示：

所以，在分布式數(shù)據(jù)庫架構(gòu)下，盡量不要用自增作為表的主鍵：自增性能很差、安全性不高、不適用于分布式架構(gòu)。

講到這兒，我們已經(jīng)說明白了“自增主鍵”的所有問題，那么該如何設(shè)計(jì)主鍵呢？依然還是用全局唯一的鍵作為主鍵，比如 MySQL 自動(dòng)生成的有序 UUID；業(yè)務(wù)生成的全局唯一鍵（比如發(fā)號(hào)器）；或者是開源的 UUID 生成算法，比如雪花算法（但是存在時(shí)間回溯的問題）。

總之，用有序的全局唯一替代自增，是這個(gè)時(shí)代數(shù)據(jù)庫主鍵的主流設(shè)計(jì)標(biāo)準(zhǔn)，如果你還停留在用自增做主鍵，或許代表你已經(jīng)落后于時(shí)代發(fā)展了。

索引設(shè)計(jì)

通過分片鍵可以把 SQL 查詢路由到指定的分片，但是在現(xiàn)實(shí)的生產(chǎn)環(huán)境中，業(yè)務(wù)還要通過其他的索引訪問表。

還是以前面的表 orders 為例，如果業(yè)務(wù)還要根據(jù) o_orderkey 字段進(jìn)行查詢，比如查詢訂單 ID 為 1 的訂單詳情：

SELECT * FROM orders WHERE o_orderkey = 1

我們可以看到，由于分片規(guī)則不是分片鍵，所以需要查詢 4 個(gè)分片才能得到最終的結(jié)果，如果下面有 1000 個(gè)分片，那么就需要執(zhí)行 1000 次這樣的 SQL，這時(shí)性能就比較差了。

但是，我們知道 o_orderkey 是主鍵，應(yīng)該只有一條返回記錄，也就是說，o_orderkey 只存在于一個(gè)分片中。這時(shí)，可以有以下兩種設(shè)計(jì)：

同一份數(shù)據(jù)，表 orders 根據(jù) o_orderkey 為分片鍵，再做一個(gè)分庫分表的實(shí)現(xiàn)；
在索引中額外添加分片鍵的信息。

這兩種設(shè)計(jì)的本質(zhì)都是通過冗余實(shí)現(xiàn)空間換時(shí)間的效果，否則就需要掃描所有的分片，當(dāng)分片數(shù)據(jù)非常多，效率就會(huì)變得極差。

而第一種做法通過對表進(jìn)行冗余，對于 o_orderkey 的查詢，只需要在 o_orderkey = 1的分片中直接查詢就行，效率最高，但是設(shè)計(jì)的缺點(diǎn)又在于冗余數(shù)據(jù)量太大。

所以，改進(jìn)的做法之一是實(shí)現(xiàn)一個(gè)索引表，表中只包含 o_orderkey 和分片鍵 o_custkey，如：

CREATE TABLE idx_orderkey_custkey （ o_orderkey INT o_custkey INT, PRIMARY KEY (o_orderkey))

如果這張索引表很大，也可以將其分庫分表，但是它的分片鍵是 o_orderkey，如果這時(shí)再根據(jù)字段 o_orderkey 進(jìn)行查詢，可以進(jìn)行類似二級(jí)索引的回表實(shí)現(xiàn)：先通過查詢索引表得到記錄 o_orderkey = 1 對應(yīng)的分片鍵 o_custkey 的值，接著再根據(jù) o_custkey 進(jìn)行查詢，最終定位到想要的數(shù)據(jù)，如：

SELECT * FROM orders WHERE o_orderkey = 1=># step 1SELECT o_custkey FROM idx_orderkey_custkey WHERE o_orderkey = 1# step 2SELECT * FROM orders WHERE o_custkey = ? AND o_orderkey = 1

這個(gè)例子是將一條 SQL 語句拆分成 2 條 SQL 語句，但是拆分后的 2 條 SQL 都可以通過分片鍵進(jìn)行查詢，這樣能保證只需要在單個(gè)分片中完成查詢操作。不論有多少個(gè)分片，也只需要查詢 2個(gè)分片的信息，這樣 SQL 的查詢性能可以得到極大的提升。

通過索引表的方式，雖然存儲(chǔ)上較冗余全表容量小了很多，但是要根據(jù)另一個(gè)分片鍵進(jìn)行數(shù)據(jù)的存儲(chǔ)，依然顯得不夠優(yōu)雅。

因此，最優(yōu)的設(shè)計(jì)，不是創(chuàng)建一個(gè)索引表，而是將分片鍵的信息保存在想要查詢的列中，這樣通過查詢的列就能直接知道所在的分片信息。

如果我們將訂單表 orders 的主鍵設(shè)計(jì)為一個(gè)字符串，這個(gè)字符串中最后一部分包含分片鍵的信息，如：

o_orderkey = string（o_orderkey + o_custkey）

那么這時(shí)如果根據(jù) o_orderkey 進(jìn)行查詢：

SELECT * FROM OrdersWHERE o_orderkey = ‘1000-1’;

由于字段 o_orderkey 的設(shè)計(jì)中直接包含了分片鍵信息，所以我們可以直接知道這個(gè)訂單在分片1 中，直接查詢分片 1 就行。

同樣地，在插入時(shí)，由于可以知道插入時(shí) o_custkey 對應(yīng)的值，所以只要在業(yè)務(wù)層做一次字符的拼接，然后再插入數(shù)據(jù)庫就行了。

這樣的實(shí)現(xiàn)方式較冗余表和索引表的設(shè)計(jì)來說，效率更高，查詢可以提前知道數(shù)據(jù)對應(yīng)的分片信息，只需 1 次查詢就能獲取想要的結(jié)果。

這樣實(shí)現(xiàn)的缺點(diǎn)是，主鍵值會(huì)變大一些，存儲(chǔ)也會(huì)相應(yīng)變大。但只要主鍵值是有序的，插入的性能就不會(huì)變差。而通過在主鍵值中保存分片信息，卻可以大大提升后續(xù)的查詢效率，這樣空間換時(shí)間的設(shè)計(jì)，總體上看是非常值得的。

當(dāng)然，這里我們談的設(shè)計(jì)都是針對于唯一索引的設(shè)計(jì)，如果是非唯一的二級(jí)索引查詢，那么非?？上В廊恍枰獟呙杷械姆制拍艿玫阶罱K的結(jié)果，如：

SELECT * FROM OrdersWHERE o_orderate >= ? o_orderdate < ?

因此，再次提醒你，分布式數(shù)據(jù)庫架構(gòu)設(shè)計(jì)的要求是業(yè)務(wù)的絕大部分請求能夠根據(jù)分片鍵定位到 1 個(gè)分片上。

如果業(yè)務(wù)大部分請求都需要掃描所有分片信息才能獲得最終結(jié)果，那么就不適合進(jìn)行分布式架構(gòu)的改造或設(shè)計(jì)。

最后，我們再來回顧下淘寶用戶訂單表的設(shè)計(jì)：

上圖是我的淘寶訂單信息，可以看到，訂單號(hào)的最后 6 位都是 308113，所以可以大概率推測出：

淘寶訂單表的分片鍵是用戶 ID；
淘寶訂單表，訂單表的主鍵包含用戶 ID，也就是分片信息。這樣通過訂單號(hào)進(jìn)行查詢，可以獲得分片信息，從而查詢 1 個(gè)分片就能得到最終的結(jié)果。

全局表

在分布式數(shù)據(jù)庫中，有時(shí)會(huì)有一些無法提供分片鍵的表，但這些表又非常小，一般用于保存一些全局信息，平時(shí)更新也較少，絕大多數(shù)場景僅用于查詢操作。

例如 tpch 庫中的表 nation，用于存儲(chǔ)國家信息，但是在我們前面的 SQL 關(guān)聯(lián)查詢中，又經(jīng)常會(huì)使用到這張表，對于這種全局表，可以在每個(gè)分片中存儲(chǔ)，這樣就不用跨分片地進(jìn)行查詢了。如下面的設(shè)計(jì)：

唯一索引

最后我們來談?wù)勎ㄒ凰饕脑O(shè)計(jì)，與主鍵一樣，如果只是通過數(shù)據(jù)庫表本身唯一約束創(chuàng)建的索引，則無法保證在所有分片中都是唯一的。

所以，在分布式數(shù)據(jù)庫中，唯一索引一樣要通過類似主鍵的 UUID 的機(jī)制實(shí)現(xiàn)，用全局唯一去替代局部唯一，但實(shí)際上，即便是單機(jī)的 MySQL 數(shù)據(jù)庫架構(gòu)，我們也推薦使用全局唯一的設(shè)計(jì)。因?yàn)槟悴恢?，什么時(shí)候，你的業(yè)務(wù)就會(huì)升級(jí)到全局唯一的要求了。

總結(jié)

今天介紹了非常重要的分布式數(shù)據(jù)庫索引設(shè)計(jì)，內(nèi)容非常干貨，是分布式架構(gòu)設(shè)計(jì)的重中之重，建議反復(fù)閱讀，抓住本文的重點(diǎn)，總結(jié)來說：

分布式數(shù)據(jù)庫主鍵設(shè)計(jì)使用有序 UUID，全局唯一；
分布式數(shù)據(jù)庫唯一索引設(shè)計(jì)使用 UUID 的全局唯一設(shè)計(jì)，避免局部索引導(dǎo)致的唯一問題；
分布式數(shù)據(jù)庫唯一索引若不是分片鍵，則可以在設(shè)計(jì)時(shí)保存分片信息，這樣查詢直接路由到一個(gè)分片即可；
對于分布式數(shù)據(jù)庫中的全局表，可以采用冗余機(jī)制，在每個(gè)分片上進(jìn)行保存。這樣能避免查詢時(shí)跨分片的查詢。

轉(zhuǎn)自：拉鉤教育

鄭重聲明：本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng)，不代表本站立場，版權(quán)歸原作者所有，如有侵權(quán)請聯(lián)系管理員(admin#wlmqw.com)刪除。

業(yè)務(wù)信息全局冗余分布式數(shù)據(jù)庫架構(gòu)淘寶索引訂單

小鵬汽車 P7體驗(yàn)評(píng)測：什么才是智能化座艙？

上一篇 2022年6月28日 17:27

Web3日報(bào)0625：幣安或?qū)⑦M(jìn)行大規(guī)模收購或投資

下一篇 2022年6月28日 17:28

淘寶工廠店的東西是正品嗎？淘寶工廠店為什么便宜
淘工廠直營店其實(shí)就是鏈接淘寶賣家與工廠的平臺(tái)，直接對接工廠型的商家，店鋪里的東西大部分價(jià)格都會(huì)很低。那么，淘工廠直營店靠譜嗎? 淘工廠直營店是靠譜的，但售后問題可能得不到很好的保障…
2022年11月27日
0
計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)論文(計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)論文七千字)
今天小編給各位分享計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)論文的知識(shí)，其中也會(huì)對計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)論文七千字進(jìn)行解釋，如果能碰巧解決你現(xiàn)在面臨的問題，別忘了關(guān)注本站，現(xiàn)在開始吧！計(jì)算機(jī)網(wǎng)絡(luò)方面的論文3000字…
2022年11月26日
0
數(shù)字看亮點(diǎn)！前十月我國造船三大指標(biāo)繼續(xù)全球領(lǐng)先
央視網(wǎng)消息：工業(yè)和信息化部最新數(shù)據(jù)顯示，今年1—10月，我國造船三大指標(biāo)繼續(xù)保持全球領(lǐng)先。隨著生產(chǎn)節(jié)奏加快，船企產(chǎn)業(yè)集中度進(jìn)一步提升。 2022年1—10月，全國造船完工量、新接訂…
2022年11月25日
0
前十個(gè)月我國造船業(yè)三大指標(biāo)穩(wěn)居世界第一
今年1—10月，我國造船業(yè)在國際市場的份額繼續(xù)穩(wěn)居世界第一。一批高技術(shù)高附加值船舶實(shí)現(xiàn)了批量接單、批量生產(chǎn)。近日，中國船舶上海船舶研究設(shè)計(jì)院又新接了韓國船東三艘汽車運(yùn)輸船的設(shè)計(jì)追…
2022年11月25日
0
客服的崗位職責(zé)怎么寫(客服工作內(nèi)容及職責(zé))
各位小伙伴們大家周一好，又到了每周一給大家分享干貨內(nèi)容的時(shí)候啦~ 本期來跟大家分享一下客服工作管理流程以及客服崗位里面的每項(xiàng)職能崗位的核心細(xì)則，也是干貨滿滿推薦收藏~ 一.補(bǔ)償流程…
2022年11月25日
0
商家收到貨才會(huì)退款嗎(淘寶代付款退款錢到哪里了)
在淘寶上有一些人下單購買商品的時(shí)候是通過代付的形式來支付的，一般情況下是家長幫助家里的小孩或者長輩進(jìn)行代付，而代付訂單和普通的訂單沒有太大的區(qū)別，不過如果發(fā)生退款的話，錢是退到哪里…
2022年11月25日
0
英皇文化產(chǎn)業(yè)：結(jié)束全部7間英皇UA電影城經(jīng)營
11月21日，英皇文化產(chǎn)業(yè)發(fā)布公告，英皇娛藝影院（廣東）有限公司（“中國附屬公司”）為英皇UA的全資附屬營運(yùn)公司。董事會(huì)謹(jǐn)此知會(huì)公司股東，于2022年11月21日，英皇UA（作為…
2022年11月24日
0
銳龍97900x參數(shù)規(guī)格跑分評(píng)測銳龍97900x屬于什么檔次
銳龍9 7900X是銳龍7000系列處理器中性能頂尖的型號(hào)之一，它采用了這一代標(biāo)配的zen4架構(gòu)和5nm制程工藝，那么它具體的參數(shù)跑分如何，在電腦上世紀(jì)發(fā)揮怎么樣呢，下面就來看看銳…
2022年11月24日
0
前三季度，市場規(guī)模超過五萬億元信息消費(fèi)展現(xiàn)蓬勃生機(jī)
家居企業(yè)個(gè)性化全屋定制系統(tǒng)，備受消費(fèi)者青睞；主打?qū)I(yè)電競的新款高性能便攜式計(jì)算機(jī)，銷量表現(xiàn)創(chuàng)新高；物流企業(yè)推出數(shù)智化供應(yīng)鏈興農(nóng)服務(wù)項(xiàng)目，助力優(yōu)質(zhì)農(nóng)產(chǎn)品出深山…… 不久前，工信部發(fā)布…
2022年11月24日
0
電商打單是什么意思打單軟件哪個(gè)好
在電商行業(yè)當(dāng)中，打單配貨方式分為前置打單和后置打單。兩者之前其實(shí)是有區(qū)別的，那今天小編就來跟大家說說。一、前置打單和后置打單的區(qū)別一般電商行業(yè)用的打單發(fā)貨的方式其實(shí)都是前置打單…
2022年11月23日
0

聯(lián)系我們

聯(lián)系郵箱：admin#wlmqw.com
工作時(shí)間：周一至周五，10:30-18:30，節(jié)假日休息

<div id="dr3is"></div><span id="dr3is"></span>

<address id="dr3is"><td id="dr3is"></td></address>

<object id="dr3is"><small id="dr3is"></small></object>