在线不卡日本ⅴ一区v二区_精品一区二区中文字幕_天堂v在线视频_亚洲五月天婷婷中文网站

<menu id="lky3g"></menu>

<pre id="lky3g"><tt id="lky3g"></tt></pre>

<td id="ae6br"><menu id="ae6br"><form id="ae6br"></form></menu></td><object id="ae6br"><s id="ae6br"><option id="ae6br"></option></s></object>

<pre id="ae6br"></pre>

<pre id="ae6br"><tt id="ae6br"><rt id="ae6br"></rt></tt></pre>

<object id="ae6br"><button id="ae6br"></button></object>

<address id="ae6br"><var id="ae6br"></var></address>

系統(tǒng)方案 – 設(shè)計一個 URL 短鏈服務(wù)

用戶投稿 ? 2022年6月14日 06:30 ? 社會

關(guān)注轉(zhuǎn)發(fā)，不間斷分享實(shí)戰(zhàn)內(nèi)容。

1. 為什么我們需要 URL 縮短？

短鏈接，通俗來說，就是將長的URL網(wǎng)址，通過程序計算等方式，轉(zhuǎn)換為簡短的網(wǎng)址字符串。

使用場景

微博和Twitter都有140字?jǐn)?shù)的限制，如果分享一個長網(wǎng)址，很容易就超出限制。

營銷短信，字?jǐn)?shù)的限制,當(dāng)字?jǐn)?shù)過長: 1.不美觀 2.超出字符額外收費(fèi)。

生成二維碼的原始鏈接,當(dāng)原始鏈接過長時,生成的二維碼過于復(fù)雜,導(dǎo)致一些像素較低的手機(jī)無法掃描.

2. 設(shè)計目標(biāo)

功能要求：

給定一個 URL，我們的服務(wù)應(yīng)該生成一個更短且唯一的別名。這稱為短鏈接。此鏈接應(yīng)該足夠短，以便輕松復(fù)制并粘貼到應(yīng)用程序中。

當(dāng)用戶訪問短鏈接時，我們的服務(wù)應(yīng)該將他們重定向到原始鏈接。

鏈接支持過期時間設(shè)置。

非功能性要求：

URL 重定向應(yīng)該以最小的延遲實(shí)時發(fā)生。

縮短的鏈接規(guī)則無法預(yù)測。

擴(kuò)展要求：

分析；例如，重定向發(fā)生了多少次？

其他服務(wù)也應(yīng)該可以通過 REST API 訪問我們的服務(wù)。

3.系統(tǒng)API

可以使用 REST API 來公開我們服務(wù)的功能。以下可能是用于創(chuàng)建和刪除 URL 的 API 的定義：

createURL (api_dev_key, original_url, custom_alias=None, user_name=None, expire_date=None)

參數(shù)：

api_dev_key(string)：注冊賬號的API開發(fā)者密鑰。除其他外，這將用于根據(jù)分配的配額限制用戶。

original_url（字符串）：要縮短的原始 URL。

custom_alias（字符串）：URL 的可選自定義鍵。

user_name（字符串）：在編碼中使用的可選用戶名。

expire_date (string): 縮短 URL 的可選過期日期。

返回：（字符串）

成功插入會返回縮短的 URL；否則，它會返回錯誤代碼。

deleteURL (api_dev_key, url_key)

其中“url_key”是一個字符串，表示要檢索的縮短的 URL；成功刪除會返回“已刪除 URL”。

如何發(fā)現(xiàn)和防止濫用？惡意用戶可以通過使用當(dāng)前設(shè)計中的所有 URL 密鑰使我們破產(chǎn)。為了防止濫用，我們可以通過他們的 api_dev_key 限制用戶。每個 api_dev_key 可以限制為每個時間段內(nèi)特定數(shù)量的 URL 創(chuàng)建和重定向（每個開發(fā)者密鑰可以設(shè)置為不同的持續(xù)時間）。

4. 數(shù)據(jù)庫設(shè)計

結(jié)合儲存數(shù)據(jù)設(shè)計：

我們需要存儲數(shù)十億條記錄。

我們存儲的每個對象都很?。ㄐ∮?1K）。

記錄之間沒有關(guān)系——除了存儲哪個用戶創(chuàng)建了一個 URL。

我們的服務(wù)閱讀量很大。

數(shù)據(jù)庫架構(gòu)：

我們需要兩張表：一張用于存儲有關(guān) URL 映射的信息，另一張用于創(chuàng)建短鏈接的用戶數(shù)據(jù)。

應(yīng)該使用什么樣的數(shù)據(jù)庫？由于我們預(yù)計存儲數(shù)十億行，并且我們不需要使用對象之間的關(guān)系——NoSQL 選擇更容易擴(kuò)展

5. 基本系統(tǒng)設(shè)計與算法

在第 1 節(jié)的示例中，縮短的 URL 是“https://tinyurl.com/vzet59pa”。這個 URL 的最后八個字符構(gòu)成了我們要生成的短鏈。討論以下兩種解決方案：摘要算法、自增序列算法

方案一：摘要算法

將長網(wǎng)址 md5 生成 32 位簽名串,分為 4 段, 每段 8 個字節(jié)

對這四段循環(huán)處理, 取 8 個字節(jié), 將他看成 16 進(jìn)制串與 0x3fffffff(30位1) 與操作, 即超過 30 位的忽略處理

這 30 位分成 6 段, 每 5 位的數(shù)字作為字母表的索引取得特定字符, 依次進(jìn)行獲得 6 位字符串

總的 md5 串可以獲得 4 個 6 位串,取里面的任意一個就可作為這個長 url 的短 url 地址

這種算法,雖然會生成4個,但是仍然存在重復(fù)幾率

方案二：自增序列算法

設(shè)置 id 自增，一個 10進(jìn)制 id 對應(yīng)一個 62進(jìn)制的數(shù)值，1對1，也就不會出現(xiàn)重復(fù)的情況。這個利用的就是低進(jìn)制轉(zhuǎn)化為高進(jìn)制時，字符數(shù)會減少的特性。

兩種算法對比

第一種算法的好處就是簡單好理解，永不重復(fù)。但是短碼的長度不固定，隨著 id 變大從一位長度開始遞增。如果非要讓短碼長度固定也可以就是讓 id 從指定的數(shù)字開始遞增就可以了。百度短網(wǎng)址用的這種算法。

6. 數(shù)據(jù)分區(qū)和復(fù)制

為了擴(kuò)展我們的數(shù)據(jù)庫，我們需要對其進(jìn)行分區(qū)，以便它可以存儲有關(guān)數(shù)十億個 URL 的信息。因此，我們需要開發(fā)一種分區(qū)方案，將我們的數(shù)據(jù)劃分并存儲到不同的數(shù)據(jù)庫服務(wù)器中。

一個基于范圍的分區(qū)：我們可以根據(jù)哈希鍵的第一個字母將 URL 存儲在單獨(dú)的分區(qū)中。因此，我們將所有以字母“A”（和“a”）開頭的 URL 哈希鍵保存在一個分區(qū)中，將那些以字母“B”開頭的 URL 哈希鍵保存在另一個分區(qū)中，依此類推。這種方法稱為基于范圍的分區(qū)。我們甚至可以將某些不太頻繁出現(xiàn)的字母組合到一個數(shù)據(jù)庫分區(qū)中。因此，我們應(yīng)該開發(fā)一種靜態(tài)分區(qū)方案，以始終以可預(yù)測的方式存儲/查找 URL。

這種方法的主要問題是它可能導(dǎo)致數(shù)據(jù)庫服務(wù)器不平衡。例如，我們決定將所有以字母“E”開頭的 URL 放入 DB 分區(qū)，但后來我們意識到我們有太多以字母“E”開頭的 URL。

另外基于散列的分區(qū)：在這個方案中，我們獲取我們正在存儲的對象的散列。然后我們根據(jù)哈希計算要使用的分區(qū)。在我們的例子中，我們可以使用“鍵”或短鏈接的哈希值來確定我們存儲數(shù)據(jù)對象的分區(qū)。

我們的散列函數(shù)會將 URL 隨機(jī)分布到不同的分區(qū)中（例如，我們的散列函數(shù)總是可以將任何“鍵”映射到 [1…256] 之間的數(shù)字）。這個數(shù)字將代表我們存儲對象的分區(qū)。

這種方法仍然會導(dǎo)致分區(qū)過載，這可以使用一致哈希解決。

7.緩存

可以緩存經(jīng)常訪問的 URL，結(jié)合緩存中間件例如 Memcached、redis，它可以存儲完整的 URL 及其各自的哈希值。因此，應(yīng)用服務(wù)器在訪問后端存儲之前，可以快速檢查緩存是否具有所需的 URL。

我們應(yīng)該有多少緩存內(nèi)存？我們可以從每天 20% 的流量開始，根據(jù)客戶的使用模式，我們可以調(diào)整我們需要多少緩存服務(wù)器。如上所述，我們需要 170GB 的內(nèi)存來緩存 20% 的日常流量。由于現(xiàn)代服務(wù)器可以擁有 256GB 內(nèi)存，我們可以輕松地將所有緩存放入一臺機(jī)器中。或者，我們可以使用幾個較小的服務(wù)器來存儲所有這些熱門 URL。

哪種緩存驅(qū)逐策略最適合我們的需求？當(dāng)緩存已滿，并且我們想用更新/更熱的 URL 替換鏈接時，我們將如何選擇？最近最少使用 (LRU) 可能是我們系統(tǒng)的合理策略。根據(jù)此政策，會首先丟棄最近最少使用的 URL，可以使用 Linked Hash Map 或類似的數(shù)據(jù)結(jié)構(gòu)來存儲我們的 URL 和哈希，這也將跟蹤最近訪問過的 URL。

如何更新每個緩存副本？每當(dāng)緩存未命中時，我們的服務(wù)器就會訪問后端數(shù)據(jù)庫。每當(dāng)發(fā)生這種情況時，我們都可以更新緩存并將新條目傳遞給所有緩存副本。每個副本都可以通過添加新條目來更新其緩存。如果副本已經(jīng)有該條目，它可以簡單地忽略它。

8.負(fù)載均衡器（LB）

我們可以在系統(tǒng)的三個地方添加負(fù)載均衡層：

客戶端和應(yīng)用服務(wù)器之間

應(yīng)用服務(wù)器和數(shù)據(jù)庫服務(wù)器之間

應(yīng)用服務(wù)器和緩存服務(wù)器之間

9. 清除或數(shù)據(jù)庫清理

條目應(yīng)該永遠(yuǎn)存在，還是應(yīng)該被清除？如果達(dá)到用戶指定的過期時間，鏈接會發(fā)生什么？

如果我們選擇不斷搜索過期鏈接來刪除它們，這會給我們的數(shù)據(jù)庫帶來很大的壓力。相反，我們可以慢慢刪除過期鏈接并進(jìn)行惰性清理。我們的服務(wù)會確保只刪除過期的鏈接。

每當(dāng)用戶嘗試訪問過期鏈接時，我們都可以刪除該鏈接并向用戶返回錯誤。
可以定期運(yùn)行單獨(dú)的清理服務(wù)，以從我們的存儲和緩存中刪除過期鏈接。該服務(wù)應(yīng)該非常輕量級，并且僅在預(yù)計用戶流量較低時才運(yùn)行。
可以為每個鏈接設(shè)置一個默認(rèn)的過期時間（例如，兩年）。
刪除過期鏈接后，我們可以將密鑰放回密鑰數(shù)據(jù)庫中以供重復(fù)使用。
我們是否應(yīng)該刪除在一段時間內(nèi)（比如六個月）未訪問過的鏈接？這可能很棘手。由于存儲變得越來越便宜，我們可以決定永遠(yuǎn)保持鏈接。

10. 安全和權(quán)限

用戶能否創(chuàng)建私有 URL 或允許一組特定用戶訪問 URL？

可以將權(quán)限級別（公共/私有）與數(shù)據(jù)庫中的每個 URL 一起存儲，還可以創(chuàng)建一個單獨(dú)的表來存儲有權(quán)查看特定 URL 的 UserID。如果用戶沒有權(quán)限并嘗試訪問 URL，可以發(fā)回錯誤 (HTTP 401)。鑒于我們將數(shù)據(jù)存儲在像 Cassandra 這樣的 NoSQL 寬列數(shù)據(jù)庫中，表存儲權(quán)限的鍵將是“哈?！保ɑ?KGS 生成的“鍵”）。這些列將存儲那些有權(quán)查看 URL 的用戶的用戶 ID。

鄭重聲明：本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng)，不代表本站立場，版權(quán)歸原作者所有，如有侵權(quán)請聯(lián)系管理員(admin#wlmqw.com)刪除。

分區(qū)字母字符串密鑰數(shù)據(jù)庫方案服務(wù)器用戶算法系統(tǒng)緩存鏈接

研究表明，為期2周的干預(yù)可能會改變?nèi)说男愿?/span>

上一篇 2022年6月14日 06:29

新華全媒+｜你所好奇的農(nóng)機(jī)“黑科技”都在這里

下一篇 2022年6月14日 06:30

ios手游模擬器(手游模擬器ios)
本文主要講的是ios手游模擬器，以及和手游模擬器ios相關(guān)的知識，如果覺得本文對您有所幫助，不要忘了將本文分享給朋友。哪個iOS模擬器能多開手游賬號？可以推薦個好用的模擬器給我嗎…
2022年11月27日
0
短視頻策劃內(nèi)容的3個要點(diǎn)(短視頻策劃內(nèi)容怎么做)
短視頻在制作時，內(nèi)容框架非常重要。如果直奔主題，然后結(jié)束，聚卓告訴你，這樣的短視頻已經(jīng)過時了?，F(xiàn)在的短視頻需要框架的，但不是任何框架，它需要一種易于理解和消化的框架。而且，現(xiàn)在大多…
2022年11月27日
0
美團(tuán)第三季度實(shí)現(xiàn)營收626億元，即時配送訂單量增至50億筆
新京報訊（記者秦勝南）11月25日，美團(tuán)發(fā)布業(yè)績公告顯示，第三季度營收為626億元，較去年同比增長28.2%，凈利潤為12.2億元。第三季度，美團(tuán)即時配送訂單數(shù)增長至50億筆。截至…
2022年11月27日
0
個人怎么做抖音帶貨(個人做抖音帶貨能賺錢嗎)
抖音如今是大家很熟悉的短視頻平臺，不過現(xiàn)在的抖音卻不只是短視頻那么簡單，它的功能非常豐富，其中一個就是可以帶貨，相信很多小伙伴都有在抖音上買過東西，抖音如今的變現(xiàn)能力也是不容小覷的…
2022年11月25日
0
《萬里歸途》密鑰延期至12月31日目前票房15.65億
11月22日，由饒曉志執(zhí)導(dǎo)，張譯、王俊凱、殷桃主演的電影《萬里歸途》宣布密鑰將延期至12月31日。《萬里歸途》宣布密鑰將延期至12月31日。據(jù)燈塔專業(yè)版數(shù)據(jù)，該片上映54天，票…
2022年11月25日
0
小紅書平臺的一些機(jī)制及玩法詳解(小紅書玩法有哪些)
關(guān)于小紅書一：小紅書平臺的一些機(jī)制 1. 筆記內(nèi)容的CES評分機(jī)制 2. 筆記流量入口與長尾效應(yīng) 二：小紅書優(yōu)質(zhì)筆記的特點(diǎn)（分維度、類型分析） 1.筆記的本身架構(gòu)組成維度 2.…
2022年11月25日
0
百度關(guān)鍵詞快速排名的4大原理解析(百度怎么刷關(guān)鍵詞)
近期百度公告驚雷算法2.0，升級之快還是第一次吧，看來百度對于刷點(diǎn)擊行為是零容忍了。之前尹華峰SEO技術(shù)博客介紹過一篇如何使用刷點(diǎn)擊工具，其實(shí)市面上有很多這類SEO快速排名的軟件，…
2022年11月25日
0
博客營銷的3大優(yōu)勢解析(博客營銷怎么做)
不知不覺已經(jīng)寫了24篇文章，加上這篇是第25篇了，都是自己這幾年來用過的營銷方法，如果遇到有些不懂的，我會咨詢我的朋友和同事幫忙，盡量讓每一篇有價值，哪怕是對大家有一點(diǎn)點(diǎn)幫助也行，…
2022年11月25日
0
直播帶貨詳細(xì)腳本(直播文案策劃怎么寫)
短視頻運(yùn)營策劃方案怎么寫？涉及哪幾個方面？我在網(wǎng)上看到好多千篇一律的文章，關(guān)于【短視頻運(yùn)營策劃方案】這一塊，基本都是在講賬號的內(nèi)容本身。你內(nèi)容做得再好，卻不掌握算法的規(guī)律，能有…
2022年11月25日
0
淘寶直播開通后帶貨鏈接怎么做(淘寶直播需要開通淘寶店鋪嗎)
直播帶貨無論是對于商家來說還是主播收益都是非?？捎^的，所以不少平臺都有直播帶貨功能，一些小伙伴也想加入淘寶直播，那么淘寶直播開通后帶貨鏈接怎么做？下面小編為大家?guī)硖詫氈辈ラ_通后帶…
2022年11月24日
0

聯(lián)系我們

聯(lián)系郵箱：admin#wlmqw.com
工作時間：周一至周五，10:30-18:30，節(jié)假日休息

<pre id="3kw0f"><tt id="3kw0f"><option id="3kw0f"></option></tt></pre>