在线不卡日本ⅴ一区v二区_精品一区二区中文字幕_天堂v在线视频_亚洲五月天婷婷中文网站

<menu id="lky3g"></menu>

<pre id="lky3g"><tt id="lky3g"></tt></pre>

<address id="0ps9i"><strike id="0ps9i"><form id="0ps9i"></form></strike></address>

<span id="0ps9i"><strike id="0ps9i"></strike></span>

正則表達(dá)式應(yīng)該怎么學(xué)？

用戶投稿 ? 2022年7月27日 09:22 ? 社會(huì)

學(xué)習(xí)正則表達(dá)式最好的方式是讀《精通正則表達(dá)式》這本書：

《精通正則表達(dá)式》

建議認(rèn)真學(xué)完前6章，后面與具體編程語(yǔ)言相關(guān)的可以跳過?；ㄒ恍r(shí)間系統(tǒng)地學(xué)習(xí)一下正則表達(dá)式是非常有好處的。就像張無忌學(xué)會(huì)九陽(yáng)神功后學(xué)其他武功都特別快，學(xué)會(huì)正則表達(dá)式后再學(xué)習(xí)UNIX/Linux的下的工具也都特別快！

除了推薦書籍，我也分享一下我自己讀寫正則表達(dá)式的心得。

如何讀正則表達(dá)式？

《精通正則表達(dá)式》這本書讓我認(rèn)識(shí)到，正則表達(dá)式只是一種描述字符串長(zhǎng)什么樣的聲明式語(yǔ)言，是字符串的元信息。就像SQL是用來描述數(shù)據(jù)長(zhǎng)什么樣的聲明式語(yǔ)言，只是SQL使用更直觀的英文單詞作為關(guān)鍵詞，而正則表達(dá)式使用的是更加精煉但也更加晦澀的符號(hào)字符。

所以，學(xué)習(xí)正則表達(dá)式與學(xué)習(xí)其他語(yǔ)言的過程是一樣的，需要學(xué)會(huì)這門語(yǔ)言的詞法、語(yǔ)法、語(yǔ)義。如果對(duì)這些詞法、語(yǔ)法、語(yǔ)義不熟悉，看正則表達(dá)式就像天書一樣。

詞法

如前文所述，正則表達(dá)式的單詞由標(biāo)點(diǎn)符號(hào)字符組成。和漢語(yǔ)、英語(yǔ)等自然語(yǔ)言一樣，這些單詞也有詞性，包括字符（character）、字符類（character class）、分組（grouping）、量詞（quantifier）、錨點(diǎn)（Anchor）等。

想要一股腦記住所有符號(hào)及其含義，就像從頭到尾背英語(yǔ)詞典一樣，是很低效且痛苦的。好在正則表達(dá)式的單詞也符合2-8法則，就像英語(yǔ)里的常用詞一樣并不多，諸如零寬斷言等用法其實(shí)不太常用，用到的時(shí)候臨時(shí)查文檔復(fù)習(xí)一下用法就行。

以下幾個(gè)字符是最最常用的元字符：

單詞	詞性	語(yǔ)義
^	錨點(diǎn)	以……開頭
$	錨點(diǎn)	以……結(jié)尾
.	字符集	任意字符
*	量詞	任意多個(gè)
+	量詞	1個(gè)或多個(gè)
?	量詞	0個(gè)或1個(gè)

需要注意的是，除了惰性匹配的量詞，其他量詞默認(rèn)都是貪心匹配，即盡可能多地匹配、直到無法匹配為止。

語(yǔ)法

正則表達(dá)式的語(yǔ)法并不多，除了要開閉括號(hào)要能一一對(duì)應(yīng)，也就是量詞只能放在字符、字符集、分組的后面。

示例

舉個(gè)例子：

/^ab+c*$/

該模式讀作：“有一些字符串，它們以1個(gè)a開頭，緊接著1個(gè)或多個(gè)b，最后以任意多個(gè)c結(jié)尾?！狈线@個(gè)規(guī)則的字符串很多，有“ab”、“abc”、“abbccc”等等。

如何寫正則表達(dá)式？

有了前文讀正則表達(dá)式的基礎(chǔ)，基本上也能照葫蘆畫瓢寫正則表達(dá)式了，但新手在寫正則表達(dá)式的時(shí)候往往容易忽略“上下文”，會(huì)寫出非常具體、非常長(zhǎng)的模式。因?yàn)檎齽t表達(dá)式的主要用途就是用于文本匹配，所謂的“上下文”就是正則表達(dá)式預(yù)計(jì)在那些文本中匹配。上下文不同，解法也可以不同。

舉個(gè)例子，一個(gè)爬蟲爬取到以下HTML頁(yè)面信息：

Home

Friends

Bob
William
Vina

假設(shè)希望在這些內(nèi)容中匹配出包含「朋友姓名」的行，比較簡(jiǎn)單的方式有：

/class=”name”/

還能更簡(jiǎn)潔一些：

/name/

或者更具體一些：

/[^]+/

這三種方式哪種最好呢？這個(gè)得視情況而定。我的建議是：

如果數(shù)據(jù)來源比較可控，例如內(nèi)部系統(tǒng)生成的數(shù)據(jù)，則盡量寫簡(jiǎn)單有效的模式；

如果數(shù)據(jù)來源不可控，例如網(wǎng)絡(luò)爬蟲從外部系統(tǒng)抓取的數(shù)據(jù)，內(nèi)容隨時(shí)都有可能發(fā)生變化，那適度地優(yōu)化一下正則表達(dá)式，讓模式具備一些彈性去適應(yīng)可預(yù)見的一些變化。

如果讓我來寫這個(gè)例子的正則表達(dá)式，我會(huì)傾向于這樣寫：

/class=”[^”]*bnameb[^”]*”/

這樣既具備一定的彈性，例如未來添加了其他class，或li換成其他tag，都能自動(dòng)適應(yīng)；又不會(huì)過于復(fù)雜。

綜上所述，正則表達(dá)式并沒有唯一的標(biāo)準(zhǔn)答案，需要根據(jù)待匹配文本的上下文選擇復(fù)雜度最合適的方案。因此，寫正則表達(dá)式時(shí)不用著急，不必要求自己一次就寫對(duì)。應(yīng)該像寫SQL一樣在數(shù)據(jù)集上多select幾次，對(duì)數(shù)據(jù)集有了較全面的認(rèn)知后，不斷修正數(shù)據(jù)過濾條件，就能優(yōu)化出比較精煉的SQL；同樣的，寫正則表達(dá)式也是在目標(biāo)字符串上反復(fù)篩選，最后就能優(yōu)化出比較精煉的模式。

鄭重聲明：本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng)，不代表本站立場(chǎng)，版權(quán)歸原作者所有，如有侵權(quán)請(qǐng)聯(lián)系管理員(admin#wlmqw.com)刪除。

上下文前文字符字符串數(shù)據(jù)模式詞法語(yǔ)義語(yǔ)法量詞

電池占整車成本高達(dá)60%！車企董事長(zhǎng)叫苦給電池企業(yè)打工背后：新能源汽車產(chǎn)業(yè)鏈成本“壓力山大”

上一篇 2022年7月27日 09:22

小米上架黃金版的小米手環(huán)6 NFC版本，最高售價(jià)超2500元

下一篇 2022年7月27日 09:22

英雄聯(lián)盟手游好玩嗎(英雄聯(lián)盟手游好玩還是端游好玩)
簡(jiǎn)要回答非常好玩，英雄聯(lián)盟手游這款游戲已經(jīng)正式的進(jìn)行公測(cè)，這款游戲是以5v5為模式進(jìn)行對(duì)戰(zhàn)的，它是以英雄聯(lián)盟端游為原型進(jìn)行開發(fā)，里面的每一種玩法基本都沿襲了端游的特點(diǎn)。 01 這…
2022年11月25日
0
什么是推廣cpa一篇文章帶你看懂CPA推廣渠道
CPA渠道 CPA指的是按照指定的行為結(jié)算，可以是搜索，可以是注冊(cè)，可以是激活，可以是搜索下載激活，可以是綁卡，實(shí)名認(rèn)證，可以是付費(fèi)，可以是瀏覽等等。甲乙雙方可以根據(jù)自己的情況來定…
2022年11月25日
0
抖音直播帶貨有哪些方法技巧(抖音直播帶貨有哪些痛點(diǎn))
如今抖音這個(gè)短視頻的變現(xiàn)能力越來越突顯了，尤其是在平臺(tái)上開通直播，更具有超強(qiáng)的帶貨屬性，已經(jīng)有越來越多的普通人加入到其中了。不過直播帶貨雖然很火，但是也不是每個(gè)人都能做好的，那么在…
2022年11月24日
0
明查｜美國(guó)新冠后遺癥患者中有16%癥狀嚴(yán)重以致無法工作？
點(diǎn)擊進(jìn)入澎湃新聞全球事實(shí)核查平臺(tái) 速覽 – 網(wǎng)傳數(shù)據(jù)比例無權(quán)威信源佐證，該比例有可能是結(jié)合了美國(guó)疾病防控中心和布魯金斯學(xué)會(huì)的數(shù)據(jù)得出，但這兩個(gè)機(jī)構(gòu)的調(diào)研目的和樣本都不同…
2022年11月24日
0
抖音怎么帶貨賺傭金(抖音怎么視頻帶鏈接)
現(xiàn)在直播帶貨很火，而如今無論是自媒體還是短視頻，大家都可以通過帶貨來賺錢，只要你有貨源渠道，就可以通過帶貨來賺取傭金。如果你想要做帶貨傭金的話，你可以了解相關(guān)技能，例如，你必須與企…
2022年11月22日
0
劉慈欣親自解讀“黑暗森林”；《云頂之弈》全球總決賽XunGe奪冠丨每日B報(bào)
星彡P(guān)丨文每日一圖早期帕底亞學(xué)生捕捉海地鼠的珍貴視頻，請(qǐng)自行搭配BGM《只因你太美》。劉慈欣解讀“黑暗森林” 《三體》動(dòng)畫將于12月3日開播，官方發(fā)布了一段預(yù)熱視頻，并邀請(qǐng)到…
2022年11月22日
0
我的世界指令創(chuàng)造(我的世界指令創(chuàng)造生存)
只有允許作弊的地圖才可以用指令將世界切換到創(chuàng)造模式具體步驟如下1首先在地圖的選項(xiàng)界面，將地圖允許作弊按鈕打開2進(jìn)入該可以作弊的地圖后，按下鍵盤上的~鍵，在彈出的對(duì)話框中，輸入ga…
2022年11月20日
0
淘寶運(yùn)營(yíng)數(shù)據(jù)分析的3個(gè)指標(biāo)解析(運(yùn)營(yíng)數(shù)據(jù)分析怎么做)
我們知道淘寶運(yùn)營(yíng)工作中對(duì)于數(shù)據(jù)的分析與整理是很重要的，這些工作乍一聽可能比較難，但是也有一些相關(guān)的技巧可以讓我們能夠有效的找出對(duì)我們有用的數(shù)據(jù)，這樣我們也能夠更加直觀的看出我們店鋪…
2022年11月20日
0
1公頃等于多少平方千米(公頃等于多少平方米)
四年級(jí)數(shù)學(xué)上冊(cè)第二單元公頃和平方千米一、換算進(jìn)率 1平方千米= 100公頃=1000000 平方米 1公頃= 10000平方米 1平方米=100平方分米 1平方分米= 100平…
2022年11月18日
0
微信緩存是什么清理微信的緩存會(huì)不會(huì)清除聊天記錄？
軟件使用的越久，產(chǎn)生的緩存垃圾也就越多。但是很多朋友不敢清理微信的緩存，怕把聊天記錄一并清理了。那么清理微信緩存會(huì)不會(huì)刪除聊天記錄？想知道答案的小伙伴就跟小編一起來看看吧！清理微…
2022年11月18日
0

聯(lián)系我們

聯(lián)系郵箱：admin#wlmqw.com
工作時(shí)間：周一至周五，10:30-18:30，節(jié)假日休息

<strike id="vyheo"><small id="vyheo"></small></strike>