在线不卡日本ⅴ一区v二区_精品一区二区中文字幕_天堂v在线视频_亚洲五月天婷婷中文网站

  • <menu id="lky3g"></menu>
  • <style id="lky3g"></style>
    <pre id="lky3g"><tt id="lky3g"></tt></pre>

    人工智能書單之(4)自然語(yǔ)言處理(上)

    人工智能三大應(yīng)用方向:CV,NLP和數(shù)據(jù)挖掘,NLP不論從理論上,還是應(yīng)用的廣泛度上都具有重要的地位,在目前AI飛速發(fā)展,機(jī)器人技術(shù)不斷進(jìn)步的今天,到處都會(huì)看到語(yǔ)音識(shí)別,智能語(yǔ)音交互,機(jī)器人問答等語(yǔ)音應(yīng)用,這部分的理論基礎(chǔ)就是NLP(自然語(yǔ)言處理)。

    自然語(yǔ)言處理作為AI的一大分支,和計(jì)算機(jī)視覺方向一樣,也得益于大數(shù)據(jù)和芯片計(jì)算能力的突破性發(fā)展,更多的訓(xùn)練樣本和更快的計(jì)算速度,使得深度學(xué)習(xí)能夠把語(yǔ)音識(shí)別的準(zhǔn)確率提高到非常接近人類識(shí)別能力的水平,飛快的推進(jìn)了NLP的實(shí)際應(yīng)用的普及,從而推動(dòng)NLP理論和算法的進(jìn)一步研究和開發(fā)。

    說清楚NLP的技術(shù)脈絡(luò)和學(xué)習(xí)路徑,其實(shí)并不復(fù)雜,簡(jiǎn)單梳理下就是如下思路:

    數(shù)字信號(hào)處理=》語(yǔ)音信號(hào)處理=》語(yǔ)音識(shí)別與合成=》自然語(yǔ)言處理=》自然語(yǔ)言處理實(shí)用框架(Python和深度學(xué)習(xí))=》預(yù)訓(xùn)練模型=》文本挖掘=》NLP項(xiàng)目實(shí)戰(zhàn)

    1. 數(shù)字信號(hào)處理:

    之所以要從信號(hào)處理入手,在于自然語(yǔ)言的理解當(dāng)然要基于對(duì)于語(yǔ)言的輸入進(jìn)行處理,CV主要處理視頻和圖像信號(hào),而語(yǔ)音和文本的信號(hào)處理,則需要?dú)w類于自然語(yǔ)言理解的范疇。

    2. 語(yǔ)音信號(hào)處理:

    語(yǔ)音部分是自然語(yǔ)言處理的主要場(chǎng)景,所以需要先針對(duì)語(yǔ)音信號(hào)進(jìn)行處理,包括規(guī)整,濾波,消除噪音等技術(shù)。

    3. 語(yǔ)音識(shí)別與合成:

    語(yǔ)音識(shí)別和語(yǔ)音合成是兩個(gè)話題,但經(jīng)常會(huì)合在一起提及,語(yǔ)音識(shí)別主要用來通過對(duì)音頻的輸入的信號(hào)分析,包括頻率,音色等特征,來識(shí)別出語(yǔ)音的特質(zhì)模型來,一方面可以識(shí)別出其中說的是啥內(nèi)容,一方面可以識(shí)別是誰(shuí)說的,都是可以利用統(tǒng)計(jì)學(xué)習(xí),機(jī)器學(xué)習(xí)的技術(shù)方法通過模型分析和學(xué)習(xí)訓(xùn)練達(dá)到識(shí)別的效果。

    語(yǔ)音合成則是另一個(gè)方向,就是如何把機(jī)器需要表達(dá)的內(nèi)容合成人聲,如何更接近于人的表達(dá)習(xí)慣和說話方式,這在與機(jī)器與人交互方面意義重大。

    4. 自然語(yǔ)言處理(NLP)

    這是個(gè)廣義的概念,包括了從語(yǔ)音,文本的識(shí)別處理,分詞分句,語(yǔ)義的分析和理解,語(yǔ)言模型的建立,語(yǔ)言的合成等各個(gè)方面的技術(shù),所有跟語(yǔ)言相關(guān)的都可以歸類于NLP技術(shù)。所以這個(gè)是本部分學(xué)習(xí)的重點(diǎn)部分。

    5. NLP框架

    有理論和算法,還需要學(xué)習(xí)如何實(shí)踐和實(shí)際應(yīng)用,目前主流的語(yǔ)言工具是Python,用到比較多,框架也包括深度學(xué)習(xí)等在NLP領(lǐng)域的應(yīng)用。

    6. 預(yù)訓(xùn)練模型

    預(yù)訓(xùn)練模型是近年來由于BERT模型的出現(xiàn)而形成的革命性的語(yǔ)言處理方式,在BERT之后又衍生出很多預(yù)訓(xùn)練模型,需要專門研究下。

    7. 文本挖掘

    之前重點(diǎn)在于語(yǔ)音信號(hào)的處理,也就是音頻數(shù)據(jù),對(duì)于另一類語(yǔ)言載體,文本數(shù)據(jù)如何處理,識(shí)別,理解,語(yǔ)義分析等,是這部分專題要涉及的話題

    8. NLP項(xiàng)目實(shí)戰(zhàn)

    掌握了理論和工具后,可以進(jìn)一步通過學(xué)習(xí)掌握如何實(shí)戰(zhàn),如何實(shí)際開發(fā)項(xiàng)目了。

    接下來的文章里會(huì)根據(jù)上面的學(xué)習(xí)途徑,逐一介紹和推薦經(jīng)典學(xué)習(xí)的書單和教程書籍,大家也可以在了解完整體系框架的基礎(chǔ)上,自己通過關(guān)鍵詞搜索經(jīng)典書籍買來學(xué)習(xí)。

    未完待續(xù)。。。

    鄭重聲明:本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng),不代表本站立場(chǎng),版權(quán)歸原作者所有,如有侵權(quán)請(qǐng)聯(lián)系管理員(admin#wlmqw.com)刪除。
    用戶投稿
    上一篇 2022年7月3日 22:03
    下一篇 2022年7月3日 22:03

    相關(guān)推薦

    聯(lián)系我們

    聯(lián)系郵箱:admin#wlmqw.com
    工作時(shí)間:周一至周五,10:30-18:30,節(jié)假日休息