在线不卡日本ⅴ一区v二区_精品一区二区中文字幕_天堂v在线视频_亚洲五月天婷婷中文网站

  • <menu id="lky3g"></menu>
  • <style id="lky3g"></style>
    <pre id="lky3g"><tt id="lky3g"></tt></pre>

    利用Python來配合Google來收集信息

    大家都知道,在進(jìn)行滲透測(cè)試最重要的一個(gè)環(huán)節(jié)就是信息收集。說到信息收集怎么能不讓能聯(lián)想到谷歌以及谷歌語法呢?如果是人工的搜索并且提取相關(guān)信息無疑是一個(gè)工作量很大的一個(gè)事情。并且也是相當(dāng)浪費(fèi)時(shí)間的一個(gè)事情。那么我們?nèi)绾慰焖俚厝コ恍?span id="35rdr0b" class="wpcom_tag_link">重復(fù)性工作呢?通過代碼語言無疑是我們一個(gè)很好的選擇,接下來我將介紹使用Python3 + Selenium + pymysql + Google來完成這樣一個(gè)重復(fù)性任務(wù)。下面我們將以提取站點(diǎn)域名以及URL為例。

    首先我先介紹一下Selenium庫以及pymysql是什么?Python3 以及Google我就不贅述了。簡(jiǎn)單地說明一下,selenium 是一個(gè)用于Web應(yīng)用程序測(cè)試的工具。Selenium測(cè)試直接運(yùn)行在瀏覽器中,就像真正的用戶在操作一樣。那么我們可以利用該庫去操作WEB瀏覽器。pymysql 是python3當(dāng)中操控數(shù)據(jù)庫的一個(gè)組件。

    下面我們來分析,我們需要利用Selenium來自動(dòng)運(yùn)行WEB瀏覽器。我們需要在瀏覽器上做什么樣的操作呢?輸入谷歌url,在谷歌搜索欄輸入谷歌語法,然后提取我們需要的內(nèi)容。對(duì)不對(duì)?好的,那么我們腦子里面已經(jīng)有了一個(gè)初步的概念。接下來,我們需要做的是告訴Selenium我們的想法,并且它需要做的事情。接下來,我們來看下面的代碼:

    #提取數(shù)據(jù)class driver_1(object): def __init__(self): self.driver = webdriver.Chrome(‘D:chromedriver_win32chromedriver.exe’) #訪問谷歌,搜索信息 def logload_Chrome(self,search): self.driver.get(‘https://www.google.com/’) #定位搜索欄位置 Search = self.driver.find_element_by_name(‘q’) self.driver.implicitly_wait(30) Search.send_keys(search) Search.send_keys(Keys.ENTER) #提取站點(diǎn)信息 def Search_site(self,site,num): dict_name_url = {} now_site = ‘site:’ + ”’ + site + ”’ self.logload_Chrome(now_site) #提取url和name for a in range(0,num): if a > 0 and a a[href]’) i = 0 while i a[href]’) i = 0 while i < len(Result_name): dict_name_url[str(Result_name[i].text)] = str(Result_url[i].get_attribute('href')) i += 1 return dict_name_url

    上述代碼的作用是:登錄谷歌并且輸入搜索內(nèi)容,并且通過循環(huán)來提取Google搜索出來的內(nèi)容。

    當(dāng)我們順利地提取出內(nèi)容的時(shí)候就可以將內(nèi)容放入數(shù)據(jù)庫。這個(gè)時(shí)候,我們需要利用到pymysql庫。通過它我們可以操控?cái)?shù)據(jù)庫。詳細(xì)情況請(qǐng)看下面代碼:

    #保存數(shù)據(jù)信息class Save_to_DB(object): #鏈接出入數(shù)據(jù) def connect(self,i,key,value): conn = pymysql.connect( host = ‘localhost’, user = ‘root’, password = ‘Password@2020’, database = ‘suda’ ) #創(chuàng)建游標(biāo)對(duì)象 cursor = conn.cursor() try: cursor.execute(“insert into information_site_suda values(%s,’%s’,’%s’);” %(int(i),key,value)) conn.commit() conn.close() except: conn.ping() cursor = conn.cursor() cursor.execute(“insert into information_site values(%s,’%s’,’%s’);” % (int(i), key, value)) conn.commit() conn.close()

    上述代碼的作用是將查詢出來的數(shù)據(jù)存放入數(shù)據(jù)庫當(dāng)中。

    既然功能模塊已經(jīng)實(shí)現(xiàn),接下來就是調(diào)用了。詳細(xì)代碼可以查看附件(注意:中的一些部分需要修改才能運(yùn)行,不如,MYSQL數(shù)據(jù)庫名等等)。該文章或許一些人看不懂。沒有關(guān)系,文章當(dāng)中的模塊可以自己學(xué)習(xí)并不難。主要是希望各位了解到盡量不要去做重復(fù)性的勞動(dòng)。學(xué)會(huì)利用工具。我一直認(rèn)為代碼功底是區(qū)分腳本小子和大牛的分水線。請(qǐng)各位一起加油?。?!

    鄭重聲明:本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng),不代表本站立場(chǎng),版權(quán)歸原作者所有,如有侵權(quán)請(qǐng)聯(lián)系管理員(admin#wlmqw.com)刪除。
    用戶投稿
    上一篇 2022年6月13日 06:10
    下一篇 2022年6月13日 06:10

    相關(guān)推薦

    • 破案了!李鐵被帶走細(xì)節(jié)曝光,始作俑者是武漢卓爾

      前幾天,前國家隊(duì)主帥李鐵突然被帶走的事情引發(fā)了球迷們的熱議,針對(duì)這個(gè)事情,外界的猜測(cè)有很多個(gè)版本,而這其中媒體人冉雄飛的說法可能是最為權(quán)威的?,F(xiàn)在他針對(duì)這個(gè)事情繼續(xù)進(jìn)行爆料,透露了…

      2022年11月27日
    • 短視頻策劃內(nèi)容的3個(gè)要點(diǎn)(短視頻策劃內(nèi)容怎么做)

      短視頻在制作時(shí),內(nèi)容框架非常重要。如果直奔主題,然后結(jié)束,聚卓告訴你,這樣的短視頻已經(jīng)過時(shí)了?,F(xiàn)在的短視頻需要框架的,但不是任何框架,它需要一種易于理解和消化的框架。而且,現(xiàn)在大多…

      2022年11月27日
    • 計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)論文(計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)論文七千字)

      今天小編給各位分享計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)論文的知識(shí),其中也會(huì)對(duì)計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)論文七千字進(jìn)行解釋,如果能碰巧解決你現(xiàn)在面臨的問題,別忘了關(guān)注本站,現(xiàn)在開始吧! 計(jì)算機(jī)網(wǎng)絡(luò)方面的論文3000字…

      2022年11月26日
    • 卿卿日常暗殺嫡長(zhǎng)主的兇手是誰 幕后兇手有什么目的解析

      《卿卿日?!氛跓岵ブ?,該劇唯一一對(duì)觀眾不看好的情侶,就是嫡長(zhǎng)主和郝葭,那么暗殺嫡長(zhǎng)主的兇手是誰?兇手有什么目的?下面一起來了解下吧! 卿卿日常暗殺嫡長(zhǎng)主的兇手是誰 平時(shí)嫡長(zhǎng)主在朝…

      2022年11月25日
    • 小紅書平臺(tái)的一些機(jī)制及玩法詳解(小紅書玩法有哪些)

      關(guān)于小紅書 一:小紅書平臺(tái)的一些機(jī)制 1. 筆記內(nèi)容的CES評(píng)分機(jī)制 2. 筆記流量入口與長(zhǎng)尾效應(yīng) 二:小紅書優(yōu)質(zhì)筆記的特點(diǎn)(分維度、類型分析) 1.筆記的本身架構(gòu)組成 維度 2.…

      2022年11月25日
    • 什么是推廣cpa一篇文章帶你看懂CPA推廣渠道

      CPA渠道 CPA指的是按照指定的行為結(jié)算,可以是搜索,可以是注冊(cè),可以是激活,可以是搜索下載激活,可以是綁卡,實(shí)名認(rèn)證,可以是付費(fèi),可以是瀏覽等等。甲乙雙方可以根據(jù)自己的情況來定…

      2022年11月25日
    • 博客營(yíng)銷的3大優(yōu)勢(shì)解析(博客營(yíng)銷怎么做)

      不知不覺已經(jīng)寫了24篇文章,加上這篇是第25篇了,都是自己這幾年來用過的營(yíng)銷方法,如果遇到有些不懂的,我會(huì)咨詢我的朋友和同事幫忙,盡量讓每一篇有價(jià)值,哪怕是對(duì)大家有一點(diǎn)點(diǎn)幫助也行,…

      2022年11月25日
    • 什么是內(nèi)容營(yíng)銷策略如何策劃一套成功的內(nèi)容營(yíng)銷策略

      很多時(shí)候,營(yíng)銷人員會(huì)在創(chuàng)作營(yíng)銷內(nèi)容時(shí)感到沮喪,這也是很多企業(yè)至今沒用好數(shù)字化營(yíng)銷工具的重要原因之一。 舉個(gè)例子,您可能會(huì)花上數(shù)小時(shí)期待制作一些令人驚嘆的東西,實(shí)際卻是得到很少的受眾…

      2022年11月25日
    • 直播帶貨詳細(xì)腳本(直播文案策劃怎么寫)

      短視頻運(yùn)營(yíng)策劃方案怎么寫?涉及哪幾個(gè)方面? 我在網(wǎng)上看到好多千篇一律的文章,關(guān)于【短視頻運(yùn)營(yíng)策劃方案】這一塊,基本都是在講賬號(hào)的內(nèi)容本身。 你內(nèi)容做得再好,卻不掌握算法的規(guī)律,能有…

      2022年11月25日
    • 閑魚上怎么賣東西快?閑魚賺錢必知技巧(怎么在閑魚里面賣東西)

      自從閑魚這個(gè)平臺(tái)出現(xiàn)以后,隨著這些年的發(fā)展,閑魚也成為了很多人開店賺錢的重要途徑。一些新人也想在閑魚上試試水,看看能不能賺到錢。如今閑魚上既可以賣二手閑置物品,也可以賣一些新品,那…

      2022年11月25日

    聯(lián)系我們

    聯(lián)系郵箱:admin#wlmqw.com
    工作時(shí)間:周一至周五,10:30-18:30,節(jié)假日休息