不能爬蟲只能采集公開數(shù)據(jù),買家數(shù)據(jù)不是公開的。爬蟲軟件根本無法采集用戶的隱私數(shù)據(jù)。但凡可以采集到的人都是通過不正當途徑。網(wǎng)站用戶在注冊時會將自己的手機號、身份證、姓名等實名信息進行上傳,通常大型正規(guī)的網(wǎng)站會幫助用戶保密,而很多公司謊稱利用爬蟲系統(tǒng)可將用戶所有的隱私信息全部采集出來。
2019年9月,天翼征信、杭州存信數(shù)據(jù)、新顏科技、魔蝎科技等多家大數(shù)據(jù)公司被查,還有幾十家公司已經被列入調查名單,其中不乏估值高達幾十億元的明星獨角獸企業(yè)。這些公司被調查的重要原因就是利用爬蟲技術過度收集、非法竊取和販賣個人數(shù)據(jù)信息。已經有不少大數(shù)據(jù)公司干脆停止了爬蟲業(yè)務,有些甚至連團隊都解散了。
其實可以說,“真要查,沒有一家的數(shù)據(jù)是百分百‘白’的。
如何避免自己的隱私數(shù)據(jù)泄露?
1、建議用戶瀏覽網(wǎng)站或APP的時候一定要仔細閱讀”隱私條約”,很多時候條約里面內容會給我們埋抗。
2、許多人為了方便,無論在哪個網(wǎng)站或是APP中注冊,都使用的是相同的用戶名和密碼。因此建議大家在使用淘寶支付寶這些涉及個人信息和資金的網(wǎng)站,使用復雜密碼,而無關緊要的論壇之類的,可以將密碼錯開。
3、各位網(wǎng)購時都可以嘗試使用虛假姓名,改名換姓即可,針對手機號碼保護而言,運營商也都推出了小號功能,或者使用阿里小號APP,即一SIM卡雙號,我們可以專門創(chuàng)建1個小號用于網(wǎng)購