029-86112530

隻因寫了一(yī)段爬蟲,公司200多人被抓!

時間:2019-10-18 13:34:23來源:浏覽:


 


“一(yī)個程序員寫了個爬蟲程序,整個公司200多人被端了。”


“不可(kě)能吧(ba)!”


剛從朋(péng)友聽到這個消息的(de)時候,我有點不太相信,做(zuò)為(wèi)一(yī)名程序員來講,誰還沒有寫過幾段爬蟲呢(ne)?隻因寫爬蟲程序就被端有點誇張了吧(ba)。


朋(péng)友說,消息很确認并且已經進入審判階段了。


01.對消息進一(yī)步确認


朋(péng)友認識幾個律師朋(péng)友,和(hé)他們有一(yī)些業務來往,得知他們想嘗試把業務擴展到程序員這個群體。那段時間我剛好離(lí)職也有時間,在朋(péng)友的(de)安排下一(yī)起聊聊看看有沒有合作的(de)機會。


他們為(wèi)什麽想擴展人群到程序員這個行業呢(ne)?其實就是因為(wèi)他們代理(lǐ)了這名程序員的(de)官司,才發現很多程序員完全不懂法,直接說是法盲一(yī)點都不過分。


剛好我也很好奇程序員因爬蟲被抓這個案子(zǐ),看看到底是怎麽回事,就和(hé)兩名律師以及朋(péng)友坐到一(yī)起,深入交流後才知道(dào)整個事件的(de)來龍去(qù)脈。


這名程序員在被警察逮捕後,警察審問期間一(yī)直不承認自(zì)己觸犯了法律,并且也完全沒有意識到自(zì)己犯法了。進去(qù)之後總以為(wèi)警察搞錯了,過幾天就會把自(zì)己放出來,結果也錯過了取保候審的(de)機會。


律師說,這名程序員的(de)媽媽當時在他畢業的(de)時候,就因程序員這個行業太辛苦不同意他做(zuò)程序員,但他對這個行業一(yī)直都很感興趣,堅持做(zuò)了一(yī)名碼農,沒想到兩年(nián)後出現了這個事情。


他們家裏人都後悔死了,距離(lí)事發當日到現在已經過去(qù)了半年(nián),當事者還被關在監獄中。不管這件事如(rú)何收尾,對這名程序員和(hé)他的(de)家庭都是一(yī)個很大的(de)打擊。


以下內(nèi)容根據部分推測和(hé)網上資料整理(lǐ)而出,可(kě)能會有細微偏差。




02.一(yī)個爬蟲引發的(de)案件


某一(yī)個知名互聯網公司,突然發現公司的(de)服務器連續幾天壓力倍增,導緻公司內(nèi)部系統崩潰不能訪問,公司領導責令技術部盡快解決。


該公司系統平時訪問量一(yī)直比較平穩,但不知為(wèi)何這幾天系統壓力突然大增,經過技術人員幾天調查發現了一(yī)個驚人的(de)真相,公司客戶信息被抓取,并且某個接口訪問量巨大。


随着技術人員的(de)深入調查發現的(de)現象更加震驚,入侵者利用這個入口已經竊取了大量的(de)客戶信息,并且所有的(de)線索都指向了一(yī)家大數據公司。


這家公司的(de)主要業務就是,出售簡曆數據庫。經核查該公司出售的(de)簡曆數據中,就包含自(zì)己家客戶的(de)簡曆信息。


技術部上報領導之後,公司開會商議後決定報案。


03.案發現場


案發前一(yī)段時間,小明(化名)接到了技術部領導的(de)需求,要求寫一(yī)段爬蟲批量從網上的(de)一(yī)個接口抓取數據,爬蟲開發完後測試沒有問題,小明就将程序上傳到了公司服務器。


程序運行了一(yī)段時間後,也許是有了新的(de)需求,也許是小明想對爬蟲程序進行進一(yī)步的(de)優化,将爬蟲的(de)線程數,由原來比較小的(de)值調到一(yī)個比較大的(de)值。


完善後的(de)程序上傳到服務器後,小明跟蹤了下爬蟲的(de)進展,運行平穩并且速度快了很多。提交之後像往常一(yī)樣,小明就把這件事情忘了。


小明沒想到自(zì)己這次提交的(de)爬蟲程序,竟然能把對方的(de)服務搞挂了,也沒想到自(zì)己因為(wèi)寫了一(yī)段代碼而坐牢。




04.整個公司被抓


2019年(nián)的(de)某一(yī)個工作日,公司員工像往常一(yī)樣忙忙碌碌,某個程序員和(hé)産品經理(lǐ)正在為(wèi)了一(yī)個需求争吵,小明帶着耳機正坐在辦公室敲代碼。


突然就來了一(yī)大群警察,要求所有人離(lí)開工位,雙手離(lí)開電腦、手機等設備。整個公司的(de)人都懵了,不知道(dào)發生了什麽事情,但也都照辦了。


警察很快查封了公司的(de)所有辦公用品,問技術部相關人員要了服務器的(de)信息,公司全體上下 200 多人無差别的(de)全部送到看守所了解情況。


在去(qù)看守所的(de)路上,大家都還心裏想這是不是搞錯了,我們隻是一(yī)個科技公司公司又沒有騙人,怎麽就集體被抓了。


小明也一(yī)直認為(wèi)自(zì)己沒有犯罪,自(zì)己隻是一(yī)名技術人員而已,所有的(de)工作也都是按照領導要求來執行的(de),應該很快就會把我們釋放了吧(ba)。


随後,公司非核心人員都被釋放了出來,主要集中在 HR、行政人員。最後确認公司 36 人被捕,其中大部分是程序員。


被捕後小明委托的(de)律師事務所,就是和(hé)我們交流的(de)兩位律師的(de)事務所,據說小明入獄後就一(yī)直不認為(wèi)自(zì)己有罪,也因一(yī)直拒絕認罪從而錯過了取保候審的(de)機會。


目前小明還在等待最後的(de)審判。。。

        AI人工智能小名片


05.涉事公司背景




巧達科技号稱是中國最大的(de)用戶畫像關鍵數據服務提供商,專注于大數據及人工智能領域前瞻性産品研發,客戶覆蓋互聯網行業及泛金融領域。


高(gāo)管多為(wèi)百度出身,公司2017年(nián)淨賺1.86億元。


公司2014年(nián)7月成立,B輪估值2億美元,目前已經到了C輪融資階段,投資者包括李開複創新工場、百度風投齊玉傑、中信産業基金、人工智能産業基金等等。


巧達的(de)創始人成予曾經是百度第一(yī)任産品部負責人、聯合創始人沈毅曾經是百度電子(zǐ)商務事業部技術總監和(hé)百度愛樂(yuè)活技術副總裁。


公司曾宣稱通過整合多達2.2億份自(zì)然人簡曆、100億個用戶識别ID組合和(hé)1000億+用戶綜合數據,繪制出了涉及中國8億人口的(de)多維度數據。其中,包含個人隐私與非隐私信息。


此外,巧達科技還有超過10億份通訊錄,并且掌握着與此相關的(de)社會關系、組織關系、家庭關系數據。結合簡曆、通訊錄,以及外部獲取的(de)超過千億條其他用戶數據,巧達科技自(zì)稱擁有超過8億自(zì)然人的(de)認知數據。


也就是說,超過57%的(de)中國人的(de)信息都在巧達科技的(de)數據庫裏面。


“基本上所有你能數的(de)上名的(de)大型互聯網公司,都是巧達科技的(de)客戶。”一(yī)位之前簡曆中介生意的(de)從業者。


06.近期多個大數據公司被查


最近的(de)大數據行業,風聲鶴唳。


在中秋節前一(yī)天,中國電信控股的(de)子(zǐ)公司天翼征信傳出風聲,其總經理(lǐ)、副總經理(lǐ)以及市場人員被警察帶走,原因是與其合作的(de)大數據公司被警方調查。


在天翼之前,新顔科技CEO黃向前被警方帶走、魔蠍科技公司CEO周江翔涉事被查、公信寶公司門口被貼了封條、知名第三方數據服務公司聚信立宣布将暫停對外提供用戶授權的(de)運營商爬蟲服務……


此外,國內(nèi)大數據風控平台龍頭同盾科技也被曝爬蟲部門已解散,CEO蔣韬已出國避風頭,對此,同盾科技昨日發表辟謠聲明表示,子(zǐ)公司杭州信川科技有限公司确實停止爬蟲業務,但其他言論均屬不實。


.....


據內(nèi)部消息,最近監管對數據亂象出手,開始清理(lǐ)行動,15家公司被列入調查名單,其中幾家估值都超幾十億。


國內(nèi)很多大數據公司的(de)數據來源多多少少都有一(yī)定的(de)問題,随着我國今年(nián)6月1日起,《中華人民共和(hé)國網絡安全法》将實施,所有的(de)網上行為(wèi)将越來越嚴格,如(rú)果還按照之前的(de)慣性去(qù)操作,遲早會出問題。


07.程序員謹慎使用技術


不知道(dào)大家是否發現,随着國家經濟的(de)不斷發展,以前可(kě)能處于灰色階段的(de)行業,現在幾乎都慢慢不能做(zuò)了。寫這篇文章(zhāng)的(de)目的(de),也是為(wèi)了警示大家技術是無罪的(de),但是用到了錯的(de)地(dì)方代價也是非常巨大的(de)。


我之前看過這樣一(yī)個報道(dào),一(yī)個程序員因為(wèi)愛好寫了一(yī)個程序(入侵工具),并且把此程序上傳到了互聯網上,沒想到過了兩年(nián)之後,有人利用這個小程序非法獲利500多萬。


雖然這名程序員并沒有因為(wèi)這個程序而獲利,但是間接給犯罪人員提供了犯罪的(de)工具,最後被判刑 2 年(nián)緩期 2 年(nián)執行。


程序員的(de)生活是簡單的(de),工作大概也隻關心代碼和(hé)BUG。小明也從來沒有把自(zì)己的(de)職業和(hé)犯罪聯系在一(yī)起。


技術本身是不違法的(de),就好像一(yī)把水果刀,如(rú)果用來削蘋果削梨沒有任何問題,但是用來傷人就是兇器,就要被列入物證list。


爬蟲也是如(rú)此,在大多數情況下,隻是采集互聯網上的(de)公開信息,很難說是違法行為(wèi)。但是一(yī)旦涉及入侵到别人系統去(qù)獲取數據,那必然存在着法律風險。


可(kě)能很多同學(xué)是懵的(de),很多互聯網公司就是靠抓取數據活着的(de)。他隻是正常執行公司安排的(de)工作任務,怎麽就涉嫌犯罪了呢(ne)?


這裏結合律師朋(péng)友給出的(de)一(yī)些建議,這裏摘錄出來僅供參考。


08.單位犯罪和(hé)個人犯罪的(de)關系


首先了解一(yī)下單位犯罪。除了自(zì)然人犯罪,還有單位犯罪,是指公司、企業、事業單位、機關、團體為(wèi)單位謀取利益,經單位決策機構或者負責人決定實施的(de),法律規定應當負刑事責任的(de)危害社會的(de)行為(wèi)。


我國刑法對單位犯罪原則上采取雙罰制度,即單位犯罪的(de),對單位判處罰金,并對其直接負責的(de)主管人員和(hé)其他直接責任人員判處刑罰。相關司法解釋規定,在審理(lǐ)單位故意犯罪案件時,對其直接負責的(de)主管人員和(hé)其他直接責任人員,可(kě)不區分主犯、從犯,按照其在單位犯罪中所起的(de)作用判處刑罰。


因此,公司犯罪有可(kě)能會牽連員工,尤其是案件中對非法獲取數據有直接責任的(de)爬蟲工程師。這也是為(wèi)什麽當事人在公司人小言微但還是被批捕的(de)原因。


其次,是否可(kě)以“不知者不為(wèi)罪”來辯解?刑法原則之一(yī)是法無明文規定不為(wèi)罪,并沒有“不知者不為(wèi)罪”。主觀上的(de)惡意是衡量犯罪的(de)要素之一(yī),結合客觀上的(de)行為(wèi)來推理(lǐ)主觀惡意。破解别人的(de)服務器,獲取别人不公開的(de)信息,不能說沒有惡意,不能以不懂法來搪塞。


09.重點:什麽樣的(de)爬蟲是違法?


如(rú)果爬蟲程序采集到公民的(de)姓名、身份證件号碼、通信通訊聯系方式、住址、賬号密碼、财産狀況、行蹤軌迹等個人信息,并将之用于非法途徑的(de),則肯定構成非法獲取公民個人信息的(de)違法行為(wèi)。


除此之外,根據相關規定,對于違反國家有關規定,向他人出售或者提供公民個人信息,情節嚴重的(de),竊取或者以其他方法非法獲取公民個人信息的(de),均可(kě)構成成“侵犯公民個人信息罪”,處三年(nián)以下有期徒刑或者拘役,并處或者單處罰金;情節特别嚴重的(de),處三年(nián)以上七年(nián)以下有期徒刑,并處罰金。


重點關注:下列情況下,爬蟲有可(kě)能違法,嚴重的(de)甚至構成犯罪。


爬蟲程序規避網站經營者設置的(de)反爬蟲措施或者破解服務器防抓取措施,非法獲取相關信息,情節嚴重的(de),有可(kě)能構成“非法獲取計算機信息系統數據罪”。


爬蟲程序幹擾被訪問的(de)網站或系統正常運營,後果嚴重的(de),觸犯刑法,構成“破壞計算機信息系統罪”


爬蟲采集的(de)信息屬于公民個人信息的(de),有可(kě)能構成非法獲取公民個人信息的(de)違法行為(wèi),情節嚴重的(de),有可(kě)能構成“侵犯公民個人信息罪”。


10.最後


最後提醒大家敬畏法律,熱愛生活。


願每一(yī)個程序員都可(kě)以用自(zì)己的(de)技術去(qù)改變世界,讓我們的(de)社會變得更加美好!


    AI人工智能小名片

    

 

————————————————

版權聲明:本文為(wèi)CSDN博主「微笑很純潔」的(de)原創文章(zhāng),遵循 CC 4.0 BY-SA 版權協議,轉載請附上原文出處鏈接及本聲明。

原文鏈接:https://blog.csdn.net/ityouknow/article/details/102597598