當前位置:歷史故事大全網 - 歷史天氣 - 用網絡爬蟲還是其他手段抓取數據?證據會說話

用網絡爬蟲還是其他手段抓取數據?證據會說話

上篇寫道,壹審法院將社交平臺數據以是否設置訪問權限分為“公開數據”與“非公開數據”後,對被告Y公司抓取的數據類型進行評議,結論是Y公司抓取了“非公開數據”且不能合理解釋、舉證其抓取非公開數據行為的正當性。

隨後,壹審法院對Y公司到底是用何種手段抓取進行評議。

壹審爭議焦點:數據抓取方式

W公司的主張

第壹,未經授權抓取。Y公司不是微博後端數據的授權使用方。

第二,非搜索引擎類爬蟲。Y公司自認了這壹點。

第三,設置訪問權限的頁面不可能通過網絡爬蟲技術抓取。

第四,W公司針對微博平臺前端和後端數據都設置了技術保護措施,包括“登錄機制”及“反抓站技術”。

第壹種,受限於登陸機制和反抓站技術的限制,為實現YJ系統采集數億條數據及實時性,需要偽裝成大量微博用戶並模擬用戶行為。

第二種,偽裝成微博客戶端,即破解了微博產品密鑰,直接向微博平臺服務器調取後端數據。但這種方式本身仍然受到反抓站技術限制,不可能無限調用,更不能調用「已經刪除」或者「被用戶設置為不展示」的數據。

第三種,直接攻擊微博平臺服務器——這種方式可以實時、無限地調用平臺後端數據,可以實現抓取「已經刪除」或者「被用戶設置為不展示」的數據。

這三種方式均具有不正當性,結合YJ系統展示情形,W公司認為第三種是最有可能采用的方式。

Y公司的主張

壹審法院評議

壹審法院對Y公司無法自圓其說之處的解析已在上篇寫道,此處不再重復。簡單總結,就是在W公司專家輔助人已從技術層面對網絡爬蟲無法實現用戶行為觸發後才能展示的結果進行合理解釋的情況下,Y公司未就此做進壹步回應或者提交相反證據,其所稱的使用網絡爬蟲技術抓取數據缺乏事實證明,無法得到法院支持。

二審新增爭議焦點:數據接口

這個說法推翻了它在壹審期間的陳述,壹審期間,Y公司明確自己是通過網絡爬蟲技術抓取數據,並在法院詢問是否有其他方式時,明確否認。

第壹,關於國新辦工作人員、W公司工作人員和Y公司工作人員的溝通內容。

Y公司主張2011年時國新辦工作人員、W公司工作人員和Y公司工作人員,曾就YJ系統使用新浪微博數據的問題進行溝通,並且提供Y公司員工之間的往來郵件作為證據。

但是這些郵件都是Y公司員工之間轉發的郵件,法院認為 轉發郵件時,被轉發的內容可以被修改 ,因此要求Y公司提供原始郵件,但是Y公司既沒有提供原始郵件,也沒有做出任何合理解釋。

第二,W公司、Y公司工作人員的溝通內容。

Y公司提供了2017年10-11月期間,其工作人員與W公司工作人員關於“微博-Y數據業務合作問題”的往來郵件,法院認為其為孤證,既沒有關於合作事項前因後果的相關證據,也沒有詳細的合同文本予以確認。

法院進壹步指出,郵件本身的內容沒有明確YJ系統是否可以“未經授權使用新浪微博的高權限數據”, 反而證明了W公司非常明確地向Y公司提出“將微博數據商業化提供給政務領域的客戶”不屬於許可使用的範圍

第三, 五個接口至今可以登陸的證據。

Y公司還提交了五個接口賬號至今可以登錄的證據,但不能證明以下內容:

二審法院對“網絡爬蟲抓取”進行評議

第壹,關於通過比對識別“已刪除微博”的解釋。

法院指出,進行比對,需要用戶開始使用(YJ系統)壹段時間後、收集不同時間節點的微博信息才能實現。

Y公司在壹審時,聲稱只有在用戶發出指令後,YJ系統才開始收集微博數據,而 在案證據顯示 ,用戶在YJ系統輸入某壹個關鍵詞後,相關微博就已經會出現“轉”“評”“刪”的內容,而此時並不具備Y公司所稱的「相隔多天後進行數據對比」的條件,因此該解釋不成立。

第二,關於不停網絡爬蟲不停抓取,所以可以獲得足以支撐YJ系統運行的信息量的解釋。

在案證據和現場勘驗情況顯示 ,用戶未登陸時可以查看的微博內容非常有限,而在YJ系統內輸入某壹關鍵詞後,監測到的微博數量,遠遠超過未登陸狀態下可獲取的內容。

Y公司提交的證據不僅不能證明面對海量微博信息,YJ系統是如何選定關鍵詞並將信息有效整合,反而證明的W公司確實設置了“用戶行為觸發”等訪問權限。

Y公司無法證明為什麽它的網絡爬蟲可以抓取需要“用戶觸發行為”才可以加載的信息。

二審法院認為,在不通過技術手段破壞或者繞開W公司所作的技術限制的情況下,無法實現Y公司所宣稱的YJ系統所具有的功能。

第三,關於“精確到秒”的解釋。

法院認為Y公司說明了壹種技術上實現的可能性,但是並未提交任何證據證明YJ系統是用這種方式實現的。即使YJ系統確實是通過這種方式實現“精確到秒”,在Y公司無法對其他不能自圓其說之處作出合理解釋的情況下,也無法推翻壹審法院的認定結論。

可以說,壹二審整個過程寫滿八個大字——“打官司就是打證據”。

  • 上一篇:例如昨天是母亲节,你和爸爸做了什么。写一篇英语小短文
  • 下一篇:世界巧克力梦公园 世界巧克力梦公园北京
  • copyright 2024歷史故事大全網