网页反作弊技术的整体思路

发布时间:2020-7-20

目前搜索引擎作弊手段五花八門且層出不窮,作為應對方的搜索引擎,也相應調整技術思路,所以如果整理一下反作弊思路,則會發現技術方法很多,理清思路著實不易。盡管如此,如果對大多數反作弊思路深入分析,會發現整體思路上還是有規律可循。從基本思路角度看,可以將反作弊手段大致劃分為以下3種:信任傳播模型、不信任傳播模型和異常發現模型。
1、信任傳播模型:在海量的網頁數據中,通過一定的技術手段或人工半人工手段,從中篩選出部分完全值得信任的頁面(可以理解為我們日常所說的白名單),算法以這些白名單內的頁面作為出發點,賦予白名單內頁面節點較高的信任度分值,其他頁面是否作弊,要根據其與白名單內節點鏈接關系來確定。白名單內節點通過鏈接關系將信任度分值向外擴散傳播,如果某個節點最后得到的信任度分值高于一定的值,則認為沒有問題,如果低于這個值則會被判為作弊。
2、不信任傳播模型:從大的技術框架來講,與信任傳播模型極其相似。最大的區別在于:初始頁面自己不是值得信任的頁面節點,而是確認存在作弊行為的頁面集合(即我們日常所說的黑名單)。賦予黑名單內頁面節點不信任分值,通過鏈接將這種不信任關系傳播出去,如果最后頁面節點的不信任分值大于設定的那個值,則被判為作弊。
3、而異常發現模型:簡單的譬如分析網頁內容來發現詞頻、鏈接等的異常,復雜點的像分析網站用戶行為異常等。異常發現模型往往和信任傳播模型和不信任傳播模型進行組合處理。
事實上,純粹技術手段目前是無法徹底解決作弊的問題,因此現在一般都是用戶在瀏覽搜索結果甚至是上網瀏覽時舉報作弊網頁,搜索引擎公司內部會有專門的團隊來審核與主動發現可疑頁面,經過審核確認的網頁則可以放入黑名單或者白名單當中。綜上所述,必須將人工手段與技術手段相互結合,才能取得較好的反作弊效果。

上一篇
下一篇企业网站修改要注意的事项

版权所有@宁波易龙计算机科技有限公司
代理域名注册服务机构:北京新网数码信息技术有限公司
浙公网安备 33020302000859号 浙ICP备13033774号-1
免责声明:网站部分图片和文字来源于网络,如有侵权请告知,我们将及时修改删除。

咨询服务热线:0574-87527666
地址:宁波市海曙区中山西路布政巷16号
   (科创大厦5楼)
邮箱:kf@1999.com.cn

    

  • 电话
  • QQ
  • 返回顶部