爬虫政府网站最常见的就是:公考机构爬虫当地人才考试中心,辅以机构“虚假查分网页”,窃取一定用户的分数,为公考机构获取利益。
手段基本就是出成绩时无限爬查分网页,使网页1-3天内都处于无法访问的状态。
同时通过手段操纵搜索引擎,使自己的“机构虚假查分网页”排名靠前,让上当的小白第一手通过自己的假网站→访问真网站查分→获取该考生的分数。以此充实自己的资料库。
所以:
1.机构不能直接在政府网站上爬直接窃取所有考生的资料,如果这么做了必违法,必被抓。
2.所以查分时不要通过第三方机构的网站二次转接到官方网站。
总而言之就是,政府不公开的东西你爬到了是违法的,政府公开的,爬到了不违法。
国内各省公考现在应该很难爬了,都做了防范措施,只要不自己自投罗网点进机构的第三方转接官方网站就行。