TEL::0898-88889999

网站公告:

诚信为本:市场永远在变,诚信永远不变。

主营项目

  • 有外媒记者提问,台湾当局称,在过去24小时内,46架解放军战机飞越台湾。有何最新消息吗?
  • 为什么好多人不承认大众审美就是喜欢白皮?
  • 能分享一下你写过的rust项目吗?
  • 为什么有些前端一直用 div 当按钮,而不是用 button?
  • 为什么鸿蒙PC要排斥Linux生态?
  • 小米发布了 REDMI 首款旗舰小平板 K Pad,仅 8.8 英寸,小巧便携,如何评价这一设计?

新闻动态

当前位置: 首页 > 新闻动态

12306 网站的根目录下为什么连 robots.txt 文件(反爬虫协议)都没有?

你当然可以爬12306。

要不携程飞猪去哪网这些的数据是哪来的。

这种爬虫反而给12306省流量。

因为如果没有第三方网站,所有查火车信息的流量(哪怕不买票)就都得是12306接收。

而这些网站虽然在抢票的时候会浪费一些流量(卡放票时间反复刷票),但是如果有人只查票不买票,则对12306的流量消耗为0。

不过你要是一天爬它几亿次,就别怪晶哥抓你了。

12306 网站的根目录下为什么连 robots.txt 文件(反爬虫协议)都没有?
上一篇:利用爬虫技术能做到哪些很酷很有趣很有用的事情?
下一篇:如何评价张靓颖刘宇宁《九万字》?