V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
BeanYoung
V2EX  ›  程序员

应对无下限无节操爬虫,是不是可以尝试sql注入?或是有更好的方法?

  •  
  •   BeanYoung · 2013-12-14 01:01:55 +08:00 · 6135 次点击
    这是一个创建于 4009 天前的主题,其中的信息可能已经有所发展或是发生改变。
    最近发现一个ip(杭州某家信用卡app的服务器,对就是某1信用卡管家)以每秒200次的频率爬取我们的数据,虽然禁掉ip还是不能让其停止,联系对方工作人员依然无果。

    刚才去掉了ip限制,然后对该ip的请求返回假数据,貌似对方的爬虫脚本被搞挂掉了。

    突然想起来,对付这样的爬虫,是不是可以尝试一下sql注入,大家有没有类似的对付爬虫的经验?
    第 1 条附言  ·  2013-12-14 11:42:39 +08:00
    昨天尝试了通过ip访问频率来限制 想到某些移动浏览器的访问会用他们自己的服务器做代理 大量请求都来自同一批ip 在没有ip白名单的情况下也不好做自动ip限制
    20 条回复    1970-01-01 08:00:00 +08:00
    liuxurong
        1
    liuxurong  
       2013-12-14 01:12:11 +08:00   ❤️ 3
    好玩点的话 针对那个IP给他返回垃圾信息 让他采美女图片去 XDDD..
    Flyfish
        2
    Flyfish  
       2013-12-14 03:35:59 +08:00 via Android
    楼上好邪恶啊,哈哈哈
    vibbow
        3
    vibbow  
       2013-12-14 06:37:45 +08:00   ❤️ 1
    之前被某H****z空间商恶意采集(攻击)过。
    我的做法是301跳转到Ubuntu镜像去...
    kendisk
        4
    kendisk  
       2013-12-14 08:23:18 +08:00
    @vibbow 应该跳转到ccav
    ufo22940268
        5
    ufo22940268  
       2013-12-14 08:26:13 +08:00 via iPhone
    笑尿,好想知道lz在哪家公司的
    humiaozuzu
        6
    humiaozuzu  
       2013-12-14 09:53:29 +08:00
    话说有什么工具可以发现有人在扒你数据。有什么工具可以定制策略吗?
    jason52
        7
    jason52  
       2013-12-14 10:01:15 +08:00
    思路不错哟!!!
    bombless
        8
    bombless  
       2013-12-14 10:26:56 +08:00
    你应对的是一个移动的目标……
    如果对方的确暴露出一些特征,当然可以对应的去攻击……
    比如对方用了一个很脆弱的HTTP解析库,遇到非预期的HTTP响应就崩溃,那……
    subpo
        9
    subpo  
       2013-12-14 11:14:53 +08:00
    带上他们公司的信息301到政府网站,不日,对方公司网站被墙。
    34D
        10
    34D  
       2013-12-14 11:23:44 +08:00
    @ufo22940268 目测是51信用卡,我同事之前在这公司帮他们写正则表达式,他说千万不要用他们的东西,你邮件内容他们都可以看到的。
    shiny
        11
    shiny  
       2013-12-14 11:26:03 +08:00
    iptables block 之就差不多了。
    lovedboy
        12
    lovedboy  
       2013-12-14 11:29:23 +08:00   ❤️ 1
    可以在返回的信息中插入sql代码。
    subpo
        13
    subpo  
       2013-12-14 11:30:32 +08:00
    @34D 都是这么查账单的
    BeanYoung
        14
    BeanYoung  
    OP
       2013-12-14 11:31:05 +08:00 via iPhone
    @humiaozuzu 通过nginx日志可以发现ip访问记录 找出异常的ip
    BeanYoung
        15
    BeanYoung  
    OP
       2013-12-14 11:33:52 +08:00 via iPhone
    @liuxurong
    @vibbow
    @subpo 是个post请求 原本想301到他们自己的网站 找了半天 没在他们网站发现可以post的地址
    loveshouhu
        16
    loveshouhu  
       2013-12-14 12:37:28 +08:00
    @subpo 好邪恶啊。我喜欢 XD
    humiaozuzu
        17
    humiaozuzu  
       2013-12-14 13:10:22 +08:00   ❤️ 1
    @BeanYoung 301 没法重定向 post 的,需要307,https://gist.github.com/humiaozuzu/7333277
    forgottencoast
        18
    forgottencoast  
       2013-12-14 14:10:20 +08:00
    找一个大文件,然后重定向到大文件,最好是大的HTML文件,非常复杂的DOM。
    无论他用DOM分析还是正则表达式,都有可能挂掉。哈哈。
    wwek
        19
    wwek  
       2013-12-14 15:06:26 +08:00
    大家很淫荡的说·
    zhonghua
        20
    zhonghua  
       2013-12-14 15:14:25 +08:00
    好欢乐
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1020 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 20:55 · PVG 04:55 · LAX 12:55 · JFK 15:55
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.