V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ilovebaicai  ›  全部回复第 5 页 / 共 5 页
回复总数  100
1  2  3  4  5  
2018-01-04 12:00:06 +08:00
回复了 Nick2VIPUser 创建的主题 程序员 (请教)如何提高爬虫的效率/采集速度
抱歉,手抖,少打了个 a。
2018-01-04 11:59:04 +08:00
回复了 Nick2VIPUser 创建的主题 程序员 (请教)如何提高爬虫的效率/采集速度
Scrpy+redis 是一个选择。![scrapy-redis]( https://github.com/rmax/scrapy-redis)
找工作,项目经验和能力都 ok,却直接被 hr 刷下去,面试都不给机会的时候,就能体会学历多重要了。
2017-12-18 15:36:19 +08:00
回复了 sangmingming 创建的主题 Android 小米感恩节不感恩
领了 100 卷,美滋滋。买点小东西,性价比蛮高的。
2017-12-13 22:35:45 +08:00
回复了 pheyer 创建的主题 程序员 喜欢用 app 记帐的人,看到这个有什么感觉
目前有什么好用的记账软件?随手记用了几年,最近广告异常多。
@bzzhou 同想法。淘宝有啥打印靠谱的?上次找了一家,打印的质量不行。
@smilekung 这个是一个可能的原因,谢谢您!
貌似确认获取不到 mac 地址,可参考 http://www.jianshu.com/p/61b1506e4c0f。
@cheesea X-Forwarded-for 这个也可能是追踪到了原始 ip,谢谢您!
@dewi 这个确实是个问题,谢谢您!
@cheesea 预算问题。只有少量的 asdl 的拨号服务。所以 ip 地址更换的并不会很快,但是每次拨号会改变 ip 地址。
@wangxiaoer 如果按照您的说法,我一个公司就一个出口 ip,如果有几十个人同时在访问淘宝,这也是算是同 ip,不同 header 访问,但是并不会被 ban。可能并不会是这个原因导致的。
@shaobin 您能说下,这个请求的特质,具体点是什么?我现在使用的 header 是随机,ip 地址也是代理随机拨号的。
目前是 12 个 ip 地址,ip 地址是 5 分钟轮流更换一次,使用随机的 user-agent,header+referer 访问,没使用 cookie。但是即使更换了 ip 地址,这个 ip 地址还是会被 ban。
@vus520 这个可能性会有。但是我是使用 asdl 自建的代理池,IP 重复的概率不会很大。
目前发现 Amazon,也是这样的。使用了代理 ip 去请求,一段时间后,就会让你输入验证码。即使立即更换 ip,也不让访问。
致电了 apple 客服,并没有什么卵用。客服也不清楚是那个地方可以设置。
1  2  3  4  5  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2864 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 23ms · UTC 12:29 · PVG 20:29 · LAX 04:29 · JFK 07:29
Developed with CodeLauncher
♥ Do have faith in what you're doing.