V2EX › caspartse 的所有回复 › 第 2 页 / 共 3 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

1 2 3

❮

❯

2016-07-23 19:14:29 +08:00

回复了 caspartse 创建的主题 › 分享创造 › 用 Python 写了个简单的 QQ 群爬虫

@xz 对的。
本人运营狗一枚，经常用到群资源，所以批量抓下来，备用。

2016-05-06 11:18:29 +08:00

回复了 pyengwoei 创建的主题 › 程序员 › 这种类型的 http URL 可以抓取吗 https://h8m9t4z3.ssl.hwcdn.net/stats.gif

Web beacon

2016-04-27 11:34:49 +08:00

回复了 qooweds 创建的主题 › Python › requests 模块能获取 Response Headers 里面 302 的 URL 吗？

r.history

2016-04-23 11:03:03 +08:00

回复了 wex 创建的主题 › Python › 求教，这个模拟登陆为什么是 403？

@wex

#!/usr/bin/env python
# -*- coding:UTF-8 -*
import requests
import re
import simplejson as json

session = requests.Session()
url = 'http://account.lvye.cn/accounts/login'
response = session.get(url)
content = response.content
pattern = r'<input type=\'hidden\' name=\'csrfmiddlewaretoken\' value=\'([^\s]+?)\' />'
token = re.search(pattern, content).group(1)
data = {
'username': 'ly233',
'password': 'ly233233',
'cap_code': '',
'auto': 'on',
'csrfmiddlewaretoken': token,
'next': 'http://lvye.cn',
'client_id': 'None',
'state': 'None',
'cap_key': '',
'login_code': ''
}
url = 'http://account.lvye.cn/accounts/ajax_login/'
response = session.post(url, data=data)
content = response.content
result = json.loads(content)
print 'uid: %s , username: %s , email: %s' % (result.get('uid'), result.get('name'), result.get('email'))

2016-04-23 00:15:04 +08:00

回复了 wex 创建的主题 › Python › 求教，这个模拟登陆为什么是 403？

post 的 url 应该是 http://account.lvye.cn/accounts/ajax_login/

2016-04-21 12:10:23 +08:00

回复了 Gary_Cheung 创建的主题 › Python › 怎么爬 iframe 里的内容？

@Gary_Cheung

data = {
'goodsname':'',
'goodstype':'00',
'beginyear':'2016',
'beginmonth':'4',
'beginday':'20',
'endyear':'2016',
'endmonth':'4',
'endmonth':'21'
}
url = 'http://www.shian.gov.cn/web/jghq_static.aspx'
web_data = requests.post(url, data=data)

是 data ，不是 headers 哦。

2016-04-21 11:18:50 +08:00

回复了 Gary_Cheung 创建的主题 › Python › 怎么爬 iframe 里的内容？

用 Firebug 看了下，需要 post 数据的。
goodsname=&goodstype=00&beginyear=2016&beginmonth=4&beginday=20&endyear=2016&endmonth=4&endday=21

2016-04-20 11:14:43 +08:00

回复了 realpg 创建的主题 › 云计算 › 阿里云这个大骗子……亏得我给你义务推广……我了个大艹……看这地怎么洗！

新玩法 233

2016-04-18 23:31:49 +08:00

回复了 bigbearme 创建的主题 › Python › 模拟登陆求助

print u'\u9a8c\u8bc1\u7801\u4f1a\u8bdd\u65e0\u6548'

2016-04-16 16:12:04 +08:00

回复了 kukuwhu 创建的主题 › Python › 大神们帮我看看 Python requests 模拟登陆 taobao 的问题

@kukuwhu 个人信息显示是通过 js 实现的，不在结果返回结果里。