V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  caspartse  ›  全部回复第 2 页 / 共 3 页
回复总数  41
1  2  3  
2016-07-23 19:14:29 +08:00
回复了 caspartse 创建的主题 分享创造 用 Python 写了个简单的 QQ 群爬虫
@xz 对的。
本人运营狗一枚,经常用到群资源,所以批量抓下来,备用。
Web beacon
2016-04-27 11:34:49 +08:00
回复了 qooweds 创建的主题 Python requests 模块能获取 Response Headers 里面 302 的 URL 吗?
r.history
2016-04-23 11:03:03 +08:00
回复了 wex 创建的主题 Python 求教,这个模拟登陆为什么是 403?
@wex

#!/usr/bin/env python
# -*- coding:UTF-8 -*
import requests
import re
import simplejson as json


session = requests.Session()
url = 'http://account.lvye.cn/accounts/login'
response = session.get(url)
content = response.content
pattern = r'<input type=\'hidden\' name=\'csrfmiddlewaretoken\' value=\'([^\s]+?)\' />'
token = re.search(pattern, content).group(1)
data = {
'username': 'ly233',
'password': 'ly233233',
'cap_code': '',
'auto': 'on',
'csrfmiddlewaretoken': token,
'next': 'http://lvye.cn',
'client_id': 'None',
'state': 'None',
'cap_key': '',
'login_code': ''
}
url = 'http://account.lvye.cn/accounts/ajax_login/'
response = session.post(url, data=data)
content = response.content
result = json.loads(content)
print 'uid: %s , username: %s , email: %s' % (result.get('uid'), result.get('name'), result.get('email'))
2016-04-23 00:15:04 +08:00
回复了 wex 创建的主题 Python 求教,这个模拟登陆为什么是 403?
2016-04-21 12:10:23 +08:00
回复了 Gary_Cheung 创建的主题 Python 怎么爬 iframe 里的内容?
@Gary_Cheung

data = {
'goodsname':'',
'goodstype':'00',
'beginyear':'2016',
'beginmonth':'4',
'beginday':'20',
'endyear':'2016',
'endmonth':'4',
'endmonth':'21'
}
url = 'http://www.shian.gov.cn/web/jghq_static.aspx'
web_data = requests.post(url, data=data)

是 data ,不是 headers 哦。
2016-04-21 11:18:50 +08:00
回复了 Gary_Cheung 创建的主题 Python 怎么爬 iframe 里的内容?
用 Firebug 看了下,需要 post 数据的。
goodsname=&goodstype=00&beginyear=2016&beginmonth=4&beginday=20&endyear=2016&endmonth=4&endday=21
新玩法 233
2016-04-18 23:31:49 +08:00
回复了 bigbearme 创建的主题 Python 模拟登陆求助
print u'\u9a8c\u8bc1\u7801\u4f1a\u8bdd\u65e0\u6548'
2016-04-16 16:12:04 +08:00
回复了 kukuwhu 创建的主题 Python 大神们帮我看看 Python requests 模拟登陆 taobao 的问题
@kukuwhu 个人信息显示是通过 js 实现的,不在结果返回结果里。
2016-04-16 16:01:44 +08:00
回复了 kukuwhu 创建的主题 Python 大神们帮我看看 Python requests 模拟登陆 taobao 的问题
实际上已经登录成功了。

print(sess.cookies.get_dict().get('lgc'))
print(sess.cookies.get_dict().get('_nk_'))

微信的扫码登录原理和这个类似。
2016-04-15 18:35:44 +08:00
回复了 muyege 创建的主题 程序员 深深的觉得百度就是个有背景的乡镇企业
233
2016-04-14 01:06:39 +08:00
回复了 caspartse 创建的主题 分享创造 分享一个小作品: Python 锤子便签
@gogobody 入门级的习作啦 ;-)
2016-04-11 17:59:22 +08:00
回复了 gogobody 创建的主题 Python 请问新手学 flask 还是 django?
Bottle
2016-04-06 19:29:19 +08:00
回复了 UnisandK 创建的主题 VPS 我准备买搬瓦工
2.99 用了快一年,配合微林使用,速度还行。不过偶尔会抽风。
2016-04-05 23:15:23 +08:00
回复了 nina2000 创建的主题 程序员 用爬虫抓取数据,这样的行为是否合法
@binux “是否违法是在数据的使用环节,而不是抓取环节。” 同意这个说法。
2016-04-05 23:12:44 +08:00
回复了 nina2000 创建的主题 程序员 用爬虫抓取数据,这样的行为是否合法
前段时间,用爬虫从有道词典和爱词霸扒了三十多万的常用词语,做成本地离线词典。
2016-04-05 23:09:21 +08:00
回复了 nina2000 创建的主题 程序员 用爬虫抓取数据,这样的行为是否合法
@SlipStupig 不公开,应该不违法吧。
1  2  3  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5545 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 33ms · UTC 08:23 · PVG 16:23 · LAX 00:23 · JFK 03:23
Developed with CodeLauncher
♥ Do have faith in what you're doing.