V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  freakxx  ›  全部回复第 16 页 / 共 25 页
回复总数  486
1 ... 8  9  10  11  12  13  14  15  16  17 ... 25  
2020-03-04 21:33:41 +08:00
回复了 captainm 创建的主题 CDN 有吊大的大佬了解 CDN 吗?
可以试下用阿里云的 dcdn,然后规则设置那里将需要的静态资源也走动态看看。
2020-03-03 20:10:21 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 Python Python 把任意非空值转为 True 怎么写最简?
@Trim21

如果你说的是楼主的 if,那么是没必要的
我想说的 #7 #9 也说明了

因为非空值这定义不明确。
2020-03-03 20:06:24 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 Python Python 把任意非空值转为 True 怎么写最简?
@Levi233
...黑人问号

#7 #9 的老哥说明了
2020-03-03 19:09:59 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 Python Python 把任意非空值转为 True 怎么写最简?
@Trim21

有可能会判断错误, 比如
bool(0)
2020-02-28 22:22:53 +08:00
回复了 zzzzzzggggggg 创建的主题 程序员 session? cookie?登录?还在分不清楚?
这个问题有类似的:
https://v2ex.com/t/641834
2020-02-28 22:06:20 +08:00
回复了 zxc1234 创建的主题 程序员 面试题请教
@zxc1234
游戏分数,积分,金额。

参照:
https://www.google.com/search?q=跳一跳修改分数
2020-02-24 13:01:37 +08:00
回复了 5bb864e1fc775087 创建的主题 程序员 准备开发和钱有关的功能,还有哪些地方要注意
- 用 decimal 避免精度问题;
- 用 ROUND_HALF_EVEN 来做处理,可搜下 银行家舍入法;
- 涉及汇率要谨慎,设置好警报,如果哪天接口异常,可及早处理(或者设置好默认范围,正常的波对不会很大);
- 涉及提现要注意舍入问题,避免造成金额损失;
2020-02-22 13:50:14 +08:00
回复了 x97bgt 创建的主题 程序员 用双拼的同志,你们真的有觉得输入速度提高了吗?
双拼的节奏感很好,
知乎有一个说的不错,我很赞同的,就是,三键两字。


快其实是其次,主要很舒服。
2020-02-21 11:04:06 +08:00
回复了 MrhuangSTR 创建的主题 Python 各位大佬有什么好的办法解析网页中不规整的表格吗
@MrhuangSTR

你多抓几份看看就可以了,
位置相对是固定的。

你事先做一份已经确定不就好?如果没 map 到,再手动补上去,这个工作总能完成的。
2020-02-20 21:37:41 +08:00
回复了 l4ever 创建的主题 Python BeautifulSoup 找到的内容, 属性为什么是倒过来的?
直接这样不行?
s.attrs[attr_name] = attr_value
2020-02-20 21:32:37 +08:00
回复了 MrhuangSTR 创建的主题 Python 各位大佬有什么好的办法解析网页中不规整的表格吗
这种要洗干净你可以这么做。

先下下来,随便拿一个,把表格洗了,然后字段扔进去 mapping, 如
{
"面积": parse_rule_1,
}

parse_rule_1(table, td)
td = td. next_tr.td[index]
table.pop(td)

最后如果 table 里面还有元素的话,那么就是有新的元素,直接报错。
你再手动去处理下。
2020-02-20 21:23:19 +08:00
回复了 MrhuangSTR 创建的主题 Python 各位大佬有什么好的办法解析网页中不规整的表格吗
但这类垂直爬取 有一个好处

你可以自己先拿几个 做个处理就干净很多。
比如你判断 “面积” 为 label 的时候,通过对比,知道一般他是在下一个 tr 里面,你写 parse 的时候,就把 2 个 tr 合起来,
直接默认拿 tr_1.td_1: tr_2.td_1, tr_2: td_2
2020-02-20 21:19:22 +08:00
回复了 MrhuangSTR 创建的主题 Python 各位大佬有什么好的办法解析网页中不规整的表格吗
应该是没有通解办法,

用 table 做的时候,他们都是直接怼进去 td 里面。

有个办法你可以尝试下, 你先做一个判断是不是标题的函数, 然后扔进去解解看。
比如最后带 ":" 判断为 label。

但实话说,我觉得这个很难洗干净,至少不是一下子能洗干净。
2020-02-17 11:42:37 +08:00
回复了 dazhangpan 创建的主题 程序员 问一道阿里的面试题如何求解
套路大概是这样, 先构建结果集,然后在结果集里面去构建。
[
[0, 1, 2, 3],
[4, 5, 6, 7],
[8, 9, x, x],
[x, x, x, x],
]

抽象看成 rand(x) --> rand(y)

2 - 4 - 16


rand(3) --> rand(10)
3 - 9 - 81
去掉[9][9]那么概率是一样的。
2020-02-17 10:17:06 +08:00
回复了 secsilm 创建的主题 Python 像这种多新闻来源的爬虫,是每种来源都做一套爬虫?
不是一套,

一般是先自己搭个框架,
像这种,可以分别写 爬取机制 + 清洗机制(parse ),然后做入库。



像 v 站一个老哥的,pyspider 用来做这玩意就还不错。
2020-02-12 18:03:10 +08:00
回复了 Windowsxpplayer 创建的主题 程序员 请教抽奖算法 奖品是 1-100 元整数
看需求,
比如总金额固定,最简单的就是你事先生成 数组,你自己按比例配进去;

还有一种比较简单的,就是你划定好区间,随机生成一个数,然后用二分插入的算法做。
x = [1, 100, 300, 400 ... 9990, 10000]
y = [1, 2, 3 ... 100]

index = bisect_search(x)
y[index]
2020-02-09 15:33:43 +08:00
回复了 black11black 创建的主题 Python Python 有办法限制字典不能添加新键吗 ?
不过看了你发的这几个贴。。。实际上搞个 tuplename 就算了,
1 ... 8  9  10  11  12  13  14  15  16  17 ... 25  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3436 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 94ms · UTC 11:30 · PVG 19:30 · LAX 03:30 · JFK 06:30
Developed with CodeLauncher
♥ Do have faith in what you're doing.