lunaticus7

lunaticus7

V2EX 第 19840 号会员,加入于 2012-04-24 00:23:46 +08:00
根据 lunaticus7 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
lunaticus7 最近回复了
2022-09-09 18:09:57 +08:00
回复了 Guesser 创建的主题 Python py 有什么好用的数据分析工具
试试 Prometheus?
2022-07-07 18:01:19 +08:00
回复了 vain 创建的主题 美酒与美食 有什么酒庄或酒商的波特酒推荐一下?
可以试试 Taylor's LBV

---

红玉波特酒: Ruby Port

---

年份波特方差很大水太深,不太懂。不过如果只是想要个生日酒的话,看价钱合适就买呗
2022-02-06 02:14:52 +08:00
回复了 knowckx 创建的主题 Python 请教一个 Python 浮点数的小问题
https://docs.python.org/3/library/decimal.html
想要精确小数的话可以用 decimal
2019-07-04 16:33:33 +08:00
回复了 sunhk25 创建的主题 Python Python +mongodb:如何快速计算大量向量近似度
`但是从 DB 把数据拿到内存就需要 7 秒` 是指取 20000 * 250 向量?
特征向量为什么要存 mangoDB 嘛,这点量也没多少,直接塞内存,精度可以转成 np.float32 甚至 np.float16,能省很多内存,这些精度做检索够用

解决了了从数据库读特征向量的问题后,就可以优化检索计算了

大方向就是分级检索:先用低运算量低精度的 metirc (句向量的话直接 cosine 就行)快速检索出一个较大的候选集,然后在候选集内部再用正常的高精度低速 metirc 得出最终结果


懒得折腾可以直接上 fb 家的 faiss

PS.你什么算法啊,20w 数据相似度居然要算 2s ?
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1020 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 21:37 · PVG 05:37 · LAX 13:37 · JFK 16:37
Developed with CodeLauncher
♥ Do have faith in what you're doing.