Avafly 最近的时间轴更新
Avafly

Avafly

V2EX 第 616174 号会员,加入于 2023-02-27 10:18:22 +08:00
今日活跃度排名 1530
根据 Avafly 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
Avafly 最近回复了
试了下 demo, 用户名随便就写了个 114514, 结果进去发现里面的人全是野兽先辈数字笑死
4 天前
回复了 Avafly 创建的主题 算法 C++如何优化矩阵乘法 gemm
@dingyaguang117
你是说它们不是传统的 C=AB, 而是用了 Strassen/Winograd 之类的方法减少了复杂度吗?
5 天前
回复了 Avafly 创建的主题 算法 C++如何优化矩阵乘法 gemm
@foool #19
非常感谢你的回复.
1. 最大 GFLOPS 这个我没算, 是以 openblas 的为目标优化的 (试过别的库, 有比 openblas 更快的).
2. 3. 很好的建议, 我回头再优化测试看看.
4. 我是脚本跑 100 次取最优值的.
5. 使用 schedule(static)是因为 for 循环中每次计算量近似才用的, 不过我试过去掉这个, 其实性能基本没区别.
5 天前
回复了 Avafly 创建的主题 算法 C++如何优化矩阵乘法 gemm
@tankeco
是的, 这点我也觉得要花时间想下怎么减少 index.
其实已经优化过一次 index 了, 现在保留的都是为了分块和区分多线程访问空间的, 后面个人感觉这不是影响速度的最大的因素就没继续花心思了.
5 天前
回复了 Avafly 创建的主题 算法 C++如何优化矩阵乘法 gemm
@toma62299781
感谢分享
5 天前
回复了 Avafly 创建的主题 算法 C++如何优化矩阵乘法 gemm
@WonderfulRush
刚看完这篇文章然后看到你的评论...
那个文章挺好的, 但是技术部分讲得有点简略, 而且其实很多提到的技术我已经用了, 比如 blocking, simd 等等.
5 天前
回复了 Avafly 创建的主题 算法 C++如何优化矩阵乘法 gemm
@Donaldo ppt😂
5 天前
回复了 Avafly 创建的主题 算法 C++如何优化矩阵乘法 gemm
@AirCrusher 谢谢分享, 这个有点猛汇编都用上了, 我回头看下. 其实后面我看过类似的就是 flame 的教程, 基本上里面的技术都应用到了已经.
5 天前
回复了 Avafly 创建的主题 算法 C++如何优化矩阵乘法 gemm
@nagisaushio 这个确实有一些帮助, 不过只能提升一点点大概 0.1GFLOPS 吧, 还是和 openblas, blis 这些有断档的差距. 感觉更多还是算法设计方面的问题, 这部分不知道该怎么做了.
5 天前
回复了 Avafly 创建的主题 算法 C++如何优化矩阵乘法 gemm
@elfive #2 什么库不重要, 主要是想自己优化 gemm 来学习一下. 实际项目中会都测试一边选性能最好的用的.
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3477 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 414ms · UTC 10:48 · PVG 18:48 · LAX 02:48 · JFK 05:48
Developed with CodeLauncher
♥ Do have faith in what you're doing.