请各位推荐一下，有没有什么速度快支持语言多的翻译模型

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 205 天前的主题，其中的信息可能已经有所发展或是发生改变。

我现在用的是, https://huggingface.co/google/madlad400-3b-mt 一个量化之后的模型, A5000/RTX4090 可以跑到 90token/s 单任务的速度

有没有速度比这个再快点的模型(要尽可能支持主流语言), 或者可以优化执行速度(付费支持, 如果能达到单任务 200~300token/s A5000 的卡, 200$起).

tg 可以直接联系我 @chino23333 微信的话您留我联系您 (国内下午 4 点后在线

1 条回复 • 2024-05-13 15:34:23 +08:00

csulyb

203 天前

我也想知道