1
qxdo1234 OP 也尽量不用 GPT 这种付费的接口,就自己玩的,用这个接口成本预估比较大。
|
2
shinyzhu 231 天前
自己训练还的看数据质量,劝退。还是想想基于大模型做什么应用吧。
|
3
sm1314 231 天前
先看看开源的 chat 模型能不能解决你的问题。不能的话再考虑自己训练,可以使用类似 QLora 量化加速技术,入门就搞搞 SFT ,更进一步就 SFT+PPO/DPO; 由于 scaling law 的存在,7b 及以下模型在量化后性能都比较傻。具体选哪个可以 Huggingface 看榜单,选个排名高的 base 模型作为基座
|
4
7VO54YYGvw3LOF9U 229 天前 via iPhone
模型是完完全全的中心化文化产物
|