模型训练开发方向怎么样

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 117 天前的主题，其中的信息可能已经有所发展或是发生改变。

本人目前在做深度学习模型推理的算子公共平台，主要是对算子进行封装提供 api 。感觉没有深入到芯片编译器，也没上升到算法业务，容易被替代。

目前想看模型训练方向，但是了解下来感觉模型训练主要是在围绕 pytorch 进行调参，性能优化也是用工具打监控，最后调 batch 改多核等。我觉得训练核心是围绕框架进行尝试，感觉很容易被替代，好处是更近业务，要的人多，不知道前辈们怎么看。

或者另一个方向去做推理引擎，这个我不太了解，感觉推理引擎市面上没几家在做，比较窄。

2 条回复 • 2024-08-05 14:23:18 +08:00

kennyInTheHouse

115 天前

如果考虑模型训练开发，最好就是去现在比较知名的几家 AI 产品公司，除了围绕不同的框架，还要考虑底层的算法设计优化，这样可替代性会低一些。

推理引擎自研的还是比较少，如你所说太窄了。

（其实这些 AI 岗位都容易被替代，目标还是尽量让自己兼容性强一些。

个人拙见。

TArysiyehua

115 天前

有用，但是跟楼上说的那样，要自己的兼容性强一点。
原因很简单，你说的模型训练都是针对于 Lora 等这种小模型，调调参数，换一下算法，底层的理论基础跟自己没啥关系，在 AI 还不是很确定的这几年，确实很容易替换，我目前差不多也这样。
这工作说白了就是一个胶水层，负责跟大模型与上层打交道。然后根据业务训练出专有的小模型。
等真正的 AI 核心都稳固的差不多了，还是很有前景的，原因就跟现在的开发模式差不多，有几个人整天研究底层框架，操作系统内核，虚拟机呢？大部分都不是，这些方向上的岗位需求少，人要求也高。

大部分人还是搞业务的，这个时候在此基础上的调参，RAG ，Lora 什么的就相当于一个框架，这个框架连接了底层的 AI 核心，只要你这玩意弄的足够好，未来说不定大家都用你的，就跟 Sping 这些玩意一样。