AIGC 多模态如何实现？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 525 天前的主题，其中的信息可能已经有所发展或是发生改变。

比如用户输入了一组字符串，我怎么判断他 User 是需要 AI 回复文本还是作图还有（未来可能支持）作曲或视频？

6 条回复 • 2023-06-29 12:45:43 +08:00

raycool

2023-06-28 21:43:41 +08:00

NLP 语义理解

airyland

2023-06-28 22:23:42 +08:00

调一次 ChatGPT 的 function call 解析成结构化数据

x77

2023-06-28 22:27:03 +08:00

@airyland

function_call: auto ，它返回的内容是怎么样的？

conhost

2023-06-28 23:59:48 +08:00

NLP 里面有意图识别，之前的任务机器人就是按照先进行意图识别，再进行槽位抽取。目前的大模型可能是反映成不同的 prompt

x77

2023-06-29 11:32:20 +08:00

@conhost

AWS 或者 Azure 有没有提供这种服务？或者推荐个 NLP 云服务？

x77

2023-06-29 12:45:43 +08:00

看了下 OpenAI 的文档，function 可能可以实现，但是感觉很麻烦。让 gpt 模型调用我预置好函数，如果一段自然语言夹杂着作画指令，模型调用我的函数时它怎么给我传递参数？我又改如何从杂乱的信息里提取有效的参数。。。