V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
marquina
V2EX  ›  OpenAI

大模型 Tools(Function Calling)实用性分析 - 以媒体信息解析为例

  •  
  •   marquina · 68 天前 · 837 次点击
    这是一个创建于 68 天前的主题,其中的信息可能已经有所发展或是发生改变。

    作为一个喜欢收集影视资源的人,笔者面临的一个任务是:从文件名中解析出格式化的媒体信息(信息源统一为The Movie Database (TMDB)),方便整理文件,如:

    文件名 格式化信息
    Young.Woman.and.the.Sea.2024.2160p.DSNP.WEB-DL.H265.HDR.DDP5.1.Atmos-ADWeb.mkv {'title': '泳者之心', 'genre': 'movie', 'year': 2024}
    [動畫瘋] 物語系列 第外季&第怪季[9][1080P].mp4 {'title': '物语系列', 'genre': 'tv(anime)', 'year': 2009, 'tv_season_num': 5, 'tv_episode': 9}

    那么,在给定文件名的情况下,怎么用大语言模型( LLM ,以下简称大模型) + TMDB API 来完成媒体信息的解析工作呢?这篇文章应运而生。

    当然,解析媒体信息 + 整理媒体文件(或者说媒体文件刮削),已经有很多现成的解决方案,如nas-toolsjellyfin,笔者更多是想探索大模型的可能性。


    "太长不看"的总结:

    • qwen-plus-latest (qwen 2.5) 强于 deepseek-chat (v2.5),gpt-4o-mini/gemini-1.5-flash 落后
    • Tools(Function Calling)在机器间交互不好用,笔者的 JSON 调用模式效率&效果更优。

    原文链接:大模型 Tools(Function Calling)实用性分析 - 以媒体信息解析为例 - OrangeWolf 的博客

    4 条回复    2024-09-21 15:09:25 +08:00
    anonydmer
        1
    anonydmer  
       68 天前
    看了原文,挺好的,楼主可以再加个 kimi 的测试一下,它有一个原生 JSON Mode 的功能
    TimePPT
        2
    TimePPT  
       68 天前 via Android
    实体抽取输出 json 现在 gpt4o 有 json schema 模式
    neteroster
        3
    neteroster  
       68 天前 via Android
    4o mini 也可以传 json schema
    marquina
        4
    marquina  
    OP
       68 天前
    @anonydmer #1
    @TimePPT #2
    @neteroster #3
    其实文章围绕的点是“如何更好地让大模型调用外部函数”,是否用 json mode 区别不大😂
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3251 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 12:43 · PVG 20:43 · LAX 04:43 · JFK 07:43
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.