V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
jackqian
V2EX  ›  程序员

音乐解构者-开发者日志

  •  
  •   jackqian · 2023-08-10 02:14:10 +08:00 · 1235 次点击
    这是一个创建于 479 天前的主题,其中的信息可能已经有所发展或是发生改变。
    https://vocal.damaoai.com

    之前没有写这个日志,今天补充一下。首先感谢大家伙的支持,上线两天时间注册了 200 个用户,这是我没有想到的,也给了我继续维护更新的动力,这两天 v 友们反馈了很多问题,我也在不断的修复中,感谢大家的反馈,这些天我也在不断的优化代码,提高分离质量

    今天我发布了一个小版本更新,修复了一些小问题,我们更换了新的分离音乐的模型,分离质量有了大幅度的提升!!!赶紧去尝试一下,遗憾的是,分离速度也有大幅度的降低,平均一首歌大概在 2-3 分钟,之前的模型在 15 秒左右,当然我觉得这是值得的

    如果有什么意见建议或者 bug 反馈,可以加入 qq 群讨论 721775103

    即将更新(预计本周末)
    准备支持更多音轨,可以分离鼓声,贝斯,其它乐器,和人声,背景声
    准备支持自定义分离质量,高质量的分离耗时会更久,消耗点数会更多
    准备优化页面,增加进度显示
    10 条回复    2023-08-10 18:35:51 +08:00
    jackqian
        1
    jackqian  
    OP
       2023-08-10 02:15:00 +08:00
    之前还有很多兑换码未被使用,如果未使用过,还能兑换
    9D925379EE50EF2
    4799C025891F652
    5085FFEFA1D8563
    474ACBAE0CEE774
    756C4B4A32E04F6
    39A17374F6D835F
    63757725C063B04
    74544BFBF95E3C2
    97DC3F3FFDC1F83
    D54C761BF1F1E50
    4EB2BEE1488A646
    E60B3599D97ED5D
    054EDEDEA897CCC
    C504C6C30D54383
    ABA0C68A1A91C71
    02944AAA847FA6E
    EA0F6C36E1AEA25
    12C7D5EA1649D35
    4BF9BD6BBFD084E
    0BBAEC8467EC1E9
    C1B848B6DFA3BB0
    5FBB2C9E897D3B5
    A67D4CCFB503B10
    D9D17EF9501018A
    E783AC6A3DEF4C1
    28D918770853561
    AD0165B365B5DE2
    8D13705205EAF14
    5FF185CA8E8FE4C
    230C7874347F6BF
    D8D5DE8B47E2AFD
    9008ACAC2151076
    517343D3CAF9D48
    4CEBBEBC9681AA8
    514BB4FC7866DC9
    1F36D5A19775B04
    F72228CA19B21FC
    55BF89BE3E965A7
    2D412FB62514EB1
    5449B0F22EF8DB1
    0B7EFED0989D215
    0CD19D4A7D6BCAA
    750A43027BFE8BF
    4EF7B2B0226BE52
    26D929417A5A19C
    2F1FFCFF1C73982
    4E7375D35641372
    B70190AE813C0AF
    47A3EE518791E0F
    2DCF5B2F6C8E4DF
    cnbatch
        2
    cnbatch  
       2023-08-10 03:26:04 +08:00
    我记得上个帖子有人提到另一个网站,也是干这个事的,看完那个网站的功能后我有点失望

    OP 也终于跟上了那个网站的功能,应该说能够满足多数人的需求,像我这种少数派除外

    因为我喜好的音乐并非流行乐、也不是爵士乐、也不是电子音乐,而是交响乐与歌剧

    所以我在上一个帖子会提到分离声部、分离单个乐器、分割和声,就是这个原因

    看来以目前的通用模型还做不到这种分离,难度可能相当于普通听众直接要求交响乐团当场排练分轨录音

    目前的通用模型可能都分不清定音鼓与大鼓(单奏都分不清的话,可能滚奏就更加没法分),分不清小提琴与中提琴(音域有重叠)。其他理论上分得清的乐器,比如单簧管、双簧管、巴松管、圆号、长号等等,目前的模型都没把它们单独分出来。

    于是那个网站以及 OP 的成品应该是暂时与我绝缘了

    最后来个猜测,大概是因为需要结合乐谱?
    我从未做过模型训练这种事这不是这个行业的,所以有个疑问:现在的 AI 模型经过训练后,能够理解多国文字,连口音差异比较大的部份语言的口语语音都能大致正确理解,却无法训练成理解音乐声部与乐谱?
    sunmoon1983
        3
    sunmoon1983  
       2023-08-10 09:35:28 +08:00
    gmail,live 都收不到邮件呀
    AMaiNya
        4
    AMaiNya  
       2023-08-10 09:39:24 +08:00
    @sunmoon1983 +1, qq 也收不到。
    sunmoon1983
        5
    sunmoon1983  
       2023-08-10 09:53:25 +08:00
    我靠,OP 不是为了收集邮件吧?
    jackqian
        6
    jackqian  
    OP
       2023-08-10 10:16:34 +08:00
    @sunmoon1983
    @AMaiNya
    @sunmoon1983
    邮箱被封了,刚去解封了。再试一下,
    下次还是换短信或者微信登陆吧。。。
    jackqian
        7
    jackqian  
    OP
       2023-08-10 10:22:20 +08:00
    上次准备自己搭建邮箱服务,用了开源的 poste.io, 在网页上能发出邮件
    ,但是我用 java 库去调用的时候就是发不出去,网上也没有什么可参考的文档,最后还是用回了 outlook 邮箱来发送
    levon
        8
    levon  
       2023-08-10 16:57:32 +08:00
    能把歌曲里的吉他、贝斯、鼓之类的分离吗。
    或者把视频里的背景配乐和实际场景声音进行分离吗。
    jackqian
        9
    jackqian  
    OP
       2023-08-10 17:22:22 +08:00
    @levon
    贝斯、鼓的分离已经可以了,但是还没上线,有些页面还没改好,这周末应该会上
    背景配乐和实际场景声音 我没试过。
    levon
        10
    levon  
       2023-08-10 18:35:51 +08:00
    @jackqian 期待
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2600 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 07:12 · PVG 15:12 · LAX 23:12 · JFK 02:12
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.