V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
拼车信息请发到 /go/cosub 节点。

如果没有发送到 /go/cosub,那么会被移动到 /go/pointless 同时账号会被降权。如果持续触发这样的移动,会导致账号被禁用。
Livid
V2EX  ›  YouTube

YouTube 这类视频里的语音是 AI 么?

  •  
  •   Livid · 2023-02-25 12:12:48 +08:00 · 6661 次点击
    这是一个创建于 645 天前的主题,其中的信息可能已经有所发展或是发生改变。
    62 条回复    2023-03-06 09:01:05 +08:00
    KKLeon
        1
    KKLeon  
       2023-02-25 12:20:40 +08:00 via Android
    这个听起来不像 ai ,看了这个 up 主主页视频以及评论区,应该是 up 主自己解说的。印象比较深的 ai 解说,一般上来就是:男人怎么怎么怎么……
    botao1
        2
    botao1  
       2023-02-25 12:24:40 +08:00
    这个可能不是,但很多娱乐评论或者影视快剪类型都是 AI 直接读脚本,就那么 3 ,4 个语音库,偶尔遇到多音字会露馅
    kaishi123
        3
    kaishi123  
       2023-02-25 12:25:34 +08:00
    Ai 无疑,正常人不会把 雪藏 cang 念成雪 zang
    cmdOptionKana
        4
    cmdOptionKana  
       2023-02-25 12:25:58 +08:00
    口音不像 AI ,但如果专门拿一个人的口音来训练,AI 可以做到和这个人的念稿一模一样,主要是他的文案太书面语了,无法体现真人的优势。
    XiaoBaiYa
        5
    XiaoBaiYa  
       2023-02-25 12:26:31 +08:00
    很难判定,但节奏特征很像,
    1 、每句话中间停顿的时间基本一样
    2 、每个字使用的时间基本差不多
    kaishi123
        6
    kaishi123  
       2023-02-25 12:27:39 +08:00
    又听了一遍,应该是我听错了
    不过这个声音挺熟悉,会不会是把 ai 的声音调整了一下放上去?
    xuangoer666
        7
    xuangoer666  
       2023-02-25 12:28:07 +08:00 via Android
    @kaishi123 #3 我就会。。。
    KKLeon
        8
    KKLeon  
       2023-02-25 12:33:50 +08:00 via Android   ❤️ 2
    @kaishi123 你是不是听错了,我开大声音听了几遍,人家发音就是雪 cang 啊
    cmdOptionKana
        9
    cmdOptionKana  
       2023-02-25 12:34:50 +08:00   ❤️ 1
    一般优秀的讲解会加入大量口语,情绪波动也比较大,如果只是平平地念稿,那就算是真人,也只能得到 “不比 AI 好” 的评价。
    bjzhush
        10
    bjzhush  
       2023-02-25 12:38:29 +08:00
    这个是不是 AI 确实已经很难判定了
    但是我搭车举例一个同样很难判定的。
    之前看到过某做电话营销方案的技术分享,他们把非常多的话术做了以句为单位的录音,比如“您好”,“谢谢”,“您可以了解一下我们的产品”,“我们稍后联系您”
    然后通过程序打电话,判断用户的状态和需求,然后播放录音回复,这玩意也是半人半 AI ,不是心思缜密的大部分人听不出来对面其实不是真人,和这个难以判断是否 AI 的播音有异曲同工之妙。
    我接到推销电话,有这种怀疑的时候,一般会直接问,你姓什么?程序 99%都会卡住,正常人会回复
    KKLeon
        11
    KKLeon  
       2023-02-25 12:39:55 +08:00 via Android
    @cmdOptionKana 确实,这个 up 主的解说词写的一般,看了评论区以及跨越长周期的解说对比,应该是真人,但属于全程平平念稿。油管有个越哥说电影稿子解说都不错,就是标题经常用那种标准的标题党,也是为了吸引力吧
    country
        12
    country  
       2023-02-25 12:48:00 +08:00
    歪个楼,这个视频的仙剑配乐叫啥来着?谢谢
    asktao
        13
    asktao  
       2023-02-25 12:58:54 +08:00
    在 B 站也有账号 120 万粉丝。如果早期是原音这个大概率是 AI 。
    omcourseecust
        14
    omcourseecust  
       2023-02-25 12:59:40 +08:00
    @kaishi123 它读的是 cang 啊
    bobryjosin
        15
    bobryjosin  
       2023-02-25 13:02:11 +08:00
    读的没有情感像是 ai ,在 0:29 流氓这个词一般读法都是[liú máng],而视频中读的感觉像是[liú mǎng],氓这个字只有 méng 和 máng ,这两种读音。
    Jamari
        16
    Jamari  
       2023-02-25 13:11:43 +08:00 via iPhone
    怎么了,你的平台不让 ai 就算了,人家的平台你还管得着?
    pista
        17
    pista  
       2023-02-25 13:12:59 +08:00 via Android
    这不叫 AI 吧,顶多语音转文字
    HY3
        18
    HY3  
       2023-02-25 14:10:02 +08:00
    @bobryjosin 就是这个我感觉才是真人,AI 虽然朗读没感情不过不会音不准。
    sNullp
        19
    sNullp  
       2023-02-25 14:13:27 +08:00
    @pista 楼主的意思应该是 TTS
    sNullp
        20
    sNullp  
       2023-02-25 14:14:07 +08:00
    @HY3 应该是文案打错了,比如达成了流莽
    ck65
        21
    ck65  
       2023-02-25 14:33:19 +08:00   ❤️ 1
    @country 新仙剑《群山飛鶴》
    Ericcccccccc
        22
    Ericcccccccc  
       2023-02-25 14:34:32 +08:00
    很像是 AI 配音的.
    ck65
        23
    ck65  
       2023-02-25 14:38:44 +08:00
    普通话 93 分用户表示,如果是 TTS ,厂商大概率会做成普通话一甲水平(不讨论地方话版本)。但视频的咬字听起来有太多不好的习惯,以及朗诵的中重格式各种蹩脚,所以猜测这不是 TTS ,最多是个很非主流的 TTS ,大概率是真人朗读。看楼下老师傅怎么说。
    KevZhi
        24
    KevZhi  
       2023-02-25 14:47:03 +08:00
    缺少非常多真人朗诵时的情绪变化特征,怀疑大概率是 TTS 。重音标注到位是可以达到这个效果的。
    SZP1206
        25
    SZP1206  
       2023-02-25 16:21:10 +08:00
    听起来是真人
    stabc
        26
    stabc  
       2023-02-25 16:41:32 +08:00
    听不出来。不过如果是真人朗读,那么朗读的水平很差,心不在焉。比如里面一句“他都想不到给钟萍一个承诺”,这句话逻辑重音应该在“承诺”,而解说里重音放在了“钟萍”。
    sillydaddy
        27
    sillydaddy  
       2023-02-25 16:47:32 +08:00
    有一个小细节,0:50~0:52 ,
    字幕是「接受外国电影的熏陶」,但读时把「外国」读成了「国外」。
    sincus
        28
    sincus  
       2023-02-25 16:51:08 +08:00
    我从头看到尾了,应该不是 ai.
    cbais7890
        29
    cbais7890  
       2023-02-25 17:14:26 +08:00
    基本可以断定是 AI, 通过每集片尾的几个固定语句 "我们下_期再见" 的固定停顿和基本完全一致的速度和语调, 如果不是 AI 的话很难做到每集都完全一致.
    fackVL
        30
    fackVL  
       2023-02-25 17:31:18 +08:00 via iPhone
    真人,然后调了语速所以听起来有点怪
    chihiro2014
        31
    chihiro2014  
       2023-02-25 17:55:18 +08:00   ❤️ 1
    让我想起了大壮,小美,翠花
    vsean
        32
    vsean  
       2023-02-25 17:57:50 +08:00
    听口音,这个像是真人,不是 AI
    AOK123
        33
    AOK123  
       2023-02-25 18:11:27 +08:00
    真人,念名字“崔明亮”的时候语气语调不像 AI
    Wobuguan
        34
    Wobuguan  
       2023-02-25 18:19:35 +08:00 via Android
    我认为是 AI ,听久了断句节奏基本一样。
    Myprajna
        35
    Myprajna  
       2023-02-25 18:24:52 +08:00
    只要没在别的地方没听过就是真人。
    6c9fd
        36
    6c9fd  
       2023-02-25 18:38:02 +08:00
    格外疏远几个字让我觉得应该不是 AI
    ashong
        37
    ashong  
       2023-02-25 18:40:13 +08:00
    不像, 感觉目前视频网站 AI 配音就那几个
    jwenjian
        38
    jwenjian  
       2023-02-25 18:44:50 +08:00
    "这裤子工人穿着干不成活", “裤子”和“工人”中间没有停顿, 我听起来 95%是 AI
    Dragonphy
        39
    Dragonphy  
       2023-02-25 18:45:00 +08:00
    lks 的那期声音 AI 视频已经让我怀疑人声了,我已经无法分辨了
    UnderAbove
        40
    UnderAbove  
       2023-02-25 19:11:58 +08:00 via iPhone
    念到陈凯歌的名字时,「陈」字有较为明显的哨音。不应该是 AI 。
    idealhs
        41
    idealhs  
       2023-02-25 19:16:26 +08:00
    没听过类似的 AI 语音,确实没法判断
    想听不是 AI 语音的,建议看 B 站 up 恐怖地带来恐怖
    freepoint
        42
    freepoint  
       2023-02-25 19:53:05 +08:00
    听着有点像,语调基本一致。鉴定完毕 over
    Tlvncks
        43
    Tlvncks  
       2023-02-25 19:55:42 +08:00   ❤️ 1
    @country #12 里面有多段配乐,其中一段应该是仙剑奇侠传二里的《蝶恋》
    LaurelHarmon
        44
    LaurelHarmon  
       2023-02-25 20:06:40 +08:00
    完了,已经快分不出来了。
    ji39
        45
    ji39  
       2023-02-25 20:11:02 +08:00
    没人写稿,直接 ai 接管内容输出语言,厉害了
    Herry001
        46
    Herry001  
       2023-02-25 20:11:50 +08:00
    找到个最早的视频,要么是换人了要么显而易见…… https://www.bilibili.com/video/BV1Dt411e72p/
    Tlvncks
        47
    Tlvncks  
       2023-02-25 20:42:43 +08:00   ❤️ 1
    @country #12 仙剑奇侠传四《寂难永劫 - 玄霄主题曲》-骆集益
    cmdOptionKana
        48
    cmdOptionKana  
       2023-02-25 21:35:58 +08:00
    @idealhs 哈哈哈哈,我也爱看这个 “痛!太痛了!”
    MC
        49
    MC  
       2023-02-25 22:32:30 +08:00
    有可能是用 veed 做的,他们的 tts 库效果很好
    https://www.veed.io/
    MC
        50
    MC  
       2023-02-25 23:06:59 +08:00
    但是我用 veed 的 男性声音全部听了一遍,并没有影片里的这个声音,可能是真人?
    hoky
        51
    hoky  
       2023-02-25 23:11:28 +08:00
    @MC 这个支持中文?
    vesx484
        52
    vesx484  
       2023-02-25 23:48:11 +08:00 via iPhone
    是真人
    nnegier
        53
    nnegier  
       2023-02-26 03:57:36 +08:00 via Android
    好电影,好解说
    DreamWeaver2016
        54
    DreamWeaver2016  
       2023-02-26 07:22:20 +08:00 via iPhone
    应该是真人吧
    lurui45
        55
    lurui45  
       2023-02-26 10:33:06 +08:00
    这个电影当时我没看得下去,看了这个解说真的拍得好,70 ,80 那代青年何尝不曾有梦想,到头来大部分人还是要蜷缩在小乡镇里过一辈子。
    fengleiyidao
        56
    fengleiyidao  
       2023-02-26 10:55:34 +08:00
    @MC
    通过调各种参数,甚至后期处理,是可以做出不一样的声音的。
    camus
        57
    camus  
       2023-02-26 11:03:51 +08:00
    @kaishi123 只从错别字而言,你高估了有些读稿“机器”的文化水平了……
    a90120411
        58
    a90120411  
       2023-02-26 20:00:34 +08:00
    感觉是真人,解说的还挺好的。
    MC
        59
    MC  
       2023-02-26 23:19:38 +08:00
    @fengleiyidao 对的,语气之类都能调,不过 veed 我仔细看了下,其实是微软的那套 tts 。
    @hoky 是的,本质上是微软 tts ,支持多种语言,不光是中文
    sisteryu100
        60
    sisteryu100  
       2023-02-26 23:57:10 +08:00 via iPhone   ❤️ 1
    XXX 分鐘看電影基本上都是,除非是一些特別老牌的博主。
    wenzaiquan199
        61
    wenzaiquan199  
       2023-02-28 00:36:00 +08:00
    @kaishi123 #3
    你是不是听错了,我听了几遍都是 cang
    nijux
        62
    nijux  
       2023-03-06 09:01:05 +08:00
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2941 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 12:43 · PVG 20:43 · LAX 04:43 · JFK 07:43
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.