Cointime

扫码下载App
iOS & Android

剧情反转,抵制 AI 音乐的华纳签了位虚拟歌手

个人专家

撰文:木沐

从文字、图片、视频到语音、音乐,AIGC 已经渗入到人类的视听体验中,即便曾经因为版权问题极力抵制 AI 音乐的巨头,也不得不转变态度顺应时代产物。

今年 9 月,华纳音乐签约了首个虚拟歌手 Noonoouri;8 月,环球音乐与 YouTube 联手推出「音乐 AI 孵化器」,解决 AIGC 出现后的音乐版权问题。

相比海外,国内似乎对 AI 音乐的接受度更高。网易云音乐与小冰公司合作推出 AI 音乐辅助创作工具,并成立了首个虚拟歌手厂牌「WOWAIDO!」。

AI 模拟的律动、人声以虚拟歌手为载体推向大众,一改过去虚拟形象发出的机械感十足的电子合成声感,拥有了接近真人的嗓音。与此同时,形象多变、持续迭代虚拟歌手已经摇身一变成为 AI 歌手,逐渐打破虚拟与现实的区隔,延伸出更多的应用场景与商业价值。

华纳音乐签约虚拟歌手 Noonoouri

今年 9 月,在社交媒体 Instagram 上拥有 40 多万粉丝的虚拟网红 Noonoouri 与华纳音乐公司签订唱片合约,并发行了她的首支单曲《Dominoes》。Noonoouri 因此成为首个签订大型唱片合约的虚拟歌手。

Noonoouri 虚拟形象于 2018 年诞生,是由艺术创意人 Joerg Zuber 创造的动漫形象,角色定位是一位模特。以往的动漫人物为吸引粉丝的故事与剧情服务,Noonoouri 则是为高端时尚品牌代言而生,活跃在各大主流时尚杂志上,曾与 Dior、 Miu Miu、Calvin Klein 等国际大牌合作。

「出道」两年,Noonoouri 在 Ins 斩获 36 万粉丝,但在随后的两年里进入不温不火,粉丝量增长到 40 万就止步不前了。直到进入华纳音乐的艺人序列中,Noonoouri 解锁了「虚拟歌手」身份。Ins 上,单曲《Dominoes》的 MV 播放量超 25 万,成为「她」近年最具影响力的作品。

让虚拟人物动起来,有动画、CG 甚至动捕技术,但 Noonoouri 的声音是怎么来的?这就要收到 AI 给这位虚拟模特吹来的东风了。据悉,Noonoouri 在《Dominoes》中的歌唱部分,是在一名真实歌手的声音基础上借助人工智能技术合成的,作品的词曲创作人和乐手都将获得相应的版税和发行分成。

签下 Noonoouri 的华纳音乐在今年 4 月还因为版权问题抵制 AI 音乐,但几个月后,这家唱片巨头的态度变了。

另一家曾经拒绝 AI 的唱片公司环球音乐,在今年 8 月与 YouTube 牵手推出了「音乐 AI 孵化器」,据悉要与艺术家和音乐家「合作探索人工智能在音乐中的应用,并保护音乐作品版权」。此外,UMG 和 YouTube 的母公司谷歌也正在商谈授权艺人的声音和旋律来训练 AI 模型测事儿。

唱片公司对 AI 技术的转变不难理解。2023 年以来,AIGC 即生成式人工智能正在成为日常生活中一部分,从图文到视频再到音频的生产都在被 AI 改造,渗入大众的视听体验中。YouTube 首席执行官 Neal Mohan 曾表示,仅 2023 年,YouTube 上与生成式 AI 工具相关的视频观看次数就超过 17 亿次。

面对大众对 AIGC 的接受,唱片公司们也不得不转变思路,想想自身积累的版权资源能如何与 AI 结合,「训练模型 - 制造工具 - 激发创作」是一个不错且相对成熟的路线。事实上,音乐与新工具的结合早已不是新鲜事,早期的电子音乐合成器就是一个案例。

从合成器到 AI 造声平台

在正在热播的《乐队的夏天》中, 乐队「超级市场」以独特的电子音乐重新圈粉这个时代的年轻乐迷,而他们正是第一个将电子音乐带入中国的乐队。

逐渐被大众接受的电子音乐几乎都是由合成器制作完成。在电子音乐出现在早期,合成器自己就是个硬件,它产生的声音通过电信号仪表放大器后通过扬声器或耳机表达出来。进入计算机时代,越来越多合成器软件出现,从现代流行乐的制作来讲,只要你拥有一台电脑,你就完全有条件利用合成器软件制作出一首完整的音乐作品。

2004 年,乐器生产商 YAMAHA 推出了电子歌声合成软件 VOCALOID,让电子音乐的创作更加好上手。不只音乐,连人声唱歌都能实现,创作者只需要输入音调和歌词,就可以合成类似人类的歌声。VOCALOID 就是国内二次元圈里所称的「V 家」。

你或许对 VOCALOID 软件不熟,但你一定听说过初音未来、洛天依、星尘等虚拟偶像,他们的声音就来自于 VOCALOID。还记得芬兰传统民歌《耶娃波尔卡》被初音未来翻唱后效果吗?这首翻唱曲目以「甩葱歌」为名爆火。

初音未来翻唱的「甩葱歌」走红网络

YAMAHA 在开发 VOCALOID 时就用到了人工智能,或者说是 AI 的基础——大数据。他们通过采集大量的人类声音样本,以神经网络合成技术,制作成音源库。用户通过设定参数调用库里的声音,就可以产出人类歌唱的效果。

VOCALOID 的能力被很多虚拟偶像公司使用,但这些虚拟歌手的短板也十分明显,由于声音是电子合成,他们只要一开嗓,就带有明显的电音感和机械感。所以,V 家的应用范围大都仅限于二次元。

但 2023 年以来,虚拟人在 AI 视觉技术的迭代下变得越来越真,再给他们上电子音就会破坏好不容易升级出的真实感。AI 可以提升视觉效果,听觉也不在话下,声音大模型训练下的类人声开始经由虚拟人发出。

今年 6 月,曾推出「半藏森林克隆人」的小冰公司和网易云音乐合作,推出 AI 音乐创作软件「网易云音乐·X Studio」,还成立了包括 12 名虚拟歌手在内的厂牌「WOWAIDO!」,这些虚拟歌手既能唱摇滚,也能搞流行,音色覆盖甜美、可爱、悠扬等多种类型。在这些虚拟歌手的评论区里,有人说,「不敢相信这是 AI 唱出来的」。

值得注意的是,这些 AI 歌手的声音并非单纯「照搬」某一自然人的声音,每一个声音背后往往都由许多不同声源合成。据悉,声源量庞大且得到了授权。

解决了版权问题,AIGC 为虚拟人注入了「发声」能力。网易云音乐·X Studio 等 AI 创作工具的出现,让音乐人在几秒内就能获得演唱干声,通过参数调整,即可呈现一首歌曲想要被歌手呈现出的效果。

回想初音未来刚诞生时,目的也是为了解决制作人或编曲人找不到歌手的问题。这样一个造型出圈、无风格限制、颠覆传统人声的「声音容器」,也激发了制作人们不断尝试,这才有了虚拟偶像这么个行当。

正如「初音未来之父」伊藤博之所说:「数字作品是越被使用,其价值越高」,而创作者们在做的事,就是「为没有生命的事物注入灵魂」。

评论

所有评论

推荐阅读

  • Polymarket将于下周一公布重大消息,或为发币或融资相关消息

    Cointime 报道,3月21日消息,Polymarket 官方团队成员 Mustafa 于 X 平台发文表示,下周一即将公布重大消息。因推文内容包含硬币符号,社区猜测或为融资或代币发射相关重大消息。 此前消息,预测市场平台 Kalshi 与 Polymarket 据悉正与潜在投资者洽谈新一轮融资,目标估值均约为 200 亿美元。日前,Kalshi 已完成新一轮超 10 亿美元融资,估值达 220 亿美元,较去年 12 月上一轮融资时的 110 亿美元估值翻倍。知情人士透露,本轮融资由 Coatue Management 领投,Kalshi 目前的年化收入为 15 亿美元。

  • 美众议院金融服务委员会将于3月25日举行代币化听证会,聚焦资本市场未来

    3 月 21 日,美国众议院金融服务委员会将于美东时间 3 月 25 日 10:00 举行听证会,主题为「代币化与资本市场的未来」,预计将重点讨论区块链技术在金融体系中的应用与监管方向。

  • 黄金创43年来最大周跌幅:一周暴跌11%,避险属性遭质疑

    3 月 21 日,受中东局势升级及利率预期影响,黄金价格大幅下挫,创下自 1983 年以来最大单周跌幅。现货黄金周五跌至约 4488 美元/盎司,单周累计下跌约 11%,自 2 月底以来累计跌幅已超 15%。市场分析认为,美联储年内或维持利率不变、鲍威尔关于通胀上行的表态削弱了黄金吸引力。同时,在伊朗冲突背景下,比特币表现相对更强,期间反弹超 11%,对黄金形成对比。

  • 分析:加密市场山寨币交易量大幅下滑,市场兴趣持续降温

    3 月 21 日,Cryptoquant 分析师 Darkfost 发文称,加密市场山寨币交易量持续走低,投资者兴趣明显减弱。在熊市背景及地缘政治不确定性影响下,山寨币表现持续跑输比特币,风险偏好显著收缩。当前,Binance 山寨币日交易量约为 77 亿美元,其它主要交易所合计约 188 亿美元,远低于 2025 年 10 月与 2 月高峰期(Binance 曾达 400 亿至 500 亿美元,其它平台达 630 亿至 910 亿美元)。目前 Binance 占据约 40% 的市场份额。分析指出,历史上交易量高峰往往对应市场阶段性顶部与 FOMO 情绪释放,而当前低迷成交环境也意味着潜在机会通常出现在市场关注度最低阶段。

  • 消息人士:特朗普政府正制定方案以夺取伊朗核材料储备

    3 月 21 日,据美国哥伦比亚广播公司(CBS)报道,多位知情人士透露,特朗普政府一直在谋划获取或转移伊朗核材料的方法和选项。此时,由美国和以色列领导的针对伊朗的军事行动正进入一个更加不确定的阶段。关于特朗普是否会下令实施此类行动,目前时机尚不明确。一位消息人士表示,他尚未做出任何决定。但两位消息人士表示,相关规划的核心是可能部署来自联合特种作战司令部的部队,该部队是精英军事单位,常负责最敏感的防扩散任务。

  • 中东冲突与加息预期共振:全球资产大震荡,美股四连跌、债市「血洗」、黄金创43年最大周跌幅

    3 月 21 日,中东局势持续升级叠加 Federal Reserve 加息预期骤然升温,全球市场遭遇系统性冲击。美股连续第四周下跌创一年最长跌势,纳指单日跌超 2%,科技股全线承压;全球债市收益率大幅飙升,美债、英债、德债均创多年新高,资金大规模去杠杆。大宗商品剧烈分化,黄金跌破 4500 美元关口,单周暴跌超 10%,创 1983 年以来最大跌幅,避险属性遭质疑;原油则因中东供应风险暴涨,布油重返 110 美元上方,迪拜原油期货单日飙升超 16%。与此同时,比特币在 7 万美元附近获得支撑,连续三周跑赢黄金。市场分析认为,地缘冲突推升能源价格并加剧通胀预期,迫使货币政策路径重定价,全球金融条件快速收紧,风险资产仍处于下行与再定价过程中。

  • 美团开源560B参数定理证明模型:72次推理通过率97.1%,刷新开源模型SOTA

    据 1M AI News 监测,美团 LongCat 团队开源 LongCat-Flash-Prover,一个 5600 亿参数的 MoE 模型,专攻形式化定理证明语言 Lean4 的数学推理任务。模型权重以 MIT 协议发布,已上线 GitHub、Hugging Face 和 ModelScope。模型将形式化推理拆解为三项独立能力:自动形式化(将自然语言数学问题转化为 Lean4 形式语句)、草图生成(产出引理风格的证明框架)和完整证明生成。三项能力均通过 Agent 工具集成推理(TIR)与 Lean4 编译器实时交互验证。训练方面,团队提出 Hybrid-Experts Iteration Framework 生成冷启动数据,并在强化学习阶段引入 HisPO 算法稳定 MoE 模型的长程任务训练,同时加入定理一致性和合法性检测机制防止 reward hacking。基准测试显示,LongCat-Flash-Prover 在开源权重模型中刷新了自动形式化和定理证明两项 SOTA。MiniF2F-Test 上仅用 72 次推理即达 97.1% 通过率,ProverBench 和 PutnamBench 分别达到 70.8% 和 41.5%,每题推理次数不超过 220 次。

  • Erik Voorhees再次增持1.44万枚ETH,总持仓量突破11.7万枚

    3 月 21 日,据 AI 姨监测,ShapeShift 创始人、比特币早期支持者 Erik Voorhees 关联地址,过去 11 小时买入 14,424.53 ETH,总持仓突破 11.7 万枚,持仓均价 2,160.24 美元,当前浮亏 114.5 万美元。

  • 消息人士:特朗普政府正制定方案以夺取伊朗核材料储备

    Cointime 报道,3月21日消息,据美国哥伦比亚广播公司(CBS)报道,多位知情人士透露,特朗普政府一直在谋划获取或转移伊朗核材料的方法和选项。此时,由美国和以色列领导的针对伊朗的军事行动正进入一个更加不确定的阶段。 关于特朗普是否会下令实施此类行动,目前时机尚不明确。一位消息人士表示,他尚未做出任何决定。但两位消息人士表示,相关规划的核心是可能部署来自联合特种作战司令部的部队,该部队是精英军事单位,常负责最敏感的防扩散任务。(金十)

  • GameFi板块市值暂报45.15亿美元,FLOKI排名第一

    3 月 21 日,据 Coingecko 数据,GameFi 板块市值暂报 45.15 亿美元,FLOKI 以 2.86 亿美元市值排名第一,排在第二第三位的分别为:The Sandbox(2.18 亿美元)、Undeads Games(2.11 亿美元)。此前 Solana 基金会主席 Lily Liu 表示,区块链游戏「不会再回归」。她认为,尽管行业曾寄望通过链上资产与开放世界推动 Web3 与元宇宙发展,但实际表现远未达预期。市场观点称链游长期依赖「Play-to-Earn」等代币激励模式,却缺乏真正吸引核心玩家的游戏性与内容构建能力,导致用户留存与生态可持续性不足。包括 Andreessen Horowitz(a16z)、Framework Ventures、Animoca Brands 在内的机构曾向该领域投入数十亿美元,但回报表现不佳。