老八资源网-致力于打造全网最强免费精品资源分享站~
广告合作 我要投稿 联系老八
北城分享 辅助.png 流量卡.png 副业网.jpg 项目zy.jpg
北城分享 辅助.png 流量卡.png 副业网.jpg 项目zy.jpg
当前位置:网站首页 > 软件仓库 > Windows > 正文

[Windows] MD23:一个优于UVR的免费开源声音分离项目

作者:老八日期:2023-10-11分类:Windows




整合包地址:链接:https://pan.baidu.com/s/1B-6_G78qvndmmGSVsFuruw?pwd=70yf   提取码:70yf

摘要

本文介绍了MD23,一个优于UVR的免费开源声音分离项目。该方案在mvsep.com的SDR Vocals评价中取得了惊人的10.2196分,截止整合包打包日成为开源模型中得分最高的方案。本文将对该方案的技术细
1,介绍

声音分离是音频信号处理领域的重要研究方向,它涉及将混合的音频信号分解为单独的声音源。MD23作为一个新型声音分离项目,通过采用先进的分离算法,在SDR Vocals评价中获得了显著的高分,显示了其在声音分离领域的突破性成果


升级了主要MDX23C 8K FFT模型,可以将音轨分离成人声和器乐部分。在MultiSong数据集和合成数据集上的SDR指标得到了提升。相应地,在Ensemble 4和Ensemble 8模型上,分离结果也得到了改善。请参见下表中的变化。

算法名称MultiSong数据集 人声SDRMultiSong数据集 器乐SDRSynth数据集 人声SDRSynth数据集 器乐SDRMDX23 排行榜 人声SDR8K FFT,全频段(旧版本)10.0116.3212.0711.7710.858K FFT,全频段(新版本)10.1716.4812.3512.0611.04

添加了两个新模型,MVSep钢琴(演示版)和MVSep吉他(演示版)。这两个模型都基于MDX23C架构。这些模型可以将音乐高质量地分离成钢琴/吉他部分和其他部分。每个模型都有两个变体。在第一个变体中,神经网络模型直接应用于整个音轨。在第二个变体中,音轨首先分为人声和器乐两部分,然后神经网络模型只应用于器乐部分。在第二种情况下,分离质量通常会稍微更高。我们还准备了一个小型内部验证集,以比较模型在从主音轨中分离钢琴/吉他的分离质量上的表现。我们的模型与另外两个模型(Demucs4HT(6个声道)和GSEP)进行了比较。对于钢琴,我们有两个验证集。第一个集合包括电钢琴作为钢琴部分的一部分,第二个集合只包括原声钢琴。

注:所使用的度量标准是SDR(信号到失真比):数值越大表示分离效果越好。

评分榜

2,下载与安装使用
该整合包修改自https://github.com/jarredou/MVSEP-MDX23-Colab_v2  ,
修改部分代码使其本地运行

整合包地址:链接:https://pan.baidu.com/s/1B-6_G78qvndmmGSVsFuruw?pwd=70yf 
提取码:70yf
--来自百度网盘超级会员V7的分享


本文链接:https://www.lb1581.xyz/post/1888.html 转载需授权!

下载链接失效或者打不开的记得在评论区留言或者直接联系老八喔!

分享到:

亲!有什么想法呢?
  • 流泪

    0

  • 打酱油

    0

  • 开心

    42

  • 鼓掌

    43

  • 恐怖

    0

暂无评论,来添加一个吧。

取消回复欢迎 发表评论:

Copyright© 老八资源网 只分享精品!

本站资源来自互联网收集,仅供用于学习和交流,我们尊重任何软件和教程作者的版权,请遵循相关法律法规,本站一切资源不代表本站立场
侵权删帖/违法举报/商务合作/投稿等事宜联系QQ2780396291 或飞机:Laoba88Bot