本文作者:kaifamei

一种基于PSO-BP神经网络的民族乐器识别方法

更新时间:2025-12-27 06:12:11 0条评论

一种基于PSO-BP神经网络的民族乐器识别方法


一种基于pso-bp神经网络的民族乐器识别方法
技术领域
1.本发明属于音频处理技术领域,尤其涉及一种基于pso-bp神经网络的民族乐器识别方法。


背景技术:



2.中国传统民族乐器的识别与分类,不仅有助于我们研究其巨大的科学研究价值,而且可以让世界更多的人能够了解中国民族乐器。近年来,国内不少的研究学者对中国民族乐器识别分类问题也进行了深入的研究,期望实现中国民族乐器准确的识别与分类。
3.现有技术中提出了基于lvq的神经网络分类算法,具有构造简单、输入矢量不必根据需要而进行归一化、正交换等长处。现有技术中还提出了隐马尔可夫分类算法,这种模型可以根据数据库大量信息的进行学习,推测出当某一个音或某几个音出现时接下来出现各个音的可能性,产生新的音乐。
4.但是现有技术中,面对高维问题也会有过早的收敛的问题,而且算法局部搜索能力比较差,搜索精度还不够高。


技术实现要素:



5.本发明实施例的目的在于提供一种基于pso-bp神经网络的民族乐器识别方法,旨在解决面对高维问题也会有过早的收敛的问题,而且算法局部搜索能力比较差,搜索精度还不够高的问题。
6.本发明实施例是这样实现的,一种基于pso-bp神经网络的民族乐器识别方法,所述方法包括:
7.输入数据源,利用mel滤波器对数据源进行滤波处理,提取得到标准梅尔倒谱参数特征mfcc;
8.利用提取得到的标准梅尔倒谱参数特征mfcc对pso-bp神经网络分类模型进行训练;
9.将需要识别的民族乐器音频输入经过训练的pso-bp神经网络分类模型,得到识别结果。
10.优选的,构建所述pso-bp神经网络分类模型的步骤,具体包括:
11.初始步优化与特定粒子结构的参数,所述参数包括粒子在集的元素个数、最大迭代的发生次数、粒子的位置和速度;
12.通过适应度函数来评估和计算各种粒子适应度值,并进行评价;
13.根据粒子适应度值分别对pbest和gbest进行更新,根据速率公式更新整个粒子的中心位置和移动速度,判断是否满足输出条件,若满足条件则输出结果,否则返回上一步骤;
14.将经过改进pso算法进行计算优化后的最优权值和阈数值分别传递给具有bp的神经网络分类模型,输入训练集,进行逻辑学习与计算训练,训练完成后得到pso-bp神经网络
分类模型。
15.优选的,所述输出条件为迭代次数达到限定次数或者获得最佳适应度值。
16.优选的,改进pso算法中采用线性向量递减算法惯性向量权重算法,公式如下:
17.ω(k)=ω
start-(ω
start-ω
end
)(t
max-k)/t
max

18.其中,ω
start
为初始惯性权重,ω
end
为迭代至最大次数时的惯性权重,k为当前迭代代数,t
max
为最大迭代代数情况下,惯性权值取值为ω
start
=0.9,ω
end
=0.4。
19.优选的,输入数据源,利用mel滤波器对数据源进行滤波处理,提取得到标准梅尔倒谱参数特征mfcc的步骤,具体包括:
20.输入数据源,通过高通滤波器进行预加重处理,所述高通滤波器为:
21.h(z)=1-μz-1
,式中μ为0.98;
22.对数据点进行分帧,1024点被划分为一帧,
23.加上汉明窗,对每一帧数据点进行fft变换,将所有的能量谱经由一组12个mel尺度的三角形滤波器组,mel滤波器组的公式如下:
[0024][0025]
式中,
[0026][0027]
经过离散余弦变换后,得到标准梅尔倒谱参数特征mfcc。
[0028]
优选的,提取标准梅尔倒谱参数特征mfcc时,同时提取相应的一阶差分计算参数和二阶差分计算参数,则mfcc的全部差分计算参数是由12维mfcc系数+12维一阶差分计算参数+12维二阶差分计算参数组成的36维mfcc差分计算参数。
[0029]
优选的,差分计算参数的计算采用如下公式:
[0030][0031]
式中,表示第m个一阶差分计算参数,cm表示第m个梅尔倒谱系数,q表示梅尔倒谱系数的阶数,k表示一阶导数的时间差,将上式的结果再代入得到二阶差分计算参数。
[0032]
本发明实施例的另一目的在于提供一种基于pso-bp神经网络的民族乐器识别系统,所述系统包括:
[0033]
特征提取模块,用于输入数据源,利用mel滤波器对数据源进行滤波处理,提取得到标准梅尔倒谱参数特征mfcc;
[0034]
模型训练模块,用于利用提取得到的标准梅尔倒谱参数特征mfcc对pso-bp神经网络分类模型进行训练;
[0035]
乐器识别模块,用于将需要识别的民族乐器音频输入经过训练的pso-bp神经网络
分类模型,得到识别结果。
[0036]
本发明实施例的另一目的在于提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上所述基于pso-bp神经网络的民族乐器识别方法的步骤。
[0037]
本发明实施例的另一目的在于提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上所述基于pso-bp神经网络的民族乐器识别方法的步骤。
[0038]
本发明实施例提供的一种基于pso-bp神经网络的民族乐器识别方法,创建了pso-bp神经网络的分类系统,使用建立的中国乐器特征的训练集对pso-bp神经网络进行学习训练,训练后得到训练好的pso-bp神经网络分类模型,使用分类模型对测试集进行识别和分类测试。总体实验结果表现很好,识别率均超过99%,平均分类准确率为99.78%,超过了现行算法,本发明具有较高的准确性与实用性。
附图说明
[0039]
图1为本发明实施例提供的一种基于pso-bp神经网络的民族乐器识别方法的流程图;
[0040]
图2为本发明实施例提供的一种基于pso-bp神经网络的民族乐器识别系统的架构图;
[0041]
图3为本发明实施例提供的pso-bp神经网络模型的架构图。
具体实施方式
[0042]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0043]
可以理解,本技术所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但除非特别说明,这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本技术的范围的情况下,可以将第一xx脚本称为第二xx脚本,且类似地,可将第二xx脚本称为第一xx脚本。
[0044]
如图1所示,为本发明实施例提供的一种基于pso-bp神经网络的民族乐器识别方法的流程图,所述方法包括:
[0045]
s100,输入数据源,利用mel滤波器对数据源进行滤波处理,提取得到标准梅尔倒谱参数特征mfcc。
[0046]
s200,利用提取得到的标准梅尔倒谱参数特征mfcc对pso-bp神经网络分类模型进行训练。
[0047]
s300,将需要识别的民族乐器音频输入经过训练的pso-bp神经网络分类模型,得到识别结果。
[0048]
随着人工智能算法的发展,bp神经网络逐渐成为应用最广泛的神经网络。但是传统的bp神经网络还存在一些问题:bp神经网络算法的收敛率较快;由于bp的神经网络获得目标函数的算法从本质上来说属于梯度式的下降方法,由于实际生活中的目标函数都是非
常复杂的,这样就使得bp神经网络的算法计算量大而且会有严重的冗余;为了能够执行算法,就不能再使用传统的一维搜索的方式来计算每次迭代的步长,而必须将每次迭代步长的最小更新准则预先赋予bp神经网络,这样的方法也会导致算法的迭代缓慢。
[0049]
以上种种原因,导致bp神经网络算法的收敛效率低和运行速度慢的问题。为了彻底解决这些问题,我们建立了一种改进后的bp神经网络,在其原有模型的基础上又添加了动量项:bp算法由于在权值调整时基于梯度式下降方法,因此容易产生振荡,收敛的速度也变慢。为大大提高bp网络的收敛速度,可以在权值调整的过程中适当地加入一个动量项,对其进行改进,权值和阈值调整公式为:
[0050]
σ(k)=σ(k-1)+δσ(k)+θ[σ(k-1)-σ(k-2)],
[0051]
式中,σ(k),σ(k-1),σ(k-2),分别为k,k+1,k-2的权值,θ为动量的学习率。
[0052]
粒子优化算法(pso)和蚁优化算法(aco)同样都被认为是属于全局优化的并行算法,搜索的过程一般都是从一个被问题理解的集合中出发开始的,而不是从一个单个或少数个体中出发开始的,它们同样也具有一种非常隐含的全局优化和搜索的特性,从而极大地降低了算法在局部陷入一个极小的问题概率。并且因为这种计算模型实现方式的并行性,容易在其他计算机上直接进行仿真和实现,算法的运行性能和计算效果也都因此得以大大改善。但是在aco算法中,每一个单独的个体都只能够感知到局部的信息,每个个体之间的信息无法相互交流,使用每一个蚂蚁并不能直接使用到整个局部的信息。所以基础的蚁算法通常都是需要很长的搜索时间,且很容易发生停滞。而在pso算法过程中的每个粒子之间都可以进行信息交互,所以在很大程度上这也就是一种基于当前信息进行分析数据共享的更新机制,整个数据搜索和信息更新的过程其实就是一个粒子跟随当前整体最优点的更新过程。所以对于一般问题,pso算法比aco更加高效。且pso算法主要是被广泛的应用在连续性问题上,aco算法更多的适用于离散问题,所以对于神经网络这类连续问题,pso算法比aco算法更加适合。但是pso算法还仍然存在着一些早熟收敛,搜索结果速率慢,容易陷入使用局部最优值等问题。针对以上问题,本发明对pso算法的惯性权重进行改进惯性权重体现的是粒子继承先前的速度的能力,一个较大的惯性权值有利于全局搜索,而一个较小的惯性权值则更利于局部搜索。为了更好的平衡算法的全局搜索与局部搜索能力,提出了一种线性向量递减算法惯性向量权重算法(linear decreasing inertia weight,ldiw),公式如下式所示:
[0053]
其中,ω
start
为初始惯性权重,ω
end
为迭代至最大次数时的惯性权重,k为当前迭代代数,t
max
为最大迭代代数情况下,惯性权值取值为ω
start
=0.9,ω
end
=0.4。随着迭代的持续进行,惯性向量权重由0.9线性变化递减至0.4,算法运行初期较大的局部惯性向量使得算法可以保持了较强的全局搜索计算能力,而迭代后期较小的局部惯性向量权重则更有利于进行更精确的局部搜索。
[0054]
在本实施例中,将一种新型改进pso算法与一种新型bp神经网络相结合,改进后的pso算法可以优化网络的初始权值和阈值。将网络优化后的权值和阈值传递到bp神经网络,然后进行训练与分析预测,以有效防止网络在训练的过程中可能陷入一个局部极值,提高了网络的训练效率与速度和学习能力,优化了网络的性能。模型的建立过程如下:
[0055]
步骤1:初始步优化与特定粒子结构有关的各个参数,主要所指的参数是粒子在集的元素个数;最大迭代的发生次数、粒子的位置和速度等。
[0056]
步骤2:通过选择合理的适应度函数来评估和计算各种粒子对其适应度值,并进行评价。
[0057]
步骤3:根据粒子适应度的数值分别对pbest和gbest进行更新,接着根据速率公式更新整个粒子的中心位置和移动速度,然后判断是否满足输出条件(迭代次数达到限定次数或者获得最佳适应度值),如果满足条件则输出结果,否则返回步骤2
[0058]
步骤4:将经过计算所提取得到的最优权值解,即经过一个改进的pso算法对其数值进行计算优化后的最优权值和阈数值分别传递反馈给具有bp的神经网络分类模型,然后将准备好的训练集带入模型对模型进行逻辑学习与计算训练,待训练完成后便得到pso-bp神经网络分类模型;pso-bp神经网络模型如图3所示。
[0059]
在本发明的一个实施例中,mfcc的提取过程如图3所示,首先,我们对采样率为22050hz采样率的单声道音频进行预加重,预加重处理其实是将语音信号通过一个高通滤波器:
[0060]
h(z)=1-μz-1
,式中μ为0.98;
[0061]
对数据点进行分帧,1024点被划分为一帧,
[0062]
加上汉明窗,对每一帧数据点进行fft变换,将所有的能量谱经由一组12个mel尺度的三角形滤波器组,mel滤波器组的公式如下:
[0063][0064]
式中,
[0065][0066]
经过离散余弦变换后,得到标准梅尔倒谱参数特征mfcc。
[0067]
最后经过离散余弦变换(dct)后,得到中国民族乐器的标准梅尔倒谱参数特征mfcc。标准的梅尔倒谱参数mfcc只是直接反映了中国民族乐器的各种静态音特性,乐器的动态音特性一般可以用这些静态音特征的差分计算参数来描述。一阶离散差分计算参数就是离散函数中连续两个相邻的帧两项之差;如果定义值为x(k),则定义y(x)=x(k+1)-x(k),这就是此离散函数的一阶离散差分计算参数,物理学的意义就是当前一个语音帧与前一帧之间的关系,体现前一帧与当前语音帧(连续相邻两帧)之间的函数联系;在一阶离散差分计算参数的基础上,z(x)=y(k+1)-y(k)=x(k+2)-2*x(k+1)+x(k)为此函数的二阶离散差分计算参数.二阶离散差分计算参数主要表示的关系是一阶离散差分与一阶离散差分之间的函数关系。即前一阶动态差分与后一阶动态差分之间的关系,体现在帧上就是相邻三帧之间的三阶动态差分关系。将动态、静态识别乐器音特征分类结合应用起来,能够更加全面有效地提高自动识别特征分类的效果。故本章实验不仅分别提取了一个标准化的mfcc,还分别提取了它的一阶、二阶差分计算参数,因此,mfcc的全部差分计算参数是由:12维mfcc系数+12维一阶差分计算参数+12维二阶差分计算参数,组成的36维mfcc差分计算参数。差分计算参数的计算可以采用下面的公式:
[0068][0069]
式中,表示第m个一阶差分计算参数,cm表示第m个梅尔倒谱系数,q表示梅尔倒谱系数的阶数,k表示一阶导数的时间差,将上式的结果再代入得到二阶差分计算参数。
[0070]
在本发明的一个实施例中,改进的粒子优化算法相关参数设置为:粒子种体积大小系数设置为20,最大迭代转换次数为2000,粒子的最大移动速度系数设置为20,初始化的学习影响因子设为c1=2,c2=2.8。惯性权值取值为为ω
start
=0.95、ω
end
=0.35[23]。改进的bp神经网络模型的输入层设置为36个神经元,用于输入36维的音乐信号特征神经网络的隐含层节点数对bp神经网络预测训练精度有较大的影响,隐含层节点数太少,网络不能很好地学习,需要增加训练次数。训练的精度也受影响;隐含层节点数太多,训练时间增加,网络容易过拟合。由于隐藏层的逼近的样函数变化剧烈、波动很大,要求可调整地连接权数多,所以隐层的节点数也应该多,而且为了提高识别的准确率所以隐藏层采用公式m=(2n+1),即73个节点,待分类的语音信号共有4类,为笛子,二胡,古筝,唢呐四种中国传统乐器,,所以输出层设置bp最佳隐含层节点数选择可参考如下公式4个神经元。用于输出实验结果,输出[1000]表示为笛子,输出[0100]表示为二胡,输出[0010]表示为古筝,输出[0001]表示为唢呐。使用准备好训练集bp神经网络分类模型进行学习训练。本市实力准备了2000组乐器的mfcc特征,从中随机选择1500组数据作为训练数据来训练网络,剩下的500组数据作为测试数据,测试网络分类能力将提取到的36维mfcc特征向量作为bp神经网络的输入向量,网络的连接的权重设置为0.1,训练次数设置为50次,分类的准确率如下:
[0071]
笛子二胡古筝唢呐0.9960.9990.9990.996
[0072]
本发明以标准的mfcc的研究为基础,提取了其中的还有一阶、二阶差分计算参数,将动、静两种特征相互地结合在一起来表示作为特征。现在大多数乐器研究人员采用的传统的bp神经网络分类器普遍会出现训练周期太久、识别和分类工作准确率不够高等问题,本文针对传统bp神经网络模型的这些问题进行了改善,将粒子算法与经过改进后的bp算法有机地相结合,创建了pso-bp神经网络的分类系统,使用建立的中国乐器特征的训练集对pso-bp神经网络进行学习训练,训练后得到训练好的pso-bp神经网络分类模型,接着使用分类模型对测试集进行识别和分类测试。总体实验结果表现很好,识别率均超过99%,平均分类准确率为99.78%,超过了现行算法,表明了我们建立的模型具有较高的准确性与实用性。
[0073]
如图2所示,为本发明实施例提供的一种基于pso-bp神经网络的民族乐器识别系统,所述系统包括:
[0074]
特征提取模块100,用于输入数据源,利用mel滤波器对数据源进行滤波处理,提取得到标准梅尔倒谱参数特征mfcc;
[0075]
模型训练模块200,用于利用提取得到的标准梅尔倒谱参数特征mfcc对pso-bp神经网络分类模型进行训练;
[0076]
乐器识别模块300,用于将需要识别的民族乐器音频输入经过训练的pso-bp神经网络分类模型,得到识别结果。
[0077]
在一个实施例中,提出了一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0078]
所述方法包括:
[0079]
输入数据源,利用mel滤波器对数据源进行滤波处理,提取得到标准梅尔倒谱参数特征mfcc;
[0080]
利用提取得到的标准梅尔倒谱参数特征mfcc对pso-bp神经网络分类模型进行训练;
[0081]
将需要识别的民族乐器音频输入经过训练的pso-bp神经网络分类模型,得到识别结果。
[0082]
在一个实施例中,提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:
[0083]
所述方法包括:
[0084]
输入数据源,利用mel滤波器对数据源进行滤波处理,提取得到标准梅尔倒谱参数特征mfcc;
[0085]
利用提取得到的标准梅尔倒谱参数特征mfcc对pso-bp神经网络分类模型进行训练;
[0086]
将需要识别的民族乐器音频输入经过训练的pso-bp神经网络分类模型,得到识别结果。
[0087]
应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
[0088]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0089]
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实
施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0090]
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
[0091]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

技术特征:


1.一种基于pso-bp神经网络的民族乐器识别方法,其特征在于,所述方法包括:输入数据源,利用mel滤波器对数据源进行滤波处理,提取得到标准梅尔倒谱参数特征mfcc;利用提取得到的标准梅尔倒谱参数特征mfcc对pso-bp神经网络分类模型进行训练;将需要识别的民族乐器音频输入经过训练的pso-bp神经网络分类模型,得到识别结果。2.根据权利要求1所述的基于pso-bp神经网络的民族乐器识别方法,其特征在于,构建所述pso-bp神经网络分类模型的步骤,具体包括:初始步优化与特定粒子结构的参数,所述参数包括粒子在集的元素个数、最大迭代的发生次数、粒子的位置和速度;通过适应度函数来评估和计算各种粒子适应度值,并进行评价;根据粒子适应度值分别对pbest和gbest进行更新,根据速率公式更新整个粒子的中心位置和移动速度,判断是否满足输出条件,若满足条件则输出结果,否则返回上一步骤;将经过改进pso算法进行计算优化后的最优权值和阈数值分别传递给具有bp的神经网络分类模型,输入训练集,进行逻辑学习与计算训练,训练完成后得到pso-bp神经网络分类模型。3.根据权利要求2所述的基于pso-bp神经网络的民族乐器识别方法,其特征在于,所述输出条件为迭代次数达到限定次数或者获得最佳适应度值。4.根据权利要求2所述的基于pso-bp神经网络的民族乐器识别方法,其特征在于,改进pso算法中采用线性向量递减算法惯性向量权重算法,公式如下:ω(k)=ω
start-(ω
start-ω
end
)(t
max-k)/t
max
,其中,ω
start
为初始惯性权重,ω
end
为迭代至最大次数时的惯性权重,k为当前迭代代数,t
max
为最大迭代代数情况下,惯性权值取值为ω
start
=0.9,ω
end
=0.4。5.根据权利要求1所述的基于pso-bp神经网络的民族乐器识别方法,其特征在于,输入数据源,利用mel滤波器对数据源进行滤波处理,提取得到标准梅尔倒谱参数特征mfcc的步骤,具体包括:输入数据源,通过高通滤波器进行预加重处理,所述高通滤波器为:h(z)=1-μz-1
,式中μ为0.98;对数据点进行分帧,1024点被划分为一帧,加上汉明窗,对每一帧数据点进行fft变换,将所有的能量谱经由一组12个mel尺度的三角形滤波器组,mel滤波器组的公式如下:式中,经过离散余弦变换后,得到标准梅尔倒谱参数特征mfcc。
6.根据权利要求1所述的基于pso-bp神经网络的民族乐器识别方法,其特征在于,提取标准梅尔倒谱参数特征mfcc时,同时提取相应的一阶差分计算参数和二阶差分计算参数,则mfcc的全部差分计算参数是由12维mfcc系数+12维一阶差分计算参数+12维二阶差分计算参数组成的36维mfcc差分计算参数。7.根据权利要求6所述的基于pso-bp神经网络的民族乐器识别方法,其特征在于,差分计算参数的计算采用如下公式:式中,θ
m
表示第m个一阶差分计算参数,c
m
表示第m个梅尔倒谱系数,q表示梅尔倒谱系数的阶数,k表示一阶导数的时间差,将上式的结果再代入得到二阶差分计算参数。

技术总结


本发明适用于音频处理技术领域,尤其涉及一种基于PSO-BP神经网络的民族乐器识别方法及系统,所述方法包括:输入数据源,利用mel滤波器对数据源进行滤波处理,提取得到标准梅尔倒谱参数特征MFCC;利用提取得到的标准梅尔倒谱参数特征MFCC对PSO-BP神经网络分类模型进行训练;将需要识别的民族乐器音频输入经过训练的PSO-BP神经网络分类模型,得到识别结果。本发明创建了pso-bp神经网络的分类系统,使用建立的中国乐器特征的训练集对pso-bp神经网络进行学习训练,训练后得到训练好的pso-bp神经网络分类模型,使用分类模型对测试集进行识别和分类测试。总体实验结果表现很好,识别率均超过99%,平均分类准确率为99.78%,超过了现行算法,本发明具有较高的准确性与实用性。本发明具有较高的准确性与实用性。本发明具有较高的准确性与实用性。


技术研发人员:

李峰 王玲玲

受保护的技术使用者:

安徽财经大学

技术研发日:

2022.08.10

技术公布日:

2022/11/4


文章投稿或转载声明

本文链接:http://www.wtabcd.cn/zhuanli/patent-1-34713-0.html

来源:专利查询检索下载-实用文体写作网版权所有,转载请保留出处。本站文章发布于 2022-12-12 16:56:30

发表评论

验证码:
用户名: 密码: 匿名发表
评论列表 (有 条评论
2人围观
参与讨论