河南农业科学 ›› 2026, Vol. 55 ›› Issue (2): 144-155.DOI: 10.15933/j.cnki.1004-3268.2026.02.016
付小朋1,2,周昕2,王星博2,徐杏2,吴越2,谢荣辉3,单颖4,叶春林1,周卫东2
FU Xiaopeng1,2,ZHOU Xin2,WANG Xingbo2,XU Xing2,WU Yue2,XIE Ronghui3,SHAN Ying4,YE Chunlin1,ZHOU Weidong2
摘要: 呼吸道疾病是规模猪场常见高发疫病之一,及时准确发现猪呼吸道疾病典型临床症状如咳嗽声对于实现早期预警、预防至关重要。以怀孕中期母猪咳嗽、尖叫、打呼噜声音为研究对象,提出了基于卷积神经网络和双向长短期记忆网络(CNN-BiLSTM)融合的猪咳嗽声识别模型,通过四阶巴特沃斯带通滤波器降噪、一阶高通滤波器预加重、短时能量端点检测等方法预处理猪声数据,采用分帧、加窗、快速傅里叶变换等方法提取预处理后声音数据的梅尔频率倒谱系数(MFCC)特征参数,并对模型识别性能进行评价。结果表明,采用四阶巴特沃斯带通滤波器降噪处理可明显降低猪咳嗽声、尖叫声和打呼噜声的背景噪音,且波形无失真,猪声信号的主要能量保留完整;一阶高通滤波器预加重可明显增强高频区域能量,减弱低频区域能量,缩小区域范围;端点检测可快速标出猪声的有效语音段,减少无关信息对识别模型的干扰;通过提取预处理声音数据的MFCC特征参数可较好地反映猪声的声学特性,将MFCC系数作为特征输入用于模型的识别。融合卷积神经网络与双向长短期记忆网络的深度神经网络(CNN-BiLSTM)模型具有良好的收敛性,混淆矩阵显示,猪咳嗽声、尖叫声和打呼噜声正确识别率分别为83.67%、85.19%和81.58%,说明模型具有良好的泛化能力;五折交叉验证显示,平均准确率为84.03%(82.79%~85.31%);CNN-BiLSTM模型在测试集上的准确率为83.93%,优于Transformer、CNN、LSTM和BiLSTM模型。由此,所提出的CNN-BiLSTM模型在识别猪咳嗽声上具有良好的性能,能够为猪只呼吸道疾病早期检测提供新的方法。
中图分类号: