基于DPCRN的模型优化
(可以参考模型GTCRN来优化DPCRN模型)
DPCRN模型参数量大概为787.15 k模型计算量为1.74 GMac。https://arxiv.53yu***/
要求:
1.最好情况就是模型参数量和计算量比DPCRN模型小的同时,PESQ,STOI,MOS等音频指标比DPCRN好。
2.如果修改后的模型参数量和计算量比DPCRN模型小,但是效果没有DPCRN效果好,那就与以前的模型(NOISY,NSNET2,DTLN,DCCRN)效果要好。总之就是说,在减小DPCRN的参数量和计算量的同时,要比之前发布的模型效果要好。
我更偏向于实现第二种(标红),这种实现起来相较于第一种难度要小不少。
训练集和验证集:
我这里有2020DNS语音数据集,训练模板。在此之外,2021DNS数据集、WSJ0-MUSAN等数据集也可以,可以选择其一。可以参考DPCRN论文(https://arxiv.53yu***/
)中数据集的选择以及模型对比的方法。