-
Notifications
You must be signed in to change notification settings - Fork 26
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
如何生成训练数据? #25
Comments
生成SMS-WSJ的步骤请参考这个仓库 https://github.com/fgnt/sms_wsj |
请问一下,那个数据集生成训练数据相对方便一点呀? |
其实 SMS-WSJ 算是比较方便的了 |
请问一下,WHAMR! 这个数据是不是按照生成方式生产完了就可以直接训练了?是不是要生成立体声数据? |
是的,这个数据集使用的就是原WHAMR!数据集,没有做额外的操作 |
请问我训练时的误差突然变成这个了,学习率出问题了吗? python SharedTrainer.py fit Epoch 62 metrics: val/neg_si_sdr=-11.5534 val/metric=11.5534 val/sdr=14.1095 val/nb_pesq=2.8877 |
大概是训练梯度出了问题,可能是半精度训练导致的,你试试从出问题前的一个epoch使用32精度继续训练 |
请问训练在线模型这样写训练代码是对的吗? python SharedTrainer.py fit 但是我这里报了一个错误: 我查看onlineSpatialNet.yaml 这个文件注释掉了,是为啥呀? |
你把{}删掉,把stft的参数设置为合适的就行。注释掉的原因是想使用者自行设置stft参数,因为不同数据集的参数不一样,因此无法给一个通用的 |
多谢您的回复,现在训练起来了! 再请教一下: |
可以的 |
请问一下:我的训练到这里就崩了,前面有这样一个错误,但是能训练,请问是怎么回事? [2024-05-08 18:49:23,275] [5/31] torch._dynamo.variables.higher_order_ops: [ERROR] unimplemented(f"comparison {typestr(left)} {op} {typestr(right)}") |
请问您最后使用了哪个数据集呢?如何获取wsj0?在官网上注册了说要等管理员接受。 |
wsj0,这个数据要下载,得是会员 |
感谢,我等等回复 |
抱歉,我没有遇到过这个错误,所以我的经验也不多 |
请问只有wsj0的话您是如何处理的?直接make的话会报错 |
请问一下:我训练了一个2通道实时的模型,训练代码如下: python SharedTrainer.py fit 但是获得的训练结果如下: Epoch 93 metrics: val/neg_snr=-6.6020 val/metric=6.6020 val/sdr=7.8546 val/neg_si_sdr=-5.0815 val/nb_pesq=2.1652 这个SDR远远低于您论文里披露的24+,这是学习率的问题吗?我应该怎样调整呢?谢谢 |
您好,您这个训练是基于2通道的SMS-WSJ-Plus数据集的?该数据集比SMS-WSJ更难,结果更差是正常的。SMS-WSJ-Plus六通道的结果对应于文章中Table I。 |
请问一下,我只关注降噪,不关注分离,就是我只希望输出单通道数据,应该怎样改这个架构呢?谢谢 |
我当时把--model.arch.dim_output改成2跑的,相当于输出一个语音 |
多谢,那个dataset也要改吧?你用的是configs/datasets/sms_wsj_plus.yaml 这个配置文件吗? |
我用pyroomacoustics模拟的多通道,只包含一个说话人的语音,但是training_loss变NAN了,后面我就没管了😢 |
没有wsj0数据集,我用aishell里wav文件改成wsj0的文件名和目录,用sms_wsj 里make生成的总报错,该怎么获取wsj0数据集呢? |
请问一下,我目前只有LDC93S6A这个数据集,在运行 sms_wsj 的make时总是出错,所以只生成了wsj_8k_zeromean(里面是wav文件)和wsj_8k_zermean.json(这文件里的性别,转录文本都是空的,我的kaldi跑不通)这两个文件,我的最终目标是把这个模型应用到2mic的阵列上,进行降噪。我要如何才能跑通这个例子呀?是不是只需要有干净数据就行了?有没有一步一步的操作步骤呀?
The text was updated successfully, but these errors were encountered: