-
Notifications
You must be signed in to change notification settings - Fork 282
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
复现结果较低 #29
Comments
效果不好可能两个原因
1. 检查下代码是否有问题
2. 参数需要调整
Cunxiao Du <[email protected]> 于2019年3月13日周三 上午10:47写道:
… 哥们您好,我也是做nlp的。
自己尝试复现了一下,发现效果不好,我的结构就是q,a都过lstm(两边共享的参数),然后maxpooling得到向量,cos之后triplet
loss,但是只跑到了0。5,而且跑得非常慢,我一个q采样了100个negative
a,想问一下啊您的模型快不快呢?我大约要一天才能收敛,参数都是我从别人论文里面找来的。。。
—
You are receiving this because you are subscribed to this thread.
Reply to this email directly, view it on GitHub
<#29>, or mute the
thread
<https://github.com/notifications/unsubscribe-auth/ABffULqACgig-ABVsNJmMS1wnEIBReHwks5vWGbHgaJpZM4bsR9F>
.
|
感觉不是参数的问题,因为我都是用的一篇iclr的论文里面的,老哥我想问一下您的模型收敛的快吗?谢谢您的回复,十分感谢~ |
不过我的框架也很您不太一样,我是用MXNET的,感觉这种数据集比较小,很有可能就出现这种问题 |
神经网络的模型就是调参要麻烦些,有几个思路:
1. 把loss和precision画出来,看看收敛趋势,是不是early stop
2. 对比下其他算法,看是不是数据集的问题,如果其他算法的准确率远高于这个,那就是代码问题了
Cunxiao Du <[email protected]> 于2019年3月13日周三 下午1:51写道:
… 不过我的框架也很您不太一样,我是用MXNET的,感觉这种数据集比较小,很有可能就出现这种问题
—
You are receiving this because you commented.
Reply to this email directly, view it on GitHub
<#29 (comment)>,
or mute the thread
<https://github.com/notifications/unsubscribe-auth/ABffUI9tq0mxBPqNsjg98FJPF9_KZsODks5vWJHFgaJpZM4bsR9F>
.
|
印象中,LSTM的模型要几个小时吧,在这个数据集上,训练
Cunxiao Du <[email protected]> 于2019年3月13日周三 下午1:51写道:
… 不过我的框架也很您不太一样,我是用MXNET的,感觉这种数据集比较小,很有可能就出现这种问题
—
You are receiving this because you commented.
Reply to this email directly, view it on GitHub
<#29 (comment)>,
or mute the thread
<https://github.com/notifications/unsubscribe-auth/ABffUI9tq0mxBPqNsjg98FJPF9_KZsODks5vWJHFgaJpZM4bsR9F>
.
|
那你很快了,我非常慢,可能是哪里有问题了 |
非常感谢您的回复!!!如果有缘再现实生活中见面,请您吃饭哈哈哈 |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
哥们您好,我也是做nlp的。
自己尝试复现了一下,发现效果不好,我的结构就是q,a都过lstm(两边共享的参数),然后maxpooling得到向量,cos之后triplet loss,但是只跑到了0。5,而且跑得非常慢,我一个q采样了100个negative a,想问一下啊您的模型快不快呢?我大约要一天才能收敛,参数都是我从别人论文里面找来的。。。
The text was updated successfully, but these errors were encountered: