-
Notifications
You must be signed in to change notification settings - Fork 282
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
数据中前两列是什么意思? #2
Comments
好像没有用到吧,通过build_vocab()来看 |
有些列的数据在这里没有用到,可以忽略 |
@snowlord test1.sample数据是采样的很少量数据,不要用这个测试吧,最好用全量的 |
@white127 怎样采样,是从train文件进行采样吗?一个反例要设为多少?或者可以把你用的全量的上传 |
@snowlord ,主要是sample中的数据量少,所以你训练出来的模型效果可能会打折扣。正例和负例的数据量可以是1:1左右。全量的数据太大,不好传 |
我理解的top1是指,对于某一个问题,比如1个正例答案和499个负例答案,然后每一个去和问题算一个相似度,取最高的相似度吗? 我感觉这样的准确度达不到62%呢,是我理解有问题吗? |
是这样的 在 2016年10月18日 下午8:40,ssdf93 [email protected]写道:
|
LSTM-BASED DEEP LEARNING MODELS FOR NON-FACTOID ANSWER SELECTION 2016-10-19 20:57 GMT+08:00 cuixue [email protected]:
|
作者您好,我在阅读您的基于tensorflow的代码时,有个问题需要请教 |
同问 vectors被覆盖了,vectors.nobin这个文件有用到吗? |
这个忘记了,pretrain的词向量在这一份语料上用不用差异好像都不大。随机初始化的词向量也能有比较好的效果 同问 vectors被覆盖了,vectors.nobin这个文件有用到吗? |
第一列和第二列是什么意思?
The text was updated successfully, but these errors were encountered: