关于InsuranceQA训练语料转，负样本采样 #25

Fyweven · 2018-10-12T07:16:33Z

代码中训练数据的获取接口是： utils.gen_train_batch_qpn(train_data, FLAGS.batch_size)
但是在该函数中
def gen_train_batch_qpn(_data, batch_size):
psample = random.sample(_data, batch_size)
nsample = random.sample(_data, batch_size)
q = [s1 for s1, s2 in psample]
qp = [s2 for s1, s2 in psample]
qn = [s2 for s1, s2 in nsample]
return np.array(q), np.array(qp), np.array(qn)
psample和nsample获取方式一样？？

zemu121 · 2018-10-31T09:02:24Z

我也有同样的疑问，你明白了吗？

zemu121 · 2018-10-31T09:03:15Z

train_data中只有qp，没有qn吧

Fyweven · 2018-10-31T09:07:01Z

train_data中只有qp，没有qn吧

直接从所有问题中随机选择了一个，作为负样本

zemu121 · 2018-10-31T09:34:46Z

train中的数据都是正样本，nsample也是从train中随机选取的，所以qn其实也是正确的答案？

Fyweven · 2018-10-31T10:20:52Z

train中的数据都是正样本，nsample也是从train中随机选取的，所以qn其实也是正确的答案？
并不是，是所有的问题，也有可能采样到正样本，但是概率很低，大概率是qn

zemu121 · 2018-11-02T01:22:42Z

我明白了，非常感谢你的回复。

zemu121 · 2018-11-06T03:01:22Z

如果将模型变成一般处理图像的模型，就是利用小滑窗，多次卷积，max_pooling，你觉得可行吗

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

关于InsuranceQA训练语料转，负样本采样 #25

关于InsuranceQA训练语料转，负样本采样 #25

Fyweven commented Oct 12, 2018

zemu121 commented Oct 31, 2018

zemu121 commented Oct 31, 2018

Fyweven commented Oct 31, 2018

zemu121 commented Oct 31, 2018

Fyweven commented Oct 31, 2018

zemu121 commented Nov 2, 2018

zemu121 commented Nov 6, 2018

关于InsuranceQA训练语料转，负样本采样 #25

关于InsuranceQA训练语料转，负样本采样 #25

Comments

Fyweven commented Oct 12, 2018

zemu121 commented Oct 31, 2018

zemu121 commented Oct 31, 2018

Fyweven commented Oct 31, 2018

zemu121 commented Oct 31, 2018

Fyweven commented Oct 31, 2018

zemu121 commented Nov 2, 2018

zemu121 commented Nov 6, 2018