python 3.9.12
torch 2.0.0
transformers 4.29.1
rank-bm25 0.2.2
ckip-transformers 0.3.4
wikipedia 1.4.0
hanlp 2.1.0b49
從google drive id=1T6jpOtdf_i6XNYA6F_lqU4mRRh1xYPcl下載資料,GitHub放不下
直接跑script,可以參考https://github.com/huggingface/transformers/tree/main/examples/pytorch/text-classification
- 以WikiAPI_retriever.py抽取10篇document
- 以word_segmentation.py將claim斷詞,再以bm25_retriever.ipynb抽取100篇document
- 以document_retrieval.ipynb混合WikiAPI及BM25的document
- 使用sent_retrieval_train.py進行訓練
- 使用sent_retrieval_test.py進行預測
- 使用claim_verification_train.py進行訓練
- 使用claim_verification_test.py進行預測