WikiWithSenti が本研究のモデル WS-BERT が従来研究のモデル
Data: Pstance: P-Stanceのデータセットとwikipediaの情報がが入っている VAST: VASTのデータセットとwikipediaの情報がが入っている
Results: 結果の出力場所. nohupに出力する場合はnohup.outを見て
src: datasets.py: データをモデルへ入力 engine.py: 学習と評価. Line 81, 82 で学習終了条件のコードがある. ある程度F1値が上がらない場合に学習終了. models.py: ゲーティングメカニズムなどをするところ (λが行列) train.py: 学習設定 correctmodel.py: 学会発表後にゲーティングメカニズムが上手く導入できていなかったことに気づき, 修正したもの(λが一つの値)がここには書かれている
Wikipediaと感情分析を利用したスタンス検出
PStance, COVID19-Stance 利用していない VAST.
-
VAST このデータセットが従来研究などで一番利用されている
-
Pstance Google Driveからデータセットをダウンロードした後、data/pstanceというフォルダーに入れ, Jupiter Notebookでデータセットの前処理を行う. preprocessing.pyをして, データの前処理を行う
-
COVID19-Stanceこのデータセットは利用不可能
Pytorch と Huggingface Transformersをインストール
PStance, 固有ターゲットのスタンス検出, Biden
python run_pstance_biden.py
PStance, クロスターゲット, Biden
python run_pstance_biden2sanders.py
VAST, ゼロショット/数ショットのスタンス検出
python run_vast.py
Issei Matsumoto, Akihiro Tamura, Kato Tsuneo:
Combining knowledge from Wikipedia and sentiment information for stance detection
The 86th National Convention of IPSJ (IPSJ2024)