ここは私の卒業研究用のリポジトリです.公開することを想定していなかったため大分ぐちゃぐちゃです.
AnimateDiffのリポジトリ に従い導入してください.プロンプトはEvalCrafterのもの を使用しました.
Python=3.10
torch=1.13.1
transformers=4.30.2
後は何でもいいと思う
言語埋込モデルの変更などはコメントアウトをいい感じにつけたり外したりしてください.
TimeSformer-GPT2 を使用する場合:
python "V2S_TimeSformer-GPT2%20Video%20Captioning.py"
Vision Transformer+GPT2 を使用する場合:
python V2S_vit-gpt2-image-captioning.py
CLIPScore を使う場合:
python Clip_Score.py
caption.ipynb
で行っていましたが,普通にぐちゃぐちゃなので新しく作ったほうが早いと思います.
発表資料などは 卒論
フォルダに,論文の翻訳は 工業英語
フォルダに入っています.活用しても構いませんが,工業英語の課題は自力でやりましょう.思っているより早く終わると思います.
フォルダの中身は逐一整理しましょう.