μ΄ νλ‘μ νΈλ βνκ΅ μλ₯ μνμμ μ°μν μ±μ μ λΌ μ μλ μκ·λͺ¨ AI λͺ¨λΈβ μ λ§λ€κΈ° μν΄ μμλμμ΅λλ€.
GPT, Claude, Gemini λ± λκ·λͺ¨ μΈμ΄ λͺ¨λΈμ΄ μ΄λ―Έ λ€μν μνμμ μ’μ μ±μ μ κ±°λκ³ μμ§λ§, μ νλ μμμΌλ‘λ λ°μ΄λ μ±λ₯μ λΌ μ μλ μκ·λͺ¨ λͺ¨λΈμ λν μ°κ΅¬ λ° μ€νμμ€ μνκ³κ° νμνλ€κ³ νλ¨νμ΅λλ€.
λ³Έ νλ‘μ νΈμμλ Multiple-Choice QA νμ€ν¬μ λν μ루μ μ μ 곡ν©λλ€.
- GPU : Tesla V100 GPU Server 32GB
- Python: 3.10.x
- CUDA: 12.1
- PyTorch: 2.5.1+cu121
git clone https://github.com/boostcampaitech7/level2-nlp-generationfornlp-nlp-13-lv3.git
cd level2-nlp-generationfornlp-nlp-13-lv3
pip install -r requirements.txt
κΈ°λ³Έμ μΌλ‘ νΈνλλ λ°μ΄ν° μμμ λ€μκ³Ό κ°μ΅λλ€.
id | paragraph | question | choices | answer | question_plus |
---|---|---|---|---|---|
1 | μμ μ§λ¬Έ1 | μμ μ§λ¬Έ1 | A, B, C, D | A | μΆκ° μ§λ¬Έ1 |
2 | μμ μ§λ¬Έ2 | μμ μ§λ¬Έ2 | A, B, C, D | C | μΆκ° μ§λ¬Έ2 |
3 | μμ μ§λ¬Έ3 | μμ μ§λ¬Έ3 | A, B, C, D, E | D | μΆκ° μ§λ¬Έ3 |
λ‘ μ΄λ£¨μ΄μ§ λ°μ΄ν°μ
λλ€.
κ° μ»¬λΌμ λ€μμ μλ―Έ ν©λλ€.
- id(str) - λ°μ΄ν° κ³ μ μ idλ₯Ό λνλ λλ€.
- paragraph(str) - λ¬Έμ μ μ§λ¬Έμ λνλ λλ€.
- question(str) - λ¬Έμ μ μ§λ¬Έμ λνλ λλ€.
- choices(list) - μ νμ§λ₯Ό λνλ λλ€.
- answer(str) - μ νμ§ μ€μ μ λ΅ νλλ₯Ό λνλ λλ€.
- question_plus(str) - μΆκ° μ§λ¬Έμ λνλ λλ€.
μ νμμ csv νμΌμ μλ μμ²λΌ λ£μ΄μ£Όλ©΄ λ©λλ€.
level2-nlp-generationfornlp-nlp-13-lv3/
βββ data/
β βββ train/
β β βββ train.csv
β βββ val/
β β βββ val.csv
β βββ test/
β βββ test.csv
...
huggingface.co μμ API Key
λ₯Ό λ°κΈ λ°μ ν
run/run_train_qwen_best.sh μμ HUGGINGFACE_TOKEN
μ λ£λ κ²μ κΆμ₯ν©λλ€.
run/run_train_qwen_best.sh --nohup
- --nohup: nohup λͺ¨λ μ€ν μ¬λΆ
huggingface.co μμ API Key
λ₯Ό λ°κΈ λ°μ ν
run/run_inference_qwen_best.sh μμ HUGGINGFACE_TOKEN
μ λ£λ κ²μ κΆμ₯ν©λλ€.
run/run_inference_qwen_best.sh --nohup
- --nohup: nohup λͺ¨λ μ€ν μ¬λΆ
huggingface.co μμ API Key
λ₯Ό λ°κΈ λ°μ ν
run/run_train+inference_qwen_best.sh μμ HUGGINGFACE_TOKEN
μ λ£λ κ²μ κΆμ₯ν©λλ€.
run/run_train+inference_qwen_best.sh
config/qwen2.5_32B_unsloth_best_config.yaml μ νλ ¨ νλΌλ―Έν° λ° λ°μ΄ν° κ²½λ‘κ° μ§μ λμ΄μμ΅λλ€.
configμμ μ§μ ν΄μΌν key-value pair
λ default_arguments.pyμ qwen_arguments.pyλ₯Ό μ°Έμ‘°λ°λλλ€.
level2-nlp-generationfornlp-nlp-13-lv3
βββ config/
β βββ qwen2.5_32B_unsloth_best_config.yaml
β βββ default_arguments.py
β βββ qwen_arguments.py
β
...
project-name/
β
βββ data/ # λ°μ΄ν°μ
ν΄λ
β
βββ notebooks/ # κ°μΈμ© μμ
μ₯(νλ‘μ νΈ μ°Έμ¬μκ° νκ³ μΆμ μ€ν)
β
βββ src/ # μμ€ μ½λ
β βββ data/ # λ°μ΄ν° λ‘λ, μ μ₯ λ° μ²λ¦¬ μ½λ
β βββ models/ # λͺ¨λΈ μ μ λ° κ΅¬μ‘° μ½λ
β βββ training/ # νμ΅ λ£¨ν, μμ€ ν¨μ, μ΅μ ν κ΄λ ¨ μ½λ
β βββ evaluation/ # λͺ¨λΈ νκ° μ½λ (λ©νΈλ¦ κ³μ° λ±)
β βββ utils/ # 보쑰 ν¨μλ μ νΈλ¦¬ν° μ½λ
β βββ visualization/ # μκ°ν μ½λ
β
βββ experiments/ # μ€ν κ΄λ¦¬ ν΄λ(checkpoint λ±)
β
β
βββ scripts/ # μ€ν κ°λ₯ν μ€ν¬λ¦½νΈ (μ£Όλ‘ νμ΄μ¬ μ§μ
μ )
β βββ train.py # νμ΅ μ€ν¬λ¦½νΈ
β βββ evaluate.py # νκ° μ€ν¬λ¦½νΈ
β βββ predict.py # μμΈ‘ μ€ν¬λ¦½νΈ
β
βββ run # μ½μ μ€ν μλν μ€ν¬λ¦½νΈ
| βββ run.sh
βββ config/ # μ€μ νμΌ (νμ΄νΌνλΌλ―Έν° λ° κ²½λ‘ μ€μ )
β
β
βββ requirements.txt # νμν Python ν¨ν€μ§ λͺ©λ‘
βββ README.md # νλ‘μ νΈ κ°μ λ° μ€λͺ
βββ .gitignore # Gitμμ μ μΈν νμΌ λͺ©λ‘
νλ‘μ νΈμ κΈ°μ¬νκ³ μΆμΌμλ©΄ [email protected] μ μ°λ½μ μ£ΌμΈμ.
μ΄μλ₯Ό λ°κ²¬νμ
¨μΌλ©΄ issue trackerμ 리ν¬νΈν΄μ£ΌμΈμ.
If you'd like to contribute to this project, please contact us at [email protected].
If you find any issues, please report them in the issue tracker.
κΈ°ν μ§λ¬Έ λ° ν λ‘ μ¬νμ Github Discussionμ λ¨κ²¨μ£Όμλ©΄ λ©λλ€.
For any other questions or discussion topics, please leave them in the GitHub Discussion.
- Github Discussion : Gihub Discussion
κΉνμ | μ΄μ¬λ£‘ | μ΄μ μΈ | μ΄νν | μνν | μ΅νμ° |
---|---|---|---|---|---|
νμ | μν |
---|---|
κΉνμ | νμΈνλ λΌμ΄λΈλ¬λ¦¬ νμ, λͺ¨λΈ νμ, νμ΄νΌνλΌλ―Έν° μ€ν, μ΄λν° λ³ν© μ€ν, μΈλΆ λ°μ΄ν°μ μ μ²λ¦¬ |
μ΄μ¬λ£‘ | λͺ¨λΈ νμ, λͺ¨λΈ κ²½λν, νλμ¨μ΄ μ΅μ ν, λ©λͺ¨λ¦¬ λΆμ |
μ΄μ μΈ | EDA, λ°μ΄ν° νν°λ§ λ° μ μ²λ¦¬, λ°μ΄ν° μ¦κ° λ° μ£Όμ λΆλ₯, νμ΄νΌνλΌλ―Έν° μ€ν |
μ΄νν | EDA, PDF QA pair μμ±, ν둬ννΈ μ‘°ν©, ννΈ μμ± LLM νμΈνλ μλ |
μνν | EDA, λ°μ΄ν° νν°λ§ λ° μ μ²λ¦¬, λ°μ΄ν° μ¦κ°, λͺ¨λΈ νμ λ° μ€ν, LoRA λ° λͺ¨λΈ νμ΄νΌνλΌλ―Έν° μ΅μ ν, νμΈνλ μ€ν, μμλΈ μ€ν |
μ΅νμ° | EDA, λ°μ΄ν° νν°λ§ λ° μ μ²λ¦¬, λͺ¨λΈ μ€ν νκ²½ ꡬμ±, μ½λλ² μ΄μ€ κ°μ λ° μ¬μ©μ± ν₯μ, μ€ν μν λ° λ³΄κ³ |