-
Notifications
You must be signed in to change notification settings - Fork 5
์๋ผ
๋ชฉ์ฐจ
06/03
06/02
06/01
05/31
05/30
05/29
05/28
05/27
05/26
05/25
05/24
๐ Experiments
-
user์ ๊ฐ์ ์ํ์ง๋ฅผ ์ฐ๋ฌ์ ๋ณด๋ ๊ฒฝ์ฐ, ์์ธ๋ฅผ ์ฒ๋ฆฌํ์ง ๋ชปํ๋ ์ค๋ฅ ํด๊ฒฐ
-
๋ด๊ฐ ์ถ๊ฐํ feature๋ฅผ ์ฌ์ฉํ๋ All data๋์ Train data๋ง ์ฌ์ฉํ์ฌ ์ฑ๋ฅ ํ์ธ
- ์ฑ๋ฅ ํฅ์! (0.7641 โ 0.7661, 0.002!)
Valid AUC LB 0.7706 0.7661 -
FEATURE ์ ๋ฆฌ์ ์ฌ๋ ค๋ ๋ชจ๋ ํน์ง ์ฌ์ฉํ์ฌ LSTM ๋ชจ๋ธ์ ์ฌ์ฉ
- CUDA error๊ฐ ๋ฐ์ํด์, ์ฐ์ ๋ฏผ์ฉ+์๋ผ feature๋ง ์ถ๊ฐํ์ฌ ์คํ ์งํ
- ์คํ๋ ค ์ฑ๋ฅ์ด ์ ํ๋์์
Valid AUC LB 0.7701 0.7626 -
SAINT ๋ ผ๋ฌธ abtract, introduction๋ณด๊ณ ์ด์ ๊น์ง ์ฐ๊ตฌ ํ๋ฆ ํ์ ํ๊ธฐ
๐ Experiments
- Feature ์ถ๊ฐ
- userTestTime: ์ฒซ ๋ฌธ์ ๋ฅผ ํ๊ธฐ ์์ํ ์๊ฐ์ผ๋ก๋ถํฐ ํ์ฌ ๋ฌธ์ ๋ฅผ ํ๊ธฐ๊น์ง ๊ฒฝ๊ณผ์๊ฐ
- userTestContAnswer: user์ ์ํ์ง ๋ณ ์ฐ์ ์ ๋ต ์
- userTestContWrong: user์ ์ํ์ง ๋ณ ์ฐ์ ์ค๋ต ์
๐ Experiments
- Feature ์ถ๊ฐ
- userTestAnswer: user์ ํ๊ณ ์๋ ์ํ์ง ์ค ์ด์ ๊น์ง ์ ๋ต์ ๋ง์ถ ๊ฐ์
- userTestWrong: user์ ํ๊ณ ์๋ ์ํ์ง ์ค ์ด์ ๊น์ง ์ ๋ต์ ํ๋ฆฐ ๊ฐ์
๐ Experiments
- ํ์ฌ๊น์ง user๊ฐ ๋ฌธ์ ๋ฅผ ํธ๋๋ฐ ์์๋ ํ๊ท ์๊ฐ feature๋ฅผ ํฌํจํ์ฌ ์คํ
- hyperparameter๋
๋ฏผ์ฉ
์ด์ best model์ ๊ทธ๋๋ก ์ฌ์ฉ - userSolTime ํน์ง ์ถ๊ฐ, ๊ธฐ์กด์ ํน์ง ํจ๊ป ์ฌ์ฉ (categorical: 3, continuous: 7)
- 10-fold (์ฐธ๊ณ ํ hyperparameter๋ฅผ ํ๋์ฉ ์์ ํ๋ฉด์ ์คํ)
Seed | Valid AUC | LB |
---|---|---|
42 | 0.7624 | 0.7634 |
๐ Peer-session
-
user๊ฐ ํ๋์ ์ํ์ ๋๋ธ ์์ ์ ์ ํํ ๊ตฌ๋ถํ์!
- ์ด ๋ถ๋ถ์ด ์์ธ๊ฐ ์์ ๊ฒ ๊ฐ์์ ์ฌ๋ฌ๋ฒ ์ด์ผ๊ธฐํด๋ณธ ๊ฒฐ๊ณผ
๋ฏผ์ฉ
์ด๊ฐ ์์ฃผ ์ข์ ์ฝ๋๋ฅผ ํตํด ๊ณ ๋ คํ ์ ์๋๋ก ํจ (discussion ์ฐธ๊ณ ํ๊ธฐ!)
- ์ด ๋ถ๋ถ์ด ์์ธ๊ฐ ์์ ๊ฒ ๊ฐ์์ ์ฌ๋ฌ๋ฒ ์ด์ผ๊ธฐํด๋ณธ ๊ฒฐ๊ณผ
-
์ฌํ
์ค๋น ๊ฐ ์ฌ๋ฆฐ feature idea๋ฅผ ๋ค๋ฅธ ํ์๋ค๋ ๋๋ ์ ์งํํด๋ณด๋๋ก ํจ
๋ด๊ฐ ๋งก์ ๋ถ๋ถ
5. ํ์ฌ๊น์ง user๊ฐ ๋ฌธ์ ๋ฅผ ํธ๋๋ฐ ์์๋ ํ๊ท ์๊ฐ
6. ํ ์ํ์ง๋ฅผ ํ์ ์์ด์ ์ด ๊ฑธ๋ฆฐ ์๊ฐ
7. ์ฒซ ๋ฌธ์ ๋ฅผ ํ๊ธฐ ์์ํ ์๊ฐ์ผ๋ก๋ถํฐ ํ์ฌ ๋ฌธ์ ๋ฅผ ํ๊ธฐ๊น์ง ๊ฒฝ๊ณผ์๊ฐ
8. ์ด์ ๊น์ง ์ ๋ต์ ์ฐ์์ผ๋ก ๋ช๋ฒ ๋งํ๋์ง - ํ์ฌ ๋ณด๊ณ ์๋ ์ํ์ ํํด์ ์นด์ดํ
9. ์ด์ ๊น์ง ์ ๋ต์ ์ฐ์์ผ๋ก ๋ช๋ฒ ํ๋ ธ๋์ง - ํ์ฌ ๋ณด๊ณ ์๋ ์ํ์ ํํด์ ์นด์ดํ
10. ํ์์ ์ํ์ง ๋ณ ์ ๋ต๋ฅ
๐ Mentoring
- feature๋ฅผ ๊ณ ๋ คํ๋๊ฒ ๊ฐ์ฅ ์ค์ํ๋ค๊ณ ๋๊ปด์ง
- ์ด๋ค feature๋ฅผ ์ฌ์ฉํ๋์ง ์น์ดํ๊ฒ ํ ๋ก ํ๋๊ฒ ์ข์ ๊ฒ ๊ฐ์
- output์ ๋ํ ๋ถ์์ด ์์ฃผ ์ค์!!
- ๊ฐ๊ฐ ์ฐพ์์ ํผ์ด์ธ์ ์์ ๊ณต์ ํ๋๊ฒ ์ข์ ๊ฒ ๊ฐ์
- ๋๋ ์ ํด๋ณด๊ณ , ๊ฐ์ด ์ด์ผ๊ธฐ
๐ Experiments
- feature๋ฅผ ์ ์ ์ถ๊ฐํ ๋๋ง๋ค ๋ณ๊ฒฝํด์ค์ผํ๋ ๊ณณ์ด dataloader.py, trainer.py, model.py ๋ก ๋๋ฌด ๋ง์ ๋ถ๋ถ์ ๊ฑด๋๋ ค์ผํด์ ์ด ๋ถ๋ถ์ ์คํ์ ์ฉ์ดํ๋๋ก ๊ตฌ์กฐ๋ฅผ ์์
- dataloader.py์
load_data_from_file
ํจ์์์ ๋ค์๊ณผ ๊ฐ์ด ๋ณ๊ฒฝ- n_cates, n_cons, cate_embs ๋ณ์๋ฅผ ๋ง๋ค์ด์ model ๊ตฌ์กฐ๋ํ ์ ๋์ ์ผ๋ก ๋ณ๊ฒฝ์ด ๊ฐ๋ฅํ๋๋กํจ!
# =============================== !!!!์ฌ๊ธฐ๋ง ์ฃผ์ํ์!!!! ===============================
columns = ["userID", "testId", "assessmentItemID", "KnowledgeTag",
"correctRate", "correctAnswer", "totalAnswer", "userAcc", "test_mean", "tag_mean", "answerCode"]
args.n_cates = 3
args.n_cons = 6
# ========================================================================================
args.cate_embs = []
for c in columns[1: args.n_cates+1]:
args.cate_embs.append(len(np.load(os.path.join(self.args.asset_dir, f"{c}_classes.npy"))))
args.n_cates += 1
args.cate_embs.append(3)
- ์ถ๊ฐ๋ก ํ์ํ ์์ ์ด ํ์ํ ๋ถ๋ถ์
๋ฏผ์ฉ
์ด๊ฐ ๋งก์์ ์งํํ๊ธฐ๋ก ํจ- embedding layer๋ง๋ค hidden_dim์ ์ฐจ์์ ๋ค๋ฅด๊ฒ ํด์ค๋ค๋์ง, LayerNorm ์ถ๊ฐ ๋ฑ
๐ Peer-session
- ์๊ฐ๋ณด๋ค ์คํํ๋ ๋ฐ์ดํฐ ๋ถ๋ฆฌ ์กฐ๊ฑด์ด ์ข์ง ์์์..๐ฅ
- ์ด์ ์คํ์์ ์ ํ seed ๊ฐ์ด model์๋ง ์ ์ฉ๋๊ฑฐ๋ผ ๋ฐ์ดํฐ์ ๋ถ๋ฆฌ๋๋ ์กฐ๊ฑด์ด ๋ฌ๋ผ์ง๋ฉด์ valid์ LB์ ๊ฐ๊ฒฉ์ด ๋์ด์ง๊ฑด๊ฐ?
- seed๋ฅผ 42๋ก ๋๊ณ ๋๋ ค๋ 406๊ณผ ๋ณ๋ก ์ฐจ์ด๊ฐ ์์์!
- ์ด๊ฑฐ๋ ์กฐ๊ฑด์ด ์ข์ง ์์์ ํ๋ฅ ์ด ๋ ํฐ ๊ฒ ๊ฐ๋ค..
๐ Experiments
-
user์ ์ํ์ง(testID)๋ง๋ค ์ ๋ต๋ฅ feature๋ฅผ ์ถ๊ฐํ์ ๋, categorical๋ก ์๊ฐํ์ฌ์ embedding layer๋ฅผ ๊ฑฐ์น๊ณ ๋ค๋ฅธ feature๋ค๊ณผ ํฉ์ณ์(concat) ์ฌ์ฉํ๋๋ฐ ์ค๋ ํ์๋ค์๊ฒ๋ ๋ฌผ์ด๋ณธ ๊ฒฐ๊ณผ continuousํ ํน์ง์ธ ๊ฒ ๊ฐ๋ค๊ณ ๊ฒฐ๋ก ์ ๋ด๋ฆผ!
-
LGBM baseline code์ ์๋ feature 2๊ฐ์ ์ด์ ์ถ๊ฐํ๋ feature๋ฅผ ๋ฐ๋ก linear layer์ ๋ฃ์ ๋ค embedding feature๋ค๊ณผ ํฉ์ณ์ comb_proj layer๋ฅผ ํต๊ณผํ๋๋ก ๋ณ๊ฒฝํ์ฌ ์คํ์ ์งํ โถ baseline (0.7361) > add_correctRatio (0.7342) > add_3features (0.7333)๋ฅผ ๋ณด์ ๐ข
-
์์ง๊น์ง embedding layer~comb_proj layer ๋ถ๋ถ์ ์ดํดํ์ง ๋ชปํ ๊ฒ ๊ฐ๋ค! ์ด ๋ถ๋ถ ๋ ํ์ธํ๊ธฐ
๐ Peer-session
- data๋ฅผ ๋ถํ ํ ๋, seed๊ฐ์ 0์ผ๋ก ๊ณ ์ ๋์ด ์์์
- model์ seed๊ฐ์ ๊ฐ์ฅ ์ข์ ์ฑ๋ฅ์ ๋ณด์ด๊ณ ์ ์ ์ฐจ์ด์๋ "406"์ผ๋ก ๊ฒฐ์
๐ซ Ideas
-
์ด๋ค feature๊ฐ ๋์์ด ๋ ๊น? "๋ด๊ฐ ๋ชจ๋ธ์ด๋ผ๊ณ ์๊ฐํด๋ณด์ธ์"
- ๊ฒฐ๊ตญ user์ history๋ฅผ ์ฌ์ฉํ์ฌ next๋ฅผ ๋ง์ถ๋๊ฒ์ด๊ธฐ ๋๋ฌธ์ history์์ ์ถฉ๋ถํ feature๊ฐ ์๋ค๋ฉด ๋ชจ๋ธ์๊ฒ ์ ์ฉํ ๊ฒ ๊ฐ์
- ์ด์ ๋ฌธ์ ์์ ๊ฑธ๋ ธ๋ ์๊ฐ? ํน์ ํ์ฌ๊น์ง user๊ฐ ๋ฌธ์ ๋ฅผ ํธ๋๋ฐ ์์๋ ํ๊ท ์๊ฐ์ ์๋ฉด ์ด์ฌํ ํธ๋ ์ฌ๋๊ณผ ๊ทธ๋ ์ง ์์ ์ฌ๋(์ฐ๋ ๊ฒฝ์ฐ)๋ฅผ ๊ตฌ๋ถํ ์ ์์ง ์์๊น?
- user์ ํ ์ ๋ณด๋ง๋ค ์ ๋ต๋ฅ ์ ์ถ๊ฐ๋ก ๋ฃ์ด์ฃผ๋ฉด ์ข์ง ์์๊น? -- ์กฐ๊ธ ๋ ์ถ๊ฐํ๋ค๋ฉด, user์ ๋ฌธ์ ๋์ด๋(9๊ฐ)๋ณ ์ ๋ต๋ฅ ?
-
์ด๋ค๊ฑธ ์๋ํด๋ณผ๊น?
- ๋ฌธ์ ๋ณ ๋์ด๋, user์ time๋ง๋ค ์ ๋ต๋ฅ , ํ์ฌ๊น์ง user๊ฐ ๋ฌธ์ ๋ฅผ ํธ๋๋ฐ ์์๋ ํ๊ท ์๊ฐ
๐ Experiments
- user์ ์ํ์ง(testID)๋ง๋ค ์ ๋ต๋ฅ feature๋ฅผ ์ถ๊ฐํ์ฌ ์คํ ์งํ (seed: 406) โถ baseline ์ฑ๋ฅ์ธ 0.7361๋ณด๋ค ํ๋ฝํ 0.7342๋ฅผ ๋ณด์, ์ด๋ Valid AUC: 0.7624
๐ก class
- ํ๊ท ์ ์ผ๋ก ๋ฌธ์ ๋ฅผ ํธ๋๋ฐ ์์๋๋ ์๊ฐ๊ณผ ๊ฐ user์ ๋ฌธ์ ํ์ด ์๊ฐ์ ์ฐจ์ด๋ ํ๋์ feature๊ฐ ๋ ์ ์์
- ์ ๊ทผ๋ฐฉ๋ฒ ๋ฌธ์ , ๋ฌธํญ, tag์ ๋ํ ์ ๋ต๋ฅ ์ ํ๋์ feature๋ก๋ ์ฌ์ฉํ ์ ์์
๐ Experiments
Seed๊ฐ์ ๋ฐ๋ฅธ LB์ Validation ์ฑ๋ฅ ์ฐจ์ด ํ์ธ ์คํ
์ฌ์ฉํ seed list - 28, 81, 1109, 1996, 8888
Seed | Valid AUC | LB | ์ฐจ์ด |
---|---|---|---|
28 | 0.7381 | 0.7234 | 0.0597 |
81 | 0.7389 | 0.7207 | 0.0182 |
1109 | 0.7336 | 0.7241 | 0.0095 |
1996 | 0.7366 | 0.7178 | 0.0188 |
8888 | 0.7378 | 0.7227 | 0.0151 |
โถ 1109๋ฅผ seed๋ก ์ฌ์ฉํ์์ ๋, ๊ฐ์ฅ ์ข์ ์ฑ๋ฅ์ ๋ณด์ด๊ณ ๊ทธ ์ฐจ์ด๋ ๊ฐ์ฅ ์ ์์