Skip to content

์žฌํ›ˆ

Jaehoon M edited this page May 25, 2021 · 20 revisions

๊ฐœ์ธ ๊ธฐ๋ก

05/24

  1. StratifiedShuffleSplit์„ ํ†ตํ•ด train valid split์„ ์ˆ˜ํ–‰ํ•ด์•ผ ํ• ๋“ฏ.
  • Target Label์€ ๋งจ๋งˆ์ง€๋ง‰ ์‹œ์ ์— ์ •๋‹ต์„ ๋งž์ท„๋Š”๊ฐ€์— ๋Œ€ํ•œ value?๋กœ
  1. EDA ์ค‘ ์ฃผ์˜๊นŠ๊ฒŒ ๋ด์•ผ๋  ๋ถ€๋ถ„๋“ค (์˜์™ธ์˜€๋˜ ๋ถ€๋ถ„)
  • ์‚ฌ์‹ค, ๋ฌธ์ œ๋ฅผ ๋งŽ์ด ํ‘ผ ์‚ฌ๋žŒ์ผ ์ˆ˜๋ก ๋‹น์—ฐํžˆ ์ดํ›„์— ์ •๋‹ต๋ฅ ์ด ๋Š˜์–ด๋‚  ๊ฒƒ ๊ฐ™์€๊ฐ€? ๋ผ๋Š” ์งˆ๋ฌธ์— ๋‹น์—ฐํžˆ ๊ทธ๋ ‡๋‹ค๊ณ  ๋‹จ์ •์ง€์„ ์ˆ˜ ์žˆ์„ ๊ฒƒ์ด๋ผ ์ƒ๊ฐํ–ˆ์ง€๋งŒ ๋‘ ๊ฐ€์ง€์˜ ์ผ€์ด์Šค๋ฅผ ๊ณ ๋ คํ•ด์•ผ ํ•œ๋‹ค.
    • ์ดˆ๋ฐ˜๋ถ€ํ„ฐ ์›๋ž˜ ์ •๋‹ต์„ ์ž˜ ๋งžํžŒ ๋ถ€๋ฅ˜ (์ดํ›„ ์ •๋‹ต๋ฅ ์ด ๊ฐ์†Œํ•˜๋Š” ์ถ”์„ธ)
    • ์ดˆ๋ฐ˜์—๋Š” ์›๋ž˜ ์ •๋‹ต์„ ์ž˜ ๋ชป ๋งžํžŒ ๋ถ€๋ฅ˜ (์ดํ›„ ์ •๋‹ต๋ฅ ์ด ์ƒ์Šนํ•˜๋Š” ์ถ”์„ธ)

๋”ฐ๋ผ์„œ, EDA์‹œ์— ์ „์ฒด์ ์ธ ํ๋ฆ„์„ ๋‹จ์ •์ง“๊ณ  ์ „์ฒด์— ๋Œ€ํ•œ ์ •๋‹ต๋ฅ ์„ ๋ณด๋Š” ๊ฒƒ๋ณด๋‹ค๋Š” ์ดˆ๊ธฐ์˜ N๊ฐœ์˜ ๋ฌธํ•ญ์— ๋Œ€ํ•˜์—ฌ ์ •๋‹ต๋ฅ ์„ ๋ณด๊ณ  ๋”ฐ๋กœ Plot์„ ๊ทธ๋ ค๋ณด๋Š” ๊ฒƒ์ด ์ข‹์•„๋ณด์ผ ๋“ฏ ํ•˜๋‹ค.

  1. Seed ์‹คํ—˜
seed Valid AUC Public LB AUC ์ฐจ์ด
77 0.7357 0.7273 0.0084
777 0.7318 0.7237 0.0081
123 0.7381 0.7244 0.0137
1234 0.7386 0.7231 0.0155
1058 0.7357 0.7242 0.0115
1995 0.7378 0.7221 0.0157
2014 0.7425 0.7276 0.0149
Clone this wiki locally