😎 μŠ€ν„°λ”” 컀리큘럼 참고사항 😎

Level 1Β 

1. 문제 μ •μ˜

  1. μ™œ 이 μ•Œκ³ λ¦¬μ¦˜μ„ κ°œλ°œν•΄μ•Όν•˜λŠ”κ°€(ν˜„μ—…μ˜ κ΄€μ μ—μ„œ 이해)
  1. 데이터 탐색
  1. λΆ„λ₯˜ x νšŒκ·€
  1. 전체 νŒŒμ΄ν”„λΌμΈ ꡬ좕

2. μΈ‘μ •μ§€ν‘œμ˜ 이해

  1. μΈ‘μ •μ§€ν‘œμ˜ μˆ˜ν•™μ  이해
  1. μΈ‘μ •μ§€ν‘œμ„ μ½”λ“œλ‘œ κ΅¬ν˜„ν•΄λ³΄κΈ°
  1. μ½”λ“œλ‘œ κ΅¬ν˜„λœ 평가산식 μ»€μŠ€ν„°λ§ˆμ΄μ¦ˆ 해보기(νŒŒλΌλ―Έν„° μˆ˜μ •)
  1. μ™œ 이 λŒ€νšŒλŠ” 이 μΈ‘μ •μ§€ν‘œμ„ μ‚¬μš©ν–ˆμ„κΉŒ? λ‹€λ₯Έ μΈ‘μ •μ§€ν‘œλ₯Ό μ‚¬μš©ν•  수 μžˆμ„κΉŒ?

Level 2

1. 탐색적 데이터 뢄석

  1. κΈ°λ³Έ ν†΅κ³„μΉ˜ 확인
  1. μ΄μƒμΉ˜ 확인
  1. μ‹œκ°ν™”
  1. λ¨Έμ‹ λŸ¬λ‹ 기법
  1. λ²”μ£Όν˜•, μˆ˜μΉ˜ν˜• 비ꡐ
  1. μ’…μ†λ³€μˆ˜

2. ν”Όμ²˜μ—”μ§€λ‹ˆμ–΄λ§

  1. μŠ€μΌ€μΌλ§, μ •κ·œν™”
  1. 원-ν•« 인코딩
  1. μƒˆλ‘œμš΄ νŠΉμ„± 생성

3. λͺ¨λΈλ§

  • 베이슀라인 μ½”λ“œ - μƒμœ„ 30% 이상을 λͺ©ν‘œλ‘œ

Level 3

1. 탐색적 데이터 뢄석 심화

  1. 상관관계

2. ν”Όμ²˜ μ—”μ§€λ‹ˆμ–΄λ§ 심화

  1. μ΄μƒμΉ˜ 처리 기법 심화
  1. Multiple Imputation
  1. Regression Imputation
  1. μ°¨μ›μΆ•μ†Œ
  1. categorical variable μ²˜λ¦¬λ°©λ²•

3. λͺ¨λΈλ§ 심화

  1. 우승자 μ½”λ“œ - μƒμœ„ 5% 이상을 λͺ©ν‘œλ‘œ

Level 4

1. λͺ¨λΈ 고도화

  • Interpretable Machine Learning(lime)
  • Bayesian optimization
  • SHAP value