다양한 머신러닝 모델의 이론과 사용방법에 관한 레포지토리
- 예측문제를 풀기 위한 선형회귀분석 모델의 수학 이론과 사용방법에 대한 정리
- 전처리, 카테고리 데이터의 처리, 스케일링, 부분회귀, 최소자승법, 확률론적 선형 회귀모형, t-검정, F-검정, 잔차행렬, 레버리지, 아웃라이어, 분산분석, 변수 중요도, 모형 진단, 잔차와 독립변수의 관계, VIF 변수선택, 정규화 선형회귀방법 등 선형회귀 분석 관련 분석 방법들의 요약과 실습
- 분류 예측 문제를 풀기 위한 분류 모델의 수학 이론과 사용방법에 대한 정리
- 확률론적 생성모형 : LDA/QDA, Naive Bayes
- 확률론적 판별모형 : Logistic Regression, DecisionTree
- 판별함수 모형 : Perceptron, Support Vector Machine
- 모형 결합(Ensemble), 모형 최적화, 변수 선택, 비대칭 데이터 처리 등의 이론과 사용 실습
- 예측 모델의 이론과 사용방법 그리고 성능을 높이기 위한 다양한 방법들에 대한 정리
- 모델별 파라미터 정리 및 사용 팁
- 하이퍼 파라미터 튜닝을 위한 Pipeline, CV, Transformer 등
- feature engineering의 다양한 방법
- 해석 가능은 모델을 위한 모델 평가 방법들에 대한 사용 실습
- 추천 시스템의 이론과 사용방법에 대한 정리
- Surprise 패키지 사용
- 추천시스테 모형들의 이론과 사용 : 협업 필터링 모형, 잠재 요인 모델 등
- 희소행렬화 방법들 : TfidfVectorizer, CountVectorizer
- 벡터간 거리 계산 방법들 : 유사도 측정 방법들