Skip to content

YongBeomKim/FinanceBasic2018

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

67 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

서울스퀘어 WeWork 2018

파이썬을 활용한 금융분석

강의 목표

본 강의의 목적은 공개 오픈소스 툴인 파이썬 언어의 기초를 익히고, 이를 활용하여 Pandas 모듈을 활용하여 다양한 금융 기술적 분석 능력을 스스로 갖출 수 있도록 실습과 이론을 통하여 배울 수 있도록 하는 것입니다. 본 강의를 통해 수강생들이 단순한 실습만아니라 실제적으로 각자의 업무에 어떻게 파이썬을 적용해야 할지 실무적 아이디어를 얻어 가시기를 바랍니다.

과정 상세

파이썬의 기본적인 객체와 함수를 학습하고, 이를 바탕으로 Pandas 모듈을 활용한 시계열 금융 데이터를 다루는 방식을 학습합니다.

PandasNumpy 그리고 Matplotlib를 바탕으로 이동평균선 생성 및 시각화, BackTesting, Risk관리를 위한 포트폴리오 구성비율 예측 등 다양한 금융분석을 수행합니다.

이를 바탕으로 다양한 머신러닝 기본 이론을 활용한 '종가 데이터를 활용한 주가예측'을 진행합니다

종가를 활용한 주가 예측은 'hidden Markov model', 'ARIMA'시계열 패턴 예측, Prophet (R) 모듈의 활용 및 Keran LSTM을 활용하여 진행합니다

수강 대상

Pandas 모듈을 활용한 시계열 데이터를 다루기 원하시는 분 

Python을 활용한 시계열 데이터를 다루기 원하시는 금융 업계 종사자

스스로 금융 분석을 위한 Simulation을 구현하기 원하는 분

독자적 투자 시스템을 구축하기 위한 기술과 이론에 대한 실습을 통해 핵심 내용을 알려드립니다.

투자 또는 금융 데이터 분석에 기본적인 머신러닝 이론을 적용해 보고 싶은 분

Python 을 통한 금융 투자 분석과 투자 기회에 인사이트를 얻고자 하는 금융 업계 종사자

수업내용

Python 기초 및 객체 다루기

Pandas 기초 및 시계열 데이터 다루기

금융데이터 분석

  1. 종목간 상관성 분석
  2. Value at Risk
  3. 이평선 활용한 수익률 분석
  4. 몬테카를로 시뮬레이션을 활용한 최적의 포트폴리오 찾기
  5. 다양한 기술적 보조지표 생성
    1. Stochastic Oscillator
    2. RSI(Relative Strength Index : 상대강도지수)
    3. 볼린저 밴드
    4. MACD(moving average convergence/divergence)

금융데이터 예측

  1. 은닉마르코프 모델을 활용 (HMM)
  2. ARIMA 시계열 분석을 활용한 주가 예측
  3. Prophet (R) 활용한 주가예측
  4. Keras 의 LSTM 모델을 활용한 주가예측

Python 기본 내용 및 Pandas 요약

Data & Datum

  1. Datum(숫자, "문자"), Data([list], {dict}, (tuple,))
  2. (기본/외부/사용자) 모듈, 함수, 메소드
  3. []의 문자에서 활용( [index], [:slicing]), 함수를 활용{for : 반복, if :판단, enumerate() :순번 integer 출력}
  4. 재무제표 Web Crawling ==> type 변경 ==> 시각화
  5. ndarray, Series, Dataframe

Pandas Series

  1. pd.Series( [ data ] , index = [ index ])
  2. series 사칙연산
  3. series [ Boolean 판단문 ]
  4. series.index = [ list ]
  5. series.isnull()
  6. series.drop()

Pandas DataFrame

  1. pd.DataFrame( { columns : [ data ] , columns : [ data ] } )
  2. pd.to_datetime()
  3. df.rename( columns = { 기존 column , 새로운 column } )
  4. df.insert( 컬럼순서, 컬럼명 , data )
  5. df.column이름   |   df['column이름']
  6. df [ index Slicing ]
  7. df.iloc[ index slicing, column slicing ]
  8. df.reset_index() : index -> column
  9. df.set_index( '컬럼명' ) : column -> index
  10. df.sort_index()
  11. df.sort_value()
  12. df[ boolean 함수 ]
  13. df[ boolean 함수 ].column이름
  14. axis = 0 : index | axis = 1 : column
  15. df.drop( 'index이름' , axis = 0 )
  16. df.drop( 'column이름' , axis = 1 )
  17. df.index.tolist()
  18. df.column.tolist()
  19. df.apply(lambda x: x ** 2)
  20. pd.pivot_table(df,index = [], values = [], aggfunc = [], margins = True)

Pandas DataFrame Static

  1. .count()
  2. .describe()
  3. .min() .max()
  4. .idxmin() .idxmax()
  5. .quantile()
  6. .sum()
  7. .mean() .median()
  8. .var() 분산 .std() 정규분산
  9. .cumsum() .cumprod() 누적 합 누적 곱
  10. .cummin() .cummax() 누적최소값, 누적최대값

Pandas Series & DataFrame 결측치 제어하기

  1. df.dropna()
  2. df.fillna(method='ffill', limit=2) # 결측치 대체
  3. df.fillna(df.mean()['컬럼명'])
  4. Series.interpolate(method='time') # 결측치 보간 (시계열적 특성을 부여가능)
  5. Series.interpolate(method='values', limit=1, limit_direction='backward') # 'forward','backward','both'

TimeSeries 시계열 데이터 다루기

  1. from datetime import datetime
  2. pandas.date_range(end = '2017-07-01', periods=30, freq='BM')
  3. pandas.date_range('2017/8/8 09:09:09', periods=5, normalize=True)
  4. [str(date.date())    for    date    in    pd.date_range('2017/01/01', '2017/01/11')]

About

파이썬을 활용한 금융분석 Tutorial

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published