챗지피티, 메타 등 거대 인공지능 서비스 모델이 글로벌 시장에서 성능을 인정받으면서 기존 인공지능 및 ML/DL 서비스 사업은 모델 중심(Model Centric)에서 데이터 중심(Data Centric)으로 변화하고 있습니다. 이것은 인공지능 산업의 트랜드가 기존의 ML/DL 모델 개발 사업에서 상용화 된 인공지능을 도메인 영역에 구축하고, 도메인 데이터 베이스를 구축하는 방향으로 빠르게 변화하고 있음을 보여 준다고 생각합니다.
따라서 저는 ML/DL 모델을 사용한 서비스 산업은 향후 두 가지 방향으로 세분화 될 것이라고 생각합니다. 한 방향은 학습 데이터의 다변화, 데이터의 품질 관리, 전처리 방법의 표준화, 데이터 저작권 등을 골자로 한 DMOps(Data Management Ops) 구축 분야이고, 또 다른 한 방향은 모델의 성능 지표 관리 및 모델 튜닝의 자동화 파이프라인 구축을 위한 MLOps (Machine Learning Ops) 분야입니다.
저는 이러한 트렌드에 맞추어 ML/DL 개발 역량을 확장하기 위해 다음과 같은 노력을 하고 있습니다.
- 데이터 분석
- 데이터 사이언스 기반 ML/DL 모델링
- 쿠버네티스 기반 MLOps CI/CD 파이프라인 구축
- 백엔드 API 개발
- AI 리서치
- OpenML과 Kaggle에서 다양한 형태의 데이터를 접하고 모델링을 통해 더 나은 데이터 기반 인사이트를 도출하는 것을 즐겨합니다.
- ML과 DL의 새로운 모델을 실험하고 데이터 예측에 더 적합한 모델을 찾아내는 것에 흥미를 갖고 있습니다.
- MLOps 파이프라인 구축 : 쿠버네티스를 기반으로한 다양한 오픈소스들(Docker, MLflow, Kubeflow, Prometheus, Grafana, Jenkins, GitAction, DVC, SeldonCore 등)을 사용하여 모델의 성능 향상을 위한 MLOps CI/CD 파이프라인을 구축을 모색하고 있습니다.
- DMOps 파이프라인 구축 : 국내 탑티어 AI 업체인 업스테이지(Upstage)사의 머신러닝 관련 논문인 에서 언급한 도메인 데이터의 학습 데이터화를 위한 12가지 프로세스에 대하여 모색하고 있습니다.
- 백엔드 개발 : MLOps의 모델을 서비스화 하고 서빙 등의 프로세스를 서포트 하기 위한 백앤드 개발 역량을 키우기 위해 노력하고 있습니다.
- 인공지능 분야 리서치 : AI 모델이 작동하는 방식 등에 대한 최신 기술을 연구하고, 국내의 AI 업체들의 이슈를 파악하며 AI 산업 분야를 다각적으로 이해하기 위해 노력하고 있습니다.
스마트폰 부터 AI까지 기술의 발달은 터프한 상태에서 섬세한 상태로 진보하며 이 과정은 기술이라는 날실과 상상이라는 씨실로 직조된다고 생각합니다. 새로운 기술이 상용화 되기까지 다양한 범용기술과 수 많은 상상들이 융합하는 과정이 필요합니다. 이러한 측면에서 상상만 해도 돈을 벌 수 있는 수익 구조를 만들어 가는 ghm.co를 운영하고 있습니다.