-
Notifications
You must be signed in to change notification settings - Fork 484
데이터 분야의 직군 소개
Sung Yun Byeon edited this page Jul 21, 2019
·
8 revisions
데이터 분야의 다양한 직군들을 소개해 드리겠습니다.
우선 이 문서에선 전반적인 내용을 알려드리고, 다른 글에서 실제 사례를 전해드리겠습니다
제 이야기가 궁금하신 분들은 데이터 사이언티스트가 되기 위해 진행한 다양한 노력들을 참고하시면 좋을 것 같습니다 :)
- 어떤 분야나 다양한 직군이 존재하지만 데이터 분야의 직군은 시간이 지나며 점점 빠르게 변하고 있습니다
- 이 자료는 제 경험 + 수많은 채용 공고를 보고 얻은 생각으로 작성했습니다. 따라서 잘못된 내용이 있을 수 있습니다
- 일반적으로 생각할 땐 데이터 분석가, 데이터 엔지니어, 머신러닝 엔지니어, 데이터 사이언티스트로 구분할 수 있습니다
- 데이터 분석가는 "기획자"적 성향이 강하며
- 데이터 엔지니어는 "개발자"적 성향이 강하고
- 데이터 사이언티스트는 "연구자"적 성향이 강합니다
- 여기에 머신러닝 엔지니어는 "개발자"적 성향이 강합니다
- 데이터 사이언티스트와 머신러닝 엔지니어의 경계는 모호합니다. 요즘은 리서치 엔지니어라는 직군도 생겼습니다. 이 문서에선 데이터 사이언티스트는 "연구자" 머신러닝 엔지니어는 "개발자" 성향이 강하다고 정의하겠습니다(차이점은 다른 문서에서 설명드릴 예정입니다)
- 데이터 엔지니어(혹은 백엔드 개발자)가 Database에 데이터를 저장해주면, 그 데이터를 기반으로 데이터 분석을 합니다
- 모니터링 해야되는 데이터 또는 특정 데이터의 경우 대시보드를 생성하고 관리합니다
- KPI(Key Performance Indicator) : 핵심 성과지표 설정
- 사내에서 정한 KPI를 모니터링합니다. 수치가 올랐다면 왜? 내려갔다면 왜? 원인 분석을 합니다
- KPI가 설정되지 않은 경우 KPI를 설정하기도 합니다
- 새로운 기능이 추가되는 경우나 특정 로그를 보고싶은 경우 데이터 로그 설계합니다
- 앱 또는 웹에서 나오는 데이터를 수집 - 가공해 데이터 분석가가 사용하기 쉽게 저장합니다
- 데이터 파이프라인 생성 : 데이터의 흐름을 관리합니다
- 데이터 분석가가 사용할 대시보드를 개발합니다
- 작은 회사에선 백엔드 개발자가 이 역할을 하는 경우도 있습니다
- 요즘 추세는 1) 백엔드 개발을 하는 데이터 엔지니어 또는 2) 머신러닝/딥러닝을 하는 데이터 엔지니어 또는 3) 데이터 엔지니어링 위주로 하는 데이터 엔지니어로 나뉘는 것 같습니다
- 자신이 속한 도메인(Computer Vision, Natural Language Process 등)에서 필요한 모델을 개발합니다
- 개발한 모델을 Production(실제 제품)에 적용합니다
- 모델의 성능을 모니터링하고 모델의 성능을 개선하거나 더 나은 모델을 만듭니다
- 여기서 핵심은 Production에 적용하는 것!
- 보통 R&D 조직에 속하며 논문 연구를 합니다
- 데이터 분석쪽의 일을 한다면 통계 모델링을 수행합니다
- 머신러닝 엔지니어가 하는 일(모델 개발, 모델 성능 개선, 추가 모델 개발)을 하기도 합니다
- 기획자
- 넓게 볼 경우 기획자 직군도 기획을 위한 데이터를 보곤 합니다. Google Analytics, Facebook Analytics, Facebook 광고 데이터, 사내 대시보드 등
- 직접 Database에 SQL 쿼리를 날리거나, 간단한 데이터 조작을 위해 Python 또는 R을 익히곤 합니다
- 기획자에서 데이터 분석가로 직군을 변경하는 분들도 종종 봤습니다
- 그로스해커
- 그로스해커는 기획자와 마찬가지로 성장을 위해 데이터를 보곤 합니다
- 기획자와 마찬가지로 쿼리를 날려 데이터를 보거나 대시보드, 각종 Analytics를 사용합니다
- 제품 개발이 아닌 성장에 집중하는 포지션입니다
- 데이터 시각화
- 데이터 시각화 직군은 따로 두는 기업은 많지 않습니다(언론사에서 종종 봤습니다)
- 디자이너면서 데이터 시각화를 할 수도 있고, 개발자면서(프론트엔드 개발자) 데이터 시각화를 할 수도 있습니다
- 디자이너의 경우 일러스트를 사용하고, 개발자의 경우 Java Script를 사용합니다
- 두 직군 결국 목적은 동일합니다. 데이터 분석 결과를 시각적으로 표현해 쉽게 이해할 수 있도록 하는 것입니다
- 다른 직군에서도 Tableau, Zeppelin 등을 사용해 시각화합니다
카일스쿨 유튜브를 시작했습니다-! 이 Wiki 문서에서 다루지 않은 현업 이야기를 공유할 예정입니다!
궁금하시거나 요청할 내용이 있으시면 [email protected]으로 메일 보내주시면 감사하겠습니다 :)