데이터 과학이란 무엇이고, 나는 왜 공부를 하는가?


데이터 과학은 상대적으로 굉장히 새로운 분야다. 어떤 이들은 단순히 통계학의 응용 분야라고 하고, 어떤 이들은 완전히 새롭게 정의내리기도 한다. 나는 개인적으로 데이터 과학(Data Science)이란 분야는 컴퓨터 공학(Computer Science)과 통계학(Statistics)의 융합 분야라고 생각한다. 통계학에 그 기초를 두고 있지만, 통계학과 가장 다른 점은 통계학이 기저 모델과 추론을 중시한다면, 데이터 과학은 굳이 논리적 추론보다는 데이터 자체에서 답을 얻으려 한다는게 아닐까 싶다. 전통적인 통계학은 데이터 수집의 한계 때문에 정밀한 모델링이 중요했고, 한정된 샘플 사이즈에서 최대한 정확한 결론을 끌어내야 했지만, 빅 데이터 시대가 도래하면서 데이터 과학자들은 굳이 샘플이 모집단을 잘 대변하는지를 신경 쓸 필요도, 제한된 샘플로 현상을 잘 설명할 모델링을 할 필요도 없어졌다. 모집단 자체에 접근이 가능해졌고, 모집단 자체를 프로세스할 수 있을 정도로 컴퓨팅 능력이 발달했기 때문이다. 따라서 데이터 과학을 공부하는데는 기존 통계적 추론도 빼놓을 수는 없지만, parallel computing과 같은 컴퓨터 공학 개념들을 습득하는 것도 필수가 되었다. 또한 머신러닝이나 딥러닝과 같은 기법들을 다루는데 있어 컴퓨터 공학을 빼놓을 수 없어졌다. 


나는 2011년부터 트레이더로 일해왔다. 그리고 요즘 트레이딩 산업의 변화에서 빼놓을 수 없는 트렌드는 데이터 과학의 대두라고 할 수 있다. 트레이딩이란 결국 금융 상품 가격의 변화에서 수익을 거두는 일이고, 그것을 위해서는 결국 금융 상품 가격 데이터를 잘 분석하는 것이 중요하기 때문이다. 메뉴얼 트레이더에서 퀀트 트레이더로 전환하고자 하는 나는, 데이터 과학의 지식은 석사 과정을 밟기로 하였다. 어째서 금융 공학이나 금융 수학 석사를 밟지 않았느냐고 하면, 첫번째 이유는 이미 계량적 금융의 지식은 온라인 계량 금융 과정을 밟고 있어서 추가적으로 석사를 할 필요가 없었기 때문이고, 두번째 이유는 트레이딩에 있어서 금융 이론보다 더 근본적으로 중요한 것이 컴퓨터 공학이나 데이터 과학이라고 생각했기 때문이다.


이러한 연유로 나는 2016년부터 데이터 과학을 본격적으로 공부할 것이고, 이 게시판에는 데이터 과학에 관련한 정보글, 기사 스크랩, 공부 노트 등을 모을 계획이다. 금융 공학 게시판과 마찬가지로, 이 게시판 또한 일반적인 블로그처럼 독자를 대상으로 하는 게시판이 아닌, 순수하게 나의 공부를 위한 게시판이다. 다만, 내가 공부를 진행하면서 남기는 글들이, 다른 데이터 과학을 공부하는 학생들에게 도움이 된다면 금상첨화라고 생각한다.



Disclaimer


본 게시판의 모든 글은 상업적 용도로 쓰인 것이 아니며, 운영자는 본 게시판에 글을 씀으로 인해 어떠한 금전적 이익도 기대하지 않습니다. 이용자 또한 본 게시판의 글을 상업적 용도로 이용해서는 안되며 타 사이트에 게재할 경우에는 출처를 명확히 밝혀야 합니다. 또한 본 게시판 및 웹사이트 전체의 모든 투자 관련 정보는 투자 권유나 추천이 아니며, 이에 따른 독자의 투자/트레이딩 이익 혹은 손실에 대해서 그 어떠한 책임도 지지 않습니다.

댓글 0

목록
번호 제목 글쓴이 날짜 조회 수
» [공지]데이터 과학 게시판의 운영에 관하여 최한철 2016.04.23 95
22 [일반]데이터 사이언스 공부 사이트 정리 최한철 2018.09.23 98
21 [계량경제학]Nonparametric Smoothing file 최한철 2018.07.13 29
20 [계산통계학]Convex Functions 최한철 2017.02.14 233
19 [머신러닝]Support Vector Machine 최한철 2017.02.13 205
18 [계산통계학]Automatic Differentiation 최한철 2017.01.23 127
17 [시계열분석-8]시계열 모델과 예측 file 최한철 2016.12.04 199
16 [시계열분석-7]자기상관과 AR모델 file 최한철 2016.12.04 988
15 [시계열분석-6]추세의 모델링 file 최한철 2016.12.04 141
14 [회귀분석-5]회귀분석 결과의 해석 file 최한철 2016.12.03 135
13 [회귀분석-4]변수 선택 및 모델의 진단 file 최한철 2016.12.03 733
12 [회귀분석-3]다중 회귀 분석 II file 최한철 2016.10.12 81
11 [회귀분석-2]다중 회귀 분석 file 최한철 2016.10.09 630
10 [알고리즘-7]그래프의 최단 거리 최한철 2016.10.09 95
9 [알고리즘-6]DFS의 응용 file 최한철 2016.09.29 450
8 [회귀분석-1]기본 회귀 분석 file 최한철 2016.09.25 326
7 [알고리즘-5]BFS의 응용 file 최한철 2016.09.19 475
6 [알고리즘-4]그래프 file 최한철 2016.09.18 910
5 [알고리즘-3]Master Theorem file 최한철 2016.09.15 321
4 [알고리즘-2]알고리즘 디자인 file 최한철 2016.09.10 379
3 [알고리즘-1]알고리즘의 정의 최한철 2016.09.08 238