Search

[Research Diary] 내 첫 텀페이퍼의 향방은 과연 어디로?

조만간 경영학계를 뒤흔들겠다는 야망을 품고 시작했던 내 첫 Term-paper. 일주일 전만해도 "제출 기한보다 훨씬 일찍 끝나면 어떡하지?"라는 고민과 걱정이 가득했으나, 다행히도(또는 불행히도) 그런 걱정은 2020년 11월 19일 목요일인 오늘부로 필요가 없어졌다. 일주일 전으로 돌아가 다시 시작해야되니깐 말이다.
본 글은 일반대학원 경영학과 마케팅을 전공하는 석사(1기) 과정의 학생이 작성한 글로 굉장히 사적인 생각을 담은 글이지만 굉장히 공개적인 곳에 올려놓은 글입니다. *오류가 상당 부분 존재하니 댓글 또는 메일을 통해 적극적인 태클과 피드백을 부탁드립니다. 겸허히 받아들여 성장의 자양분으로 삼겠습니다.
수강 중인 소비자행동론 강의에서 지필고사를 대신하여 Term-paper를 작성하게 되었다. 평소 번뜩이는 아이디어가 많았기에 보통 연구논문은 아니지만 내가 주체적으로 연구과제를 수행한다는 생각에 즐거웠다. 그러나 교수님께서 분석은 소비자행동 관련 연구에서 많이 사용되는, 특히 심리실험 '실험계획법(Design of Experiments)'의 방법론들을 사용하라고 정해주셨다. 학부시절 실험계획법을 수강하여 C+를 받아버렸던 전과가 있기에 자신이 없기도 했거니와 평소 흥미있어하던 온라인 소비행동을 주제로 페이퍼를 작성하고 싶은 마음에 과거 공모전을 준비하며 받아뒀던 온라인 소비행동 데이터를 무조건 활용하고자 했다. 그래서 신난 마음에 Github 아이디를 새로 만들고 구글의 Colab 노트와 연동 해놓고 이 블로그 역시 개설하게 되었다. 열심히 다른 깃허브를 참고해가며 코드를 작성하고 소위 EDA를 하고 있던 와중 생각이 들었다.
①내가 하는 게 맞나?
②나는 무엇을 위해 지금 이 코드를 작성하고 있었던 것이지?
① 내가 하는게 맞나?
우선 나는 틀린 방법으로 분석을 하려는 것 같았다. 교수님께서 정해주신 실험계획법이라는 분석방법에 정면으로 반하는 접근방법을 사용한 느낌이었다. EDA, 그러니깐 Exploratory Data Analysis, 다시 한 번만 더 말해서 '탐색적 자료 분석'은 수집된(또는 기존의) 데이터를 기술적(technical)으로 탐색하고 데이터의 특징과 구조적 측면을 파악하여 통찰(insight)를 얻는 것이다. 그러나 교수님께서 말씀하신 DOE, 그러니깐 Design Of Experiments, 다시 한 번만 더 말해서 실험계획법은 이미 어떤 이론 또는 선행연구를 통해 인사이트를 얻었고 그게 맞는지 아닌지를 데이터를 수집해서 한 번 증명해보겠다는 식의 접근이었다. 미안하지만 또 한 번 다시 설명하자면 이런 방법은 CDA, 그러니깐 Confirmatory Data Analysis, 정말 미안하지만 '확증적 데이터 분석'이었다. 탐색적 자료분석(EDA)이 아니었다. 2018년 6월 28일 순천향대학교 서울병원에서 내과학교실 감연분과의 김태형 교수님께서 사용하신 '자료분석과 KONIS 통계의 이용방법 산수이야기'의 PPT 중 '2016 대한의료관련감영관리학회 학술대회에서 고려대 허명회 교수님 강의'에서 나왔다는 EDA와 CDA의 차이는 다음과 같았다.
구분
EDA
CDA
특징
데이터의 특징과 구조에 대한 탐구(Exploration)
인사이트, 가설, 모형의 타당성, 일반성, 재현성 평가
목표
*인사이트의 생성, 가설과 모형의 도출
모형 적합도, *가설점정, 신뢰구간
절차
先데이터, 後분석
계획 → 데이터 확보 → 분석
교수님이 정해주신 분석 방법에 의하면 나는 계획을 세우고 특정 인사이트를 증명할 데이터를 확보하여 분석을 진행하는 확증적 데이터 분석을 진행해야했다. 그럼에도 불구하고 나는 단지 내가 하고 싶다는 이유로 탐색적 자료 분석을 무작정 진행하고 있었다. 물론 자료를 탐색적으로 살펴보고 특정 인사이트를 얻어 가설을 세우고 통계적인 분석 방법을 통해 그 인사이트를 증명해낼 수도 있겠다. 그러나 그것 조차도 나는 할 수 없었다. 왜냐하면 나는 뚜렷한 연구 목적, 주제도 없이 단지 '온라인 소비행동에 관련한 연구'를 할 작정이었기 때문이다.
이를 깨닫고 사색에 잠겼다. 그리고 갑자기 과거 무더운 여름 축구 지도자 자격증을 취득하고자 연수를 갔을 때가 생각났다.
②나는 무엇을 위해 지금 이 코드를 작성하고 있었던 것이지?
축구 코치는 축구 선수들이 경기장에서 좋은 결과를 낼 수 있도록 항상 좋은 훈련을 통해 팀과 개인의 실력 향상을 도모하는 역할을 맡는다. 그렇기에 가장 처음 이론 교육을 받았던 것이 축구 훈련 구성에 관한 것이었다. 당시 내가 가장 인상 깊었던 것은 다름 아닌 훈련이라고 하기도 애매한 'Warm up'에 관한 내용이었다. 비록 나는 어린시절 엘리트 축구선수생활을 경험하진 않았으나 일반적으로 Warm up은 그냥 운동장 돌고 다 같이 O형태로 모여서서 스트레칭하는 것만으로 생각했다. 왜냐면 난 일평생 그렇게 몸을 풀었고 그렇게 몸을 푸는 것만을 봐왔기 때문이다. 그러나 연수의 강사님께서는 정말 좋은 훈련을 위해서는 이 Warm up에서 조차 당일 훈련의 한 가지 주제에 맞춰 구성해야 한다는 것이었다. 그래야만 본 훈련까지 유기적으로 진행되고 Warm up에서 사용하는 근육이 본 훈련에서 사용되는 것과 유사해져 선수들이 효율적으로 근력과 신경을 활성화 시킬 수 있다는 것이었다. 만약에 오늘 진행할 훈련 주제가 '1vs1 드리블 돌파 능력 향상'에 있다면 본격적인 훈련에 앞서 Warm up에서도 각자 공과 함께 달린다던지, 콘을 두고 다양한 움직임을 가지며 달리는 구성을 가져간다는 것이다.
나는 이것을 이번 페이퍼 작성 과정에 적용하지 않았다. 지난 일주일 간 그저 데이터 탐색을 막무가내로 했다. 물론 그러면서 데이터를 다각적으로 살펴보고 창의적인 인사이트를 도출할 수도 있다. 실제로 내가 생각했던 것보다 이 데이터셋으로 나올 수 있는 연구의 방향이 굉장히 많아고 느꼈다. 그러나 나는 이 연구를 혼자 진행하고 있기에 그런 것을 다 즐길 수 있는 물리적인 시간이 없다(제출이 약 20일 밖에 남지 않았다). 더 중요한 것은 결국 내가 한 가지 주제에 맞춰 데이터를 사용하여 통계적 분석을 진행할 것이기 때문에 그 분석 방법에 맞도록 데이터를 전처리 해놓을 필요가 있다는 점이다. 너무 당연하고 중요한 얘기인데도 그 점을 놓치고 있었다.
축구에서 본 훈련에 앞서 그 날 훈련 주제를 떠올릴 수 있는 Warm up을 구성해야 더 효율적이고 효과적인 훈련이 가능하다는 강사님의 말씀을 다시 상기시켜보면 나 역시 나의 데이터 전처리, EDA 과정은 한 가지 연구주제를 향하고 있어야 한다. 심지어 누군가가 내 전처리된 데이터와 EDA결과들을 보고 어떤 주제를 잡고 어떤 분석을 하려는지 매우 쉽게 유추가 가능할 정도로 말이다! 따라서 연구목적과 주제를 다시 구체적이고 명확하게 정리하고 분석을 진행하고자 한다. 아마도 선행연구를 진짜 정말 많이 찾아봐야할 것 같다.
Main Page | Category |  Tags | About Me | Contact