2022 OO 제품 해외시장 조사 : R을 활용한 월간 리포트 자동화
0. 개요
매월 최소 20개 국가에서 조사되는 데이터를 R markdown 활용하여 월간 리포트 작성
소요 기간 | 약 2주 (2022년 9월 6일 ~ 2022년 9월 17일) |
참여 인원 | 2명 |
내 역할 | R programming |
기여도 | 70 |
주요 성과 | 최소 영업일 5일 소요되던 보고서 작성 → 1분 57초로 단축 |
1. 프로젝트의 목표
데이터 처리 및 보고서 작성 자동화 → 업무 효율성 제고 → 불필요한 업무 시간 최소화 → 창의성에 역량 집중 가능
2. 주요 업무
2.1. 데이터 전처리
•
데이터셋 병합
•
불필요한 변수 삭제
•
변수명 간소화
•
데이터 타입 변환
•
결측치 제거
•
변수 추가
◦
ID 부여
◦
각 나라의 ‘대륙(continent)’ 변수 추가
2.2. EDA
•
최대치/최소치 탐색
•
IQR 계산
•
이상치 탐색
2.3. 분석
•
각 국가 내 제품들의 전월 대비 가격 증감률 계산
•
전월 대비 추가된 신규 제품 확인
•
기존 보고서 형식에 맞춰 데이터 구성
•
데이터 추출
3. 이슈
3.1. 증감률 계산 (feat. Stackoverflow)
3.2. 이상치: 데이터가 최소 몇 개 있어야 할까?
4. 주요 성과
보고서 작성 소요 시간 단축: 5일 → 1분 57초
5. 배운점
•
해들리 위컴의 말처럼 역시 자동화 할 수 있는 것은 자동화 하는 것이 좋다!
◦
통계학자 해들리 위컴 “Anything that can be automated, should be automated. Do as little as possible by hand”
▪
출처: Wickham, H., & Bryan, J. (2023). R packages. " O'Reilly Media, Inc.".ISO 690
•
그러나 조직 전체의 효율성이 좋아졌는지는 의문
◦
직접 프로그래밍을 통해 작업 소요 시간을 줄인 것은 맞다. 그러나 이것이 리서처의 핵심 업무는 아니다.
◦
개발부서의 도움을 받아 본 작업을 수행했다면 조직 전체 관점에서 업무 효율성을 제고 할 수 있었을 것이다.
◦
보고서 자동화는 이 조직의 주요 현안이 아니기 때문에 별도의 메뉴얼, 문서 양식 없음
▪
향후 개발부서와 협업을 위한 메뉴얼, 명확한 요구가 담긴 문서 양식 개발 및 해당 부서와 협의 필요