매거진
매거진
데이터
RAW 데이터를 정리하는 이유
RAW 데이터 정리를 잘할수록 모든 업무의 효율은 극대화됩니다
by. 이시우
2023-11-06

스크롤 읽기

요즘은 실무를 진행하며, RAW 데이터의 중요성을 특히나 많이 느끼고 있습니다.

—–

[로데이터? ROW데이터? 뭐더라^^;;]
많은 기업에서 RAW 데이터라 부르며 관리하는 데이터와 파일이 있긴 합니다만, 문제가 있는 경우가 많습니다.

RAW 데이터가 ‘중요하다는 말’만 들었고, 정확히 무엇인지 모르기 때문입니다. RAW 데이터가 중요하다 강조하지만 ROW 또는 LAW 데이터로 표기하는 경우들이 이를 반증한다고 볼 수 있습니다.

조금 더 디테일한 문제들을 이야기해보자면,

1) RAW 데이터라는 것이 정작 살펴보니 ‘통계표’이거나
2) 관리하는 파일이 10개 이상인데 모든 파일에 RAW 데이터가 있다거나
3) RAW 데이터 한 셀에 너무 많은 정보가 들어가 있다거나
4) 같은 데이터라도 필드의 값이 다르다거나 (ex, A컬렉션 상품 / 컬렉션A 상품 / A 상품 등)
등등과 같은 문제들입니다.

이런 문제가 있다면 RAW 데이터를 정리하는 시간만 낭비될 뿐만 아니라, 결국 기업 자원의 분절/유실로 이어지고 나아가선 유의미한 데이터를 취하기 어려워집니다.

[기본인 데이터 관리만 잘해도 분명히 상황은 좋아진다.]

제가 재직중인 현기업도 데이터 관리를 하고는 있지만,

1) 즉흥적으로 만들어 사용해 방대하게 불어난 RAW 데이터
2) 관리 기준(+정책)의 부재로 인해 명확하지 않은 기준으로 혼재되거나, 잘게 분절된 데이터들
이 문제였고, 이는

1) 데이터를 정리하는 데만 2~3시간을 들여도
2) 지난 데이터(성과)를 확인하기 어려워, 계속해서 데이터가 어디 있는지 물어보고
3) 결국 유의미한 인사이트를 얻지 못하는 결과로 이어지고 있었습니다.

7명이 운영하며, 1인이 발생시키는 연 매출이 6억 이상인 이곳에서 데이터 관리에 대한 문제만 해결해도 업무 리소스를 극적으 절감할 수 있고, 더 쉽게 인사이트를 발견해 의사결정 시간을 줄이고 빠르게 액션을 취할 수 있다면 1인이 발생시킬 수 있는 매출은 눈에 띄게 늘어날 것이 분명했습니다.

그래서 저는 업무 전반을 아우르는 Full Stack 마케터로서 해야 할 일을 하기로 결심했습니다.

바로 구성원들이 명확한 의사결정을 할 수 있도록 + 불필요한 업무 리소스를 줄여 실무에 집중할 수 있는 환경을 만들어주는 일이었습니다.

[RAW 데이터를 정리하는 방법]

결론부터 말하자면 ‘데이터 정의, 데이터 전처리, 데이터 시각화’ 작업을 시작했습니다.
 
데이터에 익숙하지 않은 인원들에게 숫자로만 데이터를 보라는 건 다소 무리한 요구라 판단, ‘저는 읽기 힘든 책 대신 ‘데이터 시각화’라는 시작하기 쉬운 ‘만화책’으로 ‘데이터를 보는 맛‘을 선물하기로 했고 바로 업무에 돌입했습니다.
 
어떻게 데이터를 정리해 상황을 타개했는지 간략히 적어봅니다.
 

1. RAW 데이터를 가공해 보고자 하는 ‘최종 지표’들을 명확히 설정합니다.

일단 이곳저곳 흩어진 파일들을 살펴보고 파일의 ‘존재 목적 = 열람 지표’를 명확하고 간결하게 취합합니다. 

2. 지표를 구성할 최하위 RAW 데이터 레이블을 정의합니다.

1번에서 정의한 지표들을 열람하는 데 필요한 ‘최소한의 데이터 레이블(유형)’을 정의합니다.

3. 2번 이후, RAW 데이터 레이블 중 불필요한 것을 덜어냅니다.

예를 들면 ‘수익’이란 지표를 위해 꼭 ‘수익’이란 데이터 레이블이 필요한 것은 아닙니다.
‘매출’과 ‘비용’ 데이터가 있다면 ‘매출-비용’로 ‘수익’을 구할 수 있죠.
 
같은 원리로 ‘객단가’를 구하려면 ‘객단가’라는 데이터가 필요한 것이 아니라 ‘주문 수’와 ‘매출’이란 데이터만 있다면 충분한 것과 같습니다.

4. 데이터를 유형화 합니다.

3번까지 마쳤다면 데이터를 담을 그릇(엑셀 또는 스프레드시트 등 활용)을 구현해줍니다.
이때 모든 데이터를 ‘관리 목적’에 따라 데이터 유형을 구분합니다.
 
제 경우에 ‘상품’이나 ‘판매채널’을 ‘정적인 데이터’로 정의하고 ‘일별 매출 데이터’를 ‘동적인 데이터’로 정의해 각 데이터 목적에 따라 관리 주기를 정하고 직무에 맞는 담당자를 설정해 ‘데이터 관리 정책’을 수립했습니다.

5. 데이터를 연동해 가공할 수 있는 ‘기준’을 수립하고 적용합니다.

데이터가 모두 정리됐다면, 이제 각 데이터를 조합/가공해 실정에 맞게 사용하는 일만 남았습니다.
 
각 데이터를 조합하기 위해선 ‘Primary Key’가 필요합니다.
예를 들면 저는 ‘목표 매출과 달성 현황 관리’를 위해 ‘판매채널’, ‘목표’, ‘일별 매출’ 3가지 데이터에 ‘판매 채널 id’와 ‘목표 매출 id’, ‘월’이라는 추가 데이터 레이블을 설정하고 각 데이터가 연동될 수 있는 Primary Key를 부여했습니다.
 
이렇게 되면 유형별로 데이터가 분리되어 있으나 각 데이터를 연동, 자유로이 필요한 지표를 구현할 수 있습니다.
5번까지 완료됐다면, Power BI, Google Looker Studio 등 시각화 툴을 활용해 1번에서 정의한 지표들을 데이터 연동 + 함수를 통해 표현해주면 됩니다. (이 부분은 텍스트만으로 설명이 어렵기에 생략하겠습니다.)
 
이 과정까지 거쳐 지금은 확실히 RAW 데이터를 관리하는 시간이 대폭 감소하고 시각화 대시보드를 통해 더 빠르고 명확한 의사결정이 가능하게 됐으며 결과적으로 매출은 우상향 그래프를 그리고 있습니다.
 
저 또한 이번 경험으로 영업이나 마케팅 등 매출과 가까운 활동도 중요하지만, 업무 관리 또한 기반이 되어야 한다는 점을 다시 한번 깊이 새기게 되었습니다.
 
마지막으로 BEFORE(엑셀), AFTER(스프레드시트) 순으로 개편된 RAW 데이터와 보고서를 첨부하며 글을 마무리 짓겠습니다.
 
혹 글을 읽고 더 궁금한 점이 있는 분이 계신다면, 편히 대화 걸어 주셔도 좋습니다. 많이 부족하지만 가능한 선에서 답변드리겠습니다.

※ 본 글의 저작권은 '이시우'에게 있으며, 인용할 경우 출처를 명시해야 합니다.

※ 본 글의 저작권은 '이시우'에게 있으며,
인용할 경우 출처를 명시해야 합니다.

매거진 더보기
2024 마케팅 이슈 8가지
선빵, 고객 서비스의 필수 원칙
직장인, 번아웃이 두렵다면?
나만 알고싶은 뉴스레터 모음
대행사 협업 노하우 6가지
마케터는 풀스택이 필수

댓글 1

  1. 기본 개념 알려주셔서 감사합니다. 혹시 상세 내용을 좀 문의드려도 될까요?

    응답

댓글

Full Stack Marketer & Artist