Daily 1%
article thumbnail

프로젝트 계기

원래 축구를 하는 것도 보는 것도 좋아했지만, 지난 시즌부터 K리그를 하이라이트만 보고 있었습니다. 그런데 게속 보다 보니 실시간 경기도 보고 싶은 마음이 들었는데 마침 쿠팡 와우 멤버십에 포함되어 있다는 사실을 알게 되어 최근엔 꾸준히 보고 있습니다. 고향인 대전과 마음의 고향인 인천경기는 라이브로 보는 편이고 나머지 팀의 경기는 하이라이트만 보고 있습니다.

 

그런데 K리그 데이터 포털에서 관련 데이터를 살펴볼 수 있다는 사실을 알게 되었고, 해당 데이터와 제가 그동안 보아온 K리그에 대한 지식(?)을 결합하여 프로젝트를 진행해보겠다는 결심을 하게 됩니다. 사실 겸사겸사 태블로도 써보고, 프로젝트를 핑계로 K리그 데이터 살펴보고 싶은 마음이… 공부하다 축구영상도 보고... 하이라이트도 영상 데이터긴 합니다. 흠흠…

 

프로젝트 진행은 어떻게 했을까

1) K리그 데이터 포털에서 데이터 (손으로) 수집하기

케이리그데이터포털

저는 당연히 API를 제공하거나, 쉽게 데이터 추출을 지원할 줄 알았는데, 웬걸 그런건 없었습니다. 그러면 여기서 포기해야 하느냐! 아닙니다. 무려 최첨단 휴먼 손크롤링을 통해 데이터를 취합할 수 있었습니다. 우선 데이터 포털에서 살펴볼만한 데이터들이 있는지 보고, 해당 데이터들을 하나하나 팀별로 구글 시트에 정리했습니다. (생각보다 굉장히 오래 걸렸습니다)

 

2) 지표 살표보기

구글시트로 데이터옮기기
구글시트로 옮기기

보통은 검증하고 싶은 가설을 먼저 세웁니다만, 저는 데이터를 살펴보면서 각 팀별로 ‘내가 느기거나 생각했던 것’과 다른 지표가 있는지 살펴봤습니다. 아쉽게도 울산은 1위팀답게 대부분의 지표에서 상위권이었습니다. 하지만 최근 언더독의 반란으로 유명한 대전과 광주는 일부지표에선 최상위권인데 또 다른 지표들에선 중하위권인 경우들이 있었습니다.

 

태블로데이터연결
태블로로데이터옮기기

이러한 지표들을 표형태로 보다보니 매우 불편했고, 정렬도 애매했기에 태블로에서 살펴보기 시작했습니다. 처음에는 태블로에 익숙치 않아서 헤메다가, 어느정도 익숙해지니 요것저것하면서 흥미롭게 데이터를 살펴볼 수 있었습니다.

 

혹시라도 태블로로 프로젝트 하실 분들은 기초강의먼저 듣고 하시는 걸 추천드립니다.. 그다지 UI가 친절하진 않아요!

 

태블로를 향한 첫 걸음| Gemma - 인프런 강의

현재 평점 4.8점 수강생 505명인 강의를 만나보세요. 태블로 자격증에 나오는 내용을 훑으면서, 짧은 시간 안에 태블로의 전반적인 기능에 대해서 파악할 수 있습니다. Tableau Specialist Desktop 자격증

www.inflearn.com

이 링크를 통해 구매하시면 제가 수익을 받을 수 있어요. 🤗

3) 스토리텔링하고 싶은 내용과 필요한 지표들 선정하고 분석하기

저는 최근 축구관련 뉴스에서 자주 보이는 지표인 xG값을 중심으로 스토리텔링을 하고자 했습니다. xG값은 득점 기댓값이란 지표로, 축구에서만 사용되는 지표입니다. 90분당 xG값이 높다면, 1경기당 득점할 수 있는 찬스를 많이 만든다는 뜻이고, 반대로 낮다면 득점할 수 있는 찬스를 만들지 못한다는 뜻입니다. 그렇다면 당연히 순위에 따라 상위권팀은 xG값이 높고, 하위권팀은 낮아야 하지만… 그렇지 않았습니다. xG값이 높음에도 xG값당 득점이 낮은 팀들이 존재했고, 이 팀들의 경기를 직접 보기도 했던 터라 그 이유를 데이터와 함께 풀고자 하였습니다. 이후 스토리텔링할 지표들을 선정하여 태블로 내 시트로 만들고, 이 시트들을 조합해서 대시보드로 만들었습니다.

K리그대시보드
대시보드

4) 분석 내용 커뮤니티에 공유하기 (가장 중요)

시각화를 하고 스토리텔링을 하자 작성한 내용이 혼자 보기엔 아깝다는 생각이 들었습니다. 때문에 관심있어할만한 커뮤니티를 찾아 해당 내용을 공유했습니다. 국내 축구 커뮤니티에 분석한 내용과 함께 대시보드 이미지를 올렸고, 회고글을 쓰는 현재 기준으로 조회수 763,추천39, 댓글은 단 11개였지만 공유의 힘을 느꼈습니다. 정말 별것 아닌 지표와 저의 사견으로 작성한 부분이 많았음에도 이러한 호응(?)을 얻을 수 있어서 큰 보람을 느꼈습니다.

분석내용과 댓글
분석내용과 댓글

얻은 인사이트 4가지

관심있는 분야로 프로젝트를 진행하자

분석을 하면서 느낀 점은 결국 내가 관심있는 분야, 데이터여야만 스토리텔링이 가능하다는 것입니다. 숫자만 봐서는 사실 그 이면의 맥락을 알기 힘듭니다. 프로젝트도 마찬가지 입니다. 자신이 관심있는 분야의 데이터를 통해 프로젝트를 진행하면 가설을 설정하고 데이터를 통해 스토리텔링을하기 수월합니다. 하지만 관심없는 분야라면 백그라운드 지식을 쌓는 노력이 배로 듭니다. 때문에 개인 프로젝트를 진행한다면 관심있는 분야로 시작하기를 추천드립니다.

 

검증하고 싶은 가설이나 내용을 먼저 정하자

저는 직접 손으로 데이터를 크롤링해야했기에 데이터를 먼저 옮기고, 일일이 정합성을 맞춰보면서 어떤 데이터가 있는지 파악하는 과정을 거쳤습니다. 이후 데이터를 통해 어떤 가설들을 검증해볼 수 있을지 고민했고, 이렇게 데이터를 살펴보면서 가설을 설정하는 것에 시간을 굉장히 많이 소모했습니다. 때문에 다시 프로젝트를 하게 된다면, 가설을 먼저 설정하고 이를 검증할 수 있는 데이터만 추출하는 방법으로 진행하고 싶습니다. 먼저 시간, 정신적 소모를 줄이고 스토리텔링에 더 많은 힘을 쏟을 수 있기 때문입니다.

 

보는 이를 생각하며 시각화하자

이번에 태블로를 처음 사용했기에 각 그래프별로 색상도 기본색상으로 진행했고, 라벨도 텍스트로 간단히 표기했습니다. 하지만 그동안 보아왔던 시각화들은 한눈에 색상별로 지표를 구분하기 편했고, 각 축구팀 색상에 맞는 컬러를 사용하거나 로고를 라벨로 사용하여 보는 사람을 배려한 디자인을 갖췄습니다. 저 또한 단순히 텍스트로 표기하기보다는 각 구단의 팀컬러와 로고를 차용하여 보는 축구팬들이 더 쉽게 자신의 팀을 찾아볼 수 있도록 만들면 좋았겠다는 아쉬움이 남았습니다.

 

어쨌든 남들이 볼 수 있는 곳에 공유하자

사실 혼자서 해당 프로젝트를 간직했다면 기억에 남지 않았을 수도 있습니다. 하지만 부끄러움을 무릅쓰고 커뮤니티에 올렸고, 부족한 점이 많았음에도 노력에 박수를 보내주는 댓글들을 받을 수 있었습니다. 이 프로젝트를 시작할 때에는 손으로 크롤링해야하는 수고때문에 다음번엔 안해야겠다고 생각했지만, 수고했다고 달아준 댓글들 덕분에 정말 많은 힘을 얻고 다음에도 해봐야겠다는 생각이 들었습니다.

 

프로젝트를 마무리하며

이틀정도 진행한 토이 프로젝트였지만, 개인적으로 흥미있는 데이터를 활용해 연습 겸 태블로도 써봤고, 무엇보다 단 1사람에게라도 ‘재밌었다 잘봤다’라는 말과 함께 가치를 전달할 수 있어서 정말 행복한 프로젝트였습니다. 개인적으로 취업용 포트폴리오를 위해 데드라인에 허덕이며 진행했던 프로젝트보다 100배정도 재밌었던 것 같습니다. 이 글을 읽으실 다른 분들도 꼭… 공유!! 하세욧!!

 

+) 회고글 쓸 당시에는 한참 뒤로 파묻혀서 이제 더이상 댓글은 없겠지 했는데… 나중에 역주행해서 커뮤니티 최신 인기글에 오르기도 했습니다. 어메이징..!

실시간인기글로
인기글에 오르기도하다니!

++) 아예 전체 인기게시물에 올라서 조회수 25000이 넘었네요... 제가 만든 시각화와 분석내용이 2만명이 넘는 사람이 봤다는 게 정말 신기합니다.

조회수기록
2만이 넘는 조회수를 기록했다