사이트맵  |  Contact Us
 
홈 > SAS 분석 챔피언십 > 분석 챔피언십 참가후기
[17회] SAS분석챔피언십 후기 - 이화여대 통계학과 이정은 2020.06.18
MYSAS 124 0
http://www.mysas.co.kr/sas_mining/d_interview.asp?b_no=11475&gotopage=1&con=subject&keyword=&cmd=content&bd_no=10&gubun=

안녕하세요, 제 17회 대회에서 은상을 수상한 이정은이라고 합니다.

이 글을 보고 계신 여러분들은 SAS 분석 챔피언십에 관심이 있으실 거라 짐작이 됩니다. 이 후기에는 개인적인 소감보다는 여러분들의 여정에 실질적인 도움이 될 수 있는 내용을 위주로 작성하였습니다.

 

- 팀빌딩

장기간 진행되는 공모전인 만큼 누구와 함께 할 지 고민이 많으실 수 있습니다. 결론부터 말씀드리자면 성실성은 기본이고, 내가 잘 못하는 것을 잘 하는 팀원과 함께하시면 됩니다. 참고로 SAS 분석 챔피언십에서는 데이터 분석, PT 및 보고서 작성이 주요 과제입니다. 그러니 두 세 명이 한 팀을 이룬다면 모두가 데이터 분석만을 잘 하는 팀보다 데이터 분석과 PT, 보고서를 전반적으로 커버할 수 있는 팀원들과 함께하는 것이 유리합니다. 

 

- 1차

1차 보고서는 결과물의 퀄리티 보다, 본분석에 들어가기 전 팀원들이 모여 주제에 대해 큰 틀을 잡고 분석 방향을 구상해 보는 시도가 더 중요합니다. 주제에 대해, 그리고 앞으로의 전략에 대해 고민을 많이 해보시고 그 결과물을 보고서에 담아 내시면 됩니다. 한 가지 주의하실 점은 1차 보고서가 본분석과 동떨어진 형식적인 과제는 아니라는 것입니다. 저희 팀은 1차 보고서에서 잡았던 큰 틀을 참고하며 본분석에 적용하기도 했습니다.

 

- 2차 

저희 팀은 분석 전에 이전 수상자들의 후기를 정독하고 도움되는 내용들을 따로 정리하였었는데, 데이터 전처리의 어려움을 토로하는 팀들이 많았습니다. 전처리는 유난히 투자한 시간에 비해 성과물이 없는 것처럼 느껴지는 부분입니다. 제가 생각했을 때 이 부분이 어려운 이유는, 전처리는 완벽한 공식이 없고 분석자의 의도에 따라 좌지우지될 수 있는 부분이기 때문이라고 생각합니다. 실제로 데이터는 분석자의 의도에 따라 다양한 방식의 전처리를 거칩니다. 예를 들어 오전 3시 4분 58초가 한 변수 안에 ‘3:04:58’의 문자열 데이터로 되어 있다고 합시다. 홈쇼핑의 매출에 방영시간이 영향을 준다는 판단은 많은 사람들이 공통적으로 할 수 있습니다. 그러나 저 변수를 제공된 상태 그대로 사용하면 잘 판단하지 못했다고 할 수 있습니다. 3:04:58과 3:04:59는 거의 방영된 시간이 동일하다고 볼 수 있으나 기계학습시에는 두 값을 서로 다른 값으로 인식하여 완전히 상관없는 값이 되어버립니다. 따라서 높은 퍼포먼스를 자랑하는 모델링을 하고 싶다면 그만큼 고민하시고 효과적으로 변수를, 데이터를 가공해야 합니다. 그리고 결측 값을 단순히 삭제할 지 기법을 이용해 대체 값을 넣어 사용할 지와 파생 변수로 어떤 데이터들을 결합하여 사용할 지까지 분석자의 판단이 요구되는 경우가 많고, 매순간 여러분들은 조금 더 나은 선택을 해야 합니다. 효과적인 선택을 내리기 위해서는 목표를 의식적으로 생각하시고 많이 공부하시길 바랍니다. 분석을 하다 보면 목적을 상실하고 샛길로 빠져 시간을 낭비하는 경우가 생깁니다. 내가 하고 싶은 분석 말고 목적 달성에 필요한 분석을 하시기를 바랍니다.

 

- 3차

PPT에는 다른 조와는 차별되는 내용을 중심으로 담아 내시면 좋습니다. 뻔한 내용은 심사위원들도 어느정도 숙지하고 있는 내용이고 아무런 감흥이 없습니다. 심사위원은 사실 현업에 계신 분, 교수님 등등.. 참가자들보다 높은 수준의 분석력을 가진 분들이 많습니다. 따라서 그분들이 기본적인 내용은 숙지하고 있다고 생각하시고 우리 조의 강점을 보여줄 수 있는 내용 위주로 담아서 발표하시면 도움이 될 것입니다.

 

제 후기는 이만 마치겠습니다. 여러분 모두 좋은 결과 있기를 바랍니다 😊

 

 
휴대폰 번호
휴대폰 인증번호
 
 [17회] SAS분석챔피언십 후기 - 이화여자대학교 통계학과 김수완
 [17회] SAS분석챔피언십 후기 - 영남대학교 통계학과 김현주