로그인   |  회원가입  |  사이트맵  |  Contact Us
  아이디 저장하기
 
홈 > SAS마이닝 챔피언쉽 > 체험기
[14회] SAS분석챔피언십 후기 - 홍익대학교 산업공학과 김원겸 2016.10.18
MYSAS 424 0
http://www.mysas.co.kr/sas_mining/d_interview.asp?b_no=7038&gotopage=1&con=subject&keyword=&cmd=content&bd_no=10&gubun=

[입선] 홍익대학교 산업공학과 김원겸 (SA200)

참가 계기 : 처음엔 빅데이터에 대해 관심도 경험도 없었습니다. 학과 수업인 데이터베이스는 물론이거니와 데이터마이닝 수업도 듣지 않았고, 통계학 수업이 유일한(?) 저와 데이터의 연관성이었습니다. SAS는 2012년 통계학 실습시간에 사용해본 경험이 있지만 EG, EM, VA가 아닌 그저 코딩프로그램이었습니다. 그러던 저에게 2016년 봄 팀원인 민호형이 ‘7월에 열리는 SAS분석챔피언십에 함께 하자’고 하였고, 한번해볼까 하고 빅데이터에 관심을 갖기 시작했습니다.

사전 탐사 : 저희는 빅데이터에 들어가기에 앞서 사전탐사 느낌으로 Tableau Expert에서 주관하는 데이터 시각화 공모전에 참가하였습니다. 팀원 모두가 공모전에 대한 경험이 없고 빅데이터에 대한 자신감이 없었기 4월에 열리는 공모전을 통해 어떤 식으로 진행하고 누가 어디에 강점이 있는지 파악하기 위한 느낌으로 참가하였고, 좋은 경험을 했습니다.

SAS 챔피언십의 시작 : OT에 참여하여 어떤 주제인지 자세히 알게 되었습니다. 하지만 저희는 모두 SAS프로그램을 다뤄본 경험이 없었기 때문에 아무것도 하지 못했습니다. 그리고 7월 18, 19일 SAS스쿨에 팀원이 모두 참여했습니다. 저희 팀원 모두 SAS프로그램을 다뤄본 적이 없었기 때문에 굉장히 도움이 되었고, 교육 이후 본격적으로 시작하였습니다.
데이터가 굉장히 많았습니다. 7월 마지막 날까지 기본 데이터를 계속 가지고 놀았습니다. 수많은 데이터를 보면서 ‘이런 특징의 사람도 있을까?’, ‘이렇게 하면 이게 나올까?’ 하며 EG만을 이용했습니다. 그리고 EM으로 넘어가면서 깨달은 바가 있습니다. ‘이런 모든 데이터를 전부 이용해서 프로그램을 돌리면 시간이 너무 오래 걸린다. 분명히 데이터를 줄여서 작업을 하는 게 정답이 아닐까’라고 생각했습니다.
하지만 하면 할수록 데이터 처리에 있어서 모든 게 어려웠습니다. 맞게 하고 있는 것 인지도 너무 궁금했고 관련 논문을 100편도 넘게 찾아보았습니다. 논문을 통해 기법에 따른 변수 유형을 파악하려하는데 논문마다 유형 방법이 너무 달랐습니다. 진행이 답답하기도 하였고 한 번 거꾸로 생각해보면 어떨까 하는 마음에 시각화에 변수를 집어넣어보았습니다. 결과적으로 그동안 해왔던 명목변수뿐 아니라 이분변수를 사용하는 등 분석 기법에 따라 나눠서 진행해야 했습니다. 분석 이후 시각화를 하는 일반적인 방식이 아닌 시각화로부터 답을 찾아가는 반대 방식을 택하였기에 분석을 온전히 시행할 수 있었습니다.
# 여기서 꿀팁은, 관광 빅데이터 공모전의 수상작은 오픈되어있었기 때문에 굉장히 큰 도움이 되었습니다. #
데이터 전처리를 정말 계속했던 것 같습니다. 막말로 제출 전날까지도 전처리를 손본 것 같습니다. 또한 주제정의서에 많이 집중했던 것 같다. 중간에 몇 번 포기할까 라고 생각한 적도 있습니다. 하지만 제출이라는 목표를 갖고 하였기 때문에 입선이라는 성과를 거둔 것 같습니다.

 
  
 
 [14회] SAS분석챔피언십 후기 - 홍익대학교 산업공학과 임지원
 [14회] SAS분석챔피언십 후기 - 인하대학교 통계학과 정현명