사이트맵  |  Contact Us
 
홈 > SAS 분석 챔피언십 > 분석 챔피언십 참가후기
[17회] SAS분석챔피언십 후기 - 영남대학교 통계학과 김현주 2020.06.18
MYSAS 125 0
http://www.mysas.co.kr/sas_mining/d_interview.asp?b_no=11474&gotopage=1&con=subject&keyword=&cmd=content&bd_no=10&gubun=

안녕하세요 17 SAS 분석 챔피언십에 참가했던 SA1133팀 영남대 통계학과 김현주입니다. 먼저 SAS 분석 챔피언십은 시간을 얼마나 투자했는지에 비례하는 공모전이라고 생각합니다. 그렇기에 SAS 분석 챔피언십을 나갈 계획이신 분들이라면 중간에 포기하지 말고 꼭 끝까지 완주해보셨으면 좋겠습니다공모전을 하는 과정 속에서 많은 것을 보고 느낄 수 있고 다음 단계로 도약하는 발판이 될 것입니다.

 

저희 팀은 공모전을 진행하는 동안 매일 학교에 모여서 밥을 함께 먹으며 가족처럼 지냈습니다. 공모전을 할 때 같이 있는 시간이 많아 지기 때문에 의견 충돌이 있을 수도 있고 서로에게 마음 상하는 일이 생길 수 있습니다. 그럴 때마다 저희 팀은 많이 대화하려고 노력했고 팀장님이 잘 이끌었습니다. 이렇듯 분석챔피언십을 하면서 데이터분석 관련 능력과 의사소통 능력을 같이 키울 수 있었기에 소중한 경험이 되었습니다.



<데이터 탐색>

저희 팀은 데이터 탐색에 많은 시간을 투자했습니다. 같은 팀원들 모두 공모전에 대한 경험이 많지 않았기에 데이터를 핸들링 하는 방법을 알지 못했습니다. 그래서 VDMML프로그램을 활용해 변수들을 도표로 나타내고 어떤 변수가 목표변수에 영향을 많이 미치는지에 대해서 최대한 많이 변수탐색을 진행하였습니다. 사실 SAS에서 주신 자료가 범주형 변수가 많았기에 나타낼 수 있는 도표가 한정적이어서 힘들었지만 조금이라도 분석의 방향성을 잡기위해 변수리스트를 프린트하여 공모전을 진행하는 동안 여러 번 반복해 보았습니다.

 

 

<전처리+모델링>

저희 팀이 제일 공들인 부분이 변수 처리 부분이었다고 말할 수 있습니다. 처음에 어떤 변수가 중요한지 몰랐기 때문에 모든 변수를 넣고 모델링을 진행했다가 오차가 커서 데이터 전처리가 중요한 부분이라는 것을 깨닫게 되었습니다. 그 이후 학교 도서관에서 관련 도서를 읽고 많은 구글링을 통해 전처리는 어떤 방법으로 진행되는지 매일 찾아보았습니다. 그렇게 어떠한 방법으로 진행할지에 대한 레이아웃을 만들고 난 후 변수 전처리를 진행했습니다. EG를 활용해 파생변수를 만들었고 목표변수와 관련되어 있을 것이라 생각하는 외부변수들도 최대한 많이 활용했습니다.


모델링을 진행하기 전 어떤 변수를 선택할지에 많은 단계를 거치고 난 후 모델링을 진행하였습니다. 데이터의 수가 많았기에 모델링을 할 때 시간이 오래 걸리는 점이 아쉬웠지만 마감일까지 모델링을 수행하였고 결국 저희는 가장 작은 오차를 결과물로 제출하였습니다.

 

한 여름에 학교를 통학하기란 쉽지 않은 일이었습니다. 하지만 같은 팀원들이 항상 옆에 있었기에 좋은 결과를 가지고 올 수 있었다고 생각합니다. 특히 팀장에게 너무 감사하다는 말 꼭 전하고 싶습니다. :-)

  

 
휴대폰 번호
휴대폰 인증번호
 
 [17회] SAS분석챔피언십 후기 - 이화여대 통계학과 이정은
 [17회] SAS분석챔피언십 후기 - 영남대학교 통계학과 김규리