사이트맵  |  Contact Us
 
홈 > SAS 분석 챔피언십 > 분석 챔피언십 참가후기
[17회] SAS분석챔피언십 후기 - 이화여자대학교 통계학과 김수완 2020.06.18
MYSAS 122 0
http://www.mysas.co.kr/sas_mining/d_interview.asp?b_no=11476&gotopage=1&con=subject&keyword=&cmd=content&bd_no=10&gubun=

안녕하세요. 이화여자대학교 통계학과에 재학중인 SA1003팀 김수완이라고 합니다. 저는 SAS 프로그래밍에 관한 공부와 실제 데이터를 바탕으로 전처리부터 모델링까지 분석해볼 수 있는 좋은 기회라고 생각하여 공모전에 참여하게 되었습니다. 

 

 

<데이터 탐색>

 

이번 주제인 “롯데홈쇼핑 매출액 예측”의 가장 중요한 요소 중에 하나로 저희는 다양한 외부변수 및 파생변수를 만들어내어 이를 모델링에 잘 적용하는 것이라고 생각했습니다. 그래서 홈쇼핑 매출에 관련한 논문과 구글링을 통해 지식을 쌓았습니다. 또한 SAS EG로 데이터를 join하여 VA/VS를 통해 각 외부변수 및 파생변수가 매출에 미치는 영향력을 파악하고 변수로 사용할지 말지를 결정하였습니다. 

 

 

<분석> 

 

데이터 전처리, EDA, 모델링의 과정에 있어서 SAS EG, VA/VS, VDMML을 이용한 결과 어려운 코딩 없이 손쉽게 데이터를 처리하고 분석할 수 있었습니다. EG를 통해 데이터를 합치고, VA/VS를 이용하여 EDA 및 시각화를 진행하였고, 마지막으로 VDMML을 통해 여러 모델을 구현하고 최적의 모델을 찾을 수 있었습니다. 앞서 말한 바와 같이 2018년 매출액을 정확히 예측하는 것이 매우 중요한 관건이었기 때문에 overfitting을 고려하며 변수를 빼고, 넣는 과정을 반복하며 정확도가 가장 높은 모델을 선택했습니다. 

 

 

<그외 팁들>

 

저희 팀은 처음에 시작하기 막막하고, 어떻게 해야할지 엄두가 나지 않는다면 참가후기를 읽어보며 어떻게 해야할지 방향성을 잡았습니다. 또한, 주제정의서를 잘 정독하고, 오티 때 설명해주시는 얘기를 들으며 이 공모전의 목표가 무엇인지 잘 파악하는 것이 중요합니다. 

주제의 방향성 파악만큼이나 중요한 것이 바로 팀워크입니다. 팀 안에서 역할을 잘 배분하여 각자 맡은 역할을 잘 해낸 것이 효율적이고 빠른 일처리를 가능하게 한 것 같습니다.  

 

 
휴대폰 번호
휴대폰 인증번호
 
 [17회] SAS분석챔피언십 후기 - 이화여자대학교 통계학과 전해인
 [17회] SAS분석챔피언십 후기 - 이화여대 통계학과 이정은