사이트맵  |  Contact Us
 
홈 > SAS 분석 챔피언십 > 분석 챔피언십 참가후기
[16회] SAS분석챔피언십 후기 - 이화여자대학교 통계학과 김유리 2018.10.15
MYSAS 45 0
http://www.mysas.co.kr/sas_mining/d_interview.asp?b_no=7779&gotopage=1&con=subject&keyword=&cmd=content&bd_no=10&gubun=


 

16회 분석 챔피언십의 동상 수상자 이화여자대학교 통계학과 김유리입니다. 다음 대회 참가자 분들이 이 글을 통해 시행착오를 줄이시는 데 도움이 되셨으면 합니다.

 

[심사기준 이해하기]

대회의 목적을 파악하는 것이 가장 우선입니다. 대회 개최 당사자가 해결하고자 하는 문제가 무엇인지, 그리고 그 문제와 관련하여 어떤 화두가 되었는지 파악하는 것이 중요합니다. 이러한 대회의 목적을 파악하려면, 분석 요강을 꼼꼼히 확인하고, 비슷한 주제에 대해 선행된 분석이 있는지 확인해야 합니다.

 

[데이터 전처리]

데이터 마이닝 툴(SAS Home)의 사용법이 쉽기 때문에 데이터의 전처리에 가장 신경을 많이 써야 합니다. 이 때 주의할 점은 데이터의 전처리를 기계적으로 하는 것이 아니라, 각 데이터의 특성을 살려야 한다는 것입니다. 예컨대, 각 데이터를 합칠 때 병합 기준을 데이터의 내용에 맞게 해야 합니다. 데이터의 병합, filtering 기준이 실제 상황에 맞지 않으면 분석이 아무리 좋더라도 좋은 평가를 받을 수 없습니다.

 

[데이터 마이닝]

위에 언급했듯, 데이터 마이닝 툴이 클릭으로도 이용하기 쉽게 돼있기 때문에 누구나 쉽게 툴을적용할 수 있습니다. 다만, 분석 결과를 제대로 해석하려면, 각 기법의 특성을 이해해야 합니다. 또한, 실제 데이터인만큼 모델 성능이 좋지 않을 수 있습니다. 이 때 각 마이닝 기법에 대한 이해가 선행돼야 부족한 점을 파악하고, 모델의 성능을 향상시킬 수 있습니다.

 

[SAS코드]

SAS 코드는 SAS 홈페이지를 통해 배웠습니다. 예컨대, 이번 대회에서는 missing value에 대한 강조를 하셨기 때문에 missing value를 채우는 코드를 적용했습니다. 대부분의 통계 분석 기능이 프로그램에 내장돼 있기 때문에 코딩을 많이 할 필요는 없습니다. 필요한 몇 가지 기능만 코드를 찾으시면 됩니다.

 

[발표 자료]

발표자료는 생각보다 굉장히 중요합니다. 발표자료는 정보의 전달을 의미하기 때문입니다. 아무리 분석을 많이 하더라도, 청자에게 명료하게 전달되지 않으면, 준비기간 동안의 노력이 헛수고가 됩니다. 따라서 제출 3일 전에는 발표자료를 완성한 후에 계속 정정하는 방향으로 발표 자료를 만드시기 바랍니다.

 

이 대회에서 중요한 것은 첫번째로 팀원 간 협동하는 것입니다. 대회가 장기간 이루어지고, 이 대회에만 집중할 수 없어 포기하고자 하는 참가자들이 있을 것입니다. 완주를 목표로 하시고, 팀원 한 명이 지치면, 나머지 한 명이 분석을 이어 나가시면 좋은 결과가 있을 것입니다. 두 번째로 중요한 것은 기계적인 분석을 지양하는 것입니다. 분석 후, 분석이 제대로 된 것인지 여러 번 검토하시길 바랍니다. 

 
휴대폰 번호
휴대폰 인증번호
 
 [16회] SAS분석챔피언십 후기 - 이화여자대학교 통계학과 박정현
 [16회] SAS분석챔피언십 후기 - 이화여자대학교 통계학과 김민주