로그인   |  회원가입  |  사이트맵  |  Contact Us
  아이디 저장하기
 
홈 > SAS마이닝 챔피언쉽 > 커뮤니티 게시판
[기타] 제 14회 분석챔피언십 그 대단원의 막을 올리며 / 공모전 준비 전략(1) 2016.06.02
한노아 979 0
http://www.mysas.co.kr/sas_mining/f_mining.asp?b_no=6847&gotopage=1&con=subject&keyword=&cmd=content&bd_no=39&gubun=

안녕하세요.

 14 SAS분석챔피언십에서 여러분에게 도움을 주는 역할을 맡게 된 한노아라고 합니다( _ _ )

 

저는 작년 13 SAS분석챔피언십 코웨이상(은상) 수상자이기도 하지만 무엇보다 여러분과 같이(혹은 비슷한) “데이터 과학자를 꿈꾸는 학생입니다.

 

그래서 이 커뮤니티를 통해 비슷한 꿈을 향해 걸어가고 있는 우리들이 서로 소통했으면 좋겠습니다. 외국에는 그런 커뮤니티들이 많이 있더라고요. 지식공유도 좋고, 분석하면서 하게 되는 푸념도 좋은 것 같아요. 힘들더라도 함께 가면 멀리 갈 수 있다고 합니다. 공모전 완주! 그리고 꿈을 향한 완주!

 

그런 의미에서 오늘은 제가 작년에 공모전을 준비했던 방법, 그리고 SAS에서 인턴을 하면서 배웠던 좋은 전략들을 공유할까 합니다.

 

 

"공모전어떻게 준비해야하나요?"

 

1) 선행연구 분석

  지금 메인에 걸려있는 것은 아마 분석 주제 정도일 것입니다그렇다면 이 단계에서 공모전에 참여하시는 분들은 어떤 일을 하시는 게 좋을까요저 같은 경우엔 이 시기에 분석 주제와 관련 된 논문을 읽었습니다학과 사무실에가서 관련 논문 10~30편 정도를 프린트해서 책으로 만들어서 읽었습니다(사실 다 읽어보진 못했습니다ㅎㅎ

 

  저와 같은 학부생이라면 논문을 읽을 기회도 사실상 많지 않고거기다 본인의 전공과 전혀 관련 없는 분야의 경우 논문을 읽는데 난해함이 많을 것입니다(저도 그랬습니다그야말로 처음 읽을 때는 1도 이해가 가지 않을 수 있습니다하지만 당황하지 마시고 계속 계속 한 편씩 읽어두세요 ㅎㅎ 그리고 함께 공모전을 준비하는 팀원들과 논의하고 서로가 이해한 부분에 대해 지속적으로 커뮤니케이션을 하는 것이 중요합니다(그래야 나중에 서로 오해가 발생하지 않습니다)

 

"논문을 읽으면 뭐가 좋은데요?"

 

  분석에서 제일 중요한 것은(제 개인적인 생각으론"Domain Knowledge"인 것 같아요왜냐하면 처음 데이터를 받았을 때 그 수치들이 의미하는 것들을 정확하게 이해하는 것이 선행되지 않으면 분석의 방향성조차 제대로 잡을 수 없기 때문입니다그렇기 때문에 해당 분야에 대한 전문적인 지식들이 집약되어 있는 논문을 많이 읽어보는 것이 중요합니다논문을 읽으면 단기간에 이 분야에서 사용하는 전문용어라든지 연구 방법론이라든지 중요한 이슈들을 파악하기 쉽습니다이렇게 준비를 하면 허접하게 나마 해당 분야에 대한 지식을 쌓을 수 있습니다.

 

  참고로 학위논문들(/박사)의 경우 앞 쪽에 용어설명이라든지 개념 설명이 매우 친절하게 되어있습니다그래서 학위논문을 읽으시면 친절한 교과서를 읽는 듯한 기분이 들지도 모릅니다ㅎㅎ 

  팁을 한 가지 더 드리자면 보통 해외 논문을 읽는 데에는(특히 처음 접하는 분야시간이 국내 논문에 비해 2~3배 정도 더 많이 소요가 됩니다그래서 저 같은 경우 국내 논문을 먼저 보고해외 논문으로 넘어가는 방법을 선택했습니다이렇게 읽으면 해외 논문을 읽더라도 국내 논문을 읽으며 쌓여있는 해당 분양에 대한 지식들 때문에 더 수월하게 읽을 수 있습니다(저는 그랬습니다ㅎㅎ)

 

  이렇게 논문을 통해 쌓아 둔 전문지식들은 나중에 데이터를 받아봤을 때 무엇을 어떻게 할지에 대한 해답의 틀을 어느 정도 마련해 줍니다아무래도 먼저 준비한 사람들과 그렇지 않은 사람들의 데이터 이해 속도는 틀리겠죠이 속도가 빨라지면 더 많이 실수할 수 있는 기회를 얻을 수 있습니다.

 

2) 데이터를 그려보세요

  얼마 전에 SAS에 계신 분석의 신들에게 배운 스킬입니다우리에게 데이터가 없다면 데이터가 어떻게 생겼을지 미리 한 번 그려보는 겁니다

가령 아래와 같이 논의를 할 수 있을 것입니다.

 

"이번 분석 주제는(작년의 경우미세먼지와 호흡기 질환과의 상관관계를 밝히는 것이니까 미세먼지와 관련된 데이터들과 환자의 숫자에 대한 데이터가 있을 거야"

 

"그렇다면 관측 주기는 어떻게 될까?"

 

"아무래도 심평원 데이터를 이용하고기상청 자료를 이용할 테니 일일 단위가 아닐까?"

 

"관측 지역은 어떻게 될까?"

 

"서울시 데이터니까 서울시겠지 뭐"

 

"그럼이번에는 서울시의 일일 단위 호흡기 질환 환자 수와 기상정보 같은 게 있겠구먼그럼 데이터는 아마도 .... 하겠네?"

 

"그럼 이런 형태의 데이터로 우리가 어떻게 인과관계를 밝힐 수 있을까?"

 

....(중략)....

 

  위와 같은 방법의 논의 과정을 시간이 충분한 지금 미리 해두시면 정말 정말 도움이 많이 될 거라고 생각해요 ㅎㅎ 저는 저런 방법을 몰랐는데 제가 만약 공모전을 준비하기 전에 저런 스킬들을 알았다면 더 많은 실수를 할 수 있는 기회를 얻었을 거라고 생각합니다.

 

3) 수상작 찾아보기

  또 하나의 팁은 공모전 수상작들을 찾아보는 것입니다제가 알기론 몇몇 공모전들의 경우 수상작들을 오픈해 놓는 경우가 있습니다특히 관광 데이터의 경우 1~2회 수상작들을 홈페이지에 올려놨던 걸로 기억합니다이렇게 다른 수상작들을 찾아보면 

 

"이 사람들은 이렇게 분석을 해서 상을 받았구나"

 

"이 사람은 왜 동상 밖에 못 받았지?"

 

  와 같은 생각들이 들면서 무엇이 평가에 있어서 중요한지를 깨닫게 됩니다물론 공모전 마다 심사하는 분이 누구냐에 따라 포인트는 다를 수 있습니다하지만 1차 심사의 경우 대부분의 공모전들이 비슷한 기준에 의해서 선발하는 것 같습니다수상작을 찾아보는 것은 비단 분석 공모전 뿐만 아니라 다른 마케팅 공모전이라든지 아이디어 공모전이라든지 사실상 거의 대부분의 공모전에 좀 더 쉽게 접근할 수 있는 팁 중 하나입니다.

 

 

오늘은 여기서 글을 마무리하도록 하겠습니다.

오늘 글은 공모전의 전체적인 프로세스 중 데이터를 받기 전에 우리가 무엇을 할 수 있는지에 대한 저의 노하우를 공유해 보았는데요.

다음시간에는 스코프를 넓혀 전반적인 공모전 프로세스에 대해 이야기 해보도록 하겠습니다.

 

  

 
 
  
김진국   [2016/06/30 1:46]
잘읽었습니다 감사합니다
정상대   [2016/07/01 12:45]
말씀 감사합니다 !
 
 제 14회 분석챔피언십 그 대단원의 막을 올리며 / SAS를 공부를 위한 컨텐츠 소개

 더 이상 글이 존재하지 않습니다.