
빅데이터 및 인공지능(AI) 분야는 끊임없이 실력을 갈고닦고, 학습한 내용을 꾸준히 실습해야 한다. 따라서 많은 이들이 실력을 향상할 한 가지 방법으로 경진대회에 주목한다.
하지만 초보자라면, 경진대회에 참가하기 부담스러울 수도 있다. 그렇다면, 국내 데이터 사이언스 경진대회 플랫폼으로 유명한 데이콘(DACON)을 활용해보는 것은 어떨까?
데이콘은 지난해 10월부터 데이콘 Basic이라는 이름으로 입문자를 위한 연습용 대회를 제공하기 시작했다. 기존 대회의 난이도 때문에 참여를 망설이던 학생을 대상으로 경진대회 경험과 실력 향상에 도움이 되기 위해 기획됐으며, 대회는 2주 간격으로 진행된다.
데이콘은 오는 24일부터 정형 데이터인 집값 데이터를 활용한 대회를 진행한다. 지금까지 펭귄 몸무게 예측(정형), 영화 리뷰 감성 분석(NLP) 경진대회 등이 진행되었으며, 곧 진행될 대회로는 항공사 고객 만족도 예측(정형), 사물 이미지 분류(Vision) 경진대회 등이 예정되어 있다.
데이터 분석에 앞서 프로젝트 설계부터 데이터의 수집 및 가공까지의 단계에 가로막혀 제대로 된 실습이 어려웠다면, 이 대회를 통하여 모델 작성 및 성능 평가 과정을 빠르게 경험할 수 있다. 또한, 베이스라인 코드와 시각화 코드(EDA)가 제공돼, 모델링에 익숙하지 않은 학생들도 이를 참고하여 최종 제출이 가능하다.
대회는 최대한 다양한 도메인의 데이터를 교대로 사용하면서 기획된다. 대회 개최 주기가 짧아 각자 선호하는 도메인의 대회를 기다리는 데에 시간이 오래 걸리지 않는다. 세부 도메인을 정하지 못했다면, 대회를 발판삼아 도메인을 결정할 수도 있을 것이다.
머신러닝, 특히 딥러닝은 GPU를 이용한 연산이 뒷받침되지 않으면 연산에 큰 어려움을 겪을 수 있다. 실제로 데이콘 Basic 참여자 중 CPU 이용을 시도했다가 학습 시간이 너무 길어져 포기한 사례도 있다. 완벽하게 실력을 쌓고자 한다면, 데이콘 Basic 참가 이외에 다른 노력도 필요하다는 의미이다.
그렇다면, 구글의 콜랩(Colab)을 함께 활용하는 것은 어떨까?

구글 콜랩은 누구나 무료로 GPU를 할당받아 사용할 수 있다. 많은 입문자에게 익숙한 ipynb 형태로 사용할 수 있다. 다만, 로컬 드라이브 데이터는 이용할 수 없고, 학습에 필요한 모든 데이터와 결과가 구글 드라이브에 저장되어야 한다. 따라서 사전에 드라이브 용량 확보가 필요하다.
한편, 데이콘은 입문자가 데이콘 Basic을 거쳐 월간 데이콘에 시도한 뒤 정규 대회에 참여할 수 있도록 로드맵을 제공하고 있다. 데이콘 Basic은 보상으로 데이콘 XP와 기념 후드티를 제공하며, 월간 데이콘에서는 소정의 장학금, 정규 대회에서는 주최사의 역량에 따라 상금을 지급하기도 한다.
[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]