글쓰는 데이터사이언티스트를 꿈꾸며..


내가 꿈꾸는 미래의 나는… ‘인문학적 소양을 겸비한 데이터분석가’이다.

인문학과 빅데이터? 언뜻 이해가 안 갈 수도 있지만, 빅데이터 분석은 다른 IT 분야보다도 인문학적 사고 방식을 더욱 요구한다. 수많은 통계 데이터를 분석하고 패턴을 찾아 낸 뒤 우리가 해야 할 일은 ‘사실의 나열’이 아니라 ‘사실을 근거로 한 스토리텔링/종합분석’이 중요 포인트로 작용되기 때문이다.

이런 면에서 나의 천성과도 잘 맞아떨어지고, 더욱 잘 하고 싶은 분야이지만.. 현실은 뿌리깊은 노가다와 빠르게 치고 나가는 기술로 허덕임에 지칠때가 많다. 힘든 나를 다독이고 성장 과정을 기록하기 위해 그 동안의 다른 블로그를 처분하고 github를 개설했지만… 혼자 진행하다보면 자기 하고 싶은 것만 하게 된다는 사실을 다시 확인할 수 있었다.

전체 글 중 데이터 분석 관련 글 13건, 음악 관련 글 9건, 단상/책 관련 글 47건으로 github가 개발자 관련 글보다는 일반 단상/책을 위한 블로그로 변질되어 가고 있었다. 물론 단상/책 글을 쓰는 것도 내가 너무 좋아하고 소중하게 여기는 것이지만, 이렇게 쓸 거면 굳이 github에 기록할 필요가 없었다. (물론 네이버 블로그 등과 같이 찾는 이가 많지 않아 나만의 아지트에 몰래 기록하는 맛은 있었다.)

데이터 분석 글도 써서 업로드 해야지, 하지만 시간은 한정 되어 있고, 쓸거리는 많고.. 쉽지 않았다. 그러다가 ‘글또’라는 모임을 알게 되어 2기를 신청하여 함께 하게 되었다. ‘글또’는 ‘글쓰는 또라이’의 줄임말로 개발자들의 글쓰는 모임이다. 글쓰기 주제가 개발/데이터분석 관련 글로 집중된다. 그동안 여러 글쓰기 모임을 해오면서 개발자들을 만나기 쉽지 않아, 글쓰기도 좋아하면서 데이터분석에도 관심있는 사람에 대한 목마름이 있었다. 그런 면에서 ‘글또’는 나에게 단비와도 같은 모임이 될 것 같아 많은 기대가 된다.

글또 모임 : 리더 변성윤님 자료 참고

업무 상에서는 성과로 이어지는 분석 위주로 접근을 하다보니 개인공부나 성장을 위한 시간을 내기는 어려웠는데, 글또 모임을 하면서 내실을 다지기 위한 ‘적금’을 들어놓는다고 생각하고 그동안 미뤄두었던 하고 싶은 공부를 더 해야겠다.

내가 글로 작성하고 싶은 분야는 Text Mining 분야이다.
총 6개월 과정 중 최소 3개월은 아래 사항에 할애하려고 한다.

  • Tutorial 완성
    아직 미완성인 채로 두고 있는 Text Mining Tutorial 완성하기
    Text Mining Tutorial
  • Quora Kaggle 분석 내용
    최근 시작된 Kaggle의 Quora 공부 내용 정리
    Quora Insincere Questions Classification (deadline : 05/02, 2019)
  • Kaggle Toxic Classification 분석 내용
    EDA 편 이후 모델링 관련 내용 정리

써놓고 보니, 할게 많다. 틈틈이 시간을 잘 쪼개어서 적용해보고 기록하고 성장하자. ‘글또’ 모임 동지들이 생겼으니 더욱 힘을 낼 수 있을 것이라고 생각된다. 나는 ‘함께 하는 힘’을 믿는 사람이니까. ^-^

댓글남기기