ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 데이터 사이언티스트 미래
    일 Work 2022. 8. 30. 12:43

    데이터 사이언티스트가 사회적으로 각광받고 있다.

    현재 이 직업이 IT 회사에서는 모자를 정도이다.

    왜냐하면 데이터가 중요하다는 건 누구나 아는 사실이다.

    하지만, 데이터 사이언티스트는 없어질 직업군에 포함되어 있는 게 사실이다.

    깊게 살펴보면 대단한 직업군이 아니라는 걸 알 수 있기 때문이다.

    데이터의 정의는 글 하단 사전 설명(1)에 써놓았다.

    데이터는 크게 2종류로 볼 수 있다.

    1. 정형화 데이터
    2. 비정형화 데이터

    1. 정형화 데이터는 데이터 수집 단계에서 기획 후 수집된다.

    쉽게 말하자면, 기획자가 원하는 데이터를 단순하게 묻고 수집된다.

    예를 들자면, 설문지에서 O/X 선택지가 많고 서술하라는 의견은 최소화된다.

    정형화 데이터는 수집도 편하며 분석도 간편하다.

    서술과 자유로운 의견들은 비정형 데이터로 분류할 수 있다.

    누군가 그것을 보고 분석해야 하기 때문이다.

    2. 비정형화 데이터는 이와는 다르다.

    쉽게 말하자면 데이터는 일상에서 벌어지는 흔적들이다.

    이 일상의 데이터들이 대부분 비정형화 데이터 즉 "불규칙 흔적들"이라는 거다.

    그 흔한 일상에서 얻어지는 데이터들에서 기업 또는 단체가 원하는 인사이트를 발견해야 하기 때문이다.

    이 데이터들은 수집하는 건 어렵지 않겠으나 분석이 어렵다.

    정형화 비정형화 데이터들에서 분석을 통해 고품질 데이터를 추출해 내는 게 중요하다.

    고품질 데이터라는 건 "정확성"이 담보되거라 볼 수 있겠다.

    고품질 데이터를 만들기 위해서 기업, 기관들은 노력을 게을리하지 않으려 노력한다.

    그 고품질 데이터를 수집/기획/분석/결과의 역할 일을 "데이터 사이언티스트"가 한다는 거다.

    데이터 사이언티스트는 크게 5가지 역할이 있다.

    1. 기획
    2. 데이터 분석
    3. 데이터 시각화
    4. 데이터 프로그램 작성/활용
    5. 발표 및 소통

    현재 Ai 기술력에는 일정 한계가 보이지만, 방향성과 성장 가능성이 크다는 건 누구나 아는 사실이다.

    다만, 데이터가 많다면 누군가 그것으로부터 분석 후 인사이트를 얻어내야 한다.

    데이터 자체만으로는 이것을 활용할 수 없기 때문이다.

    누군가는 그 데이터를 분석하고 가공하여 인사이트를 얻어 활용해야 하기 때문이다.

    그래서 IT 빅 테크 기업들은 데이터 사이언티스트를 모을 수 있으면 최대한 많이 모으려고 하는 거다.

    사람 1명보다 100명이 분석하는 게 더 정확하고 다양한 인사이트를 얻을 수 있겠다는 확률 소결 때문이기도 하다.

    그리고 일의 효율화를 위해서 많은 사람이 프로젝트에 참여시킨다면 데이터 가공도 다양하게 가능해지기 때문이다.

    가공된 데이터는 판매할 수 있기 때문이다.

    그만큼 비정형 데이터에서 분석 과정은 어렵고 힘든 일이다.

    즉, 기계가 그 모든 걸 해준다는 게 아니라는 거다.

    아이러니한 건,

    어느 임계치에 도달하게 된다면 현재 기업과 단체가 필요로 하는 데이터 사이언티스트들의 숫자가 줄어들거나 없어질 거다.

    그 부분은 "시민 데이터 사이언티스트 - Citizen Data Scientist"가 채울 것이기 때문이다.

    시민 데이터 사이언티스트 - Citizen Data Scientist가 무엇인가?

    자신만의 전문지식이 있고 데이터를 기획/분석/사용/활용/발표 등 목적 달성에 기술 사용 가능한 사람을 말한다.

    즉, 자신만의 전문분야가 있다면 데이터 활용해 누구보다 더 큰 인사이트를 도출하고 얻을 수 있는 사람을 말한다.

    그렇다면 무엇이 중요하겠는가?

    자신만의 전문 영역이 있는 게 유리하다는 말이다.

    데이터가 모든 것을 정확히 말해주지 않는다.

    기획과 분석이 엉망이라면 결과도 이로울 수 없는 게 한계이다.

    그 부족한 부분을 채울 수 있는 사람이 시민 데이터 사이언티스트라는 말이다.

    자신만의 도메인 지식 - "전문 영역"이 있다면 데이터 활용은 유익하게 될 것이다.

    반면, 데이터의 중요성을 모르거나 자신의 업무에서 참고하지 않는다면 큰 인사이트를 얻기는 어려울 거다.

    이것만은 기억하였으면 한다.

    "단순히 목적과 결과를 얻기 위해 데이터를 보지 마라. 데이터가 말하고 있는 걸 보라."

    댓글

Designed by Tistory.