애드센스광고


데이터 과학의 정의 개념 역사 발전과정 정리 생활 속 데이터 과학

빅데이터 시대다. 정보화시대라고 불렸던 과거와는 다르게 하루에만도 수많은 양의 데이터가 생성되고 있고 이러한 데이터들은 우리 삶 곳곳에 영향을 미치고 있다. 심지어 기업에서는 고객 분석 및 마케팅 전략 수립 시 기존 통계자료나 설문조사 대신 대용량의 데이터를 기반으로 한 머신러닝 기법을 활용하여 더욱 정확하면서도 효과적인 결과를 도출할 수 있게 되었다. 하지만 정작 사람들은 ‘데이터’라는 단어만 들었을 뿐 정확히 무엇인지 모르는 경우가 많다. 그렇다면 먼저 사전적 의미에서의 데이터란 무엇일까? 그리고 요즘 사회에서 말하는 데이터과학이란 무엇인가? 이를 알기 위해서는 우선 데이터 사이언스의 기원에서부터 출발해야 한다.


컴퓨터 과학(Computer Science)이라는 용어는 1950년대 후반 미국 매사추세츠 공과대학(MIT) 교수이자 인공지능 연구자인 존 매카시(John McCarthy)가 처음 사용하였다. 초기에는 주로 수학 이론 중심이었으나 1960년대 중반부터는 기계학습이론·인공지능·퍼지이론·패턴인식론·자연언어처리 등 다양한 응용분야가 등장하였고 1980년대 들어서는 데이터베이스 관리시스템 개발과 함께 급속도로 발전하였다. 1990년대 초 인터넷 혁명과 함께 폭발적으로 성장하였으며 현재는 IT 산업뿐 아니라 금융·의료·교육·교통·공공서비스 등 거의 모든 영역에서 핵심기술로 자리 잡았다. 오늘날 현대사회에서 없어서는 안 될 필수 기술로 자리매김한 셈이다. 그럼 이제 본격적으로 데이터사이언스에 대해 알아보자.
우선 데이터 사이언티스트는 방대한 양의 데이터를 수집하고 가공하여 유의미한 정보를 추출하는데 필요한 지식과 역량을 갖춘 전문가를 말한다. 쉽게 말해 대량의 데이터로부터 패턴을 발견하고 인사이트를 찾아내는 일을 하는 사람이다. 이때 다루는 데이터는 정형 또는 비정형 형태 모두 포함된다. 따라서 전통적인 통계학자나 데이터분석가 외에도 비즈니스 인텔리전스 컨설턴트, 소프트웨어 엔지니어, 프로그래머, 시각 디자이너, 인문학자, 마케터 등 다양한 분야의 인재들이 모여 협업하는 구조로 이루어져 있다. 이렇게 만들어진 알고리즘은 의사결정 과정에 반영되어 경영전략수립, 신제품개발, 생산관리, 품질개선, 리스크 예측, 공공정책 결정 등 광범위한 분야에 적용될 수 있다.

덧글

댓글 입력 영역