세상 모든것을 데이터화 하는 빅데이터 시대

2014. 5. 2. 03:46미분류

이터화의 의미는 '수량화해서 기록하는 것'입니다. '디지털화'하고는 구분을 해야 하는데요. 디지털화는 아날로그 정보를 컴퓨터가 처리할 수 있게 바꿔주는 것이죠. 디지털화 자체로 데이터화가 되지는 않지만, 디지털화 덕분에 데이터화가 용이하게 된 것은 맞습니다.





▲네네~~~ 그렇습니다.



'데이터화 한다.'는 것은 수량화해서 기록하는 것이라고 했습니다. 어떤것을 수량화해서 기록할까요? 꼭 필요한 정보만 데이터화를 해야할까요? 그렇게 생각할 수도 있지만 쓸모없는 자료를 데이터화 할 때 빅데이터의 진짜 가치가 발휘될 수 있습니다.



쿄에 있는 일본 산업기술대학원대학의 시게오미 코시미즈 교수님의 사례가 있습니다. 이 분은 사람들의 엉덩이를 전문적으로 연구한다고 하는데요. (푸핫) 웃기긴 한데 연구효과가 대단합니다.



▲엉덩이 전문 시게오미 코시미즈 교수님


이 교수님은 사람이 자리에 앉아 있을때 신체의 윤곽, 자세, 무게 분산 등을 모두 수치화했습니다. 자동차 시트에 360개의 센서를 달고 각 지점의 압력을 0~256의 수치로 측정했습니다.(일명 엉덩이 데이터) 이 시스템은 98%의 정확도로 사람들을 구분했다고 하는데요. 사람이 기본적으로 앉는 자세에 습관이 있다보니 이러한 습관을 가지고 사람을 구분하였습니다.


이 기술은 현재 자동차 도난방지 시스템으로 개발되는 중입니다. 원래 주인이 아닌 사람이 운전자석에 앉으면 비밀번호를 요구하는데 비밀번호가 틀리면 엔진을 꺼버리는 것이죠.


중요하게 보지 않았던 '앉는 자세'를 가지고 데이터화를 해서 이러한 서비스를 만들어내다니... 정말 기발하다고 생각합니다. 자동차 도난방지 시스템 말고도 또 다른 것으로도 많이 활용될 것 같습니다.



이터화가 이루어질 수 있는 분야는 굉장히 많습니다. 구글의 도서관 프로젝트는 세상의 모든 책을 스캔한 후 스캔한 이미지 안에 있는 내용을 텍스트로 전환했습니다. 그 텍스트를 우리는 검색을 할 수 있게 되었는데 구글의 엔그램 뷰어 Ngram Viewer(http://books.google.com/ngrams)에서 직접 확인할 수 있습니다.


이곳에 쌓여있는 무수히 많은 단어들을 가지고 여러가지 분석이 가능한데요. 엔그림뷰어에서 검색을 해 보면 1900년대까지는 '인과성causality'이라는 단어가 '상관성correlation'이라는 단어보다 더 빈번하게 사용되었는데 이후에는 비율이 역전되었다는 것을 볼 수 있습니다. 빅데이터 시대에는 인과성보다 상관성이 조금 더 중요해지고 있나 봅니다.


그 밖에 포스퀘어는 위치를 데이터화하고, 페이스북은 사람들의 소통을 데이터화 하고 있습니다. 또 최근에는 스마트폰으로 인해 우리의 일상을 우리 스스로 데이터화 하기도 합니다. 세상의 거의 모든것이 데이터화가 되어가고 있는 느낌입니다.



크놀로지의 힘을 이용해서 모든것이 데이터화되고 또 그것을 우리가 가진 지식인 통계학, 알고리즘을 이용해서 분석할 때 별 것 아닌 것에서도 새로운 용도를 발견할 수 있을 것입니다. 당분간은 비지니스 영역에서 주로 빅데이터를 가지고 어떤 가치를 창출하려고 할텐데요. 이 부분은 다음 시간에 또 정리하겠습니다.






빅 데이터가 만드는 세상

저자
빅토르 마이어 쇤버거, 케네스 쿠키어 지음
출판사
21세기북스 | 2013-05-16 출간
카테고리
경제/경영
책소개
데이터가 폭발하는 거대한 변화의 소용돌이 속에서 우리는 어떻게 ...
가격비교 글쓴이 평점