본문 바로가기

빅데이터8

영화 <마이너리티 리포트>로 빗대어 보는 빅데이터의 위협 영화 를 보셨나요? 2002년도 작품인데 2014년인 지금 봐도 그 상상력에 놀라게 됩니다. 마치 십년이 지나도 그 품격을 잃지 않는 "살색 내복" 같은 작품입니다.영화의 내용은 이렇습니다. 미래의 범죄현장을 볼 수 있는 3명의 예지자가 있고, 경찰은 이들의 능력을 이용해 '예비 범죄자'들을 구속시킵니다. '예비 범죄자'라고 표현한 것은 이 사람들이 실제로 나쁜일을 저지른 것은 아니기 때문입니다. 단지 예지자들의 예측에 의해 '넌 앞으로 범죄자가 될 사람이니까 미리 체포한다.' 라는 식으로 잡혀 들어가는 겁니다.그런데 놀라운 일이 벌어집니다. 이 시스템을 100% 신뢰하며 수사 반장으로 활약하는 '존 앤더튼(톰 크루즈)'이 예지자들에 의해 예비 범죄자로 지목된 것이죠. 그러자 존 앤더튼은 믿을 수 없다며.. 2014. 5. 11.
빅데이터 시대를 대처하는 직장인의 자세 이라는 영화가 있습니다. 메이저리그의 팀 중 '오클랜드'라는 팀에서 있었던 실제 사건을 영화화 했는데요. 줄거리는 대략 이렇습니다. 재정난에 허덕이는 오클랜드가 팀의 주축 선수들을 팔아야 되는 상황이 되었고, 이 공백을 메울 수 있는 선수들을 저렴한 가격으로 대체해야 했습니다. 스카우터들은 자신들의 오랜 경험을 바탕으로 새로운 선수들을 물색합니다. 그런데 이와는 반대로 '빌리 빈'이라는 단장은 '세이버 매트릭스'라는 통계 기법을 기반으로 선수 트레이드를 단행합니다. 이것을 통해 적은 연봉의 선수단을 데리고도 2000~2003년까지 4번 연속 포스트시즌에 진출하는 성과를 거뒀습니다.영화는 데이터가 경험에 우선할 수 있다는 한 예를 보여줍니다. 물론 아직도 대부분의 분야에서는 경험과 직관이 통하지만 분명 데.. 2014. 5. 6.
빅데이터 시대, 어떤 비지니스가 뜰까? 빅데이터 시대의 비지니스 모델에는 어떤것이 있을까요? 회사의 성격에 따라서 크게 세 가지로 분류할 수 있습니다. 1.데이터데이터 그 자체로 비지니스를 하는 경우입니다. 데이터로 비지니스를 하려면 회사 스스로 많은 데이터를 수집하고 있거나 접근할 수 있어야 합니다. 앞선 포스팅에서 빅데이터는 1차적인 가치 이외에 부가적인 가치들이 있다고 했습니다. 데이터를 쥐고 있는 회사에서는 데이터의 부가적인 가치가 1차 가치와 부합되지 않는다고 판단될 경우 데이터를 다른 회사에 공급해 줄 수도 있습니다. 데이터를 공급받은 회사는 해당 데이터를 가지고 새로운 가치를 창출해서 사업을 하게 될 것입니다. 2.기술'우리한테 빅데이터는 없지만 그걸 분석할 수는 있다!' 이렇게 기술력을 가진 회사로는 마이크로소프트가 있습니다. .. 2014. 5. 5.
세상 모든것을 데이터화 하는 빅데이터 시대 데이터화의 의미는 '수량화해서 기록하는 것'입니다. '디지털화'하고는 구분을 해야 하는데요. 디지털화는 아날로그 정보를 컴퓨터가 처리할 수 있게 바꿔주는 것이죠. 디지털화 자체로 데이터화가 되지는 않지만, 디지털화 덕분에 데이터화가 용이하게 된 것은 맞습니다. ▲네네~~~ 그렇습니다. '데이터화 한다.'는 것은 수량화해서 기록하는 것이라고 했습니다. 어떤것을 수량화해서 기록할까요? 꼭 필요한 정보만 데이터화를 해야할까요? 그렇게 생각할 수도 있지만 쓸모없는 자료를 데이터화 할 때 빅데이터의 진짜 가치가 발휘될 수 있습니다. 도쿄에 있는 일본 산업기술대학원대학의 시게오미 코시미즈 교수님의 사례가 있습니다. 이 분은 사람들의 엉덩이를 전문적으로 연구한다고 하는데요. (푸핫) 웃기긴 한데 연구효과가 대단합니다.. 2014. 5. 2.
원인보다 결과가 중요한 빅데이터 세상 인과성과 상관성이라는 말이 있습니다. 인과성은 'B라는 결과가 나온 원인은 바로 A이다.' 그렇기 때문에 B의 원인인 A가 무엇인지가 중요하다는 것이구요. 상관성은 'A와 B가 관계가 있다. A가 나오면 B가 나올 확률이 높다.' 라는 식의 원인은 모르지만 상관이 있다는 그 사실에 주목하는 것입니다. ▲뭐라 케싼노?아무튼 인과성과 상관성은 저렇고 저렇답니다. 여기서 질문. 우리가 사고하는 습관은 인과성과 상관성 중에 어느쪽에 가까울까요? '..........' 정답은 우리의 사고하는 습관은 인과성에 더 치우쳐져 있습니다. 인간은 일상생활에서 모든 결과에 원인이 있다고 믿고 싶어합니다. 진짜 그런지 확인해보기 위해서 다음 문장을 한번 보겠습니다. 프레드의 부모님이 늦게 도착했다.출장 뷔페는 곧 도착할 예정.. 2014. 4. 30.
불확실한 데이터를 바라보는 관점 세상은 현재 스몰데이터와 빅데이터 시대의 경계 즈음에 있는 것 같습니다. 두 세계에서는 각각 데이터를 어떻게 이해하면 좋을지 예시를 통해 알아보겠습니다. 도서관의 카테고리 플리커의 태그 도서관에서는 책의 종류를 정해진 틀에 맞춰서 분류합니다. 불편하지만 스몰 세계에서는 별 문제없이 사용할 수 있을 것 같습니다. 하지만 60억 개의 사진을 가지고 있는 플리커에서 미리 정해진 틀에 맞추어서 분류할 수 있을까요? ('히틀러 닮은 고양이'라는 사진은 인물 카테고리인지 동물 카테고리인지 애매모호 합니다.) 그래서 플리커에서는 태그를 사용합니다. 태그는 사람들이 즉흥적으로 입력해서 붙입니다. 표준화된 카테고리나 분류 체계가 없습니다. 태그 덕분에 웹상에 있는 엄청나게 많은 콘텐츠를 쉽게 검색할 수 있습니다. 특히 .. 2014. 4. 29.