빅데이터를 사용하는 연구자들

2015년 7월 14일 | By: veritaholic | IT | No Comment

샤이 제넬, 콜럼비아 대학 천문학과 허블 펠로우

Q: 어떤 연구를 하고 있나요?

A: 일러스트리스(Illustris)는 은하와 별, 블랙홀이 우주적 시간 단위에서 어떻게 행동하는지를 통해 우주의 진화를 시뮬레이션 하는 프로그램을 다루고 있습니다.

Q: 어떻게 빅데이터를 쓰고 있나요?

A: 우리는 가능한한 이 우주의 많은 부분을 시뮬레이션하면서 동시에 시뮬레이션 안의 각 은하를 가능한한 자세하게 묘사하려 합니다. 계산을 위해 8,192개의 CPU가 달린 슈퍼컴퓨터를 사용합니다. 보관해야 하는 계산결과는 300테라바이트가 넘기 때문에 수백개의 하드 디스크에 이를 저장합니다.

Q: 어떤 어려움이 있나요?

A: 수천개의 CPU에 시뮬레이션 일을 나누는 것은 쉽지 않습니다. 이를 위해서는 세상에 몇 되지 않는 충분히 강력하고 안정적인 슈퍼컴퓨터가 필요하며 세심한 계산을 해야하지요.

Q: 빅데이터가 과학연구에 어떤 영향을 끼칠 것 같나요?

A: 빅데이터를 통해 우리는 더 현실적인 자연의 모델을 만들 수 있습니다. 빅데이터를 더 잘 다룰 수 있게 될수록 서로 다른 크기의 현상들을 일관성있게 연결시킬 수 있을 것이며, 이는 자연이 어떻게 작동하는지에 대한 새로운 통찰력을 우리에게 줄 것입니다.

이디 코스티, 샌프란시스코 캘리포니아 주립대(UCSF) 전산의학 연구소 포닥

Q: 어떤 연구를 하고 있나요?

A: 빅데이터를 이용해 다양한 종류의 암과 치료법에 대해 연구하고 있습니다.

Q: 어떻게 빅데이터를 쓰고 있나요?

A: 환자 및 건강한 이들의 조직세포와 암세포로부터 유전자와 단백질 표현형을 모으고 있습니다. 이를 통해 암세포와 정상세포의 차이를 연구할 수 있으며 내 가설을 검증하고, 모델을 만들며, 오늘날 암 환자들이 받는 치료법을 어떻게 바꿀 수 있을지를 찾습니다. 유전자 표현형을 찾기 위한 기술은 70년대에 등장했지만, 오늘날 우리가 사용하는 새로운 기술은 2004년에 발견되었고 2006-7년에 상용화되었죠. 이 기술에 의해 우리는 다룰 수 있는 빅데이터를 가지게 되었습니다.

Q: 어떤 어려움이 있나요?

A: 첫번째 어려움은 데이터를 어디에서 얻는가 입니다. 환자와 건강한 이들로부터 데이터를 얻어야하는데 데이터의 종류에 따라 환자들 혹은 그 가족들의 동의를 얻어야하지요. 두번째 어려움은 데이터를 얻는 과정입니다. 이때에는 많은 돈과 시간이 듭니다. 그리고 기술적인, 또 사람들간의 차이로 인해 발생하는 노이즈를 줄여야하는 문제도 있습니다.

Q: 빅데이터가 과학연구에 어떤 영향을 끼칠 것 같나요?

A: 의학분에는 빅데이터에 의해 큰 도움을 받을 것입니다. 앞으로 의사들은 진료 결과에 개인의 유전자 프로필을 더해 판단을 내리게 될 것입니다. 매일 두통약을 몇 알을 먹어야 하는지와 같은 간단한 지시에서부터 조직검사 결과에서 발견된 유전자 및 단백질 표현형에 바탕해 어떤 치료법을 택할 것인지의 결정에도 빅데이터는 쓰이게 될 것입니다.

사이먼 포플, 리즈 대학의 언론정보학과 부학과장

Q: 어떤 연구를 하고 있나요?

A: YARN 은 지역에 기반한 새로운 디지털 스토리텔링 플랫폼입니다. 이 플랫폼에서 당신은 박물관의 전시품과 같은 기관의 빅데이터를 이용할 수 있습니다.

Q: 어떻게 빅데이터를 쓰고 있나요?

A: 영국 과학관과 BBC 기록물과의 협력을 통해 우리는 그동안 지역에서 사용할 수 없었던 자료들을 사용할 수 있게 만들 계획입니다. 사람들은 자신의 이야기를 쓸 때 이런 다양한 자료들을 이용할 수 있습니다.

Q: 빅데이터가 과학연구에 어떤 영향을 끼칠 것 같나요?

A: 최근 누구나 빅데이터라는 용어를 쓰고 있습니다. 데이터의 내용이나 접근성, 명료성보다는 데이터의 규모가 충분히 크다는 이유만으로도 빅데이터라고 부르기도 하지요. 지역에서 빅데이터를 유용하게 쓸 수 있기 위해서는 사용가능한 형태로 바꾸는 것이 매우 중요합니다. 이야기는 자료를 ‘인간답게’만드는데 도움을 주지요.

토비아스 블랑크, 런던 킹즈칼리지 디지털인문학 강의교수.

Q: 어떤 연구를 하고 있나요?

A: 개인이 사용하는 스마트폰 및 디지털 기기는 어마어마한 양의 데이터를 만들어내고 있습니다. 그러나 그 데이터는 몇몇 회사와 정부에게만 공개되어 있습니다. 이때문에 우리는 스마트폰이 어떤 데이터를 모으는지를 알지 못하고 있습니다. ‘우리의 데이터, 우리자신(Our Data, Ourselves (ODO))’ 프로젝트는 이 문제를 해결하려 합니다. 이는 만들어지는 데이터와 전송되는 데이터를 밝힘으로써 새로운 연구 및 창의성, 그리고 시민참여의 시대를 만들 계획입니다.

Q: 어떻게 빅데이터를 쓰고 있나요?

A: 우리가 만든 ‘모바일마이너(MobileMiner)’ 앱은 스마트폰에서 들어오고 나가는 데이터를 추적함으로써 우리가 어떤 정보를 만들고 보내는지를 보여줍니다. 예를 들어, 우리는 스마트폰이 사용자의 위치를 기지국 위치로부터 어떻게 추적하는지를 알 수 있습니다. 또 게임 앱들이 어떤 정보를 우리몰래 마케터들에게 보내는지도 볼 수 있습니다. 우리가 만들어내는 빅데이터의 주인이 우리라는 사실을 주장해야합니다.

Q: 어떤 어려움이 있나요?

A: 사람들에게 이를 알리는 일이 우리 계획의 핵심이자 가장 어려운 점입니다. 데이터를 이해하고 사용하기 위해서는 데이터 자체에 대한 이해와 컴퓨터에 대한 지식이 필요합니다. 우리는 아이들에게 코딩을 가르치는 ‘영 리와이어드 스테이트(Young Rewired State)’와 협력하고 있습니다. 이들과 같이 우리는 자신의 데이터에 어떤 일이 일어났는지에 대한 이해를 도우며 데이터의 소유권을 주장할 수 있는 툴킷을 개발했습니다.

Q: 빅데이터가 과학연구에 어떤 영향을 끼칠 것 같나요?

A: 빅데이터는 역사와 사회를 이해하는데 커다란 도움을 줄 것입니다. 조지 W.부쉬 연구소가 제2 집권기동안 백악관에서 주고받은 2억통의 이메일을 보관하고 있고, 이것이 미국 정보자유법에 의해 막 공개되었다는 것은 잘 알려진 사실입니다. 어떤 사건이 벌어졌을 때 어떻게 이메일이 오고가며 이 결정권자들의 마음이 어떻게 바뀌는지를 연구하는 인문학 및 사회과학 연구자들에게 빅데이터는 매우 유용한 도구일 것입니다. 사기업과 정부가 현실의 센서들과 스마트폰에서 얻는 빅데이터 역시 좋은 연구자료가 될 것입니다. 물론 이들이 이를 내놓으려하지 않을 때 어떻게 이를 공개하게 만들지 하는 문제가 남아있습니다.

(가디언)

원문 보기