▣ 구글의 「페이지랭크」 알고리듬 활용


구글(Google)의 인터넷 검색 엔진을 활용해 몸 속의 암을 찾아내고 치료 확률을 예측하는 새로운 방식이 발견됐다. 구글이 사용하는 ‘페이지랭크(PageRank)’ 알고리듬은 수많은 웹페이지의 내용을 비교하고 하이퍼링크를 분석해 검색어와의 연관성 정도에 따라 순서를 매겨 보여준다.


독일 드레스덴 공대 연구진은 이와 유사한 방식으로 알고리듬을 작성해 유전자 네트워크를 분석했다.

췌장암 환자들을 대상으로 실험한 결과 기존 방식보다 예측 정확도가 높아졌으며 치료 가능성을 가늠하는 데 도움이 되는 7개의 바이오마커(Biomarker) 유전자도 찾아냈다.


연구 결과는 미국 공공과학도서관 프로젝트가 발행하는 온라인 학술지 ‘플러스 컴퓨터 생명공학(PLoS Computational Biology)’ 최근호에 게재되었다.


논문 제목은 ‘구글로 암 찾아낸다 : 네트워크 기반 마커 유전자 순위 부여에 의한 암 환자의 치료 가능성 예측도 개선(Google Goes Cancer: Improving Outcome Prediction for Cancer Patients by Network-Based Ranking of Marker Genes)’이다.

검색엔진처럼 단백질 분석하는 ‘넷랭크’ 알고리듬


단백질에서 유래된 특이한 분자 패턴을 ‘바이오마커(Biomarker)’라 한다. 바이오마커는 암 같은 질병의 발병과 치료 가능성을 예측하는 데 중요한 지표로 작용한다.


인터넷에 접속해 구글 검색창에 ‘Biomarker’라고 입력하고 엔터키를 치면 0.4초 만에 560만 개의 결과를 보여준다. 게다가 웹문서, 뉴스, 블로그, 이미지, 동영상 등 콘텐츠의 종류를 구분해서 화면에 띄운다.


구글의 놀라운 검색 속도는 ‘페이지랭크(PageRank)’라는 고성능 알고리듬 덕분이다. 수천만 개의 웹페이지를 분석하고 연결된 하이퍼링크를 검사해 내용의 연관성이 높은 가장 높은 결과부터 순서대로 보여준다.


구글 창립자인 래리 페이지(Larry Page)와 세르게이 브린(Sergey Brin)이 미국 스탠퍼드대학교 재학 시절에 개발한 페이지랭크의 원리는 간단하다. 많은 사람들이 링크를 연결할수록 중요한 내용이라고 판단하는 것이다. 링크를 따라 인터넷 사용자가 검색을 계속한다고 가정하고 연결된 페이지 숫자와 확률을 계산해 검색 결과의 순위를 매긴다.


최근 이 알고리듬을 세포 내 유전자 분석에 활용해 암 발견과 치료의 확률을 높이는 방식이 개발됐다. 독일 드레스덴공대의 생명정보학과는 의대와의 융합 연구를 통해 ‘넷랭크(NetRank)’라는 이름의 알고리듬을 만들어냈다.


페이지랭크가 인터넷이라는 네트워크의 연결성과 연관성을 검색하는 것처럼 넷랭크는 세포 내 단백질과 유전자의 생물학적 네트워크를 검사한다. 어떠한 유전자가 암 세포의 공격성을 커지게 만드는지 또한 특정한 화학치료가 성공할 확률이 얼마나 되는지를 알아낼 수 있다.


연구진은 “같은 암에 걸렸는데 왜 어떤 이들은 일찍 사망하고 다른 이들은 더 오래 사는가?” 하는 질문으로 논문을 시작했다. 이어 “주변환경이나 개인 생활습관 이외에 개인의 유전적 차이 때문”이라고 주장하며 단백질 패턴을 분석하는 알고리듬 개발의 이유를 밝혔다.

기존 바이오마커와의 연관성도 밝혀낼 수 있어


연구진은 2만 개에 달하는 단백질에 ‘넷랭크’ 알고리듬을 적용해 유전자 네트워크 상에서 어떠한 연결성을 가지는지를 조사했다. 이어 30명의 췌장암 환자들에게 얻어낸 유전자 프로파일에 적용해서 7개의 바이오마커를 찾아냈다. 바이오마커는 암 발전 가능성을 찾아낼 수 있는 지표로 쓰인다.


유전자 발현 정도와 환자의 실제 생존기간을 비교하자 넷랭크 알고리듬의 정확도가 7퍼센트 수준으로 나타났다. 피어슨(Pearson) 기법 등 기존의 방식과 비교하면 월등히 높은 수치다. 평가에는 몬테카를로 교차검증법(Monte-Carlo cross-validation)이 사용됐다.

또한 412명의 췌장암 환자에게 얻어낸 샘플에 면역화학염색법(immunohistochemistry)을 실시해서 7개의 바이오마커가 예측한 결과와 비교했다. 그러자 종양의 크기나 등급, 임파절의 상태 등 기존의 임상에서 쓰이는 예후 판단법보다 효과가 높은 것으로 나타났다.

유전자 분석을 통해 암 관련 바이오마커를 찾아내는 연구는 많지만 결과가 겹치지 않고 제각각이라는 점이 문제다. 동일한 암이라도 분석법이 다르면 바이오마커도 다르기 때문이다.


연구진은 컴퓨터 알고리듬을 활용해 유전자를 분석하면 여러 연구에서 발견된 바이오마커를 비교해 정확도를 높이고 차후 맞춤형 치료법을 개발할 수 있을 것으로 기대했다.


논문의 주저자인 크리스토프 윈터(Christof Winter) 드레스덴공대 생명공학센터 연구원은 공공과학도서관 프로젝트의 발표자료를 통해 “넷랭크 알고리듬에 새로 발견된 유전자 네트워크 정보를 덧붙이면 그만큼 정확도가 높아지고 타 연구와의 연결점을 찾기도 쉬워진다”고 설명했다. 실제로 이번 논문은 노스캐롤라이나대의 이전 연구와 유사한 부분을 발견해 의미를 분석했다.


물론 넷랭크 알고리듬을 임상에 적용하려면 장기간의 대규모 후속연구가 필요하다. 연구진은 드레스덴공대 기반의 벤처회사 레스프로텍트(RESprotect)와의 협업을 통해 췌장암 치료제를 임상실험 중에 있다.

관련 URL : http://www.ploscompbiol.org/article/info%3Adoi%2F10.1371%2Fjournal.pcbi.1002511

<출처> ScienceTimes, 2012.05.31

Posted by TopARA
,