Oct, 1, 2023

Vol.30 No.2, pp. 84-88


Review

  • Korean Journal of Biological Psychiatry
  • Volume 8(2); 2001
  • Article

Review

Korean Journal of Biological Psychiatry 2001;8(2):196-202. Published online: Feb, 1, 2001

Human Genome Project

  • Oh-Joo Kwon, MD
    Department of Biochemistry, College of Medicine, The Catholic University of Korea, Seoul, Korea
Abstract

The completion of the rough draft of the human genome is a remarkable achievement. It provides the overall structures of huge DNA molecules that constitute the genome and an outline of the information needed to create a human being. This paper reviewed new ideas, projects, and scientific advances made by the Human Genome Project. We also discussed the future of medicine and biomedical research in postgenomic era.

Keywords Gene;Genome;Genomics;Proteome;Proteomics;Microarray;SNP.

Full Text

교신저자:권오주, 137-701 서울 서초구 반포동 505
              전화) (02) 590-1179, 전송) (02) 596-4435, E-mail) Ojkwon@cmc.cur.ac.kr

   지금부터 136년 전인 1865년 Mendel이 유전의 법칙을 처음 발견한 이래, 유전물질로서 DNA의 확인(Avery 1944), DNA 구조의 발견(Watson과 Crick 1953), 그 후 DNA 재조합 기술(recombinant DNA technologies)의 발전을 통한 유전정보 전달기전의 규명 등은 유전 현상을 이해하고자 하는 과학자들의 열망을 보여주고 있으며, 이러한 노력은 21세기의 시작과 함께 2001년 2월 발표된 사람 유전체 염기서열의 규명으로 새로운 장을 열어가고 있다. 세계 6개국의 20개 연구소로 구성된 국제 인간유전체 염기서열분석 컨소시엄(International Human Genome Sequence Consortium, 이하 “국제컨소시엄”으로 약함)과 Celera Genomics라는 미국의 회사는 약 30억 염기에 해당하는 인간유전체의 염기 서열을 분석하여 그 초안을 각각 Nature와 Science에 동시에 발표하였다. 

인간유전체 사업의 배경

   인간유전체 사업(Human Genome Project;http://www.nhgri.nih.gov/HGP)은 30억 염기에 달하는 사람 유전체의 염기서열(“Book of Life”라고 불리기도 한다)을 모두 결정하기 위한 연구사업이다. 당초에는 매년 2억불씩 15년간 총 30억불의 예산으로 1990년 미국의 National Institutes of Health(NIH)와 U.S. Department of Energy가 공동 주관하여 미국의 여러 연구소에서 시작되었으나, 1993년 영국의 비영리 재단인 Wellcome Trust의 지원을 받은 Sanger Center의 합류를 시작으로 프랑스와 일본이 그리고 그 뒤를 이어서 독일과 중국이 참여함으로서 인간유전체 사업단(Human Genome Organization, HUGO)이란 컨소시엄이 설립되기에 이르렀고, 그 후 DNA의 구조를 발견하여 Nobel상을 받은바 있는 James Watson이 초대단장으로 참여하는 등 세계적인 연구자들이 속속 가세함으로서 과학분야에서는 전례가 없는 국제적인 대규모 연구 사업으로 변모되었다. 인간유전체 사업은 출범 당시부터 단순히 사람 유전체의 DNA 염기서열만을 결정하는 것이 아닌 인류의 건강 증진 추구를 위한 연구라는 포괄적인 목적을 갖고 있었다. 즉, DNA의 유전자 지도작성과 염기서열 분석을 통한 사람 및 다른 동물 유전체의 특성 규명, 유전체 분석을 위한 연구방법 개발, 인간 유전체 연구가 가져올 윤리적 법적 및 사회적 영향 연구(ethical, legal and social implications, ELSI;http://www.nhgri.nih.gov/ELSI), 그리고 유전체 사업을 통해 얻어질 새로운 연구방법과 연구결과를 적절히 이용하기 위한 과학자의 양성 등과 같은 광범위한 사업내용을 포함하고 있었다. 1977년 Sanger가 DNA 염기서열 분석방법을 개발한 후, 인간유전체 사업이 시작될 당시의 염기서열 분석은 완전히 수작업으로 진행되어 기껏해야 하루에 500개 염기 정도만 읽을 수 있었던 상황이었다. 이에 비추어 본다면, 30억의 염기를 15년 내에 분석하겠다는 당초의 계획은 지나치게 낙관적이었다고 볼 수 있다. 그러나 인간유전체 사업이 본격적으로 시작된 이후 이 사업에 대한 관심 증가와 이를 바탕으로 한 막대한 재원의 투자로, 형광물질을 이용한 서열 분석의 자동화, expressed sequence tag(EST)을 이용한 유전자 확인 방법, 대량의 염기 서열 분석을 가능하게 한 computer algorithm 개발, BAC vector 개발 등, Nobel상 수상자인 미국의 David Baltimore(California Institute of Technology)가 “진화(evolution)”라고 표현했을 만큼, 당시로서는 상상할 수 없었던 일련의 기술들이 속속 개발, 발전됨으로서 인간의 달 착륙과 핵분열 발견에 비겨지는 인간유전체의 완전 해독이 가능하게 되었다. 
   이와 같이 국익을 떠난 인류의 복지를 위한 연구라는 기치로 국제적인 자본과 인력을 집결하여 시작된 인간유전체 사업이었지만 내부의 갈등이 없었던 것은 아니었다. 그 대표적인 예가 Craig Venter 박사이다. 그는 한때 국제컨소시엄의 핵심멤버였으나 Watson과의 의견차이로 NIH를 떠나 The Institute for Genomic Research라는 venture를 만들어 독립하였으며, 그 후 1998년 5월에는 자동화 염기서열 분석장치를 처음 개발하여 세계 시장을 거의 독점하던 Perkin Elmer사와 함께 Celera Genomics라는 회사를 출범시키면서 3억불의 예산만으로 3년 내에 인간유전체 염기서열 분석을 완성하겠다고 발표하였다. 이에 자극을 받은 국제컨소시엄도 완벽한 유전자 서열 분석을 위해 질병관련 유전자의 지도작성(mapping)을 우선적으로 추진해오던 방침을 변경하여 1998년 9월 유전체서열 분석을 본격적으로 시작하게 되었다. 염기서열 분석 기술의 급속한 발전과 뜻하지 않았던 국제컨소시엄과 Celera Genomics와의 경쟁은 결국 인간유전체 염기서열 분석 속도를 배가시키는 결과를 가져와, 아직 완벽하지는 않지만, 당초 2005년 목표로 시작되었던 인간유전체 염기서열과 지도작성이 4년 정도 앞당겨진 2001년 봄에 발표되었다(International Human Genome Sequencing Consortium 2001;Venter 등 2001). 이들에 의해 발표된 인간유전체 연구결과 초안의 개요는(표 1)과 같다.

인간유전체의 분석 결과

   인간유전체 염기를 분석한 결과 이제까지 알지 못했거나 또는 알려져 왔던 것과 전혀 다른 새로운 사실들이 확인되었다(Green과 Chakravarti 2001). 그 중 중요한 몇 가지를 간추려보면 다음과 같다.
   첫째, 염색체 상에서의 유전자 분포가 균일하지 않다. 즉 유전자가 많이 몰려있는 곳이 있는가 하면 소수의 유전자들이 분산되어 퍼져있는 부위가 있고, 또 어떤 부위에서는 유전자는 없이 단백질 합성과 무관한 junk DNA라고 불리는 것들만이 몰려있는 곳이 있다. 이러한 불규칙한 분포양상은 유전자들이 비교적 균일하게 위치해있는 초파리나 선충의 유전체 구조와는 다른 것이다. 한편, 유전자가 밀집된 부위는 주로 G와 C염기로 구성되어 있으며(GC-rich regions) 반면에 junk DNA가 있는 곳의 DNA에는 A와 T가 훨씬 더 많은(AT-rich) 것으로 나타났다. 이외에도, 유전자의 기능을 조절한다고 알려진 C와 G의 두 염기서열만으로 구성된 CG 염기쌍의 반복서열(CpG island)은 유전자 밀집부위 근처에서 더 많이 발견되었다. 한편 염색체간에도 유전자의 밀도에 차이가 있었다. 그 예로서, 19번 염색체의 경우 총 1,400개의 유전자가 위치하여 100만 염기 당 23개의 유전자가 몰려있으나, 13번 염색체의 경우에는 100만 염기 당 5개의 유전자만이 분포하는 것으로 나타났다. 
   둘째, 인간유전체의 유전자의 수는 기존의 예상치를 훨씬 밑도는 30,000~35,000 정도로 확인되었다. 아직까지 유전체 분석이 완성된 것이 아니어서 그리고 계산에 사용된 컴퓨터 프로그램이 개선됨에 따라 이러한 추정치가 어느 정도 변경될 가능성은 있으나, Celera Genomics는 확실한 유전자의 수를 26,383개 그리고 유전자로 추정되는 수를 12,000개로 발표하였고, 국제컨소시엄의 경우에는 24,500 유전자와 5,000개의 추정유전자(candidate)를 발표하였다. 인간의 유전자 수가 초파리나 선충(nematode)이 갖고 있는 유전자 수의 두 배에도 못 미친다는 이러한 결과는, 다른 종이나 동물에 비교한 인간의 우월성이 유전자의 수적인 차이에 의할 것이라는 기존의 생각을 완전히 부정하는 것이다. 이를 설명하기 위한 연구 결과들은, 사람의 경우 하등동물에 비해 단백질의 구조적인 다양성이 월등히 높다는 것을 아울러 밝혀냈다. 즉, 초파리나 선충과는 달리 사람의 경우에는 하나의 유전자로 한 가지가 아니라 여러 가지 단백질을 만들 수 있다는 것으로, 평균적 볼 때 하나의 유전자로부터 세 개의 서로 다른 단백질이 만들어짐으로서 사람의 유전자는 다른 종에 비해 더 많은 역할을 할 것임을 보여주고 있다. 이러한 까닭은, 사람 유전자의 경우 단백질을 만드는데 필요한 부분인 exon이 intron이라는 부위 사이에 끼어있으며 또한 이들이 광범위한 부위에 걸쳐 퍼져있어서 alternative splicing이 가능하다는 것이 가장 중요한 원인으로 설명되어지고 있다. 이 외에도 유전자의 증폭(gene duplication) 이나 수 백년 동안 진행되어온 단백질 기능부위의 진화(domain evolution) 등이 원인으로 제시되기도 한다. 따라서, 향후 생물정보학(bioinformatics) 분야의 발달로 유전자의 spliced variants 까지 계산할 수 있는 컴퓨터 프로그램이 개발된다면 사람에서의 유전자 수는 현재 추측한 숫자보다 더 늘어날 것으로 예상할 수 있다.
   셋째, 사람유전체에 의해 만들어지는 단백질의 총체(이하 단백체, proteome)는 무척추 동물에 비해 매우 복잡한데, 이는 특정 단백질 영역에 해당하는 유전자를 재배치(rearrangement)하여 새로운 구조를 만들어 내기 때문으로 해석된다. 한편, 척추동물에만 나타나는 단백질 기능부위(domain 또는 motif)는 단백체의 약 7%를 차지하였다.
   넷째, 사람의 유전체 중 1.1%(Celera Genomics) 또는 1.5% (국제컨소시엄)에 해당하는 부위만이 단백질을 합성하는 유전자였다. 유전체의 대부분을 차지하는 나머지 부분의 약 50% 는 junk DNA라고 불리는 반복서열로 나타났으며, 이러한 반복서열이 차지하는 비중은 초파리(3%)나 선충(7%) 등과 비교해 볼 때 엄청나게 큰 것이다. 하지만, 이제까지 알려져 왔던 것과는 달리 junk라는 용어가 의미하는 것처럼 이들 junk DNA가 전혀 무용하지 않다는 것으로 밝혀졌다. 즉, junk DNA에는 인류로 진화되어 오는 동안의 기록들이 마치 화석처럼 차곡차곡 저장되어 있어서 이를 통해 인류의 진화경로를 알 수 있다고 한다. 실제로 국제컨소시엄은 약 300만개에 해당하는 반복서열을 분석하여 인류의 경우 junk DNA가 약 800만년 전부터 축적되어 왔음을 알아내었으며, 또한 각 반복서열이 인류의 유전자에 들어온 시기를 계산하였다. 이러한 결과를 통하여 인간유전체의 경우 5,000만년 전부터 반복서열의 축적이 중단된 상황이어서 mouse나 rat과는 달리 반복서열이 급속하게 감소되고 있다는 것을 알아냈다. 또한, 사람 유전자의 대표적 반복서열 중 하나이며 전체 유전체의 10%를 차지하고 있는 Alu 서열의 경우, 다른 junk DNA와는 달리 유전자들이 많이 위치한 부위에서 존재하고 있는데 이번 연구를 통하여 그 이유가 진화론적으로 설명됨으로서 이들의 새로운 기능이 주목되고 있다. 
   다섯째, X와 Y 염색체에서의 반복서열을 조사한 결과 남성에서의 변이(mutation) 발생률이 여성에 비해 두 배 가량 높음이 밝혀졌다. 이러한 원인으로는 정자의 형성을 위한 세포 분열의 필요성과 정자와 난자에서의 변이 복구기전 차이가 제시되고 있다. 한편 염색체에서의 재조합(recombination) 확률은 염색체의 끝 부분으로 갈수록 큰 것으로 나타났다.
   여섯째, 사람의 유전자 중 223개는 세균 유전자와 유사한 것으로 확인되었다. 이들 유전자가 무척추동물에서 발견되지 않는 것으로 보아 이들은 진화적으로 최근에 획득되어진 것으로 보이며, 아마도 세균의 감염으로 인해 인류 조상의 염색체로 직접 전달(horizontal transfer)되었을 것으로 추측하고 있다. 
   일곱째, 사람의 유전체는 99.9%가 유사하며 0.1%에 해당하는 서열만이 개체간에 차이가 있다고 한다. 최근의 보고에 따르면, 일반적으로는 염기서열 10,000개 중 8개 정도의 비율로 개체간에 염기가 다르다고 알려져 있으며, 이것이 질병의 유전성이나 특정 질환에 대한 감수성과 같은 개체간의 차이를 설명할 것으로 생각된다. 이처럼 유전체를 구성하는 염기서열 중 어느 하나의 염기가 다르게 나타날 경우를 single nucleotide polymorphism(SNP)이라고 하며, 인간유전체의 크기가 32억 염기쌍임을 감안한다면 이론적으로는 약 250만개 정도의 SNP가 존재할 수 있다. 국제컨소시엄은 SNP 컨소시엄과 공동으로 140만개에 달하는 SNP의 지도를 작성하여 2001년 2월에 인간유전체 서열과 함께 발표하였으며, 최근까지의 자료에 의하면 230만개 이상의 SNP가 확인되고 있다(http://www.ncbi.nlm.nih.gov/SNP). 한편 유전자의 분포와 마찬가지로 SNP의 경우에도 염색체의 부위에 따라 밀집도가 다른 것으로 확인되어, 특정 염색체 부위에서만 SNP가 축적되는 것으로 나타났고 또한 염색체 중에서는 X 염색체의 경우가 SNP 비율이 가장 적어 진화적으로 잘 보존되고 있음이 밝혀졌다. 

유전체 정보의 이용

   국제컨소시엄과 Celera Genomics에 의해 발표된 인간유전체 염기서열은, 아직 정확하게 비교되어 있지는 않지만, 염기 서열 분석에 사용한 방법이 서로 달랐고 또 아직 초안에 불과하기 때문에 완전히 일치하지는 않는다. 이 외에도 각각에 의해 발표된 두 권의 “Book of Life”에는 또 하나의 중요한 차이점이 있는데 그것은 분석한 염기서열의 공개여부이다. 1996년 미국의 Bermuda에서 열린 국제컨소시엄의 첫 회의에서 컨소시엄에 참여한 전세계 각 연구소의 대표들은 1 또는 2 kb 이상의 DNA 조각을 분석하였을 경우에는 24시간 이내에 public database인 GenBank에 등록하도록 한 “Bermuda Rule”을 만장일치로 채택함으로서, 각 연구자들에 의해 확인된 염기서열을 아무런 제약 없이 곧바로 연구에 이용될 수 있도록 모든 사람에게 개방하는 것을 원칙으로 삼았다. 이에 따라 국제컨소시엄에서 발표한 모든 염기서열은 GenBank를 통하여 언제든지 자유롭게 열람할 수 있다(http://www.ncbi.nlm.nih.gov). 이와는 대조적으로, 처음부터 상업적인 목적으로 사람의 염기서열 분석을 시작한 Celera Genomics에서 발표한 염기서열은 이 회사의 홈페이지(http://www.celera.com)를 통해서만 열람할 수 있으며, 그 방법에 있어서도 상당히 까다로운 조건을 요구하고 있다. 예를 들어, 연구의 내용이 비영리적임을 자세히 기술한 연구기관장 명의의 각서가 없다면 일주일에 최대 백만 염기까지만 정보를 다운로드 받을 수 있게 되어 있어 실제 모든 염기서열을 받기 위해서는 56년이 걸려야 한다는 계산이 나오게 된다. 한편, 제품 개발과 연관된 목적으로 정보를 얻고자 하는 경우에는 정보의 열람료를 받고 염기서열의 database를 제공하고 있다. 이 회사는 2000년 현재 약 30개의 제약회사, 대학 또는 연구소와 계약을 맺고 있으며, 정확한 자료는 아니지만 염기서열의 연간 열람료는 제약회사의 경우 500~1500만 불, 대학과 비영리 연구소의 경우 7,500~15,000 불이며, 이를 통해 2000년 한 해 동안의 수익은 약 4,300만 불에 달하는 것으로 알려져 있다. 한편, 2001년 6월부터는 국제컨소시엄의 본부가 있는 미국 NIH 산하의 연구소에서도 Celera의 정보를 실험실당 매년 20,000불씩 지불하는 조건으로 열람하고 있기도 하다. 

앞으로의 연구 방향

   인간유전체의 초안이 발표된 이후, 국제컨소시엄의 염기서열 분석능력을 합할 경우 현재는 초당 2,000, 시간당 720만, 그리고 하루에 1억 7,200만 개의 염기를 분석할 수 있어, 일년 전에 한 달이 필요했던 작업을 이제는 일주일이면 끝낼 수 있을 정도가 되었다. 이러한 염기서열 분석능력의 급격한 발달은, 유전체사업이 시작된 지 올해로 10년이 지났지만 인간유전체 염기서열 초안의 90% 이상이 초안의 발표 전 15개월 동안에 이루어졌다는 사실로도 짐작할 수 있다. 초안의 완성 이후 컨소시엄에 참여했던 연구소들 중 다수가 이미 염기서열의 분석을 위한 방법의 개발과 유전자의 기능연구로 관심을 옮기고 있는 추세이지만, 미국의 Whitehead/MIT Genome Center나 영국의 Sanger Center 등과 같이 컨소시엄의 주축이 되었던 센터들은 아직도 염기서열 분석장치를 추가하는 등 시설확충을 계속하면서, Watson과 Crick이 DNA의 이중나선 구조를 밝혀낸 지 50주년이 되는 2003년 4월 25일을 목표로 오차율이 0.01% 이하인 인간유전체 염기서열의 완결판 제작을 위한 염기서열 분석작업을 계속 진행하고 있다. 2001년 현재 인간유전체의 1/3에 해당하는 10억개 이상의 염기가 이러한 기준에 맞는 정확도로 완성이 되었으며, 향후 2년간 나머지 20억 개의 유전자 서열이 완전하게 결정될 것으로 예상된다. 
   이와 같이 완성될 인간유전체 염기서열이 단순한 염기의 나열로 그치지 않으려면 진화에 필수적인 유전 요소 또는 발현을 조절하는 부위 등과 같이 유전체의 각 부위가 갖는 의미를 알아야 한다. 이러한 목적을 위한 효율적인 방법 중의 하나는 다른 종의 유전체와 비교 분석하는 것으로서, 현재 60개가 넘는 종의 유전체 서열이 완성되었으며 이러한 숫자는 향후 몇 년 안에 100개가 넘을 것으로 예측된다(표 2). 이를 위하여 유전체 사업에 관여했던 주요 센터와 Celera Genomics와 같은 몇 몇 기업체들이 현재 사람 이외의 다른 종의 유전체 연구를 시작하고 있다. 그 예로서, mouse(mouse sequencing consortium, Celera Genomics), rat(미국), 돼지(중국), 우렁쉥이(미국), 복어, chimpanzee(독일, 일본) 등의 유전체가 분석되고 있다. 이 중 2000년 10월에 결성된 mouse sequencing consortium의 경우를 예로 보면, 컨소시엄이 결성된 지 일년이 채 안된 2001년 5월 현재 인간유전체와 비슷한 크기인 30억 염기쌍에 해당하는 mouse 유전체 서열의 95% 이상을 완성한 것으로 알려지고 있으며 Celera Genomics의 경우에는 거의 99%가 넘는 염기서열을 이미 분석했다고 한다. 이러한 추세로 볼 때, 수년 내에 인간유전체 연구에 도움을 줄 동물들의 유전체 분석이 완성될 것으로 추정되며, 이를 바탕으로 한 비교유전체학(comparative genomics)을 통하여 사람의 DNA 중에서 단백질을 합성에 필요한 exon 부위를 확인하게 됨으로서 유전자의 확인이 가속화 될 것이고, 또한 전사조절 부위 등과 같이 기능적으로 중요한 부분을 효과적으로 찾을 수 있을 뿐 아니라 생물체들의 진화 경로를 밝히는 데에 필수적인 정보를 제공할 수 있을 것으로 보인다. 
   한편, 유전체 사업에 관여하며 거액을 투자했던 수많은 회사들 중 자동화 염기서열 분석기를 개발했던 Applied Biosystems (Perkin Elmer의 새 이름)와 같은 소수의 회사를 제외하고는 계속적인 적자를 면하지 못하고 있다. 이에 따라, 사람의 유전체 서열이 거의 다 밝혀진 현재, 이들은 방대한 유전체 염기서열 자료를 바탕으로 저마다의 수익모델을 찾아 활로를 모색 중에 있다. 이들 회사들을 크게 세 부류로 나누어 보면 첫째, 장비메이커로서 DNA의 염기서열 결정과 유전자 발현연구 및 자료의 분석에 이용되는 기계, 시약, chips 및 컴퓨터 software를 개발하는 그룹(예, Applied Biosystems, Affymetrix, Informax);둘째, service 업체로서 신약 또는 진단시약을 개발하려는 회사에게 유전자에 관한 최신의 정보와 그 부산물을 판매하는 일종의 정보 브로커(Incyte Genomics, Celera Genomics);셋째, 신약개발 업체로서 약물에 사용될 만한 단백질을 대량으로 찾아내어 직접 신약 개발에 이용하거나 다른 회사에 판매하는 회사(Human Genome Sciences, Millennium)들이다. 
   생물체에서 실제 기능을 담당하는 것이 유전자가 아닌 단백질이며, 이러한 단백질의 발현이 여러 가지 상황과 시간에 따라 변화하고 또한 세포 내에서의 전사체(transcript)와 단백질 발현이 일치하지 않는다는 결과들은, 유전체 사업으로 얻어진 정보만으로는 한계가 있음을 보여주고 있다. 이에 따라, 최신의 biotechnology는 대량의 유전자 서열 분석으로부터 점차 단백질 연구 쪽으로 그 추세가 변화되고 있다. 인간유전체 연구의 가장 중요한 목표 중의 하나가 질병의 치료이고, 또 약물개발에 이용되는 것이 유전자가 아니라 유전자가 갖고 있는 정보로 만들어지는 단백질임을 생각한다면, 유전체 정보를 바탕으로 질병의 치료약물로 개발될 “효자” 단백질을 찾아내고자 하는 것은 어쩌면 자연스러운 흐름일 것이다. 
   유전체에 의해 만들어지는 모든 단백질의 총체를 단백체(proteome)라고 하며, 단백체 구성원들의 세포내 위치, 조절 기전, 삼차원적 구조, 다른 단백질과의 상호작용, 활성 등과 같은 단백질의 전반적인 기능을 연구하는 새로운 학문분야를 단백체학(proteomics)이라고 한다(Banks 등 2000;Naaby-Hansen 등 2001). 단백체학의 연구를 위하여 현재 HUGO에 상응하는 국제컨소시엄인 Human Proteome Organization (HUPO)의 결성이 추진 중에 있으며, 인간유전체 연구에 참여할 기회를 갖지 못했던 우리 나라도 HUPO에는 초기부터 적극적으로 참여하고 있다. 이와 같은 국제적인 관심에도 불구하고, 단백체 연구는 아직 초기단계에 머무르고 있는 실정이다. 그 이유는 단백질의 경우 핵산처럼 증폭이 어려울 뿐 아니라, 삼차원적 구조, 합성 후에 필요한 여러 가지 수식(modification) 그리고 상황에 따른 세포내 위치의 변화 등 수 많은 요인들에 따라 그 기능이 달라지는 까닭에, 염기서열 분석이 주된 방법이었던 유전체 연구에 비해 훨씬 더 복잡하고 다양한 연구방법들이 단백체 연구에 필요하기 때문이다. 현재 mass spectrometry나 protein microarrays 및 단백질 구조의 예측 프로그램이 개발되는 등 본격적인 연구가 시작되고 있으며, 유전체 연구에 참여했던 많은 업체들이 분초를 다투어 단백체 연구에 뛰어들고 있고, 이미 Celera나 Incyte와 같이 규모가 큰 회사들은 증권시장을 통해 수 십억불을 조달하여 거대한 연구 시설을 확충함으로서 단백체 연구의 실용화에 박차를 가하고 있다. 이러한 광범위한 연구를 바탕으로 분자수준에서의 질병 진단, 새로운 치료법 개발 나아가 개체-특이적인 치료 등이 머지않아 현실화 될 것이라는 희망으로, 전 세계적으로 유전체 및 단백체에 관련된 사업에 투자된 금액은 2001년 현재 600억불을 넘어선 것으로 알려지고 있다. 

인간유전체 사업이 의학에 미치는 영향

   인간유전체의 지도작성과 서열 결정으로 인하여 의학연구의 방향이 변화되고 있다(표 3). 그 과정에서 질병과 같은 개체의 다양한 생물학적 특징과 관련된 유전자들을 확인하는 작업이 훨씬 더 빨라지고, DNA microarrays 방법 등을 이용한 정상과 병적인 상황에서 각 조직에서의 모든 유전자 발현 양상들이 밝혀짐으로서 질병을 예방, 진단 및 치료하기 위한 분자의학의 새로운 시대가 열려가고 있다. 이에 따라, 흔한 종양의 진단과 질병의 분류를 위한 microarrays는 수년 내에 상용화 될 것으로 보여진다(Aitman 2001;Zhu과 Snyder 2001).
   1986년에 유전자 지도를 근거로 한 positional cloning 방법이 도입된 이후, 유전질환의 원인 유전자를 찾고자 했던 거의 모든 연구자들이 이 방법을 이용하였고 그 결과 현재 약 1,100개의 질병관련 유전자가 확인되었다(http://www.ncbi.nlm.nih.gov/omim). 하지만 사람 및 다른 종의 유전자 서열이 밝혀짐으로서 염기서열을 근거로 한(sequence-based) 유전자 발견이 가능해지고 또 방법이 향상됨에 따라, 머지않아 시간과 인력 그리고 경비 면에서 비교가 되지 못하는 positional cloning 방법을 대체함으로서 유전자의 확인 작업에 필요한 시간이 급속도로 단축될 것이다. 이러한 과정을 통해 대량의 질병관련 유전자들이 확인되면 이전처럼 한 가지 유전자의 기능을 분석하던 방식에서 벗어나 다수의 유전자들 간의 그리고 유전자와 환경 간의 복합적인 상호작용까지도 손쉽게 조사할 수 있게 되어, 정신분열병과 같이 한 가지가 아닌 여러 가지 유전자가 복합적으로 관여한다고 알려진 질환들의 연구가 가능하게 되었다(Marcote 등 2001). 그러나 이를 위해서는 유전체 연구로 얻어진 정보와 유전자 발현 양상 그리고 유전자 산물의 기능 분석 등이 종합적으로 연구되어야 한다. 이러한 방향으로의 진전을 위해서는 유전체학에 이용되는 비용의 감소가 전제되어야 하는데, 그 예로서 염기서열의 분석비용은 매 18개월마다 절반으로 감소하는 추세이며, 이에 따라 머지않아 개인이 아닌 집단에서의 유전적 다형성(polymorphism) 분석도 가능할 것으로 생각되며, 현재는 100명 또는 그 이상 개체의 동일한 유전체 부위를 분석함으로서 유전자의 다양성과 특정 질환 또는 개체특성과의 연관성을 조사하려는 시도가 이루어지고 있다.
   한편, 인간유전체 사업의 결과 유전체의 서열결정과 함께 얻어진 SNP 지도는 많은 질환들의 유전적 원인의 확인을 위한 가장 강력한 무기가 될 수 있을 것으로 생각된다(Liggett 2001). 지금까지 확인된 대부분의 SNP가 단백질 합성과 무관한 DNA 부위에서 나타나지만, SNP의 약 1%는 단백질 합성에 관여하는 유전자 부위에 존재하는 것으로 알려져 있어 이들이 결국에는 사람들에게 흔히 발생하는 질병의 연구에 직접 이용될 수 있을 것이다. 이외에도, 지금까지 유전질환의 원인유전자를 찾는데 주로 사용되었던 linkage나 association 연구의 표지자(marker)로서 SNP가 중요하게 사용될 것이므로, 결국에는 기능과 연관된 SNP가 추가로 확인될 수 있을 것으로 예측된다. 구체적으로 볼 때, SNP는 질병 유전자 지도의 작성 등과 같은 질병의 유전적 연구와 질병에 대한 감수성(susceptibility)의 개체간 차이에 대한 원인 규명에 도움을 줄 수 있을 것이다. 또한, SNP의 분석을 통한 약리유전체학(pharmacogenomics)의 발달은 약물의 개발과 환자치료의 개념에 커다란 변화를 가져올 것으로 생각되어, 궁극적으로는 약물의 부작용 및 약물치료에 대한 개체 차이 등의 원인 규명 등을 통하여 맞춤치료(tailored treatment) 시대를 위한 중요한 자료로 이용될 것이다. 나아가 인간유전체 사업을 통해 확인된 유전자 서열 중 인류에게 공통적인 것은 99.9%에 해당하는 유전체 서열이며 나머지 0.1%에서 나타나는 SNP가 개체에 따라 다르다는 개념은 생물학적 반응의 인종별 차이를 설명하는 데에도 적용할 수 있다. 즉, 특정 유전자에 의해 발병하는 유전질환이라 하더라도 유전자와 환경과의 상호반응이 발병에 커다란 영향을 주게되므로, 개체가 살고있는 지역에 따라 즉, 인종에 따라 호발하는 질병이 있을 경우에 이 질병에 해당하는 특이한 SNP 양상이 존재할 수 있다는 것이다. 2000년부터 우리 나라에서 시작된 “한국인 호발 질환에 대한 유전체 사업”도 이와 맥락을 같이하는 것으로 이해할 수 있다. 하지만 이러한 기대에도 불구하고, 현재 수만 명의 개체에서 수천 개의 SNP를 분석하기에는 기술적으로 많은 제약이 있으므로 향후 SNP chip의 개발 등과 같은 연구를 통해 이러한 과제를 극복해야 할 것이다.
   환자를 직접 치료하는 의료적인 면에 있어서는 의사의 주된 역할이 질병을 진단하고 치료하는 현재의 방식에서 벗어나, 질병에 대한 조기진단과 감수성(susceptibility) 조사를 바탕으로 한 질병의 예측(prediction)과 예방(prevention)으로 변화될 것으로 쉽게 생각해 볼 수 있다(Bailey 등 2001;Collins과 McKusick 2001). 나아가 환자의 치료를 위해서는 환자 개개인의 유전형에 따라 부작용이 적고 반응도가 높게 디자인 된 약물(personal pill)을 처방하게 될 것이다. 전문가들은 2010년까지는 십여 개에 달하는 흔한 질환에 대해 예측적인 유전자 검사가 가능할 것으로 내다보고 있으며, 이에 따라 사람들은 병에 걸리기 전부터 질병에 대한 각자의 발병가능성을 미리 파악하고 위험인자를 제거함으로서 발병을 사전에 방지하거나 조기 진단을 통한 치료를 꾀할 수 있게 될 것이다. 또한 2020년까지는 약리유전체학의 발달이 현실로 나타나 개체의 유전형에 따른 약물 반응을 미리 예측하여 처방하는 “맞춤 약물(designed drug)”이 당뇨병이나 고혈압과 같은 다수의 질환치료에 사용될 수 있을 것으로 예측하고 있다. 

결     론

   최근 각 학회의 표제 또는 학술지 종설을 보면 “postgenomic era”라는 용어를 어렵지 않게 볼 수 있다. 1992년부터 인간유전체 사업단을 이끌고 있는 Francis Collins는 인간유전체가 공표된 후의 지금의 상황을 “지금은 유전체학의 시대가 끝난 것이 아니며(not the end of genomics), 끝의 시작은 더구나 아니며(not even the beginning of the end) 이제 겨우 시작의 끝에 불과하다(It may be the end of the beginning)”라고 표현하였다. 학문의 명칭이 -ology에서 -omics로 변화됨을 알아챌 수 있을 정도로, 21세기에 접어든 생물학의 발전은 그 속도와 방향의 예측을 불허하고 있다. 이러한 현실에서도, 실제 연구에 참여하거나 연구를 지도하는 소수를 제외하고는 아직까지 대부분의 의사에게 유전학적인 용어가 낯선 것 또한 현실이다. 그러나, 몇 달 앞을 내다볼 수 없이 급격하게 변화 발전해가고 있는 현재의 추세를 비추어 볼 때, 10년 후 20년 후를 내다보며 지금부터 서둘러 준비를 한다고 해도 결코 빠르지는 않다고 생각된다. 이러한 시점에서 인간유전체 사업으로 얻어진, 그 가치를 평가할 수 없을 만큼, 소중한 결과들을 이해함으로서 우리도 관객이 아닌 선수가 되어 앞으로 펼쳐질 무한히 흥미로울 경기에 동참할 수 있게 되기를 기대해 본다.

REFERENCES

Timothy J Aitman(2001):DNA microarrays in medical practice. British Medical Jourhal 323:611-615

Oswald Avery, Colin MacLeod and Maclyn McCarty(1944):Studies on the chemical nature of the substance inducing transformation of pneumococcal types. Induction of transformation by a deoxyribonucleic acid fraction isolated from Pneumococcal type III. Journal of Experimental Medicine 79:137-158

David Bailey, Edward Zanders and Philip Dean(2001):The end of the beginning for genomic medicine. Nature Biotechnology 19:207-209

Rosamonde E Banks, Michael J Dunn, Denis F Hochstrasser, Jean-Charles Sanchez, Walter Blackstock, Darryl J Pappin and Peter J Selby(2000):Proteomics:new perspectives, new biomedical opportunities. Lancet 356:1749-1756

Francis S Collins and Victor A McKusick(2001):Implications of the human genome project for medical science. JAMA 285:540-544

Venter J Craig, et al(2001):The sequence of the human genome. Science 291:1304-1351

Eric D Green and Aravinda Chakravarti(2001):The human genome sequence expedition:Views from the "Base Camp". Genome Research 12:645-651

International Human Genome Sequencing Consortium(2001):Initial sequencing and analysis of the human genome. Nature 409:860921

Eric R Marcotte, Lalit K Srivastava and R mi Quirion(2001):DNA microarrays in neuropsychopharmacology. Trends in Pharmacological Sciences 22:426-436

Stephen B Liggett(2001):Pharmacogenetic applications of the human genome project. Nature Medicine 7:281-283

Soren Naaby-Hansen, Michael D Waterfield and Rainer Cramer(2001):Proteomics-post-genomic cartography to understand gene function. Trends in Pharmacological Science 22:376-384

James D Watson and Francis HC Crick(1953):Molecular structure of nucleic acid. A structure for deoxyribose nucleic acid. Nature 171:737-738

Heng Zhu and Michael Snyder(2001):Protein arrays and microarrays. Current Opinion in Chemical Biology 5:40-45