안녕 일게이들아

이번 화성살인사건을 통해 DNA의 중요성이 한번더 나오는데

정작 DNA가 뭔지 잘 모르는 게이들을 위해 준비했어


DNA, 유전자, 게놈 등등...  인터넷에서 많이 들어본 유전자라는게 정확히 뭘까??




 

유전자 (Gene) ㅡ DNA 가 갖고 있는 정보

기본적으로 유전자 하면 우리가 생각하는 게 있다

 



 

바로 자식이 부모들의 유전자를 닮는 것

잘생긴 아버지에게 미남 아들 태어나고 똑똑한 어머니에게 똑똑한 딸이 태어난다.

물론 가정환경이나 재력과 같은 변수를 고려하지 않을 수는 없지만,

적어도 "자식이 부모를 닮는다"라는 명제 자체는 인류 역사를 통틀어

수많은 사람들에게 사실로 받아들어졌다.

 




 

그런데 "왜" 닮는 걸까??

유전자, DNA가 같아서 닮는 걸로 우리는 배웠다

그런데 DNA가 뭔지, DNA가 어떻게 유전되는지,

DNA가 비슷하면 왜 부모-자식이 닮는지 정확히는 잘 모른다

아니, 그것보다 먼저 도대체 DNA에 어떤 정보가 어떻게 들어있고,

그 정보는 어떻게 읽히기에 부모와 자식이 비슷하게 태어나는 건지,

그 방대한 정보는 어떻게 아빠의 정액 한 방울에 우겨들어가 있는지....

 




그레고르 멘델 ( Gregor Mendel )


유전학의 아버지 그레고리 멘델도 이런 의문이 생겨 유전자에 대해 연구를 진행했다



 

멘델 : 야 내가 콩을 키워봤는데

동료 학자 : ㅇㅇ

멘델 : 노란 콩이랑 초록 콩이랑 교배시키면 노란 콩이 태어나더라

동료 학자: 자식이 부모 닮는 게 뭐 그리 특별함? 당연하지

멘델 : 근데 그렇게 태어난 노란 콩 두 개를 교배시키면 초록 콩이 태어나던데?

이거 부모 둘 다 초록색이 아닌데 자식은 왜 초록색이냐?

동료 학자 : ....?!




 

멘델은 콩을 여러 세대 교배시키면서 부모(P) 세대의 색이 자식(F1) 세대를 건너뛰고

손자(F2) 세대에서 나타나는 것을 확인한다.

이때 멘델은 헷갈리기 시작했다..

왜냐? 자식이 부모를 닮는 것은 오랫동안 알려진 통념이었지만,

왜 손자(F2)가 부모(F1)와는 다르게 생겼으면서 조부모 (P)를 닮는 것인지는 알려지지 않았을 때니까.


 



 

그래서 이 현상을 설명하기 위해 멘델은 "유전자 (gene)"라는 개념을 처음 도입하게 된다.

이때에는 아직 유전자가 어떤 물질인지 (다들 알다시피 나중에 DNA로 밝혀진다),

생명체의 어디에 저장되어 있는지는 알려지지 않았다.

단지 생명체가 태어날 때 엄마에게 한 짝, 아빠에게 한 짝씩 "유전자"라는 것을 물려받게 되는데

이 유전자가 상황에 따라 나타날 수도 있고 나타나지 않을 수도 있다는 사실만 알아냈다.

 

 


토머스 모건 (Thomas Hunt Morgan)


멘델의 연구는 유전에 대한 인간의 지식을 송두리째 바꿔놓을 만했지만, 아직 어딘가 부족했다.

유전자라는 개념은 도입되었지만 이게 도대체 무엇인가에 대한 설명은 없었음.

이 연구를 토머스 모건이 이어받아 좀 더 발전시키게 된다.




 

모건은 멘델과 달리 초파리를 연구했다.

초파리는 가끔 흰 눈을 가진 유전병 초파리들이 태어난다 (빨간 눈이 정상).

멘델의 유전 법칙에 따르면,

P (부모) 세대의 빨간 눈과 흰 눈 초파리를 교배했을 때

F1 (자식) 세대에서는 100% 빨간 눈의 초파리가 태어나야 하고,

 

이렇게 태어난 F1 세대 (100% 빨간 눈)를 서로 교배했을 때

F2 (손자) 세대에서는 75%의 확률로 빨간 눈의 초파리,

25%의 확률로 흰 눈의 초파리가 태어나야 한다.

여기까지는 그대로 일어났다.

문제는, 모건이 그렇게 태어난 F2 세대 초파리의 성별을 관찰했을 때였다.

F2 세대의 초파리를 관찰했을 때, 모건은 빨간 눈의 초파리 암:수 비율이 각각 50%,

흰 눈 초파리 암:수 비율이 또 각각 50%일 것이라고 예상했다.

충분히 당연한 예측이었다

초파리가 알을 까면 성비는 암수 50:50 비율이니,

마찬가지로 빨간 눈 초파리도 암수 반반, 흰 눈 초파리도 암수 반반씩 태어날 것이라고 생각한 거지.

 



 

하지만 여기서 반전이 일어난다.

F2 세대의 초파리를 관찰했을 때, 모든 암놈은 빨간 눈이었고 흰 눈의 초파리는 오직 수놈에게서만 관찰됨.

즉, 암놈은 모두 빨간 눈으로 태어나고 수놈의 일부는 빨간 눈, 일부는 흰 눈으로 태어났다.




 

모건은 이를 보고 "(멘델의 예측과는 달리) 모든 유전자들이 각각 따로따로 유전되지는 않는다,

눈의 색을 결정하는 유전자와 성별을 결정하는 유전자는 가까이 붙어있기 때문에

하나가 유전되면 다른 하나도 "같이" 유전되기가 쉬워진다.

따라서 " 흰 눈 유전병은 오직 수놈 중에서만 관측이 된다 " 라는 결론을 낸다.

(성염색체, 우/열성 관련된 부분은 지면 관계상 넘어가도록 하자).

 



 

모건의 연구결과는 당시에 굉장히 놀라운 성과이다.

현대인들은 유전자가 DNA 정보로 구성되어있다는 사실을 "당연하게" 알고 있다.

하지만 저 때는 그게 아직 밝혀지기 전이었다.

​멘델이 유전자의 개념을 도입하기는 했는데, 이 유전자라는 것이 생명체의 몸속에 들어있는 건지,

DNA에 저장된다는 건 꿈도 못 꿀 시기이고.

그때 모건이 "특정 유전자 두 개가 물리적으로 붙어있는 듯한" 연구결과를 내놓은 것이다.

모건의 연구결과에 따르면 유전자라는 것이 물리적인 무언가에 정보로써 저장되어있는 것이고,

이게 생명체의 몸속 어디엔가에 있다는 결론이 도출된다.

 

 




이제 이 유전자가 도대체 어디에 저장되어 있는지 어떻게 정보가 구겨져 있는지 알아내는 게 문제였다



프레드릭 그리피스 (Frederick Griffith)


 

의사였던 그리피스는 폐렴을 일으키는 세균

(폐렴 연쇄상구균, Streptococcus pneumoniae)을 가지고 재미있는 실험을 하나 고안했다.

 

( * 세균도 단세포 생물이고 각각 세포(개체) 가 당연히 DNA 유전정보를 갖고 있다)




 

연쇄상구균을 배양해서 쥐에게 직접 주입할 수가 있는데,

연쇄상구균 중에는 독성이 없어서 쥐를 죽이지 않는 종류( = R형) 가 있고

독성을 지녀서 쥐를 죽일 수 있는 종류( = S형) 가 존재한다

그리피스는 같은 연쇄상구균 중에 다른 독성을 지닌 R형과 S형이 존재하는 이유에 대해,

R형과 S형이 조금씩 다른 유전자를 갖고 있기 때문이라고 생각했다.

​그래서 쥐에게 연쇄상구균을 주입하는 실험을 각각 상황을 바꿔서 4번 진행한다.
 



 

1. 쥐에게 살아있는 R형을 주입한 경우 -> 쥐가 살아남음.

-> 이상할 게 없다. R형은 위에서 말했듯이 독성이 없다.

2. 쥐에게 살아있는 S형을 주입한 경우 -> 쥐가 죽음.

-> 이것도 이상할 게 없다. S는 독성이 있으니

3. 쥐에게 죽은 S형을 주입한 경우 -> 쥐가 살아남음.

-> 마찬가지. 연쇄상구균은 죽었을 때 독성을 잃으므로.

4. S형을 먼저 모두 죽여버리고, 살아있는 R형과 죽은 S형을 섞어서 쥐에 주입할 경우

-> 여기서는 결과가 어떻게 나올까??

상식적인 생각으로는 죽은 S형(죽어서 무독성) 과 살아있는 R형(무독성) 을 주입했으니

쥐가 당연히 살아남아야 한다 아닐까?

 

 



 

그런데 쥐가 죽었다.

그리피스는 헷갈리기 시작한다.

왜 독이 없는 균 두 가지를 넣었는데 동물이 죽냐??

그리피스는 이에 대해 "살아있는 S형에게 독성을 주는 유전자가 있는데,

이 유전자는 S형 세균이 죽은 이후 주변으로 흩어져 버렸다.

이 유전자가 살아있는 (무독성) R형에게 흡수되어 원래 독성을 지니지 않았던 R형이

마치 S형처럼 독성을 지니게 되었다. 그래서 쥐가 죽었다" 이런 설명을 내놓는다.

​사람들 : 그래서 그 독성을 주는 "유전자"가 뭔데?

어떻게 죽은 세균에게서 흩어지고 살아있는 세균에게 흡수된 건데?

그리피스: ....

 



오즈월드 에이버리 ( Oswald Avery )


 

이 이론을 뒷받침하기 위해 오즈월드 에이버리가 후속 연구를 진행했다.

이 당시 탄수화물, 단백질, DNA, RNA라는 물질은 알려져 있었지만

도대체 이 중에서 어떤 놈이 이 "유전자"라는 걸 저장하는 매개체인지는 알려지지 않았을 때였다

​에이버리는 위 그리피스의 실험 4번에서 [죽은 S형과 살아있는 R형 배양액의 혼합물]을

쥐에게 주입하기 전에 탄수화물/단백질/DNA/RNA를 각각 없애서 실험하기로 한다.

 

​에이버리: 죽은 S형에서 살아있는 R형으로 독성 유전자가 이동한다면 (그리피스 실험),

만일 내가 그 매개체를 없애버린다면 독성 유전자가 R형으로 이동하지 않을 것이고,

쥐는 살아남을 수 있지 않을까?

 


 


 

1. 죽S + 살R + 탄수화물 제거 -> 쥐가 죽음.

-> 결론: 탄수화물은 유전자를 저장하는 매개체가 아니다.

2. 죽S + 살R + 단백질 제거 -> 쥐가 죽음.

-> 결론: 단백질은 유전자를 저장하는 매개체가 아니다.

* 이때 유전자는 단백질에 저장되어 유전된다고 생각했던 과학자들이 많았다

 

3. 죽S + 살R + RNA 제거 -> 쥐가 죽음.

-> 결론: RNA는 유전자를 저장하는 매개체가 아니다.

4. 죽S + 살R + DNA 제거 -> 쥐가 살아남음.

-> S형의 독성 유전자는 바로 세균의 DNA 안에 저장되어 있던 것이다.

​비로소 인류는 자식이 부모를 닮는 이유가 바로 사람 세포 각각 안에 저장되어 있는 DNA에 있음을 알게 되었다.

​그러면 DNA는 어떻게 사람의 유전 정보를 저장하냐?


 



 

DNA는 Adenine (A), Guanine (G), Thymine (T), Cytosine (C)라 불리는 기본 단위 ( = 뉴클레오티드)들이

계속해서 반복하는 구조를 갖고 있다.

컴퓨터를 예로 들자면 컴퓨터는 2진법으로 정보를 0과 1로 저장한다

즉, 0101110001과 1110101110 이 서로 다른 정보를 갖고 있다



 

DNA도 비슷하다. 단지 0과 1이 아니라

A, G, T, C 뉴클레오티드가 특정한 순서에 따라 반복된다는 차이가 있을 뿐임.

예를 들어 ATCGTCTA가 한 정보를 갖고 있다면, GCATGCG가 또 다른 정보를 갖고 있다는 소리이다.

그렇기 때문에 DNA 정보를 달리 표현하여 "염기 서열"이라고 표현하기도 한다.

 





 

한 사람의 모든 유전적 정보는 32억 개의 A, G, T, C가 반복되어 저장된다고 한다

세포 한 개에 1미터의 DNA가 있다, 그리고 우리 몸의 세포는 같은 DNA를 공유한다(소수 예외 있음)

 

어떻게 이 많은 정보가 세포 한 개에 들어가 있을까??




 

DNA의 구조는 실처럼 가는 나선형 모양으로 되어있기 때문이다

이 DNA는 둥그런 히스톤(histone)에 둘둘 말려있는 형태를 띠게 된다.

(히스톤은 단백질의 일종인데 위에 보는 것처럼 둥그런 형태이고 DNA가 두루마리 휴지라면

히스톤은 휴지심을 하는 개념이라고 보면 된다)

이렇게 DNA를 칭칭 두르고 있는 히스톤은 또 다른 히스톤 여러 개와 뭉쳐

결과적으로 염색체 (chromosome)를 이루게 된다.

염색체에 관한 건 학교에서 많이 배웠을 것이다




 

건강한 사람의 세포라면 누구나 46개의 염색체를 갖고 있지만,

암세포의 염색체를 보면 깨져있고 없어져있고 똑같은 게 여러 개 발견되고 아주 난리가 나있다.

설계도가 이렇게 삑사리가 나 있으니 세포가 암세포로 변하는 것임.



 

또 다운 신드롬에 걸린 사람은 저렇게 21번 염색체가 2개가 아니라 3개가 발견됨.

 

즉, 21번 염색체에 해당하는 DNA의 총량이 일반인보다 50% 더 많이 때문에 다운증후군의 증상을 보이게 된다.




 

학자들은 생각했다

다운증후군, 암세포도 DNA에서 확인 가능한걸 보아하니...

사람의 유전자는 DNA 안에 서열로써 저장되어 있고,

그 염기서열이 한 사람당 32억 개의 뉴클레오티드로 이루어져 있다면,

이거 32억 개 염기서열만 다 알아낼 수 있다면 이 사람의 유전적 정보를 다 알아낼 수 있다는 소리 아니야??

다시 말해, 인간의 염기서열을 다 해독해 낸다면 그 사람이 어떤 유전병에 걸리고 언제 암에 걸릴지,

성격은 어떤지 언제 자연사해서 죽을지... 이거 다 예측 가능하냐....?

​이것이 바로 인간 게놈 프로젝트의 시작이다




프레더릭 생어 ( Frederick Sanger )

 

프레더릭 생어는 인간 DNA를 해독하려고 많은 노력을 했다

 

​자, 여기 시퀀싱 (해독) 하려고 하는 염기서열 ATTAAGCC가 있다고 쳐 보자.

우리는 이걸 해독하려고 하기 때문에 이 서열이 ATTAAGCC라는 사실을 모르는 상태이다.





 

프레더릭은 이 서열을 알아내기 위해서 각각의 뉴클레오티드 (A, T, G, C)에 서로 다른 색을 붙인다.

예를 들어, A에는 빨강, T에는 파랑, G에는 초록, C에는 노란색을 내는 물질을 붙여놓았다고 생각해 보자.

이제, 이 개량된 뉴클레오티드들을 갖고 우리가 원했던 DNA 조각 ATTAAGCC를 합성해 낸다.

효소들이 염기서열 ATTAAGCC를 합성해 내는 과정을 기계로 촬영해 보면,

빨-파-파-빨-빨-초-노-노 이런 식으로 색이 보이게 되는 원리이다.

우리는 빨간색이 A, 파란색이 T, 초록 색이 G, 노란색이 C라는 사실을 이미 알고 있으므로,

빨-파-파-빨-빨-초-노-노 라는 색깔들의 서열에서

쉽게 원래 우리가 해독하려고 했던 염기서열 ATTAAGCC를 알아낼 수가 있다






 

생어 시퀀싱은 분명 유용한 DNA 염기서열 해독 기법이었고,

이를 응용한 수많은 시퀀싱 연구들이 개발된 상황이었다.

하지만 당시엔 인간의 32억 개 문자를 시퀀싱 하기에는 비용도 문제지만 천문학적인 시간이 걸렸다

 



 

이는 근대의 슈퍼컴퓨터의 발달과 차세대 DNA 시퀀싱으로 인해서 해결됐다

 



 

이제 우리는 한 생물이 가지는 모든 정보를 효율적으로 시퀀싱 할 수 있다

한 생물이 가지는 모든 유전 정보를 게놈(genome)이라는 명칭으로 부르기도 한다

​와 잘 됐다!! 이제 누구나 내 유전정보를 100% 습득해서

내 몸에 대한 모든 정보를 모두 알 수 있고 모든 질병을 예측할 수 있겠네?


 



 

하지만 막상 게놈을 열어보니 도저히 우리가 해독 가능한 수준이 아니었다

과학자들이 차세대 시퀀싱으로 인간 유전정보를 해독했을 때 기대했던 결과는,

간단하고 이해하기 쉬운 유전 정보였다

 



인간 게놈 정보가 어떻게 구성되어있는지 정리한 도표

 

오른쪽 구석 끝에 Protein-coding genes 2% 가

바로 멘델이 제시한 "유전자"를 이루는 DNA 염기서열이다.

나머지 98%는 뭘까?

나머지 98%는 DNA는 DNA이고 염기서열은 염기서열인데 뭐를 하는지

왜 존재하는지 우리에게 필요하긴 한 건지에 대한 정보가 아무것도 알려지지 않았다.

​그야말로 첩첩산중에 설상가상...

이게 바로 인간 게놈 프로젝트는 한참 전에 달성되고도 남았지만

수많은 유전병 불치병이 아직도 존재하는 이유다.





그러면 게놈 프로젝트는 어떻게 풀어나가야할까??

유전자의 모든 정보를 어떻게 알아갈수있을까???


-2부에 최대한 정리해서 올리겠다 게이들아





1부 출처 
ㅡ 잭브라운 What is the end of the gene?
ㅡ  인간게놈 그 진실  
ㅡ  Bag defiller ,  gene 
ㅡ  What is a gene? - Genetics Home Reference - NIH