식물 유전체 3차원 구조의 기본 폴딩 단위 규명
- 유전자를 경계로 만들어지는 유전체의 3차원 구조 -
[연구필요성]
우리 몸을 구성하는 세포 1개의 DNA를 일자로 쭉 늘어놓으면 약 1.8m의 길이에 달하지만, 실제 DNA가 들어있는 세포 핵의 지름은 수십 마이크로미터에 지나지 않는다. 이처럼 긴 DNA가 아주 작은 핵 내에 존재하기 위해서는 고도로 잘 접혀진 구조가 필요하다.
DNA 서열 해독 (sequencing) 기술의 발달(Hi-C 기술 등)로 핵 내부에 위치한 유전체 3차원 구조를 분석할 수 있게 되었고, 이를 통해 DNA가 무작위적으로 접혀있는 것이 아니라, 일정한 규칙을 가지고 정교하게 접혀있다는 사실을 확인하게 되었다.
[연구성과/기대효과]
많은 동물 세포에서는 topologically-associating domain (TAD) 라고 불리는 구조가 유전체 3차원 구조를 이루는 기본 단위로 존재하고, 이를 기반으로 정교한 유전자 발현 조절이 이뤄지며 세포의 성장, 분화, 발달 등이 결정된다. 하지만 식물을 비롯한 일부 생물종의 게놈에서는 TAD를 만드는 메커니즘이 존재하지 않아 유전체 3차원 구조를 형성하는 더욱 본질적인 기본 단위 및 원리에 대한 의문이 여전히 남아있는 상황이다.
본 연구에서는 식물 모델을 이용하여 3차원 유전체 기본 구조가 개별 유전자 단위에서 형성되고 있음을 밝혀냈다. 이는 기존에 알려진 TAD 구조보다 더욱 작고 보편적인 3차원 유전체 폴딩 단위이고, 현 시점 가장 높은 해상도의 유전체 3차구조 단위로 볼 수 있다. 개별 유전자 수준의 단일 유전자 도메인(single-gene domain) 뿐만 아니라 인접한 몇 개의 유전자가 함께 다중 유전자 도메인(multi-gene domain)을 형성한다는 사실을 규명하였고, 이를 바탕으로 새로운 유전체 폴딩 메커니즘을 제안할 수 있게 되었다. 이러한 유전자 도메인은 모델식물 애기장대 뿐만 아니라, 우산이끼(M. polymorpha), 옥수수(Z. mays), 토마토(S. lycopersicum) 등 다양한 식물종에 보존되어 있고, 일부 동물 종에도 존재할 것으로 예상되는 바, 향후 3차원 유전체(3D genome) 연구에 중요한 토대를 제공할 것으로 기대된다.
[본문]
3차원 유전체 구조(3D genome)는 유전자 발현 조절의 핵심 요소로서 최근 많은 연구가 이루어지고 있는 분야이다. 유전체 3차 구조의 핵심 단위로 알려진 topologically associating domain (TAD)는 CTCF와 cohesin 복합체에 의해서 형성된다는 사실이 동물 모델을 중심으로 밝혀졌지만, 식물을 비롯한 일부 생물종에서는 TAD가 존재하지 않아 3차원 유전체 구조의 기본 단위 및 형성 원리에 대한 본질적인 연구가 필요하였다.
본 연구에서는 모델식물 (애기장대) 대상 초고해상도 Hi-C 데이터를 활용하여, 지금까지 불가능하였던 최고 해상도 분석(단일 제한효소 절편 수준)을 달성하였다. 이를 통해 기존에 관찰할 수 없었던 아주 작은 단위의 DNA 3차 폴딩구조를 발견하였다. 새롭게 발견된 3차원 구조는 유전자를 경계로 형성되고 있었으며, 이러한 구조는 전 식물 종에 걸쳐 광범위하게 보존되어 있다는 사실을 규명하였다. 본 연구진은 발견한 유전자 단위의 3차원 폴딩구조를 유전자 도메인 (gene domain)이라고 명명하였다.
유전자 도메인 형성은 다양한 후성유전학적 요인들 가운데 염색질 접근성(chromatin accessibility)과 밀접하게 연관되어 있다. 염색질 리모델러(chromatin remodeler)에 의해 유전자 경계 지역의 염색질 접근성이 증가하는 것이 유전자 도메인 형성의 주요 요인임을 증명하였다. 추가적으로 염색질 접근성이 높은 지역에 결합한 전사인자(transcription factor)의 결합 빈도가 유전자 도메인 형성에 함께 중요하다는 사실을 규명하였다.
유전자 도메인이 기본적으로는 개별 유전자 단위로 형성되지만, 인접한 2-4개 유전자에 걸쳐서 형성되기도 한다. 따라서 개별 유전자를 경계로 계층적 구조(hierarchical structure)를 형성하며 더 큰 단위의 3차원 구조를 만들어 낼 수 있음을 확인하였다.
염색질 접근성 데이터를 기반으로 유전체 3차원 구조 시뮬레이션을 수행하였을 때, 염색질 접근성이 높은 유전자 경계를 기반으로 애기장대 3차원 유전체 구조가 형성되고 있다는 사실을 증명하였다.
본 연구는 한국연구재단 중견연구 프로그램의 지원을 받았으며, 해당 분야 저명 국제 학술지 Nucleic Acids Research에 게재되었다.
[연구결과]
Accessible gene borders establish a core structural unit for chromatin architecture in Arabidopsis
Hongwoo Lee1 and Pil Joon Seo
(Nucleic Acids Research, in press)
유전체 3차원 구조는 게놈에 포함된 유전자의 정교한 발현 조절에 기여한다. 식물을 비롯한 일부 종에서는 기존에 알려진 3차원 유전체 구조 단위(TAD 등)와 이를 형성하는 단백질 CTCF 등이 존재하지 않기 때문에, 보다 본질적인 유전체 3차원 구조 단위 연구의 필요성이 제기되어왔다. 본 연구에서는 high-depth Hi-C 데이터를 활용하여, 기존에 도달할 수 없었던 가장 높은 수준의 초고해상도 애기장대 유전체 3차원 지도를 만들었고, 이를 통해 기존에 관찰하지 못했던 3차원 구조 단위를 관찰하였다. 해당 3차원 구조 단위는 유전자 경계(gene border)를 중심으로 형성되었다. 유전학적 분석, 상관관계 분석 및 컴퓨터 시뮬레이션 등을 통해 유전자 경계에서의 염색질 접근성(chromatin accessibility)이 유전체 3차원 구조 형성에 중요하다는 사실을 증명하였고, 염색질 접근성이 높은 유전자 경계에서는 단일 유전자 뿐만 아니라 인접 유전자와 더 큰 단위의 3차원 구조를 형성하기도 함을 확인하였다. 염색질 접근성은 전사인자(transcription factor)의 결합 위치를 결정하기 때문에, 전사인자의 결합 빈도 또한 유전체 3차원 구조 형성에 기여할 수 있음을 보였다. 염색질 접근성과 전사인자 결합에 의한 유전자 도메인 형성은 다양한 식물 종에서 광범위하게 관찰되었고, 이를 바탕으로 유전자 단위의 3차원 구조가 생물에 넓게 보존되어 있음을 제시하였다.
[용어설명]
- ○유전자 단위에서 형성되는 DNA 3차 구조를 의미하며, 유전자 주위의 높은 염색질 접근성에 의해 DNA 접힘 현상이 유도된다. 유전체 3차원 폴딩의 기본 단위로 예상된다.
- ○Chromosome 상에 형성되는 3D 구조 단위이며, DNA간 상호작용(interaction)이 활발하게 일어나는 유전체 지역을 의미한다.
- ○염색질은 DNA와 히스톤 단백질로 구성된 복합체를 의미하고, 염색질 접근성은 염색질을 구성하는 DNA가 히스톤과의 결합에서 벗어나 노출되어있는 정도를 나타낸다. 염색질 접근성이 높은 DNA 지역은 전사인자(transcription factor) 및 다양한 DNA 결합 단백질과의 결합이 빈번하게 일어난다.
- ○TAD 경계에 결합하는 전사인자로 DNA 루프 형성에 가장 중요한 기능을 하는 단백질이다. CTCF의 결합 이후 반지 모양의 cohesin 단백질 복합체가 접근하여 DNA 루프를 형성한다. CTCF는 동물에서는 발견되지만, 식물에서는 발견되지 않고 있다.