CRISPR-Cas9 enrichment and long read sequencing for fine mapping in plants - 리뷰 및 해설
이번 리뷰에서는 López-Girona 외 연구진이 2020년 Plant Methods에 발표한 논문 "CRISPR-Cas9 enrichment and long read sequencing for fine mapping in plants"를 다룬다. 이 논문은 식물의 특정 유전자 영역을 정밀하게 지도화(fine mapping)하기 위한 새로운 기술적 접근법을 제시한다. 연구팀은 사과(Malus × domestica)의 붉은 과육 형질을 유발하는 유전자 MYB10의 특정 변이를 표적으로 하여, CRISPR-Cas9을 활용한 DNA 절단 및 선택적 장독립(long-read) 시퀀싱 방법을 개발했다. Oxford Nanopore Technology(ONT) 기반 시퀀싱과 결합한 이 접근법은, 기존의 짧은 염기서열 기반 기술이 포착하지 못했던 구조적 변이나 반복 서열 영역까지 식별할 수 있다는 점에서 매우 유용하다. 본 연구는 단일 유전자 좌위의 세밀한 구조를 해석하고, 유용 형질을 유전적으로 규명하려는 식물 유전체 연구 및 육종 프로그램에 매우 중요한 전환점을 제공한다.
연구 배경 및 중요성
식물 육종에서는 유용 형질(예: 내병성, 과일 색 등)의 유전적 원인을 파악하는 것이 중요하다. 기존의 전장 유전체 시퀀싱(WGS)이나 SNP 기반 유전체 분석은 표적 유전자 주변의 구조적 변이 또는 복잡한 반복서열을 식별하는 데 한계가 있었다. 특히 많은 식물 유전체는 크고 복잡하며 반복서열이 풍부하여, 단편(short-read) 기반 시퀀싱으로는 정확한 해석이 어렵다. 이에 따라, 특정 유전자 또는 유전자군을 중심으로 구조적 변이를 고정밀도로 탐지할 수 있는 타깃 기반 시퀀싱 방법의 필요성이 제기되었다. 이 연구는 CRISPR-Cas9 시스템을 이용해 원하는 유전자 구간만을 절단하고, 이를 기반으로 ONT 시퀀싱을 진행하는 방식으로 새로운 해결책을 제시하였다.
연구 목적 및 배경
이 연구의 목적은 CRISPR-Cas9을 이용하여 사과 MYB10 유전자 인근의 특정 반복서열(R6 motif)을 정밀하게 분리 및 시퀀싱하고, 이를 통해 붉은 과육 형질과 관련된 원인 변이를 식별하는 것이다. 연구팀은 복잡한 식물 유전체 내에서 구조적 변이와 단일 염기 변이(SNP)를 동시에 식별할 수 있는 타깃 기반 장독립 시퀀싱 기술을 개발하고 검증하였다.
연구 방법
- MYB10 유전자 양쪽에 위치한 4개의 crRNA 설계
- 고분자량 핵 유전체 DNA를 추출하고 CRISPR-Cas9으로 표적 부위 절단
- 절단된 DNA의 양 끝에 ONT 시퀀싱 어댑터 부착
- ONT MinION 플랫폼을 이용해 시퀀싱 진행
- ONT 시퀀싱 데이터는 Albacore 및 Guppy로 base-calling
- 데이터 정제 후 de novo assembly 수행 (Canu, Nanopolish, Flye 사용)
사전에 설계된 crRNA는 MYB10 유전자의 프로모터와 다운스트림 영역을 절단하는 데 사용되었으며, 특정 R6 반복서열을 포함하는 약 8 kb 구간을 대상으로 하였다. 절단된 DNA는 dephosphorylation, dA-tailing 등의 절차를 거쳐 ONT 어댑터가 연결되고, 이후 MinION 시퀀서를 이용해 장독립 시퀀싱이 수행되었다.
주요 발견 및 결과
총 7,056개의 ONT 시퀀싱 리드는 평균적으로 85~91%가 사과 기준 유전체와 일치하였으며, 그중 약 3%는 정확히 MYB10 좌위(on-target)에 해당되었다. 이 구간의 시퀀싱 깊이는 180~196×에 달했으며, off-target 영역은 매우 적었다. de novo assembly 결과, R6 모티프를 포함한 8006bp 길이의 연속 서열이 도출되었고, 이는 MYB10 유전자 좌위에 정확히 일치하였다. 추가적으로 Flye를 통해 두 가지 하플로타입(R1과 R6)을 분리할 수 있었다는 점도 주목할 만하다.
실험 결과 요약
| 분석 항목 | Albacore 결과 | Guppy 결과 |
|---|---|---|
| 전체 리드 수 | 7056 | 7056 |
| on-target 비율 | 2.98% | 3.04% |
| on-target 시퀀싱 깊이 | 180× | 196× |
| 주요 contig 길이 | 8006bp | 8029bp (R6) / 7915bp (R1) |
해당 실험은 높은 특이도와 깊이를 기반으로 R6 반복서열이 포함된 MYB10 유전자 영역을 효과적으로 분리하고 조립할 수 있음을 보여준다. SNP에 의해 효율이 떨어지는 crRNA도 확인되었지만, 전체적인 시스템의 정밀도는 매우 높았다.
한계점 및 향후 연구 방향
가장 큰 한계는 DNA 품질에 따라 실험 성공 여부가 크게 달라진다는 점이다. CTAB로 추출한 DNA는 적합하지 않았고, 고분자량 핵 DNA를 별도로 추출해야 했다. 또한, 일부 gRNA는 목표 서열 내 SNP 때문에 효율이 저하되었으며, 특정 crRNA는 절단 후 Cas9이 DNA에 결합된 상태로 남아 ONT 어댑터 부착을 방해하기도 했다. 향후에는 multiplex 방식으로 여러 유전자 좌위를 동시에 타겟팅하거나, 바코드를 활용한 시료 분리 및 고속 분석이 가능한 플랫폼으로 확장될 수 있을 것이다.
결론
CRISPR-Cas9을 활용한 타겟 DNA 절단 및 ONT 장독립 시퀀싱 기술은 식물 유전체 내 특정 유전자 영역의 정밀 해석에 매우 효과적인 방법임이 입증되었다. 본 기술은 구조적 변이, 반복서열, 에피유전체 변이까지 포괄적으로 탐지할 수 있으며, 전장 유전체 시퀀싱 없이도 유용한 형질 관련 유전자 영역을 빠르게 분석할 수 있다. 향후 식물 육종, 유전형 분석, 유전자 편집 기반 형질 개선 등에 널리 활용될 수 있을 것으로 기대된다.
개인적인 생각
이 논문은 단순한 기술 시연을 넘어, 식물 유전체 연구의 실질적 문제를 해결할 수 있는 정교한 솔루션을 제시한다. 특히 복잡한 유전체를 가진 식물에서, 특정 형질 유전자 주변의 반복서열이나 구조 변이를 직접 추출하고 해석할 수 있다는 점은 유전체 기반 육종의 정밀도를 크게 향상시킬 수 있다. 기존의 SNP 중심 분석에서 벗어나, 진정한 원인 변이(causal variant)를 시퀀스 수준에서 규명할 수 있다는 점에서 매우 실용적이고, 향후 타 작물 및 형질로의 확장 가능성도 매우 크다. 다만 시퀀싱 전 처리의 복잡성과 데이터 분석을 위한 생물정보학 기술의 뒷받침이 필수적이므로, 실험실 단위의 도입을 위해서는 적절한 표준화와 매뉴얼화가 필요하다. 그럼에도 불구하고 이 기술은 식물 기능 유전체 연구의 미래를 여는 열쇠로 평가될 수 있다.
자주 묻는 질문 (QnA)
- Q: 이 기술의 주요 특징은 무엇인가요?
A: CRISPR-Cas9으로 원하는 유전자 구간을 절단하고, ONT 기반의 장독립 시퀀싱으로 해당 구간을 정밀 분석하는 방식입니다. - Q: 기존의 short-read 기반 시퀀싱과의 차이점은?
A: 반복서열 및 구조적 변이를 정밀하게 분석할 수 있으며, 하플로타입도 분리 가능하다는 점에서 우월합니다. - Q: 어떤 형질에 활용할 수 있나요?
A: 색깔, 당도, 병 저항성 등 유전자에 기반한 다양한 형질의 원인 변이 분석에 활용 가능합니다. - Q: off-target 발생은 얼마나 되나요?
A: 본 연구에서는 매우 낮았으며, 시퀀싱 깊이가 25×를 초과한 off-target 영역은 전체 중 4개에 불과했습니다. - Q: 필요한 장비나 기술은 무엇인가요?
A: MinION 시퀀서, 고분자량 DNA 추출 기술, CRISPR-Cas9 시스템 및 생물정보학 분석 능력이 필요합니다. - Q: 이 기술의 향후 확장 방향은?
A: 여러 유전자를 동시에 타겟팅하는 multiplex화, 다양한 샘플 분석을 위한 바코딩, 에피유전체 분석 등으로 확장될 수 있습니다.
용어 설명
- CRISPR-Cas9: 원하는 DNA 서열을 표적으로 절단할 수 있는 유전자 가위 시스템
- Long-read sequencing (LRS): 수천~수만 염기 길이의 DNA를 실시간으로 읽을 수 있는 시퀀싱 기술
- Oxford Nanopore Technology (ONT): 장독립 시퀀싱을 지원하는 시퀀싱 플랫폼
- gRNA (guide RNA): Cas9이 특정 DNA 서열을 인식하고 자르도록 안내하는 RNA
- R6 motif: 사과 MYB10 유전자 프로모터 앞에 위치한 반복서열로, 붉은 과육 형질과 관련 있음
- Fine mapping: 특정 형질과 연관된 유전자 좌위를 고해상도로 해석하는 과정
- Haplotype: 부모로부터 물려받은 연속적인 유전자 또는 서열의 조합
- De novo assembly: 기준 유전체 없이 시퀀싱 데이터만으로 새로운 서열을 조립하는 방법
- Base calling: 시퀀싱 데이터로부터 염기 서열을 해석하는 과정
- Off-target: CRISPR 시스템이 의도하지 않은 DNA 구간을 절단하거나 시퀀싱하는 현상
댓글