sequencing은 염기서열을 읽어낸다고 이해하면 된다.
Whole Genome sequencing
DNA의 염기서열을 모두 읽는 방법.
시퀀싱 Depth(깊이)는 낮지만 DNA의 모든 영역의 SNP(single Nucleotide Polymorphism), CNV(Copy number variant)등을 확인할 수 있다.
장점, non-coding 영역의 variant를 찾아낼 수 있고,
단점, sequencing 비용이 비싸고, 결과 파일 크기가 커서 보관, 분석 비용이 크다.
Whole exome sequencing
단백질을 코딩하고 있는부위를 엑손(Exone)이라고 하는데 엑손들의 집합을 엑솜(Exome)이라고 한다.
이 엑솜 부분은 인간 전체 genome에 2%에 해당한다. 이 부분만을 시퀀싱 하는것이 WES이다.
WGS보다 훨씬 적은 양을 시퀀싱 하기에 데이터 크기도 작아 mutation이 있는 gene을 찾는 목적으로 적합하다.
장점, 데이터가 WGS보다 작음, 높은 depth를 얻을수 있어 통계적으로 유의함.
단점, 단백질을 코딩하고 있지 않는 부위(non-coding)는 시퀀싱하지 않기때문에 intergenic, intron의 variant는 검출이 어렵다.
Target sequencing
특정 유전자를 중심으로 한 시퀀싱 기법이다. 목적에 맞는 특정 유전자들로 패널을 만들어 시퀀싱한다.
다양한 유기체를 대상으로 할 수 있기 때문에 인구유전학에 유용하다.
TAS(target amplicon sequencing) 접근방식은 생거 시퀀싱에 수반되는 비용의 일부만으로 대량의 데이터를 생성하기 위한 생물정보학 기법을 통합한다. TAS는 차세대 염기서열화 플랫폼에 이어 PCR을 통해 필요한 유전자 영역을 증폭시킬 수 있어 DNA 연구에도 유용하다. 차세대 염기서열 분석은 복수의 시료를 보다 신속하게 배열할 수 있도록 50~400 base pair를 더 짧은 판독치를 사용한다. TAS는 쉽게 확장 가능하고 신뢰성과 속도를 모두 제공하는 저렴한 시퀀싱 접근방식을 허용한다.
장점, 높은 depth를 얻을수 있음, 가격이 가장 저렴함, 원하는 유전자들만 볼수있음, 데이터가 작음
단점, 타겟팅을 하는 목적에만 사용할수있음 novel한 발견은 어려움.
출처
Cortini F, Marinelli B, Pesatori AC, Seia M, Seresini A, Giannone V, et al. Clinical Application of NGS Tools in the Diagnosis of Collagenopathies. Explor Res Hypothesis Med. 2017;2(3):57. doi: 10.14218/ERHM.2017.00010.
'BI' 카테고리의 다른 글
NGS 분석 기초 1 - 데이터형식 (FASTA, FASTQ, BAM, VCF) (2) | 2020.10.28 |
---|---|
바이오 빅데이터 정리2 ( dbSNP, geo, dbnsfp, GIAB등..) (0) | 2020.10.28 |
바이오 빅데이터 정리 ( 1000genome, TCGA, COSMIC, CCLE 등..) (0) | 2020.10.27 |
Variants allele frequency (VAF) 와 minor allele frequency(MAF)의 차이 (0) | 2020.06.25 |
Somatic variants calling VS Germline variants calling 비교 (0) | 2020.06.25 |