| Support NGS multi platform CLC Genomics Workbench는 GUI 기반의 NGS 데이터를 분석하 기 위한 데스크톱 솔루션으로 기존 sanger 방식의 시퀀싱 데이터뿐 만 아니라 Illumina, PacBio, Nanopore, Ion Torrent 등의 장비에서 생산되는 모든 시퀀싱 데이터의 분석을 지원합니다. GFF3/GFF2/GFT/GVF 포맷의 annotation, BED, WIGGLE, VCF, UCSC chromosome band 파일 등을 import 할 수 있으며, txt or csv 포맷 등의 발현 정보 파일이나 annotation 파일도 분석에 사용 할 수 있습니다.
 De novo assembly CLC Genomics Workbench는 NGS 멀티 포맷 데이터의 hybrid assembly를 지원하여 새로운 유전체 서열을 제작하기 위한 de novo assembly 분석을 수행합니다. 높은 퀄리티의 assembly 결 과를 얻기 위한 word size 조절 및 유전체 크기에 제한 없는 분석 을 수행할 수 있으며, mate paired end 시퀀싱 데이터를 이용한 scaffolding 기술을 지원하고 있습니다.

|
| Reference assembly Reference 서열에 시퀀싱 한 데이터를 맵핑함으로써 이후 variation 분석을 진행할 수 있는 기초 데이터를 제공합니다. 모델 organism의 유전체 데이터는 데이터베이스와 연동되어 쉽게 내려받아 분석에 활 용할 수 있습니다.
 Variation detection Assembly에 기초한 SNP 및 small Indel 분석을 수행하며, 기본적으 로 frequency를 이용한 알고리즘, low frequency에 적합한 알고리 즘, germline variant를 분석하기에 적합한 fixed ploidy variant 분 석 알고리즘 등 총 3종류의 variant detector가 탑재되어 확률적으 로 수준 높은 potential variant 들을 찾을 수 있습니다. 또한 시퀀싱 중에 일어난 오류에 기인한 variation 등을 구별하기 위한 여러 가지 파라미터를 설정할 수 있고, 특정 SNP가 단백질 서열까지 변화되는 SNP인지 그 여부도 판단할 수 있습니다.
 그리고 reference assembly에 기반하여 맵핑된 read 들의 통계 분 석을 통해 다양한 structure variation 분석을 수행할 수 있습니다. |
|