2019年6月14日,美國羅斯威爾帕克癌癥研究所的劉濤等人在NAR(Nucleic Acids Research,核酸研究)雜志上發(fā)表了針對ATAC-seq開發(fā)的分析工具。
ATAC-seq(Assay for Transposase-Accessible Chromatin with highthroughput sequencing),基于高通量測序的染色質轉座酶可接近性實驗。在核小體連接致密的地方,轉座酶不能進入,而松散的區(qū)域,轉座酶能夠進入并切割下暴露的DNA區(qū)域,并同時連接上特異性的接頭,有接頭的DNA片段被分離出來,用于高通量測序。ATAC-seq已被廣泛用于鑒定基因組中可接近的染色質區(qū)域。 然而,目前的數(shù)據(jù)分析仍然使用最初為ChIP-seq或DNase-seq設計的方法,而沒有考慮含有額外核小體定位信息的轉座酶消化的DNA片段。
因此,作者提出了針對ATAC-seq數(shù)據(jù)的分析工具,HMMRATAC,一種基于半監(jiān)督機器學習方法。?HMMRATAC軟件的主要思想是decomposition and integration(分解和集成),首先將單個ATAC-seq數(shù)據(jù)集分成無核小體(nucleosome-free regions, NFR)和核小體富集信號,用隱馬爾科夫模型(HMM)訓練開放區(qū)域周圍獨特的染色質結構,然后預測整個基因組中的開放區(qū)域。?該方法利用了ATAC-seq數(shù)據(jù)的獨特特征來識別的染色質的結構更準確。
將HMMRATAC軟件應用于已發(fā)布的人類ATAC-seq數(shù)據(jù)集上,發(fā)現(xiàn)其結果優(yōu)于其他流行峰值調用算法。?同時作者還發(fā)現(xiàn),相比于未經片段大小選擇的配對末端數(shù)據(jù),單端測序或片段選擇的ATAC-seq數(shù)據(jù)集會導致靈敏度降低。
結束語
偷偷的告訴你,這篇文章的作者也是當年風靡一時現(xiàn)在還如日中天的MACS軟件的作者呦!而MACS2,MACS14都是當前用于CHIP-seq和ATAC-seq中識別Peak區(qū)域用的最多的軟件。
參考文獻:
Evan D Tarbell,?Tao Liu.?HMMRATAC: a Hidden Markov ModeleR for ATAC-seq.?Nucleic Acids Research, 2019.
Zhang Y, Liu T, Meyer CA, et al. Model-based analysis of ChIP-Seq (MACS).?Genome Biol. 2008;9(9):R137. doi:10.1186/gb-2008-9-9-r137.
【相關閱讀】
前沿|ATAC-SEQ專題-GENOME BIOLOGY & GENOME RESEARCH