新聞中心您現在的位置:首頁(yè) > 新聞中心 > 30篇ENCODE相關(guān)論文摘要
                              30篇ENCODE相關(guān)論文摘要
                              更新時(shí)間:2012-10-12   點(diǎn)擊次數:3057次

                              2012年9月5日,DNA元素百科全書(shū)”計劃(簡(jiǎn)稱(chēng)ENCODE)獲得了迄今zui詳細的人類(lèi)基因組分析數據,其成果以30【Nature(6篇)、Genome Research(18篇)和Genome Biology(6篇)】論文的形式同時(shí)發(fā)表在Nature,Science,Genome Research,Genome Biology雜志等一系列學(xué)術(shù)期刊上,文章作者就達442位,迅速成為各大媒體和生物科學(xué)界熱議的話(huà)題。以下是各篇文章的中文摘要和原文鏈接。

                              1. 轉錄因子的足跡分析

                              對41種不同的細胞和組織類(lèi)型進(jìn)行基因組DNase I足跡分析(genomic DNase I footprinting),研究人員在DNA調節區內鑒定出4500萬(wàn)個(gè)轉錄因子結合事件,從而代表著(zhù)這些轉錄因子與840萬(wàn)個(gè)不同的短DNA序列元件存在差異性地結合。他們還發(fā)現影響等位基因染色質(zhì)狀態(tài)的基因變異體集中分布在這些足跡之中,并且這些序列元件優(yōu)先得到DNA甲基化的保護。他們鑒定出一個(gè)固定不變的50個(gè)堿基對長(cháng)的足跡,并且這種足跡地確定著(zhù)上千個(gè)人啟動(dòng)子內的轉錄起始位點(diǎn)。zui后,他們描述了一個(gè)新的調節因子識別基序集合,其中這些基序在序列和功能上是高度保守的。<<<原文An expansive human regulatory lexicon encoded in transcription factor footprints(10.1038/nature11212)

                              2. 人基因組DNA元件集成百科全書(shū)

                              ENCODE項目系統性地描繪出人基因組上的轉錄區域、轉錄因子結合、染色質(zhì)結構和組蛋白修飾。根據這些數據,研究人員將生化功能分配到80%的人基因組,特別是在已得到很好研究的蛋白編碼序列之外的區域。<<<原文An integrated encyclopedia of DNA elements in the human genome(10.1038/nature11247)

                              3. 人細胞轉錄全景圖

                              RNA是基因組編碼的遺傳信息的直接輸出。細胞的大部分調節功能都集中在RNA的合成、加工和運輸、修飾和翻譯之中。研究人員證實(shí),75%的人基因組能夠發(fā)生轉錄,并且觀(guān)察到幾乎所有當前已標注的RNA和上千個(gè)之前未標注的RNA的表達范圍與水平、定位、加工命運、調節區和修飾??傊?,這些觀(guān)察結果表明人們需要重新定義基因的概念。<<<原文Landscape of transcription in human cells(10.1038/nature11233)

                              4. 人基因組中可訪(fǎng)問(wèn)的染色質(zhì)全景圖

                              DNase I超敏感位點(diǎn)(DNase I hypersensitive sites, DHSs)是調節性DNA序列的標記物。研究人員通過(guò)對125個(gè)不同的細胞和組織類(lèi)型進(jìn)行全基因組譜分析而鑒定出大約290萬(wàn)個(gè)人DHSs,并且大范圍地繪制出人DHSs圖譜。<<<參見(jiàn)原文(10.1038/nature11232)

                              5. 人基因組調控網(wǎng)絡(luò )結構

                              為了確定人轉錄調節網(wǎng)絡(luò )的作用原理,研究人員在450多項基因組實(shí)驗中研究了119個(gè)轉錄相關(guān)因子的結合信息。他們發(fā)現轉錄因子的組合性結合是高度環(huán)境特異性的:轉錄因子的不同組合結合在特異性的基因組位置上。他們對所有的轉錄因子進(jìn)行組裝而產(chǎn)生一個(gè)層次結構,并且將它與其他基因組信息整合在一起而形成一個(gè)嚴密而又龐大的調節性網(wǎng)絡(luò )。<<<參見(jiàn)原文(10.1038/nature11245)

                              6. 基因啟動(dòng)子的遠距離相互作用全景圖

                              在ENCODE項目中,研究人員選擇1%的基因組作為項目試點(diǎn)區域,并且利用染色體構象捕獲碳拷貝(chromosome conformation capture carbon copy, 簡(jiǎn)稱(chēng)為5C)技術(shù)來(lái)綜合性地分析了這個(gè)區域中轉錄起始位點(diǎn)和遠端序列元件之間的相互作用。他們獲得GM12878、K562和HeLa-S3細胞的5C圖譜。在每個(gè)細胞系,他們發(fā)現啟動(dòng)子和遠端序列元件之間存在1000多個(gè)遠距離相互作用。<<<參見(jiàn)原文(10.1038/nature11279)

                              7. 果蠅和人的轉錄因子結合位點(diǎn)變異分析

                              研究人員將ENCODE項目產(chǎn)生的轉錄因子結合圖譜、他們之前發(fā)布的數據以及其他的人和果蠅等基因系中基因組變異數據來(lái)源結合在一起,來(lái)研究轉錄因子結合位點(diǎn)(transcription factor binding sites, TFBSs)的變異性。他們引入一種TFBS變異性的衡量標準和依據不斷出現的每個(gè)人的轉錄因子結合數據來(lái)證實(shí)TFBS突變,尤其是在進(jìn)化保守性位點(diǎn)上發(fā)生的那些突變,能夠被有效地緩解從而確保轉錄因子結合水平保持一致性。<<<參見(jiàn)原文(10.1186/gb-2012-13-9-r49)

                              8. 轉錄因子TCF7L2通過(guò)GATA3結合到基因組上

                              TCF7L2轉錄因子與很多人類(lèi)疾病相關(guān)聯(lián),如II型糖尿病和癌癥。研究人員利用高通量測序技術(shù)ChIP-seq在6個(gè)人細胞系中對TCF7L2進(jìn)行分析。他們鑒定出11.6萬(wàn)個(gè)非冗余性TCF7L2結合位點(diǎn),但是只有1864 個(gè)位點(diǎn)在這6個(gè)細胞系中是相同的。他們還證實(shí)被H3K4me1和H3K27Ac標記的很多基因組區域也被TCF7L2結合。對細胞類(lèi)型特異性的TCF7L2結合位點(diǎn)進(jìn)行生物信息學(xué)分析揭示富集多種轉錄因子,包括在HepG2細胞中富集HNF4alpha和FOXA2基序,而在MCF7細胞中富集GATA3基序。轉錄組測序(RNA-seq)分析提示著(zhù)TCF7L2通過(guò)GATA3結合到基因組上從而抑制轉錄。<<<參見(jiàn)原文(10.1186/gb-2012-13-9-r52)

                              9. 構建定量模型研究染色質(zhì)特征和基因表達水平之間關(guān)系

                              通過(guò)構建出一個(gè)新的研究染色質(zhì)特征和基因表達水平之間關(guān)系的定量模型,研究人員不僅證實(shí)之前在多個(gè)細胞系的研究中發(fā)現的一般性關(guān)系,而且還對它們之間的關(guān)系提出一些新的建議。<<<參見(jiàn)原文(10.1186/gb-2012-13-9-r53)

                              10. GENCODE假基因資源

                              作為GENCODE標注人基因組的一部分,研究人員基于大規模的人工標注和計算機運算來(lái)*次針對蛋白編碼的基因進(jìn)行全基因組假基因分配。他們將假基因標注和廣泛性的ENCODE功能性基因組學(xué)信息整合在一起。特別的是,他們確定了每個(gè)假基因的表達水平、轉錄因子與RNA聚合酶II結合以及與之相關(guān)聯(lián)的染色質(zhì)標記。<<<參見(jiàn)原文(10.1186/gb-2012-13-9-r51)

                              11. 對人啟動(dòng)子的轉錄因子結合位點(diǎn)進(jìn)行功能性分析

                              為了大規模地描述轉錄因子結合位點(diǎn)功能,研究人員預測了人啟動(dòng)子中的455個(gè)結合位點(diǎn),并對它們進(jìn)行突變。在四個(gè)不同的永生化人細胞系中,他們利用瞬時(shí)轉染和熒光素酶報告檢測在這些位點(diǎn)上對主要的轉錄因子CTCF, GABP, GATA2, E2F, STAT和YY1進(jìn)行功能性的測試。在每個(gè)細胞系中,36%到49%的結合位點(diǎn)提高啟動(dòng)子活性,并且在這些細胞系中的任何一個(gè)當中,觀(guān)察到這種提高啟動(dòng)子活性的功能的整體發(fā)生率為70%。<<<參見(jiàn)原文(10.1186/gb-2012-13-9-r50)

                              12. 基于轉錄相關(guān)因子的結合位點(diǎn)對人基因組區域進(jìn)行分類(lèi)

                              研究人員通過(guò)機器學(xué)習方法構建出統計學(xué)模型來(lái)捕獲三種匹配類(lèi)型的區域的基因組特征:活性結合或不活性結合的區域;高程度共同結合區域(high degree of co-binding, HOT)和低程度共同結合區域(low degree of co-binding, LOT);位于基因近端或遠端的調節性組件??傊?,這種區域在染色體位置、染色質(zhì)特征、結合到它們之上的轉錄因子和細胞類(lèi)型特異性上存在復雜的差異。<<<參見(jiàn)原文(10.1186/gb-2012-13-9-r48)

                              13. 利用RegulomeDB標注個(gè)人基因組中的功能性變異

                              研究人員開(kāi)發(fā)出一種新的方法和數據庫,即調節物組數據庫(RegulomeDB),從而能夠指導人們理解人基因組中調節性序列上發(fā)生的變異。調節物組數據庫包括來(lái)自ENCODE和其他來(lái)源的高通量的實(shí)驗數據,以及利用計算預測和人工標注來(lái)鑒定出潛在的調節性序列變異體。<<<參見(jiàn)原文(10.1101/gr.137323.112)

                              14. 制定ChIP-seq工作標準和指導準則

                              根據研究人員進(jìn)行ChIP-seq實(shí)驗的經(jīng)歷,ENCODE和modENCODE(model organism ENCODE, 模式生物ENCODE)為經(jīng)常更新的ChIP-seq實(shí)驗制定出一套工作標準和指導準則。<<<參見(jiàn)原文(10.1101/gr.136184.111)

                              15. 利用RT-PCR-seq和RNA-seq統計所有人基因組編碼的基因元件

                              在ENCODE項目中,GENCODE旨在通過(guò)人工管理和計算方法來(lái)準確地標注人基因組中所有編碼蛋白的基因、假基因和非編碼性的轉錄座位。利用一種被稱(chēng)作RT-PCR-seq(即先進(jìn)行RT-PCR擴增,然后進(jìn)行高通量多重測序)的方法可以來(lái)預測外顯子連接(exon–exon junction)。研究人員驗證了73%的預測結果,從而證實(shí)了1168個(gè)新的基因,其中大多數是非編碼性的。<<<參見(jiàn)原文(10.1101/gr.134478.111)

                              16. 細胞內RNA深度測序證實(shí)大多數RNA進(jìn)行共轉錄剪接

                              研究人員分析了K562細胞系中通過(guò)RNA-seq測序而獲得的細胞內RNA組分。他們發(fā)現在人基因組中,RNA剪接主要是在轉錄期間完成的。通過(guò)引入coSI 測量方法,他們證實(shí)在細胞質(zhì)polyA+ RNA中,剪接幾乎*完成。因此,大多數RNA在被轉錄的同時(shí)進(jìn)行剪接,即共轉錄剪接。<<<參見(jiàn)原文(10.1101/gr.134445.111)

                              17. 發(fā)現上百個(gè)小鼠和人剪接來(lái)源的miRNA

                              非典型的miRNA模板并不適合經(jīng)常用來(lái)標注典型miRNA的策略。通過(guò)對737個(gè)小鼠和人類(lèi)小RNA數據集進(jìn)行大規模分析,研究人員采取嚴格且保守性的策略對237個(gè)小鼠剪接來(lái)源miRNA(splicing-derived miRNAs, mirtrons)和240個(gè)人mirtrons進(jìn)行標注。在哺乳動(dòng)物中,這些mirtrons可以分為三類(lèi):常規性的mirtrons、5'加尾mirtrons和3'加尾mirtrons。<<<參見(jiàn)原文(10.1101/gr.133553.111)

                              18. GENCODE:ENCODE項目的人基因組參照標注

                              GENCODE項目旨在利用計算分析、人工標注和實(shí)驗驗證來(lái)鑒定出人基因組中所有的基因特征。GENCODE第七版(GENCODE v7)公開(kāi)發(fā)布了基因組標注數據集,包含了20687個(gè)蛋白編碼的RNA基因座位、9640個(gè)長(cháng)鏈非編碼RNA基因座位,并且擁有33977個(gè)在UCSC基因數據庫和RefSeq數據庫中不存在的編碼性轉錄本。它還對公開(kāi)獲得的長(cháng)鏈非編碼RNA(long noncoding RNA, lncRNA)進(jìn)行zui全面的標注。<<<參見(jiàn)原文(10.1101/gr.135350.111)

                              19. 發(fā)現人基因組中疾病相關(guān)的功能性SNP

                              研究人員系統性地研究了多種類(lèi)型的ENCODE數據與疾病相關(guān)基因SNP(single nucleotide polymorphism, 即單核苷酸多態(tài)性)之間的關(guān)聯(lián)性,并且發(fā)現在當前鑒定出的疾病關(guān)聯(lián)當中,存在功能性SNP的顯著(zhù)性富集。<<<參見(jiàn)原文(10.1101/gr.136127.111)

                              20. 在兩種人細胞系中,lncRNA很少表達

                              ENCODE項目發(fā)現被鑒定為lncRNA的9640多個(gè)人基因組位點(diǎn)中,迄今為止只有大約100個(gè)得到深入的研究以便確定它們在細胞中的作用。通過(guò)共同分析ENCODE項目zui近產(chǎn)生的兩個(gè)數據集:將表達的肽鏈映射到它們的編碼性基因組位點(diǎn)的串聯(lián)質(zhì)譜數據;ENCODE在細胞系K562和GM12878中對長(cháng)polyA+和polyA-組分進(jìn)行RNA-seq測序產(chǎn)生的數據,研究人員利用機器學(xué)習方法RuleFit3將肽鏈數據與RNA表達數據對應起來(lái)。他們發(fā)現大約92%的GENCODE v7發(fā)布的lncRNA在這兩種細胞系中并不表達。除極少例外,核糖體能夠區分編碼性RNA轉錄本和非編碼性RNA轉錄本,因而在lncRNA組(lncRNAome)中,異位表達和隱性mRNA都是罕見(jiàn)的。<<<參見(jiàn)原文(10.1101/gr.134767.111)

                              21. 關(guān)于個(gè)人和群體的基因組調節性序列變異的基因組學(xué)

                              為了更好地界定人基因組調節性序列變異的模式,研究人員選擇了來(lái)自不同地理位置的53個(gè)人的全基因組序列,將他們的138個(gè)細胞和組織類(lèi)型的DNase I超敏感位點(diǎn)(DNase I hypersensitive sites, DHSs)標記的全基因組調節性DNA序列圖譜結合起來(lái)。研究人員估計相比于蛋白編碼的DNA序列,每個(gè)人可能擁有很多更加具有功能重要性的調節性DNA序列變異體,盡管平均而言,它們可能產(chǎn)生更加小的影響。<<<參見(jiàn)原文(10.1101/gr.134890.111)

                              22. 利用開(kāi)放構象染色質(zhì)區域來(lái)預測細胞類(lèi)型特異性的基因表達

                              研究人員利用來(lái)自19項不同的人細胞類(lèi)型的DNase-seq數據來(lái)鑒定全基因組范圍的近端和遠端調節性序列元件。通過(guò)匹配表達數據,他們將基因分為三類(lèi):細胞特異性的上調表達的基因、細胞特異性的下調表達的基因和組成性表達的基因??傊?,他們成功地利用開(kāi)放構象染色質(zhì)的信息來(lái)解決利用調節性序列直接預測哺乳動(dòng)物細胞特異性表達時(shí)存在的問(wèn)題。<<<參見(jiàn)原文(10.1101/gr.135129.111)

                              23. 探究ENCODE人RNA-seq數據中的RNA編輯

                              研究人員分析了來(lái)自ENCODE項目對14個(gè)人細胞系開(kāi)展研究所獲得的長(cháng)串RNA-seq數據(這些數據經(jīng)過(guò)PolyA選擇,沒(méi)有形成雙鏈,且經(jīng)過(guò)深度測序)以便鑒定出潛在的RNA編輯事件。他們發(fā)現RNA編輯和特異性的基因之間存在較強的關(guān)聯(lián)。<<<參見(jiàn)原文(10.1101/gr.134957.111)

                              24. 細胞類(lèi)型特異性的轉錄因子結合的序列和染色質(zhì)決定簇

                              為了研究DNA序列信號、組蛋白修飾和DNase對細胞類(lèi)型特異性的結合位點(diǎn)的可訪(fǎng)問(wèn)性所發(fā)揮的作用,研究人員分析了ENCODE項目所開(kāi)展的286項ChIP-seq實(shí)驗。與之前的研究相一致的是,他們發(fā)現DNase可訪(fǎng)問(wèn)性能夠解釋很多轉錄因子的細胞類(lèi)型特異性結合。不過(guò)根據他們建立的模型,他們還發(fā)現10個(gè)轉錄因子擁有顯著(zhù)性的細胞類(lèi)型特異性的結合模式,4個(gè)轉錄因子表現出顯著(zhù)不同的細胞類(lèi)型特異性的DNA序列偏好性。<<<參見(jiàn)原文(10.1101/gr.127712.111)

                              25. 119個(gè)人轉錄因子結合的基因組區域附近的序列特征和染色質(zhì)結構

                              通過(guò)對ENCODE項目在研究119個(gè)人轉錄因子時(shí)所獲得的大約457個(gè)ChIP-seq數據集進(jìn)行整合分析,研究人員在大多數數據集中鑒定出高度富集的序列基序,揭示出新的基序和驗證已知的基序。<<<參見(jiàn)原文(10.1101/gr.139105.112)

                              26. 分析人lncRNA的基因結構、進(jìn)化和表達

                              研究人員分析了迄今為止zui為完整的由GENCODE項目產(chǎn)生的人lncRNA標注:人工標注了產(chǎn)生14990個(gè)RNA轉錄本的9277個(gè)基因。他們的分析結果表明lncRNA是通過(guò)類(lèi)似于蛋白編碼基因的轉錄途徑而被產(chǎn)生的。而且通過(guò)在多種人器官和大腦區域所開(kāi)展的lncRNA綜合性表達分析,他們發(fā)現相對于蛋白編碼的基因,lncRNA通常較低地表達。<<<參見(jiàn)原文(10.1101/gr.132159.111)

                              27. 染色質(zhì)信號存在廣泛的異質(zhì)性

                              在許多種細胞系中,研究人員將14個(gè)染色質(zhì)信號(12個(gè)染色質(zhì)標記、DNase和核小體定位)與119個(gè)DNA結合蛋白的結合位點(diǎn)相關(guān)聯(lián)在一起。他們開(kāi)發(fā)出一種被稱(chēng)作CAGT(Clustered AGgregation Tool)的方法來(lái)解釋染色質(zhì)標記在信號強度、形狀和隱性鏈定位上的異質(zhì)性。<<<參見(jiàn)原文(10.1101/gr.136366.111)

                              28. 對轉錄因子結合數據進(jìn)行整合分析來(lái)理解轉錄調節

                              利用對ENCODE項目產(chǎn)生的大量數據進(jìn)行統計學(xué)模型分析來(lái)研究轉錄因子的轉錄調節。研究結果揭示不同技術(shù)和RNA抽提實(shí)驗程序所捕獲的轉錄起始位點(diǎn)在表達水平的預測準確度上存在顯著(zhù)性的差異。<<<參見(jiàn)原文(10.1101/gr.136838.111)

                              29. CTCF結合的廣泛可變性與DNA甲基化相關(guān)聯(lián)

                              CTCF是一個(gè)廣泛表達的調節因子。研究人員通過(guò)研究19項不同人細胞類(lèi)型的ChIP-seq數據來(lái)分析CTCF的全基因組結合模式。他們觀(guān)察到高度重復性的但同時(shí)可變性非常大的基因組結合全景圖,表明著(zhù)CTCF結合受到高度細胞選擇性的調節。<<<參見(jiàn)原文(10.1101/gr.136101.111)

                              30. 細胞HepG2中高度整合的轉錄因子PPARGC1A結合網(wǎng)絡(luò )

                              PPARGC1A是一個(gè)轉錄共激活因子。它結合并共同激活多種轉錄因子來(lái)調節大多數基因的表達。在這項研究中,研究人員在經(jīng)過(guò)毛喉素(forskolin)處理的HepG2細胞中描述了一種核心的PPARGC1A轉錄調節網(wǎng)絡(luò )。他們利用ChIP-seq描繪了PPARGC1A的全基因組結合位點(diǎn),并且揭示出過(guò)多表達的對應于已知和新的PPARGC1A網(wǎng)絡(luò )成員的DNA序列基序。他們然后利用ChIP-seq構建出6個(gè)位點(diǎn)特異性的轉錄因子結合伴侶的基因表達譜。重要的是,他們發(fā)現不同的轉錄因子組合結合到一套不同的功能性基因上,從而有助于揭示代謝性過(guò)程和其他細胞過(guò)程的組合性調節

                              上海通蔚生物科技有限公司

                              上海通蔚生物科技有限公司

                              地址:上海市金山區楓涇鎮環(huán)東一路65弄2號3463室

                              主營(yíng)產(chǎn)品:ELISA檢測試劑盒,ELISA試劑盒,酶聯(lián)免疫試劑盒,人ELISA試劑盒,大鼠ELISA試劑盒,小鼠ELISA試劑盒,豚鼠ELISA試劑盒,兔ELISA試劑盒,羊ELISA試劑盒,牛ELISA試劑盒,雞ELISA試劑盒,鴨ELISA試劑盒

                              ©2019 版權所有:上海通蔚生物科技有限公司  備案號:滬ICP備14033764號-3  總訪(fǎng)問(wèn)量:991632  站點(diǎn)地圖  技術(shù)支持:環(huán)保在線(xiàn)  管理登陸

                              攻调教受扩张尿孔折磨失禁文,小婷的性放荡日记H,色88久久久久高潮综合影院,中文字幕亚洲欧美日韩在线不卡