什么是miRNA
MicroRNAs (miRNAs)是一種大小約21—23個堿基的單鏈小分子RNA,是由具有發(fā)夾結(jié)構(gòu)的約70-90個堿基大小的單鏈RNA前體經(jīng)過Dicer酶加工后生成,不同于siRNA(雙鏈)但是和siRNA密切相關(guān)。據(jù)推測,這些非編碼小分子RNA(miRNAs)參與調(diào)控基因表達(dá),但其機制區(qū)別于siRNA介導(dǎo)的mRNA降解。*個被確認(rèn)的miRNA是在線蟲中發(fā)現(xiàn)的lin-4 和let-7,隨后多個研究小組在包括人類、果蠅、植物等多種生物物種中鑒別出數(shù)百個miRNAs。
miRNA 的特征
已經(jīng)被鑒定的miRNAs據(jù)推測大都是由具有發(fā)夾結(jié)構(gòu)、約70個堿基大小形成發(fā)夾結(jié)構(gòu)的單鏈RNA前體經(jīng)過Dicer酶加工后生成的,有5’端磷酸基和3’羥基,大小約21—25nt的小分子RNA片斷,定位于RNA前體的3’端或者5’端。
zui近3個研究小組分別從線蟲、果蠅和Hela細(xì)胞中鑒定的100個新miRNAs中,有15%跨越線蟲、果蠅和哺乳動物基因組具有高度的保守性(只有有1—2個堿基的區(qū)別),Lau 和Bar 實驗室的同事更加認(rèn)為:所有的miRNAs可能在其他物種中具有直向同源物(Ortholog,指那些起源于同一祖先,在不同生物體中行使同一功能的基因群就可比作為一個門類,這些類似的基因被稱為“直向同源物”)。
Bantam zui早被認(rèn)為是果蠅中參與細(xì)胞增殖的一個基因位點。已知幾個包含增強子的轉(zhuǎn)座子插入跨越這個位點的一段12.3kb區(qū)域會導(dǎo)致果蠅的眼和翅重復(fù)生長,而由轉(zhuǎn)座子介導(dǎo)的一段跨越該位點的23kb片斷缺失則導(dǎo)致突變果蠅個體小于野生型果蠅。Cohen和同事用一段3.85kb的片斷導(dǎo)入21kb片斷缺失的果蠅中使其恢復(fù)原來的大小。但是奇怪的是表達(dá)這個3.85kb片斷中的EST卻沒有同樣的效果。Cohen將這個片斷和瘧蚊Anopheles gambiae的同源序列進(jìn)行比較,發(fā)現(xiàn)一段90bp的高度保守區(qū),經(jīng)過RNA folding program (mfold)發(fā)現(xiàn)這個保守序列可以形成發(fā)夾結(jié)構(gòu),使得這個區(qū)段很象是一個miRNA的前體。這個結(jié)果經(jīng)過Northern blot證實突變果蠅的幼體缺少一個21bp的bantam miRNA ,用這個90bp的mRNA前體經(jīng)過一系列的“功能缺失”—“功能恢復(fù)”實驗,證實 bantam miRNA在細(xì)胞增殖中的作用。研究人員用計算機程序檢索在hid mRNA的3’非編碼區(qū)找到了bantam的3個潛在的結(jié)合位點( hid是果蠅中一個誘導(dǎo)凋亡的基因),并證實 bantam miRNA抑制hid 的翻譯而非轉(zhuǎn)錄。
miRNAs的表達(dá)方式各不相同。部分線蟲和果蠅的miRNA在各個發(fā)育階段的全部細(xì)胞中都有表達(dá),而其他的miRNA則依據(jù)某種更為嚴(yán)謹(jǐn)?shù)奈幌嗪蜁r相的表達(dá)模式(a more restricted spatial and temporal expression pattern)——在不同組織、不同發(fā)育階段中miRNA的水平有顯著差異。
miRNA的功能
對microRNAs (miRNAs)的研究正在不斷增加,原因是科學(xué)家開始認(rèn)識到這些普遍存在的小分子在真核基因表達(dá)調(diào)控中有著廣泛的作用。在線蟲,果蠅,小鼠和人等物種中已經(jīng)發(fā)現(xiàn)的數(shù)百個miRNAs中的多數(shù)具有和其他參與調(diào)控基因表達(dá)的分子一樣的特征——在不同組織、不同發(fā)育階段中miRNA的水平有顯著差異,這種miRNAs表達(dá)模式具有分化的位相性和時序性( differential spatial and temporal expression patterns),提示miRNAs有可能作為參與調(diào)控基因表達(dá)的分子,因而具有重要意義。
*個被確認(rèn)的miRNA——在線蟲中發(fā)現(xiàn)的lin-4 和let-7,可以通過部分互補結(jié)合到目的mRNA靶的3’非編碼區(qū)(3’UTRs),以一種未知方式誘發(fā)蛋白質(zhì)翻譯抑制,進(jìn)而抑制蛋白質(zhì)合成,通過調(diào)控一組關(guān)鍵mRNAs的翻譯從而調(diào)控線蟲發(fā)育進(jìn)程(reviewed in Pasquinelli 2002)。
bantam miRNA是*個被發(fā)現(xiàn)有原癌基因作用的miRNA。除了lin-4、let-7,已知還有一些miRNAs可能參與在細(xì)胞分化和組織發(fā)育過程中起重要作用的基因的轉(zhuǎn)錄后調(diào)控,例如mir-14、mir-23 等。
在植物miRNAs的研究中有兩條線索提示miRNAs可能參與植物的發(fā)育過程。一是在carpel factory (car) 突變株中3個miRNAs的表達(dá)水平顯著下降。CARPEL FACTORY 是一個類似Dicer的酶,參與植物的發(fā)育,其缺失突變株表現(xiàn)為胚胎和葉片發(fā)育的缺陷。實驗結(jié)果提示這種缺陷是由于缺少miRNAs加工而造成的。多數(shù)的植物miRNAs在某些特定組織中高水平表達(dá)也提示他們可能參與了植物組織的發(fā)育。
對一部分miRNAs的研究分析提示:miRNAs參與生命過程中一系列的重要進(jìn)程,包括早期發(fā)育(Reinhart 2000),細(xì)胞增殖,細(xì)胞凋亡,細(xì)胞死亡(Brennecke 2003),脂肪代謝(Xu 2003)和細(xì)胞分化(Kawasaki 2003)。此外,一個研究表明,2個miRNAs水平的下降和慢性淋巴細(xì)胞白血病之間的顯著相關(guān),提示miRNAs和癌癥之間可能有潛在的關(guān)系(Calin 2002)。
由于miRNAs存在的廣泛性和多樣性,提示miRNAs可能有非常廣泛多樣的生物功能。盡管對miRNA的研究還處于初級階段,據(jù)推測miRNAs在真核生物體內(nèi)對基因表達(dá)的調(diào)控作用可能和轉(zhuǎn)錄因子一樣重要。有一種看法是:miRNAs可能代表在一個新發(fā)現(xiàn)的層次上的基因表達(dá)調(diào)控方式。
然而,大多數(shù)miRNAs的功能仍然是個謎。
miRNA的作用方式
zui早被發(fā)現(xiàn)的兩個miRNAs——lin-4 and let-7被認(rèn)為是通過不*互補結(jié)合到目標(biāo)靶mRNA 3’非編碼區(qū)端,以一種未知方式誘發(fā)蛋白質(zhì)翻譯抑制,進(jìn)而抑制蛋白質(zhì)合成,阻斷mRNA的翻譯。多個果蠅miRNAs也被發(fā)現(xiàn)和他們的目標(biāo)靶mRNAs的3’非編碼區(qū)有部分同源。由于miRNAs和其潛在的目標(biāo)靶之間并非*互補,這使得通過信息學(xué)的方法鑒定miRNA的目標(biāo)靶位點變得困難。因而也無法確定miRNAs的作用方式是什么,以何種機制影響mRNA的翻譯,以何種方式調(diào)控基因表達(dá)。miRNAs的作用目標(biāo)靶和活性機制一直是各地的研究人員的關(guān)注熱點。
在植物中目前有一個miRNA和3個潛在的目標(biāo)靶基因*互補(這些scarecrow 基因編碼潛在的轉(zhuǎn)錄因子),盡管目前還不清楚這些基因是否就是miRNA的目標(biāo)靶,這仍是*次發(fā)現(xiàn)miRNA 和其潛在的目標(biāo)靶*互補,也提示miRNA可能包含和siRNA類似的作用方式。
識別 miRNAs的方法
多個研究小組采用生物化學(xué)結(jié)合是
生物信息學(xué)的方法開展對
miRNAs的研究工作。由于據(jù)推測都是由
Dicer酶降解
RNA得到的,
21—23個堿基大小、有
5’端磷酸基和
3’羥基的
RNA片斷,有的實驗室采用改良的定向克隆方法來篩選具有相同特征的小分子
——篩選一定大小的
RNA分子,連接到
3’和
5’的適配子(
adapters),逆轉(zhuǎn)錄并通過
PCR擴增、亞克隆并測序。
miRNA前體在基因組上的定位和聚類是通過向基因組數(shù)據(jù)庫查詢進(jìn)行。這個方法有助于判斷
miRNAs是否是
mRNAs、
tRNAs、
rRNAs等分子的降解產(chǎn)物。
有的實驗室通過一種RNA folding program ’mfold’ 來判斷C. elegans 和C. briggsae 之間的高度保守區(qū)域是否含有潛在的miRNA前體,然后用Northern Blots的方法來確定這些miRNAs是否真的表達(dá)了。
盡管有數(shù)百個
miRNAs通過生化或者是
生物信息學(xué)的方法被鑒別出來,已經(jīng)鑒別出來的
miRNAs只不過是滄海一粟,由于很多已經(jīng)鑒別出來的
miRNAs是從單個克隆中鑒別出來的,所以可以假設(shè)還有很多
miRNAs在分離和鑒定過程中被
“漏掉
”了,測序工作還遠(yuǎn)遠(yuǎn)不夠。
1) miRNA的計算機RNA組學(xué)方法
生物信息學(xué)方法是依據(jù)在不同的物種中,其成熟的miRNA 具有較大的序列同源性以及前體的莖環(huán)結(jié)構(gòu)具有相當(dāng)大的保守性這一特征在基因組數(shù)據(jù)庫中搜索新的miRNA 基因。該方法根據(jù)比較基因組學(xué)原理并結(jié)合生物信息軟件在已測序基因組中進(jìn)行搜索比對,根據(jù)同源性的高低再進(jìn)行RNA二級結(jié)構(gòu)預(yù)測,將符合條件的候選miRNA與已經(jīng)通過實驗鑒定的miRNA分子進(jìn)行比較分析,zui終確定該物種miRNA的分布及數(shù)量。近年來隨著miRNA預(yù)測方法的不斷發(fā)展,人們發(fā)現(xiàn)的miRNA數(shù)量呈幾何級數(shù)增長。這些預(yù)測方法從簡單的序列比對搜索發(fā)展到現(xiàn)在的機器學(xué)習(xí)算法,程序設(shè)計越來越智能化,復(fù)雜化。
隨著人miRNA基因轉(zhuǎn)錄出的pri-miRNA迅速加工成具有莖環(huán)結(jié)構(gòu)的pre-miRNA,隨后被切割成miRNA:miRNA*雙體,并被選擇性地組合進(jìn)核糖核酸沉默誘導(dǎo)復(fù)合體(RISC)并進(jìn)行靶基因識別。在相似的物種中,miRNA是很保守的;但在相距較遠(yuǎn)的物種間,miRNA又有一定的分歧,尤其體現(xiàn)在pre-miRNA上。這些miRNA功能作用機制的闡明為預(yù)測軟件的研發(fā)提供了理論依據(jù),但仍需要不斷修補和完善。近年來,幾個基于這些規(guī)則的miRNA預(yù)測程序先后被開發(fā)(表1.1),并被廣泛使用。
程序名 | 發(fā)布于 | 預(yù)測目標(biāo) | 適用方式 | 算法 | 輸入序列格式 | 適用長度 | 涉及的程序 | 適用于 |
miRscan | 2003 | Pre-miRNA | Web | N | 兩物種比對序列 | <100bp | Blast | 線蟲 |
miRseeker | 2003 | Pre-miRNA | Local | N | — | — | Mfold、AVID、Blast | 果蠅 |
ERPIN | 2001 | Pre-miRNA | Local/Web | — | Fasta序列、Fasta文件 | — | Blast | 動植物 |
Srnaloop | 2003 | Pre-miRNA | Local | N | Fasta序列 | — | RepeatMasker、Blast、RNAfold | 線蟲 |
MIRFINDER | 2004 | Pre-miRNA | Local | SVM | 兩物種比對序列 | — | RNAfold、RepeatMasker、PatScan、RNAVIZ | 植物 |
PalGrade | 2005 | Pre-miRNA | Local | SVM | 基因組序列 | — | RNAfold | 人 |
MiRAlign | 2005 | Pre-miRNA | Web | N | Fasta序列 | 50-300bp | RNAfold、ClustalW、RNAforester | 動植物 |
microHARVESTER | 2005 | Pre-miRNA & miRNA | Web | N | pre-miRNA、miRNA | <450bp | RNAfold、Blast、T-Coffee | 植物 |
findMiRNA | 2005 | Pre-miRNA & miRNA | Local | N | Fasta序列 | — | RNAfold、Blast、mfold | 擬南芥 |
miR-abela | 2005 | Pre-miRNA | Web | SVM | Fasta序列、Fasta文件 | <1000bp | RNAfold、SVMlight | 動物 |
BayesMiRNAfind | 2006 | Pre-miRNA & miRNA | Web | NBS | Fasta序列 | <500Kbp | Mfold、BLAT | 動物 |
ProMiRⅡ | 2006 | Pre-miRNA & miRNA | Local/Web | HMM | 序列(只包含A、G和C,T或U) | 70-150bp | RNAfold、Blast、pipeline vist、HMmiRNApairwise | 動物 |
Vmir | 2006 | Pre-miRNA | Local | — | 基因組序列 | <2Mbp | RNAfold、mFold | 病毒 |
RNAz+RNAmicro | 2006 | Pre-miRNA | Local | SVM | 多物種比對序列 | <400bp | RNAz、libSVM | 動物 |
Microprocessor SVM | 2006 | Drosha剪切位點 | Local/Web | SVM | Fasta序列 | <180bp | RNAfold、ScorePin、 Gist SVM | 動物 |
2) miRNA的靶基因預(yù)測方法
miRNA的研究意義之重大是毋庸置疑的。然而,與新的miRNA的頻頻發(fā)現(xiàn)相比,miRNA的功能研究相對緩慢。到目前為止,在發(fā)現(xiàn)的4449多個miRNA中,確定功能的miRNA僅有幾十個。導(dǎo)致miRNA功能研究進(jìn)展緩慢的非常重要的原因是miRNA的作用靶標(biāo)難以確定。事實上,通過實驗方法確定miRNA的作用靶標(biāo)非常耗時,目前尚無高通量的靶標(biāo)鑒定方法。因此,通過理論方法預(yù)測miRNA的作用靶標(biāo)成為當(dāng)前識別miRNA作用靶標(biāo)的較為理想的途徑。以下重點介紹幾種經(jīng)典預(yù)測軟件的算法分析,其他軟件(表1.2)請查看相應(yīng)
表1.2 miRNA靶序列預(yù)測程序及查詢數(shù)據(jù)庫 Table1.2 miRNA target prediction programs and related databases |
靶序列預(yù)測程序 | 適用物種 | 相關(guān) |
EMBL miRtarget prediction | 果蠅 | http://www.russell.embl-heidelberg.de/miRNAs |
miRanda | 果蠅,脊椎動物 | http://microrna.org/miranda.html |
PicTar | 脊椎動物,果蠅 | http://pictar.bio.nyu.edu |
TargetScan,TargetScanS | 脊椎動物 | http://genes.mit.edu/targetscan |
RNA hybrid | 果蠅 | http://www.techfak.uni-bielefeld.de/persons/marc/mirna/targets |
ViTa | 病毒 | http://vita.mbc.nctu.edu.tv |
miTargert | 動物 | http://cbit.snu.ac.kr/~miTarget |
MovingTarget | 果蠅 | —— |
MiRTif | 動物 | http://mirtif.bii.a-star.edu.sg |
miRacle | 動物 | http://miracle.igib.res.in/miracle |
PatScan | 植物 | Rhoades et al. (2002) |
microTar | 動物 | http://tiger.dbs.nus.edu.sg/microTar |
EIMMo | 人,果蠅,線蟲,斑馬魚 | http://www.mirz.unibas.ch/ElMMo |
miRU | 植物 | http://bioinfo3.noble.org/miRNA/miRU.html |
DIANA-MicroT | 人,鼠 | http://diana.pcbi.upenn.edu/DIANA-microT |
RNA22 | 動物 | http://cbcsrv.watson.ibm.com/rna22.html |
MicroInspector | 動植物、病毒 | http://mirna.imbb.forth.gr/microinspector |
試驗驗證靶序列數(shù)據(jù)庫 | | |
mirBase | | http://www.microrna.sanger.ac.uk/targets/v2 |
TarBase | | http://www.diana.pcbi.upenn.edu/tarbase.html |
Argonaute | | http://www.rna.uni-heidelberg.de/apps/zmf/argonaute/interface |
miRNAMAP | | http://mirnamap.mbc.nctu.edu.tw |
miRGen | | http://www.diana.pcbi.upenn.edu/cgi-bin/miRGen/v3/Targets.cgi |
miRNA和siRNA的關(guān)系
miRNA和siRNA之間的關(guān)系令人迷惑。從表面上說,一個是非編碼的單鏈小分子RNA,在進(jìn)化上高度保守,通過翻譯抑制調(diào)控基因表達(dá)而不影響轉(zhuǎn)錄本的穩(wěn)定性;另一個是針對編碼區(qū)的雙鏈小分子RNA,每個轉(zhuǎn)錄本都可能有很多個siRNAs,是通過降解目標(biāo)靶,在轉(zhuǎn)錄后調(diào)控基因表達(dá)。由于每個mRNA模版可能產(chǎn)生很多個siRNAs,要給每個siRNA定一個基因的名字就很困難。miRNA是進(jìn)化進(jìn)程中高度保守的,因此給直向同源物一個同樣的名字可能有助于了解他們的功能,而給另一個物種中一段無關(guān)的序列一個同樣的名字就容易造成混亂。
然而,據(jù)推測miRNAs通常是由較大的(7090 nt)的莖環(huán)結(jié)構(gòu)(發(fā)夾結(jié)構(gòu))前體經(jīng)Dicer酶切割得到的,而Dicer同樣負(fù)責(zé)將長雙鏈RNA切割為siRNA,而且二者的長度也差不多,同樣有調(diào)控基因表達(dá)功能。因而這兩類小分子RNA之間的關(guān)系格外令人關(guān)注。
兩個廣為人知的miRNA——在線蟲中發(fā)現(xiàn)的lin-4 和let-7,可以通過部分互補結(jié)合到目的mRNA靶的3’非編碼區(qū)(3’UTRs),通過一種未知方式誘發(fā)蛋白質(zhì)翻譯抑制從而抑制蛋白質(zhì)合成。這種結(jié)合并不誘導(dǎo)mRNA靶的降解,就是說作為翻譯抑制子本身不影響對應(yīng)mRNA的豐度,其原因據(jù)推測是由于miRNA和結(jié)合位點之間不*互補。這就區(qū)別于siRNA的介導(dǎo)的mRNA的降解。但是其他一些miRNAs可能以類似siRNA的方式介導(dǎo)目的RNA的降解。實驗表明引入和let-7目的mRNA靶*互補的miRNA會誘導(dǎo)mRNA靶的降解。還有實驗結(jié)果表明一些miRNA,包括在植物中發(fā)現(xiàn)的Scarecrow miRNA,能結(jié)合*互補的mRNA鏈從而降解mRNA序列,抑制蛋白合成。這提示miRNAs可以和siRNAs一樣作用,這兩種小分子RNA作用通路可能有重疊的部分。這種重疊同樣提示siRNAs可能也有和miRNAs同樣的功能。
一個很有趣的實驗證實這個觀點:Doench和同事挑選一個已知在體內(nèi)可以有效使CXCR4基因沉默的siRNA,然后在熒光素酶報告基因的3’端插入對應(yīng)的CXCR4結(jié)合位點——其中一個拷貝是插入一個*匹配的CXCR4結(jié)合位點,另一個拷貝插入4個只有3’和5’端匹配,而中間不同的CXCR4結(jié)合位點,這樣選定的siRNA就不能*結(jié)合到這個結(jié)合位點——中間形成一個突起的不匹配的環(huán)。將這兩個拷貝轉(zhuǎn)入Hela細(xì)胞并用siRNA誘導(dǎo)基因沉默。結(jié)果很有趣——兩個實驗都錄得熒光素酶活性下降了超過10倍,RT-PCR和Northern分析證實,*個實驗的熒光素酶轉(zhuǎn)錄本下降了超過10倍,這正是正常的siRNA介導(dǎo)的RNAi反應(yīng),目標(biāo)靶mRNA降解導(dǎo)致表達(dá)水平的下降,而第二個實驗中熒光素酶轉(zhuǎn)錄本僅僅下降1.2倍,這種目的基因表達(dá)水平下看起來象源于miRNA介導(dǎo)的翻譯抑制降,而不是siRNA介導(dǎo)的影響mRNA的穩(wěn)定性導(dǎo)致。實驗表明:siRNA可能以miRNA的方式作用于mRNA。實驗人員還進(jìn)行了另一個實驗:改變第二個實驗中的不匹配環(huán)的堿基序列看起來不影響抑制效果,但是siRNA和報告基因上的結(jié)合位點的匹配程度越高抑制效果越好,增加siRNA的量,抑制效果越好——這一點和siRNA抑制的情況一樣——*不同的是:*匹配的結(jié)合位點(siRNA作用方式)可以單獨起作用而相互不影響,而增加不*配對的結(jié)合位點(注意在第二個實驗中用了4個CXCR4結(jié)合位點)的個數(shù)對翻譯抑制有顯著的加乘作用。
在哺乳動物細(xì)胞中還沒有找到內(nèi)源的siRNA,外源的siRNA介導(dǎo)的RNAi作用正是一種抵御機制。而miRNAs則廣泛存在于哺乳動物細(xì)胞中,從理論上推測可能參與多種調(diào)控作用。這兩種小東西的作用機制和相互關(guān)系的本質(zhì)就顯得更加撲朔迷離。如何在實驗中正確鑒定siRNA和miRNA,甚至是其他的小分子RNA都成為一個值得關(guān)注的問題。