人生如戲,相信長鏈非編碼RNA(lncRNA)也體會到了。之前一直遭冷遇,如今卻是萬人迷。其實,人類及其他哺乳動物的基因組轉錄了數萬條lncRNA。根據GenCode數據庫中版本的數據,人類基因組中包含16,000條lncRNA,產生了近28,000條轉錄本。再加上其他數據庫的數據,目前已知的lncRNA超過40,000條。
這些類似mRNA的轉錄本在各種基因調控水平和胚胎發育等生物學過程中發揮作用。越來越多的證據也表明,異常表達的lncRNA在多種疾病狀態中發揮重要作用,如癌癥。這些RNA盡管在十幾年前就已經發現,但只有少數分子的功能得到鑒定。
德克薩斯大學西南醫學中心的藥理學教授David Corey表示:“你必須從檢測非編碼轉錄本開始。”他的研究方向是將lncRNA作為藥物靶點。“我對這些數據庫不感冒,因為可能存在錯誤。他們可能檢測到你的細胞系中不存在的RNA或很少量的RNA。”
若并非全基因組范圍內的檢測,Corey博士通常利用定量PCR來檢測非編碼轉錄本。“如果我們認為那兒有一條非編碼轉錄本,我們就用5’和3’ RACE來擴增和檢測這些區域,”他說。“了解它的起始位點和終止位點是件好事,但不一定是必需的。如果你主要對功能感興趣,那么就不用了解全部情況,若存在重疊的轉錄本,檢測起來也比較困難。”
如果轉錄本的確存在,下一步則是利用逆轉錄來生成RNA,“或者購買一條適當長度的RNA,但是序列必須相同,”Corey博士說。“你必須使用*相同的qPCR引物,否則失之毫厘,謬以千里。”
當然,與mRNA相比,分析這些lncRNA面臨*的挑戰。據ArrayStar的資深科學家Yanggu Shi介紹,lncRNA的豐度水平通常比mRNA低十倍,而且組織特異性高,近80%的lncRNA是組織特異的,但mRNA不到20%。lncRNA的注釋比較少,因為它們不編碼蛋白質。此外,一些lncRNA沒有poly(A)尾。它們大多位于細胞核中。“基于這些原因,我們需要一些特殊方法來分析和注釋,”Shi博士說。ArrayStar專門開發分析RNA表達和調控的工具,特別是調控性的非編碼RNA。
舉個例子,RNA測序通常產生4000萬條序列,但lncRNA的測序覆蓋度太低,不足以進行可靠定量。“利用這種方法,lncRNA測序至少需要1億條序列,比常規的mRNA測序要多得多,”Shi博士解釋道。“相比之下,芯片受低豐度轉錄本的影響沒那么大,且錯誤定量的幾率較低。”
據Shi博士介紹,ArrayStar的lncRNA芯片帶有許多注釋,得到實驗支持,并被許多文獻引用。比如,ArrayStar芯片曾出現在《Nature Cell Biology》的一篇論文中,說明三陰乳腺癌中的細胞質LINK-A lncRNA激活了常氧下的HIF1α信號通路1。