測(cè)序、生物信息疑問解答整合(一)
Q1:請(qǐng)問下高通量測(cè)序相對(duì)基因芯片有何優(yōu)勢(shì)?
A:高通量測(cè)序有如下優(yōu)點(diǎn):
1、準(zhǔn)確性高,可重復(fù)性高;
2、不僅能對(duì)已知的基因進(jìn)行檢測(cè),還能對(duì)新基因進(jìn)行尋找;
3、對(duì)基因表達(dá)量的檢測(cè)限更廣(對(duì)高豐度和低豐度基因的檢測(cè)更加準(zhǔn)確)
4、直接得到基因序列,原始數(shù)據(jù)不會(huì)受基因組的版本號(hào)變化的影響(芯片原始數(shù)據(jù)為探針信息,可能因?yàn)榛蚪M升級(jí)導(dǎo)致注釋信息變化而失效)。因此,測(cè)序更加適合于實(shí)驗(yàn)室樣本數(shù)據(jù)的長(zhǎng)期累積和分析
Q2:我想對(duì)某種海洋生物的育種進(jìn)行研究,但該海洋生物的基因組數(shù)據(jù)一直沒有公布,請(qǐng)問是否可以通過轉(zhuǎn)錄組測(cè)序來篩選分子標(biāo)記?
A:可以,我們通過轉(zhuǎn)錄組測(cè)序可以對(duì)樣本個(gè)體SSR等分子標(biāo)記進(jìn)行檢測(cè)。同時(shí),也可以建議老師采用RAD測(cè)序來進(jìn)行分子標(biāo)記的篩選。
Q3:轉(zhuǎn)錄組測(cè)序的取樣時(shí)實(shí)驗(yàn)室沒有液氮了,能否將樣品直接至于-80℃冰箱中保存?
A:不能,因?yàn)镽NA暴露在富含RNA酶的環(huán)境中極易降解,需要迅速至于液氮中,并低溫保存,而冰箱無速凍功能。
Q4:沒有基因組的物種,可以憑借轉(zhuǎn)錄組數(shù)據(jù)做可變剪切的預(yù)測(cè)么?
A:不能,預(yù)測(cè)可變剪切需要有參考基因組。
Q5:我拿到了我的表達(dá)譜測(cè)序結(jié)題報(bào)告,顯示差異基因有好幾千個(gè),請(qǐng)問我怎樣才能找到感興趣的某功能基因?一個(gè)一個(gè)找嗎?
A:如果老師已經(jīng)鎖定感興趣的代謝通路,可以點(diǎn)開結(jié)題報(bào)告中kegg富集分析,選擇該代謝通路的超鏈接,打開基因列表,查看該通路中的差異表達(dá)基因,如果仍然過多,老師您可以點(diǎn)開路徑名的超鏈接,在路徑圖中選擇位于上游的差異基因。
Q6:差異基因的篩選條件為何是在兩個(gè)樣品中的表達(dá)量相差大于二倍?
A:表達(dá)量差異倍數(shù)的設(shè)置是根據(jù)老師的研究需要設(shè)定的,目的是找到合適數(shù)量的差異基因,并無硬性指標(biāo)。二倍的差異是國(guó)際雜志認(rèn)可的篩選標(biāo)準(zhǔn)。如果老師認(rèn)為得到的差異基因數(shù)過多,可以自行提高差異倍數(shù)。具體可以咨詢基迪奧的技術(shù)人員。
Q7:你們的轉(zhuǎn)錄組結(jié)題報(bào)告為何沒有關(guān)于mRNA可變剪接的統(tǒng)計(jì)結(jié)果?
A:對(duì)于無參考基因組的物種,轉(zhuǎn)錄組測(cè)序的結(jié)果是無法區(qū)分可變剪切和基因家族的,我們不知道兩個(gè)相似序列是否來自同一個(gè)基因,所以轉(zhuǎn)錄組測(cè)序結(jié)果不包含可變剪切的分析。
Q8:如何判斷基因表達(dá)量測(cè)定結(jié)果的好壞?
A:有如下方法:一,觀察結(jié)題報(bào)告中的測(cè)序及比對(duì)結(jié)果是否正常;二,正常情況下兩樣品差異比較得到的上調(diào)基因和下調(diào)基因的數(shù)目應(yīng)基本在一個(gè)數(shù)量級(jí);三,可以通過比較兩樣品中物種組成型表達(dá)的基因(看家基因)的表達(dá)量,正常情況下應(yīng)基本一致。我們都會(huì)在將結(jié)果呈遞給老師前對(duì)結(jié)果進(jìn)行檢驗(yàn),老師可以放心使用。
Q9:我想在ncbi數(shù)據(jù)庫(kù)中下載的某物種轉(zhuǎn)錄組測(cè)序結(jié)果,請(qǐng)問具體方法是什么?
A:在ncbi數(shù)據(jù)庫(kù)中,轉(zhuǎn)錄組測(cè)序的reads信息被壓縮為SRA格式,在ncbi搜索物種,可以在搜索的SRA欄目中找到測(cè)序信息和下載鏈接。下載下來的數(shù)據(jù)需要使用SRA轉(zhuǎn)換工具來轉(zhuǎn)換成分析軟件需要的FASTQ格式。
Q10:我研究的物種沒有參考基因組,一共六個(gè)樣品。我準(zhǔn)備分別進(jìn)行混樣轉(zhuǎn)錄組測(cè)序,再進(jìn)行表達(dá)譜測(cè)序,你們還有更好的辦法嗎?
A:老師您的方法是合理的,對(duì)混樣進(jìn)行轉(zhuǎn)錄組測(cè)序,盡可能得到完全的轉(zhuǎn)錄組數(shù)據(jù),以此為參考序列,進(jìn)行表達(dá)譜測(cè)序。但我們有更好的辦法。老師可以選擇對(duì)合樣品進(jìn)行pe100測(cè)序,測(cè)序量為2G,然后將表達(dá)譜測(cè)序的結(jié)果混合后進(jìn)行組裝,同樣可以得到轉(zhuǎn)物種的轉(zhuǎn)錄組。
Q11:我在貴公司進(jìn)行了測(cè)序,現(xiàn)在正在進(jìn)行論文撰寫,到關(guān)于你們的測(cè)序方法與結(jié)果不甚了解,請(qǐng)問你們能否提供相關(guān)幫助?
A:我們有對(duì)我們的各業(yè)務(wù)線的圖表結(jié)果及其實(shí)驗(yàn)分析方法進(jìn)行了撰寫,并參考在知名sci雜志上發(fā)表的論文對(duì)文檔進(jìn)行了翻譯。老師可以聯(lián)系我們的銷售來獲取這些文檔。
Q12:在lncRNA分析中,你們是如何分析其對(duì)基因的調(diào)控的?
A:由于目前對(duì)lncRNA的功能機(jī)制的研究尚未明確,現(xiàn)在我們一般采用lncRNA順式調(diào)控假說的方法原理,將lncRNA附近10kb的區(qū)域中包含的基因作為潛在的lncRNA相關(guān)基因,如果同時(shí)進(jìn)行了表達(dá)譜測(cè)序,我們可以通過這些基因與lncRNA間的共表達(dá)關(guān)系對(duì)之進(jìn)行篩選,得到更可信的lncRNA與基因調(diào)控網(wǎng)絡(luò)。
Q13:對(duì)于一個(gè)未知物種而言,如果做轉(zhuǎn)錄組denovo項(xiàng)目,一般有多少個(gè)unigene比較合適?
A:物種的轉(zhuǎn)錄組unigene數(shù)目因?yàn)槲锓N的不同可能有顯著不同,考慮到每個(gè)基因有可能產(chǎn)生多個(gè)轉(zhuǎn)錄本的情況,結(jié)合目前的項(xiàng)目經(jīng)驗(yàn),一般物種的unigene數(shù)目為基因數(shù)的2-4X比較合適。
Q14:計(jì)劃研究一個(gè)物種(基因組未發(fā)表),想了解一下其基因組的基本信息,請(qǐng)問有哪些途徑?
A:可以通過查詢相關(guān)網(wǎng)站數(shù)據(jù)獲知,例如Animal Genome Size Database,PlantGDB,Plant DNA C-values Database等。
Q15:對(duì)于某個(gè)物種,做過兩次獨(dú)立的轉(zhuǎn)錄組組裝,如何知道兩次結(jié)果中的unigene的對(duì)應(yīng)關(guān)系?
A:可以但是一般老師通常關(guān)注的是某類基因,而且老師往往已經(jīng)在一個(gè)轉(zhuǎn)錄組結(jié)果中找到,那么可以建議老師通過本地blast,將所要查詢的基因與另一個(gè)轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行匹配,將對(duì)應(yīng)unigene找出。
如果數(shù)量巨大,我們將提供大批量blast的個(gè)性化分析服務(wù)。
Q16:做多個(gè)樣本的RNA-seq項(xiàng)目,兩兩比較中有某個(gè)樣品的基因表達(dá)量上調(diào)和下調(diào)基因數(shù)目相差很多(兩個(gè)數(shù)量級(jí)),是否正常?
A:理論上講,一個(gè)細(xì)胞的RNA總量是比較穩(wěn)定的,那么通常情況下,上調(diào)和下調(diào)的基因數(shù)一般不應(yīng)該差別很多,如果差別一個(gè)數(shù)量級(jí)以上,可以考慮查證是否在樣品中存在的rRNA或者其他物種RNA污染的影響。
Q17:如果要做一個(gè)未知物種的轉(zhuǎn)錄組高通量測(cè)序項(xiàng)目,應(yīng)該怎么來選擇測(cè)序平臺(tái)及數(shù)據(jù)量?
A:Illumina測(cè)序平臺(tái)因其穩(wěn)定的測(cè)序質(zhì)量,優(yōu)質(zhì)數(shù)據(jù)性價(jià)比,占領(lǐng)了市場(chǎng)80%以上的份額。數(shù)據(jù)量我們一般推薦做4-8G(這個(gè)也不是固定標(biāo)準(zhǔn),隨著行業(yè)發(fā)展會(huì)變化,而且不同的老師可能有不同的需要)
Q18:目前做高通量測(cè)序項(xiàng)目是否必須設(shè)置生物學(xué)重復(fù)?
A:理論上講,設(shè)置生物學(xué)重復(fù)是比較合理嚴(yán)謹(jǐn)?shù)淖龇ǎ绻蠋煹慕?jīng)費(fèi)允許的話,可以建議老師做適當(dāng)?shù)纳飳W(xué)重復(fù)(至少三個(gè))。但就目前高通量研究領(lǐng)域來看,考慮到成本問題,單獨(dú)樣品的研究亦可得到學(xué)界的一定認(rèn)可,比如IF在5以下的期刊,還是可以接受無重復(fù)的樣本研究。不過隨著時(shí)間的推移,做生物重復(fù)是必然趨勢(shì)。
Q19:老師想打開測(cè)序結(jié)果文件,但是半天沒反應(yīng),是怎么回事?
A:這是因?yàn)槟承┪募^大,office軟件(word,記事本等)通常需要將文件整體讀入電腦內(nèi)存,耗費(fèi)電腦資源,故速度較慢甚至死機(jī),建議老師可以使用VIM,ultraedit等軟件。
Q20:結(jié)題報(bào)告中某些插件顯示不出來,是怎么回事?
A:這些問題是由于瀏覽器以及java插件的版本兼容問題。但這些東西對(duì)于結(jié)果的整體解讀不會(huì)有很大影響,比如熱圖,這個(gè)圖一般不能直接用到文章里,后來可根據(jù)老師挑取特定的基因,重新繪制熱圖。