-
如何在 NCBI 上進行菌種的同源性比對
發(fā)布時間: 2021-08-23 點擊次數: 6684次當我們將未知菌株送到公司測序時,并不意味著公司會直接告訴我們未知菌株是什么種什么屬的,他們只會給你未知菌株的測序序列,這時候就需要我們自己在 NCBI 上進行同源性比對。
下面結合實驗經歷跟大家交流一下。 首先,我們先來弄清楚幾個概念:
Query:數據庫中的序列
alignments: 比對上的兩個序列
hits:兩個序列比對上的片段
Score:比對得分,如果序列匹配上得分,不一樣,減分,分值越高,兩個序列相似性越高
E Value:相對的一個統(tǒng)計值,值越小,越可信
Length:輸入序列的長度
Identities:一致性,就是兩個序列有多少是一樣的
Accession:登錄號
NCBI 網站:blast.ncbi.nlm.nih.gov/Blast.cgi
操作步驟
1、打開上述網站,出現圖 1 頁面,
圖1
點擊,進入圖 2 頁面,
圖2
2、在圖 2 界面的
輸入序列, 這里以JF439461//CTTGGTCATTTAGAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGAT CATTACCGAGTGCGGGTCCTTTGGGCCCAACCTCCCATCCGTGTCTATTGTACCCTGTTGCTTCGGCGGGCCC GCCGCTTGTCGGCCGCCGGGGGGGCGCCTCTGCCCCCCGGGCCCGTGCCCGCCGGAGACCCCAACACGA ACACTGTCTGAAAGCGTGCAGTCTGAGTTGATTGAATGCAATCAGTTAAAACTTTCAACAATGGATCTCTTG GTTCCGGCATCGATGAAGAACGCAGCGAAATGCGATAACTAATGTGAATTGCAGAATTCAGTGAATCATCGA GTCTTTGAACGCACATTGCGCCCCCTGGTATTCCGGGGGGCATGCCTGTCCGAGCGTCATTGCTGCCCTCAA GCCCGGCTTGTGTGTTGGGTCGCCGTCCCCCTCTCCGGGGGGACGGGCCCGAAAGGCAGCGGCGGCACC GCGTCCGATCCTCGAGCGTATGGGGCTTTGTCACATGCTCTGTAGGATTGGCCGGCGCCTGCCGACGTTTTC CAACCATTCTTTCCAGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATATCAATAAGCGGA GGA為例。
選中頁面下的
然后點擊 BLAST。出現圖 3 和圖 4 的頁面(圖 3 和 4 是同一頁面的上下兩部分)。
圖3
圖4
3、在圖 3 頁面上
表示你可以調整參數,重新比對或者保存搜索條件以便下次比對,調整報告顯示的參數,以更符合你的要求、下載你比對的結果。
表示比對的標題,優(yōu)先是 你填寫的,如果沒有填寫可能是你輸入 fasta 序列頭(大于號后面的),如果這個也沒有找到, NCBI 會自動生成一個。
表示你輸入序列的信息,包括標識號、描述信息、類型、長度。
表示你可以查看其他報告,比如摘要、分類、距離樹等。
4、在圖 4 的頁面上 Ident 越高,表明序列的同源性也就越高。通過同源性較高的描述你可以初步判斷未知菌株的類別。點擊同源性較高的,比如我們點開第一個,出現圖 5 的頁面,將滾動條向下拉至圖 6,得到比對同源性高的序列,將其登錄號以及序列保存在文本文檔中, 通過系統(tǒng)發(fā)育樹我們能具體判別未知菌株屬于哪種菌株。
圖5
圖6