2009中央研究院 生命科學圖書館 生物資訊教育推廣

地點:中央研究院生物醫學研究所B1B

時間: 2009/12/4, 9:30-12:00

講員:中央研究院資訊科學所 系統生物與網路生物學實驗室

           林仲彥 助研究員, 陳淑華 博士

助教: 蘇聖堯 先生     呂怡萱 小姐

 

主題: 生物巨分子序列比對與親緣分析


時程規劃:

09:30-09:50 Registration
09:50-10:40
 序列比對簡介與上機實習 (myBLAST) (Lecture PDF)

11:00-12:00   親緣分析系統簡介與上機實習 (POWER, PALM) (Lecture PDF)

課程內容簡介:

 

1.      

高效率平行化BLAST序列比對平台, myBLAST web version and Standalone (Web version: http://mybioweb.nhri.org.tw/myblast, standalone version for windows http://eln.iis.sinica.edu.tw)

2.      

生物巨分子序列親緣分析流程之整合與最佳化系統Brief on phylogenetics & Introduction of Phylogenetic Web Repeater (http://power.nhri.org.tw)

3.       最佳化分子親緣關係分析平台,Phylogenetic Reconstruction by Automatic
Likelihood Model Selector (PALM, http://palm.iis.sinica.edu.tw)

 

1. 高效率平行化BLAST序列比對平台: myBLAST

myBLAST, a customized BLAST platform for genomics and proteomics with paralleled computing, submitted,

 myBLAST為一個客製化BLAST序列比對平台,使用者可以上傳fasta格式序列,自行建立DNA或是蛋白質資料庫(16S rRNA與特定立體結構蛋白序列), 上載大量欲比對序列後,再透過圖像介面的協助,便能以條列式的方式呈現分析的結果,所以能一次解析多條序列的比對分析工作。同時,使用者所建置的資料庫與 比對結果,也都能透過圖像的管理介面,進行下載與篩選,協助後續的研究工作的深入分析。目前此一系統已應用來解析環境基因體(Metagenomics)、基因體(Genomics)、轉錄體(Transcriptomics)與蛋白質體(Proteomics)的分析工作上,亦能透過序列比對的方式,協助使用者找尋同源序列,配合分子演化分析工具(POWERPALM)來進行親緣分析。

除了web平台外,研究小組也針對有資料安全需求的實驗室或是個人,設計一套可安裝於一般windows平台,客製化BLAST平行運算高效能比對系統,可協助使用者快速地建立myBLAST網站,並以平行化技術驅動多核CPU,充分發揮PC的運算能力,減少大量計算所需耗用的時間,所建置之資料庫與所得結果,都能透過網路與研究伙伴一同分享,加速研究的進程。

線上網站:  http://mybioweb.nhri.org.tw/myblast

單機版網站:  http://eln.iis.sinica.edu.tw

線上使用說明影片: http://eln.iis.sinica.edu.tw

範例檔案: (請按右鍵另存新檔) DB (30M, Human Swissprot sequence) , Query Sequence


2. 生物巨分子序列親緣分析流程之整合與最佳化系統

POWER: PhylOgenetic WEb Repeater (Nucleic Acid Research 2005)

POWER為 一自動化序列親緣性分析系統,以導引式互動介面協助來自不同研究社群的使用者完成分析,簡化繁瑣的序列格式處理過程及流暢地銜接多種操作程 序,但又能保有各分析階段的精細調整參數的功能,並自動記錄分析操作過程的參數設定,以便使用者回溯其工作流程,再行調整。另外,針對樹形圖的輸出方式, 與樹形分支排列調整等功能設計程式,以符合客製化(customize)的理想。另外,可與BLAST工 具結合,將比對出的標的作為輸入序列,加速使用者解析所研究之序列與相關序列間的時空分析概況。所有分析流程中所用的參數與產出檔案,都與圖像化結果被紀 錄在報表網頁中,可讓使用者下載利用,並觀察不同參數對分析結果的影響。本系統為整合性可反覆執行之序列親緣關係分析工具,提供使用者分別以一般序列(Fasta)與比對序列(Aligned sequences)二 種方法來進行核酸或蛋白質序列親緣關係分析,並可即時動態增加或減少序列數目節點,反覆調整分析之結果。像這樣具親和性的序列親緣分析系統,除了運用於生 物巨分子序列分析外,可以讓研究人員進行疾病病原分子監控,快速判定源自不同時空背景之檢體序列間的親緣關係,而無須陷入繁瑣的程式操作與避免複雜的結果 研判,譬如腸病毒與流感病毒的分析,更可以透過這樣的系統快速地進行親緣與傳遞途徑的解析。此一系統,已被收錄在多個生物資訊入口網站,如ExPAsy的序列親緣分析平台之推薦網站與Bioinformatics Directory Links中。
參考網址:
http://power.nhri.org.tw
簡介影片: http://power.nhri.org.tw/power/tutorial1.htm 或是參閱主網頁的Demo連結 (結果範例)

3. 最佳化分子親緣關係分析平台

PALM: Phylogenetic Reconstruction by Automatic Likelihood Model Selector (PLoS ONE, Dec 7, 2009)
一直以來,演化模型的選取,都是建構親緣樹的重要關鍵,不同的模型往往會造成樹型拓樸的差異,進而影響後續的生物意義推論。PALM為一個自動選擇最佳演化模型之生物分子親緣關係分析平台,應用多核心平行技術,可加速運算效能,縮減所需時間為原來的六分之一,目前提供多達56DNA演化模型及112種蛋白質演化模型,可供本系統同時評估,依其統計結果擇取最佳模型再輔以Bootstrap分析,並進一步提供互動式親緣樹檢視介面,方便使用者對親緣樹型進行翻轉、交換,同時也可以透過圖像化方式刪除與新增分析序列,再次進行新的分析工作。分析流程中所用的參數與產出檔案,都與圖像化結果被紀錄在報表網頁中,可供使用者下載並進一步利用。PALM以極具親和性的介面,大大地減少使用者在進行複雜多演化模型分析的難度與時間,使得生物學家能以更具統計意義的演化模型,來解釋所建構出來的親緣關係與其中所包含的生物意涵。

參考網址: http://palm.iis.sinica.edu.tw

簡介影片: http://palm.iis.sinica.edu.tw/demo.html 或是參閱主網頁的Demo連結