實驗室智慧數位化與次世代生物序列分析平台
/Intelligent Environments of Future Lab for biomedical Research
研發團隊/Research Team
中央研究院資訊科學研究所 (Institute of Information Science,Academia Sinica)
系統網路生物實驗室 (Lab of Systems Biology and Network Biology, http://eln.iis.sinica.edu.tw)
詳細課程內容與相關連結/More detail: http://eln.iis.sinica.edu.tw
- 引言/Opening
9:00-9:20: 林仲彥 博士 (Chung-Yen Lin Ph.D.)
內容:簡介實驗室相關研究、生物資訊系統平台與資料庫等
Brief on Recently Research results, published web applications and databases
Slides for this section: [PDF]
- 快速建構序列分析平台架構/Construct the infrastructure for Future Laboratory rapidly
9:20 - 9:50 黃智偉 先生 (Mr. Chi-Wei Huang)
內容: 簡介Live-DVD: Biolinux、ELN and myBLAST 之安裝與基本設定/ Introduction on the installation of Live-DVD
Bio-Linux,為英國NERC Environmental Bioinformatics Centre所開發,是一個以Ubuntu( Linux 的一種)為基礎架構的開放式作業系統,其上已預先裝載了許多生物序列分析的重要軟體工具及分析平台,使用者可以 Live DVD的形式,以光碟開機無須任何安裝動作,便能測試與了解系統的內容與功能合乎研究需求與否。之後,再決定是否要透過高親和性的介面,以滑鼠操作與簡單的資料輸入,進行系統的安裝,跳過以往複雜的程式安裝與系統設定,建構出一個自有的生物序列分析環境(EMBOSS, Galaxy, Phylogenetic tools, R, alignment tools, NGS related tools... etc, more detail)。為了協助生物醫學研究以更具效率的方式進行,本研究團隊將我們所發展的電子實驗室記錄本與高通量生物序列比對平台等系統,與Bio-Linux結合,建構新的 Live-DVD ,提供使用者更佳的分析環境。
Reference Sites: Biolinux,our LiveDVD download site (4.2 GB, as DVD ISO)
Sildes for this section: [PDF]
- 電子實驗室記錄本/Elegance: Electronic Lab Notebook-- Digitize your experimental designs and results into wisdom from Discovery to Publication
10:00 - 10:30 黃智偉 先生 (Mr. Chi-Wei Huang)
內容: 電子實驗室記錄本之運用與維護
將實驗室中所產生的各種紀錄與大量數據,以電子化方式儲存於網路伺服器/一般桌上型/筆記型電腦,可藉由一般電腦、筆記型電腦與移動式裝置如智慧型手機與平板電腦等,透過一般的網路瀏覽器就可以來存取相關內容與研究數據,以高親和性介面,協助使用者管理、分享、搜尋、備份、列印,及與國內外研究伙伴線上討論相關問題,讓實驗室的眾多智慧、想法與研究歷程得以紀錄回顧與交互串連,不受時空與人員異動的影響,進而激盪出新的成果與方向。此一系統,除可供個人使用外,亦可建置成為一般實驗室內部與對外網站,並可作為國際合作研究平台,目前研究團隊正進行雲端版本的開發,與優化移動式設備(mobile devices)的存取介面,讓實驗室的智慧結晶得以快速存取與整合,並隨時上傳新的想法與心得,即時分享給研究伙伴,加速研究的進展。
平台: Electronic Laboratory Notebook (ELN) (影音簡介)
下載:Windows/ Mac, Linux/ Cloud version
Slides for this section: [PDF]
- 高通量生物序列比對平台/ myBLAST: a customized BLAST platform for genomics /transcriptomis and proteomics with paralleled computing on your desktop
10:40 - 11:10 呂怡萱 小姐 (Ms. I-Hsuan Lu)
內容:myBLAST的操作與資料維護/Manipulation and Maintenance of myBLAST
myBLAST為一個客製化BLAST序列比對平台,使用者可以上傳fasta格式序列,自行建立DNA或是蛋白質資料庫(如16S rRNA與特定立體結構蛋白序列或是尚未發表的私有序列/組裝序列),進行自有序列的相似性比對,在上載大量欲比對序列後,可透過圖像介面的協助,執行不同類型的序列比對(blastn, Megablast, blastp,blastx, tblastx ...),以條列式的方式呈現分析的結果,並能留存並加以註解,與後續的分析結果協同比對,同時這些已建立之資料庫可重複使用。使用者所建置的資料庫與比對結果,也都能透過圖像的管理介面,進行下載與篩選,協助後續的研究工作的深入分析。前此一系統已應用來解析環境基因體(Metagenomics)、基因體(Genomics)、轉錄體(Transcriptomics)與蛋白質體(Proteomics)的分析工作上,亦能透過序列比對的方式,協助使用者找尋同源序列,配合分子演化分析工具(如POWER與PALM)來進行親緣分析。除了web平台外,研究小組也針對有資料安全需求的實驗室或是個人,設計一套可安裝於一般windows/MAC平台,客製化BLAST平行運算高效能比對系統,可協助使用者快速地建立myBLAST網站,並以平行化技術驅動多核CPU,充分發揮運算設備的計算能力,減少大量計算所需耗用的時間,所建置之資料庫與所得結果,都能透過網路與研究伙伴一同分享,加速研究的進程。
線上網站: http://mybioweb.nhri.org.tw/myblast
單機版下載網站: http://eln.iis.sinica.edu.tw (MAC/ Windows)
線上使用說明影片: http://eln.iis.sinica.edu.tw (影音簡介)
Slides for this section: [PDF]
- 次世代序列分析平台/ Galaxy (Pre-installed in Bio-Linux) for Next Generation Sequencing
11:10 - 12:00 蘇聖堯 先生 (Mr. Sheng-Yao Su)
中央研究院系統網路生物實驗室
內容:初探 Galaxy/ First look at Galaxy
Galaxy 是一個以開放軟體為基本架構的線上生物序列分析平台,可以協助生物醫學的研究人員解析新世代定序所產生的大量資料,完成初步的資料分析工作。目前已有一些網站提供小型資料的Galaxy線上使用,研究人員也可自行下載安裝整個平台,供內部私有大量資料分析所需。透過Galaxy圖像化的介面,除了有許多序列分析的軟體工具外,使用者也可以執行、重製與分享由其他研究團隊所串接建置的分析步驟,並可以客製化修改整個流程,符合特定研究需求,減少分析的複雜度與耗用的資源。目前,在BioLinux LiveDVD中,已預裝Galaxy系統,可減少使用者在佈建平台時所面臨的安裝困難度。然而,由於次世代序列資料產出龐大,分析過程往往會有數倍於輸入檔案大小的中繼檔出現,同時分析所需之特定物種資料庫也因需求空間頗多,無法放在一般的DVD光碟中,必須自行下載安裝。若有大量資料或是內部資料的分析需求,建議使用者需與資訊專業人員討論,考量合宜的硬體設備(處理器數目與記憶體大小)與儲存方案,自行建置私有之分析平台,或是使用商業平台如建構Amazon Web Service (AWS) Elastic Compute Cloud (EC2)上的雲端Galaxy等。由於平台本身為開放系統,我們的合作團隊也在上面開發一些插件 (plug-in) ,協助基因體短序列的重組與全基因體的甲基化分析等,因此,若是配合其他團隊所研發的插件,將能自行組合出符合研究目的所需的分析流程,減少因個別程式操作中所可能產生的錯誤,讓研究人員更能專注於結果的解析與判讀。
Galaxy Project: http://galaxyproject.org/
Galaxy 101: https://main.g2.bx.psu.edu/u/aun1/p/galaxy101
Available sever list: http://wiki.galaxyproject.org/PublicGalaxyServers
Slides for this section: [PDF]