2021 生物醫學大數據淘金工作坊/2021 Workshop for Biomedical big data

報名網頁:

 https://lsl.sinica.edu.tw/Activities/class/schedule.php

 時間/Time 題目/Topic 報告人/Presenter
13:30 - 13:50 簡介/Introduction 林仲彥  博士 (Chung-Yen Lin Ph.D.)
13:50 - 15:20 雲端電子實驗室記錄本/Elecrtonic Lab Notebook 黃智偉 資訊工程師 (Chi-Wei Huang)
15:30 - 17:00 單細胞轉錄體分析平台/Seashell: Web portal for Single cell RNA-seq

莊佳憲 資訊工程師(Chia-Hsien Chuang)

余柏毅 資訊工程師 (Po-Yi Yu)

 

 

 

 

 

 

 

 


Date: 1/ 13 (Thursday), 2022,  13:30 -17:00       Venue: 生化所 209 研討室

課前須知:**本課程部分工具程式將使用DOCKER平台,如自行攜帶筆電,請先安裝相關套件,安裝資訊請參閱連結 (WINDOWS) (Mac),本次課程也會示範安裝過程。

已安裝好docker 環境的學員可以先下載上課需要用到的docker image

下載指令如下:
docker pull lsbnb/eln
docker pull lsbnb/seashell

Docker hub 網址:
https://hub.docker.com/r/lsbnb/eln 
https://hub.docker.com/r/lsbnb/seashell 

引言/Opening

13:30-13:50: 林仲彥  博士 (Chung-Yen Lin Ph.D.)

系統網路生物實驗室 (Lab of Systems Biology and Network Biology, http://eln.iis.sinica.edu.tw)

中央研究院資訊科學研究所 (Institute of Information Science, Academia Sinica)

內容:將簡介實驗室相關生物醫學巨量資料研究、以及公開發表與次世代定序相關之模式生物,與非模式生物多維體分析平台生物資訊系統平台、DOCKER程式與相關人工智慧在生醫農學之運用等。研究團隊希望,透過本次的工作坊,從原始定序產出到後端生物意義解析,讓使用者快速瞭解與運用我們所開發的資訊工具,跨越複雜的資訊技術門檻,以更為清晰的方式來處理與管理巨量生物序列,並減低大數據所帶來的障礙,擷取其中的關鍵差異資料,並進行與個人專業領域相關的深度分析。

This brief will show our recently research works about biomedical big data and their applications. Meanwhile, we will show you those published web applications, databases, DOCKER images and frameworks in AI/Deep Learning available for public. 

Resource contributed by Our team:

雲端電子實驗室記錄本/Elegance: Electronic Lab Notebook on Cloud-- Digitize your experimental designs and results into wisdom from Discovery to Publication

13:50 - 15:20 黃智偉 先生 (Mr. Chi-Wei Huang)

中央研究院資訊科學研究所 (Institute of Information Science, Academia Sinica)

內容: 雲端電子實驗室記錄本之線上運用與安裝設定

將實驗室中所產生的各種紀錄與大量數據,以電子化方式儲存於網路伺服器/一般桌上型/筆記型電腦/雲端/NAS,可藉由一般電腦、筆記型電腦與移動式裝置如智慧型手機與平板電腦等,以一般的網路瀏覽器就可以來存取實驗相關內容與研究數據,以通用網頁編輯的高親和性介面,協助使用者管理、分享、搜尋、備份、列印,及與國內外研究伙伴線上討論相關問題,讓實驗室的眾多智慧、想法與研究歷程得以紀錄回顧與交互串連,不受時空與人員異動的影響,讓實驗室的智慧結晶得以快速存取與整合,並隨時上傳新的想法與心得,即時分享給研究伙伴,加速研究的進展。為了因應新世代的研究需求,解決資料的分享與擷取再利用,本研究團隊在美國微軟公司全球雲端計畫的贊助 (2011- 2013)與科技部研究計畫的支持下,以開放源碼(Open Source)為基礎,並融入web 2.0的精神,整合網路工具(drupal, apache, Ajax)、資料庫(mySQL)與程式語言(php, Java, C++),及我們多年在生物醫學研究室中的實做經驗,建構一套電子實驗室記錄本(Electronic laboratory Notebook, ELN)。本系統亦榮獲2018國家新創獎之學研新創獎項,並在2019, 2020, 2021皆獲得國家新創獎之學研精進獎。

這一套系統,可以在不同作業系統 (Linux, Windows, Mac)或是DOCKER雲端平台上,透過高親和性的簡易介面由使用者自行進行安裝,無須複雜的資訊技術協助,便能同時快速建置屬於自己或是中小型研究團隊所需的資料交換分享平台及對外網站。除了可提供各類型實驗資料(文字、數據、檔案、圖像及影音等)的儲存列表,也能進行增刪修訂、搜尋分類、專案與參與人員管理、多人協作、手寫繪圖、瀏覽列印、安全防護以及自動複製備份等功能,並能進一步協助建置資料交換分享、線上討論、即時編修、實驗報告版本修改紀錄管理、實驗室耗材藥品資源管理、會議邀請與數位簽章等機制。目前此一系統內建中文、日文與英文之使用介面,並提供包括雲端平台等多種版本,透過對Web介面的優化,除了一般的電腦外,也讓不同的移動設備如智慧型手機、平板電腦等,都能透過直覺的圖形化介面,在無時間與距離的限制下,存取與分享儲存在雲端的實驗室智慧,進而激盪出更多的研究火花與新的探討方向。

The hand-writing, paper-based recording way is not competent to keep data in increasing volumes and complexity, and is hard to make data sharing in a cooperating project among various disciplines and research communities. With more and more outputs generated with digital deluge from high throughput biology, a web platform we developed for knowledge repository with the functions like search, backup, reconstruction will be an important issue in current laboratories for daily records.

Currently, we have developed the framework of pure web-based ELN which can be deployed on local PCs, local servers, NAS or clouds instead of high manpower required ELN server /client architecture. Meanwhile, users can access the ELN by any kinds of web browsers on various machine including mobile devices without the limitation of time and space. Thus, it can be shaped for managing thoughts and all kind of lab working logs/ experiment data for a single researcher, for a small research team to construct their own internet web service for public and intranet framework to manage experimental results, as well as a sharing working platform among labs. 



Graphical Brief Download Online Demo  Online help

課程簡報檔:[pdf]

 
SeaShell:單細胞RNA定序實驗分析平台/ Seashell: an automatic web portal system for single-cell RNA sequencing (scRNA-seq) analysis

15:30 - 17:00莊佳憲 資訊工程師(Chia-Hsien Chuang), 余柏毅 資訊工程師 (Po-Yi Yu)

中央研究院資訊科學研究所 (Institute of Information Science, Academia Sinica)

內容:

隨著近年來單細胞分選及基因定序技術的突破,單細胞定序實驗便憑藉著傳統定序實驗無法比擬的高解析度廣泛被運用於生物醫學領域的研究之中。然而,極高解析度所帶來的大量定序資料卻也提高了後續分析的難易度,使得資料分析成為進行單細胞定序實驗的一大技術門檻。因此,本實驗室希望藉由提供一自動化的單細胞RNA定序實驗分析平台,SeaShell,以圖像化單一DOCKER平台,來協助生物醫學領域的學者從龐大的基因資料中取得有意義的資訊,跳脫大量數據所帶來的資訊枷鎖。

SeaShell分析平台可分為兩個部分,將以不同的連接埠來處理原始定序資料與分析個別細胞基因表現

(一)SeaShell_Data-前處理Galaxy流程平台:原始資料品管與個別細胞基因表現估計



使用者可輸入簡易的Docker指令,啟動以Galaxy為基礎的圖形化介面來進行資料的前處理,取得單細胞基因表現之表格(Expression matrix)後便可進行後續的平台分析。可以用原始讀序當作輸入檔案,不過需考量運算平台與計算時間。或是以廠商所產出的初步處理資料,如CellRanger的產出檔為輸入資料,來進行後續的分析。

(二)SeaShell_Analyzer-單細胞基因表現分析網頁平台:資料存取系統、細胞品質管控、資料分析、視覺化



本研究團隊以單細胞分析工具中最常使用的R語言為基礎,搭配RShiny、Java Script D3等網頁視覺化套件設計此網頁平台,使用者可藉由直觀操作的圖形化介面來使用目前單細胞RNA定序的各種分析工具,進行客製化的生物性分析。目前的分析流程包含:細胞品質管控(Cell quality control)、正規化(Normalization)、群集分析(Cluster analysis)、差異性表現基因分析(Differentially expressed genes analysis)、生物標靶基因分析(Marker identification)、GO分析(Gene ontology analysis)等標準化流程。

本次課程中將會涵蓋本地端Docker程式集的操作示範以及圖像化操作平台的展示,希望能藉由此一簡易使用的分析平台,讓研究者能夠從第一線自由地進行單細胞RNA定序實驗的分析。

The portal system can be divided into two parts via single Docker image with different ports:
  1. SeaShell_Data: Galaxy-based platform for data preprocessing

Users can run this docker image by a Galaxy-based GUI, and then easily obtain expression matrices for further analysis from raw reads or outputs from CellRanger.

  1. SeaShell_Analyzer: RShiny-based web portal system

The web-portal system was well-developed by R language, JavaScript D3 library, and other visualization tools, allowing researchers to automatically perform a user-friendly and up-to-date scRNA-seq analysis pipeline on scRNA-seq experiments. The analysis pipeline contains: cell quality control, normalization, cluster analysis, differentially expressed genes analysis, marker identification, gene ontology analysis, and other popular tools.

In this education course, we will demonstrate how to activate the docker image to use Galaxy-based platform on raw reads and the RShiny-based web portal system on expression analysis for experiments in scRNA-seq.

 

課程簡報檔:[pdf]