細胞注釋是單細胞研究中十分重要的環節,人工注釋需要借助文獻檢索或者結合常用的注釋數據庫來尋找marker基因,準確性相對較好,但對于研究者研究背景的了解程度具有一定的要求,并且比較耗時。軟件自動化注釋一般是使用軟件內置參考數據集進行注釋,操作相對簡單,雖然準確性較人工注釋相對稍差,但可以作為一種很好的輔助注釋手段。
SingleR 是一個用于對 scRNA-seq 數據進行細胞類型自動注釋的 R 包,其自帶 7 個參考數據集,包括 5 個人類和 2 個小鼠數據集:
· BlueprintEncodeDataBlueprint (Martens and Stunnenberg 2013) and Encode (The ENCODE Project Consortium 2012) (人);
·DatabaseImmuneCellExpressionDataThe Database for Immune Cell Expression(/eQTLs/Epigenomics)(Schmiedel et al. 2018)(人);
·HumanPrimaryCellAtlasDatathe Human Primary Cell Atlas (Mabbott et al. 2013)(人);
· MonacoImmuneDataMonaco Immune Cell Data - GSE107011 (Monaco et al. 2019)(人)
· NovershternHematopoieticDataNovershtern Hematopoietic Cell Data - GSE24759(人)
· ImmGenDatathe murine ImmGen (Heng et al. 2008) (鼠)
· MouseRNAseqDataa collection of mouse data sets downloaded from GEO (Benayoun et al. 2019).(鼠)
SingleR注釋結果展示
首先, 基于singleR參考細胞類型對實驗樣本的每個細胞進行評分,若細胞在一個參考細胞類型中的得分顯著高于其他標簽,表示對應的細胞類型可能性越大。結果由細胞評分熱圖展示,如下圖:
圖1:細胞評分熱圖
橫軸代表樣品中的每個細胞,縱軸為 Single R 參考細胞類型;黃色到藍色代表細胞評分逐漸降低,細胞在一個標簽的得分越高,表示對應的細胞類型可能性越大。
除了對每個細胞的所屬細胞類型進行評分外,singleR還會對seuret聚類結果中每個cluster中各細胞類型比例進行分析,評估每個cluster所屬的細胞類型。結果由細胞比例矩陣圖展示,如下圖:
圖2:細胞比例矩陣圖
縱軸為 Single R 參考細胞類型,橫坐標為樣本 cluster,紅色越深細胞比例越高,表示該細胞類型在當前cluster中的占比越高。
在得到每個細胞所屬細胞類型的評分以及每個cluster中的細胞比例, Single R會基于上述數據進行細胞類型注釋,并繪制細胞類型注釋結果的tSNE/UMAP圖。結果如下圖所示:
圖3:細胞分群 tSNE 圖
圖4:細胞分群 UMAP 圖
關于SBC中心實驗室
SBC中心實驗室聚焦單細胞、空間多組學前沿技術,圍繞基因組、表觀組、轉錄組、蛋白組、代謝組和微生物組等多維組學研究,以國際一流水平的技術平臺,二十余年專業經驗的技術團隊,打造創新產品服務體系,高效助力科學發現產品研發。中心始終以嚴謹的科學態度,堅持創新,服務國家重大戰略任務,推動技術成果轉化應用和帶動產業集群發展。長期舉辦學術論壇、專題研討會、前沿技術培訓,為數十家跨國制藥企業和上千家國內科研機構、院校、醫院提供系統全面一站式的科研與轉化解決方案,日益發揮面向生物醫藥全行業功能效益和策源動力。
-
細胞
+關注
關注
0文章
66瀏覽量
18325 -
數據集
+關注
關注
4文章
1205瀏覽量
24643
原文標題:單細胞細胞注釋詳解之singleR細胞注釋
文章出處:【微信號:SBCNECB,微信公眾號:上海生物芯片】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論