發(fā)布時間:2024-07-02
近日,中國科學院廣州生物醫(yī)藥與健康研究院王杰課題組開發(fā)了新的計算工具CACIMAR(Cross-species Analysis of Cell Identities, Markers, Regulations),用于分析跨物種單細胞轉(zhuǎn)錄組測序數(shù)據(jù)(scRNA-seq),揭示物種間細胞類型、標志基因、細胞內(nèi)調(diào)控以及細胞間相互作用的進化保守性。相關(guān)成果以“CACIMAR: cross-species analysis of cell identities, markers, regulations, and interactions using single-cell RNA sequencing data”為題目發(fā)表在學術(shù)期刊Briefings in Bioinformatics上。
物種不僅在基因?qū)用?,也在細胞類型、基因表達、基因調(diào)控、細胞間相互作用等方面顯示出進化保守性。單細胞轉(zhuǎn)錄組測序技術(shù)已廣泛用于不同物種的單細胞表達研究,為在細胞類型水平研究物種的進化保守性提供了新機會。已有的算法能通過分析跨物種單細胞轉(zhuǎn)錄組數(shù)據(jù)識別進化保守的細胞類型,如Seurat和SAMap等。但是,這些方法主要通過跨物種的單細胞聚類確定保守細胞類型,其準確性在很大程度上取決于跨物種批次效應(yīng)校正的能力。這些軟件對進化距離較遠物種進行聚類分析,仍存在明顯不足。此外,目前仍沒有方法能確定細胞間相互作用的進化保守性。
針對以上問題,我院王杰課題組開發(fā)了新的R軟件包 CACIMAR ,用于分析跨物種的單細胞轉(zhuǎn)錄組數(shù)據(jù)。CACIMAR的保守性分析主要包含三個步驟(圖1)。第一步,CACIMAR 基于每個物種內(nèi)的單細胞聚類結(jié)果確定每個物種的細胞類型、標志基因、細胞內(nèi)調(diào)控和細胞間相互作用。該策略不用進行跨物種的單細胞聚類,有效避免了跨物種的批次效應(yīng)。第二步,基于標志基因的統(tǒng)計值(statistical power)和物種同源性(homolog),CACIMAR計算細胞類型的保守性分值。此外,CACIMAR還建立了特征加權(quán)和的模型(weighted sum?model),分別計算細胞內(nèi)調(diào)控網(wǎng)絡(luò)的保守性分值和細胞間相互作用的保守性分值。最后一步,基于計算的不同保守性分值分別確定跨物種保守或特異的細胞類型、細胞內(nèi)調(diào)控和細胞間相互作用。該研究將CACIMAR應(yīng)用于小鼠、斑馬魚和小雞的視網(wǎng)膜損傷再生的公共單細胞轉(zhuǎn)錄組數(shù)據(jù)中,有效地確定了小鼠、斑馬魚和小雞視網(wǎng)膜中保守的細胞類型、標志基因、細胞內(nèi)調(diào)控和細胞間相互作用。
總體上,CACIMAR提供了一種新的算法,能克服現(xiàn)有跨物種單細胞轉(zhuǎn)錄組數(shù)據(jù)分析的挑戰(zhàn),特別是在識別跨物種保守和特異的細胞類型、基因調(diào)控以及細胞間相互作用方面。通過該算法,研究人員能深入地分析不同物種的細胞和分子水平的進化保守性,為理解物種進化的機制提供了新的視角。
廣州健康院的王杰研究員和徐雪麗助理研究員為本論文的共同通訊作者,蔣俊堯和李金連為論文的共同第一作者。該研究得到了國家自然科學基金、國家重點研發(fā)計劃、廣東省自然科學基金等項目的資助。
圖1?CACIMAR進行跨物種單細胞轉(zhuǎn)錄組數(shù)據(jù)分析示意圖
附件下載: