首页 >> 新闻报道 >>行业报道 >> 如何让单细胞测序变得如此简单?
详细内容

如何让单细胞测序变得如此简单?

细胞生物学研究一直是当今的热门话题,而且最前沿的领域就是单细胞RNA测序了(scRNA-seq)。常规RNA测序方法一次性能够对成千上万个细胞进行加工测序,并给出平均差异,但并没有两个细胞是完全一样的,而新型的scRNA-seq方法就能够揭示出制造每一种特异性的微小改变,甚至这种技术还能够阐明完整的新的细胞类型。

比如,当来自博德研究所的研究人员Aviv Regev等人利用scRNA-seq对2400个免疫系统细胞进行探查时,他们无意中发现了一些具有潜在T细胞激活活性的树突状细胞,Regev表示,一种刺激这些细胞的疫苗或能够潜在增强机体免疫系统并且保护机体抵御癌症。当然了,这些发现都是来之不易的,相比大量细胞而言,研究人员很难对单个细胞进行操作,因为每一种细胞仅会产生少量的RNA,对于研究者而言没有犯错的余地;另外一个问题就是如何对大量的数据进行分析,最重要的是,研究者使用的工具可能是并不直观的。

图片来源:www.nature.com

一般而言,RNA测序数据能够被以指令的形式输入到Unix操作系统中进行分析,数据文件会从一个软件包传输到另外一个,在这个过程中,每个工具都要对每一个步骤进行处理,比如基因组比对、质量控制、识别突变体等等。这个过程是非常复杂的,但对于大量的RNA-seq而言,研究人员可以利用算法对每一个步骤进行处理,而且他们也非常清楚每个过程的运行状况。

如今网上有很多在线资源和工具能够简化scRNA-seq数据分析的过程,其中名为GitHub的平台(Awesome Single Cell)就整合了70多种工具和资源,而且相关的工具和资源能够覆盖分析过程的每一步。

定制技术

在2016年发表的一篇研究报告中,来自夏威夷大学的生物信息学家Lana Garmire就列出了他们进行scRNA-seq数据分析的基本步骤,尽管每一个实验都具有特殊性,但很多分析流程都是按照相同的步骤进行过滤以及对数据进行排序的,同时还能够找出哪些转录物会被表达并且能够纠正扩增效率的差异性,随后研究人员就能够进行一个或多个二级分析来检测亚群和其它功能。

研究人员所面临的另外一项挑战就是规模问题,经典的RNA-seq实验往往包含了少量样本,但scRNA-seq研究中则含有成千上万个样本,能够处理少量样本的工具当遭遇十倍甚至百倍的样本时,其效率通常就会降低。比如一种最常见的单细胞分析类型就是维数约减(dimensionality reduction),这一过程就能够简化数据集来促进对相同细胞的识别;桑格学院研究所的计算机生物学家Martin Hemberg认为,scRNA-seq数据能够把每一个细胞描绘成为“具有20000个基因表达值的一览表”。而诸如主成分分析法(PCA)和t-分布邻域嵌入算法(t-SNE algorithm)等维数约减算法则能够有效地将这些形状投射到两个或三个维度,从而就能够使得相似的细胞聚集在一起。另外一种流行的应用就是伪时分析,2014年研究人员就开发了一种名为Monocle的工具,该工具能够利用机器学习的方法来对scRNA-seq实验性的数据进行推断。

当然,诸如Pagoda等其它工具还能够解决亚群特征检测和空间位置确定等信息,其能够利用组织中基因表达的分布数据来确定每一个组织中的转录组学表达情况;来自纽约基因组研究中心的研究者Rahul Satija就开发了一种名为Seurat的工具,该工具能够利用这些数据将细胞定位在三维空间中的点。

如今,研究人员已经开发出了一些即用型的检测“流水线”,当然还有一些端对端的图像工具,包括一些商业性的SeqGeq包以及一些成对儿的网络开放性工具,比如Granatum和ASAP(自动的单细胞分析流水线,the Automated Single-cell Analysis Pipeline);Granatum和ASAP能够利用网络浏览器提供相对简单、交互式的工作站来帮助科学家们以图形化的模式来深度分析数据;目前这两个工具能够更好地帮助科学家们进行日常的测序工作。

图片来源:www.nature.com

使用工具时需要警惕

这些工具并不是在每一种情况下都是完美的,比如一种能够善于精确鉴别细胞类型的“流水线”或许在进行伪时间分析(pseudo-time analysis)上并不擅长;此外,一些适当的方法或许还具有一定的数据依赖性。

对于初学者而言,严谨是非常必要的,生物信息学工具几乎总是能够给出一个答案,那么问题是,这些答案意味着什么呢?来自加利福尼亚大学的研究者Sandrine Dudoit的建议就是进行一些探索性的分析,同时对我们选择的算法进行一些假设性的研究。有些分析性的任务仍然极具挑战性,包括将来自实验条件下或有机体中的数据同来自不同组学整合的数据进行对比。

目前研究人员能够使用足够多的工具来进行研究,而那些对其感兴趣的科学家也在不断钻研;每一种新型工具都能够揭示生物学的另一面,因此只要时刻关注科学,我们就能够做出明确的选择。


技术支持: 建站ABC | 管理登录
seo seo