-
转录组,能揭示存在特定表达模式的基因,西交团队研发TDEseq生物测序法,样本,异质性,序列
- 核心提示
-
转录组,能揭示存在特定表达模式的基因,西交团队研发TDEseq生物测序法,样本,异质性,序列
- 详情
-
在灵活性、以及对于特定表达模式的表征能力之间,这些函数存在难以平衡的问题。
经过深入研究之后,该团队最终选择带有形状约束的 I 样条和 C 样条函数。
排版:初嘉实
通过此,他希望探索那些在肺腺癌发展过程中逐渐上调的基因。原因在于:这些基因可能对肺腺癌的恶化和转移起着关键作用。
此外,随着单细胞测序技术的发展,人们开始更加频繁地从具有不同表型的生物样本或人群样本中获取数据。
在一些生物过程中,这些基因可能扮演着重要角色。特别是那些表达模式呈现出随时间逐步上调或下调、或者先上调后下调、亦或是先下调后上调的基因,它们可能蕴含着更为丰富的生物学信息。
04/ 让心衰治疗告别“治标不治本”:科学家发现新型小分子激动剂,能有效缓解心肌肥大和纤维化
因此,课题组决定开发一种分析工具,旨在揭示这些数据中隐藏的特定表达模式的基因。
具体而言:在单细胞 RNA 测序(scRNA-seq)的时间序列数据分析中,人们通常会进行基因差异表达分析。
Yue Fan 是第一作者,孙世权担任通讯作者。
通过此,可以识别那些表达水平随时间变化或生物过程发展而变化的基因(这种基因也被称之为“时间动态差异基因”)。
05/ 新型AI大模型“能够对任意代谢酶进行活性预测”和生成式设计改造,私有数据集部署成为迈向产业化关键
02/ 马普所团队补齐固-液界面的基础理论缺失,突破纳米涂层的传统认知,推动无氟纳米涂层的应用
然而,在深入调研文献之后,他和团队发现了另一个尚未解决的问题:即尚未有任何成熟的方法,能在单细胞时间序列数据中,识别具有特定表达模式的差异表达基因。
后来,他们集中精力解决样本异质性带来的干扰问题,尽管尝试了多种批次的效应去除方法,但是效果都不如人意。
这一改进最终解决了在大规模数据集上应用 TDEseq 的问题,并取得了令人满意的效果。
总的来说,TDEseq 为相关领域的数据分析提供了有力工具。大量的数据仿真和实例数据分析也证明,本次方法具有较好的可靠性和有效性。
图 | 相关论文(来源:Genome Biology)
1.Fan, Y., Li, L., & Sun, S. (2024). Powerful and accurate detection of temporal gene expression patterns from multi-sample multi-stage single-cell transcriptomics data with TDEseq.Genome Biology, 25(1), 96.
随着单细胞与空间组测序技术的迅猛发展,使得从分时间与空间两个维度探索基因表达的动态变化过程成为可能。
不同的拟合函数,对于分析结果有着显著的差异。初期,课题组尝试了多种以往被用于 bulk 时间序列数据的拟合函数,包括多项式函数、B 样条、Sigmoid 函数等。
2020 年底,西安交通大学孙世权教授正在利用单细胞与空间转录测序技术,研究肺腺癌进化过程的研究课题。
然而,在样本异质性极大的情况下,线性混合模型也显得力不从心。
图 | 孙世权(来源:孙世权)
确定拟合函数之后,该团队在实际数据测试中又遇到了新难题:当数据集包含多个样本时,样本层面的异质性会极大地干扰分析结果。