在自然界的生长发育过程中,单个细胞是如何发育成为复杂的多细胞生物的?在癌症这样的复杂疾病中,为什么很少量的肿瘤细胞在一些条件下可以不断产生抗药性?这些都是生物医学领域中依然悬而未决的基本问题。为了解决这些疑问,我们需要在这些过程中精确跟踪每一个细胞,从而了解细胞的发育谱系(celllineage)和状态变化(cellstate)。随着单细胞基因组学的进步,研究人员可以为单个细胞进行“快照”,通过scRNA-seq,scATAC-seq等高通量测序手段分析每一个细胞的类型及状态信息。然而仅凭这些信息,我们无法准确推测细胞谱系,揭示细胞在连续时间轴上的发育和命运。为了能够同时收集细胞状态和细胞谱系信息,近年来,研究人员将基因条码标记和基因编辑技术,与单细胞基因组学方法相结合,双管齐下解析细胞命运和基因表达,并开始将这一技术应用在胚胎发育和肿瘤发展等研究领域中。年6月24日,斯坦福医学院的丛乐研究组(博士生NicholasHughes为第一作者)和普林斯顿大学的王梦迪研究组联手在MolecularCell杂志上发表文章Machine-learning-optimizedCas12abarcodingenablestherecoveryofsingle-celllineagesandtranscriptionalprofiles,报道了一种经深度学习优化产生的高分辨率CRISPR细胞条形码工具“DAISY-barcode“,并实现了单细胞水平基因表达信息与细胞谱系信息的整合。通过Cas12a对DAISY-barcode的编辑,可以从一个细胞开始追踪其数千个后代细胞。为了达到这样的追踪能力,丛乐研究组与王梦迪研究组合作,创建了一个用于设计CRISPR细胞条形码的在线机器学习(OnlineMachineLearning)模型。王梦迪课题组的VickiZhang主导了该模型的计算开发,并得到了丛乐课题组WeijingTang等人的协助。该模型搜索了巨大的基因编辑序列空间(20个碱基的CRISPR条形码序列,就存在超过1万亿种可能)以迭代优化条形码设计。这些在线学习优化出的条形码经过实验验证,比随机选择的条形码的信息熵提高了10倍。文章中报道的这种优化策略,还有潜力广泛应用于其他分子生物学的设计问题,如蛋白质设计和抗体工程。为了在疾病相关的领域中展示这种新型单细胞条形码工具,斯坦福大学遗传系博士生NicholasHughes,癌症生物学博士生屈元昊两人为首的实验组,与MonteWinslow研究组以及Chan-ZuckerbergBiohub合作,追踪了超过47,个人类黑色素瘤细胞的进化过程。通过这一单细胞状态、谱系联合分析,他们发现EZH2基因可能参与调节黑色素瘤细胞基因表达的记忆过程,并揭示EZH2、SUZ12所组成的PRC2复合物可能是影响其进化路径的关键表冠遗传机制。基于临床数据的分析表明,人黑色素瘤中的EZH2表达水平是预测患者存活率的潜在预后标志物。未来,他们计划进一步探索EZH2在人黑色素瘤中的重要作用及其与黑色素瘤生长驱动因子BRAF之间的相互协同,作为一种黑色素瘤及其他相关肿瘤的潜在多靶点疗法。此外,丛乐团队正在与MonteWinslow等科研团队合作,将这种单细胞条形码技术应用于更复杂的体内动物模型,以探索驱动癌症免疫逃逸,及癌细胞转移过程的新机制。
作为封面候选的示意图(花朵代表单细胞发育过程,花瓣上带有CRISPRBarcode条码,蜜蜂代表CRISPR-Cas12蛋白对条码进行编辑来记录细胞谱系,灌溉系统代表了通过机器学习优化CRISPR设计的神经网络,从而产生了高通量单细胞谱系记录技术)
论文图片摘要(上部分为技术路线及开发过程,下部分为应用场景及实例)原文链接:
转载请注明:http://www.0431gb208.com/sjsbszl/953.html