癌症治疗依赖于令人眼花缭乱的大量数据:以下是数据在云端的排序方式

癌症患者及其医生比以往任何时候都拥有更多有关该疾病及其治疗的信息,并且可用的信息继续以令人眼花缭乱的速度增长。然而,如果人们无法理解所有这些信息,那么所有这些信息都是没有用的。 

例如,考虑一位肺癌患者,他可能通过生成计算机断层扫描 (CT) 图像的筛查程序获得早期诊断。随着诊断和治疗计划的进展,他们的护理人员将引入 MR 和分子成像、病理数据(日益数字化)和基因组信息等数据源。 

飞利浦基因组学和肿瘤信息学总经理 Louis Culot 在亚马逊发布会上表示:“老实说,所有这一切对于护理团队本身来说都是一个非常艰巨的挑战,因为他们正在考虑如何最好地护理和治疗这些患者。”健康行业的网络服务虚拟活动。 

“现在在肿瘤学或任何医学学科中,这很重要,因为治疗很重要,干预也很重要,”库洛特说。 “我们不只是为了数据而需要数据。护理团队成员可以根据信息采取什么行动?”

为了更好地掌握所有这些数据,创新者转向云计算和机器学习等工具,这可能会挽救生命。在本周的 AWS 活动中,Culot 介绍了飞利浦与德克萨斯大学 MD 安德森癌症中心的合作伙伴关系,该中心旨在帮助医生整合所有数据,为患者制定个性化护理计划。 

Grail 软件工程高级副总裁 Satnam Alag 解释了他的公司如何使用云和机器学习来开发一个系统,该系统可以同时筛查患者数十种不同类型的癌症,而不是一次筛查一种。 

癌症筛查和治疗改进的影响怎么强调都不为过。 Alag 指出,2020 年,全球有超过 19 万癌症病例,近 10 万人死亡。据估计,三分之一的男性和四分之一的女性可能在一生中患上癌症。

“我或家人会被诊断出患有癌症吗?它在我身体的什么地方?可以治愈吗?还是它会杀了我?这些是我们许多人都有的共同问题,”阿拉格说。 

值得庆幸的是,随着我们收集更多数据点来研究癌症,科学家们也在快速开发新的治疗方案。分子分析的进步帮助科学家识别癌症的不同类别和子类别,以及不同的潜在疗法。 Culot 指出,2009 年,美国 FDA 批准了八种抗癌药物。到 2020 年,这个数字增长到 57 个。除此之外,目前约有 1,500 个临床试验正在向癌症患者开放。 

“总的来说,现在实际上有数百种可能的疗法或疗法组合可用于治疗癌症,”库洛特说。 “所以我们面临着双重挑战,对吗?我们如何汇总所有这些数据以更好地了解患者?那么从这个角度来看,这对于最佳治疗意味着什么呢?”

为了解决这个问题,MD 安德森的医生开发了精准肿瘤决策支持 (PODS) 系统,这是一种基于证据的工具,可以帮助医生评估相关信息,例如最新的药物开发和临床试验以及患者对治疗的反应。这有助于他们制定个性化的治疗计划。

癌症可操作性.png

2020 年,MD 安德森与飞利浦和 AWS 合作,向全球的医生和从业人员提供该系统。 

Culot 指出,出于多种原因,该系统只能存在于云端。有大量数据需要存储,并且需要进行大量数据处理。同时,该系统需要成为全球从业者安全、合规的多租户系统。 

Culot 指出,也许最重要的是,云允许医生协作并整合他们的数据,从而实现真正个性化的治疗计划。 

“人们将癌症视为一个大数据问题,但它也是我所说的一个小端问题,”库洛特说。他举了一个肺癌患者的例子,他得知自己患有带有特定突变的第四期肺癌。 

“你最终会对这些人群进行子集划分,因此即使是最大的医疗机构有时也只有少数患者符合我们试图学习的标准,”他说。 “能够以合规的方式组合去识别化的数据,以便我们能够从中学习,这是通过这些基于云的生态系统实现的。”

同样,Grail 的 Satnam Alag 表示,云对于该公司的多种癌症早期检测测试 Galleri 的开发至关重要。该测试旨在检测 50 多种癌症,作为单一癌症筛查测试的补充。

“利用基因组学和机器学习的力量需要大量计算,”阿拉格说。 “需要收集和扩展大量数据。” 

Galleri 测试通过单次抽血,使用 DNA 测序和机器学习算法来分析患者血液中的 DNA 片段。该测试专门寻找肿瘤在血液中脱落的无细胞核酸 (cfDNA),它可以告诉您体内有哪种癌症以及它来自哪里。 

“我们需要对个体进行癌症筛查,而不是仅仅筛查个体癌症,”阿拉格说。 “得益于过去 20 年发生的两次重大技术革命,现在这一切成为可能。首先,基因组学的力量——现在可以对完整的 DNA 进行测序……在几天内有效地生成数 TB 的数据。其次,是机器学习方面的大量创新。我们现在拥有能够构建具有数千万参数的复杂深度学习模型的专业知识。”

来源