AI医疗系列二:AI大模型辅助先导药物的发现图1:药物研发生产流程,图片引自[1] 传统方法在先导化合物发现中的局限性 在AI大模型时代到来之前,先导化合物的发现以实验方法及计算机辅助药物 设计(CADD)的方法为主。这些方法都有着一些自身难以解决的问题。 实验方法: 当前,药物化学实验方法在很大程度上依赖于"试错法"。这些技 术涉及检查大量潜在的药物化合物,以识别具有所需特性的化合物。显然,这些 方法速度缓慢且成本高昂,若是完全基于实验方法进行药物虚拟筛选,完成化合 完成化合 物数据库的筛选所需的时间是一个天文数字。此外,实验方法还受到可用测试化 合物的供应和准确预测它们在体内行为的难度的限制。 计算机辅助药物设计方法(CADD): CADD相较实验方法极大地加速了先导 化合物发现的速度。在CADD中,先导化合物的筛选被普遍称为: 虚拟筛选 (virtual screening)。他使用基于分子力场或者量子力场的分子对接方式,对数 据库中的海量化合物与靶点 据库中的海量化合物与靶点进行对接,从而依据自由能最小化等方式,计算靶点 与药物的亲和力,完成药物的筛选。基于CADD的方法除了能够加速,还不受化 合物是否可以获得的限制。然而,基于CADD的虚拟筛选存在一个trade off, 即想要进行精确的筛选需要大量的计算资源和时间,而想要快速的完成筛选,则 会损失较大的精度。在药物发现这个先导化合物准确率极为重要的领域,大量的 计算资源和时间很难避免。曾有研究统计过,若想要对100亿个小分子进行令人10 积分 | 7 页 | 860.95 KB | 1 月前3
AI医疗系列三:AI大模型如何辅助临床试验患者匹配而完全无法开展。据估算每招募一名患者约花费6000至7500美元,成本可谓十分 高昂。因此如果进行高效的临床试验-患者匹配,是药物研发中急需解决的一个难 题。 传统的临床试验患者匹配方法及局限性 传统情况下,患者和试验的匹配是人工进行的。主要包含两大方向:TO B(找医 生)和TO C(找患者)。早期的患者招募机构多采取线下招募的方式,即项目人员 前往不同的城市、医院,乃至 Criteria、Exclusion Criteria,为临床试验挑选合适的患者。 这样的方法存在着一些难以解决的问题: • 招募效率低:人工筛选过程耗时且效率不高,很难快速识别和招募合适的患 者,这可能导致临床试验启动和完成的时间延长。 • 数据利用不充分:人工匹配的方法难以充分利用患者的历史医疗记录和其他 相关信息来进行更精细化的匹配。 • 性,例如患者可能同时患有多种疾病,这在传统的匹配方法中难以体现。 • 统计功效问题:由于传统匹配方法可能导致样本数量不足或样本选择存在偏 差,这可能影响临床试验的统计功效,即发现实际有效治疗效果的能力。 因此,如果存在一种方法能自动, 高准确率, 其大批量的为临床试验匹配患者,便可 节省大量的人力、物力,治愈更多的患者。 TrialGPT, 基于大语言模型的临床试验患者匹配方法 近年10 积分 | 8 页 | 900.80 KB | 1 月前3
AI医疗系列一:AI大模型在药物靶点识别中的应用药物研发生产流程,图片引自[1] 传统方法在靶点识别中的局限性 在AI的第三次浪潮之前,靶点的识别通常依赖多组学实验方法或者计算机辅 助药物设计的方法。多组学方法主要通过对病例组和对照组进行基因组、蛋白质 组等组学数据差异性比较,提取出可能致病的基因或蛋白靶点。这一方法通常有 着较高的准确性,但整体策略既费时又费力,且实验结果严重受到生物样本质量 的限制。 计算机辅助的方法主要包括反向对接,结构相似性分析等。这些计算技术能 析等技术的实 现。 基于上述所提的AI在靶点发现中的应用,本文将依据近期的AI医疗相关论 文,为大家介绍AI在药物靶点发现中的两个应用: 驱动新颖靶点的发现,预测蛋 白质结构。并将为大家介绍这些方法的技术细节以及局限性。 医学大语言模型驱动新颖靶点的发现 目前已有研究利用大语言模型,通过分析海量的医疗文本,实现了对新颖靶 点的挖掘。这里我们以英矽智能于23年9月发表的论文: Biomedical BioGPT-G信息提取流程,图片引自[2] 文章结论 通过上述方法,作者将prompt中的{DISEASE}设置为阿尔兹海默症、肌萎 缩性侧索硬化症等14个衰老相关疾病。对于每个疾病分别提取输出基因列表中 top200的基因及probability。最后提取出14个衰老疾病共有的靶点基因,共提 取出了9个靶点。这些靶点中6个是已经报道过的衰老相关靶点,一定程度上反 应了该方法的准确性。同时还发现了3个新颖靶点,其中1个由于不可成药性无10 积分 | 8 页 | 1.40 MB | 1 月前3
医院网络系统建设设计方案不同工作组间的用户二层互访,每个工作组就是一个虚拟局域网。虚拟局域网 的好处是可以限制广播围,并能够形成虚拟工作组,动态管理网络。 VLAN 在交换机上的实现方法,可以大致划分为 4 类: 1、 基于端口划分的 VLAN 这种划分 VLAN 的方法是根据以太网交换机的端口来划分,比如 Quidway S3526 的 1~4 端口为 VLAN 10,5~17 为 VLAN 20,18~24 为 VLAN 的最广泛的方法,IEEE 802.1Q 规定了依据以太网交换机的端口来划分 VLAN 的国际标准。 这种划分的方法的优点是定义 VLAN 成员时非常简单,只要将所有的端口 都指定义一下就可以了。它的缺点是如果 VLAN A 的用户离开了原来的端口, 到了一个新的交换机的某个端口,那么就必须重新定义。 2、基于 MAC 地址划分 VLAN 这种划分 VLAN 的方法是根据每个主机的 地址的主机都配置他属于哪个组。这种划分 VLAN 的方法的最大优点就是 当用户物理位置移动时,即从一个交换机换到其他的交换机时,VLAN 不用重 新配置,所以,可以认为这种根据 MAC 地址的划分方法是基于用户的 VLAN, 这种方法的缺点是初始化时,所有的用户都必须进行配置,如果有几百个甚至 上千个用户的话,配置是非常累的。而且这种划分的方法也导致了交换机执行 效率的降低,因为在每一个交换机的端口都可能存在很多个10 积分 | 58 页 | 929.00 KB | 7 月前3
从诊室到云端:医疗大模型的应用挑战与未来探索(一)医疗大模型超越传统方法的优势特征 大语言模型(Large Language Model)在医疗领域相对传统方法具有多方面的优势, 不仅体现在知识的提取整合上,也体现在医疗实践的各个环节之中。 在自动化的知识提取与整合方面,传统医疗信息整合通常需要大量人工努力,涉及文 献检索、数据抽取和手工整理,是一个费时费力的过程。大模型可以自动从大量医学 文献中提取知识,识别重要的疾病信息、治疗方法和疾病-基因关联等,迅速整合多个 联等,迅速整合多个 数据源,提供有价值的医学知识。 在临床文本分析与诊断支持方面,传统的临床文本分析通常依赖于规则引擎或浅层机 器学习方法,对复杂的医学文本难以处理。大模型可以处理自然语言文本,分析临床 病例和医学报告,帮助医生更快速地做出诊断和制定治疗方案。它可以理解上下文, 处理模糊信息,并且能自我学习和更新知识,这使得它在处理复杂和变化的医疗问题 时具有优势。 在医学影像分析方面,传统医 性和一致 性。 在医学研究和知识发现领域,传统医学研究依赖于繁琐的实验和文献回顾,速度较 慢。大模型可以分析大规模文献数据,发现新的疾病关联、药物靶点和治疗方法,加 速医学研究的进展,为科学家提供重要洞察。 大模型在医疗领域相较于传统方法具有自动化、高效性、多模态数据处理和个性化医 疗的优势。这些优势使医疗大模型成为医疗人工智能领域的有力工具,有望提高医疗 保健的质量和效率。 (二)医疗大模型面临的技术挑战与局限10 积分 | 8 页 | 2.44 MB | 1 月前3
智能AI,构建未来医院智慧图谱(35页 PPT)数据驾驶舱 • 患者全景视图 • 多条件筛选搜索引擎 • 研究路径导航式工具应用 • 科研项目管理 科研能力提升 • 科研方法论培训 • 人才培养 • 数据 + 工具 + 方法论融合 • 助力高水平医院建设 智慧医学科研平台 全院级“多模态异构数据治理 + 智能工具应用 + 科研转化体系建设”支撑高水平医院建设目标 多模态异构数据治理 科研方法学 统计方法学 成果转化方法学 科研设计 智能化专病库赋能 科研成果转化 科研方法论 科研设计赋能 科研方法赋能 辅助制定研究方案 协助制定搜集临床指标、生物 样本数据、基因检测数据等 科研流程智能引导 流程可视化、取数科研化、设 计灵活便捷 数据模型、表单 设计 专病数据采集10 积分 | 35 页 | 6.51 MB | 1 月前3
2025中国智慧中医行业发展报告然而获取用于构建模型的有标记的数据需要中医专家花费大量精力进行手工 标注,构建成本非常高,不依赖标注的神经网络技术作为机器学习领域的一个重 要分支也同样受到了大量研究者的重视,模糊计算、粗糙集等一些数学方法也被 应用到中医诊断的研究中。 在早期,研究者一般采用一种或两种技术来解决中医的智能诊断问题,随着 研究的深入和问题复杂度的增加,研究者发现采用多种技术更加有利于诊断问题 的解决,多种智能技术混合开始用于问题解决。 关节炎,提出了一种中医分型诊断系统。厦门大学人工智能研究所利用粗糙集、 神经网络及其软计算技术,构建了关于八纲辨证和脏腑辨证的多种模型和系统, 也取得了良好的成果。 虽然科研工作者利用机器学习对中医智能辨证诊断方法做了许多积极且富有 意义的研究探索,但受到技术手段制约,中医智能诊断系统诊断准确率低、覆盖 病种少以及系统应用率低的问题依然凸显。 (3)大数据与深度学习探索阶段 随着大数据产业和人工智 500 万美元融资,以帮助这家针灸馆实现物理疗法与草药疗法相结 合,提升对顾客整体健康的管理。 该诊所成立于 2019 年,旨在将传统中医的健康理念融入现代生活,让经验 证的缓解疼痛和压力治疗方法更加普适化,基于东方传统医学的现代化消费医疗 服务正逐渐使西方资本市场所认可。 3. 社会环境发展 (1)老龄化程度不断加深 中国已经成为世界上老年人口最多的国家,也是人口老龄化发展速度最快的10 积分 | 44 页 | 1.81 MB | 1 月前3
智能AI+智慧医院解决方案(40页 PPT)数据驾驶舱 • 患者全景视图 • 多条件筛选搜索引擎 • 研究路径导航式工具应用 • 科研项目管理 科研能力提升 • 科研方法论培训 • 人才培养 • 数据 + 工具 + 方法论融合 • 助力高水平医院建设 智慧医学科研平台 全院级“多模态异构数据治理 + 智能工具应用 + 科研转化体系建设”支撑高水平医院建设目标 多模态异构数据治理 科研方法学 统计方法学 成果转化方法学 科研设计 智能化专病库赋能 科研成果转化 科研方法论 科研设计赋能 科研方法赋能 辅助制定研究方案 协助制定搜集临床指标、生物 样本数据、基因检测数据等 科研流程智能引导 流程可视化、取数科研化、设 计灵活便捷 数据模型、表单 设计 专病数据采集10 积分 | 40 页 | 12.28 MB | 1 月前3
医药工业数智化转型典型应用场景节,应用数智技术提升新靶点和新药发现效率,加速药物 研发和临床试验进度。 1.精准靶点识别与筛选 面向疾病机制探究和药物靶点发现等业务活动,针对 传统实验方法在通量和成本方面的局限性问题,利用多组 学数据分析和文本挖掘方法,整合丰富的生物学数据,结 合自然语言处理、深度学习、图像识别以及大模型等人工 智能(AI)技术,构建新药研发知识图谱,开展复杂蛋白 质结构预测,显著提升药物靶点的识别和筛选效率。 工智能(AI)技术,以更高的效率和更低成本获得符合特 2 定要求的化合物,实现药物分子的从头设计及结构优化。 3.超高通量化合物虚拟筛选 面向新分子实体(NMEs)筛选等业务活动,针对传统 筛选方法效率低下和创新性不足的问题,利用计算机仿真、 分子模拟和成药性理化模型等技术进行高通量虚拟筛选, 加快化合物生物活性和药理作用的评估速度;基于人工智 能(AI)技术挖掘文献、数据库等,提高化合物筛选范围 于模 型的物料、工艺和装备协同设计与优化,提高工艺放大和 生产过程可靠性。将高质量的工艺和质量数据集与数学建 模方法或人工智能(AI)算法结合,辅助理解中药工艺中 关键物料属性、关键工艺参数(CPP)和产品关键质量属性 之间的关系,通过机器学习、迁移学习和强化学习等方法 实现数据增强,提升工艺模型可靠性和工艺参数的可调控 性,保持生产过程的稳定性和可控性。 13.数智化生物制品工艺设计0 积分 | 16 页 | 376.97 KB | 6 月前3
预训练大模型与医疗:从算法研究到应用Confidential | lvhairong@tsinghua.edu.cn 嵌入向量: • 在 GPT 里面,把一个记号作为一个 N 维浮点数向量来表示。这种用 一 个向量来表示一个单词或记号的方法按神经网络的术语就叫做嵌入 • 一个单词对应的向量叫这个单词的嵌入向量 • 把每个单词或记号( token )在 GPT 内部都会通过一层简单的神经 网 络映射层对应到一个嵌入向量,这个向量代表了记号的语言特征 commonsense reasoning." arXiv preprint arXiv:2110.08387 (2021) 知识图谱应用于大模型训练后阶段: Liu 等 人提出了知识生成式大模型提示方法,让 模型 进行知识预测,通过将知识图谱的三元 组形式 转化成 Question and answer 的形式, 让模型 生成一些知识,然后将这些知识进行 聚合,从 而得到最终的更为精确靠谱的结果。 arXiv preprint arXiv:2104.08696 (2021). 白箱算法的可解释性与模型构造本身高度相关, 因此对于大模型可以根据相关思路设计更具有 针对性的可解释性方法。 主流的模型相关可解释性方法: • 基于梯度显著性 [1] • 基于因果启发 [2] • 基于注意力机制 [3] • 基于神经元分析 [4] CHIMA 20Pag2 Tsinghua Confidential10 积分 | 52 页 | 28.32 MB | 7 月前3
共 53 条
- 1
- 2
- 3
- 4
- 5
- 6
