AI医疗系列一:AI大模型在药物靶点识别中的应用合描述蛋白质序列。在 AlphaFold2中,每个氨基酸被视为一个单词,一串氨基酸序列就构成了一句 “话”。通过Transformer模型,AlphaFold2能够理解蛋白质序列中的“语境”,进 而预测出蛋白质的三维结构。 AlphaFold2的输入主要为蛋白质序列的多序列比对(MSA)结果,MSA的构 建方式是将输入的蛋白质序列与蛋白质数据库中的序列进行多比对,提取出与输 入序列相似的所有序 入序列相似的所有序列,并构建为一个矩阵。这种比对基于这样一个假设:序列 的相似性表示它们具有共同的进化起源。多序列比对可以帮助确定多物种保守的 序列区域,这些区域在进化过程中保持不变,可能是因为它们对生物有重要的功 能。AlphaFold2通过MSA来提取出蛋白质序列的进化信息,此外,如果在MSA 中的多个序列中观察到两个位置的氨基酸同时变化,那么这可能暗示这两个氨基 酸在蛋白质的空间结构中是相互接近的。Alpha ESMfold。 ESMfold放弃了MSA的构建步骤,而是采用了使用一个蛋白质大语言模型 ESM2,来对氨基酸之间的相互作用模式进行表征。ESM2同样基于 Transformer架构,可以针对输入的蛋白质序列直接提取出其包含进化信息 embedding。该embedding可以直接输入类似AlphaFold的Evoformer中。 这种端到端的计算方法,使得ESMfold的推理速度比AlphaFold2快了一个数量10 积分 | 8 页 | 1.40 MB | 2 月前3
电子-AI大模型+医疗:从问诊到新药开发Statista,2021 年全球制药行业总收入约 1.5 万亿美金,制药研发投入 约 2.4 千亿美金。DeepMind 是最早用 AI 赋能新药开发的企业之一,其推出 的 AlphaFold 主要解决从已知的氨基酸序列,预测相应蛋白质 3D 结构的问 题,为探索生命的起源迈出重要的一步。随着生成式 AI 的出现,业内开始 探索自动根据功能需求设计/优化蛋白质、给定抗原等目标蛋白生成抗体等 蛋白、给定靶点一键生成 Binder Biosciences 和加州大学研究团队发布的蛋白质语言模型 ProGen,在数百万个原始蛋白质序列上训练,可生成跨多个家族和功能的人造蛋白质。不 同于 AlphaFold2 利用 AI 的手段辅助理解自然界已有的蛋白结构,以 ProGen 为例的类 ChatGPT 生成式 AI 的目标是生成自然界不存在的人工蛋白质序列。虽然生成式 AI 在制药 领域的应用仍处于起步阶段,但天壤 XLab 负责人苗洪江博士认为,从 晶泰科技通过无标记的蛋白质序列数据(约 2.8 亿条)+抗体序列数据训练出的 ProteinGPT 可以一键生成符合要求的蛋白药物,应用案例包括:1)根据给定的靶点一键生成 Binder 蛋白;2)根据指定要求一键生成抗体文库;3)对性质欠佳的抗体进行改造,一键生成优 化后的抗体。 AlphaFold2 生成式AI 蛋白质结构预测:基于氨基酸序列,预测已知基因序 列的蛋白10 积分 | 10 页 | 1001.24 KB | 2 月前3
AI医疗系列二:AI大模型辅助先导药物的发现得了总计209M 个小分子的三维构像数据,并利用这些数据对Uni-Mol进行了充分的预训练。 Uni-Mol模型: 基本结构:Uni-Mol模型参考了transformer的骨架。他将分子进行了序列表 征以及结构表征,并在更新的过程中不断以自注意力的方式对两个表征相互 融合迭代。最终,可以以分子的CLS token 来表示整个分子在潜空间的嵌 入。Uni-Mol相对传统transform 原子对的欧氏距离。2,直接预测被掩盖的原子坐标。基于上述的三个预训练策 略,作者认为可以充分的学习到分子的合理表征。 图2:Uni-Mol模型骨架。左图为整体的pretrain模型及预训练策略。中图为模型的输 入,包括分子序列及结构信息。右图为Block内部的计算,图片引自[2] 作为结果,Uni-Mol达到了充分的分子表征效果。以分子生化性质数据集 MoleculeNet为例,MoleculeNet数据集中包括分子的水化自由能,亲脂性等10 积分 | 7 页 | 860.95 KB | 2 月前3
某高校智算中心解决方案(41页 PPT)天体研究 量子化学 分子动力学 混合精度计算 基于深度学习的分子模拟方法 深度势能 核聚变研究 凝聚态物理 等离子体计算 数值大气预报模式 大气环流模式 气候模式 类脑计算 序列比对 序列拼接 电镜三维重构 清华大学”地球模拟器” 首次突破 100T 持续升级 南京大学 AI 超 算 高校首套智算平台 计算能力 3.4P 中南大学 计算性能突破 4.7P 全国高校40 积分 | 41 页 | 9.91 MB | 8 月前3
预训练大模型与医疗:从算法研究到应用masked language model )和下一句 预测任务 ( next sentence prediction )进行预训练,使得模型能够学习到上下 文 关系和词汇语义 通常用于文本分类、序列标注、问答等任务 GPT : Generative Pre-trained Transformer 单向模型,只考虑前文,不考虑后文 采用自回归( autoregressive )的方式生成文本,即逐个生成下一个词 1. 使用密集连接的方式可以连接不同层的 表示到最顶层,有助于增强 BERT 表示 的 能力。 2. 融合图结构,一方面可以使大模型编码 图结构信息,另一方面有助于提升大模 型建模序列中的精确语义信息。 使用 BookCorpus 和 WikiPedia 训练 4 层的 tiny BERT 和 tiny EnhancedBERT ,结果 显示 EnhancedBERT 相较于原始10 积分 | 52 页 | 28.32 MB | 9 月前3
中医医院智慧一体化建设项目需求规格设计方案(219页 WORD)支持将患者分配至指定医生或诊室排队候诊功能。 支持按已设定规则自动选择医生或诊间功能。 支持对老、幼、军人、离休患者进行“特殊”标识功能,此类患者优先就诊。 支持患者无法就诊时,可将患者移出排队序列,做弃号处理功能; 支持过号处理功能,可将过号病人重新加入分诊队列。 支持转诊功能,可将患者转诊到院内其他科室。 支持手工调整排队信息功能。 支持绿色通道患者不经语音叫号直接就诊功能。 支持分诊台向候诊区广播语音功能。 从院区维度,统计院区的病例数、预估结算费 用、预估结算差异、差异比例、差异分类、差异 主因、费用结构占比、院区排名等; 2.支持院区排名的查看及排序; 3.支持院区之间的横向.对比;支持查看不同院区 的预估结算差异随时间序列的变化趋势; 4.支持院区的超支结余占比分析; 5.支持院区服务能力及服务效率的展示分析; 6.支持不同院区对应的病例数,进行下钻; 7.支持不同院区的病例数,按照病例类型分类; 8.支持数据的查询与下载; 从专科维度,统计专科的病例数、预估结算费 用、预估结算差异、差异比例、差异分类、差异 主因、费用结构占比、专科排名等; 2.支持专科排名的查看及排序; 3.支持专科之间的横向.对比;支持查看不同专科 的预估结算差异随时间序列的变化趋势; 4.支持专科的超支结余占比分析; 5.支持专科服务能力及服务效率的展示分析; 6.支持不同专科对应的病例数,进行下钻; 7.支持不同专科的病例数,按照病例类型分类; 8.支持数据的查询与下载;10 积分 | 429 页 | 374.35 KB | 3 月前3
AI医疗系列三:AI大模型如何辅助临床试验患者匹配多模态任 务提供了新的思路。简单来说,大语言模型是一种可以理解给定的上下文,并根据 上下文做出回应的生成模型。大语言模型首先在一个包含数万亿单词的大型语料库 上进行预训练,训练的方式是通过给定的文本序列去预测下一个单词,从而得到基 础模型(base model),如GPT-3、PaLM、LLaMA等。然后,这些基础模型可以 进一步在特定的任务上进行微调,以更好地遵循人类的指示,从而得到现在被人们10 积分 | 8 页 | 900.80 KB | 2 月前3
基于DeepSeek AI大模型辅助病历书写系统设计方案 (226页 WORD)XTJSON PRIMARY KEYFOREIGN KEYNOT NULLDEFAULT NULL 临床文书内容 关键设计要点包括: 1. 患者 ID 采用 UUIDv4 标准,避免暴露序列信息 2. 诊断代码字段关联 ICD-10 国际标准编码表 3. 临床文书内容字段支持 Markdown 格式文本存储 4. AI 标注结果以 JSON 格式存储实体识别、关系抽取等结构化数 型采用监督学习与自然语言处理技术,通过以下流程实现功能闭 环:首先对电子病历数据库进行特征工程处理,提取关键临床实体 (如主诉、现病史、检查结果),随后通过双向 LSTM 与 CRF 结合 的序列标注模型完成实体识别,准确率达到 93.2%(测试集 n=15,000 份三甲医院病历)。对于病程记录生成任务,系统使用 改进的 Seq2Seq 架构,在编码阶段引入医疗知识图谱嵌入,解码 阶段采用覆盖度机制避免内容重复。 标准协议,系统可在不改造原有医院信息系统的 情况下完成数据对接。关键数据预处理流程包括: 非结构化文本的分词与实体标注(准确率≥92%) 异常值检测与数据标准化(符合 ICD-10 编码规范) 时间序列数据对齐(误差<5 分钟) AI 处理层部署了三个核心引擎:自然语言处理引擎采用 BERT+BiLSTM 混合模型处理医学术语,在测试集上达到 88.7%的 实体识别 F1 值;临床决策支持引擎基于知识图谱构建,包含超过10 积分 | 239 页 | 1.64 MB | 2 月前3
医院智能化系统规划设计方案电子标签的人体感应系统发生作用,并发出报警,以 确保婴儿在系统保护范围。 防被盗 :在区域边界安装读写器,当佩戴标签的婴儿 没有经过系统的认证签出而被非法抱出,经过区域边 界时,系统产生报警。 防抱错 :除婴儿腕带唯一序列号外,门口机支持人脸 识别,可有效判断是否走错房间,同时加入感应器可 有效与婴儿腕带感应匹配。 系统特点 BI决策系统 BI决策系统通过对医院运行数据的整合和有效 分析,实现对医院管理:医院医护人员的优化配置、10 积分 | 54 页 | 8.57 MB | 8 月前3
智慧医疗医院智能化系统规划设计方案警,以 确保婴 儿 在系统保护范围。 防被盗 :在区域边界安装读写器,当佩戴标签的婴 儿 没有经过系统的认证签出而被非法抱出,经过区域边 界时,系统产生报警。 防抱错 :除婴 儿 腕带唯一序列号外,门口机支持人脸 识别,可有效判断是否走错房间,同时加入感应器可 有效与婴 儿 腕带感应匹配。 系统特点 BI 决策系统 BI 决策系统通过对医院运行数据的整合和有效分 析,30 积分 | 54 页 | 38.63 MB | 8 月前3
共 34 条
- 1
- 2
- 3
- 4
