Deepseek在药企研发领域的本地化部署和应用场景BMS-986278 in Pulmonary Fibrosis 1. 结构比对:使 用 PDB 条目 7BZ9 ( 人源 LPA1-Gi 复合物 ) 作为模板,通过 SWISS-MODEL 构建同源模型 ( 序列相 似 性 9 2 % ) 1 2. 结合口袋分析: · 使 用 PocketFinder 识别出体积为 580 A 的配体结合腔 ·PLIP 分析显示 10 个特异性相互作用残基,其中 4 个保守于 相关专利信息 SI-B001 的核心专利家族包括: SI-B001 的 序 列 信 息 序列数据库查询方法 1. 智慧芽 Bio 生物序列数据库:通过药物 / 基因索引模块输入 "SI-B001°, 筛选抗体序列类型,结合靶点名称 ( 如 PD-L1/4-1BB) 进行交叉验证。若序列未公开,可通过轻链 (VL) 、 重 链 (VH) 或 CDR 区域 ( 如 HCDR3) 四川百利药业 ) 筛选核心专利,通过序列助手功能定位权利要求中的 SEQ ID NO, 提取全长或可变区序 列 10 11. 3. 新药情报库关联分析:在 Synapse 平台查询 SI-B001 的研发管线信息,关联其 IND 申请资料中的序列披露片 段, 结合文献数据库 ( 如 PubMed) 补充注释 1213 。 SI-B001 的具体序列数据 芽仔与 Deepseek10 积分 | 33 页 | 2.29 MB | 9 月前3
规划和自然资源行业应对DeepSeek浪潮的思考混乱的语言。 1 、语言模型概 述 语言模型( Language Model , LM ) 目标是建模自然语言的概率分 布 词汇表 V 上的语言模型由函数 P(w1w2...wm) 表示 ,表示词序列 w1w2...wm 作为 一 个句子出现的可能性大小。对于任意词串 w1w2...wm ∈ V+ ,则有 P (w1w2...wm ) > 0 ,并且对于所有词串, 函数 P w1 生成 w2 ,再根据 w1 和 w2 生成 w3 , 以此类推,根据前 m − 1 个 单词生成 最后一个单词 wm 为了减少 P (w1w2...wm ) 模型参数量 ,可以利用句子序列通常情况下从左至右的 生 成过程进行分解 ,使用链式法则得到: 1 、语言模型概 述 学习语义关系 理解词语含义:大模型通过大量文本中的使用场景来 理解词语含义。比如,当看到“苹果 ”一词频繁与水 的各类语言模型的发展及预训练微调范式在自然语言处理 各 Transformer 结构是由谷歌在 2017 年提出并 首 先应用于机器翻译 Transformer 结构完全通过注意力机制完成对源 语 言序列和目标语言序列全局依赖的建模 。 如 今 , 几乎全部大语言模型都是基于 Transformer 结构 的。 2 、 Transformer 结 构 类任务中取得突破性进展。 基于 Transformer10 积分 | 62 页 | 12.36 MB | 8 月前3
基于大模型的具身智能系统综述使用基于 Trans- former 体素编码器得到体素特征, 而自然语言则通 过 CLIP 的语言编码器转化为语言特征, 随后体素 特征一起输入至 Perceiver Transformer, 最后输出 序列经过解码器处理, 恢复到原始体素网格的维度, 并用于预测离散化的行动动作. 通过对场景进行三 维体素化, 并使用编码器进行场景、语言的特征提 取, PerAct 能够有效地对环境进行建模, 获取全局 考虑对同一物体执行不同任务时对应的关键点相似 但动作可能截然不同, KITE 使用大语言模型从指 令中提取任务类型 (如抓取、放置、开启、关闭), 并 将锚定模块所得关键点与任务类型输入至动作生成 模块中, 得到完成整个任务所需的动作序列. 实验 表明, 相比于依赖预训练视觉语言模型或仅采用端 到端视觉运动控制而忽视技能模块的方法, KITE 在演示数据较少或相当的情况下训练效果更优. CoPa[96] 通过部件空间约束实现通用机器人操 通过语言提示使视 觉语言生成相应的空间几何约束. 获取操作约束之 后, CoPa 计算出抓取后的一系列目标姿态, 并将目 标姿态规划形式化为一个受约束的优化问题, 从而 得出符合物理规律且能精准执行的连续动作序列. Robo-ABC[98] 则通过从人类视频中提取物体的 交互经验, 并存储为可供性的经验, 当面对新物体 时, 机器人通过检索记忆中视觉或语义上相似的物 体来获得可供性, 并利用预训练的扩散模型将检索20 积分 | 19 页 | 10.74 MB | 3 月前3
基于DeepSeek AI大模型量化交易可信数据空间设计方案(249页 WORD)AI 在量化交易中的典 型应用场景与技术实现路径: 数据预处理与特征工程 AI 通过自动化特征提取与降维技术处理金融数据的非线性和高噪声 特性。例如,使用 LSTM 网络对分钟级行情数据进行时间序列建 模,自动捕捉价格波动中的隐含模式。特征重要性分析工具(如 SHAP 值)可量化因子贡献度,优化输入变量。 高频数据清洗:基于异常检测算法(如 Isolation Forest)自 动识别并修正异常报价 规则,通过历史数据回测构建线性策略,例如均值回归、动量策略 等。其典型特征包括: 策略逻辑固化:基于人工设定的数学公式或经济理论,如 Black-Scholes 期权定价模型 数据处理方式:使用结构化数据,依赖时间序列分析和截面数 据分析 执行效率:通常在毫秒级响应,但策略迭代周期需要数周至数 月 AI 量化交易则采用机器学习范式,通过非线性模型捕捉市场微 观结构特征。深度强化学习(DRL)和时序预测网络(如 数据清洗与预处理是确保量化交易系统数据可靠性的核心环 节,其目标是通过规范化处理消除原始数据中的噪声、异常值和结 构性缺陷,从而为模型训练提供高质量输入。以下是关键实施步骤 与技术要点: 1. 缺失值处理 针对金融时间序列数据常见的缺失问题,采用分层修复策略: o 日内高频数据(如 tick 级)采用线性插值法补全,公式 为:xt=xt −1+ (xt+1− xt −1) 2 o 日频以上数据采用 EMA(指数移动平均)平滑处理,权10 积分 | 261 页 | 1.65 MB | 22 天前3
2025年超节点发展报告-华为&中国信通院3. 传统服务器集群阶段(大模型主导):当模型参数达到千亿乃至万亿级别,单机已无法满足需 求,必须使用大规模服务器集群进行训练。这引入了序列并行、专家并行等更复杂的并行策略。训 练集群的总规模(卡数)是数据并行(DP)、张量并行(TP)、流水并行(PP)和序列并行(CP) 等多种并行维度的乘积。随着集群规模增大,单纯扩大数据并行(DP)维度会受到限制。因为在全 局批次大小(GBS)固定的情况下,增加 超节点能够实现内存的全局管理和灵活访问。超节点内所有互联设备的内存地址需全局唯一,基 于全局内存可实现任意设备间的灵活访问。这使得大模型训练中频繁的参数同步操作,无需经过传 统的“序列化 - 网络传输 - 反序列化”流程,直接通过内存语义通信完成,提升小包数据传输及离 散随机访存通信效率。 超节点是 AI 计算节点通过高速互联协议组成更大内存空间的 AI 系统。超节点可以支持 32 及以 备以下特征: 超节点发展报告 17 Scale Up 组网:突破单机算力边界,灵活构建大规模高速互联体系。 传统集群受限于 PCIe 带宽与拓扑结构,基于传统单机八卡架构实施张量并行(TP)、序列并行 (CP)、专家并行(EP)等策略时,通信链路易达瓶颈(卡间带宽通常低于 100GB/s),且并行 维度被限制在八卡以内。以大模型训练为例,当前主流的 MoE 模型(如 DeepSeek V3、Qwen320 积分 | 31 页 | 4.79 MB | 3 月前3
智能风控典藏版合集(377页)期风险相对较低。 核心而言,利用用户的基础画像、行为需求,外延到用户社会活动去挖掘用户是 否有真实合理的资金需求,是否有较好的还款意愿和还款能力,从而建立区分度 良好的风险模型。 3. 时间序列的处理:贷前 信贷业务通过用户授权获取征信报告,基于征信报告了解用户的信用历史,通过 分析用户的行为时序来理解用户的真实现金流需求。 常见的征信查询包括信用卡审批、贷款审批等,此类查询表征了用户在该 间点的动作、该动作的类型以及该动作的多个特征值,将每一项信息转为 Item 作为输入提供给 LSTM 单元,获取该单元的输出同时又作为下一个时 间序列的输入,不断学习从而获得更好的信息表达。 相比传统方案,基于这类机器学习的方案能够带来 KS 2 个点的提升。 4. 时间序列的处理:贷中 信贷贷中行为数据主要用于 B 卡的建模,在整个客户生命周期线上,用户存在不 断借钱、还钱的循环往复行为。基于此,在每个动作发生的时间切片上,可以生 的模型,关联图谱以及行为序列分析五个层次,其中黑名单机制,专家规则 都需要较高的人力成本,而且从行业现状来看,很难构建一份完整的业界黑 名单,从而导致黑名单机制的可实施性较差,而专家规则过度依赖专家经验, 存在较高的经验误判风险,主观犯错概率较大,因此通过黑名单或专家规则 的方式,很难构建切实可行的风控体系,而监督模型方法的难点在于样本的 定义与构造,因此关联图谱和行为序列分析这种自动化识别风险的方法吸引20 积分 | 377 页 | 30.66 MB | 3 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告𝜋𝜃和 𝜋𝜃𝑜𝑙𝑑 分别表示当前策略模型和旧策略模型,q, o是从问题数据集和旧策略 𝜋𝜃𝑜𝑙𝑑中 采样的输入和输出, 𝐴𝑡是基于广义优势估计(GAE)计算的优势值,依赖于奖励序列 {𝑟≥t} 和学 习的价值函数𝑉𝜓 。因此,PPO需要同时训练策略模型和价值函数。为避免奖励模型的过度优化, 标准做法是在每个词元的奖励中添加与参考模型的KL惩罚项 23 DeepSeek-R1 技术剖析:GRPO 赋能RL-Scale ➢From PPO to GRPO: ➢ PPO的价值函数通常是与策略模型规模相当的独立模型,这带来了巨大的内存和计算负担。 ➢ 奖励模型通常仅对输出序列的最后一个词元分配奖励,导致逐词元价值函数的训练复杂化。 ➢ GRPO:无需像PPO额外近似价值函数,而是利用同一问题下多个采样输出的平均奖励作为基线。具体而 言,对于每个问题 ,GRPO从旧策 理想的数据构建应当覆盖广泛的类别,并且难度分级明确,这有利于实现类似课程学习的效果,逐步提高模 型的能力。 ➢ 在奖励建模时,必须确保基于奖励模型的奖励机制不会被轻易攻陷。平衡推理长度与推理正确率之间 的关系。例如,针对一个序列中的下一个动作,若存在一个是错误答案而另一个是正确答案的情况, 传统的方法会倾向于提升选择正确答案的概率,同时降低选择错误答案的概率。然而,从推理长度的 角度来看,有时选择看似错误的答案可能会引导模10 积分 | 76 页 | 8.39 MB | 9 月前3
网络安全实战攻防演习防守方案(38页 PPT)漏洞名称、厂商品牌等多个维度 快速锁定资产范围 入侵检测 • 暴力破解监控 • Web 后门监控 • 本地提权监控 • 系统后门监控 网防 G01 (主机应用综合防护系统) 永恒之蓝 weblogic 反序列化 获取控制权 口令暴力破解 struts2 服务器安全巡检 子账号 攻击检测预警 服务器安全防护 安全审计 安全事件告警 备份所有在网防 G01 平台上的登录、 配置、开关功能等操作 自行创建下一级子账号供本单位其他部门使用 用户可以指定子账号可以操作的服务器 网页木马扫描 二进制后门扫描 弱口令扫描 漏洞扫描等 网站漏洞防护 放端口扫描 文件监控防护 网站后台防护 反序列化漏洞防护、任意文件读 取漏洞防护 网盾 K01 (网络威胁情报联防处置平台) 01 03 04 公安部第一研究所情报中心 攻击 IP 画像 行业情报 情报溯源 网络攻击阻断系统 自动检测与阻断 支持 70+ 种文件还原 自定义文件格式还原 WEB 攻击检测 远程漏洞攻击检测 邮件攻击检测 挂马攻击检测 恶意文件检测 Kill Chain 分析 ATT&CK 技术点分析 时间序列分析 实时告警 流量采集及文件还原 高级入侵植入检测 高级远程控制检测 可视化分析与预警 高级持续性威胁检测系统 攻击诱捕与威胁检测系统(蜜罐),可实现攻击诱捕与威胁监测,发现内网失陷主机。同时支持资产梳10 积分 | 38 页 | 10.08 MB | 3 月前3
英特尔-工业人工智能白皮书2025年版产效率、优化资源配置、增强质量控制和实现生产过程 的自动化与智能化。具体包括: • 设备管理: 在设备入库管理方面,AI 通过深度学习识别设备上的 条形码、二维码或设备特征,自动读取设备信息如型 号、序列号等;AI 的自然语言处理功能,可以自动 提取设备手册或标签上的文字信息,获取设备规格、 性能指标等关键参数。这些都能显著提升设备入库管 理的效率和准确性。 在设备运维管理方面,利用机器学习算法,对部署在 Transformer 架构。Transformer 架构通过引入自注意力 (Self-Attention) 机制,在处理序列数据时,能同时 关注输入序列的所有元素,并直接建立任意两个元素之间的联系,从而捕捉序列中的长距离依赖关系,实现对输入序列的 高效处理和理解。由于不依赖序列顺序,Transformer 架构在模型训练和推理时的并行处理能力更强,效率更高。 2. 参数规模大。大模型通常包含数 2022.3,BERT-Large,序列长度 512,批大小为 1。英特尔® 至强® 8480+:由 Numenta 测试,截至 2022 年 11 月 28 日。1 个 节点,2 个英特尔® 至强® 8480+,512 GB DDR5-4800,Ubuntu 22.04 内核 5.17,OpenVINO™ 2022.3,Numenta 优化的 BERT-Large,序列长度 512,批大小为 1。 英特尔®0 积分 | 82 页 | 5.13 MB | 9 月前3
智慧钢铁行业预测AI大模型应用方案(186页 WORD)4. 质量控制与监测:利用计算机视觉与数据分析技术,对生产过 程中的产品质量进行实时监测,及时发现和纠正问题,有效降 低不合格率。 5. 市场需求预测:结合历史销售数据与市场趋势,通过时间序列 分析与模型预测,优化库存管理与出货策略。 实施这些 AI 大模型应用方案,将对钢铁行业的各个环节产生 深远影响,具体效果可通过相关指标进行评估,如生产效率提升百 分比、生产成本降低幅度、产品质量合格率提升等。以某国际钢铁 间的关系。 决策树和随机森林:适用于处理非线性关系和特征交互,能有 效处理大量特征并评估其重要性。 深度学习模型(如卷积神经网络和长短期记忆网络):在处理 图像识别(如表面缺陷检测)和时间序列预测(如生产工艺参 数变化预测)时表现优异。 模型选择时,需考虑模型的复杂性、训练时长和数据需求,确 保其适应钢铁行业的实际应用场景。 模型训练是一个迭代过程,涉及到多个方面的考量。首先,需 (SVM):在分析小样本且特征维度高的情况下表 现良好,特别适合于分类问题。 4. 神经网络:尤其是深度学习模型如卷积神经网络(CNN)和 循环神经网络(RNN),能够处理庞大复杂的数据,适用于 图像识别、时间序列预测等场景。 5. XGBoost 等梯度提升模型:在结构化数据处理中表现出色, 能够有效提高预测精度,对特征的处理能力强。 对于选择具体模型时,以下几个方面需考虑: 数据规模:确定所用数据量的大小,选择适合规模的模型。60 积分 | 197 页 | 302.02 KB | 8 月前3
共 100 条
- 1
- 2
- 3
- 4
- 5
- 6
- 10
