医疗健康大模型伦理与安全白皮书(93页 WORD)医疗健康大模型兴起, 但在应用中面临诸多问题。 本 白 皮 书 旨 在 全 面 剖 析 医 疗 健 康 大 模 型 应 用 的 各 方 面 情 况 , 包 括 技 术 分 析 、 伦理法律评测、模型评测及提升措施等, 为其安全、有效、合规应用提供指导, 促进医疗行业智能化发展, 保障患者权益与医疗质量 。《 医疗健康大模型应用 伦理与安全白皮书 》 围绕医疗健康大模型展开多方面探 佳实践建议。 其二, 介绍通用大模型评测框架的任务定义 、 数据准备和评测方法 ; 概 述 医疗 健康 领域大模型评测的科学性 、 安全 性 、 合规性 、 伦理道德等方 面, 并 列 举 中 文 医 疗 健 康 评 测 集 ; 以 Med Bench 和 MedEth icEval 为 例 展 示评测实践过程。 其三, 聚焦 于医疗健康 大模型 医疗大模型评测 3.1 通用大模型评测框架 3.1.1.任务定义 3.1.2.数据准备 3.1.3.评测方法 3.2 大模型在医疗健康领域的评测概述 3.2.1.科学性:从通用能力到医学专业能力的提升 3.2.2.安全性:从潜在风险识别到安全输出保障 3.2.3.合规性:确保法律与行业标准的严格遵守 3.2.4.伦理道德:从责任性到文化适配的全面评估 3.2.5.中文医疗健康评测集 3.320 积分 | 93 页 | 12.19 MB | 5 月前3
全球计算联盟GCC:2025年异构算力协同白皮书际 的各类异构算力芯片齐头并进。 然而,因芯片架构不同、通信协议不统一、算存传能力差异而导致的异构算 力碎片化、生态割裂及协同效率不足等问题日益显现。构建统一计算、统一通信、 统一调度和统一评测的异构算力协同体系,实现异构算力间的无感知计算、无阻 碍通信协作、资源的高效调度和自动化测评,是推动异构算力基础设施迈向新阶 段的关键路径。 本白皮书通过系统性梳理算力产业发展现状、异构算力协同体系架构、关键 .........................................................................................15 3.4 统一评测体系................................................................................................. ASIC、GPGPU 不同路线算力差异,北向承载多场景、多行业、多模态大模型,构建异构算 力协同生态体系,实现异构算力的无感知计算、无阻碍通信、无闲置调度和无差异评测。异 构算力协同生态体系包括统一计算、统一通信、统一调度和统一评测四方面,通过四个核心 维度的统一化实现异构算力资源的深度融合。 图 异构算力协同体系架构 (1)统一计算:打破异构壁垒构建算力融合底座 统一计算是异构算力协10 积分 | 31 页 | 1.21 MB | 4 月前3
阿里云:2025年阿里云百炼安全白皮书为企业提供开箱即用的 AI 能力,大幅降低了 使用门槛,提升了部署效率,显著提升了业务敏捷性和创新能力。此外,MaaS 提供 了 AI 基础设施层的算力调度、存储管理、网络传输等核心支撑能力,覆盖了模型训练、 评测、部署、推理等全流程服务,从而满足不同行业对服务可用性的差异化需求。 3 公共云和 MaaS 是兼顾性能、效率、安全的 最佳解决方案 23 22 ALIBABA CLOUD MODEL STUDIO 的方向发展。 ● 合规遵循:严格遵循法规和国标,对训练数据执行信息化筛选与过滤,并通过技 术手段构建围栏防护,防止模型被滥用或生成违法不良信息。 ● 安全可靠:全面落实国标要求,执行体系化安全评测;依托红蓝对抗持续提升模 型鲁棒性,确保模型在面对恶意攻击时大模型能够保持正常运行并输出可靠结果。 ● 伦理向善:通过安全训练实现价值观对齐,并在生成内容中主动开展正向引导, 在开放可控的环境中助力生产力提升与价值创造。 视 频、代码等多模态能力,实现跨模态深度语义对齐,显著提升模型在复杂任务中的表 现力和泛化能力;在安全治理方面 , 通义构建了模型全生命周期安全保障体系,涵盖 训练数据采集、模型训练、模型安全评测、服务部署与运行,全面保障模型的“安全、 可靠、可信赖、可用”。 49 48 ALIBABA CLOUD MODEL STUDIO SECURITY WHITE PAPER 安全 可信的20 积分 | 59 页 | 45.36 MB | 4 月前3
AI知识库:电力行业智能转型的新底座(23页 PPT)改 写 智 能 推 理 Rerank 多轮校验 上下文增强 知识问答 二次创作 分析推理 总结摘要 支持 29 种多模态数据 ,综合能力上 , 360 RAG 方案在中文评测基准 SuperCLUE-RAG 专项榜单中表现优异取得榜单第二 , 通过 了中国信通院 “可信 AI 检索增强生成产品”评估认证。 AI 企业知识库特点 2 : 领先的多模态 RAG& 知识解析技术 RAG 架构 ,任意模块均可插拔 ★ 自研高性能向 量库 ,达到 18.7 万 QPS 片 段入库 智能标签 智能摘要 问答对提取 精细化的 数据增强 策略 向量库 ★ 第三方评测版式分析效果准确率达到 90% 去水印 ,去除 LLM 识别干扰 AI 企业知识库特点 2 : 领先的多模态 RAG& 知识解析技术 , 让 AI 精准理解知识 n 支持单图直检、20 积分 | 23 页 | 4.45 MB | 5 月前3
2025年云计算研究白皮书-中国电信动执行;协作层面涵盖集中式、去中心化与混合式多智能体组织;演化层面通过自反学习、群体共演化和 外部知识反馈不断提升策略稳定性与适应性。同时,工具生态为智能体提供知识检索、程序执行与应用 操作等能力扩展,评测体系则从通用任务、行业场景到多 Agent 协作全面衡量系统的可靠性与智能水平。 借由这些能力的收敛,LLM Agent 正成为构建可扩展、可协作、可演化智能系统的关键技术路径。 多模态与具身智 动执行;协作层面涵盖集中式、去中心化与混合式多智能体组织;演化层面通过自反学习、群体共演化和 外部知识反馈不断提升策略稳定性与适应性。同时,工具生态为智能体提供知识检索、程序执行与应用 操作等能力扩展,评测体系则从通用任务、行业场景到多 Agent 协作全面衡量系统的可靠性与智能水平。 借由这些能力的收敛,LLM Agent 正成为构建可扩展、可协作、可演化智能系统的关键技术路径。 3.3.1.1 实现可迁移的长期积累。 Agent 评测 评测体系从通用任务、领 域场景到多 Agent 协作, 系统性衡量智能体在推 理、规划、工具使用、环 境操作与长期自治等维 度的综合表现,是检验 Agent 是否“可用、可信、 可落地”的关键标准。 NeurIPS ACL EMNLP ICLR ICML TPAMI ICRA • 通用评测:清华大学团队 [515] 提出 A10 积分 | 140 页 | 11.65 MB | 1 月前3
2025企业出海数字化白皮书的选项,怎么迅速做出高质量的选择。 为了解决这一挑战,思科 ThousandEyes 可以帮助企业在出海前进行全面的网络环境评测。ThousandEyes 作为一款 强大的网络监测和可视化工具,能够远程提供端到端的网络性能分析,无需到国外现场,即可帮助企业提前识别并优化 海外服务资源。典型模式包括 o 云服务性能评测 企业在选择 AWS、Azure、Google Cloud 等海外云服务时,需要评估各个云平台的访问速度、网络延迟、丢包率以及 、丢包率以及 服务稳定性。ThousandEyes 通过全球分布的探测点,模拟用户访问不同云端数据中心的实际情况,提供详细的网络路 径分析,帮助企业选择最优云资源。 o IDC 机房稳定性评测 企业可能需要租用海外 IDC 机房部署业务应用或存储数据。在选定 IDC 机房之前,ThousandEyes 可监测机房的网络 连通性、SLA(服务等级协议)达标情况,并检测机房是否存在潜在 能够追踪不同 运营商的带宽利用率、BGP 路由健康度、网络拥塞情况,以及动态路径调整情况,帮助企业选择最优的网络服务商, 避免因运营商问题导致业务受损。 通过思科 ThousandEyes 的评测,企业能够在出海前精准洞察目标市场的网络环境,并根据实际测试数据制定最优 IT 基础设施部署策略。这不仅能降低海外业务的网络风险,提高用户体验,还可优化成本,避免因选择不佳的云服务或 IDC20 积分 | 62 页 | 12.38 MB | 5 月前3
2025年应用全生命周期智能化白皮书检索增强生成(RAG)的基本流程 RAG 技术目前在多个领域都发挥了重要作用,如智能客服、医疗、金融和研发领域。在研发领域,如上图所示, 通过数据飞轮与 RAG 技术的结合,构建知识数据清洗、转化和评测流水线,可以支持各类研发作业,迭代优化高质量 领域知识,淘汰冷门知识,实现知识的 E2E 生命周期闭环,持续提升大模型推理的效果;通过为应用层抽象并统一多 种知识数据与存储,可以实现安全高效的访问,简化并提升 在数据安全技术,需要支持数据来源可信,数据内容合规,数据版权合规,敏感信息识别与关键信息资产检测, 数据来源可追溯、数据防篡改与防泄漏等。 模型开发安全方面,需要保障模型来源可信、可溯源,模型安全评测与版本管理,支持防篡改与防泄漏,模型领 域隔离强化训练与合规等。 生成内容安全方面,需要控制领域性的安全风险,例如软件应用开发中代码的安全治理、版权合规,支持 AI 攻击 检测、内容风控、用户20 积分 | 59 页 | 8.39 MB | 8 月前3
数字中国十五五发展趋势白皮书-华信咨询年)》显示,2024 年我国高质量数据集数量同比增长 27.4%,标志高质量数据集建设进入加速期。同时,国家数据 局指导全国数据标准化技术委员会发布高质量数据局建设 指南、格式要求、分类指南、质量评测规范等标准,并进行 试点验证。遴选出 140 家高质量数据集方向标准/技术文件 验证试点典型单位,覆盖工业制造、金融服务、科技创新、 医疗健康、现代农业、交通运输等重点行业和领域。三是数 据10 积分 | 93 页 | 1.52 MB | 1 月前3
上海科学智能研究院:2025年科学智能白皮书系统安全评估与防护 现有安全评估依赖静态测试和对抗攻 击实验,难以全面评估开放环境下 AI 系 统的安全性。为持续监测通用大模型的安 全风险,发展自动化、覆盖面广、风险发 现能力强的 AI 动态安全评测技术尤为重 要。 突破路径:构建自动化安全评估工具, 基于博弈论和机器学习开发自适应评估方 法,探索通用安全标准;研究面向内生安 全的大模型风险靶向挖掘技术,发现代表 性风险用例,形成风险数据库;研究基础20 积分 | 29 页 | 2.74 MB | 9 月前3
2025年人工智能就绪度白皮书-企业数智化转型的Al变革路径与评估指南化。科技界的开闭源之争由来已久,而近年来国内各 类开源社区、开源基金会的设立,极大促进了开源生 态的壮大。根据工信部信息,2025年中国已成为全球 开源参与者数量排名第二、增长速度最快的国家1。根 据国际大模型评测榜单LiveBench,全球排名前十的 模型仅两款开源且均来自中国,分别是QwQ-32B和 DeepSeek-R12。此背景下,数量庞大的开发者和中小 企业依靠“基础模型开源化+垂直领域私有化定制”就20 积分 | 78 页 | 21.63 MB | 9 月前3
共 12 条
- 1
- 2
