评测 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

医疗健康大模型伦理与安全白皮书（93页 WORD）

医疗健康大模型兴起，但在应用中面临诸多问题。本白皮书旨在全面剖析医疗健康大模型应用的各方面情况，包括技术分析、伦理法律评测、模型评测及提升措施等，为其安全、有效、合规应用提供指导，促进医疗行业智能化发展，保障患者权益与医疗质量。《医疗健康大模型应用伦理与安全白皮书》围绕医疗健康大模型展开多方面探佳实践建议。其二，介绍通用大模型评测框架的任务定义、数据准备和评测方法；概述医疗健康领域大模型评测的科学性、安全性、合规性、伦理道德等方面，并列举中文医疗健康评测集；以 Med Bench 和 MedEth icEval 为例展示评测实践过程。其三，聚焦于医疗健康大模型医疗大模型评测 3.1 通用大模型评测框架 3.1.1.任务定义 3.1.2.数据准备 3.1.3.评测方法 3.2 大模型在医疗健康领域的评测概述 3.2.1.科学性：从通用能力到医学专业能力的提升 3.2.2.安全性：从潜在风险识别到安全输出保障 3.2.3.合规性：确保法律与行业标准的严格遵守 3.2.4.伦理道德：从责任性到文化适配的全面评估 3.2.5.中文医疗健康评测集 3.3

20 积分 | 93 页 | 12.19 MB | 6 月前
3
全球计算联盟GCC：2025年异构算力协同白皮书

际的各类异构算力芯片齐头并进。然而，因芯片架构不同、通信协议不统一、算存传能力差异而导致的异构算力碎片化、生态割裂及协同效率不足等问题日益显现。构建统一计算、统一通信、统一调度和统一评测的异构算力协同体系，实现异构算力间的无感知计算、无阻碍通信协作、资源的高效调度和自动化测评，是推动异构算力基础设施迈向新阶段的关键路径。本白皮书通过系统性梳理算力产业发展现状、异构算力协同体系架构、关键 .........................................................................................15 3.4 统一评测体系................................................................................................. ASIC、GPGPU 不同路线算力差异，北向承载多场景、多行业、多模态大模型，构建异构算力协同生态体系，实现异构算力的无感知计算、无阻碍通信、无闲置调度和无差异评测。异构算力协同生态体系包括统一计算、统一通信、统一调度和统一评测四方面，通过四个核心维度的统一化实现异构算力资源的深度融合。图异构算力协同体系架构（1）统一计算：打破异构壁垒构建算力融合底座统一计算是异构算力协

10 积分 | 31 页 | 1.21 MB | 6 月前
3
阿里云：2025年阿里云百炼安全白皮书

为企业提供开箱即用的 AI 能力，大幅降低了使用门槛，提升了部署效率，显著提升了业务敏捷性和创新能力。此外，MaaS 提供了 AI 基础设施层的算力调度、存储管理、网络传输等核心支撑能力，覆盖了模型训练、评测、部署、推理等全流程服务，从而满足不同行业对服务可用性的差异化需求。 3 公共云和 MaaS 是兼顾性能、效率、安全的最佳解决方案 23 22 ALIBABA CLOUD MODEL STUDIO 的方向发展。 ● 合规遵循：严格遵循法规和国标，对训练数据执行信息化筛选与过滤，并通过技术手段构建围栏防护，防止模型被滥用或生成违法不良信息。 ● 安全可靠：全面落实国标要求，执行体系化安全评测；依托红蓝对抗持续提升模型鲁棒性，确保模型在面对恶意攻击时大模型能够保持正常运行并输出可靠结果。 ● 伦理向善：通过安全训练实现价值观对齐，并在生成内容中主动开展正向引导，在开放可控的环境中助力生产力提升与价值创造。视频、代码等多模态能力，实现跨模态深度语义对齐，显著提升模型在复杂任务中的表现力和泛化能力；在安全治理方面 , 通义构建了模型全生命周期安全保障体系，涵盖训练数据采集、模型训练、模型安全评测、服务部署与运行，全面保障模型的“安全、可靠、可信赖、可用”。 49 48 ALIBABA CLOUD MODEL STUDIO SECURITY WHITE PAPER 安全可信的

20 积分 | 59 页 | 45.36 MB | 6 月前
3
AI知识库：电力行业智能转型的新底座（23页 PPT）

改写智能推理 Rerank 多轮校验上下文增强知识问答二次创作分析推理总结摘要支持 29 种多模态数据，综合能力上， 360 RAG 方案在中文评测基准 SuperCLUE-RAG 专项榜单中表现优异取得榜单第二，通过了中国信通院 “可信 AI 检索增强生成产品”评估认证。 AI 企业知识库特点 2 ：领先的多模态 RAG& 知识解析技术 RAG 架构，任意模块均可插拔 ★ 自研高性能向量库，达到 18.7 万 QPS 片段入库智能标签智能摘要问答对提取精细化的数据增强策略向量库 ★ 第三方评测版式分析效果准确率达到 90% 去水印，去除 LLM 识别干扰 AI 企业知识库特点 2 ：领先的多模态 RAG& 知识解析技术，让 AI 精准理解知识 n 支持单图直检、

20 积分 | 23 页 | 4.45 MB | 6 月前
3
2025年云计算研究白皮书-中国电信

动执行；协作层面涵盖集中式、去中心化与混合式多智能体组织；演化层面通过自反学习、群体共演化和外部知识反馈不断提升策略稳定性与适应性。同时，工具生态为智能体提供知识检索、程序执行与应用操作等能力扩展，评测体系则从通用任务、行业场景到多 Agent 协作全面衡量系统的可靠性与智能水平。借由这些能力的收敛，LLM Agent 正成为构建可扩展、可协作、可演化智能系统的关键技术路径。多模态与具身智动执行；协作层面涵盖集中式、去中心化与混合式多智能体组织；演化层面通过自反学习、群体共演化和外部知识反馈不断提升策略稳定性与适应性。同时，工具生态为智能体提供知识检索、程序执行与应用操作等能力扩展，评测体系则从通用任务、行业场景到多 Agent 协作全面衡量系统的可靠性与智能水平。借由这些能力的收敛，LLM Agent 正成为构建可扩展、可协作、可演化智能系统的关键技术路径。 3.3.1.1 实现可迁移的长期积累。 Agent 评测评测体系从通用任务、领域场景到多 Agent 协作，系统性衡量智能体在推理、规划、工具使用、环境操作与长期自治等维度的综合表现，是检验 Agent 是否“可用、可信、可落地”的关键标准。 NeurIPS ACL EMNLP ICLR ICML TPAMI ICRA • 通用评测：清华大学团队 [515] 提出 A

10 积分 | 140 页 | 11.65 MB | 2 月前
3
2025企业出海数字化白皮书

的选项，怎么迅速做出高质量的选择。为了解决这一挑战，思科 ThousandEyes 可以帮助企业在出海前进行全面的网络环境评测。ThousandEyes 作为一款强大的网络监测和可视化工具，能够远程提供端到端的网络性能分析，无需到国外现场，即可帮助企业提前识别并优化海外服务资源。典型模式包括 o 云服务性能评测企业在选择 AWS、Azure、Google Cloud 等海外云服务时，需要评估各个云平台的访问速度、网络延迟、丢包率以及、丢包率以及服务稳定性。ThousandEyes 通过全球分布的探测点，模拟用户访问不同云端数据中心的实际情况，提供详细的网络路径分析，帮助企业选择最优云资源。 o IDC 机房稳定性评测企业可能需要租用海外 IDC 机房部署业务应用或存储数据。在选定 IDC 机房之前，ThousandEyes 可监测机房的网络连通性、SLA（服务等级协议）达标情况，并检测机房是否存在潜在能够追踪不同运营商的带宽利用率、BGP 路由健康度、网络拥塞情况，以及动态路径调整情况，帮助企业选择最优的网络服务商，避免因运营商问题导致业务受损。通过思科 ThousandEyes 的评测，企业能够在出海前精准洞察目标市场的网络环境，并根据实际测试数据制定最优 IT 基础设施部署策略。这不仅能降低海外业务的网络风险，提高用户体验，还可优化成本，避免因选择不佳的云服务或 IDC

20 积分 | 62 页 | 12.38 MB | 6 月前
3
2025年应用全生命周期智能化白皮书

检索增强生成（RAG）的基本流程 RAG 技术目前在多个领域都发挥了重要作用，如智能客服、医疗、金融和研发领域。在研发领域，如上图所示，通过数据飞轮与 RAG 技术的结合，构建知识数据清洗、转化和评测流水线，可以支持各类研发作业，迭代优化高质量领域知识，淘汰冷门知识，实现知识的 E2E 生命周期闭环，持续提升大模型推理的效果；通过为应用层抽象并统一多种知识数据与存储，可以实现安全高效的访问，简化并提升在数据安全技术，需要支持数据来源可信，数据内容合规，数据版权合规，敏感信息识别与关键信息资产检测，数据来源可追溯、数据防篡改与防泄漏等。模型开发安全方面，需要保障模型来源可信、可溯源，模型安全评测与版本管理，支持防篡改与防泄漏，模型领域隔离强化训练与合规等。生成内容安全方面，需要控制领域性的安全风险，例如软件应用开发中代码的安全治理、版权合规，支持 AI 攻击检测、内容风控、用户

20 积分 | 59 页 | 8.39 MB | 10 月前
3
数字中国十五五发展趋势白皮书-华信咨询

年)》显示,2024 年我国高质量数据集数量同比增长 27.4%,标志高质量数据集建设进入加速期。同时，国家数据局指导全国数据标准化技术委员会发布高质量数据局建设指南、格式要求、分类指南、质量评测规范等标准，并进行试点验证。遴选出 140 家高质量数据集方向标准/技术文件验证试点典型单位，覆盖工业制造、金融服务、科技创新、医疗健康、现代农业、交通运输等重点行业和领域。三是数据

10 积分 | 93 页 | 1.52 MB | 2 月前
3
2025年人工智能就绪度白皮书-企业数智化转型的Al变革路径与评估指南

化。科技界的开闭源之争由来已久，而近年来国内各类开源社区、开源基金会的设立，极大促进了开源生态的壮大。根据工信部信息，2025年中国已成为全球开源参与者数量排名第二、增长速度最快的国家1。根据国际大模型评测榜单LiveBench，全球排名前十的模型仅两款开源且均来自中国，分别是QwQ-32B和 DeepSeek-R12。此背景下，数量庞大的开发者和中小企业依靠“基础模型开源化+垂直领域私有化定制”就

20 积分 | 78 页 | 21.63 MB | 11 月前
3
上海科学智能研究院：2025年科学智能白皮书

系统安全评估与防护现有安全评估依赖静态测试和对抗攻击实验，难以全面评估开放环境下 AI 系统的安全性。为持续监测通用大模型的安全风险，发展自动化、覆盖面广、风险发现能力强的 AI 动态安全评测技术尤为重要。突破路径：构建自动化安全评估工具，基于博弈论和机器学习开发自适应评估方法，探索通用安全标准；研究面向内生安全的大模型风险靶向挖掘技术，发现代表性风险用例，形成风险数据库；研究基础

20 积分 | 29 页 | 2.74 MB | 11 月前
3

共 12 条前往

页

分类

语言

格式