积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部维度学堂(31)白皮书(22)政策法规(4)工具模板(3)书籍精华(2)

语言

全部中文(简体)(30)

格式

全部PDF文档 PDF(27)DOC文档 DOC(4)
 
本次搜索耗时 0.038 秒,为您找到相关结果约 31 个.
  • 全部
  • 维度学堂
  • 白皮书
  • 政策法规
  • 工具模板
  • 书籍精华
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • DOC文档 DOC
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 阿里云:2025年阿里云百炼安全白皮书

    大模型风险:算法合规、内容安全、对抗攻击 大模型在技术原理上具有天然的局限性,面临全生命周期的风险挑战。 ● 算法合规风险:大模型全生命周期需要遵循明确的法规和技术标准要求,包括但不 限于训练数据来源、数据预处理、数据标注、输出内容、内容标识等方面; ● 内容安全风险:由于训练数据的偏差和污染,以及模型生成机制的不完全可控,可 能生成违法违规不良价值观的内容; ● 对抗攻击风险:攻击者可通过构造对抗样本或指令注入攻击,诱导模型生成错误的 低了硬件门槛和资源消耗。 3 通义大模型全生命周期安全实践 通义大模型严格遵循 GB/T 45652《生成式人工智能预训练和优化训练数据安全规范》、 GB/T 45674《生成式人工智能数据标注安全规范》和 GB/T 45654《生成式人工智能 服务安全基本要求》等国家技术标准要求,创新式构建三层防护体系,覆盖模型研发 训练、部署应用、运行上线全流程,通过内置算法安全设计、模型安全训练、内容安 2 模型训练 (一)预训练(Pre-Training): 通过严格筛选数据源、多层过滤内容及规范标注管理,构建安全可控的预训练语料体 系。预训练阶段是大模型获取世界知识的关键环节,训练数据的质量与安全性很大程 度上决定了模型的基础能力和安全水位。通义大模型严格执行语料来源管控、数据清 洗和标注管理,落实预训练语料安全管理。 (1)数据源筛选:严格落实 GB/T 45652 对训练数据来源审核、来源配比、公网数
    20 积分 | 59 页 | 45.36 MB | 2 天前
    3
  • pdf文档 全国数智产业发展研究报告(2024-2025)

    华为的盘古、百度的文心等;三是数智化应用程度高的企业 独立开发形成,如 Deepseek、宇树科技、银河智能等;四是 数据企业升级迭代而成,如拥有数据资源的各类数据集团、 拥有数据技术的数据标注公司、拥有数据安全技术数据安全 公司、以及从事数据基础设施建设运营数据基础设施企业, 随着业务不断数智化进程不断深化而转型升级为人工智能 企业。 19 图 12:人工智能企业的四种培育方式 数据采集存储技术包括接口采集技术、自动导入技术、 自动录入技术、爬虫技术、智能传感技术等,以及结构化存 储技术、非结构化存储技术、网络存储技术、云存储技术、 光存储技术、磁盘存储技术等;数据加工分析技术包括自动 标注技术、用户画像技术、商业智能分析技术、超大数据量 自动分析技术、可视化分析技术、智能预测技术等;数据流 通交易技术包括数据登记技术、数据目录技术、数据搜索技 术、隐私技术、区块链技术、匿名化技术、数据编织技术等; 数据治理服务 指对数据全生命周期进行规范化管理的服务,包括但不 限于数据架构规划、元数据管理、数据质量提升、数据 生命周期管理等。 4 数据标注服务 指对数据进行分类、注释、标记等的专业服务。包括但 不限于文本标注、图像标注、语音标注、视频标注等, 主要用于形成供人工智能训练的数据。 5 数据产品设计 服务 指分析需求并设计数据产品过程中所提供的一系列专业 服务。包括但不限于需求分析、产品规划、架构设计、
    20 积分 | 236 页 | 8.61 MB | 14 天前
    3
  • word文档 医疗健康大模型伦理与安全白皮书(93页 WORD)

    根 据已有的前文信息逐词预测下一个词语的概率分布,从而实现高质量的文本生成。与传统的监 督学习方法相比,生成式预训练模型的优势在于它们可以在大规模未标注语料库上进行预训练,然 后通过少量有标签数据的微调来适应特定任务。这种方法极大地降低了对大量人工标注数据的依 赖,同时也加速了模型的迭代更新过程。 随着时间的推移,模型的规模得到了快速的膨胀,参数量从最初的数亿增长至如今的数千亿,从而 人工智能的发 数据层的开发必须确保数据来源的多样性和可靠性, 包括电子病历、医学影像、历史问诊记录、 医院科室等多种数据源。同时, 还要保证数据的质量, 进行清洗和标准化处理。数据标注是关键步骤, 它将原始数据转换为可用的训练数据, 通过专家标注或自动化标注工具为数据添加标签, 并确保隐 私数据经过严格脱敏处理,保护患者信息安全。 接下来是训练层, 这一层专注于大模型的设计与开发。大模型的训练通常包含预训练、指令微调、 是 数 据 增 强、遮盖预测、对比学习等形式。自监督学习的关键在于构建适当的辅助任务, 这些任务能够帮助 模型学习到数据的内在结构和规律。在医疗健康领域, 自监督学习可以用于处理大量的未标注医疗 数据, 帮助模型学习到从图像中提取关键信息的能力、学习到不同疾病或症状之间的相似性和差异 性等。 SFT 是一 种 有 监督 的 微调 方法, 旨在 针 对 特定任务 或 场景对模型进行
    20 积分 | 93 页 | 12.19 MB | 14 天前
    3
  • pdf文档 华为:2025年鸿蒙编程语言白皮书

    中声明被调用的 C 函数接口;  低互操作开销:在仓颉侧使用 @C 和 foreign 标注的结构体和函数, 其实现与 C 在二进制层面保持兼容;提供 inout 关键字,可将仓颉栈 上的变量引用传递到 C 侧,减少跨语言拷贝;提供 @FastNative 注解 标注 foreign 函数,减少调用被标注函数的运行时开销;支持将仓颉 Array 中数据的原始指针实例传递到 C 侧访问,避免大块内存拷贝; 语言的互操作过程中,会引入了 C 的许多不安全因素,因此 在仓颉中使用 unsafe 关键字,用于对跨 C 调用的不安全行为进行标 识;  同时例子中使用 @FastNative 注解来标注 rotate 函数,实际调用中运 行时会基于这个标注优化互操作开销。 14 更详细描述请参考《仓颉编程语言开发指南》中 仓颉-C 互操作 1 章节。 仓颉与 ArkTS 互操作 在鸿蒙应用开发中,仓颉和 3. 4. // 调用仓颉接口 5. let result = addNumber(1, 2); 同时为了提升开发者易用性,仓颉提供声明式互操作宏机制,使开发者可 以标注仓颉代码中需要被 ArkTS 跨语言使用的函数或类型,在编译阶段自动生 成互操作“胶水层”代码及 ArkTS 接口声明,从而减少开发者手写互操作代码的 复杂度。比如以上案例中仓颉侧代码可以简化成:
    0 积分 | 65 页 | 2.09 MB | 4 月前
    3
  • pdf文档 2025中国银行业数字化转型人才报告

    单,突破硬性 条件局限,聚焦候选人实操能力。现场设置业务场景实测,淘汰“唯证书 论”候选人; 2.业务快速发展变化,单一岗位招聘无法应对突发人力需求。配合客户建 立数字化技能雷达图,面试时标注候选人可复用技能标签,后续调岗可直 接调用; 23 3.采用专场快招模式提升效率,集中资源优化流程,2 个月内高效完成 70+人到面; 4.“铁三角”机制保障交付,通过节点管控+全程护航+风险预案三管齐 务! 28 版权声明 本报告及相关内容由北京网聘信息技术有限公司(简称“智联招聘”)编制并拥 有版权。在转发或引用本报告时,需在显著位置清晰标注“转自(或引自)智联 猎头”,并确保内容完整、准确,不得进行篡改、歪曲或误导性解读。如需进一 步了解本报告内容或有合作意向,请在公众号留言与我们取得联系。 相关阅读 智联猎头丨《2025
    20 积分 | 28 页 | 2.37 MB | 4 月前
    3
  • word文档 医疗健康场景引入DeepSeek AI大模型可行性研究报告(144页 WORD)

    病诊断、个性化治疗、健康管理以及医疗资源优化等方面。 DeepSeek 技术的架构主要包括以下几个关键组件:数据处理 层、模型训练层、推理引擎和用户交互界面。数据处理层负责对原 始医疗数据进行清洗、整合和标注,确保数据的质量和可用性;模 型训练层通过深度学习算法对预处理后的数据进行训练,生成高精 度的预测模型;推理引擎则负责在实时场景中对新数据进行快速分 析和预测;用户交互界面为医疗专业人员提供直观的操作平台,便 在医疗影像分析领域,DeepSeek 技术的引入可以显著提升诊 断的准确性和效率。通过深度学习算法,DeepSeek 能够快速处理 和分析大量的医学影像数据,如 X 光片、CT 扫描、MRI 等。其核 心优势在于能够自动识别和标注出影像中的异常区域,帮助医生更 早、更准确地发现病变。 首先,DeepSeek 可以应用于肺癌筛查。通过对大量肺部 CT 影像的学习,系统能够自动检测出肺结节的存在,并评估其恶性概 率。相比传统的人工筛查,DeepSeek 技术的自动识别与诊断功能 具有显著的潜力和实际应用价值。通过深度学习算法,DeepSeek 能够高效、准确地处理和分析大量的医疗影像数据,如 X 光片、CT 扫描、MRI 图像等。该技术首先通过对已有标注的影像数据进行训 练,学习并识别出病变区域的典型特征。随后,系统能够在新的影 像中自动检测出异常区域,并提供初步的诊断建议。 具体而言,DeepSeek 在自动识别与诊断中的应用可以分为以 下几个步骤:
    20 积分 | 151 页 | 370.68 KB | 14 天前
    3
  • word文档 医疗健康行业-AI应用白皮书(40页 WORD)

    在医疗健康和生命科学行业的应用深化,行业企业在 模型训练、微调及应用开发上,需要高性能 GPU 集群、高性 能存储系统及低延迟网络支持,需要适配医疗数据特性的 AI 开发工具链(如基因数据脱敏、医学影像标注)、模型部署与 监控体系等。传统 IT 架构在应对海量数据计算、大模型训练 及跨场景 AI 部署时,逐渐面临算力瓶颈、敏捷性不足、开发 运维成本高等多重挑战。基于此,阿里云为医疗健康行业企业 开发与管理平台 医疗健康行业的 AI 应用开发和数据处理面临以下核心问题: 一是技术门槛高, AI 开发涉及数据标注、模 型训练、部署等多个环节,需依赖专业算法团队,导致研发周期长、成本高;二是数据质量与标准化不足, 医疗 数据来源复杂(如电子病历、影像、基因组数据),缺乏统一的清洗、标注与格式化工具,影响模型效果;三是跨 场景协同困难,临床、科研与药研场景需求差异大,缺乏统一的开发平台支撑多模态数据融合与模型迭代。 据中提取特征,并利用海量的医学影像数据和诊断结 果,进行特定的多层神经网络训练,揭示高维特征之 间的联系,从而实现定性和定量分析疾病情况。因 此,诊断过程中,AI 系统能够快速准确地捕捉影像 中的细微变化,实现病灶识别与标注、靶区自动勾 画、生理信息定量计算等,为医生提供诊断意见和辅 助建议。 当前,AI 影像分析技术在肺部、心脑血管等领 域的应用较为成熟,如在胸部 CT 影像分析中, AI 能 够快速定位肺部结节,并分析其大小、形状、密度、
    20 积分 | 40 页 | 7.84 MB | 14 天前
    3
  • pdf文档 上海科学智能研究院:2025年科学智能白皮书

    力。应用包括人机交互、机器人自主导航 等,但在多模态学习与系统复杂度方面仍 面临挑战,需要在效率与复杂度之间找到 平衡。 2.3.2 数据引擎 具身智能系统的数据获取和融合仍面 临数据质量参差不齐、数据标注成本高、 跨模态数据同步性不足等问题,限制了模 型的泛化和适应性。 研发多源异构数据采集与融合技术, 构建高质量数据引擎。推动统一的数据采 集与多模态融合平台建设,确保数据标准 化与时间同步,促进开放数据集生态建设。 突破路径:统一化学数据的标准格式, 例如分子式使用 SMILES 表示,物理量单位 统一使用国际单位制。开发自动化工具对来 自化学实验、理论计算结果、文献资料等多 重来源的数据进行清洗、验证和标注。 2.3.3 增强 AI 模型的化学特化型认知 此前大语言模型大多是基于语言构建 的,而针对化学领域的 AI 模型需要在解决 更复杂问题时具备更强的化学科学认知,例 如需要正确理解分子和晶体结构、具备基本 不仅丰富了神经科学的实验手段,也为精准 医疗和智能计算的未来奠定了坚实基础。 3.3 前沿科学问题和突破路径 3.3.1 智能数据生成与标注 电子显微镜、光学显微镜和扩散 MRI 等成像技术实验生成了海量、多模态数据, 如何利用生成对抗网络等 AI 技术实现数据 自动生成与智能标注,从而准确捕捉神经网 络微观结构和功能特征,成为当前亟待解决 的关键问题。 突破路径: 构建 AI 驱动的神经信息学平台,整合
    20 积分 | 29 页 | 2.74 MB | 5 月前
    3
  • pdf文档 2025年人工智能就绪度白皮书-企业数智化转型的Al变革路径与评估指南

    用层。目 前,中国的AI产业链呈现出“基础层攻坚、技术层突破和应用层分化”的阶梯式发 展特征。在基础层,中国的算力规模已经占到全球的30%左右,居全球第二位,但 仍然需要突破高端芯片制造和数据标注自动化等技术;在技术层,DeepSeek开启 了通用大模型开源和效率优化的先河,但如何产生垂直领域的落地价值仍亟需产业 打通“端到端”的闭环;在应用层,B端市场如工业质检、智能制造等已经实现了 治理并重 国家标准体系建设和行业规范不断完善,引导人工智 能产业规范化、高质量发展。2024年3月,全国网络 安全标准化技术委员会出台《生成式人工智能服务安 全基本要求》,该标准在语料采集、语料标注、内容 安全监测、服务稳定性等方面提供了量化评估标准; 同年7月,工信部等四部门联合印发《国家人工智能产 业综合标准化体系建设指南(2024版)》(以下简称 《指南》),该指南明确了人工智能产业各环节的重 投入,推动AI应用落地。2025年1月,出资额高达 600.6亿元的国家人工智能产业投资基金成立,将聚焦 AI算力构建和应用场景开发进行投资,预计将撬动更 多社会资本加大投入。 围绕数据标注、国产算力生态等重点领域,优化支撑 体系。数据、算力作为AI产业发展的两大支柱产业, 政府将围绕财税金融、数据开放共享、人才培养等方 面优化支撑体系,推动构建高质量数据集和自主可控 的算力生态。
    20 积分 | 78 页 | 21.63 MB | 5 月前
    3
  • pdf文档 AI+HR黑科技秘笈-AI赋能人力资本智能化变革

    作为预训练的权重。这样有监督训练的目的就是利用真实 的行为数据更新 embedding 层的数据,使得每个实体的 embedding 更能好的表达在招聘这个 业务场景中的语义。 图 1 我们使用内部标注的评估数据对不同模型进行了评估,比较结果如下 : 15 | 第一部分 以下是 fasttext 和 graph embedding 模型输出的 top 相关公司实体的一些例子。可以看到 FastText 可以直接作为词语特征使用。考虑到模型结构复杂,运算时间较长,针对某些性能要求较高的 业务场景,可以将模型输入层对应的 Embedding 作为静态词向量使用,通过查表方式大大简化 运算流程。 我们使用内部标注的薪酬预测、人岗匹配数据对不同模型进行了评估,结果如下: 21 | 第二部分 22 第二部分 | 薪酬预测任务中,每个模型需要提取候选人的技能 Embedding 作为下游任务的参数,辅助判断 一 个 基 本 的 效 果,而 训 练 样 本 不 是 自 然 就 有 的,大 多 需 要 人 工 标 注。BERT 出 现 之 后, BERT 可以基于已经习得的语言规律,更好的利用样本,使依赖的标注数量降低至少一个量级, 极大加快模型的理解速度。 02 BERT原理和BERT升级 BERT 自 2018 年底诞生后,在业界和学术界迅速激起一层研究热潮,不断的出现以 BERT 为基 础 的
    20 积分 | 98 页 | 8.41 MB | 14 天前
    3
共 31 条
  • 1
  • 2
  • 3
  • 4
前往
页
相关搜索词
阿里2025云百炼安全白皮皮书白皮书全国数智产业发展研究报告2024医疗健康模型伦理93WORD华为鸿蒙编程语言编程语言中国银行行业银行业数字数字化转型人才场景引入DeepSeekAI可行可行性可行性研究144应用40上海科学智能研究院人工人工智能就绪企业数智化Al变革路径评估指南HR科技秘笈赋能人力资本人力资本智能化
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩