积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(58)行业赋能(58)

语言

全部中文(简体)(58)

格式

全部PDF文档 PDF(22)DOC文档 DOC(18)PPT文档 PPT(18)
 
本次搜索耗时 0.028 秒,为您找到相关结果约 58 个.
  • 全部
  • 人工智能
  • 行业赋能
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • DOC文档 DOC
  • PPT文档 PPT
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • ppt文档 AI大模型时代下的网络安全建设方案(37页 PPT)

    主机钓鱼检测 辅助驾驶 零信任平台 数据安全平台 检测类大模型 运营类大模型 其他类大模型 …… 检测大模型 模型 安全 GPT 检测大模型 数据 流量日志 代码 溯源报告 恶意样本 安全知识 情报 公开漏洞 IOA 日志 代码理解能力 <%@page import=” <%@page import=”java ... 安全常识理解能力 Shell 俗称壳(用来区别于核), 88 98.55 利用大模型重做 Web 安全检测: • 仅百亿级参数大模型,训练两周, 效果超越持续优化 4 年的语义分析引擎 • 12 类无样本攻击类型, 其中 9 类超越了现有语义分析引擎 • 5000w+ 实际流量样本测试,大模型优化后呈现高检出、低误报特性 【题目示例】请问以下流量是否恶意: GET /easportal/tools/appUtil.jsp?EAS_ 月共收录了 35 个漏洞。 厂商样本互测 背景:深信服和某 SOC 厂商各出 40 个样本互测 操作步骤:将深信服样本在某 SOC 进行回放, 将 SOC 厂商样本 在 深信服安全 GPT 进行回放 结果: 1 ) SOC 平台回放深信服 40 个样本, 检出 5 个, SOC 平台检 出率 12.5% 2 ) 安全 GPT 回放 SOC 厂商 40 个样本, 检出 38 个, 安全
    20 积分 | 37 页 | 7.79 MB | 3 月前
    3
  • pdf文档 智能风控典藏版合集(377页)

    模型的开发和构建。企业模型解释在优化模型的期间,是一个优化 模型的一个非常重要的手段。在实际的模型构建的过程中,这种 bad case 分析寻找模型优化方向还是一个比较困难的问题,如果模型可 解释,可以对出错的样本采取针对性的措施对模型进行优化。  我们的模型试运行上线期间。模型的可解释性能够提升模型的可信 度,同时有利于业务的推广。  模型推广期间,模型预测真正人融入到具体的业务环节流程之中。 来的信息量。第三 个特征重要性,特征重要性很大程度上就可以解释模型预测的一个 判断依据。  局部的解释方法(对这个单条的预测进行解释):第一个 LIME,它 本质上是用线性模型在一个局部的样本空间上进行一个模拟。第二 个 DeepLIFT,计算每个特征值的一个基准值,然后计算某个特征取 值相对于基准值的变动对于预测结果带来的一个提升和影响。第三 个 Shap,它本质上是基于博弈论的一种计算方法,计算也是计算特 点周围特征空间中的局部次区域,并尝试基该局部及区域去理解该点的模 型决策。简单理解为它是解释单个预测样本。以 ppt 中的红叉对应的样本 点为例,在选取的样本点的附近选取一定数量的样本点,利用这些样本点 重新训练一个简单的模型,如线性模型,然后利用这种解释性较好的方法 来解释预测样本。 4. 模型解释性方法-shap DataFunTalk 成就百万数据科学家! 13 修改方法中
    20 积分 | 377 页 | 30.66 MB | 3 月前
    3
  • pdf文档 Deepseek+机器人,化工的时代大考

    100 万倍的 模拟加速,并将误差减少了 10 倍以上。 3.小样本强化学习:在有限的实验次数、原材料等条件下,AI 通过机器强化学习以及推理, 使得能够在少量实验数据的基础上,快速学习到如何调整配方和条件以提高反应效率。比如 Wen 等在 Al-Co-Cr-Cu-Fe-Ni 系统中搜索高硬度的 HEAs 时,仅用 155 个初始样本,经 7 轮 主动学习迭代,就获得了硬度提升显著的合金。 4. ........................ 6 1.2 分子动力学加速 ............................................. 10 1.3 小样本强化学习 ............................................. 11 1.4 高通量机器人验证:大幅提升新产品的研发速度 ................ ............................... 11 图表 9: 材料科学中机器学习的发展趋势和小数据集 ....................... 12 图表 10: 小样本学习方法及相关案例 .................................... 13 图表 11: 基于 RL 的拓扑优化可以根据特定应用需求预测改进的超材料设计 ... 14 图表
    10 积分 | 30 页 | 2.63 MB | 9 月前
    3
  • pdf文档 DeepSeek资产配置进阶实践的20个核心问答

    XGBoost 对历史股债 市场数据(如宏观经济指标、资金流向等)进行特征重要性分析,量化各因子对" 股债强弱走势"的解释能力,筛选出具有长期稳定性的高价值因子;然后将这些因 子重要性结果作为训练样本输入 DeepSeek 模型,使其学习因子与市场状态的关联 模式;最后结合当前市场环境,AI 基于历史规律生成初始权重框架,再通过动态 赋权机制进行实时调整。这种方法的优势在于既保留了传统模型的逻辑可解释性, 资料来源:Wind,国信证券经济研究所整理 问题 2:DeepSeek 训练所用的数据样本量(时间跨度,如 3 年/5 年/更长)大概 是多少?多大的训练样本或特定的训练方式可能导致过度拟合?是否有相关经 验? 关于数据样本量的问题,本项目训练 DeepSeek 所使用的数据样本从 2015 年 9 月开始,数据频率为月度。首先是分析师底稿数据从该时间开始较为完备,这保 证了样本数据的一致性和可用性;其次,近 10 年的跨度基本覆盖了完整的宏观经 态优化”展开,既保留了传统模型的逻辑可解释性,又通过 AI 的实时学习能力适 应市场状态变化,最终在测试周期内实现风险收益比的显著提升。 问题 5:财务造假样本的行业分布不均是否导致模型对低风险行业的误判?是 否需要引入行业分层采样优化训练集? 财务造假样本的行业分布不均(如通讯服务行业占比 19.4%而金融、公用事业不 请务必阅读正文之后的免责声明及其项下所有内容 证券研究报告 6 足 8.5
    10 积分 | 16 页 | 644.10 KB | 3 月前
    3
  • word文档 DeepSeek智慧政务数字政府AI大模型微调设计方案

    调方案将从以下几个方面进行改进: 1. 模板化生成机制:为不同类型的政务文本(如公文、报告、通 知)构建标准化的生成模板,确保生成内容符合政务文本的格 式规范。 2. 数据驱动的生成优化:通过引入大量政务文本的生成样本,模 型将学习如何在生成过程中融入政务场景中的常见表达方式和 专业术语,避免生成内容出现不规范的表达。 3. 多轮对话与迭代生成:针对复杂的政务场景,模型将支持多轮 对话与迭代生成,确保生成内容能够逐步细化并满足用户需求。 规范化处理。数据清洗主要包括去除无关信息、修正错误数据、填 补缺失值等操作。规范化处理则涉及文本的统一编码、标准化术语 的使用以及数据格式的一致性。此外,为了提高模型的泛化能力, 还需对数据进行平衡处理,确保各类政务问题的样本分布均匀。 接下来,对清洗和规范化的数据进行标注。标注工作应由具备 政务知识背景的专业人员完成,确保标注的准确性和权威性。标注 内容包括但不限于问题类型、关键词、情感倾向、实体识别等,这 些标注信息将作为模型训练的重要特征。 结构化的数据集,从而提升政务大模型的性能和应用效果。 2.2.1 数据去重与噪声处理 在数据清洗与标注的过程中,数据去重与噪声处理是确保数据 质量的关键步骤。去重操作旨在消除数据集中的重复样本,避免模 型在训练过程中过度拟合重复信息,从而提高模型的泛化能力。噪 声处理则通过识别和移除异常值、错误数据或无关信息,确保输入 数据的准确性和一致性。 首先,数据去重可以通过哈希算法或相似度匹配实现。对于结
    0 积分 | 167 页 | 464.82 KB | 8 月前
    3
  • ppt文档 AI赋能新型电力系统建设

    月对外发布基于 MaaS ( 模型即服务 ) 架构的电力行 业人 工智能创新平台,依托南网数据优势和场景禀赋,对外提供高水平 AI 服务,带动行业智能化转型。为电力系 统各 领域业务场景提供典型样本集、模型管理、训练环境、业务场景落地等一站式人工智能服务。 电力人工智能场景云端服务 模型推理服务 模型训练服务 模型贡献、上传 人工智能平台—模型即服务 ( 基于 MAAS 框架 ) 模型管理 / 检索 模型下载 模型调优 / 训练 模型推理 模型部署 模型应用 典型开发框架 模型库 样本库 实训框架 文档 / 教程 开发者社区 简单可集成 全模态 高质量全领域 可在线 / 离线 AI 高效学习 贡献活跃 产业金融 金融放货智能评估 电费货智能评估 飞轮。建立“算法识别数据实时汇集→样本重标注→模型再训练”的模型自动更新迭代机制,实现模型应 用效果与样本数据质量的高效循环;对全网算法组件 " 应接尽接 ", 监控和管理全网算力、算法组件 ( 纳管 370 个推 理节点、 633 张推理卡、超 1200 个算法实例,日汇集数据 300 万条,调用 4.6 亿次 ), 支持端侧 Al 装 置算法适配和 语音等数据样本和识别结果;④通过评价、标注
    10 积分 | 30 页 | 15.88 MB | 9 月前
    3
  • word文档 保险行业理赔业务基于DeepSeek AI大模型应用设计方案(281页 WORD)

    ........................................................................................99 6.2.2 小样本学习优化............................................................................................... 的 错赔率从 0.7%降至 0.15%,同时保持 85%案件的自动通过率。 模型针对保险行业特别优化的训练体系包含: - 领域自适应预训练:在 1200GB 保险专业语料上持续训练 - 对抗样本训练:包含 8 类常见欺诈模式的对抗数据集 - 条款对齐微调:使用对比学习技术确保输出与保险条款的严格对 应 实时服务能力通过以下技术实现保障: | 指标 | 性能参数 | 2048 tokens 适配长文档处理需求 2. 多任务微调架构:针对理赔场景中的分类、实体识别、因果关 系推断等任务,设计分层损失函数。例如在欺诈检测任务中, 采用 Focal Loss 解决样本不平衡问题,公式设置为 FL( pt)=−αt (1− pt) γ log ( pt),其中α=0.25,γ=2。同步引入对抗训练 (Adversarial Training),通过在嵌入层添加扰动提升模型
    20 积分 | 295 页 | 1.87 MB | 3 月前
    3
  • pdf文档 运营商智算中心建设思路及方案

    据进行 处理,包括格式对齐、归一化、去重、隐私保护、异常值 处理等。训练阶段涉及海量小文件的训练数据存取 和训练过程中参数文件的周期性保存;在推理阶段, 需要读取本地存储的模型参数,并对实时样本进行处 表1 算力需求和模型参数规模 参数 模型参数 规模 Tokens 规模 训练算力 训练所需 GPU卡规 模 符号表示 P D F G 等量关系 - 20×P,至少为模 b)做好存力和运力的协同。对于用户数据存储 热点区域,其存力需求巨大,需要提前做好和智算中 心之间的运力提升,便于训练数据和推理数据的传 输。 c)在具体存储资源和能力部署上,对于清洗后的 训练样本、训练中的 Checkpoint数据等热数据,以及未 清理的海量数据、训练好的模型数据等温冷数据,因 为两者的访问频率和性能需求不同,需分别考虑其存 储方案。 d)对于热存储,为保障性能,采用高性能介质 GPT-3 训练时间 30 天计算,将 增加 40% 的训练时间,且未考虑网络设备出现数据包 丢失和重传的问题。 基于大模型组网需求和上述策略,智算中心典型 组网方案如图 2 所示,分为参数面、样本面、业务面和 管理(存储)面4个平面。 a)参数面。采用 RoCEv2 或 IB 协议实现无损转 发,Leaf 作为接入节点的网关独立部署,通过 200 GE 链路与训练服务器互联。Leaf之上可以部署一层或两
    10 积分 | 6 页 | 3.64 MB | 3 月前
    3
  • word文档 基于DeepSeek AI大模型量化交易可信数据空间设计方案(249页 WORD)

    模型可将黑 天鹅事件预警时间提前 3-5 个交易日,2022 年瑞士信贷通过 此类系统避免了约 4.7 亿美元的 Euribor 波动损失。 技术落地仍面临三大挑战:首先,过拟合问题导致策略在样本 外测试中衰减严重,2021 年 CICC 研究显示约 43%的 AI 策略实盘 年化收益比回测下降超过 40%;其次,监管合规风险加剧,欧盟 MiFID II 要求所有 AI ” 交易算法必须通过 订单拆分算法:TWAP/VWAP 策略优化冲击成本  流动性探测:盘口深度预测模型  异常熔断机制:基于波动率突变的动态止损 实际部署时需要解决三个核心问题:首先,过拟合控制需通过 Walk-Forward 分析,保持样本外测试年化衰减率<15%;其次, 实盘延迟要求从信号生成到订单提交全程<50ms;最后,需建立动 态仓位管理系统,根据凯利公式调整风险敞口,单策略最大回撤控 制在 8%以内。通过模块化设计,AI 缺失值填充(采用插值或基于关联字段的预测)  标准化处理(Min-Max 或 Z-Score 归一化) 历史数据回测需覆盖不同市场周期(如牛熊市、震荡市),建 议至少包含 10 年数据,并设置 20%的预留样本用于验证。 模型鲁棒性依赖三重验证机制 1. 静态验证:通过 SHAP 值、特征重要性排序分析模型逻辑一致 性 2. 动态验证:使用滚动时间窗口测试(如每月滚动训练+预测) 3. 压力测试:模拟极端市场条件(如
    10 积分 | 261 页 | 1.65 MB | 22 天前
    3
  • pdf文档 税务行业标准大模型

    法律法规、通用知识)、行业典型案例,税务和智能解决方案以及人力 支撑共同构建,可用于解决税务行业性、专业性问题,该模型在税务 领域内做行业场景训练并输出行业场景应用模型。 税务行业标准大模型具备以下技术优势: 1. 样本优化:通过样本优化技术,建立倒排定位,不断通过模型 微调自动化测试跑校验集,以实现高质量的逻辑链路。 2. 去重优化:通过专家高质量输入,淘汰低质句子及篇章粒度去 重,从而保证了文本的质量。 3 38%, 模型总体得分稳定为 53.7%,是其他同类竞品模型的 3 倍。 在实际应用中,税务领域有明确目标并且税务行业认可,即参加 注册税务师考试,以注册税务师考过 60%为标准进行优化。通过样本 优化、去重优化、算法优化、训练优化、上下文学习窗口优化、历史 问答优化、计算类难题适配等技术突破。基于此,税务行业标准大模 型让 AI 技术与税务管理相融合,不断强化行业赋能效果。 未来发展规划
    10 积分 | 5 页 | 381.51 KB | 3 月前
    3
共 58 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
前往
页
相关搜索词
AI模型时代网络安全网络安全建设方案37PPT智能风控典藏典藏版合集377Deepseek机器机器人化工大考DeepSeek资产配置进阶实践20核心问答智慧政务数字政府微调设计设计方案赋能新型电力力系系统电力系统保险行业保险行业理赔业务基于应用281WORD运营营商运营商智算中心思路量化交易可信数据空间空间设计249税务标准行业标准
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 - 2026 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩