积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(17)大模型技术(17)

语言

全部中文(简体)(17)

格式

全部DOC文档 DOC(12)PDF文档 PDF(3)PPT文档 PPT(2)
 
本次搜索耗时 0.032 秒,为您找到相关结果约 17 个.
  • 全部
  • 人工智能
  • 大模型技术
  • 全部
  • 中文(简体)
  • 全部
  • DOC文档 DOC
  • PDF文档 PDF
  • PPT文档 PPT
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • ppt文档 金融-DeepSeek银行部署加速,AI金融应用迎来跃迁

    DeepSeek 开源使金融机构能够轻松获得前沿模型能力,且大幅降低部署成本。其通过对训练方式、算法架构和推理方 法 的工程化优化大幅降低了部署成本。近期采用大规模 RL 训练方法的阿里 QwQ-32B 等模型也在缩小规模的同时达到了 DeepSeek R1 671B 的应用效果,有望进一步催生银行落地应用。 n 我们认为金融行业人工智能的应用价值大体可以分为三个层次: 降本增效,价值创造与决策赋能。在实际银行落地应用 ,中泰证券研究所 7 n 阿里近期开源的 QwQ-32B 模型基于 320 亿参数规模,在数学推理、代码生成及通用任务中表现亮眼,综合性能对标 DeepSeek-R1 ( 6710 亿参数,激活量 370 亿)。该模型大幅降低部署成本, 支持在消费级显卡(如英伟达 RTX 4090 )上 本地运行,满足快速响应及数据安全需求。同时, QwQ-32B 集成智能体( Agent )能力,可调用工具并基于 )能力,可调用工具并基于 环境反馈调 整推理逻辑,为定制化 AI 方案提供基础。 图表: QwQ-32B 模型表现 资料来源:阿里,中泰证券研究所 8 性能:开源 QwQ-32B 性能比肩满血 R1 ,再次降低部署成 本 n 通过将 DeepSeek-R1 的推理能力蒸馏到更小的模型中,较小的模型也能具备强大的推理能力。 DeepSeek 开源了从 15 亿 到 700 亿参数的 R1 蒸馏版本。这些模型基于
    10 积分 | 25 页 | 1.44 MB | 6 月前
    3
  • word文档 审计领域接入DeepSeek AI大模型构建Agent智能体提效设计方案(204页 WORD)

    ...................................................................................................32 3.1.3 智能审计决策模块................................................................................... NLP 解析合同条款与会计准则差异,识别潜在 合规风险 3. 建立多维度关联分析引擎,发现隐蔽的舞弊模式(见 下表典型场景) 风险类型 传统检测率 智能体检测率 关键技术 关联交易舞弊 32% 89% 图谱推理+时序分析 风险类型 传统检测率 智能体检测率 关键技术 收入确认异常 45% 93% 贝叶斯网络+规则引 擎 费用分摊失真 28% 76% 聚类分析+异常值检 测 知识沉淀标准化 的组合结构。训练数据需包含历史审计案例 中的异常交易特征,例如: - 输入层维度:根据审计对象动态调整 (如财务审计中科目余额、交易频率、金额分布等) - 隐藏层设 计:3 层 LSTM(128/64/32 单元)配合 20% Dropout - 输出层: Sigmoid 激活函数输出异常概率 训练时采用对抗样本增强技术,注入 10%-15%的已知异常模 式数据以提升泛化能力。模型评估指标需满足:
    10 积分 | 212 页 | 1.52 MB | 6 月前
    3
  • ppt文档 DeepSeek消费电子行业大模型新型应用最佳实践分享

    服务调用 高并发、高可用 企业级鉴权流控 算力投入持续降低 DeepSeek 全系 列 R1 、 V3 满血版 R1-Distill-Llama-70B R1-Distill-Qwen-32B R1-Distill-Qwen-14B R1-Distill-Llama-8B R1-Distill-Qwen-7B R1-Distill-Qwen-1.5B DeepSeek 部署方案 • 全参 +LoRA 双模 式 • 低至 1 卡 A10 DeepSeek 全系 列 R1 、 V3 满血版 R1-Distill-Llama-70B R1-Distill-Qwen-32B R1-Distill-Qwen-14B R1-Distill-Llama-8B R1-Distill-Qwen-7B R1-Distill-Qwen-1.5B DeepSeek 精调方案
    10 积分 | 28 页 | 5.00 MB | 1 年前
    3
  • word文档 AI知识库数据处理及AI大模型训练设计方案(204页 WORD)

    色,能够有效处理知识库中的语义信息。训练过程中,采用迁移学 习和微调策略,利用预训练模型的参数,通过知识库数据进一步优 化模型性能。训练时使用 Adam 优化器,学习率设置为 0.0001, 批量大小为 32,训练轮数为 10 轮。 输出层根据任务需求设计不同的输出结构。对于分类任务,输 出层采用 Softmax 函数进行分类;对于生成任务,则使用自回归 模型生成文本。此外,输出层还需包含后处理模块,对模型的输出 法收敛,过低则会导致训练速度过慢。建议采用学习率衰减策略 (如余弦衰减或步进衰减)或自适应学习率方法(如 Adam 优化 器)。批量大小的选择需权衡训练速度和模型性能,通常建议使用 2 的幂次方(如 32、64、128)以提高计算效率。优化器的选择应 根据模型的复杂度进行,对于简单的模型可以使用 SGD,而对于复 杂的深度学习模型,Adam 或 RMSprop 通常更具优势。 正则化系数(如 L2 计进行,但需注意计算资源的限制。 为了高效进行超参数调优,建议采用以下步骤: 1. 定义搜索空间:根据模型和数据集的特征,合理定义每个超参 数的范围。例如,学习率可以在[1e-5, 1e-1]之间搜索,批量 大小可以在[32, 512]之间选择。 2. 选择调优方法: o 网格搜索:适用于超参数数量较少的情况,但计算成本 较高。 o 随机搜索:适合超参数数量较多的情况,能在较短时间 内找到较优解。 o 贝叶
    60 积分 | 220 页 | 760.93 KB | 10 月前
    3
  • word文档 AI大模型人工智能数据训练考评系统建设方案(151页 WORD)

    30 3.1 系统总体架构......................................................................................32 3.2 模块划分......................................................................................... 际操作中,可以根据计算资源和时间预算选择合适的方法。  学习率:通常设置为 0.01 到 0.001 之间,通过逐步减小学习 率,观察模型收敛情况。  批量大小:根据数据规模和硬件资源,设定为 32、64 或 128,过大可能导致内存不足,过小可能影响训练稳定性。  正则化系数:用于控制模型复杂度,常用 L1 或 L2 正则化,系 数通常设置为 0.01 到 0.0001 之间。 在 型的训练与推理任 务。例如,NVIDIA A100 GPU 在 FP16 精度下的计算能力可达 312 TFLOPS,能够显著加速模型训练过程。根据实际业务需求,初始 配置可包括 16 至 32 块 GPU,并在后续根据用户规模和数据量逐 步扩展。 存储资源的配置需要兼顾容量与速度。建议采用分层存储架 构,包括高速固态硬盘(SSD)和机械硬盘(HDD)。SSD 用于存 储频繁访问的训练数据和中间结果,HDD
    60 积分 | 158 页 | 395.23 KB | 10 月前
    3
  • pdf文档 基于大模型的具身智能系统综述

    Meta-World[47], BEHAVIOR-1K[48] ALOHA[37], UMI[38], HumanPlus[39], GELLO[40], GC-DA[41] MineDojo[31], VRB[32], Baker 等[33], RoboCLIP[34], Seo 等[35], Han 等[36] 图 1 基于大模型的具身智能工作概览 Fig. 1 Overview of embodied 的大量人类与环境交互的视频更是能提供大规模的、 多样的和真实的行为数据, 用于训练具有广泛性和 通用性行为能力的模型. 但此类视频一般不包含标 签, 如何有效地提取视频中的动作并用于训练是该 方向的重点问题. 文献 [32] 提出了一种名为 VRB 的方法, 通过 利用互联网上的人类行为视频来训练一个视觉可供 性 (Visual affordance) 模型, 该模型能够估计人类 在场景中的可能交互位置和方式, 通过从人类的视 Conference on Com- puter Vision and Pattern Recognition (CVPR). Vancouver, Canada: IEEE, 2023. 32 Baker B, Akkaya I, Zhokhov P, Huizinga J, Tang J, Ecoffet A, et al. Video PreTraining (VPT): Learning
    20 积分 | 19 页 | 10.74 MB | 6 月前
    3
  • word文档 CRM客户关系系统接入DeepSeek大模型应用场景设计方案(173页WORD)

    工作流的无缝融合,所有 AI 功能均以插件形式存在,支持企业根据实际需求分阶段启用。通过 建立效果监测看板,管理层可实时追踪 ROI 转化情况,确保技术投 入产生实际业务价值。最终将形成包含 7 大类 32 个标准接口的 AI 能力中台,为后续智能化扩展预留充足空间。 2. 技术可行性分析 在技术可行性分析中,我们首先需要评估 DeepSeek 大模型与 现有 CRM 系统的兼容性。DeepSeek 正负样本比例控制在 3:1 训练参数配置 采用两阶段训练策略: 关键参数设置: - 学习率:初始阶段设为 5e-5,领域适配阶段降至 3e-6 - Batch Size:根据 GPU 显存动态调整,建议 32-128 区间 - 训练轮次:通用微调 3-5 轮,领域适配 8-10 轮 效果验证方法 建立三维评估体系: 评估维度 测试集 达标阈值 意图识别准确率 500 条真实对话 92% ≥ 实体抽取 在金融行业某头部券商的实践中,CRM 系统接入 DeepSeek 大模型后,客户服务效率提升显著。通过分析历史沟通过程数据, 系统可自动生成投资建议初稿,理财顾问的方案撰写时间从平均 45 分钟缩短至 8 分钟,准确率提升 32%。关键数据对比如下: 指标 接入前 接入后 提升幅度 客户需求响应时效 2.3 小时 0.8 小时 65% 服务方案通过率 68% 89% 21% 高净值客户留存率 76% 92% 16%
    10 积分 | 179 页 | 1.22 MB | 4 月前
    3
  • pdf文档 CAICT算力:2025综合算力指数报告

    ..31 图 20 省级行政区环境分指数 Top10....................................................................... 32 图 21 省级行政区环境分指数-资源环境 Top10.......................................................33 图 22 省级行政区环境分指数-市场环境 特优势;东部沿海地区则在基础设施建设、人才资源和行业生态建 设方面表现突出。同时,各地区面临着基础设施建设、能源供应、 技术人才等方面的挑战,需要进一步加强合作和协同发展。 综合算力指数 32 来源:中国信息通信研究院 图 20 省级行政区环境分指数 Top10 2.资源环境 我国省级行政区环境分指数-资源环境 Top10 为青海省、内蒙古 自治区、新疆维吾尔自治区、甘肃省、宁夏回族自治区、西藏自治
    20 积分 | 54 页 | 4.38 MB | 6 月前
    3
  • word文档 Deepseek大模型在银行系统的部署方案设计

    4 接口设计.............................................................................................32 4. 数据管理.......................................................................................... 同步。这种方法能够显著减少训练时间,尤其是在处理 TB 级数据 时。为了进一步提高训练效率,我们使用混合精度训练(Mixed Precision Training),即同时使用 16 位和 32 位浮点数进行计 算,以减少显存占用并加速训练速度。 模型训练过程中,采用交叉验证技术来评估模型的性能,避免 过拟合。我们将数据集划分为训练集、验证集和测试集,比例为 7:2:1。通过交叉验 保其高效运行和满足业务需求的关键环节。首先,针对银行系统的 实际场景,需要对模型进行轻量化处理。通过剪枝、量化和知识蒸 馏等技术,减少模型的参数量和计算复杂度,从而降低对硬件资源 的消耗。例如,可以将模型的浮点数精度从 FP32 降低到 FP16 或 INT8,在保证性能的同时显著减少计算资源的占用。 其次,为了提高模型的推理速度,可以引入并行计算和分布式 推理技术。通过将模型切分到多个 GPU 或计算节点上并行处理,
    10 积分 | 181 页 | 526.32 KB | 1 年前
    3
  • word文档 AI大模型人工智能行业大模型SaaS平台设计方案

    ...........30 2.3.1 人工智能技术发展......................................................................32 2.3.2 SaaS 平台趋势...........................................................................34 3. 产品设计 GPT-3、BERT 等),这 些技术的演进使得机器在自然语言处理、图像识别、决策支持等方 面展现出了惊人的能力。 根据市场研究机构的数据显示,预计在未来五年内,人工智能 市场的复合年增长率(CAGR)将达到 32%以上。这一增长主要得 益于以下几个方面的技术进步: 1. 算力的提升:随着 GPU 和 TPU 等专用硬件的广泛应用,人工 智能的计算能力得到了极大的提升,特别是在图像和视频处 理、自然语言处理等领域。 码测试、构建和发布的流程。 整体构架可以使用以下 Mermaid 图示进行展示: 在资源配置上,初期将根据访问预估量配置基础的 Kubernetes 集群,包含 3 个节点。每个节点配备 8 核 CPU 和 32GB 内存,以支持初步的模型推理需求。随着用户量及访问量的 增加,我们将在流量监控的基础上进行水平扩展,动态调整集群节 点的数量。 平台定期向用户提供关于模型表现的反馈,结合用户的数据使 用
    50 积分 | 177 页 | 391.26 KB | 11 月前
    3
共 17 条
  • 1
  • 2
前往
页
相关搜索词
金融DeepSeek银行部署加速AI应用迎来跃迁审计领域接入模型构建Agent智能体提效设计方案设计方案204WORD消费电子行业电子行业新型最佳实践分享知识知识库数据处理数据处理训练人工人工智能考评系统建设151基于具身综述CRM客户关系客户关系场景173CAICT算力2025综合指数报告Deepseek方案设计SaaS平台
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 - 2026 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩