泛东 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

CAICT算力：2025综合算力指数报告

为了推动算力产业发展，我国出台多项相关政策对算力产业顶层规划，明确算力产业的发展目标、战略重点和实施路径，引导算力资源的合理配置和高效利用。2023 年印发《算力基础设施高质量发展行动计划》和《关于深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》，旨在不断完善综合算力基础设施，增强算力赋能成效。2024 年印发《推动工业领域设备更新实施方案》，提出推动“云边端”算力协同发展，加大高性能智算供给，在算力枢然而，在算力产业高速发展过程中，也暴露出一系列亟待解决的问题。一是跨区域资源协同机制亟待进一步完善。目前，我国跨综合算力指数 3 区域算力资源协同还处于初级阶段，缺乏统一的调度平台和协同机制。东、西部地区算力供需存在对接不够顺畅，信息不对称、资源匹配度不高等问题。同时，不同区域的算力政策、标准不一致及算力网络传输效能不足，导致算力资源在跨区域流动和共享时也面临诸多障碍，制约了全国算力资源的优化配置和高效利用。二是基础干直连点，杭州、上海、深圳和中卫 4 个新型互联网交换中心建设运营步入正轨。国家枢纽间传输时延不超过 20 ms，集群到周边主要城市传输时延不超过 5 ms，区域内算力节点间时延达 1 ms。入算网络泛在、灵活、敏捷，技术创新和应用活跃。IP 承载网具备广域无损超宽 400GE，TB 级样本数据小时级送达的能力，网络吞吐 90%+，确保计算不等样本，提升训练效率；IP 应用感知使网络能够

20 积分 | 54 页 | 4.38 MB | 6 月前
3
基于大模型的具身智能系统综述

张雨浓 1 郑伟诗 1 孙富春 2 摘要得益于近期具有世界知识的大规模预训练模型的迅速发展, 基于大模型的具身智能在各类任务中取得了良好的效果, 展现出强大的泛化能力与在各领域内广阔的应用前景. 鉴于此, 对基于大模型的具身智能的工作进行了综述, 首先, 介绍大模型在具身智能系统中起到的感知与理解作用; 其次, 对大模型在具身智能中参与的需求级、任务级、规划级和动作且可以与物理环境进行信息、能量交换的智能系统[2]. 虽然在过去的几十年间, 离身智能取得了令人瞩目的成就, 但对于解决真实世界的问题来说, “具身”的实现仍然是必要的, 与强调从经验中学习并泛化的离身智能方法相比, 具身智能更强调与环境的交互, 只有拥有物理身体才能与世界进行互动, 更好地解决现实问题[3]. 当前, 随着机器人技术和计算机科学的发展, 具身智能受到更多的关注, 逐渐从概念走向实际应用年 1 月 ACTA AUTOMATICA SINICA January, 2025 数更新或微调的情况下, 仅通过文本交互来指定任务和少样本示例就能很好地完成各类任务. 在此之后, 具有优秀泛化能力与丰富常识的基础模型在计算机视觉、自然语言处理等领域都展现出令人瞩目的效果. GPT-4[5]、LLaMA[6]、LLaMA2[7]、Gemini[8]、 Gemini1.5[9] 等大语言模型能与人类进行流畅的对

20 积分 | 19 页 | 10.74 MB | 6 月前
3
AI知识库数据处理及AI大模型训练设计方案(204页 WORD)

化需求。项目通过对多源异构数据的采集、清洗、标注和结构化处理，打造高质量的知识库，为后续的 AI 模型训练提供坚实的基础。同时，结合先进的深度学习技术和规模化计算资源，设计高效的模型训练流程，确保模型在准确性、泛化能力和计算效率方面达到预期目标。项目的实施将涵盖以下关键步骤：  数据采集与整合：从内部系统、公开数据集以及第三方数据源中获取数据，确保数据的多样性和覆盖度。  数据清洗与预处理：通过去重、缺失值填充、异常值处理等操最终，该方案将广泛应用于金融、医疗、教育等多个行业，推动人工智能技术的深入应用和创新发展。 1.2 项目目标本项目的核心目标在于构建一个高效、精准的知识库数据处理系统，并基于该数据处理结果，训练出一个具备强大泛化能力和智能化水平的 AI 大模型。通过系统的数据处理和模型训练，最终实现从海量异构数据中提取有价值的信息，并将其转化为可支持决策和创新的知识资产。具体目标包括以下几个方面：首先，实现模型提供丰富的上下文信息。知识图谱的关键性能指标包括： - 实体识别准确率达到 95% 以上 - 关系抽取准确率达到 90% 以上 - 知识图谱覆盖率达到 80%以上再次，设计并训练一个具备强泛化能力的 AI 大模型。基于处理后的数据，采用预训练-微调的技术路线，训练一个能够适应多场景任务的 AI 模型。模型的训练过程将注重优化参数效率和数据利用率，确保模型在有限资源下仍能保持高性能。模型训练的关键

60 积分 | 220 页 | 760.93 KB | 10 月前
3
AI大模型人工智能数据训练考评系统建设方案（151页 WORD）

过本项目的实施，将建立起一套科学、规范、高效的人工智能数据训练考评体系，为 AI 技术的进一步发展提供有力支撑。 1.1 项目背景随着人工智能技术的迅猛发展，其在各行各业的应用日益广泛，尤其在数据驱动的决策支持、自动化流程优化以及智能分析等领域表现尤为突出。然而，人工智能系统的性能和效果高度依赖于其训练数据的质量和模型训练的精准度。在当前的技术实践中，数据训练的效果评估练参数和策略。在数据考评方面，系统需要构建一套完整的考评指标体系，以确保模型训练的有效性和科学性。考评指标应涵盖模型精度、泛化能力、训练效率等多个维度，并结合实际应用场景进行动态调整。例如：  模型精度：准确率、召回率、F1-score 等  泛化能力：测试集表现、过拟合检测等  训练效率：单次训练耗时、资源利用率等系统应支持自动化考评工具的开发与应用，减少人工干预，提 CSV、JSON、图像、视频等），并提供数据清洗、归一化、特征工程等预处理模块，确保训练数据的高质量。系统还应具备数据增强功能，特别是针对图像和文本数据，支持随机裁剪、翻转、旋转、噪声添加等操作，以提升模型的泛化能力。在训练过程中，系统需实时监控训练状态，包括损失函数值、准确率、学习率等指标，并提供可视化工具，如 TensorBoard 集成，帮助用户直观分析训练效果。为了提高训练效率，系统应支持断点续训功能，允许用户在训

60 积分 | 158 页 | 395.23 KB | 10 月前
3
DeepSeek在金融银行的应用方案

112 6.1.1 数据质量与可用性...................................................................113 6.1.2 模型泛化能力...........................................................................115 6.1.3 计算资源需求..... 衍生特征：计算信贷额度使用率、逾期率等衍生指标。  交互特征：将多个特征组合，如交易金额与交易时间的乘积。最后，将处理后的数据划分为训练集、验证集和测试集，通常按 7:2:1 的比例分配，确保模型在训练中能够泛化到新数据。值得注意的是，金融数据具有时间序列特性，因此在划分数据集时需采用时间序列交叉验证策略，避免数据泄露。通过以上步骤，可以确保数据的质量，为后续的模型训练和预测奠定坚实基础。 4 适合的机器学习算法，如逻辑回归、随机森林、梯度提升树等。对于复杂场景，可以采用深度学习模型，如 LSTM、Transformer 等。模型训练过程中，采用交叉验证方法进行参数调优，确保模型的泛化能力。使用网格搜索或贝叶斯优化等自动化超参数调优技术，提升模型性能。模型训练完成后，进行模型评估与验证。使用准确率、召回率、F1 分数、AUC 等指标对模型性能进行全面评估。此外，通过

10 积分 | 154 页 | 527.57 KB | 1 年前
3
深度学习在智能助理产品中的应用（20页PPT-吾来）

2017] 有监督学习无监督学习历史语料主题词预处理 l 基于知识库和历史语料训练具有较强语义泛化能力的问答模型 l 提高问答机器人的召回率和准确率 l 用候选回复辅助客服，提升服务效率 l 传统方法缺乏语义泛化能力 l 传统方法没有上下文理解的能力 l 使用检索 + 上下文深度匹配排序的方法 l 匹配模型考虑上文历史消息序列深度学习的应用：

10 积分 | 20 页 | 427.93 KB | 6 月前
3
AIGC生成式AI大模型医疗场景应用可行性研究报告(152页 WROD)

高效性：在某些情况下，生成的内容能够达到或超过人类专家的水平，提高效率并降低误诊率。  个性化：能够根据用户特定的需求或者特征提供量身定制的内容或建议。通过这些特点，AI 生成式大模型在医疗场景中的应用展现出广泛的潜力，能够大幅提升诊断的精确度、治疗的针对性以及医疗服务的效率。这些特征也使得生成式大模型成为未来医学发展的重要工具。 2.1.1 生成式模型概念生成式模型是一类能够通过学习数据分布生成新样本的机器学形式的信息。这对于医疗图像分析和报告生成等应用具有重要价值，如通过 AI 分析医学影像并自动生成影像报告。 3. 自监督学习的利用：自监督学习方法允许模型在未标注数据上进行训练，促进了模型的泛化能力和知识的融入。这意味着 AI 可以在相对较少的标签数据的情况下，依然能够应用于疾病预测和临床决策支持系统。 4. fine-tuning 技术的成熟：使得在特定领域（如医学）中进行模 150 30% 临床决策支持系统 120 25% 药物研发 100 20% 患者管理与教育 80 15% 其他 50 10% 这些应用案例的汇总显示出 AI 生成式大模型在医疗行业的广泛应用与迅猛发展。在过去几年中，随着数据的积累和计算能力的提升，医疗场景中的 AI 技术不仅带来了效率的提升，也为患者提供了更为精确的医疗服务。在未来，随着技术的持续进步和优化，预计还会涌现

60 积分 | 159 页 | 212.70 KB | 10 月前
3
2025年智算服务案例集-全球计算联盟

编写组成员（排名不分先后）马季春王曼施晶峰王月张建峥赵以爽杨军刚杨伊鸣郭光鑫吴茜梁宇栋马凤鸣党朝志赵金辉陈常水颜万瑞吴涛顾剑波谈儒猛夏冬胡铭珊孙东旺、熊家振、许轶版权声明本研究报告版权属于全球计算联盟。使用说明：未经全球计算联盟事先的书面授权，不得以任何方式复制、抄袭、影印、翻译本文档的任何部分。凡转载或引用本文的观点、数据，请注明“来源： AI、大数据、云计算和高性能计算为核心的新一代信息技术产业，旨在为各行各业提供高效、智能的数据处理与决策支持能力。随着全球数字化转型加速，智算产业已成为推动经济增长、科技创新的关键基石。政策与市场方面，中国“东数西算”工程、美国“人工智能行动计划 2”等政策加速推进了智算基础设施布局；金融、医疗、制造等行业利用 AI 优化流程，提高生产力和效率，使得智算服务市场年增速超 30%。技术驱动方面，

10 积分 | 28 页 | 2.59 MB | 4 月前
3
大模型技术深度赋能保险行业白皮书151页（2024）

等方面的挑战，更为开发出更加健壮、可靠且公平的大模型奠定了坚实基础。具体而言，合成数据尤其适用于那些数据稀缺或难以直接获取的特定领域。此外，合成数据还能根据具体需求进行定制化设计，如确保不同类别数据的平衡表示，进一步提升模型的泛化能力。同时，合成数据还有助于缓解数据隐私保护的压力，通过创建匿名化或去标识化的数据集，为数据的安全共享与高效利用提供了保障。 1.1.1 数据：多措并举缓解短缺状态 �� 然而，值得可能。（1）视频生成模型的进步视频生成模型是大模型技术中的一个新兴领域，它允许从文本描述直接生成视频内容。过去一年，这一技术取得了显著的进展，生成的视频质量大幅提高，应用场景也更加广泛，包括电影制作、广告创意和虚拟现实等。视频生成模型利用深度学习技术生成高质量的视频内容。随着算力的提升和算法的优化，视频生成模型在生成连贯、逼真的视频方面取得了显著进步。例如，2024年2月16日，（2）多模态模型的崛起多模态模型能够处理和理解不同类型的数据，如文本、图像和声音。过去一年中，这一领域取得了显著进展，尤其是在图像和文本的联合表示学习方面。这些模型不仅提高了任务的性能，还增强了模型的泛化能力，使其能够更好地理解和生成复杂的数据模式。今年5月，OpenAI在其春季发布会上推出了他们的最新旗舰模型：GPT-4o，该模型具备强大的多模态实时交互能力。其对音频输入的响应时间最短为0

20 积分 | 151 页 | 15.03 MB | 6 月前
3
智慧地铁城市轨道交通行业AI大模型应用设计方案

训练过程中的参数调整也非常关键。我们可以通过下列步骤优化训练效果：  超参数调优：使用网格搜索或随机搜索优化学习率、批大小、层数等超参数。  交叉验证：利用 K 折交叉验证提高模型的泛化能力，避免过拟合问题。  模型集成：可以考虑使用简易集成方法（如 Bagging 和 Boosting），结合多个模型的优势，提升最终预测准确度。对于训练数据的监控与反馈机制，建议建立实时监测系统，对  超参数调优：利用网格搜索或贝叶斯优化方法对超参数（如学习率、批量大小等）进行系统搜索，以寻找到最优的训练配置。  模型评估与验证：定期根据交叉验证结果调整模型结构，确保模型的泛化能力，防止出现过拟合。综上所述，设计深度学习模型时需充分考虑数据的多样性与复杂性，通过合理的网络结构和有效的训练策略，能够显著提升城市轨道交通行业引入 AI 技术后的智能化水平和运营效率。模型训练阶段是关键，首先通过对数据集进行划分，建立训练集、验证集和测试集。随后，将训练集用于训练模型，利用反向传播算法和优化器（如 Adam 或 SGD）更新模型参数。在这一过程中，可以运用数据增强技术来提升模型的泛化能力。此外，使用早停（Early Stopping）策略可以防止模型过拟合，通过对验证集的表现来调整训练过程。在训练过程中，可运用交叉验证来进一步评估模型的稳定性和可靠性，确保模型在

40 积分 | 154 页 | 284.34 KB | 11 月前
3

共 24 条前往

页

分类

语言

格式

CAICT算力：2025综合算力指数报告

基于大模型的具身智能系统综述

AI知识库数据处理及AI大模型训练设计方案(204页 WORD)

AI大模型人工智能数据训练考评系统建设方案（151页 WORD）

DeepSeek在金融银行的应用方案

深度学习在智能助理产品中的应用（20页PPT-吾来）

AIGC生成式AI大模型医疗场景应用可行性研究报告(152页 WROD)

2025年智算服务案例集-全球计算联盟

大模型技术深度赋能保险行业白皮书151页（2024）

智慧地铁城市轨道交通行业AI大模型应用设计方案