CAICT算力:2025综合算力指数报告区产业仍以传统资源型产业和劳动密集型产业为主,数字化转型的 动力相对薄弱,具备巨大的算力发展潜力和市场空间。 区域差距的扩大既会加剧经济发展的不平衡,也会制约全国产 业数字化的整体进程。研究综合算力指数有助于促进我国各区域充 分利用优势要素,挖掘区域发展需求,合理配置算力资源;加速算 力与产业深度融合,全方位驱动产业数字化转型进程,催生新业态、 新模式;缩小区域间发展差距,促进我国算力产业协调发展,推动 产业数字 建设成效显著。中国算力平台监测数据显示,截至 2025 年 6 月底, 全国存力规模达 1680 EB,相比于 2023 年增长约 40%,存力规模持 续扩大。《全国数据资源调查报告(2024 年)》显示,我国数据存 储总量持续增长,2024 年已达 2.09ZB,同比增长 20.81%。大数据、 人工智能等技术的广泛应用,以及智能制造、智慧交通等场景对海 量数据存储需求的释放,有力推动了存储需求的增加。 我国 。存力 方面,推动高性能、大容量新型存储技术发展,鼓励部署更先进的 分布式存储、全闪存阵列、海量冷存储介质,提升“存力”能效比和 密度;突破存储技术瓶颈,研发下一代高速存储介质及更高效的存 储管理软件。运力方面,构建“高带宽、低时延、全连接”的运力网 络,持续建设 400G/800G 及更高速骨干网;推动全光网络在算力中 心互联(DCI)和边缘侧应用的深度覆盖和性能提升。加速推进“算、20 积分 | 54 页 | 4.38 MB | 1 月前3
AI知识库数据处理及AI大模型训练设计方案(204页 WORD)为高效管理多源数据,可构建数据采集管道,使用 ETL(Extract, Transform, Load)工具或分布式计算框架(如 Apache NiFi、Apache Kafka)实现数据的自动化采集、清洗和存 储。最终,采集的数据应存储于结构化数据库(如 MySQL、PostgreSQL)或非结构化数据库(如 MongoDB、Elasticsearch)中,以便后续处理和分析。 通过上述方案,可确保数据来源的多样性和采集过程的规范 数据存储与备份:采集到的数据应按照统一的存储规范进行保 存,并定期备份。建议使用分布式文件系统(如 HDFS)或云 存储服务(如 AWS S3、Azure Blob Storage)进行数据存 储,以确保数据的安全性和可扩展性。 监控与日志记录:在数据采集过程中,应建立完善的监控和日 志记录机制,及时发现和处理采集过程中的异常情况。可使用 监控工具(如 Prometheus、Grafana)对采集任务进行实时 记录,可以直接删除。这种方法适用于缺失值比例较高且对整 体数据影响较小的情况。 填充法:对于数值型特征,可以使用均值、中位数或众数进行 填充;对于类别型特征,可以使用众数或特定的默认值进行填 充。此外,还可以基于其他相关特征进行预测填充,例如使用 回归模型或 K 近邻算法。 插值法:对于时间序列数据或其他有序数据,可以使用线性插 值、多项式插值或样条插值等方法进行缺失值的估计。插值方60 积分 | 220 页 | 760.93 KB | 5 月前3
Deepseek大模型在银行系统的部署方案设计发处理能力、快速推理速度、强大的数据处理能力、高可用性和高 安全性等性能需求,以确保系统能够高效、稳定地支持银行业务的 开展。 3. 系统架构设计 在部署 Deepseek 大模型于银行系统时,系统架构设计需要充 分考虑高可用性、安全性、可扩展性和性能优化。架构整体采用模 块化设计,分为数据层、模型层、服务层和应用层,各层之间通过 标准化接口进行通信,确保系统的灵活性和可维护性。 数据层作为系统的核心,负责数据的存储与管理。采用分布式 能够快速恢复业务。备份数据采用异地多副本存储,结合增量备份 和全量备份策略,减少恢复时间目标(RTO)和数据丢失风险 (RPO)。 通过上述方案,确保 Deepseek 大模型在银行系统中的数据存 储高效、安全且可扩展,为银行业务的稳定运行提供坚实的数据基 础。 4.3 数据处理 在银行系统中,Deepseek 大模型的数据处理环节是确保数据 质量、提升模型性能的关键步骤。首先,数据的预处理阶段需要对 大模型至银行系统时,合规检查是确保系统 安全运行、符合监管要求的关键环节。首先,需进行全面的数据隐 私与保护审查,确保模型处理的所有客户数据均符合《个人信息保 护法》及银行业相关数据保护规定。具体措施包括:数据加密存 储、访问权限控制、数据最小化原则的实施等。同时,需设立数据 泄露应急响应机制,确保在数据安全事件发生时能迅速采取有效措 施。 其次,模型输出的合规性检查同样重要,这涉及到模型的决策 逻辑和输出结10 积分 | 181 页 | 526.32 KB | 7 月前3
埃森哲报告:AI赋能保险,三大应用场景如何重构价值链?pdf数据分析:挖掘隐藏价值,以尖端科技打造创新产品 保险公司为了利用数据进行定价和风险管理,在技术和人员上进行了大量投 资。但他们仍看重传统的保险精算师,这意味着,数据并没有得到应有的充 分利用。所以,保险公司应该利用人工智能来挖掘数据中隐藏的价值。例如, 以前所未有的方式查询和可视化企业以及客户的数据。 这样可以打破现有价值链和数据竖井的局限性,在整个业务中发挥杠杆作用。10 积分 | 11 页 | 422.61 KB | 1 月前3
从大模型、智能体到复杂AI应用系统的构建(61页 PPT)进行微调, 并结合预算强制技术,实现了强大的推理能力和测试时计算扩展性 如何低成本实现推理模型? Less Is More for Reasoning LIMO 假说: 在预训练阶段已经充 分 编码领域知识的基础模型中, 复 杂 的推理能力可以通过最少但精 确编 排的认知过程演示来涌现: • 模型具备丰富预训练知识 • 高质量的推理链示范 LIMO 通过 817 个训练样本20 积分 | 61 页 | 13.10 MB | 1 月前3
公共安全引入DeepSeek AI大模型视频智能挖掘应用方案,为实 时监控和分析提供支持。 大容量存储:系统应支持扩展存储,能够处理长时间的高流量 数据,保证数据的不间断存储。 数据压缩技术:采用高效视频编码技术,如 H.265,以降低存 储空间和带宽需求,同时不影响画质。 最后,视频数据采集系统的设计应考虑用户的操作便捷性和系 统的安全性。具体需求包括: 用户友好的界面:提供简单直观的数据管理和设备监控界面, 使用户能够轻松进行设置和操作。 数据处理工具:利用 OpenCV、FFmpeg 等工具进行视频数据 的预处理和格式转换,确保数据的高效输入与输出。 数据库系统:使用 PostgreSQL 或 MongoDB 等数据库来存 储用户信息和分析结果,确保数据的持久性与可查询性。 安全工具:配置防火墙和入侵检测系统,如 iptables 和 Fail2ban,以保障服务器的安全性。 综上所述,本项目的服务器配置方案旨在为视频智能挖掘提供 社区支持与文档:优秀的支持社区和详细的文档可以显著降低 使用过程中的学习成本和开发时间。 易集成性:所选工具是否能够与现有的硬件系统及其他软件工 具顺利集成。 总结来说,在实际项目中,可选用以下软件工具的组合,以充 分利用其各自的优势,实现视频智能挖掘的最佳效果: 软件工具 主要功能 适用场景 TensorFlow 深度学习框架,支持大规模训练 图像分类与识别 PyTorch 动态图计算,高度灵活 实时视频分析0 积分 | 144 页 | 318.04 KB | 4 月前3
基于大语言模型技术的智慧应急应用:知识管理与应急大脑用自监督学习方法,主动捕捉训练文本中更深层次 的特征和规律,而非在预设知识结构下的信息抽 取[11],从而具有突破已有认知局限实现创新的潜能。 1.1.3 数值计算过程 模型通过优化其预测下一个单词(如 GPT)或填 充缺失单词(如 BERT)的能力,来调整多层神经网络 模型的内部大量神经元连接权重参数,实现对知识 的获取。这一参数调优过程在连续平滑数值空间进 行,与符号化表示的知识获取中的离散符号操作相 比,可以捕捉更为复杂和细致的规律,实现对过往20 积分 | 8 页 | 3.21 MB | 1 月前3
金融-DeepSeek银行部署加速,AI金融应用迎来跃迁编程、智能风控、智能营销等; 3 ) 决 策赋能: 深度分析和决策辅助。 n 从实际落地应用情况看, 大行发力更早, 中小银行正在快速追赶。如工商银行、建设银行、招商银行等大行布局更早, 邮 储银行、浦发银行、江苏银行等也有较为领先布局应用。 AI 一体机的出现为机构提供了全新的解决方案,凭借其开箱 即 用、软硬件一体化设计等优势, 正在成为很多中小银行智能化转型的重要选择。 n 智能问答、智能客服、辅助编程、智能办公、智能风控等 中国银行 内部知识服务、辅助编码等 建设银行 智能客服、市场营销、投研报告、智慧办公、智能运营、智能风控等 交通银行 办公助手、客服问答等 邮储银行 研发测试、运营管理、客户营销、智能风控、消费者权益保护等 中信银行 落地代码生成、智能操作等 平安银行 零售风控、零售贷款审批、运营管理、消保降诉、汽车金融等 招商银行 零售、批发、中后台 入外部模型,保障技术 可 控性 应用场景:建信理财率先探索资产配置优化、风险预警等理财场景,同时通过金融语义框架将“抵押率”“偿债覆盖率”等术语转化为业务逻辑,应用于 合同 解析与风险建模 邮储银行 技术落地:依托自有大模型“邮智”,本地部署并集成 DeepSeek-V3 模型和 DeepSeek-R1 推理模型 应用场景:应用于智能客服“小邮助手”后,新增逻辑推理功能,可精准识别用户需10 积分 | 25 页 | 1.44 MB | 1 月前3
审计领域接入DeepSeek AI大模型构建Agent智能体提效设计方案(204页 WORD)输出格式 结构化数据 财务总账、明细账 字段映射(科目代码→标准科 目体系) 关系型数据库 表 半结构化数 据 电子发票、银行对账 单 JSON/XPath 解析 文档数据库存 储 非结构化数 据 采购合同、审批邮件 OCR 识别+NLP 实体抽取(金 额、签约方) 知识图谱三元 组 数据清洗阶段需部署规则引擎与机器学习双校验机制: 1. 规 则校验层:实施 B :人机协同执行存货监盘 - 模式 C:实时监控资金流水 每周召开问题诊断会,重点优化两个维度:一是调整风险阈值 参数(如关联方交易识别阈值从初始的 0.7 下调至 0.65),二是补 充行业特定规则库(如增加房地产行业收入确认的特殊条款)。试 点期末进行 ROI 测算,要求智能体贡献至少 30%的工时压缩。 第四阶段:全面推广与持续优化(持续进行) 制定阶梯式推 广计划,按会计师事务所规模分批次部署:10 积分 | 212 页 | 1.52 MB | 1 月前3
智慧地铁城市轨道交通行业AI大模型应用设计方案器 和人脸识别技术等。这些技术不仅能够统计进出车站的人流量,还 可以实时分析人流密度情况,进而为乘客安全管理与服务优化提供 依据。 为了确保数据的准确性与可靠性,需建立完备的数据传输与存 储架构。采用边缘计算的方式,在传感器附近进行初步数据处理, 减少传输延迟,并降低网络带宽压力。经过预处理的数据再传输至 云端或本地数据中心进行深度分析。这种模式能够实时、快速响应 异常情况,为 AI 异常值检测 在城市轨道交通行业的 AI 大模型应用中,数据清洗与处理是 确保模型训练和推理有效性的重要步骤。其中,异常值检测是数据 预处理过程中的关键环节。异常值通常是由于数据收集、传输或存 储过程中的错误,而产生的数据点可能会显著影响模型的表现和结 果分析。因此,及时并有效地识别和处理这些异常值将提升数据质 量,提升模型的准确性和鲁棒性。 异常值检测的步骤一般包括数据的初步审查、统计分析方法的 TensorFlow 或 PyTorch 等主流深度学习框 架,这些框架可以支持大规模的模型训练,且拥有活跃的社区 与丰富的生态系统。 此外,在数据管理方面,需要建立健全的数据采集、清洗、存 储与分析体系,建议如下: 数据采集:利用数据采集接口与 SDK,实现对轨道交通系统 各传感器的数据获取,确保数据的全面性与及时性。 数据清洗:引入 ETL 工具,对采集到的数据进行清洗、转换40 积分 | 154 页 | 284.34 KB | 6 月前3
共 19 条
- 1
- 2
