AI智能体行业案例(22页 PPT)3 )限制,包括要求拒绝回答无关问题并要求按格式回复。对于专业领域问答,一般还需要规定明确的回复格式,这可以 通过少样本提示完成。我们使用的民法典原文件是 PDF 格式,将在扣子中被转换成文本格式(大模型无法直接处理 Word 和 PDF 等格式的文档,需要转换成纯文本格式)在智能体配置的“知识”中选择“文本”,添加已有的知识库,在创建 知识库时,用户可以上传文档,并设置文档解析策略、过滤策略和10 积分 | 22 页 | 1.02 MB | 3 月前3
建筑行业建筑设计接入DeepSeek AI大模型应用设计方案(228页 WORD)筑设计相关的数据进行全面的收集与整理,包括但不限于建筑平面 图、立面图、剖面图、结构系统图、设备布置图、材料规格表以及 相关的设计规范和标准。这些数据通常以 CAD 图纸、BIM 模 型、Excel 表格和 PDF 文档等形式存在,因此需要建立统一的数据 仓库,确保所有数据能够被高效存储和快速检索。 接下来,进行数据清洗与预处理,以消除数据中的噪声和不一 致性。具体步骤包括: 1. 数据格式转换:将不同格式的文件转换为模型可处理的统一格 在建筑设计领域,数据标准化与格式统一是确保模型训练和应 用效果的关键步骤。首先,针对不同来源的建筑设计数据,如设计 图纸、建筑材料参数、结构计算书等,需进行统一的数据格式转 换。例如,设计图纸可能以 DWG、DXF 或 PDF 格式存在,须统一 转换为 AO 标准的矢量图形格式,以便后续处理。 数据标准化处理涵盖多个方面: - 坐标系统一:将所有设计图 纸转换为统一的地理坐标系(如 WGS84),确保空间数据一致 备交互功能,允许用户通过鼠标或触摸屏对设计结果进行旋转、缩 放、剖切等操作,以便更直观地了解设计方案。此外,输出区还应 提供一键导出功能,支持将设计结果导出为常见的文件格式,如 DWG、PDF、JPEG 等。 参数调整区是用户对模型进行微调的关键区域,应提供直观的 滑块、下拉菜单、复选框等多种交互控件,方便用户调整设计参 数。为了降低用户的使用门槛,该区域应内置多种预设参数组合,10 积分 | 239 页 | 624.33 KB | 3 月前3
英特尔-教育行业AI实战手册2024Object Detection,Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi https://arxiv.org/pdf/1506.02640.pdf 行为分类:在区分出待检测的各个学生后,就需要对学生当 前行为进行识别与分类。通常而言,最简单的行为识别就是 以单一视频帧为对象,然后利用 CNN 对其进行识别,但这种 方法 Hausknecht,Sudheendra Vijayanarasimhan, Oriol Vinyals,Rajat Monga,George Toderici https://arxiv.org/pdf/1503.08909.pdf 视频采集 人物检测 行为分类 图 2-2-2 面向教育场景的行为分析方案架构 图 2-2-4 采用 LSTM 模型的行为识别网络架构 图 2-2-5 按帧统计时的行为状态分析 HCLG,Kaldi 中使用 compile-train-graph 来加载声学模型, 用 faster-decoder 解码器进行维特比解码,解码器的输出结 果会包含识别文本序列、pdf-id 序列。其中,pdf-id 序列可以 计算出音素的起始帧和帧数,根据音素的时间轴信息可以还原 识别文本的单词、句子的时间轴信息。根据这些时间轴信息在 声学模型中提取分数特征用来结算每个颗粒度的发音分数。10 积分 | 40 页 | 4.85 MB | 9 月前3
金融银行业务接入DeepSeek AI大模型智能体建设方案(304页 WORD)识别准确率≥99.5%(300dpi 标准分辨率) o 表格结构还原 F1-score 达98.2% o 跨模态语义关联响应时间<800ms(A4 尺寸文档) 2. 动态文档理解 支持 PDF、Word、Excel 等20+文件格式的端到端处理,具 备以下特征: o 自动识别文档中的关键字段(如金额、账号、日期) o 理解多页文档的全局逻辑关系 o 保留原始排版格式的语义标注 5% ≥ 部署阶段采用动态热更新机制,通过以下方式保证模型持续优 化: 1. 建立客户反馈自动标注流水线,将人工坐席修正记录转化 为训练样本 2. 每周增量训练时引入最新监管政策文档(PDF/PPT 格式自动解析) 3. 季度性全量微调时同步更新金融知识图谱(含 约20 万实体关系对) 该模块通过金融专用 tokenizer 扩展( 新增 1,200+金融词汇) 和注意 处理(四分位数范围缩 放),避免极端值影响 o 文本字段:执行 GB18030 编码统一转换,处理特殊字 符集问题 非结构化数据处理 建立多模态处理流水线,重点解决文档类 数据的标准化: 1. PDF/ 扫描件处理: - 使用 OCR 引擎提取文本 后,通过正则表达式过滤非金融相关符号 - 关键字段(如金额、 日期)提取模板: 字段类型 正则表达式 后处理逻辑 人民币金额 ¥10 积分 | 313 页 | 3.03 MB | 3 月前3
保险行业理赔业务基于DeepSeek AI大模型应用设计方案(281页 WORD)预处理与标准化环节部署了分布式数据处理集群,关键处理步 骤包括: 1. 数据脱敏:自动识别并加密 PII(个人身份信息)字 段,采用国密 SM4 算法处理身份证号、银行卡号等敏感数据 2. 格 式转换:将 PDF/JPEG 等格式通过 OCR 服务转化为结构化文本,医 疗影像使用 DICOM 标准转换 3. 数据增强:对模糊图像采用超分辨 率重建,对缺失字段通过第三方数据补全 模型推理层采用动态加载机制,根据理赔类型自动匹配最优模 事故证明、身份 文件等 12 类常见理赔材料,平均审核时效从传统人工处理的 4.6 小时缩短至 8 分钟,错误率下降 72%。 核心处理流程包含以下环节: 1. 文档智能解析 - 支持 PDF、 扫描件、照片等非结构化数据输入 - 采用 OCR+语义理解双引擎技 术,识别准确率达 98.4% - 自动提取关键字段(如病历中的诊疗日 期、伤情描述等) 2. 逻辑一致性校验 增量批处理混合模式采集数据。重点覆盖以下数据类 型: - 结构化数据:保单信息(投保人、险种、保额)、理赔申请 单(事故描述、损失清单)、核赔结论(赔付金额、拒赔原因代 码) - 非结构化数据:医疗报告扫描件(PDF/JPG)、伤情照片、 维修报价单(Excel/Word)、客户通话录音(需转文本) 数据清洗规范(示例) | 数据类别 | 常见问题 | 清洗方法 | 输出标准 | |—————-|—————————|20 积分 | 295 页 | 1.87 MB | 3 月前3
新材料行业可信数据空间建设方案(132页 WORD)、 不同编码 、不同单位的数据转换为统一格式, 以便进行 后续 的集成和分析 。针对文件格式转换, 开发专门的格式 转换工 具 ,能够将常见的文件格式 ,如 Excel 、CSV 、PDF 等 ,相 互转换为符合数据空间存储和处理要求的格式 。例如, 将 Excel 格式的实验数据文件转换为 CSV 格式, 便于在大数 据处理框架中进行批量处理 。在数据编码转换方面, 、编码与单位的数据之间的高效转换 。在文件格式转换 方面,能够将常见的文件格式,如 Excel、CSV、PDF、XML 等,相互转换为符合数据空间存储与处理要求的格式。例如, 将 Excel 格式的实验数据文件转换为 CSV 格式, 便于在 大数据处理框架中进行批量处理; 将 PDF 格式的研究报告 文件转换为文本格式, 以便进行文本挖掘与数据分析 。在 数 据编码转换方面, 利用编码转换库, 。市场分析报表 则结合市场调研数 据,对新材料的市场规模、市场份额、竞 争态势等进行分析, 并以图表和文字相结合的形式展示, 为 企业的市场决策提供 依据 。报表生成服务支持多种输出格 式, 如 PDF 、Excel 、 Word 等, 方便用户根据不同需求 进行数据汇报和进一步分 析。 可视化展示服务: 运用先进的数据可视化技术, 将复杂的 新 材料数据以直观 、生动的图表 、图形 、地图等形式展示10 积分 | 133 页 | 216.08 KB | 22 天前3
运营商智算中心建设思路及方案[2024-01-20]. https:// aiindex. stanford. edu/wp-content/uploads/2023/04/HAI_AI-Index- Report_2023.pdf. [10] 殷凯凯. 基于电信运营商视角的智算中心规划建设关键要点分析 及建议[J]. 现代信息科技,2024,8(1):22-27. 作者简介: 童俊杰,高级工程师,博士,主要从事云计算10 积分 | 6 页 | 3.64 MB | 3 月前3
税务稽查基于DeepSeek AI大模型应用设计方案(214页 WORD)此外,DeepSeek 还支持与其他税务系统的无缝集成,如税务 申报系统、发票管理系统等,确保稽查报告中的数据来源广泛且准 确。为了进一步提升用户体验,系统还提供了多种报告导出格式, 如 PDF、Excel 等,方便稽查人员进行后续处理和存档。通过以上 功能,DeepSeek 的自动化报告生成能力不仅提升了税务稽查的效 率,还为税务机关提供了更强的数据驱动力,助力更精准的税务管 理和决策。 案件基本信息、稽查进度和相关文档链接。用户可通过点击记录查 看详细信息,或直接下载相关文档。 报表生成界面采用模板化设计,用户只需选择报表类型(如稽 查报告、数据分析报告等),系统即可自动填充数据并生成标准化 报表。报表支持 PDF、Excel 等多种格式导出,并可通过邮件或系 统消息直接发送给相关责任人。 为提升用户体验,系统还提供了个性化设置功能。用户可根据 个人偏好调整界面主题(如深色模式、浅色模式)、字体大小和布 数据来源广泛,包括税务系统内部数据、企业财务报表、银行交易 记录、第三方平台数据等。DeepSeek 能够建立统一的数据接入接 口,支持结构化数据(如数据库表)、半结构化数据(如 XML、JSON 文件)和非结构化数据(如 PDF 文档、电子邮件)的 自动采集和解析。例如,对于企业申报的财务报表,可以利用 OCR 技术提取关键字段,并将其与税务系统中的申报数据进行比对,确 保数据的完整性和一致性。 其次,采用实时数据采集技术提升稽查效率。传统的数据采集10 积分 | 225 页 | 622.28 KB | 3 月前3
AI可信数据空间(54页 WORD)图 15 知识搜索引擎功能架构 基于上述知识库搜索面临的问题与挑战,在可信数 据空间中的知识搜索引擎需要提供如下核心能力: · 智能文档解析与知识构建 知识搜索引擎支持多种文档格式(如 PDF、Word、 PPT、图片等)的解析与知识提取,将非结构化数据转 化为 AI 可理解的知识图谱或向量数据。例如,政策 文件中的条款会被转化为知识图谱,清晰展示政策 间的关联关系;图片和表格则会被转录并标注,生 类典型应用场景: (1)高密的资料文档交换。主要应用于研发、销售 等领域,如涉及芯片 / 部件 相关的 技术文件、研 发 路标规划等,为非结构化数据文件,如 Word、PPT、 Excel、PDF 等文件,从华为向生态伙 伴单向传递。属于华为高密数据,需要严格控制使用 范围(仅具体合作项目成员),只允许查看。 (2)敏感业务信息共享查询。主要应用于制造、物 流、服务等领域,如华为向整机厂商供货的物流计10 积分 | 55 页 | 4.11 MB | 22 天前3
数字化医疗系统接入DeepSeek构建Agent智能体提效方案(220页 WORD)预处理后存入向量数据库。关键数据流转指标如下: 数据类型 处理时效 存储格式 安全等级 电子病历 T+1 小时 FHIR 标准 JSON P3 级加 密 检验报告 实时流处 理 DICOM+PDF P2 级加 密 医患交互语音 T+4 小时 128kbps MP3 P4 级加 密 智能层部署三大核心引擎:临床决策支持引擎采用多模态 Transformer 架构,在 300 万份三甲医院病历上微调的模型实现 结合患者个体特征进行二次过滤: 4. 多模态警示系统 o 界面层:在电子处方界面嵌入彩色高亮警示条 o 语音层:对禁忌级交互触发工作站语音报警 o 文档层:自动生成包含替代方案的 PDF 附录 系统每 24 小时同步更新一次药物数据库,对于新上市药品 (如 CDE 批准 3 ” 个月内品种)会额外标注 新分子实体-监测建 ” 议 标签。所有交互判断均记录审计日志,支持点击查看原始文献 15% | | 穿戴设备 | 5Hz 采样率 | 增加动态阈值预警算法 | 漏报率 <3% | 3. 系统对接能力强化 重点开发非结构化报告转换组件,解决当前 30%的 PDF 化验 单解析缺失问题 建立供应商白名单机制,确保第三方设备接入符合 ISO 13485 医疗器械标准 4. 实时性优化专项 在急诊科部署边缘计算节点,将危急值响应延迟从 8.2 秒压缩40 积分 | 213 页 | 1.48 MB | 7 月前3
共 21 条
- 1
- 2
- 3
