厦大团队:DeepSeek大模型赋能政府数字化转型据上进行训练, 以寻找特 征并发现 规律 ,进而形成可“举一 反三” 的强 大泛化能力 ,可在不 进行微调或少 量微调的情况下完 成多场景任务 , 相当于 AI 完成 了“通识教育” 行业大模型 L1 是指那些针对特定行业或领域的大 模型 。 它们通常使用行业相关的 数 据进行预训练或微调, 以提高 在该 领域的性能和准确度,相当 于 AI 成 为“行业专家” 垂直大模型 L2 是指那些针对特定任务或场景的大 是指那些针对特定任务或场景的大 模型 。 它们通常使用任务相关的 数 据进行预训练或微调, 以提高 在该 任务上的性能和效果 1.4 大模型的分 类 按照应用领域的不同 ,大模型主要可以分为 L0 、 L1 、 L2 三个 层级 OpenAI 定义推理模型 在 OpenAI 的官网上 , OpenAI 定义推理 模 型是在回答之前进行思考 , 并在回复用 户 之前 ,在内部生成一长串的思维链过10 积分 | 121 页 | 13.42 MB | 6 月前3
政务系统接入DeepSeek构建智能体提效方案出合 规性 政务数据交互采用分级处理机制,敏感字段在传输前进行 AES-256 加密,内存中最大驻留时间不超过 60 秒。系统设置三级 缓存策略: 缓存层级 存储介质 命中率 失效机制 L1 Redis 92% TTL 15s L2 ES 7% LRU 淘汰 L3 本地内存 1% 请求结束释放 业务流程优化通过动态工作流实现,系统自动生成处理流程图: 性能保障方面,部署集群采用 医疗保障局 月度汇总 关键实施步骤包含: 1. 数据源映射:建立字段级元数据目录, 标注敏感等级(PII/非 PII),例如: - 身份证号标记为 L3 级敏感 数据 - 企业注册资金标记为 L1 级公开数据 2. 标准化处理:采用国家政务信息资源标准(GB/T 31076- 2014)进行格式转换,重点处理: o 日期时间统一转为 ISO 8601 格式 o 金额字段强制保留两位小数10 积分 | 273 页 | 1.96 MB | 6 月前3
数字政府智慧政务AI法制员大模型设计方案(213页 WORD)性。较小的批量大小可带来更好的泛化能力,但训练时不稳 定。根据硬件条件及模型复杂度进行调整,建议尝试 32、64、128 等常见值。 3. 正则化参数(Regularization Parameters):如 L1 和 L2 正则 化,适合防止过拟合。通过逐步试探不同的正则化系数,可以 找到合适的平衡点。 4. 激活函数(Activation Functions):不同的激活函数对于模型 训练结果的影响显著。根据模型任务特征,可尝试10 积分 | 224 页 | 1.34 MB | 1 月前3
数字政府智慧政务办公大模型AI公共支撑平台建设方案(308页WORD)调整学习率以获得更稳定的训练过程。 超参数优化步骤: - 确定超参数搜索范围 - 选择优化算法(如贝叶斯优化) - 评估不同超参数组合的性能 - 选择最佳超参数组合 2. 正则化技术:为防止模型过拟合,可以采用 L1/L2 正则 化、Dropout、早停等技术。L2 正则化通过在损失函数中加 入权重衰减项,限制模型复杂度;Dropout 随机丢弃部分神 经元,增强模型的鲁棒性;早停技术则通过监控验证集损失,10 积分 | 323 页 | 1.04 MB | 1 月前3
共 4 条
- 1
