积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部解决方案(195)研究报告(107)人工智能(54)企业案例(54)城市民生(45)能源双碳(33)教育医疗(26)维度学堂(26)行业赋能(25)农业农村(20)

语言

全部中文(简体)(382)

格式

全部PDF文档 PDF(177)PPT文档 PPT(105)DOC文档 DOC(100)
 
本次搜索耗时 0.046 秒,为您找到相关结果约 382 个.
  • 全部
  • 解决方案
  • 研究报告
  • 人工智能
  • 企业案例
  • 城市民生
  • 能源双碳
  • 教育医疗
  • 维度学堂
  • 行业赋能
  • 农业农村
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • DOC文档 DOC
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

    技术剖析:DeepSeek-R1 Zero DeepSeek-R1 Zero: 无需监督微调SFT,纯强化学习驱动的强推理模型 DeepSeek-v3-Base (671B) DeepSeek-R1-Zero 基于规则的奖励 Rule-Based Reward 推理为中心的大规模强化学习 Large-Scale Reasoning-Oriented RL 大规模推理为中心的强化学习,提升模型数学代码能力 RL驱动下自然涌现长文本推理能力 技术剖析:DeepSeek-R1 Zero DeepSeek-R1 Zero: 无需监督微调SFT,纯强化学习驱动的强推理模型 ➢ 奖励建模:基于规则的奖励 (Rule-Based Reward) : 准确率奖励 + 格式奖励 ➢ 准确率奖励 Accuracy Rewards: 判断答案是否是正确的 ➢ 格式奖励Format Rewards: 规劝模型生成答案的过程是 和 ➢ 没有使用Reward model 需要大量的计算资源,可能会复杂化整个流程 ➢ 训练模板:选择最简单的 Thinking Process,直接观察到最直接的RL过程下的表现 基于规则的奖励 (Rule-Based Reward) : 准确率奖励 + 格式奖励 10 DeepSeek-R1 技术剖析:DeepSeek-R1 Zero DeepSeek-R1 Zero: 无需监督微调SFT,纯强化学习驱动的强推理模型
    10 积分 | 76 页 | 8.39 MB | 9 月前
    3
  • ppt文档 北大:DeepSeek-R1及类强推理模型开发解读

    驱动下自然涌现长文本推理能力 基于规则的奖励 Rule-Based Reward 推理为中心的大规模强化学习 Large-Scale Reasoning-Oriented RL DeepSeek-R1-Zero DeepSeek-v3-Base (671B) 奖励建模: 基于规则的奖励 (Rule-Based Reward) : 准确率奖励 + 格式奖励 准确率奖励 Accuracy Rewards: Rewards: 判断答案是否是正确的 格式奖励 Format Rewards: 规劝模型生成答案的过程是 和 没有使用 Reward Model, 因为 ORM 和 PRM 等基于神经网络的都可能遭受 reward hacking 而 retraining reward model 需要大量的计算资源,可能会复杂化整个流程 训练模板: 选择最简单的 Thinking DeepSeek-R1 技术剖析: DeepSeek-R1 Zero 9 基于规则的奖励 (Rule-Based Reward) : 准确率奖励 + 格式奖 励 推理为中心大规模强化学习:组相对策略优化( GRPO ) + 瞄准 Reasoning 推理任务 自我迭代提升 Self-Evolution :
    10 积分 | 76 页 | 6.72 MB | 9 月前
    3
  • pdf文档 《绿色低碳产业补贴政策汇编》(2024年第一季度合订本)

    兆瓦时,全容量放电时长不低于 2 小 时,年充放电次数不低于 450 次),由项目建设运营企业申报,经新片 区管委会组织评审后,按照项目装机容量规模给予 200 元/千瓦时的奖 励支持,奖励分 3 年进行发放,单个项目奖励最高不超过 500 万元, 具体实施细则及申报方式等另行制定发布。鼓励新型储能项目参与电力 市场。 15.结合虚拟电厂建设探索新型储能商业应用新模式 用户侧新型储能项目原则上均应参与虚拟电厂响应,参照本市及新 150 万元奖励;对列入省级工业互联网平台创建名单的 企业,给予 50 万元奖励。(责任单位:市经信局、市财政局) (3)对经认定的省级未来工厂企业、省级未来工厂培育(试点)企 业、省级智能工厂、省级数字化车间,分别给予 200 万元、100 万元、 50 万元、30 万元奖励;对经认定的国家智能制造示范企业和国家智能制 造优秀场景企业,分别给予 200 万元、30 万元奖励。(责任单位:市经 (4)对经认定的国家级、省级制造业创新中心,分别给予 300 万元、 150 万元奖励;对经认定的国家级、省级、市级制造业企业技术中心, 分别给予 150 万元、50 万元、20 万元奖励。对经认定的国际、国内、省 内、市内首台(套)装备(首批次新材料、首版次软件),分别给予 200 万元、150 万元、50 万元和 20 万元奖励;对符合条件的首台(套)装备 保险保费,在投保费率 2%的上限内按保费的
    10 积分 | 215 页 | 1.90 MB | 9 月前
    3
  • word文档 培训体系资料

    提高员工的素质,培养其丰富的知识与技能,提高质量意识 及业务能力、 同时养成良好的职业道德和敬业精神,符合职位现实和发展的要 求,成为自强不息的知识型员工。 1.2 培训主要遵循一般制度原则,辅以奖励性培训原则。 1.3 培训分类 1.3.1 培训按对象分 1.3.1.1 软件人员培训:针对软件事业部和各分公司员工所设计的 培训,主 要内容是与这些人员工作关系紧密的软件开发、设计、测试、安 将公司分为四大部门,分别为软件产品事业部、DY 事业部、分公司和 职能支持部; 1.3. 2.2 奖励性培训:为奖励业绩优良,职位价值高的员工,并激励其 更好 工作而为其提供的培训。 1.4 责任 1.4.1 人力资源部负责制订和执行全公司范围的员工培训计划,包 括制度性培训 和奖励性培训; 1.4.2 各经理、部长对下属的培训负有责任并保证其下属有一定时 间参加培训; 1.4.3 3 人力资源部负责组织实施制度性公司培训,各部门予以配合; 1.4.4 人力资源部负责组织实施奖励性培训,各部门予以配合; 1.4.5 人力资源部负责对新员工进行“入司教育”的计划和实施,其 他部门予以 配合; 1.4.6 各部门负责本部门员工的上岗和转岗培训,人力资源部予以 协助和支持; 1.4.7 对于职能支持部人员的部门培训,由其下属的各个分部门自 行组织实施, 人力资源部予以协助和支持;
    0 积分 | 14 页 | 26.24 KB | 9 月前
    3
  • pdf文档 《绿色低碳产业补贴政策汇编》(2024年第二季度合订本)

    期内 实现产品推广应用。 3.申报材料 (1)企业营业执照、组织机构代码证、税务登记证或多证合一营业 执照(复印件)。 (2)首台(套)认定证明材料。 (3)申报省级首台套市场化推广应用奖励年度首台(套)氢能装备 产品研制/采购的销售合同、销售清单及发票、货款到账凭证,购买保险 保单及发票、货款到账凭证(如有请提供),发票上的产品名称须与认 定的产品名称一致,如不一致需单独说明并提供证明材料。 制氢加氢先进装备、储氢运氢关键零部件等。 (3)项目建设期和运营期内未发生过安全事故及环境污染事故等。 (4)申请贷款补贴的贷款行应为辽宁省内独立银行法人机构。 (5)获得营收奖励的企业如在三年内迁出大东区,应返还全部奖励 (扣除企业所得税等税费部分)。 3.申报材料 (1)企业营业执照、组织机构代码证、税务登记证或多证合一营业 执照(复印件)。 (2)项目审批和开工相关手续(复印件)。 并报区政府审议。需进行补贴资金及数额划算的,安排三方专业机构进 行核算。需确定当年补贴比例的,由对应责任部门确定。政策条款对应 多个责任部门的,由牵头责任部门统一组织。 第十条 惩戒机制 对弄虚作假骗取奖励资金等违反上级和本级相关规定的申报单位, 一经查实,取消资金支持,按照规定收回已拨付的资金,并追究项目单 位和有关负责人法律责任。被取消资金支持单位三年内不得再次申报本 政策。涉及退款的单位应在收到取消资金支持通知后
    10 积分 | 234 页 | 2.05 MB | 9 月前
    3
  • pdf文档 《绿色低碳产业补贴政策汇编》(2024年第四季度合订本)

    ..........................................................................9 3.大兴区 2025 年促进企业用户绿电应用奖励措施........................................................11 天津市.................................. 研究成果转化和产业化,解决企业关键核心技术和“卡脖子”技术难 题,分批给予攻关投资一定比例奖励(市经济和信息化局)。 5.支持新材料首批次应用。将氢能领域新材料产品优先纳入北京 市重点新材料首批次应用示范指导目录,对于指导目录中的氢能领域 新产品首批次应用,按单个产品不超过 500 万元、单个企业不超过 1000 万元给予分档奖励(市经济和信息化局)。 6.支持首创产品进入市场。支持属于氢能关键领域“补短板”, 加大统筹协调与培育扶持力度,强化市区协同开展全面精准服务,对 获评“专精特新”的企业给予区级分档资金奖励(市经济和信息化局、 各区政府)。鼓励氢能领域研发设计、中试集成、测试验证等产业支 撑平台面向中小企业提供服务,符合条件的可认定为“北京市中小企 业公共服务示范平台”,给予一定建设补助或绩效奖励;使用公共服 务平台的企业,符合条件的可纳入中小企业服务券政策支持范围(市 经济和信息化局)。
    10 积分 | 159 页 | 2.13 MB | 9 月前
    3
  • pdf文档 《绿色低碳产业补贴政策汇编》(2024年第三季度合订本)

    业,不再支持。市级杰出青年科学基金、自然科学基金青年和一般项目、 科技发展战略研究计划、创新平台、科技型中小企业创新资金、企业科 技特派员、农村科技帮扶、科普、“一带一路”科技创新合作、科技金 融、补贴奖励等项目不纳入限项查重范围。为鼓励有一定基础的项目申 报单位加大研发力度,企业集团、转制院所和整编制引进的国家级科研 院所、北沪深三市上市公司、产业技术研究院、科技领军(培育)企业 不限项。 (六)不予受理的项目 研究工作基础的项目。 2.项目第一承担单位是国家高新技术企业,天津市科技领军(培育) 企业、技术领先型企业或者“瞪羚”企业。 3.项目第一承担单位具有完备的科研项目管理制度、研发投入核算 体系和研发人员绩效考核奖励制度,研究开发组织管理水平较高;具有 明确的创新发展战略和规划。 4.参与市级重点工程科技创新的,资源环境、现代农业、城乡建设 及公共服务领域申报项目。 5.项目第一申报单位已在标准化共性关键技术方面形成标准研究成 体化算力调度和监测平台,按照接入的算力规模,给予每户企业最高不 超过 50 万元奖励。支持算网协同发展,鼓励网络基础设施运营商优化网 络架构,持续推动网络提速降费。 (六)支持自主可控数据中心建设。鼓励算力企业加大信创产品应 用力度,提升数据中心自主可控、安全可靠水平,对基础软硬件实现国 产化 90%以上的新建、改建数据中心,给予最高不超过 500 万元的一次 性奖励。对通过第三方机构安全性测试的算力上下游产品,按照不超过
    10 积分 | 359 页 | 4.49 MB | 9 月前
    3
  • ppt文档 某大型企业人力资源数字化咨询售前方案(176页 PPT)

    薪酬激励性: 激励要素中没有体现对岗位和人员 能力的 认同,激励导向单一,激励模式未与业务开展 模式相结合,激励模式过于机械化;  结构合理性: 人工成本与薪酬结构安排不合理,薪酬奖励部分过于分散,薪酬项目存在重复激励的现象。 (2)优化 建议:  参照外部市 之间没有形成联动,个人绩效对组织绩效的支撑作 用 没有得到充分体现 … 组织绩效 个人绩效 设置部门绩效管理的规则 与制 度 设置部门的目标和计划 监控、评价部门绩效实施 情况 激励部门员 工 的发展 进行部门奖励和部门绩效 改进 让员 工 做正确的事情 确定员 工 发展的 途径和目标 提供持续的培 训 和发展机会, 个人能力得到提升 鼓励员 工 自主管理 分析处理个体绩效中的问题 提供绩效反馈 从企业的中长期激励来看,主要有三种类型  中长期激励在实践中采取的形式多种多样  根据其原理及主要特点,可归纳为以下三大类  基本上所有的中长期激励工 具 均由此衍生变化而来 延期支付 奖励基金 …… 现金类 虚拟类 实股类 强激励 弱约束 虚拟股票 分红权 股票增值权 …… 股权 股票期权 限制 性 股票 …… 强激励 强约束 中激励 强约束 特点 稳定核心团队
    20 积分 | 176 页 | 4.30 MB | 3 月前
    3
  • ppt文档 大型企业人力资源咨询售前方案

    薪酬激励性: 激励要素中没有体现对岗位和人员 能力的 认同,激励导向单一,激励模式未与业务开展 模式相结合,激励模式过于机械化;  结构合理性: 人工成本与薪酬结构安排不合理,薪酬奖励部分过于分散,薪酬项目存在重复激励的现象。 (2)优化 建议:  参照外部市 之间没有形成联动,个人绩效对组织绩效的支撑作 用 没有得到充分体现 … 组织绩效 个人绩效 设置部门绩效管理的规则 与制 度 设置部门的目标和计划 监控、评价部门绩效实施 情况 激励部门员 工 的发展 进行部门奖励和部门绩效 改进 让员 工 做正确的事情 确定员 工 发展的 途径和目标 提供持续的培 训 和发展机会, 个人能力得到提升 鼓励员 工 自主管理 分析处理个体绩效中的问题 提供绩效反馈 从企业的中长期激励来看,主要有三种类型  中长期激励在实践中采取的形式多种多样  根据其原理及主要特点,可归纳为以下三大类  基本上所有的中长期激励工 具 均由此衍生变化而来 延期支付 奖励基金 …… 现金类 虚拟类 实股类 强激励 弱约束 虚拟股票 分红权 股票增值权 …… 股权 股票期权 限制 性 股票 …… 强激励 强约束 中激励 强约束 特点 稳定核心团队
    10 积分 | 176 页 | 4.30 MB | 9 月前
    3
  • ppt文档 某大型零售食品集团会员中台解决方案(47页 PPT)

    / 晋级 规则 使用查询 会 员 关 怀 会 员 营 销 生日关怀 节日关怀 促销推送 活动 提醒 交易提醒 关 联 分 润 关联 奖励规则 会员门户(小程序、商城端) 会员细分 关联 人角色 奖励计算 奖励明细记录 奖励结算单 场景一:全渠道会员数据采集 会员管理 全渠道会员数据、交易数据、行为数据整合 零售系统 门店 POS 官方商城 PC 、微信、 APP 跨 会籍积分晋级规则 跨 会籍积分兑付规则 跨 会籍积分折算规则 记录管理 跨 会籍积分使用查询 扩展应用考虑 关联 分润 基础设置 关联 角色管理 记录管理 奖励明细记录 扩展应用考虑 关联 奖励规则 结算记录查询 多品牌 ** 睿致肌 Beauty Boutique 其他品牌 多触点 门店 云店 i** 种草社 eCard 其他 02 技术解决方案 技术体系 高并发支持
    10 积分 | 47 页 | 12.03 MB | 1 月前
    3
共 382 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 39
前往
页
相关搜索词
2025DeepSeekR1Kimi1.5及类推理模型推理模型开发解读报告北大R1绿色低碳产业补贴政策汇编2024第一一季季度第一季一季度第一季度合订合订本培训体系资料第二二季第二季二季度第二季度第四四季第四季四季度第四季度第三三季第三季三季度第三季度大型企业人力资源人力资源数字数字化咨询售前方案176PPT零售食品集团会员解决解决方案47
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 - 2026 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩