积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(3)技术工具(3)

语言

全部中文(简体)(3)

格式

全部PDF文档 PDF(2)PPT文档 PPT(1)
 
本次搜索耗时 0.010 秒,为您找到相关结果约 3 个.
  • 全部
  • 人工智能
  • 技术工具
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

    技术剖析:DeepSeek-R1 Zero DeepSeek-R1 Zero: 无需监督微调SFT,纯强化学习驱动的强推理模型 DeepSeek-v3-Base (671B) DeepSeek-R1-Zero 基于规则的奖励 Rule-Based Reward 推理为中心的大规模强化学习 Large-Scale Reasoning-Oriented RL 大规模推理为中心的强化学习,提升模型数学代码能力 RL驱动下自然涌现长文本推理能力 9 DeepSeek-R1 技术剖析:DeepSeek-R1 Zero DeepSeek-R1 Zero: 无需监督微调SFT,纯强化学习驱动的强推理模型 ➢ 奖励建模:基于规则的奖励 (Rule-Based Reward) : 准确率奖励 + 格式奖励 ➢ 准确率奖励 Accuracy Rewards: 判断答案是否是正确的 ➢ 格式奖励Format Rewards: 而retraining reward model 需要大量的计算资源,可能会复杂化整个流程 ➢ 训练模板:选择最简单的 Thinking Process,直接观察到最直接的RL过程下的表现 基于规则的奖励 (Rule-Based Reward) : 准确率奖励 + 格式奖励 10 DeepSeek-R1 技术剖析:DeepSeek-R1 Zero DeepSeek-R1 Zero: 无需
    10 积分 | 76 页 | 8.39 MB | 6 月前
    3
  • pdf文档 英特尔-工业人工智能白皮书2025年版

    4 半导体行业 加速集成 电路芯片 设计流程 晶圆缺陷 检测 随着制造工艺提升,集成电路芯片制造的工艺线宽不断缩小,这将带来更复杂和更大规模的电路设计,传统 EDA 设计流程在应对设计规则复杂度、功耗及热管理、信号完整性等方面面临一系列挑战。 将 AI 技术与 EDA 工具相结合,在电路设计阶段,AI 可以自动识别和优化电路拓扑结构,通过深度学习模型预测 不同电路设计的性能指标( 技术的应用正为工业领域带来前所未有的创新性变革。而且,工业领域对 AI 技术的部署,正在随着 AI 技术本 身的发展和工业应用复杂性的增加,日渐从传统的 AI 技术向更加复杂的工业大模型过渡。 传统 AI 技术则主要基于规则和知识库实现智能工作,它通常使用神经网络结构,通过大量数据进行训练,来获得较好的性 能。传统 AI 具有较强的实时性,能在特定场景下快速解决问题。但是,对于更加复杂的多样化应用场景,比如需要处理文 机、水泵、冷却塔,以及优化系统设计。此外,通过升级或优化 制冷机房的自动控制系统,可以进一步提高运行效率。尽管许多机房已配备自动控制系统,但节能潜力仍然巨大。这主要是 因为现有的自控系统采用基于规则的简单逻辑控制,难以适应暖通空调系统的动态和非线性特性,以及设备间的相互影响, 导致系统无法持续高效运行。因此,如何在确保舒适性和稳定性的前提下,实现暖通空调系统的经济性最优运行,成为了行 业面
    0 积分 | 82 页 | 5.13 MB | 5 月前
    3
  • ppt文档 DeepSeek大模型赋能高校教学和科研2025

    Processing , NLP )领域中的一类大 模型, 通常 用于处理文本数据和理解自然语言 。 这类大模型 的主要特点是它们在大规模语料库上 进行了训练, 以学习自然语言的各种语法 、语义和语境规则 。 代表性产品包括 GPT 系列 ( OpenA I ) 、 Bard ( Google ) 、 DeepSeek 、文心一言 (百度)等 多模态大模型 是指能够处理多种不同类型数据的大模型,例如 提高准确性 5.1.5 AIGC 大模型的提示词 使用提示词需要注意一些技巧 , 这样可以从大模型获得更加符合我们预期要求的结 果 简洁明确 示例驱动 考虑受众 明确角色 分解复杂任务 遵守规则 使用肯定性指令 自然语言回答 通用模型 n 需显式引导推理步骤(如通过“思 维链” 提示) ,否则可能跳过关键 逻辑。 n 依赖提示语补偿能力短板(如要求
    10 积分 | 123 页 | 15.88 MB | 6 月前
    3
共 3 条
  • 1
前往
页
相关搜索词
2025DeepSeekR1Kimi1.5及类推理模型推理模型开发解读报告英特特尔英特尔工业人工智能人工智能白皮皮书白皮书年版赋能高校教学科研
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩