DeepSeek大模型及其企业应用实践程师的工作效率。通过AI编程助手,减少了重复劳动,提 升了代码质量 编码助手 4.3 企业大模型的部署方式 本地/内网部署 云端部署 通过云厂商实现弹性扩展和成 本优化 通过本地数据中心实现数据完 全掌控 边缘部署 通过边缘节点实现低延迟和实 时处理 容器化/微服务部署 混合部署 通过本地和云端结合实现灵活 性和灾备需求 通过容器技术和微服务架构实 现敏捷开发和资源隔离 联邦部署 通过联邦协议和分布式架构实 DeepSeek大模型部署在公有云或私有云上,利用 云厂商的基础设施和资源。适用场景: n 弹性需求:需要根据负载动态调整资源 n 快速扩展:业务增长迅速,需快速扩展系统 n 成本优化:希望通过按需付费模式降低IT成本 云端部署 DeepSeek大模型部署在企业内部服务器或数据中 心,数据和应用完全在企业内网中运行。适用场景: n 数据敏感:对数据安全要求高,需完全掌控数据 n 合规要求:需满足特定行业或地区的合规要求 计算可减少数据上传 n 离线运行:需要在网络不稳定或离线时仍能正常 运行 边缘部署 结合云端和本地部署,DeepSeek大模型部分系统在云 端,部分在本地。适用场景: n 灵活需求:部分数据需本地处理,部分需云端处理 n 过渡阶段:从本地逐步迁移到云端时,混合部署可 作为过渡方案 n 灾备需求:本地和云端互为备份,提升系统可靠性 混合部署 4.3 企业大模型的部署方式 将DeepSeek大模型系统拆分为多个微服务,使用10 积分 | 147 页 | 16.82 MB | 7 月前3
未来网络发展大会:2025分布式算力感知与调度技术白皮书4.1 远程医疗 在远程医疗场景中,分布式算力感知与调度技术可以打破地理与 机构壁垒。它整合从一线城市三甲医院高性能影像服务器,到县级医 疗中心边缘计算节点,乃至偏远乡镇卫生院轻量级终端及云端算力集 群,构建“广域医疗算力网”,让优质诊断能力和 AI 辅助分析能力 高效、安全、普惠地服务患者,为医疗资源公平可及提供技术支撑。 实现这一目标,需先精准感知网络内异构、分散的算力资源,形 等步骤的工作流,调度器评估子任务计算强度、时延阈值等,结合资 源视图与网络负载模型映射执行路径。如急诊影像分析这类超低时延 任务,会下沉到就近边缘节点并通过网络切片保障传输;常规体检图 像筛查等则优先上传至云端大规模集群处理,以获规模效益。 分布式算力感知与调度还天然支持隐私保护的协同推理与训练。 在联合推理模式下,患者原始影像块仅在本地进行 DICOM 去标识和压 缩编码,随后通过加密隧道传输特征张量至云推理服务器;对联邦学 可追溯与不可篡改。 在实际应用中,这一体系让放射科医生在高峰时段也能在 2–3 秒内获得 AI 辅助肺结节检出结果;同一时间,偏远乡镇卫生院通过 5G 专网将疑难病例的 MRI 切片拆分上传,云端完成分区推理与拼接 后把定量分析报告回传,仅耗时数十秒。大规模资源池的协同让设备 利用率提升 30-50%,而调度算法对时延违约率的持续压缩,使危急 重症的影像诊断平均响应时间缩短至传统单点部署的20 积分 | 73 页 | 2.15 MB | 1 月前3
电子行业深度报告:AI系列深度,AI+降本增效拓宽应用,硬件端落地场景丰富-20230712-东吴证券-28页边缘计算盒子、物联网设备等,而不仅仅依赖于远程的云服务器。边缘计算在成本、时 延、隐私上具有天然优势,也可以作为桥梁,预处理海量复杂需求,并将其导向大模型。 人工智能的未来既需要终端侧 AI,也需要云端 AI。在终端侧运行 AI 应用可提升成本效 益、增强隐私性、个性化并降低时延;与仅在 CPU 或 GPU 上进行 AI 工作负载处理比 较,骁龙平台集成专用的高通 AI 引擎,处理 AI 工作负载可以更加高效,让小巧轻薄的 为 35%、31%、27%、4%,合计占据中国智能音箱 97%的市场份额。 组装环节,国光电器 6 月 15 日在投资者互动平台表示,公司目前推出的搭载 Chat GPT 的智能音箱是依据云端的算力提供反馈内容的。未来,AI 音箱搭载的是大模型或 小模型,并需要匹配有不同的算力提供方案,公司针对各类型 AI 音箱均有研发、设计 方案。 芯片环节,目前市场上主流的智能音箱主控芯片主要来自:苹果、全志、晶晨、创 3.1.2. 安防解决方案正在向云+边缘的方案演进 AI 在视频监控领域的落地首先从云端开始,即在后端产品加入 AI 计算功能,实现 视频数据的智能化分析。随着摄像机的清晰度提高、可拍摄距离增大,分辨率提高,通 过网络回传的数据量也越来越大,将数据的结构化、处理与分析完全集中到云端会有网 络传输压力、实时性要求达不到、准确性降低等问题。 “云+边缘”的边缘计算解决方案,把 AI10 积分 | 28 页 | 2.68 MB | 7 月前3
2025年中国量子计算产业市场现状及发展前景研究报告-智研咨询现出指数级加速。 首款商用量子计 算机发布:加拿 大D-Wave公司 正式发布了全球 首款商用型量子 退火机“D- Wave One” , 可应用于解决各 种组合优化问题。 IBM推出云端量子计 算服务:IBM推出了 云端量子计算服务 “Quantum Experience”。这 一服务允许用户通过 互联网访问IBM的量 子计算系统,并在上 面运行算法、操纵量 子比特、开发教学及 模拟实验等。20 积分 | 57 页 | 12.13 MB | 1 月前3
电子行业AI+系列专题:边缘AI,大语言模型的终端部署,推动新一轮终端需求-20230531-国信证券-25页网络 边缘,更靠近数据源,而云计算,处理发生在数据中心。边缘计算是指在尽可能 靠近数据源或终端的地方捕获和处理数据。通过在数据源的物理位置附近放置服 务器或其他硬件来处理数据,在本地完成处理而不是在云端或集中式数据中心, 它能最大限度地减少延迟和数据传输成本,允许实时反馈和决策。 图14:边缘计算的应用场景 图15:云计算与边缘计算的区别 资料来源:NVIDIA,国信证券经济研究所整理 资料来 AI 模型在云端训练, 并部署在终端设备上。例如计算机视觉等高度数据密集型、低时延要求类的任务, 将 AI 模型部署在终端的优势包括: 1)更低的延迟:因为传感器和物联网设备产生的数据不再需要发送到集中式云进 请务必阅读正文之后的免责声明及其项下所有内容 证券研究报告 12 行处理,可以实现更快的响应,获得结果的时间可能从几秒减少到几分之一秒。 2)减少带宽:当数据发送到云端时,它通过广域网传输,需要满足全球覆盖和高 用户身份。 5)高可靠性:去中心化和离线功能使边缘 AI 更加稳定,不受网络访问限制,这 是关键任务系统稳定运行的必要条件。 当边缘 AI 应用程序遇到它无法准确处理的数据时,它通常会将其上传到云端,以 便 AI 算法可以重新训练并从中学习。因此,模型在边缘运行的时间越长,模型就 会变得越准确,由于可以获得如此多的价值,企业正在迅速采用边缘计算。 Gartner 预测,到 2023 年底,5010 积分 | 25 页 | 2.20 MB | 7 月前3
未来网络发展大会:算力城域网白皮书(2025版)临扩容 难、维护成本高等问题,难以满足大模型微调和推理不断增长的算力 需求。因此,通过企业本地算力与云端租赁算力之间的高效协同,以 满足企业算力资源灵活扩展需求,成为更高效、便捷且兼具性价比的 方案。云边协同训推方案基于 Split Learning 部署模式,将模型切分 到本地和云端算力资源池中并行处理,并结合输入、输出层的本地化 部署,保证样本数据不出园区,满足了金融、医疗等数据敏感客户的 11 数据安全要求。此外,该方案与 Prefill-Decode 分离式推理架构天然 适配,通过将可弹性扩展的 Prefill 和 Decode 分层部署在本地和云端, 显著提升推理效率、资源利用率和用户体验。 在此场景下,本地和云端算力池之间基于 RDMA 协议传递参数 面同步数据、KV Cache 等信息,要求网络在保证高吞吐、低时延的 前提下,具备 RDMA 无损传输能力,避免出现拥塞、丢包。同时, 力资源池之间的云边协同训练/推理,实现企业算力资源的弹性扩展, 云边协同训练/推理基于模型分割实现,这种方式既满足了企业推理/ 训练敏感数据不出园区的要求,又满足企业算力的灵活扩展按需租赁 云端算力的诉求。由于城域网需要支撑层间的参数面数据同步因此需 要具备 RDMA 无损传输与超高吞吐能力。该场景组网方案如图 7-4 所示。 图 7-4 云边协同分布式训推组网方案 算力城域网白皮书(202520 积分 | 42 页 | 7.16 MB | 1 月前3
华为-人工智能行业:智能世界2035-20250918-134页此时人机之间的决策权将发生实质性迁移,智 能体获得更多直接与物理世界交互决策的能力, 能够自主闭环执行多类任务。 智能体的未来发展,关键在于攻克三大交 织融合的核心挑战:多智能体协同(通信与协 作)、云端环境交互(探索与执行),以及长 程推理认知(规避偏差累积与组合爆炸)。这 三者共同构成了通向高级智能的道路上必须逾 越的障碍。 未来十年,智能体将发展为侧重实践的行动系统 1980年 1990年 云侧智能体适合复杂长时间任务,算力更 强,易于跨平台适配;端侧智能体可以快速响 应简单的任务,实现低时延、低成本、高隐私 安全。端云协同可以最大化发挥“端侧快”和 “云侧强”的优势,同时解决信息安全隐患、 云端算力成本过高等问题。 部署策略:端云协同是新生态的最优解 18 具身智能跨越鸿沟,形成多个万亿产业 具身智能是 AI 走向物理世界的关键体现, 它并非单一技术的突破,而是融合了 AI 技术、 级,端到端时延需降低到亚毫秒级,以便支撑沉浸式会诊、关键医 疗 IoT、脑机接口等实时应用。 随着这些底层能力的持续跃升,医疗服务的组织逻辑也在随之发生深刻重构。患者不必再频繁 往返医院,而是可以依托可穿戴设备和云端平台,在日常生活中获得持续健康监测与支持。多源数 据的实时采集与 AI 智能分析,让诊疗从经验驱动走向数据驱动,医生借助医疗大模型为个体生成动 态、精准的个性化方案。未来医疗将突破医院边界,延伸至日常生活,不仅更加普惠可及,更通过20 积分 | 134 页 | 27.89 MB | 1 月前3
电子行业:AI大模型需要什么样的硬件?-20240621-华泰证券-40页Agent,具有自主记忆、推理、规划和执行的全自动能力。 观点#1:Apple Intelligence 推动苹果用户换机,利好产业链业绩增长 6/11, 苹果 WWDC 2024 大会推出由苹果自研的端侧大模型、云端大模型、 以及 OpenAI 的 ChatGPT 组成的全新智能系统 Apple Intelligence。从功能 上来讲,和 OpenAI,Google 的现有功能差异不大,但由于此类功能只在 iPhone 由苹果端侧大模型、云端大模型、ChatGPT 共同组成,算力足够下依赖终端,复杂场景则 使用私密云计算或 ChatGPT,能够 1)增强 Siri 理解能力,配备多轮对话、总结信息、屏 幕内容感知、应用智能交互等能力,2)提供邮件智能回复、通知整理,备忘录和通话录音 /撰写/摘要等功能,3)支持图像生成/智能修图等功能,4)ChatGPT4o 将融入 siri 和 writing tools,作为云端备选模型。我们看到 tools,作为云端备选模型。我们看到 Apple Intelligence 核心能力包括文生文、文生图、跨 App 交互与个人情境理解,并需要以 OpenAI ChatGPT4o 作为云端备选模型,配备上了目 前已有的大部分 AI 功能。苹果通过 Siri,把 AI 当作手机不同 App 之间联系的工具,而不是 像此前三星和谷歌的 AI 应用更侧重于让 AI 去完成单一特定任务。苹果让 Siri 在未来成为应 用分发入口和流量入口,以超过10 积分 | 40 页 | 2.60 MB | 7 月前3
人形机器人行业:由“外”到“内”,智能革命-能检测、寿命检测等功能,提高其精确度与可重复性。 • 精准装配:通过灵活多变的机械手臂和精细的手指运动,实现人类难以企及的速度和精度完成各项装配 任务。实时调整策略应对不确定因素,保证组装质量。 • 检测报告预警:利用云端大数据分析工具进行产品质量的预测性分析与预警。及时发现产品设计与制造 过程中的问题,与相关部门进行沟通反馈,持续优化产品质量。 • 实验操作:辅助科研人员进行实验操作、数据采集和设备调试等任务,减轻工作负担,提高实验效率。 智能汽车解决方案(车BU),二是鸿蒙智行。未来华为或效仿特斯拉,从智能 汽车进入就人形机器人领域,强化智能终端领域布局、提高终端智能化水平。 华为还大力布局大模型算力,构建AI算力第二极,可为人形机器人提供云端和 终端算力支持。昇腾910C采用中芯国际7nm工艺制造,AI推理性能达到英伟达 前代产品H100的60%。基于昇腾AI处理器和基础软件构建Atlas人工智能计算解 决方案,打造面向“端、边、云”的全场景AI基础设施方案,覆盖深度学习领 相。XR4高 165cm,重65kg,大量采用碳纤维复合材料,拥有 60多个智能柔性关节,处于业界领先水平;采用 并联驱动结构和高扭矩密度电机,单腿峰值扭矩 达600N·m;支持实时接入达闼云端大脑,通过多 模态大模型RobotGPT赋能,具备多模态融合感 知、认知、决策和行为生成能力,实现高性能具 身智能;基于数字孪生的深度强化学习完成自主 智能训练,生成多种步态和动作,实现平衡站0 积分 | 49 页 | 3.78 MB | 7 月前3
华为:鲲鹏原生开发技术白皮书(6.0修订版)H.265 编码带宽减少 30%+,其实现原理是利用云端强大的能力将应用和游戏的运行、 渲染成最终的画面,并进行视频的压缩流化后,发送到终端播放显示。视频流引擎支持视频编码能力、视频解码 播放能力、云手机图像截屏能力、触控和音频抓取 / 播放能力等核心功能,客户可以基于这些引擎进行二次开发, 实现在移动终端上进行操控应用和游戏等操作。云端采用专业显卡进行渲染,可以获取高画质的业务体验;对终 一 API,降低二次开发难度,易集成。 指令流引擎 指令流云手机方案采用业界独创的端云分离渲染技术,可实现云侧免 GPU 部署,整机硬件成本下降 10%,其实 现原理是云手机利用云端强大的算力,通过引擎实现云端复制应用和游戏的渲染指令,并进行渲染指令和纹理数 据压缩流化,在端侧使用手机终端的 GPU 把这些指令渲染出来图像。指令流引擎,支持机指令分离渲染、纹理 数据视频流化、触控和音频抓取 进行操控应用和游戏等操作。通过指令流引擎技术,可以支持云手机全系统渲染,并提供近乎无损的画质,在 1080P/2k/4k 分辨率下均不影响传输带宽,并通过资源缓存技术,有效降低网络带宽 50%+;突破云端 GPU 能力 限制,实现无 GPU 高密运行机制,单路硬件成本降低 40%,支持图形渲染状态机的本地执行与远端同步,实现 1080P 30FPS 低响应时延的用户体验。 大数据 鲲鹏 BoostKit10 积分 | 112 页 | 17.64 MB | 6 月前3
共 30 条
- 1
- 2
- 3
