为什么越来越多的边缘设备都在谈NPU、协处理器?RK3588 已经是 6TOPS(INT8) 的强大SoC,但在多任务推理、模型并行、视频AI分析等复杂场景中,单芯片的算力始终有上限。RK1820的出现,正是为了解决主控“算力焦虑”的那部分任务负载。
在端侧AI设备中,主控SoC早已不再“孤军奋战”。当AI任务开始超越传统CPU/NPU的调度能力时,协处理器正悄悄接管一部分智能负载。
协处理器RK1820
RK1820是一款专为AI推理与算力扩展而设计的协处理芯片,它能与RK3588、RK3576等主控SoC灵活搭配,通过PCIe、USB等接口实现高效通信。

| 能力类别 | 核心参数与功能 |
| 处理器架构 | 3 个 64 位 RISC-V 核心;每核 32KB L1 缓存,共享 128KB L2 缓存;支持 RISC-V H/F/D 精度 FPU |
| 存储能力 | 内置 2.5GB 高带宽 DRAM+512KB SRAM;外部支持 eMMC 4.51(HS200)、SD3.0、SPI Flash |
| 编解码能力 | JPEG编码(16×16~65520×65520,YUV400/420/422/444); JPEG解码(48×48~65520×65520,多 YUV/RGB 格式) |
| NPU 算力能力 | INT8 算力 20TOPS,支持 INT4/INT8/INT16/FP8/FP16/BF16等混合精度; 兼容 TensorFlow/MXNet/PyTorch/Caffe 等框架, Qwen2.5 3B(INT4)达 67 Token/s,YOLOv8n(INT8)达 125 FPS |
| 通信方式 | PCIe 2.1(2 路,2.5/5Gbps)、USB3.0(5Gbps,与 PCIe 复用) |
| 主要功能 | 边缘 AI 推理(检测 / 分类 / 大模型);RISC-V 通用计算;2D 图形加速(缩放 / 旋转);AES/SM4 等安全加密 |
从系统架构看分工:谁在做什么?
在 RK3588 + RK1820 系统中,AI 任务的处理流程可以被拆解为四层架构:
应用层 → 中间件层 → 协处理执行层 → 控制与展示层。
RK3588主控:负责任务调度、数据预处理、结果输出,全流程管控。
| 阶段 | 执行角色 | 任务说明 |
| 应用请求 | RK3588 | 应用层发出AI任务调用(如识别/检测) |
| 调度分配 | RK3588调度器 | 判断是否转交协处理执行 |
| 模型推理 | RK1820 | 执行深度学习模型计算 |
| 结果回传 | RK1820 → RK3588 | 返回推理结果,主控展示或继续逻辑处理 |
RK1820协处理器:专注高算力 AI 推理,通过PCIe总线与主控联动,形成“轻管控 + 重计算”的协作模式。
1、应用层:AI任务的“发起者”
应用层是AI任务的起点,将用户需求(如图像分析、目标检测、边缘大模型问答)转化为系统可执行的任务指令,并通过标准化接口传递给中间件层。此层完全由RK3588主控主导,因为它需要处理用户交互和业务逻辑,同时管理外设数据。

任务接收:通过摄像头、触摸屏、以太网、串口等外设获取用户指令。例如:智能安防:检测视频画面中的人;工业检测:识别产品表面缺陷;边缘大模型:语音输入转文本形成问答任务。
指令标准化:将非结构化输入转为结构化任务参数,例如:图像任务:输入分辨率、模型版本、输出要求;大模型任务:输入 tokens、模型版本、输出长度限制。
2、中间件层:AI任务的“调度者”
中间件层是协作的核心枢纽,负责任务判断、资源分配、数据预处理以及总线通信管控。它决定哪些任务由主控执行,哪些任务下发给协处理器。
RK3588参与,RK1820 不参与 PCIe 配置、总线中断管理,仅按主控下发的任务执行推理。
任务分类与调度
本地处理:低算力或实时性高的任务(如图像缩放、轻量级 AI 推理)由 RK3588 CPU/NPU/RGA 处理。
下发RK1820:高算力任务(如 YOLOv8 多类别检测、大模型推理、语义分割)交由 RK1820 处理。RK1820接管后,主控CPU/NPU可腾出资源处理其他任务。
数据预处理
图像类:裁剪、降噪、归一化、通道重排。
文本类:Token化、填充、编码。

总线通信管控
通过PCIe或 USB3建立通信链路。
数据传输使用DMA,无需CPU 干预。
下发推理控制指令,如启动 NPU、设置精度、完成中断。
3、协处理执行层:AI任务的“计算者”
协处理执行层是推理的核心,由 RK1820 协处理器主导,专注高算力 AI 推理。
RK1820参与,RK3588 不干预推理,仅等待结果回传。超时或异常可由RK3588通过PCIe发送复位指令。
任务接收与准备
接收RK3588下发的数据、模型权重、指令。写入本地高带宽DRAM。加载模型并配置NPU。

NPU推理计算
目标检测(YOLOv8n):卷积→BN→激活→Pooling → 后处理 NMS。
大模型推理(Qwen2.5 3B):Prefill 阶段处理输入 tokens → Decode 阶段逐 token 生成输出。
推理优化:算子融合、权重压缩。
结果回传
返回目标检测坐标、类别、置信度。
返回大模型 tokens 数组。
4、控制与展示层:AI任务的“输出者”
控制与展示层是AI任务的终点,将 RK1820 的原始推理结果转化为可视化或可用的业务输出,完成闭环。RK3588 参与,RK1820 仅输出原始推理结果。

结果后处理
映射坐标到原始图像尺寸。
Tokens 解码为自然语言。
工业检测统计缺陷数量。
系统控制与反馈输出
智能安防:显示带检测框视频、触发报警。
工业检测:控制流水线剔除不合格产品。
边缘大模型:文本显示 + 语音播报。
协同带来的价值:不仅更快,还更聪明
| 协同维度 | 系统收益 |
| 算力叠加 | 双芯并行执行,AI推理性能提升 30%~70% |
| 能效优化 | 主控负载下降,整机功耗更低,发热更小 |
| 任务并行 | 多模型可同时运行,任务响应更快 |
| 升级便捷 | 无需更换主控即可提升AI能力,降低升级成本 |
通俗来说:RK3588 负责统筹全局、掌控流程,RK1820 专注算力爆发,两者配合,让边缘 AI 设备“更聪明、更快、更省心”。想了解RK1820的更多消息与 SDK,请关注我们,获取最新教程和示例。