新闻中心

产品发布 | 公司动态 | 行业资讯 | 活动报道

RK1820:让端侧设备也能运行大模型的AI协处理器

2025.04.07

当边缘设备也能运行数十亿参数模型;当AI 不再完全依赖云端算力。瑞芯微的RK1820,集成超高带宽片内置DRAM和针对3B/7BLLM/VLM的多核NPU,支持主流模型框架并提供通用API易于开发。RK1820搭配RK3588等主控芯片构建强大的AI算力平台,通过其多模态AI任务能力,支持语音识别、视频分析、长上下文对话等场景应用,适用于安防、机器人、车载、消费电子、办公、教育、家居、工业等端侧场景。

随着大模型(如 3B、7B 规模模型)被压缩 / 量化 /蒸馏后,越来越多任务可以在端侧落地执行。对于安全、隐私、低延迟、高带宽成本的场景来说,端侧处理比云端更有吸引力。目前很多设备依赖主处理芯片(RK3588/RK3576 SoC)自带 NPU,加速 AI 推理。但这些 SoC 的带宽、内存资源、接口、异构协同能力往往有限。在面对更大模型或复杂场景时可能力不从心。就像在 PC 里有 GPU 辅助 CPU 一样,AI 协处理器成为一种趋势:主处理器负责系统调度、I/O、控制逻辑,协处理器专注于 AI 模型推理。这种方法可以做到更灵活的算力扩展与模块化升级。


架构 & 核心技术剖析

类别子项具体规格参数
核心处理器内核配置3 个独立 64 位 RISC-V 内核(SRV、VRV0、VRV1)
指令集架构SRV:RV64GCB ISA;VRV0/VRV1:RV64GCBV ISA
浮点单元(FPU)所有内核集成 FPU,支持 RISC-V H/F/D 精度
缓存配置每个内核:32KB L1 I-Cache + 32KB L1 D-Cache + 128KB L2 Cache
向量单元VRV0/VRV1 集成 128 位向量单元
存储组织片上内置内存引导 ROM(Bootrom):支持 SPI/eMMC/SD/MMC 启动,UART/PCIe 下载代码
系统 SRAM:512KB
动态内存接口:5GB
其他:32KB ROM + 8Kbits OTP(6.5Kbits 用于安全应用,支持 Program/Read/Idle 模式)
片外外部内存复合 SDMMC 接口:
- eMMC 模式:兼容 JEDEC eMMC 4.51,支持 HS200,1/4/8 位总线
- SD/MMC 模式:兼容 SD3.0/MMC 5.1,1/4 位总线
- SDIO 模式:兼容 SDIO3.0,4 位总线
FSPI:支持 1/2/4 位总线,2 个芯片选择
系统组件时钟与复位单元(CRU)4 个 PLL,24MHz 振荡器
支持单个组件时钟门控,全局 / 单独软复位
电源管理单元(PMU)多可配置工作模式(节能)
3 个独立电压域:VDD_TOP、VDD_LOGIC、VDD_PMU
定时器(Timer)6 个 64 位计数器定时器,支持自由运行 / 用户定义模式,可查工作状态
看门狗(Watchdog)3 个 32 位计数器,超时操作:直接复位 / 先中断后复位
中断控制器SRV:160 个中断源;VRV:64 个中断源
m-mode/s-mode 各 1 个软件触发中断,高电平敏感,优先级可软件配置
DMAC2 个物理通道,22 组外设请求,24 个逻辑通道
支持内存 - 内存 / 内存 - 外设 / 外设 - 内存传输,链表 DMA,3 种多块传输
安全系统密码引擎:
- 对称算法:AES-128/192/256、SM4(多模式)
- 哈希算法:SHA-1/256/224、MD5、SM3(硬件填充 + HMAC)
- 非对称算法:RSA(4096 位)、ECC(256 位)、SM2
密钥阶梯(KL):OTP/RKRNG 获取根密钥,可派生写入特定模块
Mailbox12 个mailboxes,用于 RISC-V 内核间通信
多媒体处理器JPEG 编解码器编码器:支持基准 DCT、JFIF 02,16×16~65520×65520,YUV400/420/422/444
解码器:支持基准 DCT、JFIF 02,48×48~65520×65520,YUV400/420/422/440/411/444、RG888/RGB565
NPU算力:INT8 精度下 20 TOPS
精度支持:INT4/INT8/INT16/FP8/FP16/BF16
框架兼容:TensorFlow、Caffe、Tflite、Pytorch、Onnx NN、Android NN
2D 图形引擎(RGA)数据格式:支持多 ARGB/RGB/YUV/TILE 格式输入输出,8bit YUV 输出
功能:像素转换(601/BT.709)、抖动,8192×8192 源 / 4096×4096 目标分辨率,1/16~16 缩放(下采平均 / 双线性,上采双三次),0°/90°/180°/270° 旋转 + 镜像,块传输 /alpha 混合 / OSD 叠加等
SAI1 个接口,4TX+4RX lanes,支持 I2S/PCM/TDM,128 个可配置时隙(8~32 位)
连接性以太网1 个控制器,RGMII 接口,10/100/1000Mbps,全 / 半双工,TSO/USO 加速,IEEE 1588 时间戳
USB 接口USB 2.0 DRD:兼容 USB 2.0,高速 (480Mbps)/ 全速 (12Mbps)/ 低速 (1.5Mbps),支持 EHCI/OHCI
多 PHY 接口:2 个 PHY,支持 USB 3.0 DRD / 设备 / 主机、USB 2.0 OTG
PCIe 接口兼容 PCIe Base Spec 1,1 lane,仅 RC 模式,2.5/5.0Gbps 速率(每 lane 每方向)
SPI 接口2 个控制器,2 个芯片选择,支持主 / 从模式(软件配置)
I2C 接口5 个主机端口,7/10 位地址,速率:标准 (100k)、快速 (400k)、高速 (1M) bits/s
SMBus 接口1 个从模式接口,支持多协议(写字节 / 读字节等),PEC/Alert/UDID 命令,时钟拉伸
UART 接口3 个端口,64 字节 TX/RX FIFO,5~8 位数据,最高 4Mbps 波特率,UART2 支持自动流控 / RS485
PWM 接口1 个接口 8 通道,支持输入捕获 / 连续 / 单次模式,两级分频,电源键捕获 / 频率计 / 计数器
其他功能GPIO多组,支持中断(电平 / 边沿触发,极性 / 边沿可配),上拉 / 下拉 / 驱动强度可配
温度传感器(TS-ADC)3 通道,-40~125°C 范围,±3.5°C 精度,0.1°C 分辨率,支持用户定义 / 自动模式(警报 / 复位温度可配)
SARADC1 个,2 个单端输入,13 位分辨率,2MS/s 采样率,支持单次 / 连续模式
封装类型-FCBGA 746L:19mm×19mm 体尺寸,0.35mm 球径,0.65mm 球间距

RK1820 拥有三个64 位RISC-V 内核(含 FPU),每个核配备 32 KB 指令缓存 + 32 KB 数据缓存 + 128 KB二级缓存。内置 NPU 支持混合精度运算(INT4 / INT8 / INT16 / FP8 / FP16 / BF16)算力高达 20 TOPS(具体取决于精度 / 模型),主核(RISC-V)负责模型调度 / 控制 / I/O,NPU专注推理集成 “超高带宽片内DRAM,支持 PCIe 2.0 和 USB 3.0 PHY,方便与主处理器 / SoC 连接。

支持3B / 7B级别 LLM / VLM 模型 在端侧运行。可以在离线端侧设备上部署 最高 7B 大模型 实现视频摘要、图像识别辅助、多模态感知等。RK1820在运行7B模型时可达到百 token/s级别(实际性能会受模型结构、量化精度、I/O 带宽、主机协同效率影响)输出。

RK3588 + RK1820应用样例:安防视频结构化 + 检索方案、全模态交互助手方案、AI Codec 方案、同声传译方案、虚拟数字人方案。安防、机器人、车载、消费电子、教育 / 学习机、AI 辅助设备、工业设备、AIoT 终端等场景。端侧视频摘要、图像识别、多模态感知等应用。


top