SY.
← 返回项目

Edge AI

离线智能语音交互系统

基于 RK3576 NPU 的全离线端侧语音对话系统,支持工业级实时交互。

角色
核心开发
年份
2025.04 - 2025.07
状态
项目经历
技术
C++ / RK3576 NPU

项目界面截图占位,后续替换为真实图片

Overview

项目概览

围绕端侧算力与离线使用场景搭建 ASR、LLM 与 TTS 完整链路,并针对工业环境补充自启动和 ASR 误触发处理方案。

<4s语音交互闭环
100%全离线运行
3核心模型模块

Challenge

遇到的问题

嵌入式设备算力有限,同时需要保证语音识别、文本推理与语音合成之间的实时协作。

Approach

解决方式

使用 RK3576 NPU 承载推理,采用消息与音频双缓冲队列实现伪流式 TTS;各模块通过封装后的 ZeroMQ 标准接口松耦合通信。

Architecture

项目架构

Microphone
Streaming ASR
DeepSeek LLM
Buffered TTS
Speaker

Highlights

主要能力

  • 流式 ASR
  • 量化 DeepSeek 推理
  • 伪流式 TTS
  • 跨进程模块通信