业余设计

发布日期: 2025-05-08

更新日期: 2025-11-12

文章字数: 799

阅读时长: 2 分

AI小智语音聊天机器人

在项目中，软件部分使用了开源的XiaoZhiAI固件框架开发。
硬件部分完全由自己设计。接下来我将简要介绍我的这款产品。

硬件部分主要器件：

MCU: ESP32-S3R8
Flash: NorFlash W25Q128 (16MB)
DAC: MAX98357 集成3W PA I2S接口
ADC: ICS-43434数字麦克风芯片 I2S接口
LCD: 240x320 IPS面板 SPI接口
Speak: TR-3012BOX(深圳市途瑞电子)

软件部分:

固件框架: xiaozhi-1.6.1
ADC扩展x5按键,按键支持语音唤醒,网络配置,主题切换,风格切换,音量
调节,亮度调节,睡眠切换。这些功能也可通过语音直接控制。详细介绍
请向后翻看。

👉 注意!!! 本文引用AI小智开源站点 👉点击此处访问

👉 ESP32+SenseVoice+Qwen72B打造你的AI聊天伴侣！【bilibili】

👉 给小智装上 DeepSeek 的聪明大脑【bilibili】

👉 手工打造你的 AI 女友，新手入门教程【bilibili】

项目是一个开源项目，以 MIT 许可证发布，允许任何人免费使用，并可以用于商业用途。
通过这个项目，能够帮助你入门 AI 硬件开发，了解如何将当下飞速发展的大语言模型应用到实际的硬件设备中。
无论你是对 AI 感兴趣的学生，还是想要探索新技术的开发者，都可以通过这个项目获得宝贵的学习经验。

已实现功能

Wi-Fi / ML307 Cat.1 4G
BOOT 键唤醒和打断，支持点击和长按两种触发方式
离线语音唤醒 ESP-SR
流式语音对话（WebSocket 或 UDP 协议）
支持国语、粤语、英语、日语、韩语 5 种语言识别 SenseVoice
声纹识别，识别是谁在喊 AI 的名字 3D Speaker
大模型 TTS（火山引擎或 CosyVoice）
大模型 LLM（Qwen, DeepSeek, Doubao）
可配置的提示词和音色（自定义角色）
短期记忆，每轮对话后自我总结
OLED / LCD 显示屏，显示信号强弱或对话内容
支持 LCD 显示图片表情
支持多语言（中文、英文）

固件部分

免开发环境烧录

新手第一次操作建议先不要搭建开发环境，直接使用免开发环境烧录的固件。

固件默认接入 xiaozhi.me 官方服务器，目前个人用户注册账号可以免费使用 Qwen 实时模型。

👉 Flash烧录固件（无IDF开发环境）

开发环境

Cursor 或 VSCode
安装 ESP-IDF 插件，选择 SDK 版本 5.3 或以上
Linux 比 Windows 更好，编译速度快，也免去驱动问题的困扰
使用 Google C++ 代码风格，提交代码时请确保符合规范

智能体配置

如果你已经拥有一个小智 AI 聊天机器人设备，可以登录 xiaozhi.me 控制台进行配置。

👉 后台操作视频教程（旧版界面）

技术原理与私有化部署

👉 一份详细的 WebSocket 通信协议文档

在个人电脑上部署服务器，可以参考另一位作者同样以 MIT 许可证开源的项目 xiaozhi-esp32-server

电路板

图1 电路板正面
图2 电路板背面

外观样式

图3 浅蓝色外壳
图4 粉色外壳
图5 外壳背部

功能介绍

视频演示

暂无

Yuan Huafei

https://mqcx-xs.cn/40-xiao-zhi-yu-yin-liao-tian-ji-qi-ren/

本博客所有文章除特別声明外，均采用 CC BY 4.0 许可协议。转载请注明来源 Yuan Huafei !

PCB设计 ESP32 C/C++编程

《冬雨》

冬雨

2025-11-11 日常写作

记叙文

LVGL开发辅助工具

LVGL开发辅助工具。

2023-05-10 业余设计

python 软件设计

AI小智语音聊天机器人

AI小智语音聊天机器人

硬件部分主要器件：

软件部分:

已实现功能

固件部分

免开发环境烧录

开发环境

智能体配置

技术原理与私有化部署

电路板

外观样式

功能介绍

视频演示

你的赏识是我前进的动力