小智AI聊天机器人常见问题Q&A
为简化表述,以下小智AI终端代指小智AI聊天机器人,除了ESP32-S3-WROOM-1系列开发板相关外,以下问题大部分针对面包板配置方案,其他厂商的方案或定制的方案的问题不在此整理之列。
Q0:小智AI机器人复刻操作步骤是怎样的?
A:使用面包板,或杜邦线,或自己焊接导线组装方式,分以下5个步骤:
1)按照清单购买所需要的材料及模块:具体参考文档:
2)开发板及硬件模块接线:根据用户买的开发板44引脚或42引脚,请选择对应的44引脚或42引脚的开发板接线图或连线表格教程文档,按照对应英文及数字编号连线接好导线,参考链接文档:
3)下载烧录面包板固件:
(1)默认WIFI版本,请下载烧录WIFI版本固件 v0.X.X_WiFi.zip (X.X代表版本号)。
(2)ML307R-4G版本(可选)请下载烧录4G版本固件 v0.X.X_ML307.zip(X.X代表版本号)
固件版本及FLASH烧录工具,请到QQ群公告github链接中下载(保持最新),如遇到打不开github链接,固件版本也可以到QQ群文件中获取,FLASH烧录固件操作参考文档:
4)配置设备联网:
(1)ESP32S3开发板默认支持WIFI网络,请配置你所在场所的WIFI,或者手机热点(限2.4G频段WIFI,不支持二次验证的WIFI网络,如部分校园网或商业网络。),具体请参考配网教程:
注意:手机找不到 Xiaozhi-XXX网络,可能是仿版ESP32-S3开发板的天线信号问题(仿版建议选择带天线座子的开发板,或者乐鑫官方模组带乐鑫LOGO的开发板),请参考设备配置网络教程第3节。
(2)ML307R-4G版本插上SIM卡/流量卡(物联网卡)即可联网。
5)到网站后台控制面板登记设备:按照上面的链接,添加设备验证码登记设备。唤醒“你好小智”即可使用。
网站后台控制面板网址:https://xiaozhi.me
注意:1)第3步和第4步的WIFI配置,可以在硬件模块接线之前先操作。
2)购买第三方开发板或已经组装好的产品,参考相关说明,一般无需接线,可以直接按对应固件版本烧录即可(部分商家支持烧录固件,到手可直接配置设备联网即可使用)。
Q1:我不会焊接电烙铁,可以复刻小智AI聊天机器人吗?
A:可以的,按照项目教程文档,使用面包板配置WIFI方案,在购买时选择焊接好的排针的电子元件模块,再按照文档步骤操作接线和下载固件到开发板,配置WIFI网络和登记设备后即可复刻小智AI聊天机器人,整个过程不需要使用到电烙铁。
Q2:请问复刻小智AI的硬件材料及元件清单到哪里看,到哪里买?
A: 1)小智AI终端的硬件材料及模块清单,请参考接线文档第1部分和第2部分,具体文档链接:
2)关于购买链接,本项目以开源为主,但我们会挑选一些群友经常购买的链接放到文档里,方便大家参考,更多的请自行到某宝或其他购物平台搜索。
(1)散件就按模块的名称搜索,例如开发板搜索 “ESP32 S3 开发板”,麦克风搜索 “INMP441”,音频功放搜索 “MAX98357”,一般同一家店铺就能买齐清单上的模块(ML307R-4G模块除外)。
(2)组合套件请搜索关键词 “小智AI ESP32”,或 “小智AI ESP32S3” 等,其他搜索自行发挥。
3)购买链接参考:
注意:由于商家产品存在差异,请尽量选择信誉高销量高评价好的店铺购买,购买咨询和售后质量问题请自行和商家协商,不归本项目负责。
Q3:请问我需要购买ML307R-4G模块吗?
A:ML307R-4G模块在清单中上可选的,同时需要购买4G流量卡或使用手机卡(默认带数据流量的)配合使用,主要是在无WIFI或者WIFI受限的情况下使用的:
①所使用小智AI终端的地方没有WIFI或者WIFI受限(比如部分校园网、商业场所等需要二次认证身份的网络,ESP32的WIFI模块默认连接不上);
②非WIFI环境下,连接手机热点不方便的或者用户没有智能手机;
结论:有正常WIFI或手机热点可使用,不用购买ML307R-4G模块。(不想连wifi或觉得连WIFI麻烦的,不在意流量费用成本就想使用4G流量的除外)。
Q4:如何烧录小智AI的固件程序,报错了怎么办?
A:1)请参考无IDF开发环境具体步骤,是否有按步骤指引操作。
操作关键点:
①芯片型号选择为ESP32-S3;
②加载模式默认 UART,插开发板右侧的USB接口(背面丝印对应COM);
③烧录的BIN文件要勾选上,地址要填写0 或 0x0 ;
④ COM端口请选择自己电脑上识别的COM端口号;
没有识别出COM端口号,先检查连接ESP32S3开发板的使用的是否为的数据线,再检查驱动,如果出现惊叹号,请找卖家要安装更新驱动程序)。
注意:请使用手机或开发板配置的TYPE-C数据线,不要使用细小的USB充电线(里面只有两个电源线,不能进行数据通信)。
其他配置默认不需要改动即可烧录。
烧录的BIN文件请到QQ群公告中下载(保持最新版本和全部releases),或到QQ群文件中下载对应的版本,面包板wifi产品对应:vx.x.x_bread-compact-wifi.zip文件,面包板4G版本对应 vx.x.x_bread-compact-ml307.zip文件(vx.x.x表示版本号例如 v0.9.7 )。下载后存放在我的电脑本地硬盘上时,路径里不能包含中文字符,否则无法加载烧录。
具体请参考文档链接:
注意:直接小智AI终端烧录bin固件用户,不需要安装配置ESP-IDF开发平台及相关系统环境。
Q5:IDF是什么开发环境,我需要配置IDF开发环境吗?
A: 1)普通用户不需要安装配置IDF开发环境,开发者或者学习编程用户才需要配置。
IDF是指 ESP-IDF,是ESP32芯片公司乐鑫科技官方推出的开发平台,支持C/C++语言开发ESP32应用的开发平台。小智AI开源项目是基于 ESP-IDF 5.3 版本使用C/C++语言开发的AI应用。
普通用户不需要安装配置IDF开发环境,需要改动小智AI开源代码重新编译,或者开发其他应用的开发者,或者想学习如何编程的用户,才需要配置安装 ESP-IDF开发平台。
Windows 配置开发环境参考:
Linux 用户请自行上网查资料配置开发环境,不在此表述。
Q6:我复刻的小智AI终端喇叭为什么没有声音?
A: 1)请检查你的喇叭是否接好,一般红色线为正极,黑色线为负极。
2)请检查你的数字功放是否接对了且接触良好,数字功放的引脚接线,请参考开发板对应接线版本的接线表格中接线对应检查(照片只做参考)。面包板质量有好坏,有问题时可以使用万用表测试通联情况。
3)用户如果使用电脑USB口为小智AI设备供电,喇叭功率达到3W,可能会出现供电不足的情况,喇叭卡顿或突然没有声音(屏幕显示正常),建议改用5V2A及以上的USB充电头或5V2.1A的充电宝USB口供电,一般能恢复正常。
具体请参考接线文档链接:
注意:如果你已经确定接线正确,还是没有解决,可以更换备用喇叭和数字功放模块测试,如果更换可以使用,则说明你原来的模块对接有问题,如果都不行再完整拍照到Q群提问。
Q7:我复刻的小智AI终端喇叭有沙哑的声音/声音异常?
A: 1)喇叭有沙哑声一般考虑数字功放GAIN没有接地 GND,或GND接线不稳定。
小智AI终端喇叭有沙哑的声音,请检查你的数字功放GAIN引脚的接地GND情况,是否接对了且接触良好,请参考对应版本的接线教程的表格检查(照片只做参考)。面包板质量有好坏,有问题时可以使用万用表测试通联情况。
2)喇叭中声音有沙沙的电声,除了接线问题,一般考虑电磁干扰。请将小智AI终端远离强磁场设备或模块,隔离充放电电源等。或考虑加锡箔片或其他金属屏蔽隔离。
Q8:如何调整小智AI终端的音量大小?
A: 1)小智AI终端固件版本大于等于0.9.7,支持语音识别控制音量,直接和小智AI说把音量调整到多少,或者说音量调小/调大一点就可以。
2)小智终端固件版本小于0.9.7,需要接物理按钮支持音量调节,对应ESP32-S3开发板IO39引脚为音量减小,IO40引脚为音量加大。具体请参考固件接线教程文档。
Q9:为什么小智AI终端“你好小智”无法唤醒/无反应?
A: 1)首先唤醒词默认是 你好小智,请确认是否正确(不是 小智你好 或 小智小智,也不是配置的角色名字)。
2)检查你的麦克风6个引脚的接线是否正确,且接触良好,请参考对应版本的接线教程的表格检查(照片只做参考)。面包板质量有好坏,有问题时可以使用万用表测试通联情况。
注意:INMP441麦克风默认是有麦克风图标和丝印字母带进声孔这一面朝上的,部分商家或自己把麦克风的排针接反了接到了背面的,要注意对照丝印字母的引脚接口参考教程文档表格接线。
具体请参考接线文档链接:
附串口工具简略操作:第1步选择COM端口,第2步点击打开串口。其他配置默认不需要改动。

Q10:小智AI终端提醒我配网,但是找不到 xiaozhi-xxx WIFI?
A:配网时有提示音或者屏幕有显示进入配网状态,但是用手机或者电脑WIFI打开搜索不到 Xiaozhi-xxx 名称的 WIFI,则说明你的ESP32S3开发板的WIFI信号存在问题(非乐鑫官方ESP32S3模块,可能存在产品批次质量问题),可以临时用手按住开发板天线位置或绕线尝试增强天线信号,具体请参考配网教程第3节配网异常处理。
参考WIFI配网及异常问题链接:
部分情况可能需要使用串口工具检查开发板输出信息,用来定位问题。
串口工具使用指引参考链接:
Q11:小智AI如何重新配网WIFI/切换WIFI ?
A:将开发板重新上电/重启,在连接WIFI闪烁蓝灯时,直接按下Boot按钮然后松开,听到提示音重新进入WIFI配网模式。
当小智AI连接上次配置的WIFI失败3次后,将重新进入WIFI配网模式。
注意:当前小智AI只默认记住了上次连接的WIFI及密码,如果更换WIFI或者WIFI/热点关闭,需要重新配置WIFI网络。(如果你需要实现记住更多WIFI需要另行代码程序实现。)
Q12:为什么我的屏幕没有点亮?
A:请检查你的屏幕接线是否正确,且接触良好,4脚的OLED屏幕的引脚接线,请参考对应开发板版本(标准44脚和42脚,44脚为第1个版本,42脚为第2个版本)的接线教程的表格检查(照片只做参考)。面包板质量有好坏,有问题时可以使用万用表测试通联情况。
具体请参考接线文档链接:
注意:如果你已经确定接线正确,还是没有解决,可以更换备用屏幕测试,如何更换可以使用则可能你原来的屏幕模块烧坏了或有问题。如果没有备用的或者都不行,再完整拍照到Q群提问。
Q13:小智AI终端支持播放音乐吗?
A:支持播放测试的音乐,由于受限版权的问题,曲目仅限测试歌曲和网友提交的歌曲,以及一些儿歌等。
如果需要连接更多的音乐,可以自己扩展IO接口播放本地音乐(如TF卡等),或自行代码实现连接第三方平台的音乐播放接口,具体可以和实现的群友探索。
Q14:小智AI终端支持 DeepSeeK 等大模型切换吗?
A:支持,目前已支持以下大模型/API:
Qwen 2.5(实时)
DeepSeek V3
DouBao 1.5 Pro
Qwen Max 2.5
操作步骤:请登录小智AI管理后台控制面板,在控制台/设备管理/配置角色页面切换AI角色大模型,如下图示。
管理后台控制面板设备管理:https://xiaozhi.me

Q15:小智AI终端支持蓝牙连接吗?
A:暂时不支持。
ESP32S3芯片/模块是支持蓝牙BLE从机模式的(只支持被连接),小智AI项目没有用到,如果需要该功能,比如用手机或电脑连接小智AI聊天机器人硬件终端,不需要扩展硬件,可以另编写程序代码实现。
注意:由于ESP32S3芯片/模块只支持蓝牙BLE从机模式,所以小智AI终端不支持连接蓝牙耳机或者音箱,如果需要实现该功能,需要另外加蓝牙主机模块和代码程序实现。
Q16:可以给小智AI终端的换更大的喇叭吗?
A:可以的,目前小智AI终端默认的数字功放MAX98357支持3W左右的喇叭,如果你对音量音质效果不满意,你可以换成其他支持 I2S 的功放模块,ESP32开发板的USB供电一般不超过5W,使用功率较大音频功放需要另外单独供电。
Q17:请问小智AI终端支持插耳机或者3.5MM的音频孔输出吗?
A:默认不支持,需要更换音频模块,目前市面上的支持I2S的音频模块可以支持,不需要改动程序代码。
例如 PCM5102音频模块(支持立体声DAC,大概10元左右),已经验证可支持3.5MM的音频孔输出。
或者 UDA1334A I2S 立体声 解码器 ,大概13-15元,待验证。
上述解码器某宝上都可以购买到,其他更多I2S音频模块待群友探索和汇总。
Q18:可以给小智AI终端更换更大的屏幕吗?
A:目前MCU常用的有两种屏幕,SSD1306驱动的OLED屏幕和ST7789驱动的SPI-LCD屏幕。
1)默认支持SSD1306驱动的OLED屏幕更换。默认配置的0.91寸4脚OLED单色屏幕128*32分辨率。可以更换0.96寸、1.3寸和1.5寸128*64分辨率等SSD1306驱动系列的4脚屏幕,相应的屏幕的分辨率需要在开源项目代码 boards/bread-compact-wifi/config.h 配置文件中调整 DISPLAY_HEIGHT 为 64,需要重新编译项目flash烧录到开发板中。
2)SPI-LCD屏幕默认已支持,目前支持 ST7789驱动、ILI9341驱动、ST7735三种,在开发板类型为“面包板新版接线(WiFi)+ LCD”的DIY开发板类型,选择对应的屏幕驱动和分辨率,保存配置后,重新编译构建烧录(必要时请先清除构建)一键三连烧录到开发板,即可在面包板上实现对应SPI-LCD屏幕的驱动。

其他厂商方案中已经实现其他驱动版本的SPI-LCD屏幕,相关驱动程序已经在开源项目代码库中,需改动开源项目的程序代码自定义引脚适配分辨率等,重新编译才能使用。
Q19:小智AI支持更换唤醒词吗?
A:代码编译支持,需要自己或找到人配置IDF开发环境,修改开源项目代码,在配置SDK或menuconfig中修改唤醒词,目前可选的为25个左右。
具体参考唤醒词更换文档链接:
注意:本开源项目暂时不能定制自定义唤醒词,ESP32乐鑫官方的离线唤醒词识别需要向官方申请,涉及语料和商业费用,在上面链接参考文档或到乐鑫官网了解。其他方案可参考外接扩展离线语音识别模块如天问,具体需要自己修改代码程序和尝试。
Q20: 小智AI的角色名称可以换吗?
A:可以,请到小智AI管理后台控制面板——角色配置中修改AI角色的名字,下次小智AI对话他就知道自己叫什么名字了,记得保存保存,如下图示。
注意:角色名字只是大模型配置的智能体角色的名字,和离线唤醒词是两个东西,“你好小智 / nihaoxiaozhi” 离线唤醒词是要到乐鑫官方定制的,两者不存在关联。设备唤醒词没有更换的话还是默认的 “你好小智”。
小智AI控制台设备管理:https://xiaozhi.me/console/

Q21: 小智AI支持更换声音/音色吗?
A:支持,请到小智AI网站控制台——配置角色中切换角色声音,可以先试听一下,然后提交保存配置。下次对话就会切换配置好的音色了。
管理后台控制面板设备管理:https://xiaozhi.me/


Q22: 请问能让小智AI听声辨人记住我是谁吗?
A:可以的
操作:请到小智AI网站后台控制台——智能体——找到对应 声纹识别 弹层中声纹向量下拉选择一段语音记录(建议适当长一点表述较为清楚的),填写 名称 和 描述(对话人和角色的关系), ——点击 OK 按钮 添加说话人,在 声纹识别 页面列表就可以看到了,可以添加多个说话人。
描述:可以在描述输入栏填写你和小智AI角色的关系,比如:我是xx,是{小智}的主人、或好朋友、或男/女朋友、或英语老师等。
重新唤醒小智AI终端,下次对话中你问小智AI角色,他/她就知道你是谁啦,这让你感觉很亲密,很酷对吧!
注意:受限技术框架和硬件实现效果,不能100%识别;另外说话人越多,分辨的准确率会下降。
管理后台控制面板设备管理:https://xiaozhi.me



Q23: 小智AI支持更换成自己定制的声音吗?
A:已支持,公测体验
此功能需要在服务端支持,目前已经在全面放开公测了,服务价格为99元/年,如有体验需求可参考小智AI声音复刻教程:
Q24:小智AI终端支持电池供电吗,如何对接?
A:需要增加5V电压升压模块才能支持。
1)ESP32S3开发板需要5V供电,锂电池通常是3.8V电压不够,如果需要建议加装 5V充放电一体板。
用户可以到某宝搜索 5V 充放电一体板,注意要带有5V输出的,不清楚请咨询商家。(建议5V2A的,大约2-3元左右,建议和锂电池或其他元件模块一起采购,节省运费)。
2)开发板外接5V供电操作:ESP32S3开发板支持外接5V供电,请将 5V充放电一体板 的VOUT或5V+电源正极输出,接线到开发板的5Vin引脚,负极GND输出接开发板上的GND引脚,(5Vin看开发板上的丝印标识,44引脚的开发板一般在左下边,42引脚的开发板一般在右下边,GND一般建议接最近的,或随便接一个GND都可以)。可以参考番外篇 故事机改造,文档中有对接5V充放电一体板的案例,包括电源开关。
3)如果用户有充电宝/移动电源,可以通过TYPE-C口充电线,直接给小智AI的开发板TYPE-C接口供电。两个TYPE-C接口都可以供电。如果喇叭功率达到3W或其他高耗电模块,建议使用充电宝/移动电源的 5V2.1A的USB口供电。
Q25:小智AI终端支持语音控制电机/舵机吗?
A:默认不支持,需要加舵机/电机驱动模块支持。
ESP32-S3芯片/模块主打低功耗物联网通信及解决方案,可以利用已接入的IOT框架扩展,通过语音控制esp32s3输出信号,到扩展的舵机/电机驱动板芯片模块,通过扩展电机/舵机驱动板和代码程序实现。
目前小智AI已经适配 ESP-SparkBot开发板(坦克,硬件开源项目)实现小车运动控制。
开源项目地址:https://oshwhub.com/esp-college/esp-sparkbot
Q26:小智AI终端支持语音控制其他的设备吗?
A:目前小智AI终端0.9.7版本已支持IOT物联网框架,支持定义引脚控制开关灯试验,更多的功能可以自己根据需要自己开发。
视频参考链接:https://www.bilibili.com/video/BV1k9ieYhEHj
Q27:请问小智AI支持市面上的哪些开发板?
A:小智AI终端固件烧录和开源程序代码编译,目前已经支持以下市面上的开发板/产品:
1)乐鑫 ESP32-S3-DevKitC-1 开发板(ESP32-S3-WROOM-1/1U N16R8芯片模块搭载的相关开发板)
2)乐鑫 esp-box-3,(仿版需要改动小部分代码)
3)立创S3实战派 lichuang-dev
4)酷世开发板 kevin-box-1和 kevin-box-2(源代码已由开发板开源)
如果烧录bin固件请自行选择对应的固件程序烧录,如果选错了程序可能无法运行。
如果编译小智AI项目,请在SDK或者idf.py menuconfig 配置中选择对应的开发板,具体请参考IDF开发环境和编译小智项目文档第4节。
注意:其他开发板或产品,没有默认支持的,直接烧录程序可能无法运行,需要修改程序源代码重新编译去适配相关芯片引脚接口、音频驱动及屏幕驱动程序等。(重新编译操作需要先搭建ESP-IDF开发环境,使用C/C++语音,熟悉小智AI项目源代码后才能修改代码编译测试,不在本文档中表述)
Q28:小智AI项目使用的是什么大模型?服务端开源吗?
A:服务端基础框架是开源的,但是大模型是私有训练和部署的,使用的是阿里开放的QWen 72B大模型,需要自行对接和训练,部署大概需要4张4090显卡(24*4=96G显存)以上才能正常运行,具体自行了解实现。
服务端开源地址:https://github.com/78/xiaozhi
Q29:小智AI支持接入GPT等大模型吗?
A:暂时不支持,此功能需要在服务端实现,小智AI暂时未开放支持配置其他大模型或其他大模型API。
如果用户需要支持其他大模型API或者自建部署的大模型,需要自行实现服务端。
可参考小智AI服务端开源基础框架,开源地址:https://github.com/78/xiaozhi
更多请参考网站官方相关帮助
https://xiaozhi.me/