小胖-R1智能音箱,是一款定位于中高端的智能语音生活助手,面向智能语音家居市场。为用户提供智能语音生活助理服务,如:天气查询、闹钟设定、语音记事、翻译等;互动娱乐服务,如:音乐、笑话、新闻、有声读物、相声小品等;家居控制类服务:灯具、窗帘、门锁、家电等。具有内容丰富,拓展性强的特点。

硬件主要由如下部分组成:麦克风阵列、主控板、LED灯板、扬声器、电源适配器。
灯光定义:
用户在初始化使用智能音箱时,需要首先在 APP 端登录或注册账号。在完成初始化配置之后,该音箱设备的 Device ID 与该用户账号完成绑定。
通过以下蓝牙完成设备的联网,ID 绑定,服务激活。
支持通过蓝牙协议、AirPlay,同步推送多媒体音乐资源。在音箱未联网的状况 下,本功能仍可正常执行。 针对蓝牙,AirPlay设备需要进入外放配置状态,并完成配置之后,方可同步移动端的音频流。
唤醒性能:环境需求:整机测试,在麦克风处人声音量的大小为 70dB。
误唤醒概率(整机):在新闻联播,歌曲等有声环境下,做到低于 3 次/24 小时;安静环境下 0次/72 小时。
UniOne音箱 APP 是一款管理智能音箱的智能家庭应用,提供方便、快捷的联网体验,支持远程控制,实时记录用户与智能音箱之间的对话,支持自定义智能硬件与智能音箱之间的联动。可根据客户要求快速定制APP,周期2月/1人。
当前酒店行业的竞争非常激烈,智能化改造可以提升酒店竞争力。Pandora A1的目标客户即是酒店智能化改造的集成厂商或者集团化酒店。客户通过在其平台上的配置,满足各酒店个性化的业务需求,同时提供安装部署培训等服务。
名词解释:
设备/产品:一般情况下,均指本文的主体,即Pandora A1设备。
家电/家居/客房设备:酒店客房内的各类家用电器,包括不限于灯光、空调、门锁、空净、窗帘、电视、门铃等。
客户:特指酒店智能化改造厂商,如携住科技。(也可以是酒店)
客人/住客/用户:均指入住酒店客房的客人,也是产品最终的使用人群。
配置话术:因酒店业务的差异性,涉及该部分的TTS应答开放给客户或酒店自行配置。
设施/配套设施/酒店设施:指酒店内的固定场所,如健身房、游泳池、图书馆、棋牌室等。
服务/客房服务:指酒店提供的客房服务,如叫醒、加床、洗衣等。
PMS:酒店管理系统软件,由客户平台和酒店PMS对接。
RCU:酒店客房的设备中控,由客户平台和酒店RCU对接。
方案架构图:

技术架构图:

酒店业务配置平台:客户(智能化改造厂商)需要一种高度灵活的机制来快速实现酒店不同的需求,通过配置该平台可对不同酒店、房型的应答话术、设备动作、设施明细、服务方式等业务相关的模块和我司产品进行解耦,便于客户的实施和酒店的运营维护。
场景触发器:客户平台主动向设备发起的消息推送,以期给入住客人提供相对主动的智能服务。
功能架构图:



上海垃圾分类政策实施,客户欲打造一款基于语音入口自动分类的智能垃圾桶,先用于家庭使用,支持1米以上的距离使用,第一期基于KAR Lite4方案,第二期使用IVM Unione方案。
智能垃圾桶语音板是IVM Unione方案。产品结构,硬件MCU控制板由客户设计和提供,整个PCB设计和集成由客户实现,用户可以通过客户公司公众号入口,打开小程序,进行垃圾桶的配网操作,垃圾桶需要联网确保垃圾分类语音交互和OTA等功能的正常运作。用户通过说“你好小丢”唤醒智能垃圾桶,然后和智能垃圾桶进行语音交互,语音板对输入语音进行降噪、唤醒以及识别和处理之后,把云端返回结果通过UART送到MCU控制板,控制垃圾桶的打开/关闭,语音板并对返回TTS进行播报。
智能垃圾桶结构由客户确定,但需要考虑MIC和喇叭的声学结构以保证语音识别的可靠性和性能,硬件板子由客户MCU厂商设计,我们提供满足硬件设计规格尺寸及功能要求的Unione语音板。
硬件需求表如下:
依赖项:对于语音识别性能和效果需要拿到客户整个产品结构(智能垃圾桶)进行声学结构测试,软件也需要基于此调优;对于串口通信协议的打通,需要客户MCU板子及相关烧录工具到位才可顺利进行。
1、唤醒词:你好小丢;
2、离在线混合:50条离线命令,在线垃圾分类语音交互,垃圾分类技能领域;
3、垃圾分类交互:
根据用户所说的垃圾,云端做分类,并下发所说垃圾分属某大类的tag及TTS(此垃圾介绍及所属分类), 终端根据云端下发结果传送到客户端执行打开xx垃圾桶,终端播报xx属于xx提示音;
只做垃圾分类交互,其他类例如音乐、聊天等模块都不需要;
不做城市分类;
未在我们词典范围数据,由客户1个月更新一次,我们如果有数据也会及时更新;
只响应我方固定的请求句式,其他非固定句式或者复杂组合句式一律不响应,直接播报不知道;
不在我方词典里的东西也播报不知道;
4、支持OTA升级;
5、支持小程序配网:扫二维码进入兴财公众号,用户可通过小程序进行配网操作;为了兼容lite4第一期方案,建议统一使用声波配网方式;
6、具体某种垃圾对应打开/关闭某个垃圾盖(例:如语音“西瓜皮”,湿垃圾盖打开,10S后自动关闭);
7、语音板和MCU控制板通过串口控制协议交互;
8、其他状态:
配网成功,播报成功提示音并通知MCU,LED蓝色常亮;配网不成功,播报提示音,通知MCU,LED闪烁;
网络正常,提示:主人,我在,请指示;网络不正常,提示:主人,我不在线 ,触发场景;
市电断电下,MCU发出进入休眠指令,语音模块进入休眠;要退出休眠模式,MCU控制唤醒脚即可。
支持打开/关闭4个垃圾桶的8个在线命令词,用户说“打开/关闭xx垃圾桶”,设备端播报“好的”,同时把命令传到MCU,由MCU执行动作。其他命令待确定,一共50条离线命令。
只做垃圾分类交互,其他类例如音乐、聊天等模块都不需要;不做城市分类;未在我们词典范围数据,由客户1个月更新一次,我们如果有数据也会及时更新;只响应我方固定的请求句式,其他非固定句式或者复杂组合句式一律不响应,直接播报不知道;不在我方词典里的东西也播报不知道;具体某种垃圾对应打开/关闭某个垃圾盖(例:如语音“西瓜皮”,湿垃圾盖打开,10S后自动关闭);
在线识别到其他领域内容时,固定播报“你的话太深奥了,我还要学习一下”。
华云智能电话一期项目的需求。基于智能语音终端进行人机交互,对语音进行识别、理解及播报。此需求来源于客户《智能电话对话设计(1)》表以及和客户进行电话沟通结果;本文针对客户提出的需求,进行项目方案和架构设计,需求功能定义,并用以作为客户需求确认的书面材料,整体规范华云智能电话功能需求和需求边界,定义开发范围。
整个系统架构如图所示:

用户可以通过智能语音终端配套的APP(IOS/Android版)进行配网和对智能语音终端进行交互控制。
用户通过语音唤醒智能语音终端并下发指令,终端对输入语音进行降噪、唤醒和识别之后,进一步把语音送到AI云平台做TR判断和在线识别并转发到客户云平台做语义分析,客户把处理结果返回AI云平台,并返回终端,终端SDK模块把云端返回结果通过IPC送到应用解析模块,从json中解析出结果,并调用在线语音合成TTS模块,把结果送回终端进行播报。
硬件:基于Unione的智能语音终端;
固件:AIOS系统及应用;
手机APP:Android和IOS手机APP,配套智能语音终端配网和交互控制;
解析应用:用于解析客户NLU语义处理的JSON结果,并通过IPC和AIOS SDK通信,最终TTS语音合成并播报;
在线ASR:在线语音识别,针对华云智能电话指令进行定制化实施;
云端配置:针对华云进行ASR、NLU、TR配置和华云服务支持配置;
TR:对智能语音终端上报语音,ASR,NLU,TTS,客户端配置和华云服务配置进行判别和路由分发;
云端协议:ASR结果需要通过TR发送到华云服务平台并进行NLU语义处理,华云服务平台把处理结果通过返回给云平台TR处理,云端打通需要定义通信协议;
唤醒词:用于唤醒智能语音终端,唤醒后进入识别模式,仅识别模式下支持离线命令词识别和在线话术识别;未唤醒时,仅能识别唤醒词。
离线命令词:不论是否联网,唤醒后均能直接识别的词汇;
打断:指语音板喇叭在播报状态下,需要先打断播报,才能使其进入识别模式;
单轮对话:指唤醒后,仅能进行一次识别,识别到有效指令即退出识别,下一次再进入识别状态,需要重新唤醒。
音箱作为电话的终端,实现打电话的功能和场景。
通话SDK由客户实现和提供,基于linux3.1内核版本开发。当音箱语音应用识别到云端返回的通话话术和指令时,即触发了通话功能,此时语音应用把mic和喇叭释放出来,并把从返回结果解析出的通话号码/或者其他拟定的通话凭证传给通话SDK,通话SDK接管mic和喇叭,并通过号码或凭证建立通话,当通话挂断后,通话SDK给出标志,把mic和喇叭释放出来由语音应用重新接管。
唤醒率验收标准为:3米噪音SNR=15dB,唤醒率≥92%
识别率验收标准为:3米噪音SNR=15dB,识别率≥92%
误唤醒率验收噪音环境下(45-50dB)的误唤醒要求为:24小时误唤醒测试≤3次
说明:测试噪音包含音乐、电视剧、综艺节目等,且噪音集不得含有唤醒词;