一年前写过《我们需要什么样的智能音箱》,里面提到现在市面上智能音箱在某种程度上是从厂商的角度设计的,存在两个问题:一是音箱作为一个always-listening black box所带来的隐私顾虑,另一是设备不开放所造成的功能受限问题。
那么我们就自己从头设计一个开源的智能音箱吧,在《语音交互——弹药库》中罗列了各种语音方面的资源,已经足够用来打造一个完全开源的智能音箱,就以一个开源项目的方式开始尝试,项目英文名就叫Smart Speaker from Scratch(因为受到Linux From Scratch的启发和激励)。
就定三个小目标:
- 开源(Open Source)
- 平价(Affordable)
- 可日常使用(Daily Use)
开源,即项目所用到的软硬件尽可能开放,当然也不排斥没开源的资源,希望有一套完全开源方案,最终希望是有开源的方案和各种其它方案可供用户选择(是的,有选择很重要)。
平价,意味着这不应该是很昂贵的玩物,虽然不能做到市面上智能音箱补贴后的价格,但会在硬件和结构的选择和设计上充分考虑成本,让成本尽可能的低。比如结构上可以选择低成本的纸壳(纸壳设计的门槛很低,可以让更多的人参与到DIY中)。
可日常使用,意思是可靠性足够好,不能停留在prototype阶段,不能只是demo的程度,需要可以像市面上的智能音箱那样,可以日常听歌,可以控制家里的电器。
这里面涉及的软件一点都不少,所幸的是过去三年一直在语音这个方向折腾,如今也算轻车熟路。过去的几年,主要就是在写代码,不过呢,一直会去思考产品要怎么设计,现在就开始把一些想法具象化吧。去挑战各种类型的事情,一个人像一支队伍,大概是因为队里面有程序 、产品 ,机械攻城 ……当然,一支队伍是不够的。
另外,想把整个过程写下来,写成一个电子书《Smart Speaker from Scratch》,可以写硬件设计、结构DIY、语音前端处理算法、语音交互逻辑,诸如此类。
项目的记录放在hackaday.io上面
Smart Speaker from Scratch代码和文档会放在Github,欢迎follow跟进
voice-engine/smart_speaker_from_scratch如果你对智能音箱感兴趣,对always listening black box很在意,对DIY一个感到好奇,其它什么原因也行,欢迎在下面留言,也可以加入 gitter chat room 交流。
Have fun!