wwr207 发表于 2022-7-28 18:16:07

树莓派开发自己的智能语音系统-开篇

自从各大云平台逐步开放智能云服务之后,我就有了结合目前流行的开源硬件开发属于自己的智能语音系统的想法。当时还没有接触树莓派这个开源硬件,后来之所以选用它,主要还是因为树莓派提供了合适的性能支持和开发环境,正好也在学习python,而树莓派提供了很好的python开发环境,另外选择python作为开发语言也是因为python的易用性,有着众多的粉丝支持。

当然,在我们选择软硬件开发环境时,还得考虑自己的项目需求,接下来谈谈这个项目。最初的想法是做一个家用机器人,当然是可以自主移动的机器人,结合语音和视觉,实现语音控制,视觉识别交互导航等功能,因为个人觉得不能自主移动的机器人都不能叫机器人,另外,希望机器人能实现一般的NLP,识别情绪和语境,增强交互体验。想法总是远高于能力,随着项目的进展,原本期待的功能被一点点放弃或者降低要求。项目最终还是实现了大部分的功能,只是效果没有想象的理想,甚至相去甚远,这就是现实。后来我总结了一下原因,树莓派目前的性能不足于支持需要大数据和深度学习支持的算法,比如视觉导航和NLP等,树莓派提供的硬件支持远远不够,期待将来整合了AI芯片的开源硬件出来再试试。不过,我还是想把项目开发的过程整理出来,供大家参考。

好了,既然选择了树莓派,就先了解一下它是什么,能干嘛。

https://p3-sign.toutiaoimg.com/pgc-image/8a655df9f4ca4995a3738dadcc619833~tplv-tt-large.jpeg?x-expires=1974365721&x-signature=ScKKx8TVK8tHoXPE%2FViziZJIQzQ%3D

树莓派虽小,但五脏俱全和普通电脑无异,电脑能做的大部分事情,在树莓派上都能做,而树莓派以其低能耗、移动便携性、足够多的GPIO扩展性等特性,很多在普通电脑上难以做好的事情,用树莓派却可以轻松实现,只要你动起来,没有什么实现不了的。

看上图,小小的板子整合了四个标准USB接口,HDMI,AUDIO,40P,CSI视频接口,WIFI/有线网络接口,蓝牙接口等。非常丰富的接口提供了无限可能。配合一张TF卡,烧录上respi-debian系统就可以开始你的DIY之路了。

为了方便使用,我把原来的旧的DELL电脑改造了一下,塞进我的树莓派,改造显示屏,连上树莓派,就成了树莓派笔记本电脑了,只是原本的笔记本键盘改造起来比较麻烦,没找到合适的接口,只好外接一个键盘凑合使用。当然,你完全不需要像我这样折腾,树莓派可以通过VNC连接远程登录操控使用,也可以连接台式机的显示屏再外接键盘鼠标一样很方便。下图就是我改造好的树莓派笔记本。

https://p3-sign.toutiaoimg.com/pgc-image/3ac2912cd28c40ff9286319d43e82d0e~tplv-tt-large.image?x-expires=1974365721&x-signature=USEWDpa4UgKzc7%2Bm60PhCvhAsUE%3D

介绍完主角,回到项目本身的需求,既然需要实现智能语音和视觉,就少不了语音输入输出设备和摄像头。为了省事,我直接使用了JABRA的speak710会议音箱,另外买了一个逻技的网络摄像头,这两个设备最好都使用有线连接,确保数据传输不容易出现问题,尽管树莓派提供了蓝牙接口,但不推荐。当然,你可以选择其它合适的音箱,最好是带阵列麦克风的,这样语音识别效果会好很多。摄像头当然高清的比较好了。

关于树莓派,就简单介绍这些,考虑到不是为了介绍树莓派而介绍,不会深入讲解,感兴趣的可以到网上搜索关于树莓派的资料深入了解。基于项目简单了解一下就行了,后面遇到问题再去找解决方案即可,不必担心。

接下来我将正式开始项目的搭建和开发。

uz06f6a677mfm0 发表于 2022-7-28 18:16:31

厉害

un63if9mmdffd3 发表于 2022-7-28 18:16:57

没了

卓越9 发表于 2022-7-28 18:17:13

转发了

ul8err225d55ri 发表于 2022-7-28 18:17:23

转发了

ugf7afflk1z1id 发表于 2022-7-28 18:17:46

转发了
页: [1]
查看完整版本: 树莓派开发自己的智能语音系统-开篇