zoukankan      html  css  js  c++  java
  • 筹划了几年,我终于开始实现了---语音智能管家

    加群获取学习资料QQ群:901381280

    先看看我自己规划的语音智能管家的基本功能框架

     

    一.为什么会造一个语音智能管家?

    • 2016年开始接触编程,到现在快4年半了,当初想学习编程,目的都是想做一些有趣的东西,当初的目标是做一个自己的网站、一个自己的小游戏,这些都已经实现了。后来接触的科幻电影多了,里面的人工智能技术真是太炫酷啦,同时一些重复的工作,能够智能帮自己去处理,那可就太爽了,因此自己也想做一个自己的语音智能系统。

    1.为什么到现在才想开始做?

    • 语音智能系统涉及到很多知识,比如语音识别技术,语音合成自然语言处理处理,python自动化办公,大型爬虫系统,物联网,人机对话聊天等等,那时候还在本科,接触的技术不多,也无法实现。
    • 尤其是这个语音智能系统做出来后,系统配置较为不错的服务器去支持。为了便携式移动式使用系统,个人希望可以用树莓派去部署一些功能,这样才离线的时候也可以使用智能系统。
    • 但奈何服务器也没有(我在阿里云租过学习版服务器,但是那种配置真的很低,无法实现这个想法),树莓派也没有(一个最基本的树莓派都要550元,加上一些摄像头和麦克风,这些杂七杂八都要700左右,如果好一些的树莓派都要接近900元,为了能够顺畅使用系统,还是希望偏向于好一些的树莓派,可惜太贵了),因此这个智能系统也就没有去弄。

    万事俱备

    硬件方面:目前在读研的实验室里面,经费充足,里面有几台电脑+一个高配置的服务器(GPU-P40,听说是价值三百多万),也买了一个高配的树莓派(实验室报销,爽呀,嘿嘿嘿),硬件方面硬件基本具备了。

    软件方面:在本科大三跟着老师进行了半年的自然语言处理处理,毕设是聊天机器人的设计与实现,这四年对爬虫系统和自动化办公也较为熟悉,支撑智能管家这些基本没问题。在今年暑假,学了三个月的物联网技术(当时觉得好玩就学了,没想到为了现在的语音智能管家提供了技术支持,看来是天意),目前研究生阶段也学习了不少语音处理和图片、视频相关的人工智能技术,这些技术可以支撑开始这个计划了。

     

    二.语音智能管家的功能介绍

    功能分为五大模块:休闲、日常、闲聊、学习、智能家居

    里面的很多功能目前已经实现了,比如:听音乐、看影视、备忘录提醒、微博热搜、邮件检查,日常聊天,问题解答、爬虫系统。但是都是单独的网页或者系统,没有整合到一起形成一个整体,一个可以统一管理的系统。现在造一个智能管家,通过它去语音管理这些功能。

    1、休闲

    1.听音乐

           目前在我个人网站部署了一个在线播放各种平台vip的音乐网页:http://music.chenlove.cn/,可以在线搜在线听。

    计划:希望通过智能管家去接管这个网页,通过语音的方式去播放音乐,不在人为的输入,在搜索。比如说:播放《海阔天空》,智能系统能够自动搜索并播放该音乐

    2.看影视

    相信大家都有了解了很多的vip视频解析网页,为此我之前也做了一个这个在线搜索免费观看的视频网站:http://movie.chenlove.cn/

    计划:同时是通过语音的方式,去播放影视。比如说:播放《唐人街探案》,终端(电脑或者手机)能够切换到该影视的播放页面。

    2、日常

    1.出行规划

     计划:在外出时,能够给自己规划好路线(语音输入起点和终点),系统给出相应的路线图,然后投屏到终端。

    2.备忘录提醒

            前几个写了一个备忘录提醒网页,功能:输入计划内容,提醒时间,系统会以邮件的方式给我提醒。因目前正在使用,个人隐私就不公开这个网页链接了。

            计划:能够语音方式输入计划内容和提醒时间。

    3.新闻播报

            计划:每天定时(每天早晨或者晚上),通过爬虫系统去定时采集新闻数据,通过语音合成的方式去播报。个人认为每天还是多了解一下新闻还是不错的。

    4.微博热搜播报

            之前在公众号写过微博热搜的文章,源码已放到了gitee,没有部署到服务器,到时候再部署到服务器并接入智能管家。

    计划:每天定时(每天早晨或者晚上),通过爬虫系统去定时采集微博热搜,通过语音合成的方式去播报。个人认为每天还是多了解一下新闻还是不错的。

    5.邮件检查

            计划:通过爬虫系统去监控邮件,并进行语音播报。

    3、闲聊

    1.日常聊天

            目前已经实现了日常聊天的模型:GPT-2(毕设时),听说GPT-3这几天出来,到时候再看看并改进替换。此外,BDCI 千言:多技能对话比赛也公开了聊天模型源码,个人跑起来试了一下,感觉聊天效果还不错。到时候也可以接入到智能系统中来。

    计划:通过语音唤醒,进行平常的日常聊天解闷,哈哈哈。

    2.问题解答

    已经实现了知识图谱在医药领域和百度百科的知识问答(因为我只采集了这两个领域的数据集,哈哈哈),后面根据需要去采集更多的问题数据集,让问答能够更加智能。

    计划:通过语音唤醒,进行问题提问,语音解答。

    4、学习

    1.监控服务器

    计划:目前有好几台服务器使用,通过语音问答方式去了解服务器的状态(网速,内存,硬盘,进程等情况)

    2.控制爬虫系统

            目前在用的爬虫系统,是通过可视化去开启和关闭爬虫系统,去浏览数据量,爬取情况。

            计划:语音唤醒,通过智能管家去操作这些爬虫,通过语音播报爬虫系统的情况。

    5、智能家居

            智能家居这一块,本来没有这个打算的,但是学了几个月的物联网技术,也不能浪费,那必须加上,哈哈哈。

    1.开关门

            计划:接入相应的传感器,智能家居能够进行开门和关门操作。

    2.视频监控

            计划:在实验室门口安装一个摄像头,可以对实验室的人流量进行统计,此外还可以对人脸进行识别,如果是该实验室的小伙伴,智能系统打开实验室门。

    3.室内灯光

            计划:语音开灯和关灯。

    三、语音智能系统的实现计划

    在平时的科研和任务不多的时候,利用空闲的时间去编写这个系统(因为空闲时间的乐趣就是做自己喜欢的事情,嘻嘻嘻,正好可以用来编写这个系统)。

    每次完成一个小进度的时候都会在公众号和博客进行更新,记录一下这个过程(毕竟自己动手完成一件事,还是很有成就感的)

    希望大家也能在这个过程中可以学习到一些知识(大牛就忽略了吧,哈哈哈)

     

    同时在这个过程中,大家有更好的建议也可以进行评论交流,让这个系统更加完善。

     

                                   【加群获取学习资料QQ群:901381280

                                             【各种爬虫源码获取方式

                                          识别文末二维码,回复:爬虫源码

                            欢迎关注公众号:Python爬虫数据分析挖掘,方便及时阅读最新文章

                                 回复【开源源码】免费获取更多开源项目源码;

                     

  • 相关阅读:
    mysql 存储过程 异常处理机制
    Maven 私服打包
    Flink(2):Flink的Source源
    Flink(1):Flink的基础案例
    最后一课
    我的获奖记录及 Important Dates in OI
    目录
    入坑 OI 三周年之际的一些感想
    洛谷 P3781
    Atcoder Typical DP Contest S
  • 原文地址:https://www.cnblogs.com/chenlove/p/14128883.html
Copyright © 2011-2022 走看看