最近看了新浪微博的API, 感觉挺囧的, 居然限制得那么严格, 目前还不知道通过api检索数据是不是依然有限制, 如果还有的话, 那只好HTML解析大法了....
发现大家都挺喜欢上微博的, 心中就萌生了一个念头, 制作一个AI机器人来治愈那些忧伤的哥哥们-_-|| 也就是做一个治愈娘.
由于本人并没有自然语言处理的基础, 所以昨天花了点时间做了一个随机@用户的发贴机, 现在取名叫@小唯女, 以向平沢唯表示敬意.
@小唯女只是一个简单的自动发贴机, 我会在以后将AI加上.
如果要制作治愈娘, 首先要实现一个完全自动发贴机, 即从互联网搜索有用的资料, 然后通过发贴机发送到可能需要的人那里; 之后要会自然语言分析, 分析出哪些文字是治愈系文字, 哪些人的帖子包含忧伤, 分析出这两点后就可以实现随机治愈; 当然我们的目标不是随机治愈, 而是精确治愈, 比如失恋的, 事业遭受挫折的...等等都需要不同的治愈方案; 最后一个目标是实现互动, @小唯女要学会如何和受伤的大哥哥们进行会话.
@小唯女的完全自动发贴功能应该分以下几个步骤来实现:
1. 从twitter/t.sina.com以及其他网站上搜集语句通顺的文字.
2. 在新浪微博中随机@大哥哥, 发送文字.
目前我只是手写了一些数据在data文件中, @小唯女还处于没有智商的阶段-_-||