zoukankan      html  css  js  c++  java
  • 九眼智能:用大数据技术为网络信息加层“滤网”

      随着信息传播技术的快速发展和各类互联网平台的兴起,个人、机构均可通过注册公众账号借助平台公开发布信息,成为新闻媒体等专业内容生产机构之外的重要内容生产者,互联网平台成为用户获取信息的重要渠道。互联网平台的兴起及公众账号数量的日益增多,在一定程度上满足了用户多元化的信息需求。

      近年来,随着网络技术和新媒体应用的不断迭代创新,自媒体的社会化信息传播得到了空前释放,但供大于求的信息产能过剩已经显现出来。不少年轻人之所以谈起“爸妈的朋友圈”就一脸苦笑,正是由于泛滥在朋友圈中的种种不实消息和争夺眼球无底限的“标题党”已经成为误导公众的隐形公害。

      此外,无门槛亦无监管,导致互联网群组滥建滥用,致使误导信息在其中的流通也泥沙俱下。比如,道听途说不实信息甚或谣言,危害社会、个人安全的涉思想、教唆等有害信息……一些不实消息借助互联网群组肆无忌惮地传播;披着“互联网新经济”外衣的网络传播等网络群组也屡见不鲜,所有这些都损害着社会公共秩序和公共安全利益。

      网络治理工作重心之一是网络信息流通的安全有序与生态健康管理,唯有管好,才能让绝大多数网民用好网络,确保绝大多数网民合法正当的权益不受侵害。只有强化账号群组的创建者、组织者、运营者的监管责任,强化的是公共信息在进入社会舆论传播的自律性洁净机制,唯有从源头过滤和截留“信息杂质”,才能让互联网更积极更健康地服务社会发展。

    九眼智能过滤系统是面向复杂文本大数据的内容智能过滤系统,可实时智能识别关键词音变、形变与拆字等常见变体,并实现了语义的精准排歧,系统内置了国内更新更全的知识库,适用于多场景不文明信息内容的智能过滤发现。

    九眼智能过滤三大技术核心:智能变种、语义排歧、快速实时

      1、智能变种识别:九眼智能过滤利用美双数组TRIE树词典管理与检索方法,系统自动识别形变词、音变词、拆字、噪音、繁简体、全角半角、中间加各类干扰噪音等变体; 同时,系统支持自定义词库,增量添加百万量级词库。

      2、语义排歧:九眼智能过滤利用NLPIR语义精准分词系统与情感分析系统,精准识别与过滤,排除正面无害的信息,极大降低了误判率。

      3、快速实时:九眼智能过滤使用专利算法,快速扫描,单机速度30MB/s;支持单机多线程、多机并行、Hadoop云服务模式,对PB级信息内容实现并行高效在线核查。

  • 相关阅读:
    团体程序设计天梯赛-练习集L1-002. 打印沙漏
    WUOJ-ACM :1003: 零起点学算法78——牛牛
    ZOJ-2965
    天梯赛-L1-018. 大笨钟
    代码哲学 摒弃“够用就行”的心态
    github 源码阅读
    Biopython SeqIO 读取序列文件,读取信息,写入序列
    Biopython 模块处理Seq序列 方法
    coursera 有比较丰富的生物信息等课程 win7 访问设置
    python 正则匹配 csv文件中特殊符号如■高风险 这样的black block
  • 原文地址:https://www.cnblogs.com/ljrj/p/7543559.html
Copyright © 2011-2022 走看看