zoukankan      html  css  js  c++  java
  • Azure 内容审查器之文本审查

    内容审查器

    Azure 内容审查器也是一项认知服务。它支持对文本、图形、视频进行内容审核。可以过滤出某些不健康的内容,关键词。使你的网站内容符合当地的法律法规,提供更好的用户体验。

    文本内容审核

    其中文本内容的审核应用比较广泛。比如在审核游戏中的群聊内容,过滤掉不健康关键词;在社交媒体发布的内容过滤关键词等。Azure 内容审查器支持对绝大多数语言的审核,当然也包括中文。它已经内置了中文常用关键词列表,当然也可以自定义关键词列表。下面让我们看看如何

    创建内容审查器

    在portal管理平台找到内容审查器,点击“创建”。
    0e9N4I.png
    区域选择离你最近的。
    定价层选择免费F0。

    内容审查器的免费策略为:5000事务/月,1次/s 。

    0e9tUA.png
    创建完资源后,点击资源左边菜单:密码与终结点。复制好密钥跟终结点信息后面会用到。

    使用.NET调用文本审核API

    创建控制台项目

    使用VS创建一个控制台项目。我们来简单演示下如何使用C#代码来实现文本审核。
    创建完控制台项目后,在nuget管理工具里找到:Microsoft.Azure.CognitiveServices.ContentModerator这个包安装之。
    0e9aCt.png

    编写代码进行审核

    修改main方法为以下内容:

        static void Main(string[] args)
            {
                Console.WriteLine("Hello World!");
    
                var endpoint = "https://x.cognitiveservices.azure.com/";
                var subscriptionkey = "x";
    
                var client = new ContentModeratorClient(new ApiKeyServiceClientCredentials(subscriptionkey));
                client.Endpoint = endpoint;
    
    
                var text = @"哈哈,从前有个xx,他喜欢吃山芋。他喜欢骂人xxx的,xxx什么的。";
                Console.WriteLine(text);
                var screen =
                          client.TextModeration.ScreenText(
                              "text/plain", 
                              new MemoryStream(Encoding.UTF8.GetBytes(text)),
                              "zho", 
                              true, 
                              true,
                              null,
                              true);
    
                foreach (var term in screen.Terms)
                {
                    Console.WriteLine(term.Term);
                }
    
                Console.ReadLine();
            }
    

    代码很简单。实例化一个ContentModeratorClient之后把骂人的话传进去调用ScreenText方法就会返回包含的关键词。

    注意第三个参数lang要穿 zho ,不然识别不出来。

    让我们看一下识别的结果。可以看到脏话都给识别出来了,哈哈。
    0e9YEd.png

    自定义关键词列表

    Azure已经内置了常用的关键词列表。如果想要加入自定义的关键词可以自己创建关键词列表。在调用ScreenText的时候传入列表的id就可以了。

    //自定义过滤关键词列表
    static string CreateList(ContentModeratorClient client)
            {
                Body body = new Body("blacklist", "Term list description");
                TermList list = client.ListManagementTermLists.Create("application/json", body);
                client.ListManagementTerm.AddTerm(list.Id.ToString(), "二愣子", null);
    
                return list.Id.ToString();
            }
    
     var screen =
                          client.TextModeration.ScreenText(
                              "text/plain", 
                              new MemoryStream(Encoding.UTF8.GetBytes(text)),
                              "zho", 
                              true, 
                              true,
                              listId,//自定义关键词listId
                              true);
    

    总结

    Azure 内容审查器是除了文本审核还包括图片视频内容的审核。本次简单介绍了如何使用.Net平台来实现文本内容的审核。由于Azure已经内置了大量常用关键词,也封装了SDK所以基本上可以做到开箱即用。当然了它还支持REST API方式来调用,这样就不受语言限制了。接下来还会介绍如何进行图片、视频的识别,敬请期待。

    关注我的公众号一起玩转技术

  • 相关阅读:
    送给热爱书法的朋友们
    [原创]中秋随笔 祝大家中秋快乐
    Comsenz力邀您的加盟
    夜半冻醒有感
    Comsenz力邀您的加盟
    成熟的谷子先低头
    [转载]10个经典的web2.0配色方案网站
    无法嵌入互操作类型“Microsoft.Office.Interop.Excel.ApplicationClass”
    C#获取真实IP地址及分析
    使用TRY CATCH进行SQL Server异常处理
  • 原文地址:https://www.cnblogs.com/kklldog/p/13751808.html
Copyright © 2011-2022 走看看