zoukankan      html  css  js  c++  java
  • python langid实现语种识别

    2017-04-26

    语料数据入库时有个小需求,需要用一个字段存储语料的语种,偶然发现langid可以实现这一功能,再次感叹python的好用!

    #coding=utf-8
    import langid                             #引入langid模块 
    
    s1 = '你好'
    s2 = 'hello'
    s3 = 'Flüssigkeiten zum Nassbehandeln von Wäschestücken werden vielfach mit Dampf aufgeheizt. Dazu wird der Dampf mit hoher Geschwindigkeit durch eine Düse (30) der aufzuheizenden Flüssigkeit direkt zugeführt. Aufgrund der hohen Geschwindigkeit, mit der der Dampf in die aufgeheizte Flüssigkeit einströmt, entstehen starke Geräusche sowie Schwingungen und Vibrationen. Um mindestens die Geräusche zu reduzieren, ist es bereits bekannt, zusätzlich Druckluft zuzuführen. Das verschlechtert den Wärmeübergang. Die Erfindung sieht es vor, in die Düse (30) eine kleine Menge der aufzuheizenden Flüssigkeit einzusaugen und dadurch in der Düse (30) ein Kondensat-Dampfgemisch zu bilden. Alternativ oder zusätzlich kann hinter der Düse (30) ein Strömungsteiler vorgesehen sein, der die Strömungsgeschwindigkeit des Dampfs bzw. Dampf-Kondensatgemisches erhöht. Hierdurch und/oder durch die Bildung eines Dampf-Kondensatgemisches in der Düse (30) werden die Geräuschentwicklung beim Einleiten des Dampfs in die aufzuheizende Flüssigkeit sowie Schwingungen und Vibrationen ohne die Zufuhr von Druckluft verringert'
    
    i = langid.classify(s1)
    j = langid.classify(s2)
    m = langid.classify(s3)
    
    print m, m[0], type(m)
  • 相关阅读:
    简单实现缓存需求
    Visual Studio 项目模板、文件模板、代码段和环境设置
    Memcached 基础应用
    Visual Studio 2010 模型设计工具 基本应用
    委托和事件 委托
    C# 编码规范
    锂电池正确使用方法
    HTC W800(XV6750) USB 连接 Windows 7 设备错误 解决办法
    UML 面向对象分析与设计
    注册表项写入与删除简便方法
  • 原文地址:https://www.cnblogs.com/zhangtianyuan/p/6872926.html
Copyright © 2011-2022 走看看