zoukankan      html  css  js  c++  java
  • python生成textgrid文件

    textgrid文件说明

    第一行是固定的:File type = "ooTextFile"
    第二行也是固定的:Object class = "TextGrid"
    空一行
    xmin = xxxx.xxxx  # 表示开始时间
    xmax = xxxx.xxxx  # 表示结束时间
    tiers? <exists>  # 这一行固定
    size = 4     # 表示这个文件有几个item, item也叫tiers, 可以翻译为'层', 这个值是几,就表示有几个item
    item []:
        item [1]:
            class = "IntervalTier"
            name = "phone"
            xmin = 1358.8925
            xmax = 1422.5525
            intervals: size = 104
            intervals [1]:
                xmin = 1358.8925
                xmax = 1361.8925
                text = "sil"
            intervals [2]:
                xmin = 1361.8925
                xmax = 1362.0125
                text = "R"
            intervals [3]:
                ...
            intervals [104]:
                xmin = 1422.2325
                xmax = 1422.5525
                text = "sil"
        item [2]:
            class = "IntervalTier"
            name = "word"
            xmin = 1358.8925
            xmax = 1422.5525
            intervals: size = 3
            intervals [1]:
                xmin = 1358.8925
                xmax = 1361.8925
                text = "sp"
    
    

    textgrid文件中的size的值是几就表示有几个item, 每个item下面包含class, name, xmin, xmax, intervals的键值对,
    item中的size是几就表示这个item中有几个intervals, 每个intervals有xmin, xmax, text三个键值参数.
    所有item中的xmax-xmin的值是一样的

    代码生成

    #! /usr/bin/env python
    # -*- coding: utf-8 -*-#
    
    # -------------------------------------------------------------------------------
    # Name:         demo
    # Author:       yunhgu
    # Date:         2021/8/24 10:56
    # Description: 
    # -------------------------------------------------------------------------------
    import textgrid
    
    # 读取音频文件给定最大时长
    tg = textgrid.TextGrid(minTime=0, maxTime=2)
    print(tg.__dict__)
    
    tier_word = textgrid.IntervalTier(name="word", minTime=0., maxTime=2)  # 添加一层,命名为word层
    tier_phone = textgrid.IntervalTier(name="phone", minTime=0., maxTime=2)  # 添加一层,命名为phone音素层
    
    # 添加分割线
    interval = textgrid.Interval(minTime=0, maxTime=2, mark="s")
    interval2 = textgrid.Interval(minTime=1, maxTime=2, mark="asdfas")
    tier_word.addInterval(interval)
    tier_phone.addInterval(interval2)
    
    # 添加到tg对象中
    tg.tiers.append(tier_word)
    tg.tiers.append(tier_phone)
    
    print(tg.__dict__)
    # 写入保存
    tg.write("1.TextGrid")
    

    生成图片样例
    image

    问题

    一般意义上textgrid时间上是不可以有重叠部分的,textgrid,设置了严格性参数,默认为True.
    image
    因此如果允许时间上有重叠的话,可以:

    tier_text = textgrid.IntervalTier(name="文本", minTime=min_time, maxTime=max_time)
    tier_text.strict = False
    
    不论你在什么时候开始,重要的是开始之后就不要停止。 不论你在什么时候结束,重要的是结束之后就不要悔恨。
  • 相关阅读:
    Java:day4
    Java:day3
    Java:day2
    Java学习的第一天
    void指针
    const* 和 *const
    指针数组和数组指针
    c++的const
    C语言基础总结
    C、C++、java中的static区别
  • 原文地址:https://www.cnblogs.com/yunhgu/p/15179565.html
Copyright © 2011-2022 走看看