textgrid文件说明
第一行是固定的:File type = "ooTextFile"
第二行也是固定的:Object class = "TextGrid"
空一行
xmin = xxxx.xxxx # 表示开始时间
xmax = xxxx.xxxx # 表示结束时间
tiers? <exists> # 这一行固定
size = 4 # 表示这个文件有几个item, item也叫tiers, 可以翻译为'层', 这个值是几,就表示有几个item
item []:
item [1]:
class = "IntervalTier"
name = "phone"
xmin = 1358.8925
xmax = 1422.5525
intervals: size = 104
intervals [1]:
xmin = 1358.8925
xmax = 1361.8925
text = "sil"
intervals [2]:
xmin = 1361.8925
xmax = 1362.0125
text = "R"
intervals [3]:
...
intervals [104]:
xmin = 1422.2325
xmax = 1422.5525
text = "sil"
item [2]:
class = "IntervalTier"
name = "word"
xmin = 1358.8925
xmax = 1422.5525
intervals: size = 3
intervals [1]:
xmin = 1358.8925
xmax = 1361.8925
text = "sp"
textgrid文件中的size的值是几就表示有几个item, 每个item下面包含class, name, xmin, xmax, intervals的键值对,
item中的size是几就表示这个item中有几个intervals, 每个intervals有xmin, xmax, text三个键值参数.
所有item中的xmax-xmin的值是一样的
代码生成
#! /usr/bin/env python
# -*- coding: utf-8 -*-#
# -------------------------------------------------------------------------------
# Name: demo
# Author: yunhgu
# Date: 2021/8/24 10:56
# Description:
# -------------------------------------------------------------------------------
import textgrid
# 读取音频文件给定最大时长
tg = textgrid.TextGrid(minTime=0, maxTime=2)
print(tg.__dict__)
tier_word = textgrid.IntervalTier(name="word", minTime=0., maxTime=2) # 添加一层,命名为word层
tier_phone = textgrid.IntervalTier(name="phone", minTime=0., maxTime=2) # 添加一层,命名为phone音素层
# 添加分割线
interval = textgrid.Interval(minTime=0, maxTime=2, mark="s")
interval2 = textgrid.Interval(minTime=1, maxTime=2, mark="asdfas")
tier_word.addInterval(interval)
tier_phone.addInterval(interval2)
# 添加到tg对象中
tg.tiers.append(tier_word)
tg.tiers.append(tier_phone)
print(tg.__dict__)
# 写入保存
tg.write("1.TextGrid")
生成图片样例
问题
一般意义上textgrid时间上是不可以有重叠部分的,textgrid,设置了严格性参数,默认为True.
因此如果允许时间上有重叠的话,可以:
tier_text = textgrid.IntervalTier(name="文本", minTime=min_time, maxTime=max_time)
tier_text.strict = False