zoukankan      html  css  js  c++  java
  • 制作数据集(二)

    完善上一篇,使用列表制作数据集

    # encoding:utf-8
    def main():
        with open('./result.txt', 'r', encoding='utf8')as f:
            data1 = f.readlines()
            data1 = [x.strip() for x in data1 if x.strip()!='']
            l_1 = ['', 'B1']
            l_2 = ['', 'B1']
           # print(data1)
            for s in data1:
                list_1 = []
                for i in s:
                    l1 = []
                    le = len(s)
                   # s.index(i) + 1 < le - 1
                   # s.index(i) - 1 > 1
                    l1.append(i)
                    if(i == '' and s.index(i) + 1 < le - 1 and s[s.index(i) + 1] == ''):
                        list_1.append(l_1)
                        continue
                    if(i == '' and s.index(i) - 1 > 1 and s[s.index(i) - 1] == ''):
                        list_1.append(l_2)
                        continue
                    if(i == '' or i == '' or i == '' or i == '' or i == '' or i == '' or i == ''):
                        i1 = 'B1'
                        l1.append(i1)
                    else:
                        i1 = 'o'
                        l1.append(i1)
                    list_1.append(l1)
                print(list_1)
                with open('./d1.txt', 'a', encoding='utf8')as fp:
                    for item in list_1:
                        fp.write('  '.join(j for j in item)+ '
    ')
                    fp.write('
    ')
    
    if __name__ == '__main__':
        main()
                     

    解析:

    data.txt 格式:

    2.txt 最后保存格式:

     

    data1 = [x.strip() for x in data1 if x.strip()!=''] 为了解决以下问题:

     或者有空的地址

    问题:可能会有下标超出的问题,给下标一个限制即可!

    列表添加列表

  • 相关阅读:
    什么是https?
    Gojs
    GoJs 01讲解
    你真的了解WebSocket吗?
    django channels
    序列化及反序列化
    全角转半角
    Thread Culture
    设置输入法
    token的认证使用
  • 原文地址:https://www.cnblogs.com/yu121/p/13214548.html
Copyright © 2011-2022 走看看