zoukankan html css js c++ java

Python逐行读取txt文本，按符合分割词并逐行写入txt



背景Background:

我的txt文件里面存放的是搜索词，由于原始的query（搜索词）都是用/或者、来分割词，而我要达到的是每个词语是单独的一行，并且写入txt


第一步：按行读取txt文件

s = []
f  = open('querylist.txt','r') #由于我使用的pycharm已经设置完了路径，因此我直接写了文件名
for lines in f:
    # query_list.append(line.replace('/','').replace('、','').replace(' ','').strip('
'))
    ls = lines.strip('
').replace(' ','').replace('、','/').replace('?','').split('/')
    for i in ls:
        s.append(i)
f.close()
print(s)

第二步：逐行写入txt
把我们列表中s的每一个元素写入tet，一个元素为一行，方法有很多，我这里只列举一种
（提前在你的文件路径中建立好一个空的txt:query_result）

f1 = open('query_result.txt','w')
for j in s:
    f1.write(j+'
')
f1.close()

　　大功告成，最后我输出的结果是：

其他：分类汇总的反向操作

完整版：为每一个资源号ID下的query配置对应资源号
我现在有两个变量：资源ID 和对应的检索词，每个ID对应多个检索词，每个ID和对应的检索词成为一行，具体结构如下：
我希望能够实现：1）把每行的多个检索词分开成一个个的单词，每个单词占一行
                2）每个检索词前面对应各自的ID
为了做这个，我做了一个实验：

# # d = {'37186':'高能少年团,高能王俊凯','37192':'世界杯'}
# cc = [['高能少年团','高能王俊凯'],['shijiebei','世界杯c罗']]
# nn = ['37186','37192']
# for i in range(0,2):
#     for j in cc[i]:
#         print(j+nn[i])

#step1:读取资源号ID
q_id = []
f2 = open('id.txt','r')
for lines in f2:
    q_id.append(lines.strip('
'))
f2.close()
# print(q_id)
# print(len(q_id))

#step2：读取检索词（参照上两步）

s = []
f  = open('querylist.txt','r') #由于我使用的pycharm已经设置完了路径，因此我直接写了文件名
for lines in f:
    # query_list.append(line.replace('/','').replace('、','').replace(' ','').strip('
'))
    ls = lines.strip('
').replace(' ','').replace('、','/').replace('?','').split('/')
    for q in ls:
        if q == '':
            ls.remove('')
    s.append(ls) #这一步和上一步不同，是为了每一行的检索词单独成为一个列表中的小列表，后面才能实现对应到自己的资源号
f.close()
# print(s)
# print(len(s)) #要保证两个列表的长度相等，这里都是51个
if len(s) == len(q_id):
    print('长度相等')
#step3：对应ID和检索词,把这个结果写入空的txt：
dy = open('duiying.txt','w')

for i in range(0,52):
    for j in s[i]:
        print(q_id[i]+j)
        dy.write(q_id[i]+j+'
')
dy.close()

　大功告成：结果如图所示：

之后copy到excel里，使用分割功能分割一下就好啦~~~~~~开熏

查看全文

相关阅读:
Temporal Action Detection with Structured Segment Networks (ssn)【转】
ubuntu多版本cuda并存与切换【两个博客链接】
TURN TAP: Temporal Unit Regression Network for Temporal Action Proposals（ICCV2017）
CTAP: Complementary Temporal Action Proposal Generation (ECCV2018)
很实用的HTML5+CSS3注册登录窗体切换效果
 基于js的网页换肤（不需要刷新整个页面，只需替换css文件）
CSS重置 reset.css
CSS3制作分步注册表单
 CSS3 3D立体柜子实现
 创建 CSS3 下拉菜单

原文地址：https://www.cnblogs.com/candy3026/p/9360532.html