zoukankan      html  css  js  c++  java
  • python文本处理---计算fasta文件中不同氨基酸的数目

    #::!/usr/bin/python3
    #-*- coding:utf-8 -*-
    #计算fasta文件中各个氨基酸的含量
    
    import sys
    args=sys.argv
    
    f=open(args[1], 'r')
    fw=open('out.txt', 'w')
    
    line=f.read()
    txt=''.join(line.split('
    ')[1:])       #可以得到氨基酸序列
    
    
    #构建了各个氨基酸和含量的字典
    ##注意collections模块中Counter的用法
    from collections import Counter
    dict=Counter(txt)       #Counter直接返回字典
    
    
    #文件的write方法只能写入字符串,
    #因此要先将字典转变为字符串模式;json模块
    import json
    strdict=json.dumps(dict)
    fw.writelines(strdict)
    fw.writelines('
    ')
    fw.writelines(str(sum(dict.values())))
    fw.writelines('
    ')
    
    
    #计算指定氨基酸的百分比
    '''
    for index  in dict.keys():
        if index==args[2]:
            rate=str(dict[index]/sum(dict.values()))
            fw.writelines('
    ')
            fw.writelines(rate)
            fw.writelines('
    ')
    '''

    f.close()
    fw.close()
  • 相关阅读:
    [恢]hdu 2502
    [恢]hdu 1008
    [恢]hdu 2073
    [恢]hdu 2500
    [恢]hdu 2501
    [恢]hdu 2190
    [恢]hdu 2535
    [恢]hdu 2085
    [恢]hdu 2067
    [恢]hdu 2504
  • 原文地址:https://www.cnblogs.com/lmt921108/p/8034685.html
Copyright © 2011-2022 走看看