zoukankan      html  css  js  c++  java
  • 【python】使用jieba分词并导出txt

     主要步骤:

    1.读取文件

    2.jieba分词

    3.写入文件

    完整代码如下:

    import jieba
    fR = open('gp.txt', 'r', encoding='UTF-8') //读取文件
    sent = fR.read()
    sent_list = jieba.cut(sent) //使用jieba进行分词
    fW = open('gp2.txt', 'w', encoding='UTF-8') //写入文件
    fW.write(' '.join(sent_list))
    fR.close()
    fW.close()

    分词后结果:

    华龙 证券 新华路 营业部 总经理 邓丹 在 接受 记者 采访 时 指出 : “ 周二 尾市 收于 2900 点 之上 , 使得 短期 虽然 积累 了 下跌 的 压力 , 但是 仍然 不大可能 深幅 调整 , 更 多 地 是 盘中 洗盘 后 继续 向上 。 就 后市 来讲 , ‘ 领先 指标 ’ 上证 50 收复 了 年线 大关 , 最高 距离 回 补缺 口 只有 17 个点 , 若能 补缺 , 对 上证指数 也 有 正面 的 影响 。 而 单独 就 上证指数 来讲 , 后面 需要 关注 的 压力 位 , 一个 是 运行 到 2924 点 的 500 天线 , 其次 是 前期 提到 的 2934 点 , 然后 是 2955 点 缺口 上 沿 , 最终 要 注意 120 周线 在 2970 点 附近 的 重压 区 。 总之 , 连续 收阳尚 不能 等同于 牛市 , 不过 上证指数 短期 形势 依然 不差 , 只是 震荡 会 逐渐 加剧 , 涨速 将 慢慢 放缓 。 投资者 在 操作 上 , 关注 底部 躁动 的 资源 类 蓝筹股 和 重启 升势 且 完成 回 踩 的 二线 消费 股 。 ” 

  • 相关阅读:
    千年决心
    编译器及其命令行模式杂谈
    How Microsoft Lost the API War
    再看计算机本科该如何学习
    C++杂记(一)
    C++杂记
    Java IO 学习心得
    VMDq (Virtual Machine Device Queue) in OpenSolaris
    WCHAR and wchar_t 的区别 (zz)
    error C3225: generic type argument for 'T' cannot be 'System::Collections::Generic::KeyValuePair ^',
  • 原文地址:https://www.cnblogs.com/helenlee01/p/12617492.html
Copyright © 2011-2022 走看看