zoukankan      html  css  js  c++  java
  • 我的nlp之路(1)

    1/8日任务

    基础篇:

    1. 如何使用远程连接从windows或者linux连到服务器进行操作(切换用户,传递文件) (严禁使用root账户)
    2. Linux基本bash命令

    a)        查看文件大小,内存大小,cpu信息,硬盘空间等等

    b)        查看目前运行程序情况,剩余内存,kill程序

    c)        运行一个程序

    d)       写一个脚本,使用上for, if等语句

    e)        sed命令, grep命令

    1. Awk练习

    a)        词、字的统计

    b)        取出某些特定的字段

    c)        改写:根据某个特定字段进行排序

    1. 程序运行实践

    a)        Stanford nlp: 分词、词性标注、句法分析; 整体跑一遍

    b)        HIT-ltp: 分词、词性标注、句法分析; 整体跑一遍

    c)        CMake使用

    d)       ZPar: 分词、词性标注、句法分析; 整体跑一遍(模型自己训练)

    e)        Berkeley parser使用 (模型自己训练)

    f)         情感分析代码跑一遍:NNContextSentiment

    g)        NNCRF跑一遍:NNSegmentation, NNPostagging, NNNameEntity

    h)        使用word2vec训练一个词向量

    1. 使用github,建立自己的github,建立自己的代码和文档仓库
    2. 查找一个你认为比较好用的开源应用软件(大众熟知的机器学习或者自然语言处理工具):例如我推荐 beyond compare, ConstTreeViewer, whatswrong
    3. 致力于研究的同学,使用latex(CTex工具包),使用yinxiang笔记
  • 相关阅读:
    POJ 1041(欧拉路)
    POJ 1904(强连通分量)Tarjan
    POJ 1486(二分图匹配)二分图的完全匹配的必须边
    POJ 1780(欧拉路)
    POJ 1386(欧拉路)
    HDU 3496(DP)
    PKU2387Til the Cows Come Home(SPFA+邻接表)
    HDU1863畅通工程(prim)
    ACM国内外OJ网站大集合
    HDU1175连连看(BFS)
  • 原文地址:https://www.cnblogs.com/ldphoebe/p/5111669.html
Copyright © 2011-2022 走看看