zoukankan      html  css  js  c++  java
  • 1.28学习日记

    1.目前还是在看MTB的代码,其中预训练的部分,有很多不明白的,地方:

    使用的预训练的数据集是cnn.txt,不知道是否是使用的QA数据集https://cs.nyu.edu/~kcho/DMQA/

    它整个的格式是这个样子的:

    分为两个部分:一个是短文,另一个是4个@highlight,强调部分的文字并不标准在短文中出现,是summary性的。

    从上述的链接中可以知道,这些附带的是问题,缺少一个单词或短语,可以从短文中找到。(也就是说也是个完形填空的类型?)

    cnn数据集中有大约9万个文档,有38万个问题。

    #不对,上面应该是理解错了,上面是story,下面才是问题question:

    下载下来就是为了看里面的格式

    那么既然有这个question文件,要story还有啥用?

    2.作者给出了预训练模型的文件

     运行时出现了以下问题:

     尝试使用:python -m spacy download en_core_web_lg 下载,但是失败:

     日,使用python3 -m spacy download en_core_web_lg,就可以下载!意思是要指定python的版本咯?但是我目前使用的conda环境就是python3的!

    4.对于所使用的spacy的包,https://github.com/explosion/spacy-models/releases//tag/en_core_web_lg-2.2.5,原来分别都是这个意思啊:

     https://github.com/explosion/spaCy/issues/2405

    这里学习spaCy例子,非常好!如果对一个内容找不到对应的教程,那么就搜索关键词+example。

     它能够获取到文本中所有的实体。

    1.30日————————————————

    1.这里类中使用这个函数是什么意思?

     https://stackoverflow.com/questions/43627405/understanding-getitem-method

    class Person:
        def __init__(self,name,age):
            self.name = name
            self.age = age
    
        def __getitem__(self,key):
            print ("Inside `__getitem__` method!")
            return getattr(self,key)
    
    p = Person("Subhayan",32)
    print (p["age"])

    也就是说在获取本类对象的属性时所调用的,可以很方便的获取到属性值,通过.就可以。

    1.31日——————————————

    1.这里MTB论文中提到的关系提取是针对一个句子中两个实体的关系

    上面的例子中,e1和e2是部分和整体的关系,嗯。

    2.安装seqeval包时遇到了这个问题

    https://blog.csdn.net/weixin_41923658/article/details/96127770

    应该是因为安装它就自动安装了最新版的tensorflow所以出现的问题。

    2.1日————————

    3.遇到了这个问题,已解决

    https://github.com/ipython/ipython/issues/10627

    就是在运行时,python文件中用matplot创建的图并不能保存到文件中。

    再次感觉遇到bug可别找百度,找谷歌啊。

  • 相关阅读:
    MySQL日志系统
    MySQL基础架构
    Java操作XML牛逼利器JDOM&DOM4J
    SAX方式解析XML
    DOM方式解析XML
    Jquery Ajax
    Jquery动画效果
    angular6新建项目
    mysql命令行使用
    git常用命令
  • 原文地址:https://www.cnblogs.com/BlueBlueSea/p/12240265.html
Copyright © 2011-2022 走看看