zoukankan      html  css  js  c++  java
  • mrac数据转换心得

    从一开始,听到marc这个词,到现在转换marc数据。整整花了我一个多星期。

    baidu.com google.cn里面都找不到理想的信息,但在csdn.net里面还有一篇,对我起了一点作用

    的文章。当然是我看的第一篇关于marc的文章。在后面就再也没有找到有用的资料了。

    拿着中国机读目录格式使用手册,了解marc数据的原理与结构。

    关于marc,确实让我对字符串处理得到了很大的提高,主要体现在逻辑上面。

    首先,无论做什么事,我们都要注意方法。一个好的方法能让我们事半功倍。这一点我深有感受。

    再次,要有较强的接受新事物的能力,和学习能力。

    最后,做好方案。

    cnmarc的结构

    记录头标:例如:01233oam2 2200301 450(共23位)

    0--标识块

    1--编码信息块

    2--著录信息块

    3--附注块

    4--款目连接块

    5--相关题名块

    6--主题分析块

    7--知识责任块

    8--国际使用块

    9--国内使用块

    001,0013,00000,010,0028,00028.....

    001字段 0013字段长度 000000 字符位置 010字段  0028 字符长度......

    人为的加上,之后,就可以发现地址目次区是有规则了。

    然后根据这些规则写个for循环,就可以取出字段,字段长度和字符位置了。

    大字段就这么处理,接下来就是小字段的处理了。

    我们可以根据换行符,然后轻松的区分各字段,然后再处理各小字段。

    这些是我个人的心得,不是最好的方法。

    终于把这块搞清楚了。``````希望对您有所帮助。

  • 相关阅读:
    Promise小结 ES6异步编程
    XLNet模型
    BERT模型
    Transformer模型
    注意力机制(Attention Mechanism)
    序列到序列模型(seq2seq)
    【Pandas-附件2】查询手册
    【Pandas-附件1】读取excle和csv具体函数
    【pandas-21】实践-同比和环比指标
    【pandas-20】实践(泰坦尼克沉船事件)-特征处理
  • 原文地址:https://www.cnblogs.com/fengju/p/6174125.html
Copyright © 2011-2022 走看看