Marc读取 - 走看看

zoukankan html css js c++ java

Marc读取

首先要说的，无论是什么读或写marc数据，都必须吃透marc的数据格式。如果是cnmarc的格式，强烈建议参考《中国机读目录格式使用手册》，对格式的讲解很详细，保证事半功倍，根本不用看我在这里罗嗦。

读取，就分2步，一读，一取。

读：marc文件是.iso格式的文本，每一条记录都是分行的，有一个结束符chr(29)。所以可以一行一行的读取。

取：先获取记录头标区和地址目次区的信息，然后根据地址目次区的位置地址去切割。这里有字段分隔符chr(30),子字段标识符chr(31)

还是给个事例：

$--------chr(31)

@--------chr(30)

%--------chr(29)

#--------space

上边是为学习方便人为的替代符号

这是一条marc数据:

1.头标区：01071nam0#2200277###450#

固定24位,注意空格不能少哦。。

01071：记录总长，5位

nam0：如果是丛书（有225字段）,就是oam2，当然每一位都有具体的意思。还有其他变化。这是常用的。

22：一般是22了，具体的意思也可以查书。

00277：数据字段区以前的字符总长度，5位。

450:一般是，具体一看书吧。

2.地址目次区，人为加了”;”和”,”区分。

001,0013,00000;005,0017,00013;…………………………801,0022,00771@

001,0013,00000 :表示字段001（3位），字符长度0013（4位）,在数据字段区开始的位置00000（5位）

801,0022,00771 :表示字段801，字符长度0022,在数据字段区开始的位置:00771

这里是读取的一个重要的地方了，知道了这几个数据，很容易分割出来。每个都是固定长度的。

3.数据字段区

012001022343@20020928000000.0@##$a7-80142-191-4$dCNY46.00@…………………………………………@%

字段间就是@分隔的，子字段用的$。

@##$，这里##就是指示符位置了。如101字段有指示符012,所以 @012$

查看全文

相关阅读:
消息中间件——RabbitMQ（一）Windows/Linux环境搭建（完整版）
数据结构与算法（一）：带你了解时间复杂度和空间复杂度到底是什么？
作为一技术人员，面试前都需要做哪些准备？
消息中间件——RocketMQ（一）环境搭建（完整版）
从“数学归纳法”到理解“递归算法”！
深入浅出了解“装箱与拆箱”
PMP备考指南之第二章：项目运作环境
 PMP备考指南之第一章：引论
 PMP备考指南之相关事项介绍
 7月新的开始

原文地址：https://www.cnblogs.com/twilight/p/1330344.html