惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
I
InfoQ
宝玉的分享
宝玉的分享
Blog — PlanetScale
Blog — PlanetScale
博客园 - 司徒正美
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
P
Privacy International News Feed
T
Threatpost
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
V
Vulnerabilities – Threatpost
NISL@THU
NISL@THU
aimingoo的专栏
aimingoo的专栏
S
Schneier on Security
C
Cisco Blogs
T
The Blog of Author Tim Ferriss
Simon Willison's Weblog
Simon Willison's Weblog
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
Jina AI
Jina AI
雷峰网
雷峰网
Know Your Adversary
Know Your Adversary
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
I
Intezer
博客园 - Franky
博客园 - 【当耐特】
Hugging Face - Blog
Hugging Face - Blog
The Hacker News
The Hacker News
K
Kaspersky official blog
D
Darknet – Hacking Tools, Hacker News & Cyber Security
T
Tailwind CSS Blog
Project Zero
Project Zero
T
Tor Project blog
B
Blog RSS Feed
Recorded Future
Recorded Future
Scott Helme
Scott Helme
美团技术团队
V
V2EX
V
Visual Studio Blog
L
Lohrmann on Cybersecurity
P
Proofpoint News Feed
D
DataBreaches.Net
The Register - Security
The Register - Security
M
MIT News - Artificial intelligence
L
LangChain Blog
Cisco Talos Blog
Cisco Talos Blog
博客园 - 三生石上(FineUI控件)
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
C
Cyber Attacks, Cyber Crime and Cyber Security
博客园_首页
P
Privacy & Cybersecurity Law Blog

博客园 - fisherman

学习写第一个SQL server触发器 操纵自如--页面内的配合与通信 一些DIV+CSS 命名规范 asp.net 2.0中生成RSS 避免重复提交 - fisherman - 博客园 button 删除确认 - fisherman - 博客园 用相对定位和负向移动完成图片象框阴影 负边距居中法(水平居中、垂直居中) - fisherman - 博客园 CSS 代码格式化工具 - fisherman - 博客园 JS代码的格式化和压缩 - fisherman - 博客园 把SQL SERVER里表里的数据导出成为insert into 脚本 对FckEditor编辑器在MAXTHON浏览器下选择服务器文件对话框显示不正常的改进 下载网页中远程图片的方法 关于ISO2709数据的格式说明 C#写的读取ISO2709格式数据的DLL 数据库打开 使用 Engine 对象创建 SQL Server Compact Edition 数据库 用SharpZipLib压缩和解压缩文件 Access数据库压缩和修复
读取marc数据
fisherman · 2007-07-04 · via 博客园 - fisherman

首先要说的,无论是什么读或写marc数据,都必须吃透marc的数据格式。如果是cnmarc的格式,强烈建议参考《中国机读目录格式使用手册》,对格式的讲解很详细,保证事半功倍,根本不用看我在这里罗嗦。

读取,就分2步,一读,一取。

读:marc文件是.iso格式的文本,每一条记录都是分行的,有一个结束符chr(29)。所以可以一行一行的读取。

取:先获取记录头标区和地址目次区的信息,然后根据地址目次区的位置地址去切割。这里有字段分隔符chr(30),子字段标识符chr(31)

还是给个事例:

$--------chr(31)

@--------chr(30)

%--------chr(29)

#--------space

上边是为学习方便人为的替代符号

这是一条marc数据:

1.头标区:01071nam0#2200277###450#

固定24位,注意空格不能少哦。。

01071:记录总长,5位

nam0:如果是丛书(有225字段),就是oam2,当然每一位都有具体的意思。还有其他变化。这是常用的。

22:一般是22了,具体的意思也可以查书。

00277:数据字段区以前的字符总长度,5位。

450:一般是,具体一看书吧。

2.地址目次区,人为加了”;””,”区分。

001,0013,00000;005,0017,00013;…………………………801,0022,00771@

001,0013,00000 :表示字段0013位),字符长度00134位),在数据字段区开始的位置000005位)

801,0022,00771 :表示字段801,字符长度0022,在数据字段区开始的位置:00771

这里是读取的一个重要的地方了,知道了这几个数据,很容易分割出来。每个都是固定长度的。

3.数据字段区

012001022343@20020928000000.0@##$a7-80142-191-4$dCNY46.00@…………………………………………@%

字段间就是@分隔的,子字段用的$