如何配置查重空间参数 - DigitalPlatform/dp2 GitHub Wiki

配置查重空间参数的目的,是让系统可以根据997字段来判断书目记录是否重复,从而避免重复的书目记录进入系统。


具体配置

路径:点击菜单【功能】-【系统维护】-【系统管理窗】-【内核】-【!】-【library.xml】,右击【library.xml】,选择【编辑配置文件】。在root根目录下加入unique元素

<unique>
  <space dbnames="中文图书,中文期刊,西文图书,西文期刊" />
</unique>

unique 元素定义了书目库的查重空间。它是个容器元素,其下可以包含一个或者多个 space 元素。每个 space 元素负责定义一个查重空间。

space 元素的 dbnames 属性的值为数据库名称,多个数据库名以英文逗号分隔。space 元素 dbnames 属性中指定的若干书目库,这些书目库中的记录互相都不允许重复。也就是说,一旦其中一个书目库中有了一条书目记录,其它书目库中就不允许再创建同样的书目记录。同一个书目库中的记录之间也不允许重复。重复是靠书目记录中的 997 字段来比对判断的。dp2library 在创建或者覆盖书目记录的时候,会自动根据特征字段创建一个 997 字段。

配置了查重空间参数以后,系统中原有的记录如果已具备997字段,当用户在使用过程中对这些记录进行保存时,如果系统中存在相同记录,会无法保存。用户导入与系统中相同的记录时,系统也会报告记录重复,无法导入。


书目记录997字段查重的依据,是将书目记录的题名,责任者,出版社,出版时间,版本号对应的字段放到997字段,如果两条书目的这些内容完全一致,系统判定记录重复。

在题名,责任者,出版社完全相同的前提下:

出版时间:210$d,目前只取年份进行判断(关于出版时间的国家标准,几经变更。最初是要求按照年月日标注,后来按照年,月,再后来变成按照年分标注。所以997所检查的只有年份)

如果题名,责任者,出版社完全相同的两本书确定需要建立两条书目记录,但210$d和205$a都不能区分,则可以在系统中用 998$k 进行区分 ,在998$k中加入一些文字标注,系统会将这些标注落实到997字段,从而让两条书目的997不同。从而系统判定两条记录不重复。

系统按照997查重还有一个前提:library.xml中须要配置查重空间参数。配置后同一个空间以内如果两条书目的997精确一致的话,系统就会判定两条记录重复。

⚠️ **GitHub.com Fallback** ⚠️