WikiDer > Схема пешеходного перехода

Schema crosswalk

А схема пешеходного перехода это таблица, в которой показаны эквивалентные элементы (или "поля") более чем в одном схема базы данных. Он сопоставляет элементы одной схемы с эквивалентными элементами другой схемы.

Таблицы пешеходного перехода часто используются внутри или параллельно корпоративные системы, особенно когда взаимодействуют несколько систем или когда система включает устаревшая система данные. В контексте интерфейсов они функционируют как своего рода внутренние Извлечь, преобразовать, загрузить (ETL) механизм.

Например, это метаданные пешеходный переход от Стандарты MARC к Дублинское ядро:

Поле MARCЭлемент Dublin Core
260 центов (Дата публикации, распространения и т. Д.)Дата создания
522 (Примечание по географическому охвату)Покрытие.
300 долларов США (физическое описание)Format.Extent

Пешеходные переходы показывают людям, где поместить данные из одной схемы в другую. Они часто используются библиотеками, архивами, музеями и другими учреждениями культуры для перевода данных в стандарты MARC, Dublin Core и обратно. Инициатива кодирования текста (TEI) и другие схемы метаданных. Например, предположим, что в каталоге архива есть запись в формате MARC, описывающая рукопись. Если архив делает цифровую копию этой рукописи и хочет отобразить ее в сети вместе с информацией из каталога, ему придется перевести данные из записи каталога MARC в другой формат, например Схема описания объекта метаданных который можно просмотреть на веб-странице. Поскольку поля MARC отличаются от полей MODS, необходимо принять решение о том, куда поместить данные в MODS. Этот тип «перевода» из одного формата в другой часто называется «сопоставлением метаданных» или «сопоставлением полей» и связан с «отображение данных", и "семантическое отображение".

Пешеходные переходы также имеют несколько технических возможностей. Они помогают базам данных, использующим различные схемы метаданных, обмениваться информацией. Они помогают сборщикам метаданных создавать сводные каталоги. Они позволяют поисковым системам выполнять поиск в нескольких базах данных одновременно с помощью одного запроса.

Проблемы для пешеходных переходов

Одна из самых больших проблем для пешеходных переходов заключается в том, что никакие две схемы метаданных не эквивалентны на 100%. В одной схеме может быть поле, которого нет в другой схеме, или может быть поле, разделенное на два разных поля в другой схеме; Вот почему вы часто теряете данные при преобразовании сложной схемы в более простую. Например, при отображении MARC на Simple Dublin Core вы теряете различие между типами заголовков:

Поле MARCЭлемент Dublin Core
210 Сокращенное названиезаглавие
222 Заголовок ключазаглавие
240 Унифицированный титулзаглавие
242 Перевод названиязаглавие
245 Титулзаглавие
246 Название вариантазаглавие

Simple Dublin Core имеет только один элемент «Заголовок», поэтому все различные типы заголовков в формате MARC объединяются без каких-либо дополнительных различий. Это называется сопоставлением «многие к одному». Вот почему после того, как вы перевели эти заголовки в Simple Dublin Core, вы не сможете перевести их обратно в MARC. Как только они становятся Simple Dublin Core, вы теряете информацию MARC о том, какие типы заголовков они представляют, поэтому при преобразовании из Simple Dublin Core обратно в MARC все данные в элементе «Title» сопоставляются с основным заявлением заголовка MARC 245 поле.[1]

Элемент Dublin CoreПоле MARC
заглавие245 Заголовок
заглавие245 Титул
заглавие245 Титул
заглавие245 Титул
заглавие245 Титул
заглавие245 Титул

Вот почему пешеходные переходы называются «боковыми» (односторонними) отображениями от одной схемы к другой. Для перехода от схемы A к схеме B и от схемы B к схеме A потребуются отдельные пешеходные переходы.[2]

Трудности при картировании

Другие проблемы с отображением возникают, когда:

  • В одной схеме есть один элемент, который необходимо разделить, а разные его части поместить в несколько других элементов второй схемы (сопоставление «один ко многим»).
  • Одна схема позволяет элементу повторяться более одного раза, в то время как другая позволяет этому элементу появляться только один раз с несколькими терминами в нем.
  • Схемы имеют разные форматы данных (например, Джон Доу или Доу, Джон)
  • Элемент в одной схеме индексируется, но эквивалентный элемент в другой схеме не индексируется.
  • В схемах могут использоваться разные контролируемые словари.
  • Схемы меняют свои стандарты со временем

Некоторые из этих проблем просто невозможно исправить. Как говорит Карен Койл в "Метаданные перекрестного цитирования: опыт Калифорнийского университета,"

«Чем больше у нас опыта работы с метаданными, тем яснее становится, что совершенство метаданных недостижимо, и любой, кто попытается это сделать, будет сильно разочарован. Когда метаданные пересекаются между двумя или более несвязанными источниками, будут элементы данных, которые невозможно согласовать идеальным образом. Ключом к успешному переходу к метаданным является интеллектуальная гибкость. Важно сосредоточить внимание на важных целях и быть готовым к компромиссу, чтобы достичь практического завершения проектов ».[3]

Примеры

Смотрите также

использованная литература

  1. ^ «Дублинское ядро ​​до пешеходного перехода MARC», Офис развития сетей и стандартов MARC, Библиотека Конгресса
  2. ^ Каплан, Присцилла (2003). Основы метаданных для всех библиотекарей. Чикаго: Американская библиотечная ассоциация. стр.39. ISBN 0838908470.
  3. ^ в «Метаданные на практике» Дайан И. Хиллманн и Элейн Л. Вестбрукс, редакторы, Американская библиотечная ассоциация, Чикаго, 2004, с. 91.

внешние ссылки