Відкрити головне меню

unimarc.org.ua β

Відмінності між версіями «Структура формату»

(3.8. Набори символів)
(3.13 Зв'язок між полями)
(Не показані 3 проміжні версії цього користувача)
Рядок 1: Рядок 1:
 
==Структура формату==
 
==Структура формату==
 +
<div class="noautonum">__TOC__</div>
  
 
==<span id="3.1">3.1. Структура==
 
==<span id="3.1">3.1. Структура==
Рядок 162: Рядок 163:
 
#    ''Деяка інформація повторюється за допомогою різних графічних наборів для подання різних варіантів складних випадків виводу даних''. В ідеальному випадку каталогізаційний запис створюється з повним дотриманням графіки оригіналу. Але це не завжди можливо. Тому агентства, які мають можливість одночасно створювати в одному каталозі транслітеровані записи та записи в графіці оригіналу, мають обирати для обміну ті з них, які доступні агентствам-отримувачам. Механізм наводиться в [[#3.10|розділі 3.10]].
 
#    ''Деяка інформація повторюється за допомогою різних графічних наборів для подання різних варіантів складних випадків виводу даних''. В ідеальному випадку каталогізаційний запис створюється з повним дотриманням графіки оригіналу. Але це не завжди можливо. Тому агентства, які мають можливість одночасно створювати в одному каталозі транслітеровані записи та записи в графіці оригіналу, мають обирати для обміну ті з них, які доступні агентствам-отримувачам. Механізм наводиться в [[#3.10|розділі 3.10]].
  
==<span id="3.10">3.10 Цифрові підполя==
+
==<span id="3.10">3.10. Цифрові підполя==
  
 
Наступні цифрові підполя визначені для використання в бібліографічному форматі:
 
Наступні цифрові підполя визначені для використання в бібліографічному форматі:
Рядок 202: Рядок 203:
 
Методи, призначені для забезпечення механізму латинізації, кирилізації, транслітерації або подання інформації засобами альтернативних графік та орфографій, розробляються агентствами з каталогізації згідно з діючими стандартами, правилами, методичними розробками тощо.
 
Методи, призначені для забезпечення механізму латинізації, кирилізації, транслітерації або подання інформації засобами альтернативних графік та орфографій, розробляються агентствами з каталогізації згідно з діючими стандартами, правилами, методичними розробками тощо.
  
==<span id="3.12">3.12 Дані, які стосуються окремого примірника==
+
==<span id="3.12">3.12. Дані, які стосуються окремого примірника==
  
 
Бібліографічний запис може містити інформацію, що стосується окремого екземпляру, в полях [[012]], [[141]], [[316]], [[317]], [[318]], [[345]], [[560]], [[600]], [[601]], [[602]], [[606]], [[607]], [[610]], [[702]], [[712]] і [[722]]. У разі необхідності вказати, до якого саме примірника ставиться окреме входження поля, може використовуватися механізм зв'язку між полями.
 
Бібліографічний запис може містити інформацію, що стосується окремого екземпляру, в полях [[012]], [[141]], [[316]], [[317]], [[318]], [[345]], [[560]], [[600]], [[601]], [[602]], [[606]], [[607]], [[610]], [[702]], [[712]] і [[722]]. У разі необхідності вказати, до якого саме примірника ставиться окреме входження поля, може використовуватися механізм зв'язку між полями.
  
==<span id="3.13">3.13 Зв'язок між полями==
+
==<span id="3.13">3.13. Зв'язок між полями==
  
 
До кожного повторюваного з метою подання альтернативних/інших графік поля обов’язково включається підполе '''$6 (Зв’язок між полями)''', а також, при потребі, підполе '''$7 (Абетка/графіка поля)'''. У цих випадках необхідно дотримуватися наступних інструкцій:
 
До кожного повторюваного з метою подання альтернативних/інших графік поля обов’язково включається підполе '''$6 (Зв’язок між полями)''', а також, при потребі, підполе '''$7 (Абетка/графіка поля)'''. У цих випадках необхідно дотримуватися наступних інструкцій:

Версія за 19:37, 12 червня 2019

Структура формату

3.1. Структура

УКРМАРК являє собою специфічну реалізацію міжнародного стандарту ISO 2709-1981, який визначає структуру записів, що містять бібліографічні дані.

Він установлює, що кожен підготовлений до обміну бібліографічний запис повинен містити:

а) Маркер запису — складається з 24 символів;

б) Довідник — складається з 3-цифрової позначки для кожного поля даних, довжини поля та позиції початкового символу, який відноситься до першого поля даних;

в) Поля даних змінної довжини — відокремлюються одне від одного роздільником полів.

Загальна структура:
Маркер запису Довідник Змінні поля Р/З
Р/З = Роздільник записів

Надалі встановлюється, що даним у полях можуть передувати індикатори і поля можуть поділятися на підполя.

а) Кожна стаття довідника складається з 3 цифрової позначки, 4 значного числа довжини поля даних і 5-значного числа, яке визначає початкову символьну позицію. Інші символи в статті довідника неприпустимі.

Довідник:
Перша стаття довідника Друга стаття Інші статті
Позна­чка Довжина поля Позиція початкового символу Р/П
Р/П = Роздільник полів

б) У кожному полі, за винятком поля 00-, даним передують два символи, які називаються індикаторами. Коли у визначенні поля зазначено, що наявність індикаторів не є обов’язковою, замість них проставляються пробіли.

в) Усі дані в полях, окрім полів з позначкою 00-, розташовуються у підполях. Кожне підполе забезпечується ідентифікатором поля IS1 7-ми-бітного кодового набору символів (ISO 646), тобто позиція 1/15, а також одним літерним або цифровим символом, який визначається в кожному полі.

Змінне (кероване) поле: (00)
Дані Р/П
Змінне поле (від 01 до 999)
Індикатори Ідентифікатори підполя Інші підполя
Інд. 1 Інд. 2 $a (тощо) Дані Дані Р/П

г) Певні позиції символів маркера, відомі як Коди застосування (позиції символів 6 9), заповнюються значеннями, які залежать від особливостей запису. Додаткові відомості про це знаходяться в описі маркера запису.

3.2. Маркер запису

ISO 2709 приписує, що кожен запис повинен починатися з 24-символьного маркера запису. Він містить дані, які стосуються структури запису, визначення котрих задаються в стандарті ISO 2709, а також деякі елементи даних, призначені ISO 2709 для особливого застосування. Ці елементи визначаються при використанні та пов’язані з типом запису, його бібліографічним рівнем і положенням в ієрархії рівнів, ступенем повноти запису й використанням правил ISBD або інших, базованих на ISBD, правил підготування запису. Елементи даних у маркері запису призначено передусім для оброблення запису та побічно для ідентифікації самих бібліографічних матеріалів.

3.3. Довідник

За маркером запису згідно з УКРМАРК та ISO 2709 розташовується довідник. Кожна його стаття складається з трьох частин. Перша — це позначка поля (3 цифри), за ним услід іде кількість символів у цьому полі (4 цифри), яке охоплює весь масив символів: індикатори, ідентифікатори підполів, текстові або кодовані дані та роздільники полів. За довжиною поля міститься позиція початкового символу поля відносно позиції першого символу частини в записі, який складається зі змінних полів (5 цифр). Перший символ першого змінного поля має символьну позицію 0. Її місцезнаходження всередині цілого запису задається позиціями символів 12 16 маркера запису.

Після того, як усі 12 символьні статті довідника приведено у відповідність до кожного поля запису, довідник закінчується роздільником полів IS2 згідно з ISO 646 (1/14 у 7 бітній кодовій таблиці). Статті довідника впорядковано за першою цифрою позначки. При впорядкуванні рекомендується, коли це можливо, використовувати позначку цілком. Безпосередньо для полів визначення порядку не є необхідним, оскільки їх положення повністю визначається довідником.

3.4. Поля даних змінної довжини

Поля даних змінної довжини розташовуються одразу після довідника. Вони містять бібліографічні дані (на відміну від маркера, який складається з даних загальної обробки).

Позначки не розташовуються в полях даних, а наводяться тільки в довіднику. Виняток становлять позначки у вбудованих полях (блок 4--). Поля з позначкою 00- (так, приміром, 001) складаються тільки з даних і роздільника поля. Інші поля складаються з двох індикаторів і розташованою після них будь-якою кількістю підполів. Кожне підполе починається з ідентифікатора підполя, що складається з роздільника підполя IS1 (1/15 згідно з ISO 646) та коду підполя (літерного чи цифрового символу), який ідентифікує підполе. Після ідентифікаторів підполя розташовуються кодовані або текстові дані довільної довжини, що не перевищує зазначену на початку опису поля. Останнім символом даних у запису є символ кінця запису IS3 (1/13 згідно з ISO 646), який розташовується після символу кінця поля IS2.

3.5. Обов’язкові поля даних

Набір обов'язкових в записі УКРМАРК-у полів відповідає списку обов'язкових полів UNIMARC.

3.5.1. Поля, обов'язкові для усіх записів

3.5.2. Поля, обов'язкові для окремих типів записів

Записи для документів, що містять текстову інформацію
Записи для картографічних матеріалів

Примітка. Зазначені поля (120, 123, 206) є обов'язковими в записах для картографічних матеріалів, якщо поз. 8 маркера містить значення #, 0, 1.

Записи для електронних ресурсів

Примітка. Зазначені поля (230, 300) є обов'язковими в записах для електронних ресурсів, якщо поз. 8 маркера містить значення #, 0, 1.

3.5.3. Обов'язкові поля і ретроспективна конверсія

У разі, якщо раніше створені записи не містять достатньої інформації для обов'язкових полів, там, де це можливо, повинно використовуватися значення за замовчуванням. Якщо використовувати значення за замовчуванням неможливо, допускається використання символу-заповнювача. В крайньому випадку поле може не включатися в запис, але цей факт повинен бути обов'язково зазначений в супровідній документації при обміні записами (див. Додаток K).

Приклад

101 |#$aund
Програма конвертації не може коректно згенерувати код мови документа на підставі наявних даних.

3.6. Довжина записів

Довжина записів УКРМАРКу обмежується 99,999 символами згідно з угодою між учасниками обміну.

3.7. Зв’язок записів

На практиці виникають ситуації, коли бажано пов’язати один бібліографічний запис з іншим. Наприклад:

1) зв’язок може створюватися між записами на документи, один з яких являє собою переклад, а другий — оригінал;
2) пов’язуються записи, створювані на різні назви одного серіального видання у разі, коли воно змінювало назву.

УКРМАРКом забезпечується створення таких зв’язків. Детальна інформація щодо нього знаходиться у спеціально з цією метою зарезервованому блоці полів 4--.

Співвіднесені поля можуть містити описову інформацію щодо іншого документа з або без інформації про окремий запис, який описує документ. Співвіднесені поля складаються з підполів, кожне з яких містить поле УКРМАРКу, які являють собою комплекс з позначки, індикаторів і вмісту полів, включаючи ідентифікатори підполів. Зазначимо, що серед них знаходяться поля, не доступні засобами довідника, оскільки лише повне поле зв’язку (а не його окремі частини), мають відповідні статті довідника. Позначка зв’язаного поля позначає зв’язок між документом, зазначеним у полі, з документом, на який створюється бібліографічний запис.

3.8. Набори символів

Для обміну даними в УКРМАРКу застосовуються стандарти ISO на набори символів. Маркер запису, довідник, індикатори, ідентифікатори полів і кодові позначення повинні кодуватися з використанням керувальних функцій та графічних символів згідно з ISO 646 (IRV), що розглядаються як набори символів, задані за умовчуванням. Техніка розширення коду, зазначена в ISO 2022, застосовується, коли в записі вимагається декілька наборів. Позиції символів 100$a/26-29 та 100$a/30-33 використовуються для зазначення наборів символів за умовчуванням і додатково застосованих у записі наборів графічних символів. Усі набори символів повинні бути зареєстровані ISO, проте допускаються випадки домовленостей між учасниками обміну.

В УКРМАРКу припустимо застосування наступних керувальних функцій, визначених ISO 646:

  1. IS1 згідно з ISO 646 (позиція 1/15 7-бітної кодової таблиці): перший символ двохсимвольного ідентифікатора підполя;
  2. IS2 згідно з ISO 646 (позиція 1/14 7-бітної кодової таблиці): роздільник поля, який знаходиться наприкінці довідника та кожного з полів;
  3. IS3 згідно з ISO 646 (позиція 1/13 7-бітноої кодової таблиці): роздільник запису, який знаходиться наприкінці кожного запису.

У разі необхідності в додаткових символьних наборах зазвичай застосовується додаткова керувальна функція ESC згідно з ISO 646. Також УКРМАРКом допускаються дві керувальні функції з ISO 6630, використовувані для сортування. Детальнішу інформацію можна отримати з Додатку J до УКРМАРКу.

3.9. Повторення даних

Повторення даних допускається в різних формах у наступних чотирьох випадках:

  1. Дані одночасно як кодовані, так і текстові, як у відображуваній, так і не у відображуваній формі. Коли це можливо, в записі можуть зустрічатися обидві форми даних, навіть якщо інформація наводиться у вихідному форматі лише раз.
  2. У документі міститься однакова інформація різними мовами. Порядок включення до створюваного на каталогізований документ запису паралельних даних (як і коли) встановлюється правилами ISBD. В УКРМАРКу він забезпечується шляхом використання різних або повторюваних підполів. Приміром, див. поле 200.
  3. При каталогізації багатомовного документа використано більш як одну мову. Використання при каталогізації декількох мов (наприклад, у полях приміток) цілком корисно, а в деяких випадках обов’язкове в національних форматах. Однак для міжнародного обміну така практика менш прийнятна, оскільки агентства-отримувачі, одержуючи багатомовні записи, часто змушені виключати інформацію, подану мовами, відмінними від своєї «робочої». Тому бажано, щоб кожний запис на УКРМАРК-івських обмінних носіях було створено однією мовою каталогізації. Для інших мов створюються окремі записи або окремі обмінні носії.
  4. Деяка інформація повторюється за допомогою різних графічних наборів для подання різних варіантів складних випадків виводу даних. В ідеальному випадку каталогізаційний запис створюється з повним дотриманням графіки оригіналу. Але це не завжди можливо. Тому агентства, які мають можливість одночасно створювати в одному каталозі транслітеровані записи та записи в графіці оригіналу, мають обирати для обміну ті з них, які доступні агентствам-отримувачам. Механізм наводиться в розділі 3.10.

3.10. Цифрові підполя

Наступні цифрові підполя визначені для використання в бібліографічному форматі:

Підполе Опис Використання у полях
$1 Дані зв'язку 4--; 576; 577, 604
$2 Системний код фінгерпрінт 012
$2 Джерело 1--; 2--
$2 Код системи 0--; 102; 283; 5--; 6--; 852
$2 Код формату 801; 886
$2 Текст посилання 856
$3 Номер авторитетного запису 4--; 500; 501; 506; 507; 576; 577; 608; 621; 6--; 7--; 5--
$4 Код відношення 6--; 7--
$5 Організація і екземпляр, до якого відноситься поле 012; 2--; 3--; 5--; 608; 621; 6--; 7--
$6 Зв'язок між полями усі блоки
$7 Графіка поля усі блоки
$8 Матеріали, до яких відноситься поле усі блоки
$9 Підполе для локального використання усі блоки

3.11. Застосування різних/альтернативних графік

Наявність різних графік у полях запису 001 099 і 200 899 зумовлюється визначниками змісту описуваних даних. Усі поля УКРМАРКу розглядатимуться як повторювані для подання даних засобами альтернативних графік незалежно від зазначення їх повторюваності в головному текстовому блоці запису. Поля, які є неповторюваними, мають використовуватися не більше одного разу для альтернативного графічного подання даних, що входять до запису.

Методи, призначені для забезпечення механізму латинізації, кирилізації, транслітерації або подання інформації засобами альтернативних графік та орфографій, розробляються агентствами з каталогізації згідно з діючими стандартами, правилами, методичними розробками тощо.

3.12. Дані, які стосуються окремого примірника

Бібліографічний запис може містити інформацію, що стосується окремого екземпляру, в полях 012, 141, 316, 317, 318, 345, 560, 600, 601, 602, 606, 607, 610, 702, 712 і 722. У разі необхідності вказати, до якого саме примірника ставиться окреме входження поля, може використовуватися механізм зв'язку між полями.

3.13. Зв'язок між полями

До кожного повторюваного з метою подання альтернативних/інших графік поля обов’язково включається підполе $6 (Зв’язок між полями), а також, при потребі, підполе $7 (Абетка/графіка поля). У цих випадках необхідно дотримуватися наступних інструкцій:

$6 Зв’язок між полями

Обов’язкове за умов використання інших/альтернативних графік
Не повторюється
Співвіднесені п/пп: $7, $3
Примітки

Підполе містить інформацію, яка дозволяє для обробки пов’язати в записі це поле з іншими. Крім того поле також містить код причини зв’язування. При використанні поля наявність двох перших елементів підполя (позиції символів 0 2) обов’язкова, третього (позиції символів 3 5) — факультативна. Таким чином довжина підполя становитиме 3 або 6 символів.

Підполе $6, як правило, розташовується в полі на першому місці, за винятком випадків, коли йому передує поле $3 (Номер авторитетного запису). Підполе $6 має розташовуватися перед будь-яким з підполів $7.

Однак, якщо представлення альтернативної графіки відрізняється від пов’язаних з ним назв, то ці паралельні дані повинні знайти відображення в авторитетному файлі. У протилежному випадку агентствами-учасниками обміну застосовуються поля внутрішньонаціонального використання.

До поля $6 заносяться наступні дані:

Назва позиції елемента даних Кількість символів Позиції символу Обов’язко­вість
Код зв’язку 1 0 +
Номер зв’язку 2 1 2 +
Позначка співвіднесеного поля 3 3 5

$6:0 Код зв’язку. Пояснення причини встановлення зв’язку між полями. Може приймати наступні значення:

a альтернативне графічне зображення / графіка
b = зв'язок, дійсний для окремого примірника
z інші причини зв’язку

$6:1-2 Номер зв’язку. Двозначний цифровий номер, що наводиться в підполі кожного з співвіднесених одне з одним полів. Його функція полягає в забезпеченні приведення у відповідність полів, які співвідносяться. Вона ніяким чином не призначена для встановлення послідовності та місцезнаходження номера. Номер зв’язку може надаватися довільно (доки номери, які присвоюються кожному з співвіднесених у пару чи групу полів, є ідентичними та відрізняються від номерів, які присвоюються іншим парам або групам усередині запису).

$6:3-5 Позначка співвіднесеного поля. УКРМАРК-івська позначка співвіднесеного поля, яка складається з трьох символів. Факультативна: коли позначки співвіднесених полів ідентичні, вони зазвичай випускаються.

$7 Абетка/графіка поля

Факультативне
Не повторюється
Співвіднесені п/пп: 100$a/34 35
Примітки

Підполе містить код абетки та/або графіки основного змісту поля. Кодові значення ті ж самі, що й у полі 100, позиції символів 34 35 Графіка назви. Це підполе здебільшого випускається у тих полях, які мають ту саму абетку/графіку, що зазначена кодом у символьних позиціях 100$a/34-35.

Це підполе повинне розташовуватися безпосередньо перед першим підполем даних (приміром, $a) поля, яке його містить. Зазвичай, воно знаходиться після підполя $6, за винятком відсутності паралельного поля, а отже, й підполя $6.

Згідно з пропозиціями ISO 2022, Секція 1, які стверджують, що „Коди символьного набору… розроблялися для використання при роботі з даними, які опрацьовуються послідовно в прямому порядку», передбачається, що символи вводяться в певній логічній послідовності.

Коли дані (арабською мовою або мовою іврит) записуються/ читаються справа наліво, після коду графіки ставиться позначка ‘/r’. Секція 1 ISO 2022 також стверджує: „Використання цих кодів у рядку даних, які оброблюються в будь-якому іншому прядку чи які включені до даних, відформатованих як для оброблення записів фіксованої довжини, може привести до небажаних наслідків або вимагатиме додаткової обробки з метою забезпечення коректності їх інтерпретації“.

Приклади (клацніть, щоб розгорнути)

Приклад 1.

100 ##$a позиции символов 34-35 = ba [латинская]
600 #0$6a01$a[Имя лица в латинизированной форме]
600 #0$6a01$7ea$a[Имя лица в китайском написании]
Два параллельных поля, содержащих латинскую и китайскую формы имени лица, деятельность которого является предметом описания определенного материала. Первое поле не имеет $7, так как значение его приводится в том же алфавите, который указан в позициях символов 34-35 поля 100, то есть "ba" (латинский).

Приклад 2.

100 ##$a позиции символов 34-35 = ka [корейская]
200 1#$6a01$a[Заглавие в символах корейской графики]
200 1#$6a01$7ba$a[Заглавие в латинизированной форме]
Два поля параллельных заглавий, содержащие версии заглавий в корейской и латинской графике. Первое поле не имеет $7, так как значение его приводится в том же алфавите, который указан в позициях символов 34-35 поля 100, то есть "ka" (корейский).

Приклад 3.

100 ##$a позиции символов 34-35 = db [японская - канджи]
701 #0$6a04$a[Имя первого соавтора, записанное в канджи]
701 #0$6a04$7dc$a[Имя первого соавтора, записанное в кана]
701 #0$6a04$7ba$a[Имя первого соавтора, записанное в латинизированной форме]
701 #0$6a08$a[Имя второго соавтора, записанное в канджи]
701 #0$6a08$7dc$a[Имя второго соавтора, записанное в кана]
701 #0$6a08$7ba$a[Имя второго соавтора, записанное в латинизированной форме]
Поля дополнительных точек доступа для отражения имен авторов в японских азбуках канджи, кана и в латинизированной форме. Поля, записанные в канджи, не содержат подполя $7, так как позиции символов 34-35 поля 100 содержат "db (японская азбука канджи).

Приклад 4.

100 ##$a позиции символов 34-35 = ca [кириллическая]
710 02$6a05791$aРоссийская национальная библиотека
791 02$6a05710$7ba$aNational Library of Russia

Приклад 5.

100 ##$a позиции символов 26-29 = 0103, позиции символов 30-31 = 05, позиции символов 34-35 = ga [греческая]
200 1#$a01/11 07/13Ελληνικά 01/11 07/14 Windows XP01/11 07/13 - ο εύκολος τρόπος 01/11 07/14
Назва грецькою мовою включає фразу англійською мовою. Вказівка графіки в підполі $7 не забезпечить необхідної інформації для обробки комбінації графіки в полі. У цьому випадку необхідно використовувати механізм, описаний в ISO 2022.
ISO 5426 (расширенный латинский набор) был определен как набор G1, ISO 5428 (греческий набор) определен как набор G2. В нужный момент набор G2 загружается в колонки 10-15 с помощью LS2R (битовая комбинация 01/11 07/13), замещая набор G1. После того, как необходимость использования греческого набора символов в поле исчезает, набор G1 по умолчанию вновь возвращается в колонки 10-15 с помощью LS1R (битовая комбинация 01/11 07/14).

* Поле має фігурувати у всіх без винятку записах

Див. також