Відкрити головне меню

unimarc.org.ua β

Додаток A: Коди мов

Версія від 08:55, 6 жовтня 2018, створена Dubyk (обговореннявнесок) (Вступ)

Додаток А: Коди мов

Appendix A: Language Codes

Вступ

В УКРМАРК (відповідно до базового формату UNIMARC) застосовуються коди мов Альфа 3, наведені в додатку відповідно до ISO 639 2 «Codes for the representation of names of languages: alpha-3 codes)» («Коди представлення назв мов: альфа 3 коди»), який було розроблено у 1998 році Об’єднаною робочою групою Міжнародної організації з стандартизації та опубліковано TC37/SC2-TC46/SC4. ISO 639 2 містить два переліки кодів мов: бібліографічний (B), використовуваний у записах УКРМАРК, і термінологічний (T). Детальнішу інформацію можна одержати в Бібліотеці Конгресу США за адресою: http://lcweb.loc.gov/marc/iso639.html

Кодовий набір B з урахуванням декількох відхилень можна вважати ідентичним до переліку кодів мов MARC21. Саме його й було адаптовано для UNIMARC.

Незначна кількість кодів ISO 639 2 відрізняється від застосовуваних раніше кодів ISO 639. Щоб ознайомитися з внесеними до переліку змінами, варто звернутися до Бібліотеки Конгресу США за адресою: http://leweb.loc.gov/marc/isochange_ann.html

або за адресою: http://ifla.org/VI/3/ubcim.html

Характеристика переліку

Додаток А «Коди мов» складається з абеткового переліку мов, укладеного на основі покажчику кодів переліку B ISO 639-2 з використанням абеткового покажчика мов.

Наведені в переліку мнемонічні коди утворюються з англійської форми назв мов і записуються трьома малими латинськими літерами.

Включення

До переліку включено тільки ті мови, які мають писемність. У разі, коли розмовна мова записується за допомогою двох різних наборів символів (приміром, сербська та хорватська мови мають одну розмовну мову, проте перша записується кирилицею, а друга — латиницею, тому до переліку занесено коди обох мов):

Сербо-хорватська (кирилиця) [scc]
Сербо-хорватська (латиниця) [scr]
Сербська [scc] (сербо-хорватська (кирилиця))
Хорватська [scr] (сербо-хорватська (латиниця))

Мовні групи

Деякі з кодів переліку призначено для великих мовних груп. Їх уведено замість надання кодів кожній окремій малій мові. Так, приміром, полабську мову відносять до мовної групи «Слов’янські (інші)» ([sla]) і тому їй не надається власного коду:

Форма давньої або застарілої мови, яка не має унікального коду, визначатиметься кодом великої мовної групи, до якої вона належить, а не кодом сучасної форми цієї мови. Наприклад, давньоукраїнська мова (мертва мова) визначатиметься кодом мовної групи слов’янських мов ([sla]), а не кодом сучасної української мови ([ukr]).

Критерій призначення дискретних кодів

Зазвичай використовуються тризначні літерні мнемонічні коди, утворені з перших початкових літер англійської форми назви мови. Винятком є випадки, коли назви кількох мов мають однакові початкові літери. Приміром,

малагасійська (Malagasy) [mlg]
малайська (Malay) [may]
малаяламська (Malayalam) [mal]
мальтійська (Maltese) [mit]

Для визначення сучасних і застарілих форм деяких мов при утворенні коду використовувалися початкові літери кожного з слів з найменування мови. Наприклад:

середньоверхньонімецька (German (Middle High) (1050-1500)) [gmh]
давньоверхньонімецька (German (Old High) (750-1050)) [goh]

У разі, коли багатомовному документу необхідно присвоїти єдиний код без надання переваги мові будь-якого з його фрагментів, прийнято використовувати код [mul]. Коли мову документу не визначено, застосовується код [und].

Доповнення і виправлення

У Додатку А коди, які вийшли з ужитку, позначені в круглих дужках знаком мінус, а нові — знаком плюс. Наприклад,

[epo](+) Есперанто (Esperanto)
[esp]( ) Есперанто (Esperanto)

Див. також