Лингвистические информационные системы

умови) комунікації, у цьому випадку – загальний фон знань комунікантів.

Знання бібліографічного характеру, як це прийнято в більшості систем, задаються машині у вигляді згаданого передмашинного формату. Так звані "енциклопедичні" знання про структуру предметних сфер фіксуються в спеціальній базі даних ЕК, умовно званій "базою знань", що має вигляд словника-тезауруса або класифікації.

Як правило, в бібліотеках використовуються також такі допоміжні картотеки, або довідники, як "Картотека різночитань іноземних прізвищ", "Найменування організацій" (перейменування організацій, варіанти найменувань, абревіатури) і т. п. Їх введення до електронного каталогу у формі нормативних записів означає формування цілої низки довідкових баз даних як додаткової пресупозиціональної умови успішного спілкування читача з ЕК. Дійсно, фіксація допустимих способів вираження одного і того самого поняття дає читачеві та ЕК шляхом звертання того або іншого з них до довідкових баз даних забезпечити однозначність вираження і сприйняття значення в діалозі. Таку ж саму роль узгодження лексики спілкування із системою виконують переліки допустимих значень окремих елементів БЗ. Слушні приклади – переліки кодів назв країн, видів носіїв, кодів мов і т. д. Тут необхідність взаємодії бібліотек є безперечною.

Щодо підготовки форматів, співпраця бібліотек в Україні і між бібліотеками різних країн є досить розвиненою. Прикладами можуть служити міжнародні конференції та семінари з форматів UNIMARC і USMARC, робочі групи з підготовки комунікативних форматів для бібліографічних і нормативних (авторитетних) записів на основі UNIMARC-форматів для відповідних записів.

Зараз, відповідно до спеціальної угоди, РДБ України (Республіканська державна бібліотека) бере участь у спільних дослідженнях з фахівцями Бібліотеки Конгресу США, Національної бібліотеки Канади і Британської бібліотеки, спрямованих на зближення форматів з метою створення єдиного формату представлення елементів бібліографічних записів для вказаних бібліотек

Що стосується забезпечення "взаєморозуміння" між читачем і ЕК на основі "баз знань", то, наприклад, РДБ пропонує використати формалізовану і модернізовану Бібліотечно-бібліографічну класифікацію (ББК) у машиночитаємому вигляді з предметним входом до неї.

Користувач ЕК уводить гіпотетичний набір понять, висловлених звичайною мовою як пошуковий аргумент. Програмне забезпечення демонструє при виведенні на екран варіанти найменувань ділень класифікації, пов'язаних з цими словами, і показує семантичні відносини між найменуваннями. Потім користувач вибирає потрібну тему (предмет), і система показує на екрані бібліографічні записи. При цьому індекси він може не використовувати.

Цю відповідність між предметами (поняттями, термінами) і найменуваннями ми називаємо "предметним входом, або доступом" в ЕК або класифікації. Предметний доступ може служити засобом з'єднання лексичних одиниць різних природних мов з діленнями різних класифікацій і дескрипторів різних тезаурусів. Користувач зможе побачити найменування ділень з різних класифікацій, пов'язаних з пошуковим аргументом.

Як проект майбутнього, можна уявити собі банк даних, що утримує багатомовний словник слів і словосполучень, які пов'язані з нормативними/авторитетними записами для різних класифікацій і тезаурусів. Використання такого масиву даних корисне при пошуку в чужих базах даних. Бібліотеки не залежатимуть при цьому від відмінностей у мові, типів класифікації власного ЕК і придбаної бази даних або бази даних на чужому комп'ютері. Такий проект може сприяти організації тематичного пошуку в Internet.

Невеликим експериментом у даному напрямі можна вважати випуск у 1995 р. декількома організаціями загального CD-ROM "Класифікаційні системи".

1 2 3 4

Похожие работы