Современных методов автоматизации процессов обработки информации

На етапі аналізу баз даних здійснюється формування різноманітних вихідних файлів відповідно до індивідуальних запитів замовників інформації.

Методи автоматизованої обробки інформації базуються на можливості виявлення в тексті первинного документа фрагментів, що містять заздалегідь заявлені змістові аспекти, і на формуванні з них рефератів-екстрактів. Фрагменти тексту первинного документа вибирають за формальними ознаками, а саме за частотою вживання слів, обраних як змістові критерії. На жаль, такий підхід не завжди гарантує відбір з тексту найважливіших відомостей. Щоб відрізнити автоматичну обробку інформації від інтелектуальної процес автоматизованого реферування називають квазіреферуванням.

Автоматизація обробки інформації здійснюється за двома напрямами:

  • екстрагування із першоджерел найбільш інформативних фрагментів тексту та формування на їх основі рефератів або анотацій (автоматичне екстрагування);
  • виявлення в текстах найбільш інформативних фрагментів з наступним синтезуванням із них нових реферативних текстів. [8]

На початку 80-х років було запропоновано методику формалізованого реферування з використанням маркерів для текстів з електроніки. За цією методикою процес автоматичного реферування зведено до двох основних операцій: власне екстрагування, тобто розпізнання в тексті первинного документа маркірованих речень і подача їх на друкарський пристрій; постредагування, під час якого усувають логічні й змістові повтори, зайві звороти, а також включають необхідні змістові зв'язки між фразами. Позитивною рисою цієї методики вважають можливість робити постредагування не лише для фахівців певної галузі знання, а й для інших осіб, що володіють навичками реферування. Важливо також, що така методика при певному доопрацюванні дає змогу користувачу самостійно визначати потрібні йому аспекти змісту, здійснюючи так зване індивідуальне реферування, та за потреби одержувати відповідні реферативні огляди первинних документів.

Питання автоматизації семантичних процесів розглянуто і на сторінках українських фахових видань. Серед них заслуговують на увагу дослідження вчених харківської школи: І. В. Замаруєвої, присвячені вирішенню завдань автоматизації аналітико-синтетичної переробки інформації; Н. В. Шаронової, Н. Ф. Хайрової, які висвітлюють питання створення систем автоматизованого реферування, систем автоматизованої переробки іншомовних текстів з метою екстрагування змісту вхідного іншомовного тексту та його представлення засобами вихідної мови. [8]

Характерною рисою методів реферування є те, що вони націлені на виявлення й відбиття у вторинному документі основного змісту первинного документа. Якщо в процесі ручного реферування виявлення основного змісту первинного документа відбувається багато в чому інтуїтивно, то в рамках автоматичного реферування під основним змістом звичайно розуміються пропозиції, виділювані й що витягають (екстраговані) на основі зафіксованих у словниках лексико-граматичних ознак. Таким чином, методика автоматичного реферування включає три основних етапи: 1) складання словника; 2) перегляд тексту оригіналу й виявлення пропозицій, що містять лексико-граматичні одиниці, зазначені в словнику; 3) екстрагування виявлених пропозицій і складання тексту реферату. [18]

Залежно від структури словника можна виділити два підходи до автоматизованого реферування: реферування на основі словників нетематичної лексики й реферування на основі словників тематичної лексики. Прикладом першого підходу є методика маркерного реферування, розроблена Д. Г

Лахуті, В. П. Леоновим, Д. І. Блюменау й іншими дослідниками. Даний вид реферування здійснюється на основах словника маркерів, індикаторів і коннекторов. Під маркерами розуміються слова й словосполучення, що однозначно виражають той або інший аспект тексту первинного документа. Індикатори, на відміну від маркерів, не пов'язані з яким-небудь аспектом тексту, а вказують пропозиції, яким автор надає особливого значення, наприклад, варто підкреслити, необхідно відзначити, отже. Коннектори служать для виділення пропозицій, так чи інакше пов'язаних з маркірованими, до них ставляться: а) вказівні й особисті займенники, слова-заступники; б) слова й вираження, що говорять про те, що пропозиція в яке вони входять, уточнює, конкретизує зміст маркірованої пропозиції, наприклад, при цьому, зокрема, наприклад, у тому числі, що випливає. Екстрагування проводиться з використанням словника маркерів й індикаторів (словесних кліше) і включає наступні етапи: перегляд тексту первинного документа й виписування пропозицій, що містять маркери. Пропозиції з індикаторами виписуються тільки в тому випадку, якщо референт уважає, що одних маркірованих недостатньо; при наявності коннекторов першого типу робиться крок назад і виписується попередня пропозиція; при наявності коннекторов другого типу робиться крок уперед і виписується наступна пропозиція. [18]

Маркерне реферування може застосовуватися тільки стосовно наукових текстів великого обсягу, у яких можна виділити відповідні аспекти (науковим статтям і монографіям). Достоїнством цього виду реферування є те, що воно може проводитися безвідносно до предметної області первинного документа. [18]

Прикладом другого підходу до реферування може служити функціональне реферування, основні ідеї якого були розроблені X. Луном й Е. Ф. Скороходько. Цей вид реферування заснований на припущенні, що найбільш значима інформація в першоджерелі втримується в окремих пропозиціях, які мають більшу функціональну вагу в порівнянні з іншими пропозиціями. Функціональна вага пропозиції розглядається як кількість зв'язків між даною пропозицією й іншими пропозиціями даного тексту. Кожен зв'язок - це повторення іменника, дієслова, причастя, прикметника, або прислівника, що належить до даної предметної області. У процесі реферування на основі словника тематичної лексики підраховується функціональна вага пропозицій у первинному тексті й пропозиції з більшою функціональною вагою включаються в текст реферату.

Функціональне реферування, на відміну від маркерного, може застосовуватися тільки стосовно текстів певної, досить вузької, предметної області. Достоїнством функціонального реферування є те, що воно застосовно не тільки до наукових, але й до газетних текстів різного обсягу. [18]

Загальними недоліками обох підходів до автоматичного реферування є складність складання словників і незв'язність одержуваних текстів рефератів. [18]

1 2 3 4 5 6 7 8 9 10 11 12

Похожие работы