Організація пошуку правової інформації в Інтернет

логічного оператора «AND» (від англ. «та») або символу «+». За статистикою, українські користувачі вводять у запиті в середньому 2,5 слова, а закордонні — 1,5 слова. На запит з одним словом система видасть більшу кількість посилань, але при збільшенні слів результати будуть точнішими. Бажано визначити для кожного слова із запиту можливі синоніми, еквівалентні терміни, інші варіанти написання. Синоніми можна вказати у цьому ж запиті через оператор «OR» (від англ. «або») або використати в наступному запиті, якщо перший не приніс бажаних результатів. Деякі системи дають змогу вказати сукупність еквівалентних термінів за допомогою дужок, наприклад (french francaise). Слід також ураховувати існування різних словоформ (наприклад, різних закінчень), якщо така можливість надається системою. Наприклад, вираз правове може охоплювати слова «правовий», «правове», «правова» та ін. Деякі системи роблять це автоматично.

База індексів пошукової системи — поле конкурентної боротьби

Власники (автори) Web-серверів зацікавлені в тому, щоб їх URL-адреси були відомі пошуковим системам, оскільки це прямий шлях до кінцевих користувачів. Крім звичайних прийомів при цьому застосовуються і нетрадиційні. Так, служби Lycos та AltaVista повідомили про зафіксовані спроби реєстрації вузлів з неправильними адресами і спроби видалення адрес з бази індексів, можливо, з метою нанесення шкоди конкурентам. Деякі розробники намагаються ввести в оману роботів пошукових систем за допомогою «приманок» — до Web-сторінки включаються популярні ключові слова, набрані невидимим шрифтом (таким, що збігається за кольором із фоном). Це може призвести до неправильного оцінювання релевантності сторінки.

Формулюючи запит, слід передбачати, які нерелевантні докумен­ти можуть бути видані у відповідь на запит з такими словами або фразами

Крім омонімії в одній мові, можуть траплятись слова-омоніми, що належать різним мовам. Наприклад, спільними для української та російської мов є слова «лист», «приклад», «стан» та ін. За можливістю слід вказувати мову документів, що розшукуються.

Варто також зважати, що деякі пошукові системи ігнорують так звані «стоп-слова» — прийменники, частки, сполучники і т.  ін. , а деякі їх враховують. Виключити з пошукового запиту певні слова можна за допомогою оператора «NOT» (від англ. «не») або символу «-». Наприклад, запит малі підприємства -кооперативи означає, що зі списку знайдених ресурсів будуть виключені ті, в яких трапляється слово «кооперативи».

Після завершення обробки запиту система видає список посилань на Web-сторінки та інші елементи інформаційних ресурсів Інтернет. Деякі системи пропонують виконати повторний пошук «серед знайденого», що корисно в разі великої кількості виданих елементів. Перегляд та остаточне оцінювання знайдених результатів користувач має виконувати вручну.

Якщо система не знайшла документи, що відповідають указаному запиту, рекомендується вибрати ширший термін для пошуку. Наприклад, під час пошуку деякого закону США рекомендується спочатку знайти сервери з американським законодавством. Якщо пошук проводився за словосполученням, можна поослабити умови, виключивши із запиту одне або кілька слів.

Слід також пам’ятати, що в Інтернет існують ресурси, не охоп­лені пошуковими системами та пошуковими каталогами — так званий «невидимий Web». «Невидимий Web» можна розбити на дві частини:

  • ·вміст спеціалізованих баз даних, які не зберігаються у вигляді певних Web-сторінок, а динамічно формуються спеціально у відповідь на конкретний запит до цієї бази;
  • ·сторінки, які виключають з
1 2 3 4 5 6 7 8

Схожі роботи

Реферати

Курсові

Дипломні