Штучні нейронні мережі

Розчаровані дослідники залишили поле досліджень ради більш обіцяючих областей, а уряди перерозподілили свої субсидії, і штучні нейронні мережі були забуті майже на два десятиліття. Проте, декілька найбільш наполегливих вчених, таких як Кохонен, Гроссберг, Андерсон продовжили дослідження. Разом з поганим фінансуванням і недостатньою оцінкою ряд дослідників випробовував утруднення з публікаціями. Тому дослідження, опубліковані в сімдесяті і на початку восьмидесятих років, розкидані в масі різних журналів, деякі з яких маловідомі. Поступово з'явився теоретичний фундамент, на основі якого сьогодні конструюються найбільш могутні багатошарові мережі. Оцінка Мінського виявилася надмірно песимістичною, багато хто з поставлених в його книзі завдань розв'язується зараз мережами за допомогою стандартних процедур. За останні декілька років теорія стала застосовуватися в прикладних областях, і з'явилися нові корпорації, що займаються комерційним використанням цієї технології. Наростання наукової активності носило вибуховий характер. У 1987 р. було проведено чотири крупні наради по штучних нейронних мережах і опубліковано 500 наукових повідомлень - феноменальна швидкість росту. Урок, який можна витягнути з цієї історії, виражається законом Кларка, висунутим письменником і вченим Артуром Кларком. У ньому затверджується, що, якщо крупний поважаний учений говорить, що щось може бути виконано, то він (або вона) майже завжди прав. Якщо ж учений говорить, що це не може бути виконано, то він (або вона) майже завжди не прав. Історія науки є літописом помилок і часткових істин. Те, що сьогодні не береться під сумнів, завтра відкидається. Некритичне сприйняття «фактів» незалежно від їх джерела може паралізувати науковий пошук. З одного боку, блискуча наукова робота Мінського затримала розвиток штучних нейронних мереж. Немає сумнівів, проте, в тому, що область постраждала унаслідок необґрунтованого оптимізму і відсутності достатньої теоретичної бази. І можливо, що шок, викликаний книгою «Персептрони», забезпечив необхідний для созреванія цієї наукової області період.

ШТУЧНІ НЕЙРОННІ МЕРЕЖІ СЬОГОДНІ

 Є багато вражаючих демонстрацій можливостей штучних нейронних мереж: мережу навчили перетворювати текст у фонетичне уявлення, яке потім за допомогою вже інших методів перетворювалося на мову [7]; інша мережа може розпізнавати рукописні букви [1]; сконструйована система стиснення зображень, заснована на нейронній мережі [2]. Всі вони використовують мережу зворотного розповсюдження - найбільш успішний, мабуть, з сучасних алгоритмів. Зворотне розповсюдження, незалежно запропоноване в трьох різних роботах [8, 5, 6], є систематичним методом для навчання багатошарових мереж, і тим самим долає обмеження, вказані Мінським. Як підкреслюється в наступних розділах, зворотне розповсюдження не вільно від проблем. Перш за все, немає гарантії, що мережа може бути навчена за кінцевий час. Багато зусиль, використаних на навчання, пропадає марно після витрат великої кількості машинного часу. Коли це відбувається, спроба навчання повторюється - без жодної упевненості, що результат виявиться кращим. Немає також упевненості, що мережа навчиться можливим найкращим чином. Алгоритм навчання може потрапити в «пастку» так званого локального мінімуму і буде одержане гірше рішення

Розроблено багато інших мережевих алгоритмів навчання, що мають свої специфічні переваги. Деякі з них обговорюються в подальших розділах. Слід підкреслити, що ніяка з сьогоднішніх мереж не є панацеєю, всі вони страждають від обмежень в своїх можливостях навчатися і згадувати. Ми маємо справу з областю, що продемонструвала свою працездатність, що має унікальні потенційні можливості, багато обмежень і безліч відкритих питань. Така ситуація настроює на помірний оптимізм. Автори схильні публікувати свої успіхи, але не невдачі, створюючи тим самим враження, яке може виявитися нереалістичним. Ті, хто шукає капітал, щоб ризикнути і заснувати нові фірми, повинні представити переконливий проект подальшого здійснення і прибули. Існує, отже, небезпека, що штучні нейронні мережі почнуть продавати раніше, ніж прийде їх час, обіцяючи функціональні можливості, яких поки неможливо досягти. Якщо це відбудеться, то область в цілому може постраждати від втрати кредиту довіри і повернеться до застійного періоду сімдесятих років. Для поліпшення існуючих мереж потрібно багато ґрунтовної роботи. Повинні бути розвинені нові технології, поліпшені існуючі методи і розширені теоретичні основи, перш ніж дана область зможе повністю реалізувати свої потенційні можливості.  

ПЕРСПЕКТИВИ НА МАЙБУТНЄ

 Штучні нейронні мережі запропоновані для завдань, що тягнуться від управління боєм до нагляду за дитиною. Потенційними додатками є ті, де людський інтелект малоефективний, а звичайні обчислення трудомісткі або неадекватні. Цей клас додатків, в усякому разі, не менше класу, обслуговуваного звичайними обчисленнями, і можна припускати, що штучні нейронні мережі займуть своє місце разом із звичайними обчисленнями як доповнення такого ж об'єму і важливості.

Штучні нейронні мережі і експертні системи

 Останніми роками над штучними нейронними мережами домінували логічні і символьно-операційні дисципліни. Наприклад, широко пропагувалися експертні системи, у яких є багато помітних успіхів, так само, як і невдач. Дехто говорить, що штучні нейронні мережі замінять собою сучасний штучний інтелект, але багато що свідчить про те, що вони існуватимуть, об'єднуючись в системах, де кожен підхід використовується для вирішення тих завдань, з якими він краще справляється. Ця точка зору підкріплюється тим, як люди функціонують в нашому світі. Розпізнавання образів відповідає за активність, що вимагає швидкої реакції. Оскільки дії здійснюються швидко і несвідомо, то цей спосіб функціонування важливий для виживання у ворожому оточенні. Уявите тільки, що було б, якби наші предки вимушені були обдумувати свою реакцію на хижака, що стрибнув? Коли наша система розпізнавання образів не в змозі дати адекватну інтерпретацію, питання передається у вищі відділи мозку. Вони можуть запитати додаткову інформацію і займуть більше часу, але якість одержаних в результаті рішень може бути вище. Можна уявити собі штучну систему, що наслідує такому розподілу праці. Штучна нейронна мережа реагувала б в більшості випадків відповідним чином на зовнішнє середовище. Оскільки такі мережі здатні указувати довірчий рівень кожного рішення, то мережа «знає, що вона не знає» і передає даний випадок для дозволу експертній системі. Рішення, що приймаються на цьому вищому рівні, були б конкретними і логічними, але вони можуть потребувати збору додаткових фактів для отримання остаточного висновку. Комбінація двох систем була б могутнішою, ніж кожна з систем окремо, слідуючи при цьому високоефективній моделі, біологічною еволюцією, що дається.

1 2 3 4