Штучні нейронні мережі

Абстрагування

 Деякі з штучних нейронних мереж володіють здатністю витягувати суть з вхідних сигналів. Наприклад, мережа може бути навчена на послідовність спотворених версій букви А. Після відповідного навчання пред'явлення такого спотвореного прикладу приведе до того, що мережа породить букву довершеної форми. В деякому розумінні вона навчиться породжувати те, що ніколи не бачила. Ця здатність витягувати ідеальне з недосконалих входів ставить цікаві філософські питання. Вона нагадує концепцію ідеалів, висунуту Платоном в його «Республіці». В усякому разі, здатність витягувати ідеальні прототипи є у людей вельми цінною якістю.

Застосовність

 Штучні нейронні мережі не є панацеєю. Вони, очевидно, не годяться для виконання таких завдань, як нарахування заробітної платні. Схоже, проте, що їм віддаватиметься перевага у великому класі завдань розпізнавання образів, з якими погано або взагалі не справляються звичайні комп'ютери.  

ІСТОРИЧНИЙ АСПЕКТ

Людей завжди цікавило їх власне мислення. Це самопитання, думання мозку про себе самого є, можливо, відмінною рисою людини. Є безліч роздумів про природу мислення, що тягнуться від духовних до анатомічних. Обговорення цього питання, що протікало в гарячих суперечках філософів і теологів з фізіологами і анатомами, принесло мало користі, оскільки сам предмет вельми важкий для вивчення. Ті, хто спирався на самоаналіз і роздум, пришли до висновків, що не відповідають рівню строгості фізичних наук. Експериментатори ж знайшли, що мозок важкий для спостереження і ставить в безвихідь своєю організацією. Коротше кажучи, могутні методи наукового дослідження, що змінили наш погляд на фізичну реальність, виявилися безсилими в розумінні самої людини. Нейробіологи і нейроанатоми досягли значного прогресу. Старанно вивчаючи структуру і функції нервової системи людини, вони багато що зрозуміли в «електропроводці» мозку, але мало дізналися про його функціонування. В процесі накопичення ними знань з'ясувалося, що мозок має приголомшуючу складність. Сотні мільярдів нейронів, кожний з яких сполучений з сотнями або тисячами Інших, утворюють систему, що далеко перевершує наші найсміливіші мрії про суперкомп'ютери. Проте, мозок поступово видає свої секрети в процесі одного з самих напружених і честолюбних досліджень в історії людства. Краще розуміння функціонування нейрона і картини енергозв'язків дозволило дослідникам створити математичні моделі для перевірки своїх теорій. Експерименти тепер можуть проводитися на цифрових комп'ютерах без залучення людини або тварин, що вирішує багато практичних і морально-етичних проблем. По-перше ж роботах з'ясувалося, що ці моделі не тільки повторюють функції мозку, але і здатні виконувати функції, що мають свою власну цінність

Тому виникли і залишаються в даний час два взаємно збагачуючих одна одну мети нейронного моделювання: перша - зрозуміти функціонування нервової системи людини на рівні фізіології і психології і друга - створити обчислювальні системи (штучні нейронні мережі), що виконують функції, схожі з функціями мозку. Саме ця остання мета і знаходиться в центрі уваги цієї книги. Паралельно з прогресом в нейроанатомії і нейрофізіології психологами були створені моделі людського навчання. Однієї з таких моделей найбільш плідної, що опинилася, була модель Д. Хебба, який в 1949 р. запропонував закон навчання, що з'явився стартовою крапкою для алгоритмів навчання штучних нейронних мереж. Доповнений сьогодні безліччю інших методів він продемонстрував ученим того часу, як мережа нейронів може навчатися. У п'ятдесяті і шестидесяті роки група дослідників, об'єднавши ці біологічні і фізіологічні підходи, створила перші штучні нейронні мережі. Виконані спочатку як електронні мережі, вони були пізніше перенесені в гнучкіше середовище комп'ютерного моделювання, що збереглося і в даний час. Перші успіхи викликали вибух активності і оптимізму. Мінський, Розенблатт, Уїдроу та інші розробили мережі, що складаються з одного шару штучних нейронів. Часто звані персептронами, вони були використані для такого широкого класу завдань, як прогноз погоди, аналіз електрокардіограм і штучного зору. Протягом деякого часу здавалося, що ключ до інтелекту знайдений, і відтворення людського мозку є лише питанням конструювання досить великої мережі. Але ця ілюзія скоро розсіялася. Мережі не могли вирішувати задачі, зовні вельми схожі з тими, які вони успішно вирішували. З цих нез'ясовних невдач почався період інтенсивного аналізу. Мінський, використовуючи точні математичні методи, строго довів ряд теорем, що відносяться до функціонування мереж. Його дослідження привели до написання книги [4], в якій він разом з Пайпертом довів, що використовувані у той час одношарові мережі теоретично нездатні вирішити багато простих завдань, зокрема реалізувати функцію що «Виключає АБО». Мінський також не був оптимістичний відносно потенційно можливого тут прогресу: Персептрон показав себе заслуговуючим вивчення, не дивлячись на жорсткі обмеження (і навіть дякуючи їм). У нього багато привабливих властивостей: лінійність, цікава теорема про навчання, простота моделі паралельних обчислень. Немає підстав вважати, що ці достоїнства зберігатися при переході до багатошарових систем. Проте ми вважаємо важливим завданням для дослідження підкріплення (або спростування) нашого інтуїтивного переконання, що такий перехід безплідний. Можливо, буде відкрита якась могутня теорема про збіжність або знайдена глибока причина невдач дати цікаву «теорему навчання» для багатошарових машин ([4], С. 231-232). Блиск і строгість аргументування Мінського, а також його престиж породили величезну довіру до книги - її висновки були невразливі.

1 2 3 4