Wprowadzenie do sieci neuronowych


Wprowadzenie do sieci neuronowych

Cena: 20 zł



Zamów

Przekład i opracowanie pod kierunkiem Ryszarda Tadeusiewicza
Wydawca: StatSoft Polska
Wydanie: Kraków, 2001
ISBN: 83-88724-04-5
Liczba stron: 78

Książka ta jest przystępnym wprowadzeniem w świat sieci neuronowych. Od podstaw wyjaśnione zostały najważniejsze pojęcia związane z sieciami neuronowymi, zalety modeli neuronowych oraz problemy które mogą pojawić się podczas ich konstruowania. Przedstawiono tu najważniejsze (stosowane w praktyce) architektury sieci neuronowych oraz sposoby konstruowania różnych modeli (regresyjnych, klasyfikacyjnych, prognostycznych). Znakomity podręcznik dla początkujących oraz osób, które dopiero chciałyby się dowiedzieć co to są sieci neuronowe.

ta książka jest również częścią dokumentacji ST Neural Networks PL.


Wstęp:

W ostatnich latach bardzo gwałtownie wzrosło zainteresowanie sieciami neuronowymi. Są one z powodzeniem stosowane w rozwiązywaniu niezwykle szerokiego zakresu problemów, w tak różniących się od siebie dziedzinach jak finanse, medycyna, zastosowania inżynierskie, geologia czy fizyka. W rzeczywistości sieci neuronowe mogą być zastosowane wszędzie tam, gdzie pojawiają się problemy związane z predykcją, klasyfikacją czy sterowaniem. Ten olbrzymi sukces sieci neuronowych jest związany z kilkoma czynnikami:

Moc. Sieci neuronowe są bardzo wyrafinowaną techniką modelowania, zdolną do odwzorowywania nadzwyczaj złożonych funkcji. W szczególności sieci neuronowe mają charakter nieliniowy (termin ten zostanie szczegółowo omówiony w dalszej części tego rozdziału), co istotnie wzbogaca możliwości ich zastosowań. Rozwiniemy nieco ten temat, żeby wskazać na wagę formułowanych tu wniosków.

Przez wiele lat powszechnie stosowaną techniką matematycznego opisywania różnych obiektów i procesów było modelowanie liniowe. Takie postępowanie jest z powodzeniem stosowane także obecnie, przynosząc pomyślne rezultaty, głównie z uwagi na dobrze znaną strategię optymalizacji stosowaną przy konstrukcji modeli tego typu. Jednak wszędzie tam, gdzie nie ma podstaw do aproksymacji liniowej występujących zjawisk i procesów (a przypadki takie są w praktyce dość częste), modele liniowe nie sprawdzały się, prowadząc niekiedy do formułowania niesłusznych opinii o całkowitym braku możliwości matematycznego opisywania takich czy innych systemów. W takich przypadkach, przy rozwiązywaniu tych trudnych i kłopotliwych zagadnień odwołanie się do modeli tworzonych z wykorzystaniem sieci neuronowych (a więc modeli, które bez trudu mogą odwzorować zależności nieliniowe) może być najszybszym i najwygodniejszym rozwiązaniem problemu.

Zalety sieci neuronowych nie ograniczają się jedynie do tego, że umożliwiają one swobodne i łatwe (bez konieczności samodzielnego formułowania przez użytkownika skomplikowanych hipotez) tworzenie modeli nieliniowych. Sieci umożliwiają także kontrolę nad złożonym problemem wielowymiarowości, który przy stosowaniu innych metod znacznie utrudnia próby modelowana funkcji nieliniowych z dużą liczbą zmiennych niezależnych (tzw. funkcji wektorowych).

Łatwość użycia. Sieci neuronowe w praktyce same konstruują potrzebne użytkownikowi modele, ponieważ automatycznie uczą się na podanych przez niego przykładach. Odbywa się to w taki sposób, że użytkownik sieci gromadzi reprezentatywne dane pokazujące, jak manifestuje się interesująca go zależność, a następnie uruchamia algorytm uczenia, który ma na celu automatyczne wytworzenie w pamięci sieci potrzebnej struktury danych. Opierając się na tej samodzielnie stworzonej strukturze danych, sieć realizuje potem wszystkie funkcje związane z eksploatacją utworzonego modelu.

Chociaż zatem użytkownik potrzebuje pewnej, w głównej mierze empirycznej wiedzy dotyczącej sposobu wyboru i przygotowania danych stanowiących przykłady, a także wyboru właściwego rodzaju sieci neuronowej oraz sposobu interpretacji rezultatów, to jednak poziom wymaganej od użytkownika wiedzy teoretycznej, niezbędnej do skutecznego zbudowania modelu, przy stosowaniu sieci neuronowych jest znacznie niższy niż w przypadku stosowania tradycyjnych metod statystycznych.

Pociągająca jest również taka właściwość sieci neuronowych, że stanowią one (w jakimś zakresie) naśladownictwo działania ludzkiego umysłu. Wprawdzie sieci oparte są na bardzo prostym modelu, przedstawiającym wyłącznie najbardziej podstawową istotę działania biologicznego systemu nerwowego, jednak ich działanie wzbudza ciekawość jako jedna z prób przeniknięcia istoty działania ludzkiego mózgu. Niektórzy w związku z tym sądzą, że w przyszłości rozwój modelowania neuro-biologicznego może doprowadzić do powstania prawdziwych komputerów inteligentnych. Tak będzie jednak dopiero w przyszłości – być może dość odległej. Tymczasem już dziś, „proste” modele sieci neuronowych, na przykład te tworzone w ST Neural Networks, stanowią godne uwagi, bardzo użyteczne narzędzie. Są tacy, którzy przypuszczają, że będzie to prawdziwie „cudowny oręż” oddany do dyspozycji osób zajmujących się statystyką stosowaną.


Spis treści:

SIECI NEURONOWE

Wstęp
Inspiracje biologiczne
Model podstawowy
Korzystanie z sieci neuronowej
Gromadzenie danych dla sieci neuronowych
Streszczenie
Pre- i postprocessing
Perceptrony wielowarstwowe
Uczenie perceptronu wielowarstwowego
Algorytm wstecznej propagacji błędów
Przeuczenie i generalizacja
Wybór danych
Intuicyjne przedstawienie sposobu uczenia perceptronu wielowarstwowego
Inne algorytmy uczenia perceptronów wielowarstwowych
Sieci o radialnych funkcjach bazowych
Probabilistyczne sieci neuronowe
Sieci neuronowe realizujące regresję uogólnioną
Sieci liniowe
Sieci Kohonena
Klasyfikacja w ST Neural Networks
Statystyki klasyfikacyjne
Problemy regresyjne w ST Neural Networks
Prognozowanie szeregów czasowych w ST Neural Networks
Wybór zmiennych oraz redukcja liczby wymiarów
Zakończenie

INDEKS