identyf

 

Sieci neuronowe z ich atrakcyjnymi charakterystykami stwarzają możliwość opracowania ogólnej metodologii identyfikacji obiektów dynamicznych i jej zastosowania w układach sterowania.

Perceptron wielowarstwowy

Jednym z ważnych problemów przy stosowaniu sieci neuronowych w układach dynamicznych jest to, że sieć neuronowa powinna być uczona z wykorzystaniem nie tylko danych bieżących, ale również i przyszłych. Problem ten można rozwiązać dwojako. Jednym ze sposobów, jest użycie sieci jednokierunkowej i uwzględnienia poprzednio mierzonych wyjść układu jako wejść sieci. Innym rozwiązaniem jest użycie estymowanych wyjść sieci jako jej aktualnych wejść.

 Konfiguracje układów identyfikacji z sieciami neuronowymi, z-1 -symbol opóźnienia o jeden takt.

W przypadku, gdy wyjście obiektu jest przekazywane do sieci neuronowej, mamy sieć neuronową jednokierunkową, która może być uczona np. według uogólnionej zasady delty. Z kolei, jeśli wyjście z sieci neuronowej jest zwrotnie przekazywane jako wejście sieci, mamy przypadek sieci neuronowej ze sprzężeniem zwrotnym.

Problem identyfikacji polega na wyborze odpowiednio sparametryzowanej struktury modelu, a następnie na estymacji parametrów modelu poprzez minimalizację funkcji celu opartej na definicji błędu pomiędzy wyjściem obiektu a wyjściem modelu. Tradycyjnie w teorii identyfikacji wyróżnia się dwa rodzaje modeli: modele równoległe oraz szeregowo-równoległe. Przyjmując, że dyskretny model nieliniowy opisany jest równaniem:

                         yk+1 = f[ yk, yk-1, ..., yk-n+1; uk, uk-1, ..., uk-m+1]

gdzie sygnał wyjściowy y w chwili k+1 zależy w sposób nieliniowy (nieliniowa funkcja f ) od n wartości poprzednich y oraz od m wartości poprzednich sygnału wejściowego u

Równoległy model identyfikacji

 

Przykładowa struktura układu z równoległym modelem identyfikacji, dla n = 2 i m = l

 

W tym przypadku uogólniony model obiektu zadany równaniem można zapisać następująco:

ykm+1 =a0 ykm +a1 ykm-1 + N[uk], 

gdzie N[.] oznacza sieć neuronową aproksymującą nieliniową funkcję f1 procesu.

Problem identyfikacji modelu sprowadza się więc do estymacji parametrów a0  a1, oraz współczynników wag sieci neuronowej typu propagacji wstecznej. Rozwiązanie tego zadania można otrzymać np. korzystając z algorytmu dynamicznej propagacji wstecznej  opartego na przetwarzaniu błędu ek, jaki występuje pomiędzy wyjściem modelu ykm a wyjściem obiektu y k.

W rozpatrywanej strukturze równoległej stabilność modelu identyfikacji z siecią neuronową, z uwagi na ograniczoność sygnałów wejściowych i wyjściowych, nie jest zagwarantowana. W konsekwencji można nie uzyskać zbieżności estymowanych parametrów oraz błąd wyjściowy nie będzie dążył do zera. Należy podkreślić, że problem zbieżności estymat parametrów w równoległych strukturach identyfikacji nie jest dotychczas rozwiązany nawet dla przypadku układów liniowych. Dlatego z punktu widzenia zastosowań efektywniejszą strukturą układu identyfikacji jest struktura z tzw. modelem szeregowo-równoległym.

Szeregowo-równoległy model identyfikacji

W przeciwieństwie do modelu równoległego, w modelu szeregowo-równoległym wyjście z obiektu, a nie z jego modelu, jest przekazywane poprzez sprzężenie zwrotne do modelu identyfikacyjnego. W tym przypadku uogólniony model obiektu przyjmuje posiać

ykm+1 = a0yk + a1yk-1 + N[uk]

gdzie N[.] oznacza sieć neuronową, aproksymującą nieliniową charakterystykę obiektu f1.  

Szeregowo-równoległy model identyfikacji

W ogólniejszej postaci strukturę układu z szeregowo-równoległym modelem identyfikacji można przedstawić następująco: 

Ogólna struktura układu identyfikacji z siecią neuronową

Zadaniem linii opóźnień jest przechowywanie wartości sygnałów wejściowych i wyjściowych wcześniejszych względem bieżącej chwili czasu. Dzięki temu wcześniejsze wartości sygnału wejściowego  wyjściowego tworzą wektor wejściowy (obraz wejściowy) dla sieci neuronowej, której wyjście ykm+1 odpowiada estymacie wyjścia obiektu yk+1 dla każdej dyskretnej chwili czasu k + l. W bardziej czytelnej formie sposób tworzenia obrazu wejściowego sieci można pokazać na poniższym rysunku.

 

Sieć wielowarstwowa z wydzielonymi sygnałami
w
obrazie wejściowym i wyjściowym

W porównaniu ze strukturą identyfikacji z modelem równoległym, struktura z modelem szeregowo-równoległy m posiada szereg zalet. Przykładowo, ponieważ w modelu nie ma sprzężenia zwrotnego, do dostrajania współczynników wag sieci można zastosować statyczny algorytm propagacji wstecznej. Ponadto, zakładając że błąd wyjściowy ek dąży asymptotycznie do małych wartości, takich że y k » ykm, model szeregowo-równoległy może być zastąpiony modelem równoległym bez poważniejszych konsekwencji praktycznych.