Rodzaje modeli rozmytych

Model Mamdaniego       Model Takagi - Sugeno        Model relacyjny         Globalny model rozmyty          Wielomodele

W miarę rozwoju logiki rozmytej opracowywane są nowe modeli rozmytych. Celem tworzenia nowych modeli jest dążenie do uzyskania coraz większej dokładności, wymiarowości lub też chęć uproszczenia struktury. Konieczność tworzenia nowych modeli spowodowana jest również wielką różnorodnością systemów rzeczywistych, różnym stopniem dostępności informacji o tych systemach oraz różnymi jej formami.

Główną zaletą modeli rozmytych względem konwencjonalnych modeli matematycznych jest możliwość ich opracowania na bazie znacznie mniejszej ilości informacji o systemie. Informacja ta może mieć charakter nieprecyzyjny, rozmyty. W dalszym ciągu przedstawione zostaną zasadnicze rodzaje modeli rozmytych oraz omówione zależności pomiędzy niektórymi z tych modeli. Najważniejszym i najczęściej stosowanym typem modelu rozmytego jest model Mamdaniego. Model ten oaz inne modele pochodne przedstawione zostaną poniżej.

Model Mamdaniego

W modelach Mamdaniego modelowany system traktuje się na zasadzie czarnej skrzynki cechującej się brakiem informacji o zjawiskach fizycznych zachodzących w jej wnętrzu.

Model Mamdaniego jest zbiorem reguł, z których każda definiuje jeden rozmyty punkt w tej przestrzeni. Zbiór rozmytych punktów tworzy wykres rozmyty, w którym interpolacja pomiędzy punktami zależy od użytych elementów aparatu logiki rozmytej.

Modelowany system SISO realizuje odwzorowanie y = (x-2)2 +2. Rozmyty model Mamdaniego tego systemu może mieć postać zbioru reguł oraz funkcji przynależności przedstawionych na rys. poniżej

R1: JEŚLI (x jest A1) TO (y jest B1),
R2: JEŚLI (x jest A
2) TO (y jest B2),
R3: JEŚLI (x jest A
3) TO (y jest B3),
gdzie: A1= około 1, A2 = około 2, A3
= około 4,
B1 = około 3, B2 = około 2, B3
= około 5,
x: 1£ x £ 4.

Każda reguła definiuje ważną typową cechę zachowania systemu, która geometrycznie odpowiada punktowi w przestrzeni X´ Y. “Ważne" punkty modelu mogą być usytuowane bezpośrednio na charakterystyce systemu rzeczywistego, tak jak na rys. powyżej a. Charakterystyka modelu pokrywa się wówczas w tych punktach z charakterystyką modelowanego systemu. Reguły modelu “mówią" wtedy prawdę o systemie, np:

JEŚLI ( x jest około 1 ) TO (y jest około 2),

określa punkt R1 który jest jednocześnie istotnym punktem systemu i modelu.

Jednak istotne punkty modelu nie zawsze muszą leżeć na charakterystyce (powierzchni) systemu rzeczywistego. Jak pokazuje rys. powyżej b inne usytuowanie tych punktów może dać wyższą dokładność modelu. W tym przypadku zmieniają się parametry funkcji przynależności (nowe zbiory rozmyte A2*, B1*, B2*) a reguły mają postać:

R1*: JEŚLI (x jest A1) TO (y jest B1*),
R2*: JEŚLI (x jest A2) TO (y jest B2*),
R3*: JEŚLI (x jest A3) TO (y jest B3*).

Reguły R1* i R2* nie mówią prawdy o systemie bowiem punkty definiowane przez nie, nie leżą na charakterystyce systemu rzeczywistego. Jednak średnia dokładność może być tutaj wyższa niż w przypadku modelu z rys. powyżej a.

Przebieg charakterystyki modelu rozmytego pomiędzy “ważnymi" punktami definiowanymi przez poszczególne reguły zależy od zastosowanego aparatu logiki rozmytej (sposobu przeprowadzenia fuzyfikacji, defuzyfikacji, itd.). Jeżeli w przykładzie przedstawionym na rys. powyżej a wprowadzona zostanie inna funkcja przynależności dla zbioru A2 spowoduje to zmianę kształtu charakterystyki modelu, rys. powyżej b.

  

Model Takagi - Sugeno

Modele Takagi – Sugeno różnią się od modeli Mamdaniego postacią reguł. O ile w przypadku modelu Mamdaniego systemu jedno wejście jedno wyjście reguła ma postać:

JEŚLI (x jest A) TO (y jest B),

gdzie: A,B – zbiory rozmyte typu “mały”, “blisko” 5”, to w przypadku modelu TS reguły mają postać:

JEŚLI (x jest A) TO (y = f(x)).

Ich konkluzja zawiera funkcję f(x), a nie zbiór rozmyty. Funkcja ta może być nieliniowa, chociaż najczęściej stosuje się funkcje liniowe. Wówczas reguły TS mają formę:

JEŚLI (x jest A) TO (y = ax+b),

Modele TS należy stosować głównie wtedy, gdy funkcje przynależności mają charakter trapezowy lub podobny.

Rys. Rodzaje funkcji przynależności zalecane w modelach Takagi-Sugeno: a) trapezowe, b) trapezopodobne.

Należy zauważyć, ze stosując funkcje trapezopodobne z brzegami nieliniowymi (np. gaussowskim) nawet w strefie, w której przynależność do zbioru Ai jest pełna i wynosi 1 nie uzyskamy powierzchni modelu dokładnie takiej, jak podaje odpowiednia reguła Ri, lecz powierzchnię mniej lub bardziej zmienioną przez wpływ funkcji fi innych reguł. Wynika to, z faktu, że gaussowskie funkcje przynależności mają podstawę nieskończenie wielką, nie sumują się do jedności, i znacznie rozszerzają zakres wpływu poszczególnych konkluzji fi.

W przypadku systemów z dwoma (lub większą ilością wejść) trapezowe funkcje przynależności pozwalają uzyskać (hiper-) prostokątne sektory, w których przynależność do iloczynów zbiorów jest równa 1.


Model relacyjny

Ich zasadniczą cechą jest to, że reguły lingwinistyczne nie są traktowane jako całkowicie prawdziwe, lecz jako częściowo (mniej lub bardziej) prawdziwe. Poszczególnym regułom przypisuje się odpowiedni współczynnik ufności.

Baza reguł reprezentowana jest przez rozmytą relację, a do jej identyfikacji i analizy stosowana jest teoria równań relacyjnych. Sens współczynnika ufności reguł wyjaśniony zostanie w przykładzie:

Baza reguł określa relację między zdolnościami dziecka oraz jego wynikami w nauce.

R1: Dziecko zdolne uczy się dobrze.
R2: Dziecko średnio – zdolne uczy się średnio.
R3: Dziecko niezdolne uczy się źle.

Nie analizując głębiej problemu, gotowi jesteśmy uznać reguły za prawdziwe. Reguły te można przedstawić w postaci tabeli relacyjnej ze współczynnikami ufności równymi 1 lub 0 wiążącymi zbiory rozmyte wejścia ze zbiorami wyjścia.

 

             wyniki nauki
poziom
uzdolnienia

dobre

średnie

złe

zdolne

1

0

0

średnio – zdolne

0

1

0

niezdolne

0

0

1

Badania statystyczne prowadzone w szkołach, a także doświadczenia większości rodziców wykazują jednak, że są dzieci zdolne, które uzyskują średnie lub nawet złe wyniki w nauce, oraz, że są dzieci niezdolne uzyskujące wyniki średnie. Badając statystyczne grupy uczniów zdolnych, średnio – zdolnych i niezdolnych możemy obliczyć jaki procent dzieci uzyskuje w tych grupach dobre, średnie, lub złe wyniki. Na tej podstawie możemy określić współczynniki ufności w poniższej tabeli relacyjnej.

 

             wyniki nauki
poziom
uzdolnienia

dobre

średnie

złe

zdolne

0.6

0.3

0.1

średnio – zdolne

0.1

0.7

0.2

niezdolne

0

0.3

0.7

W rozmytych modelach relacyjnych, przed przeprowadzeniem wnioskowania rozmyte zbiory konkluzji są zwykle defuzyfikowane i zastępowane singletonami. Następnie przeprowadza się agregację z uwzględnieniem wagowych współczynników ufności poszczególnych reguł.

Rozmyte modele relacyjne umożliwiają podwyższenie dokładności modelu przez wprowadzenie współczynników ufności poszczególnych reguł. Współczynniki te umożliwiają wyrażanie konkluzji nowych reguł jako wypukłą kombinację sąsiednich zbiorów rozmytych wyjścia modelu. Określenie optymalnych wartości współczynników ufności może się odbywać na bazie pomiarów wejścia / wyjście systemu z użyciem rozmytych sieci neuronowych, metodą kwantyzacji wektorowej lub estymacji (minimalny średni błąd kwadratowy).

Forma prezentacji rozmytych modeli relacyjnych komplikuje się znacznie ze wzrostem ilości wejść modelu.


Globalny model rozmyty

Pierwsze modele rozmyte miały charakter globalny, tzn. dotyczyły całej przestrzeni wejść. Szybko jednak stwierdzono, że dążenie do wysokiej dokładności modelu globalnego prowadzi w przypadku niektórych systemów do ogromnej komplikacji wyrażającej się w wielkiej ilości reguł. Okazało się też, że modele globalne są efektywne (strojenie parametrów) przy względnie małej ilości wejść n £ 4. Ilustracją omawianego problemu jest poniższy rysunek.

Rys. Podział przestrzeni wejść X1´ X2 w modelu globalnym systemu zawierającym dwie “góry” i dwa obszary płaskie.

 Aby zapewnić wysoką dokładność odwzorowania “gór" należy w ich rejonie zagęścić funkcje przynależności. W ten sposób uzyskuje się siatkę podziałową o 13x13=169 węzłach (punktach podparcia). Ponieważ każdemu węzłowi odpowiada jedna reguła rozmyta, model zawiera dużą ilość (l 69) reguł.

O ile jednak duże zagęszczenie węzłów potrzebne jest w rejonach “gór", to obszary płaskie można wystarczająco dokładnie opisać przy pomocy mniejszej ilości reguł (węzłów). Dlatego rozsądnym byłoby rozbicie modelu globalnego na 4 modele lokalne przedstawione na rys. poniżej. W modelach lokalnych rys. a i d, obszary płaskie opisane są tylko 4 regułami. “Góry" na rys. b i c opisane są natomiast większą ilością 49 reguł. Łączna ilość reguł w 4 modelach lokalnych wynosi 106 i jest o 63 mniejsza w porównaniu z modelem globalnym.

Rys. Cztery modele lokalne zastępujące model globalny.

 Do identyfikacji modelu z mniejszą ilością reguł wystarczy mniejsza ilość danych pomiarowych wejścia / wyjście systemu. Jest to bardzo ważna zaleta modelowania lokalnego, bowiem często brak dostatecznej ilości pomiarów z modelowego systemu. Przyczyną braku informacji o systemie mogą być wysokie koszty, pracochłonność lub czasochłonność pomiarów.

Pożądaną cechą zbioru modeli lokalnych zastępujących jeden model globalny jest ciągłość powierzchni na styku jednego modelu lokalnego z drugim. 

Oddzielne strojenie mniejszych modeli lokalnych jest o wiele łatwiejsze niż strojenie jednego modelu globalnego. Trudności strojenia modeli rosną bowiem wykładniczo z ilością reguł (węzłów siatki podziałowej). Zwiększa się też gwałtownie ilość minimów lokalnych powierzchni błędu modelu w których proces strojenia modelu może się zatrzymać. Ponieważ po oddzielnym strojeniu modeli lokalnych ich brzegi zwykle się nie pokrywają i przy przejściu z jednego modelu do drugiego mógłby wystąpić gwałtowny skok wyjścia y, strefy przejściowe należy wygładzić. Do realizacji tego celu można zastosować nadrzędny, integrujący, rozmyty model globalny.


Wielomodele

Pedrycz definiuje wielomodel jako “zbiór modeli M1, M2, ... , Mc wyposażony w mechanizm odpowiedniego ich przełączania lub, jeśli potrzeba agregacji wyników dostarczanych przez poszczególne modele".

Mechanizm przełączania modeli działa na podstawie dodatkowych informacji o systemie (wejść). Mechanizm agregacji działa natomiast w oparciu o współczynniki ufności poszczególnych modeli.

System  jest jednoznaczny względem wejścia x jeśli każdej wartości x odpowiada tylko jedna wartość wyjścia y. System może być opisany jednym modelem.

Jeżeli model systemu nie uwzględnia niektórych jego wejść (ponieważ nie znamy ich wartości lub nie uświadamiamy sobie ich istnienia), to stan wyjścia nie może być określony jednoznacznie, bowiem nieuwzględnione wejścia również wpływają na wyjście zmieniając je w określony “tajemniczy” sposób.

Jedną z przyczyn niejednoznaczności jest też słabo rozpoznana zależność wejścia / wyjście systemu, sprawiająca, że mimo znajomości stanu wejść nie potrafimy określić stanu wyjścia.

Jeżeli nie znamy przyczynowo – skutkowej zależności wejścia / wyjście systemu lub też nie znamy niektórych jego wejść, możemy zastosować metodę opisu systemów polegającą na podaniu prawdopodobieństwa różnych możliwych stanów wyjścia y przy danym stanie wektora wejść X modelu.

Kolejnym ważnym problemem związanym z wielomodelami jest rozróżnianie, na bazie danych pomiarowych wejścia / wyjście, czy mamy do czynienia z systemem jednoznacznym (model) czy wieloznacznym (wielomodel). Problem przedstawiony jest na rys. poniżej.

Dane pomiarowe wejścia / wyjścia systemu są zwykle zaszumione (szum pomiarowy) oraz / lub zakłócone wejściami nie uwzględnionymi w modelu. Jeżeli zachodzi ten drugi przypadek, to system należy przedstawić raczej w formie wielomodelu (jeżeli wpływ nieuwzględnionych wejść jest “dostatecznie" duży).

Jeżeli rozrzut pomiarów wyjścia jest mały (w granicach błędu urządzenia pomiarowego) to system należy przedstawić w formie (jednoznacznego) modelu.

Rys. Ilustracja problemu wielkości rozrzutu danych pomiarowych i związanej z nim oceny jednoznaczności modelu.

 Jeżeli rozrzut jest duży, raczej w formie wielomodelu. Określenia “mały", “duży" rozrzut są rozmyte i w dużej mierze uzależnione od naszej intuicji lub wstępnej wiedzy o modelowanym systemie. Trudność odróżnienia wpływu szumu pomiarowego od wpływu nieuwzględnionych wejść gwałtownie rośnie z wymiarowością systemu (ilością wejść).