czy AI naprawdę umie przewidywać wyniki i jak dobrze robi to dla różnych strategii?

Jak dobrze AI przewiduje wyniki Teorii Beczki?

Po przygotowaniu zbiorów treningowych dla kilku strategii podlewania można było wreszcie sprawdzić, jak dobrze model uczenia maszynowego radzi sobie z przewidywaniem wyników bez wykonywania pełnej symulacji dzień po dniu.

W tym etapie badania wykorzystano po 1000 przykładów dla każdej strategii. Dane zostały podzielone na dwie części:

800 przykładów uczących – na nich model się uczył,
200 przykładów testowych – na nich sprawdzano, jak radzi sobie z danymi, których wcześniej nie widział.

Dzięki temu można było uczciwie ocenić, czy model naprawdę nauczył się zależności, czy tylko zapamiętał wcześniejsze przypadki.

Poniżej znajduje się porównanie czterech strategii:

no_rain + cold – nie podlewaj w dni deszczowe i w chłodne dni,
constant – stałe podlewanie,
seasonal – podlewanie tylko w sezonie, bez deszczu,
temp_seasonal – podlewanie sezonowe zależne także od temperatury.

Strategia	Capacity MAE / R²	Used MAE / R²	Coverage MAE / R²	Overflow MAE / R²	Turnover MAE / R²
no_rain + cold	1136 L / 0.899	7.82 / 0.943	0.055 / 0.900	7.65 / 0.919	2.15 / 0.859
constant	1102 L / 0.872	6.63 / 0.964	0.032 / 0.925	5.33 / 0.866	3.59 / 0.862
seasonal	1167 L / 0.907	7.80 / 0.913	0.067 / 0.892	8.40 / 0.928	1.98 / 0.793
temp_seasonal	1428 L / 0.869	10.24 / 0.793	0.102 / 0.750	10.34 / 0.873	1.83 / 0.827

Na pierwszy rzut oka widać, że model najlepiej radzi sobie z prostszymi strategiami, a najtrudniejsza okazała się strategia temp_seasonal, czyli taka, w której podlewanie zależy nie tylko od sezonu i opadów, ale również od temperatury.

To nie jest zaskoczenie. Im bardziej złożona logika działania, tym trudniej modelowi ML wiernie odwzorować zachowanie pełnej symulacji.

Co oznaczają te nagłówki i liczby?

W tabeli porównawczej przy każdej strategii pojawiają się skróty typu Capacity MAE / R², Used MAE / R² itd. Dla osoby spoza świata ML może to brzmieć dość tajemniczo, więc warto to rozbroić prostym językiem.

Każda z tych kolumn mówi o tym, jak dobrze model AI przewiduje konkretny rodzaj wyniku. Zapis MAE / R² oznacza po prostu dwie różne miary jakości modelu:

MAE mówi, o ile średnio model się myli,
R² mówi, jak dobrze model rozumie zależności w danych.

Najprościej:

mniejsze MAE = lepiej
większe R² = lepiej

Co oznaczają poszczególne nagłówki?

Capacity MAE / R²
To jakość przewidywania rekomendowanej pojemności zbiornika. Innymi słowy: jak dobrze model zgaduje, czy zbiornik powinien mieć na przykład 2000, 3000 albo 5000 litrów.

Used MAE / R²
To jakość przewidywania ile deszczówki uda się wykorzystać w ciągu roku. Czyli jak dobrze model szacuje roczne zużycie wody ze zbiornika.

Coverage MAE / R²
To jakość przewidywania jaką część potrzeb podlewania pokryje deszczówka. Na przykład czy deszczówka pokryje 40%, 70% albo 90% planowanego zapotrzebowania.

Overflow MAE / R²
To jakość przewidywania ile wody się przeleje i nie zmieści w zbiorniku. To można traktować jako miarę strat wynikających z ograniczonej pojemności.

Turnover MAE / R²
To jakość przewidywania jak intensywnie pracuje zbiornik w ciągu roku, czyli ile razy jego objętość jest w praktyce „wykorzystana”.

Co oznacza R² i jak je czytać?

To właśnie R² jest często najbardziej mylące, więc warto je wyjaśnić po ludzku.

R² pokazuje, na ile model potrafi wychwycić prawdziwe zależności w danych. Im bliżej 1, tym lepiej.

R² = 0.98 oznacza wynik znakomity. Model prawie idealnie łapie zależności i bardzo dobrze przewiduje dany parametr.
R² = 0.90 oznacza wynik bardzo dobry. Model wyraźnie rozumie problem i daje wiarygodne przewidywania.
R² = 0.75 oznacza wynik nadal dobry, ale już wyraźnie słabszy. Model rozumie dużą część zależności, ale częściej się myli i mniej precyzyjnie odwzorowuje rzeczywistość.
R² = 0.50 oznacza wynik średni. Model coś łapie, ale jeszcze sporo mu brakuje.
R² bliskie 0 oznacza, że model prawie nie rozumie zależności i jego przewidywania są słabe.

Najprościej można to zapamiętać tak:

0.95-1.00 – bardzo blisko ideału
0.85-0.95 – bardzo dobrze
0.70-0.85 – dobrze, ale z wyraźnym marginesem błędu
poniżej 0.70 – model wymaga ostrożności albo dalszego douczenia

A co oznacza MAE?

MAE to średni błąd bezwzględny. Pokazuje, o ile przeciętnie model myli się w liczbach.

Dla przykładu:

jeśli przy pojemności zbiornika MAE wynosi 1100 L, to model myli się średnio o około 1100 litrów,
jeśli przy pokryciu potrzeb MAE wynosi 0.03, to błąd jest średnio rzędu kilku punktów procentowych.

Dlatego MAE mówi o wielkości błędu „w praktyce”, a R² mówi o tym, jak dobrze model rozumie samą strukturę problemu.

Jak czytać tabelę bez technicznego przygotowania?

Najprościej tak:

sprawdź, czy R² jest wysokie – im bliżej 1, tym lepiej,
sprawdź, czy MAE jest małe – im mniejszy błąd, tym lepiej,
porównuj strategie między sobą i patrz, dla których parametrów model radzi sobie najlepiej.

Dzięki temu tabela przestaje być zestawem tajemniczych skrótów, a staje się prostą odpowiedzią na pytanie:

czy AI naprawdę umie przewidywać wyniki tej symulacji i jak dobrze robi to dla różnych strategii?

Wnioski

Najważniejszy wniosek z tego etapu jest dość prosty: AI naprawdę potrafi nauczyć się przewidywać wyniki Teorii Beczki, ale nie każda strategia jest dla niej równie łatwa.

Najlepiej wypadają strategie prostsze, takie jak constant czy no_rain + cold. W ich przypadku model bardzo dobrze przewiduje roczne wykorzystanie wody, pokrycie potrzeb oraz przelewy.

Strategia seasonal także wypada bardzo dobrze, choć już widać nieco większą złożoność problemu. Najtrudniejsza okazuje się temp_seasonal, co jest logiczne, bo w tej wersji dochodzi więcej ruchomych elementów: sezon, opad i wpływ temperatury.

To jednak nie jest zła wiadomość. Wręcz przeciwnie: oznacza to, że obecne podejście działa i daje mocny punkt odniesienia. Teraz można spokojnie przejść do kolejnego etapu, czyli sprawdzić, czy model da się jeszcze uprościć i uogólnić przez normalizację względem powierzchni oraz przejście do jednostek wyrażanych w milimetrach.

Innymi słowy: pierwszy etap został zamknięty sukcesem. Teraz zaczyna się etap drugi, w którym można sprawdzić, czy da się zbudować model jeszcze bardziej elegancki, skalowalny i odporny na zmianę powierzchni zbierania deszczówki.

Każda z tych kolumn mówi o tym, jak dobrze model AI przewiduje konkretny rodzaj wyniku. Zapis MAE / R² oznacza po prostu dwie różne miary jakości modelu:

MAE mówi, o ile średnio model się myli,
R² mówi, jak dobrze model rozumie zależności w danych.

Najprościej:

mniejsze MAE = lepiej
większe R² = lepiej

Co oznaczają poszczególne nagłówki?

Used MAE / R²
To jakość przewidywania ile deszczówki uda się wykorzystać w ciągu roku. Czyli jak dobrze model szacuje roczne zużycie wody ze zbiornika.

Coverage MAE / R²
To jakość przewidywania jaką część potrzeb podlewania pokryje deszczówka. Na przykład czy deszczówka pokryje 40%, 70% albo 90% planowanego zapotrzebowania.

Overflow MAE / R²
To jakość przewidywania ile wody się przeleje i nie zmieści w zbiorniku. To można traktować jako miarę strat wynikających z ograniczonej pojemności.

Turnover MAE / R²
To jakość przewidywania jak intensywnie pracuje zbiornik w ciągu roku, czyli ile razy jego objętość jest w praktyce „wykorzystana”.

Co oznacza R² i jak je czytać?

To właśnie R² jest często najbardziej mylące, więc warto je wyjaśnić po ludzku.

R² pokazuje, na ile model potrafi wychwycić prawdziwe zależności w danych. Im bliżej 1, tym lepiej.

R² = 0.98 oznacza wynik znakomity. Model prawie idealnie łapie zależności i bardzo dobrze przewiduje dany parametr.
R² = 0.90 oznacza wynik bardzo dobry. Model wyraźnie rozumie problem i daje wiarygodne przewidywania.
R² = 0.75 oznacza wynik nadal dobry, ale już wyraźnie słabszy. Model rozumie dużą część zależności, ale częściej się myli i mniej precyzyjnie odwzorowuje rzeczywistość.
R² = 0.50 oznacza wynik średni. Model coś łapie, ale jeszcze sporo mu brakuje.
R² bliskie 0 oznacza, że model prawie nie rozumie zależności i jego przewidywania są słabe.

Najprościej można to zapamiętać tak:

0.95-1.00 – bardzo blisko ideału
0.85-0.95 – bardzo dobrze
0.70-0.85 – dobrze, ale z wyraźnym marginesem błędu
poniżej 0.70 – model wymaga ostrożności albo dalszego douczenia

A co oznacza MAE?

MAE to średni błąd bezwzględny. Pokazuje, o ile przeciętnie model myli się w liczbach.

Dla przykładu:

jeśli przy pojemności zbiornika MAE wynosi 1100 L, to model myli się średnio o około 1100 litrów,
jeśli przy pokryciu potrzeb MAE wynosi 0.03, to błąd jest średnio rzędu kilku punktów procentowych.

Dlatego MAE mówi o wielkości błędu „w praktyce”, a R² mówi o tym, jak dobrze model rozumie samą strukturę problemu.

Jak czytać tabelę bez technicznego przygotowania?

Najprościej tak:

sprawdź, czy R² jest wysokie – im bliżej 1, tym lepiej,
sprawdź, czy MAE jest małe – im mniejszy błąd, tym lepiej,
porównuj strategie między sobą i patrz, dla których parametrów model radzi sobie najlepiej.

Dzięki temu tabela przestaje być zestawem tajemniczych skrótów, a staje się prostą odpowiedzią na pytanie:

Zdankiewicz.pl

rozwiązania dla administracji publicznej i nie tylko

czy AI naprawdę umie przewidywać wyniki i jak dobrze robi to dla różnych strategii?

Jak dobrze AI przewiduje wyniki Teorii Beczki?

Co oznaczają te nagłówki i liczby?

Co oznaczają poszczególne nagłówki?

Co oznacza R² i jak je czytać?

A co oznacza MAE?

Jak czytać tabelę bez technicznego przygotowania?

Wnioski

Co oznaczają poszczególne nagłówki?

Co oznacza R² i jak je czytać?

A co oznacza MAE?

Jak czytać tabelę bez technicznego przygotowania?