czy AI naprawdę umie przewidywać wyniki tej symulacji i jak dobrze robi to dla różnych strategii?

Jak dobrze AI przewiduje wyniki Teorii Beczki?

Po przygotowaniu zbiorów treningowych dla kilku strategii podlewania można było wreszcie sprawdzić, jak dobrze model uczenia maszynowego radzi sobie z przewidywaniem wyników bez wykonywania pełnej symulacji dzień po dniu.

W tym etapie badania wykorzystano po 1000 przykładów dla każdej strategii. Dane zostały podzielone na dwie części:

  • 800 przykładów uczących – na nich model się uczył,
  • 200 przykładów testowych – na nich sprawdzano, jak radzi sobie z danymi, których wcześniej nie widział.

Dzięki temu można było uczciwie ocenić, czy model naprawdę nauczył się zależności, czy tylko zapamiętał wcześniejsze przypadki.

Poniżej znajduje się porównanie czterech strategii:

  • no_rain + cold – nie podlewaj w dni deszczowe i w chłodne dni,
  • constant – stałe podlewanie,
  • seasonal – podlewanie tylko w sezonie, bez deszczu,
  • temp_seasonal – podlewanie sezonowe zależne także od temperatury.
Strategia Capacity MAE / R² Used MAE / R² Coverage MAE / R² Overflow MAE / R² Turnover MAE / R²
no_rain + cold 1136 L / 0.899 7.82 / 0.943 0.055 / 0.900 7.65 / 0.919 2.15 / 0.859
constant 1102 L / 0.872 6.63 / 0.964 0.032 / 0.925 5.33 / 0.866 3.59 / 0.862
seasonal 1167 L / 0.907 7.80 / 0.913 0.067 / 0.892 8.40 / 0.928 1.98 / 0.793
temp_seasonal 1428 L / 0.869 10.24 / 0.793 0.102 / 0.750 10.34 / 0.873 1.83 / 0.827

Na pierwszy rzut oka widać, że model najlepiej radzi sobie z prostszymi strategiami, a najtrudniejsza okazała się strategia temp_seasonal, czyli taka, w której podlewanie zależy nie tylko od sezonu i opadów, ale również od temperatury.

To nie jest zaskoczenie. Im bardziej złożona logika działania, tym trudniej modelowi ML wiernie odwzorować zachowanie pełnej symulacji.

Co oznaczają te nagłówki i liczby?

W tabeli porównawczej przy każdej strategii pojawiają się skróty typu Capacity MAE / R², Used MAE / R² itd. Dla osoby spoza świata ML może to brzmieć dość tajemniczo, więc warto to rozbroić prostym językiem.

Każda z tych kolumn mówi o tym, jak dobrze model AI przewiduje konkretny rodzaj wyniku. Zapis MAE / R² oznacza po prostu dwie różne miary jakości modelu:

  • MAE mówi, o ile średnio model się myli,
  • mówi, jak dobrze model rozumie zależności w danych.

Najprościej:

  • mniejsze MAE = lepiej
  • większe R² = lepiej

Co oznaczają poszczególne nagłówki?

Capacity MAE / R²
To jakość przewidywania rekomendowanej pojemności zbiornika. Innymi słowy: jak dobrze model zgaduje, czy zbiornik powinien mieć na przykład 2000, 3000 albo 5000 litrów.

Used MAE / R²
To jakość przewidywania ile deszczówki uda się wykorzystać w ciągu roku. Czyli jak dobrze model szacuje roczne zużycie wody ze zbiornika.

Coverage MAE / R²
To jakość przewidywania jaką część potrzeb podlewania pokryje deszczówka. Na przykład czy deszczówka pokryje 40%, 70% albo 90% planowanego zapotrzebowania.

Overflow MAE / R²
To jakość przewidywania ile wody się przeleje i nie zmieści w zbiorniku. To można traktować jako miarę strat wynikających z ograniczonej pojemności.

Turnover MAE / R²
To jakość przewidywania jak intensywnie pracuje zbiornik w ciągu roku, czyli ile razy jego objętość jest w praktyce „wykorzystana”.

Co oznacza R² i jak je czytać?

To właśnie jest często najbardziej mylące, więc warto je wyjaśnić po ludzku.

pokazuje, na ile model potrafi wychwycić prawdziwe zależności w danych. Im bliżej 1, tym lepiej.

  • R² = 0.98 oznacza wynik znakomity. Model prawie idealnie łapie zależności i bardzo dobrze przewiduje dany parametr.
  • R² = 0.90 oznacza wynik bardzo dobry. Model wyraźnie rozumie problem i daje wiarygodne przewidywania.
  • R² = 0.75 oznacza wynik nadal dobry, ale już wyraźnie słabszy. Model rozumie dużą część zależności, ale częściej się myli i mniej precyzyjnie odwzorowuje rzeczywistość.
  • R² = 0.50 oznacza wynik średni. Model coś łapie, ale jeszcze sporo mu brakuje.
  • R² bliskie 0 oznacza, że model prawie nie rozumie zależności i jego przewidywania są słabe.

Najprościej można to zapamiętać tak:

  • 0.95-1.00 – bardzo blisko ideału
  • 0.85-0.95 – bardzo dobrze
  • 0.70-0.85 – dobrze, ale z wyraźnym marginesem błędu
  • poniżej 0.70 – model wymaga ostrożności albo dalszego douczenia

A co oznacza MAE?

MAE to średni błąd bezwzględny. Pokazuje, o ile przeciętnie model myli się w liczbach.

Dla przykładu:

  • jeśli przy pojemności zbiornika MAE wynosi 1100 L, to model myli się średnio o około 1100 litrów,
  • jeśli przy pokryciu potrzeb MAE wynosi 0.03, to błąd jest średnio rzędu kilku punktów procentowych.

Dlatego MAE mówi o wielkości błędu „w praktyce”, a mówi o tym, jak dobrze model rozumie samą strukturę problemu.

Jak czytać tabelę bez technicznego przygotowania?

Najprościej tak:

  • sprawdź, czy jest wysokie – im bliżej 1, tym lepiej,
  • sprawdź, czy MAE jest małe – im mniejszy błąd, tym lepiej,
  • porównuj strategie między sobą i patrz, dla których parametrów model radzi sobie najlepiej.

Dzięki temu tabela przestaje być zestawem tajemniczych skrótów, a staje się prostą odpowiedzią na pytanie:

czy AI naprawdę umie przewidywać wyniki tej symulacji i jak dobrze robi to dla różnych strategii?

Wnioski

Najważniejszy wniosek z tego etapu jest dość prosty: AI naprawdę potrafi nauczyć się przewidywać wyniki Teorii Beczki, ale nie każda strategia jest dla niej równie łatwa.

Najlepiej wypadają strategie prostsze, takie jak constant czy no_rain + cold. W ich przypadku model bardzo dobrze przewiduje roczne wykorzystanie wody, pokrycie potrzeb oraz przelewy.

Strategia seasonal także wypada bardzo dobrze, choć już widać nieco większą złożoność problemu. Najtrudniejsza okazuje się temp_seasonal, co jest logiczne, bo w tej wersji dochodzi więcej ruchomych elementów: sezon, opad i wpływ temperatury.

To jednak nie jest zła wiadomość. Wręcz przeciwnie: oznacza to, że obecne podejście działa i daje mocny punkt odniesienia. Teraz można spokojnie przejść do kolejnego etapu, czyli sprawdzić, czy model da się jeszcze uprościć i uogólnić przez normalizację względem powierzchni oraz przejście do jednostek wyrażanych w milimetrach.

Innymi słowy: pierwszy etap został zamknięty sukcesem. Teraz zaczyna się etap drugi, w którym można sprawdzić, czy da się zbudować model jeszcze bardziej elegancki, skalowalny i odporny na zmianę powierzchni zbierania deszczówki.

W tabeli porównawczej przy każdej strategii pojawiają się skróty typu Capacity MAE / R², Used MAE / R² itd. Dla osoby spoza świata ML może to brzmieć dość tajemniczo, więc warto to rozbroić prostym językiem.

Każda z tych kolumn mówi o tym, jak dobrze model AI przewiduje konkretny rodzaj wyniku. Zapis MAE / R² oznacza po prostu dwie różne miary jakości modelu:

  • MAE mówi, o ile średnio model się myli,
  • mówi, jak dobrze model rozumie zależności w danych.

Najprościej:

  • mniejsze MAE = lepiej
  • większe R² = lepiej

Co oznaczają poszczególne nagłówki?

Capacity MAE / R²
To jakość przewidywania rekomendowanej pojemności zbiornika. Innymi słowy: jak dobrze model zgaduje, czy zbiornik powinien mieć na przykład 2000, 3000 albo 5000 litrów.

Used MAE / R²
To jakość przewidywania ile deszczówki uda się wykorzystać w ciągu roku. Czyli jak dobrze model szacuje roczne zużycie wody ze zbiornika.

Coverage MAE / R²
To jakość przewidywania jaką część potrzeb podlewania pokryje deszczówka. Na przykład czy deszczówka pokryje 40%, 70% albo 90% planowanego zapotrzebowania.

Overflow MAE / R²
To jakość przewidywania ile wody się przeleje i nie zmieści w zbiorniku. To można traktować jako miarę strat wynikających z ograniczonej pojemności.

Turnover MAE / R²
To jakość przewidywania jak intensywnie pracuje zbiornik w ciągu roku, czyli ile razy jego objętość jest w praktyce „wykorzystana”.

Co oznacza R² i jak je czytać?

To właśnie jest często najbardziej mylące, więc warto je wyjaśnić po ludzku.

pokazuje, na ile model potrafi wychwycić prawdziwe zależności w danych. Im bliżej 1, tym lepiej.

  • R² = 0.98 oznacza wynik znakomity. Model prawie idealnie łapie zależności i bardzo dobrze przewiduje dany parametr.
  • R² = 0.90 oznacza wynik bardzo dobry. Model wyraźnie rozumie problem i daje wiarygodne przewidywania.
  • R² = 0.75 oznacza wynik nadal dobry, ale już wyraźnie słabszy. Model rozumie dużą część zależności, ale częściej się myli i mniej precyzyjnie odwzorowuje rzeczywistość.
  • R² = 0.50 oznacza wynik średni. Model coś łapie, ale jeszcze sporo mu brakuje.
  • R² bliskie 0 oznacza, że model prawie nie rozumie zależności i jego przewidywania są słabe.

Najprościej można to zapamiętać tak:

  • 0.95-1.00 – bardzo blisko ideału
  • 0.85-0.95 – bardzo dobrze
  • 0.70-0.85 – dobrze, ale z wyraźnym marginesem błędu
  • poniżej 0.70 – model wymaga ostrożności albo dalszego douczenia

A co oznacza MAE?

MAE to średni błąd bezwzględny. Pokazuje, o ile przeciętnie model myli się w liczbach.

Dla przykładu:

  • jeśli przy pojemności zbiornika MAE wynosi 1100 L, to model myli się średnio o około 1100 litrów,
  • jeśli przy pokryciu potrzeb MAE wynosi 0.03, to błąd jest średnio rzędu kilku punktów procentowych.

Dlatego MAE mówi o wielkości błędu „w praktyce”, a mówi o tym, jak dobrze model rozumie samą strukturę problemu.

Jak czytać tabelę bez technicznego przygotowania?

Najprościej tak:

  • sprawdź, czy jest wysokie – im bliżej 1, tym lepiej,
  • sprawdź, czy MAE jest małe – im mniejszy błąd, tym lepiej,
  • porównuj strategie między sobą i patrz, dla których parametrów model radzi sobie najlepiej.

Dzięki temu tabela przestaje być zestawem tajemniczych skrótów, a staje się prostą odpowiedzią na pytanie:

 

Teoria Beczki i AI

Teoria Beczki i AI: czy da się nauczyć model przewidywać wynik zamiast liczyć go od zera?

Na pierwszy rzut oka Teoria Beczki wygląda jak zwykły kalkulator internetowy. Użytkownik wpisuje kilka parametrów, klika przycisk i po chwili dostaje rekomendowaną pojemność zbiornika na deszczówkę.

W rzeczywistości pod spodem nie działa prosty wzór, ale pełna symulacja. To oznacza, że każda odpowiedź wymaga wykonania szeregu obliczeń opartych na rzeczywistych danych pogodowych. I właśnie w tym miejscu pojawia się bardzo ciekawe pytanie:

czy taki wynik da się przewidywać szybciej za pomocą modelu AI lub ML, zamiast za każdym razem liczyć wszystko od nowa? Czytaj dalej

Teoria Beczki

Teoria Beczki: ile deszczówki naprawdę da się wykorzystać?

Deszczówka brzmi świetnie. W teorii wystarczy zbiornik, kilka rur i już można podlewać ogród wodą z nieba. W praktyce szybko pojawia się pytanie: jak duży zbiornik ma sens?

Za mały przeleje się po pierwszym większym deszczu. Za duży będzie kosztowny i przez większość czasu niewykorzystany. Właśnie po to powstała Teoria Beczki.

To internetowe narzędzie, które pomaga dobrać pojemność zbiornika na deszczówkę na podstawie rzeczywistych danych pogodowych, a nie zgadywania.

Co można policzyć?

Serwis pozwala oszacować, jak zachowywałby się zbiornik na deszczówkę w długim okresie, przy zadanej powierzchni dachu lub innej powierzchni zbierającej wodę.

Można sprawdzić między innymi:

  • jaką pojemność zbiornika warto rozważyć,
  • ile wody uda się realnie wykorzystać w ciągu roku,
  • ile wody przeleje się i zostanie niewykorzystane,
  • jak często zbiornik będzie pusty,
  • jaki procent zapotrzebowania na podlewanie pokryje deszczówka,
  • jak intensywnie będzie pracował zbiornik w ciągu roku.

To nie jest prosty kalkulator typu „powierzchnia razy opad”. Model bierze pod uwagę przebieg pogody dzień po dniu. Czytaj dalej

AI nie zabierze mi pracy bo zarabiam śrubokrętem?

Wszędzie słychać to samo: „Sztuczna inteligencja zabierze pracę programistom, księgowym, lekarzom… nawet prawnicy są zagrożeni!” Wniosek? Jeśli nie chcesz być zastąpiony przez robota, lepiej już dziś zacznij ćwiczyć machanie łopatą. Bo podobno tylko prace fizyczne są bezpieczne – przecież AI nie przybije gwoździa ani nie wymieni uszczelki, prawda? Prawda?

No i tu wchodzę ja, cały na innowacyjnie biało, i pokazuję, że AI nie tylko nie zabiera pracy, ale może ją znacząco ułatwić. Wziąłem na warsztat przykład mojego kolegi – serwisanta AGD. Facet naprawia pralki, lodówki, zmywarki, czyli jak najbardziej fizyczna robota, żadne tam wirtuale. Ale to nie znaczy, że sztuczna inteligencja nie może mu pomóc! Czytaj dalej

Złap czas

Automatyzacja procesów wniosków o dotacje – jak VBA usprawnia pracę

W codziennej pracy administracyjnej czy w organizacjach zajmujących się przyznawaniem dotacji kluczowe jest sprawne zarządzanie dokumentacją, monitorowanie procesów oraz automatyzacja rutynowych zadań. Mając na uwadze te potrzeby, stworzyłem program w VBA, który znacząco usprawnia obsługę wniosków o dotacje. Projekt ten został zaprezentowany w ramach prezentacji dostępnej pod adresem: Złap Czas. Czytaj dalej

Sztuczna inteligencja w lokalizacji telefonów – czyli moja praca dyplomowa z 2009 roku.

Nie każdy pamięta, ale 16 lat temu świat wyglądał trochę inaczej. Smartfony dopiero zaczynały zdobywać popularność, a GPS w telefonach był luksusem, a nie standardem. O sztucznej inteligencji mówiło się głównie na uczelniach i w laboratoriach badawczych.

Już wtedy widziałem potencjał uczenia maszynowego i postanowiłem sprawdzić, czy można lokalizować telefony bez wbudowanego GPS – wykorzystując tylko dane z sieci komórkowej (moc sygnału). Pomysł wydawał się trochę dziwaczny, bo dominowały wtedy klasyczne metody jak triangulacja  sygnału z masztów GSM. Matematyczny układ równań, który nie uwzględniał przeszkód dla sygnału GSM w mieście.

Czytaj dalej

Infokawka.pl

Na potrzeby Wydziału Środowiska i Rolnictwa Tadeusz Zdankiewicz stworzył serwis informacyjny infokawka.pl na temat programu dotacji do wymiany lokalnych węglowych źródeł ciepła na proekologiczne.

Strona zawiera wszelkie informacje nt. programu Kawka. Obwieszczenia, wzory wniosków a przede wszystkim obszerne wademekum wszelkich formalności potrzebnych do uzyskania dotacji

 

Ranking stron internetowych urzędów miast wojewódzkich

Wypozycjonowany Wrocław

Wrocławski portal miejski zwyciężył w rankingu serwisów miast wojewódzkich.

W sierpniu 2011 roku zespół Bluerank, opublikował kolejny Bluepaper podsumowujący SEO i Usability serwisów internetowych urzędów miast wojewódzkich. Raport podsumowuje badanie SEO i użyteczności serwisów administracji publicznej ze wszystkich 16 województw Polski. Podczas jego tworzenia sprawdzono jak witryny miast prezentują się w 5 kategoriach: pozycji oraz widoczności w wyszukiwarce, optymalizacji SEO, linków zewnętrznych, użyteczności i dostępności.

Ranking stron internetowych urzędów miast wojewódzkich

Czytaj dalej

Kody 2D na przystankach komunikacji miejskiej

Kody 2D na przystankach komunikacji miejskiej

Na początku lipca 2009 Tadeusz Zdankiewicz opracował i wdrożył pomysł umieszczenia tabliczek z kodami 2D na przystankach komunikacji miejskiej.

Dzięki kodom pasażerowie zyskali łatwiejszy dostęp do stron www z aktualnymi rozkładami jazdy z danego przystanku. Zamiast wpisywać www.mobi.wroclaw.pl/przystanek_xxxxx.html, gdzie xxxxx jest numerem przystanku – wystarczy skorzystać ze specjalnego programu w telefonie komórkowym. W najnowszych aparatach jest on zainstalowany fabrycznie. Posiadacze trochę starszych komórek mogą pobrać program z Internetu i zainstalować, podobnie, jak robi się to, instalując nowe dzwonki.
Darmową aplikację FOTOKODY można pobrać wysyłając SMS o treści fotokody na bezpłatny numer: 8085.

Co to jest kod 2D? Czytaj dalej