"#51 — Szybko zmieniająca się technologia"

Drogi Czytelniku,

W 2024 roku biznesowe uzasadnienia dla wdrożeń AI w przedsiębiorstwach często opierano na założeniu, które wtedy wydawało się rozsądne: że koszty wnioskowania (inference) będą stale spadać. Każda kolejna generacja modeli miała być tańsza za token, każdy model potężniejszy za tę samą cenę. W połowie 2026 roku to założenie się odwróciło. Gemini 3.5 Flash kosztuje, po uwzględnieniu zużycia tokenów, mniej więcej pięć razy więcej za zadanie niż jego poprzednik. GPT-5.5 i Claude Opus 4.7 również okazały się droższe w przeliczeniu na zadanie od swoich poprzedników. Założenia kosztowe projektu, którego rentowność modelowano na podstawie cen wnioskowania z 2024 roku, mogą być kilkakrotnie wyższe lub niższe od obecnej rzeczywistości — a to tylko jedna z warstw. Organizacje, które zbudowały swoją architekturę wiedzy AI wokół dedykowanych baz wektorowych, zostały z kategorią produktów, którą rynek w międzyczasie wchłonął do platform hybrydowych. LangChain, dominujący framework do orkiestracji dwa lata temu, zreorganizował się wokół LangGraph, wprowadzając fundamentalne zmiany w API, które wymagały przebudowy architektury w oprogramowaniu, które było na nim oparte. Żadna z tych zmian nie została zapowiedziana z wyprzedzeniem.

Plan wdrożeniowy, który tego wszystkiego nie przewidział, niekoniecznie był źle zaprojektowany. Po prostu z dużą precyzją określał niewłaściwe rzeczy — na przykład który dostawca hostuje integrację albo który model obsługuje dany krok — a mógł przy tym pozostawiać niejasne to, co naprawdę istotne: na który element biznesu program ma wpłynąć i jak architektura ma się utrzymać, gdy zewnętrzne warstwy pod nią się zmienią.

Sześciomiesięczny horyzont

W 2025 roku Viktor Malyi opublikował tezę, która od tamtej pory krąży w kręgach menedżerów odpowiedzialnych za dane (CDO): horyzont planowania dłuższy niż sześć miesięcy oznacza, że angażujesz zasoby w oparciu o świat, który nie będzie istniał, gdy spróbujesz plan zrealizować. Ma on rację, ale tylko w odniesieniu do jednej warstwy. Analiza Nasscom, dotycząca przyczyn zatrzymania planów wdrożeń AI w 2025 roku, jest bardziej precyzyjna co do tego, o którą warstwę chodzi: programy, które utknęły, zazwyczaj sztywno określały dwie rzeczy, które nie powinny być sztywno określone — model, na którym miały działać, oraz stos technologiczny dostawcy, który miał go hostować. Kiedy oba te elementy zmieniły się w połowie roku — modele zostały wycofane, a ceny platform odwróciły trend — plany wdrożeniowe wymagały przebudowy od drugiej warstwy w dół. 18-miesięczny horyzont jest odpowiedni dla architektury governance i celów biznesowych. Dla decyzji o modelach i dostawcach to zupełnie niewłaściwy rytm.

Wzorzec RAG ewoluował z techniki wyszukiwania w coś, co praktycy nazywają teraz silnikiem kontekstowym (context engine), gdzie grafy wiedzy zastępują proste wyszukiwanie wektorowe w zarządzanych wdrożeniach produkcyjnych — to kolejna decyzja architektoniczna, która wyglądała na stabilną, a okazała się taka nie być.

Co faktycznie zawiera plan transformacji AI

Narzucenie jednego horyzontu planowania na wszystkie warstwy to błąd strukturalny. Każda z nich zmienia się w innym tempie, a traktowanie ich tak, jakby działały w jednym rytmie, prowadzi do załamania całego planu.

Budowa centrum danych czy plan capex dla firmy produkcyjnej pozwalają zamrozić koszty i specyfikacje z 18-miesięcznym wyprzedzeniem, ponieważ ich składowe – ceny sprzętu, etaty, licencje – zmieniają się powoli. Program AI składa się z warstw, które funkcjonują w zupełnie innych cyklach. Część z nich trzeba ustalić zanim ruszy jakakolwiek praca deweloperska, natomiast jedną projektuje się z myślą o ciągłej adaptacji. Systemowy błąd polega na przykładaniu tego samego rygoru do każdej z nich.

Plan transformacji składa się z czterech elementów.

Wynik biznesowy jest stały i precyzyjny. Określa, na którą linię P&L ma mieć wpływ dany projekt, przez jakie metryki operacyjne będziemy to mierzyć i w jakich granicach kosztowych ten efekt pozostaje opłacalny. Koszty wnioskowania (inference) okazały się zmienne w obu kierunkach, dlatego business case nie może być konkretnym punktem, a raczej przedziałem. Składa się na niego scenariusz bazowy oraz stress test przy dwu- lub trzykrotnie wyższych kosztach wnioskowania — przy czym analiza wrażliwości opiera się na wskaźniku automatyzacji, bo to on najsilniej wpływa na opłacalność projektu. Sam cel i warunki jego opłacalności to jeden, nierozłączny mechanizm.

Docelowy model operacyjny zamraża się zanim jakikolwiek deployment wejdzie na produkcję. To specyfikacja procesu dostosowanego pod AI, która klasyfikuje każdy krok według typu decyzji, kosztu błędu i wymaganego w tym miejscu nadzoru człowieka. Nie mówimy tu o mapowaniu obecnego stanu, ale o zdefiniowaniu docelowego. Gdzie AI działa autonomicznie, gdzie człowiek musi zweryfikować wynik, a gdzie podejmuje ostateczną decyzję. Zmiany w architekturze procesu wprowadzane już po rozpoczęciu prac deweloperskich kosztują znacznie więcej.

Architektura governance jest sztywna i niezmienna w czasie. Obejmuje zasady ochrony danych, wymogi dotyczące audit trail, warunki aktywacji kill-switch oraz pełen harmonogram nadchodzących regulacji prawnych. Infrastruktura nadzoru dobudowywana do istniejącego rozwiązania już po wdrożeniu jest słabsza i droższa niż governance zaprojektowany od samego początku.

Elastyczna architektura integracji projektowana jest raz, z wyraźnym naciskiem na zdolność do adaptacji. Gateway lub warstwa routingu zarządza wyborem modelu w fazie runtime, na bieżąco optymalizując wywołania pod kątem aktualnych kosztów i jakości. Plan transformacji nie wymienia tu żadnego modelu z nazwy — definiuje jedynie sposób integracji oraz parametry, według których gateway ma optymalizować ruch. To, jaki konkretnie model znajduje się pod spodem, jest decyzją operacyjną realizowaną przez gateway, a nie strategicznym wyborem zaszytym w dokumencie planistycznym.

Według Gartnera, do końca 2027 roku ponad 40% projektów wykorzystujących agentowe AI trafi do kosza z powodu braku jasnej wartości biznesowej. W wielu spośród przypadków pierwotny business case opierał się na decyzjach wdrożeniowych, które z czasem uległy zmianie.

Pierwszy program AI uruchamiany przez organizację tworzy wzorzec planowania, którą będą powielać wszystkie kolejne. Firmy, które zaczynają od skupienia się na oczekiwanym wyniku biznesowym, a samo podejście do wdrożenia traktują jako elastyczne, zachowują tę dyscyplinę na przyszłość. Te, które na starcie przywiązują się do konkretnego dostawcy i wersji modelu, również przenoszą ten nawyk dalej.

Dlaczego ta struktura działa

Czterokomponentowa struktura jest odporna, ponieważ każdy element jest dobrany specjalnie z uwagi na jego niezależność od tego, co zmienia się najszybciej. Wynik biznesowy nie staje się błędny, ponieważ model został wycofany. Architektura governance nie wymaga przebudowy, ponieważ na rynku pojawił się nowy dostawca. Analiza programów transformacji AI w przedsiębiorstwach autorstwa Larridina z 2026 roku opisuje tę samą logikę jako core-and-orbit: stabilny rdzeń, wokół którego zewnętrzna warstwa narzędzi i integracji może być rewidowana bez naruszania go.

Organizacja, która zdefiniowała reguły nadzoru w kategoriach typu decyzji i kosztu błędu, może wymienić model bez przebudowy warstwy nadzoru. Ta, której reguły są wyrażone w kategoriach specyficznych dla modelu — progi confidence, kontrole formatu odpowiedzi — musi ponownie walidować i kalibrować za każdym razem, gdy model się zmienia.

90-dniowa pętla

To, co zastępuje 18-miesięczny plan, to cykl planistyczny działający w sposób ciągły w 90-dniowym rytmie — każda iteracja aktualizuje zewnętrzną orbitę, podczas gdy stabilne zobowiązania pozostają w mocy. Dziewięćdziesiąt dni jest zgodne z kwartalnymi cyklami raportowania biznesowego i zarządczego, więc rewizja planu i przegląd rachunku zysków i strat odbywają się w tym samym rytmie. Jest to również okres wystarczająco bliski faktycznemu tempu zmian w cenach modeli i opcjach dostawców, aby wychwycić złe założenie, zanim jego skutki się skumulują, a jednocześnie wystarczająco długi, aby coś zrealizować i zaobserwować wyniki.

Każdy cykl obejmuje cztery działania. Ocenia to, co jest obecnie wdrożone — poziom jakości, wskaźnik automatyzacji oraz co zmieniło się w bazowych parametrach kosztu lub zdolności od poprzedniego cyklu. Ta ocena napędza przegląd zewnętrznej orbity: czy obecna umowa z dostawcą nadal odzwierciedla najlepszy dostępny kompromis koszt-jakość; czy parametry routingu w gatewayu wymagają aktualizacji; czy zmiana zdolności otworzyła przypadek użycia, który nie był ekonomicznie opłacalny w zeszłym kwartale? Na podstawie tego przeglądu dokonuje się ponownej priorytetyzacji prac wdrożeniowych na następny kwartał. Następnie realizuje się plan i mierzy efekty w odniesieniu do tej pozycji w rachunku zysków i strat, na którą program miał wpłynąć — nie liczby agentów czy wdrożeń, ale metryki operacyjnej, do której faktycznie zakotwiczony jest wynik biznesowy.

Dokument dla zarządu, który z tego powstaje, pokazuje architekturę governance i wyniki biznesowe jako stałe zobowiązania, a konkretne implementacje jako bieżące wybory z ich znanymi warunkami rewizji. Menedżer (CDO) prezentujący taki materiał jest w innej pozycji niż ten, który broni nieaktualnego planu: plan został zaprojektowany, by absorbować zmiany, a oto jak wygląda jego wersja na ten kwartał.

W ten sposób praca również procentuje. Pierwszy cykl ustanawia bazowy proces i metody pomiarowe. Drugi udoskonala oba na podstawie tego, co ujawnia produkcja. W czwartym lub piątym cyklu korekty są już oparte na rzeczywistych danych.

The Briefing

Podczas konferencji deweloperskiej Build w dniach 2–3 czerwca 2026 r. Microsoft ogłosił rodzinę modeli MAI — własne generatywne modele AI, opracowane w celu zmniejszenia zależności przedsiębiorstw od OpenAI i obniżenia kosztów wnioskowania dla deweloperów. MAI-Thinking-1, obecnie w prywatnym podglądzie, ma specyficzną cechę, którą Microsoft mocno promuje: udokumentowane pochodzenie licencji komercyjnych, co oznacza, że model był trenowany bez destylacji na danych licencjonowanych, co ma na celu rozwianie obaw dotyczących ryzyka prawnego, które spowalniały zakupy w sektorach regulowanych. Azure Foundry hostuje obecnie ponad 12 000 modeli. Dla planowania AI w przedsiębiorstwach istotnym sygnałem jest nie tyle to, który model wybrać, ile to, co ta zapowiedź potwierdza: krajobraz dostawców, wokół którego organizacje planowały 12 miesięcy temu, znacznie się zmienił, a zamykanie się na jedną platformę jako strategiczne zobowiązanie jest zakładem, który wymaga ponownej oceny.

Konferencja IBM Think 2026, która odbyła się w tym tygodniu, pozycjonowała firmę wokół warstwy operacyjnej dla AI w przedsiębiorstwach — łącząc orkiestrację agentów, dane w czasie rzeczywistym, operacje i narzędzia do suwerenności danych, wprost w odpowiedzi na pilotażowe wdrożenia AI, które mają problemy ze skalowaniem. IBM Sovereign Core osiągnął ogólną dostępność: to oprogramowanie do budowy suwerennych środowisk gotowych na AI, które pozwala przedsiębiorstwom weryfikować swoją kontrolę od początku do końca. Przekaz Arvinda Krishny był bezpośredni: hybryda jako trwała architektura, AI-first jako zmiana modelu operacyjnego. Ramowanie “suwerenności” rezonuje inaczej na rynkach, gdzie lokalizacja danych i nadzór rządowy nad infrastrukturą AI są żywymi problemami — co obejmuje większość środkowoeuropejskiego rynku przedsiębiorstw, do którego zwraca się IBM.

Pytania dla Twojego zespołu zarządzającego

Kiedy ostatni raz przeglądaliśmy konfigurację naszego gatewaya i umowy z dostawcami w ramach świadomej, kwartalnej decyzji, a nie w odpowiedzi na wycofanie produktu lub niespodziankę cenową? Jeśli odpowiedź brzmi “nigdy” lub “gdy byliśmy zmuszeni”, co to mówi o tym, czy warstwa routingu faktycznie istnieje w opisany sposób — czy też wybory poszczególnych modeli wciąż są dokonywane ręcznie?
Gdyby ktoś z zarządu zapytał jutro, na którą konkretną pozycję w rachunku zysków i strat nasz program AI ma wpłynąć — i o ile, i do kiedy — czy potrafilibyśmy odpowiedzieć jednym zdaniem? Czy też program jest obecnie definiowany przez to, co buduje, a nie przez to, co zmienia?
Dla każdego wdrożenia AI, które jest obecnie aktywne lub w fazie rozwoju: czy model ludzkiego nadzoru, który zaprojektowaliśmy, przetrwałby wymianę narzędzia lub modelu? Ile w praktyce zajęłaby dzisiaj wymiana modelu od decyzji do wdrożenia na produkcję?
Patrząc na inicjatywy AI, które anulowaliśmy lub wstrzymaliśmy w ciągu ostatnich 12 miesięcy — czy zostały anulowane, ponieważ technologia nie działała, czy dlatego, że pierwotne uzasadnienie opierało się na założeniach, które się pod nim osunęły? Co zmieniłaby 90-dniowa pętla planistyczna?

Podsumowanie

Szczegółowe 18-miesięczne plany załamują się, gdy technologia idzie do przodu. Zobowiązanie do wyniku jest stałe i precyzyjne; implementacja jest tymczasowa i podatna na zmiany. Planowanie w szybko zmieniającym się środowisku polega mniej na skracaniu horyzontu, a bardziej na wiedzy, jakie zobowiązania plan faktycznie podejmuje — i na pozostawieniu reszty otwartej na kwartalną rewizję.

Zachowaj równowagę, Krzysztof

Krzysztof Goworek jest założycielem Quintant — firmy doradczej, która prowadzi przedsiębiorstwa od eksperymentów AI do realnej, mierzalnej wartości.