Twój agent AI potrzebuje supervisora – i to nie AI

Twój agent AI potrzebuje supervisora – i to nie AI

Pełna automatyzacja brzmi świetnie. Agent AI, który sam odpowiada na zapytania, sam podejmuje decyzje, sam wykonuje zadania. Zero pracy z twojej strony.

Aż do momentu, gdy wyśle klientowi coś, czego nie powinien. Albo usunie dane, które miały zostać. Albo zinterpretuje złośliwe instrukcje ukryte w dokumencie.

To nie teoria – to udokumentowane incydenty. Agent AI potrzebuje supervisora.

  1. Dlaczego agent może się pomylić
  2. Kiedy automatyzacja jest bezpieczna
  3. Kiedy potrzebujesz człowieka
  4. Trzy poziomy nadzoru
  5. Jak zaprojektować dobre potwierdzenie
  6. Problem dialog fatigue
  7. Praktyczny balans

Dlaczego agent może się pomylić

Agent AI to nie deterministyczny program. To model probabilistyczny, który może:

Sposoby na pomyłkę agenta
Typ błęduCo się dziejeKonsekwencja
HalucynacjaAgent wymyśla fakty lub daneWysyła nieprawdziwe informacje
Prompt injectionUkryte instrukcje w danych zmieniają zachowanieAgent robi co chce atakujący
Context confusionAgent myli konteksty różnych rozmówWysyła dane do złego odbiorcy
OverconfidenceAgent podejmuje decyzję bez wystarczających danychBłędne decyzje biznesowe

W lutym 2025 GitLab Duo – AI assistant w GitLabie – został zhakowany przez ukryte instrukcje w merge requeście. AI wykradło prywatny kod źródłowy na serwer atakującego. Zero interakcji z ofiarą – wszystko automatyczne.

Więcej o tym ataku: Atak na GitLab Duo.

Kiedy automatyzacja jest bezpieczna

Nie każda akcja wymaga ludzkiego nadzoru. Kluczowe pytania:

  1. Czy jest odwracalna? – Można cofnąć bez konsekwencji?
  2. Czy jest wewnętrzna? – Pozostaje w systemie, nie wychodzi na zewnątrz?
  3. Czy jest read-only? – Tylko odczyt, bez modyfikacji?
Akcje bezpieczne do automatyzacji
Typ akcjiPrzykładDlaczego bezpieczne
Odczyt danychSprawdzenie statusu zamówieniaNie zmienia stanu systemu
Wewnętrzne przetwarzanieAnaliza dokumentu, kategoryzacjaWynik pozostaje w systemie
Odwracalne akcjeDodanie tagu do kontaktuŁatwo cofnąć jednym kliknięciem
DraftyPrzygotowanie odpowiedzi do reviewNie wysyła, tylko proponuje

Kiedy potrzebujesz człowieka

Niektóre akcje są zbyt ryzykowne dla pełnej automatyzacji:

Akcje wymagające nadzoru
KategoriaPrzykładyRyzyko
Komunikacja zewnętrznaEmail do klienta, wiadomość na SlackuReputacja, nieodwracalne
Modyfikacja danychEdycja profilu klienta, zmiana zamówieniaIntegralność danych
Operacje finansoweZwrot, faktura, płatnośćStrata finansowa
UsuwanieDelete user, anuluj subskrypcjęNieodwracalne
EskalacjaPrzekazanie do managera, otwarcie ticketuOrganizacyjne

Zasada kciuka: Jeśli akcja jest nieodwracalna lub ma konsekwencje zewnętrzne – wymaga zatwierdzenia człowieka.

Trzy poziomy nadzoru

Nie musisz wybierać między pełną automatyzacją a ręcznym zatwierdzaniem wszystkiego. Wdrażaj różne poziomy nadzoru:

Poziomy nadzoru agenta
X zł"]} />
PoziomOpisDla jakich akcji
Full autoAgent wykonuje bez pytaniaOdczyt, analiza, drafty
ApprovalAgent proponuje, człowiek zatwierdzaWysyłanie, modyfikacja, eskalacja

Przykładowa konfiguracja:

czytaj_zamówienie: full-auto
zmieniaj_status: approval
wysyłaj_email: approval  
anuluj_zamówienie: approval (manager)
usuwaj_konto: disabled

Każda akcja ma swój poziom ryzyka. Dopasuj nadzór do ryzyka.

Jak zaprojektować dobre potwierdzenie

Nie wystarczy pokazać OK/Anuluj. Dobre potwierdzenie:

Elementy dobrego potwierdzenia
ElementDobry przykładDlaczego ważne
Opis akcji'Wysłać email do: jan@firma.pl'Jasne co się stanie
Pełna treśćCała treść wiadomościMożna zweryfikować przed wysłaniem
Kontekst'W odpowiedzi na pytanie o zwrot'Rozumiesz dlaczego agent to proponuje
OpcjeWyślij / Edytuj / AnulujMożesz poprawić, nie tylko akceptować
Timeout'Auto-anuluj za 24h jeśli brak decyzji'Nie blokuje systemu

Złe potwierdzenie:

Wysłać wiadomość?
[OK] [Anuluj]

Dobre potwierdzenie:

📧 Email do: jan.kowalski@firma.pl
Temat: Potwierdzenie zwrotu #12345

---
Szanowny Panie Janie,

Potwierdzam przyjęcie zgłoszenia zwrotu...
[pełna treść]
---

[Wyślij] [Edytuj] [Anuluj]

Kontekst: W odpowiedzi na ticket #789 z 2026-02-28

Problem dialog fatigue

Jeśli użytkownik musi zatwierdzać 50 akcji dziennie, zacznie klikać OK bez patrzenia. To dialog fatigue – i realne zagrożenie bezpieczeństwa.

Rozwiązania:

  1. Tylko wysokie ryzyko wymaga potwierdzenia
  2. Grupuj podobne akcje ('Wyślij 5 odpowiedzi?')
  3. Różnicuj UI – ważne akcje wyglądają inaczej
  4. Ucz agenta na podstawie feedbacku

Metryki do monitorowania:

  • Średni czas decyzji (< 2s = może klikanie bez czytania)
  • % odrzuceń (< 1% = może za dużo auto-approve)
  • % edycji przed zatwierdzeniem

Praktyczny balans

Start bezpiecznie:

  1. Zacznij z więcej nadzoru niż mniej
  2. Loguj wszystkie akcje agenta
  3. Obserwuj gdzie agent nie robi błędów
  4. Stopniowo automatyzuj bezpieczne kategorie

Reguły eskalacji:

Jeśli kwota > 1000 zł → wymaga managera
Jeśli klient VIP → wymaga supervisora
Jeśli agent niepewny (confidence < 80%) → wymaga człowieka
Jeśli to pierwszy kontakt z klientem → zawsze review

Platformy takie jak OpenClaw pozwalają konfigurować poziomy nadzoru per akcja, per użytkownik, per kontekst.

To nie jest wybór między automatyzacją a kontrolą. To projektowanie właściwego balansu dla twojego przypadku.