Multi-agent w OpenAI Codex: Jak 6 agentów przeglądało PR równolegle

Jeden agent przegląda pull request przez 15 minut. Sześć agentów — każdy skupiony na innym aspekcie — kończy w 3 minuty. To nie science fiction, to multi-agent workflows w OpenAI Codex.

  1. Czym są multi-agent workflows?
  2. Wbudowane role agentów
  3. Konfiguracja w config.toml
  4. Przykład: 6 agentów przegląda PR
  5. Kiedy multi-agent pomaga, a kiedy przeszkadza
  6. Podsumowanie

Czym są multi-agent workflows? {#czym-sa-multi-agent}

Multi-agent to architektura, w której kilka niezależnych agentów AI pracuje równolegle nad różnymi aspektami tego samego zadania. Zamiast jednego wszechwiedzącego agenta, masz zespół specjalistów.

W kontekście Codex oznacza to, że możesz:

  • Uruchomić 6 agentów, z których każdy sprawdza inny aspekt kodu
  • Dać każdemu agentowi inne instrukcje i inne uprawnienia
  • Zebrać wyniki i połączyć je w jeden raport

Analogia: Wyobraź sobie code review w zespole. Jeden programista sprawdza bezpieczeństwo, drugi wydajność, trzeci czytelność. Każdy jest ekspertem w swojej dziedzinie. Multi-agent to dokładnie taka architektura — tylko że zamiast ludzi pracują agenci AI.

Żeby włączyć multi-agent w Codex, wystarczy jedna linia w konfiguracji:

[features]
multi_agent = true

Wbudowane role agentów {#role-wbudowane}

Codex oferuje cztery wbudowane role, które możesz przypisać agentom:

Wbudowane role agentów w Codex
RolaPrzeznaczenieTryb sandbox
defaultZadania ogólne, fallbackPełne uprawnienia
workerImplementacja, pisanie koduPełne uprawnienia
explorerEksploracja bazy kodu, analizaTylko odczyt
monitorMonitorowanie długich procesówTylko odczyt

Rola explorer jest idealna do code review — agent może czytać kod, ale nie może go modyfikować. To naturalne ograniczenie dla zadań analitycznych.

Rola worker nadaje się do zadań implementacyjnych, gdzie agent musi pisać i testować kod.

Konfiguracja w config.toml {#konfiguracja}

Własne role definiujesz w pliku konfiguracyjnym Codex. Oto przykład agenta-recenzenta:

[agents]
max_threads = 6
max_depth = 1

[agents.reviewer]
description = "PR reviewer dla poprawności i bezpieczeństwa"
config_file = "agents/reviewer.toml"

Parametr max_threads = 6 oznacza, że Codex może uruchomić do 6 agentów równolegle. Parametr max_depth = 1 ogranicza zagnieżdżenie — agenci nie mogą tworzyć własnych sub-agentów.

Plik agents/reviewer.toml definiuje szczegóły roli:

model = "gpt-5.3-codex"
model_reasoning_effort = "high"
sandbox_mode = "read-only"
developer_instructions = """
Przeglądaj kod jak właściciel produktu.
Priorytet: poprawność, bezpieczeństwo, brakujące testy.
"""

Zwróć uwagę na sandbox_mode = "read-only" — recenzent nie powinien modyfikować kodu, tylko go analizować. Więcej o bezpieczeństwie i uprawnieniach agentów przeczytasz w artykule o AGENTS.md w Codex.

Przykład: 6 agentów przegląda PR {#przyklad-pr-review}

Załóżmy, że masz duży pull request — 47 zmienionych plików, 2300 linii kodu. Jeden agent przegląda to sekwencyjnie, sprawdzając wszystko po kolei. To trwa.

Z multi-agent możesz napisać:

Przejrzyj ten branch. Uruchom osobnego agenta dla każdego obszaru:
1. Luki bezpieczeństwa
2. Jakość kodu i czytelność
3. Potencjalne bugi i edge case y
4. Warunki wyścigu i współbieżność
5. Kruchość testów
6. Długoterminowa utrzymywalność

Codex utworzy 6 agentów, każdy z własnym focusem. Pracują równolegle, każdy czyta kod przez pryzmat swojej specjalizacji.

Efekt: PR, który jeden agent przeglądał 15 minut, sześciu agentów przeglądnie w 3 minuty. A co ważniejsze — każdy agent jest głębiej skupiony na swoim obszarze, więc jakość recenzji jest wyższa.

Wyniki zbierasz w jednym raporcie. Agenci mogą też wchodzić w interakcje — np. agent ds. bezpieczeństwa może poprosić agenta ds. testów o sprawdzenie, czy istnieją testy dla znalezionych luk.

Kiedy multi-agent pomaga, a kiedy przeszkadza {#kiedy-stosowac}

Multi-agent to potężne narzędzie, ale nie dla każdego zadania.

Używaj multi-agent gdy:

  • Zadanie można podzielić na niezależne pod-zadania
  • Każde pod-zadanie wymaga innej perspektywy lub ekspertyzy
  • Czas jest krytyczny (równoległość = szybkość)
  • Potrzebujesz głębokiej analizy w wielu wymiarach

Unikaj multi-agent gdy:

  • Zadanie jest liniowe i sekwencyjne
  • Pod-zadania są od siebie zależne
  • Kod jest mały (overhead koordynacji przewyższa zysk)
  • Potrzebujesz jednej, spójnej wizji (np. projektowanie architektury)

Uwaga: Multi-agent zwiększa zużycie tokenów. Jeśli 6 agentów czyta ten sam kod, płacisz za 6 razy więcej tokenów wejściowych. Warto to uwzględnić w budżecie.

Dobrą praktyką jest zacząć od jednego agenta i dodawać kolejnych tylko gdy widzisz konkretną potrzebę. Integracja Codex z narzędziami zewnętrznymi przez MCP może dodatkowo zwiększyć możliwości każdego agenta.

Podsumowanie {#podsumowanie}

Multi-agent workflows w Codex pozwalają podzielić złożone zadania między wyspecjalizowanych agentów pracujących równolegle. Cztery wbudowane role (default, worker, explorer, monitor) pokrywają podstawowe scenariusze, ale możesz definiować własne role w config.toml.

Kluczowe zasady:

  • Włącz multi-agent przez multi_agent = true w konfiguracji
  • Ustaw max_threads na liczbę równoległych agentów
  • Definiuj role z odpowiednimi uprawnieniami (read-only dla recenzentów)
  • Używaj multi-agent dla zadań, które można zrównoleglić

Równoległy code review to tylko jeden przykład. Multi-agent sprawdzi się też przy refaktoryzacji dużych baz kodu, migracji między frameworkami czy audytach bezpieczeństwa.

Wdrożenie multi-agent