Multi-agent w OpenAI Codex: Jak 6 agentów przeglądało PR równolegle

Jeden agent przegląda pull request przez 15 minut. Sześć agentów — każdy skupiony na innym aspekcie — kończy w 3 minuty. To nie science fiction, to multi-agent workflows w OpenAI Codex.

Czym są multi-agent workflows?
Wbudowane role agentów
Konfiguracja w config.toml
Przykład: 6 agentów przegląda PR
Kiedy multi-agent pomaga, a kiedy przeszkadza
Podsumowanie

Czym są multi-agent workflows? {#czym-sa-multi-agent}

Multi-agent to architektura, w której kilka niezależnych agentów AI pracuje równolegle nad różnymi aspektami tego samego zadania. Zamiast jednego wszechwiedzącego agenta, masz zespół specjalistów.

W kontekście Codex oznacza to, że możesz:

Uruchomić 6 agentów, z których każdy sprawdza inny aspekt kodu
Dać każdemu agentowi inne instrukcje i inne uprawnienia
Zebrać wyniki i połączyć je w jeden raport

Analogia: Wyobraź sobie code review w zespole. Jeden programista sprawdza bezpieczeństwo, drugi wydajność, trzeci czytelność. Każdy jest ekspertem w swojej dziedzinie. Multi-agent to dokładnie taka architektura — tylko że zamiast ludzi pracują agenci AI.

Żeby włączyć multi-agent w Codex, wystarczy jedna linia w konfiguracji:

[features]
multi_agent = true

Wbudowane role agentów {#role-wbudowane}

Codex oferuje cztery wbudowane role, które możesz przypisać agentom:

Wbudowane role agentów w Codex

Rola	Przeznaczenie	Tryb sandbox
default	Zadania ogólne, fallback	Pełne uprawnienia
worker	Implementacja, pisanie kodu	Pełne uprawnienia
explorer	Eksploracja bazy kodu, analiza	Tylko odczyt
monitor	Monitorowanie długich procesów	Tylko odczyt

Rola explorer jest idealna do code review — agent może czytać kod, ale nie może go modyfikować. To naturalne ograniczenie dla zadań analitycznych.

Rola worker nadaje się do zadań implementacyjnych, gdzie agent musi pisać i testować kod.

Konfiguracja w config.toml {#konfiguracja}

Własne role definiujesz w pliku konfiguracyjnym Codex. Oto przykład agenta-recenzenta:

[agents]
max_threads = 6
max_depth = 1

[agents.reviewer]
description = "PR reviewer dla poprawności i bezpieczeństwa"
config_file = "agents/reviewer.toml"

Parametr max_threads = 6 oznacza, że Codex może uruchomić do 6 agentów równolegle. Parametr max_depth = 1 ogranicza zagnieżdżenie — agenci nie mogą tworzyć własnych sub-agentów.

Plik agents/reviewer.toml definiuje szczegóły roli:

model = "gpt-5.3-codex"
model_reasoning_effort = "high"
sandbox_mode = "read-only"
developer_instructions = """
Przeglądaj kod jak właściciel produktu.
Priorytet: poprawność, bezpieczeństwo, brakujące testy.
"""

Zwróć uwagę na sandbox_mode = "read-only" — recenzent nie powinien modyfikować kodu, tylko go analizować. Więcej o bezpieczeństwie i uprawnieniach agentów przeczytasz w artykule o AGENTS.md w Codex.

Przykład: 6 agentów przegląda PR {#przyklad-pr-review}

Załóżmy, że masz duży pull request — 47 zmienionych plików, 2300 linii kodu. Jeden agent przegląda to sekwencyjnie, sprawdzając wszystko po kolei. To trwa.

Z multi-agent możesz napisać:

Przejrzyj ten branch. Uruchom osobnego agenta dla każdego obszaru:
1. Luki bezpieczeństwa
2. Jakość kodu i czytelność
3. Potencjalne bugi i edge case y
4. Warunki wyścigu i współbieżność
5. Kruchość testów
6. Długoterminowa utrzymywalność

Codex utworzy 6 agentów, każdy z własnym focusem. Pracują równolegle, każdy czyta kod przez pryzmat swojej specjalizacji.

Efekt: PR, który jeden agent przeglądał 15 minut, sześciu agentów przeglądnie w 3 minuty. A co ważniejsze — każdy agent jest głębiej skupiony na swoim obszarze, więc jakość recenzji jest wyższa.

Wyniki zbierasz w jednym raporcie. Agenci mogą też wchodzić w interakcje — np. agent ds. bezpieczeństwa może poprosić agenta ds. testów o sprawdzenie, czy istnieją testy dla znalezionych luk.

Kiedy multi-agent pomaga, a kiedy przeszkadza {#kiedy-stosowac}

Multi-agent to potężne narzędzie, ale nie dla każdego zadania.

Używaj multi-agent gdy:

Zadanie można podzielić na niezależne pod-zadania
Każde pod-zadanie wymaga innej perspektywy lub ekspertyzy
Czas jest krytyczny (równoległość = szybkość)
Potrzebujesz głębokiej analizy w wielu wymiarach

Unikaj multi-agent gdy:

Zadanie jest liniowe i sekwencyjne
Pod-zadania są od siebie zależne
Kod jest mały (overhead koordynacji przewyższa zysk)
Potrzebujesz jednej, spójnej wizji (np. projektowanie architektury)

Uwaga: Multi-agent zwiększa zużycie tokenów. Jeśli 6 agentów czyta ten sam kod, płacisz za 6 razy więcej tokenów wejściowych. Warto to uwzględnić w budżecie.

Dobrą praktyką jest zacząć od jednego agenta i dodawać kolejnych tylko gdy widzisz konkretną potrzebę. Integracja Codex z narzędziami zewnętrznymi przez MCP może dodatkowo zwiększyć możliwości każdego agenta.

Podsumowanie {#podsumowanie}

Multi-agent workflows w Codex pozwalają podzielić złożone zadania między wyspecjalizowanych agentów pracujących równolegle. Cztery wbudowane role (default, worker, explorer, monitor) pokrywają podstawowe scenariusze, ale możesz definiować własne role w config.toml.

Kluczowe zasady:

Włącz multi-agent przez multi_agent = true w konfiguracji
Ustaw max_threads na liczbę równoległych agentów
Definiuj role z odpowiednimi uprawnieniami (read-only dla recenzentów)
Używaj multi-agent dla zadań, które można zrównoleglić

Równoległy code review to tylko jeden przykład. Multi-agent sprawdzi się też przy refaktoryzacji dużych baz kodu, migracji między frameworkami czy audytach bezpieczeństwa.

Wdrożenie multi-agent