정의
Garry Tan이 오픈소스로 공개한, AI 에이전트를 “팀”으로 다루는 구조화된 소프트웨어 개발 운영 시스템. 단일 코딩 어시스턴트가 아니라 CEO·Staff Engineer·QA Lead·CSO·Designer 등 역할별 에이전트가 워크플로우를 분담한다. MIT 라이선스 오픈소스.
핵심 속성
- 역할 분할: CEO, Staff Engineer, QA Lead, Security Officer, Designer, Release Engineer, DevEx Reviewer, SRE, Technical Writer 등 역할별로 컨텍스트·기준·책임이 다름
- 핵심 명령어:
/office-hours(빌드 전 아이디어 인터로게이션),/review,/qa,/cso,/benchmark,/ship - 검증 레이어: Playwright 기반 실제 브라우저 QA. AI가 작성한 코드를 인간처럼 클릭·네비게이션·회귀 테스트 자동 생성
- 브라우저 서브시스템: 인증된 세션·장기 워크플로우·실제 네비게이션·다중 탭 작업이 지속됨 (대부분 AI 에이전트가 “장님”인 한계 극복)
- 포터블성: Claude Code, Codex CLI, Cursor, Gemini, OpenClaw 등 다양한 에이전트 지원
- 이론적 입장: “prompting is not the moat. Process is.” — 약한 프롬프트 × 강한 프로세스 > 강한 프롬프트 × 혼돈
관계
- 20260515-agent-team-operating-layer — 동일 카테고리: Paperclip + Hermes도 유사 패턴이지만 검증 레이어는 약함
- 20260510-agent-execution-right-is-new-moat — 연장: 실행 권한이 모트가 되는 흐름의 정점
- 20260508-no-evals-no-improvement-direction — 보완: GStack의 검증 레이어는 evals 부재 문제를 메우는 시도
- 20260508-demo-to-product-gap-7-patterns — 동일 문제: 데모는 동작하지만 프로덕션은 깨진다
인용
The future isn’t “AI writes code.” The future is: AI writes code, AI reviews code, AI tests code, AI debugs code, AI ships code. End-to-end autonomous software operations.
A mediocre prompt inside a strong operational system beats a brilliant prompt inside chaos.