GPT 5.5 코딩 능력 코덱스 활용법 2026 - 설치부터 토큰 절약까지 5분 정리

GPT 5.5가 풀린 첫 주 동안 코덱스(Codex)로 사이드 프로젝트 두 개를 직접 갈아엎으면서 진짜 쓸만한 부분만 골라드릴게요!
OpenAI가 2026년 4월 23일에 공개한 이 모델은 Terminal-Bench 2.0에서 82.7%, SWE-Bench Pro에서 58.6%로 일반에 공개된 모델 중 에이전트 코딩 1위에 다시 올라선 상태거든요. 무엇보다 GPT-5.4 대비 같은 작업에 출력 토큰을 약 40% 적게 쓰면서도 더 좋은 결과를 낸다는 점이 핵심이에요.
근데 처음 코덱스를 켜면 모델 이름, 토큰 한도, AGENTS.md, 승인 모드 같은 게 한 번에 쏟아져서 뭐부터 만져야 할지 막막하더라고요. 그래서 GPT 5.5 코딩 능력 코덱스 활용법 2026 기준으로 설치부터 요금제 선택까지 한 번에 정리해드릴게요.
GPT 5.5의 등장과 코딩 성능 핵심 정리
GPT-5.5는 2026년 4월 23일에 ChatGPT와 코덱스로 먼저 공개됐고, 다음 날인 4월 24일 API에도 풀렸어요. 핵심 포인트는 GPT-5.4 대비 같은 코덱스 작업을 끝내는 데 출력 토큰을 약 40% 덜 쓰면서도 거의 모든 에이전트 코딩 벤치마크에서 더 높은 점수를 기록했다는 점이거든요.
특히 20시간짜리 장기 코딩 작업을 다루는 OpenAI 내부 평가인 Expert-SWE에서 73.1%를 기록해, GPT-5.4의 68.5%보다 4.6포인트 올라섰어요. ARC-AGI-2 검증판도 85.0%로 클로드 Opus 4.7(75.8%), 제미나이 3.1 Pro(77.1%)를 앞선 상태예요. 모델은 표준판 GPT-5.5와 더 많은 병렬 추론을 쓰는 GPT-5.5 Pro 두 종류로 나뉘어요.
| 항목 | 수치/상세 |
|---|---|
| 출시일 (ChatGPT/Codex) | 2026년 4월 23일 |
| API 공개일 | 2026년 4월 24일 |
| Terminal-Bench 2.0 | 82.7% (SOTA) |
| SWE-Bench Pro | 58.6% |
| Expert-SWE (20시간 작업) | 73.1% |
| ARC-AGI-2 | 85.0% |
| API 컨텍스트 | 1M 토큰 |
| Codex 컨텍스트 | 400K 토큰 |
| 토큰 효율 | GPT-5.4 대비 약 40% 감소 |

코덱스(Codex)는 어떤 도구이고 어디서 쓸 수 있나
코덱스는 OpenAI가 만든 코딩 에이전트로, 4가지 표면을 한 번에 지원해요. 터미널에서 도는 CLI, VS Code 확장, 맥용 데스크톱 앱, 그리고 웹 기반의 Codex Cloud예요. 이 4개가 모두 같은 ~/.codex/config.toml과 AGENTS.md, 캐시된 로그인을 공유하기 때문에 한 번 세팅해두면 다른 표면에서 그대로 이어 쓸 수 있어요.
실행 환경은 샌드박스 기반이라, 코덱스가 작업 디렉터리 바깥 파일을 건드리거나 허락받지 않은 네트워크 호출을 하는 걸 기본적으로 막아줘요. 풀 액세스로 도는 다른 도구들에 비해 실수 한 줄로 시스템이 망가질 가능성이 작은 편이에요. 인증은 ChatGPT 로그인 또는 API 키 둘 중 하나로 가능해요.
| 인터페이스 | 지원 OS | 주요 특징 |
|---|---|---|
| CLI | macOS / Linux / Windows | Rust 기반 오픈소스, 가장 빠름 |
| VS Code 확장 | 전 플랫폼 | IDE 통합, 같은 config 공유 |
| 데스크톱 앱 | macOS 전용 | GUI 작업, 컴퓨터 사용 기능 |
| Codex Cloud (웹) | 브라우저 | 클라우드 작업, diff 적용 가능 |

코덱스 CLI 설치와 첫 실행까지 5분 컷
설치는 npm 한 줄이면 끝나요. Node.js 22 이상이 필요하고, 패키지 자체는 50MB 정도로 가벼운 편이에요. 윈도우는 PowerShell 네이티브 샌드박스나 WSL2 둘 중 하나로 가야 안정적으로 동작해요.
설치 명령은 다음과 같아요: npm install -g @openai/codex. 그리고 작업 폴더에서 codex 한 줄을 치면 첫 실행 화면이 떠요. 처음에는 ChatGPT 로그인 또는 API 키 입력 중에 하나를 고르게 되는데, 매월 정해진 한도 안에서 쓰고 싶으면 ChatGPT 로그인이 유리하고, 토큰 단가로 정확히 과금하고 싶으면 API 키 쪽이 깔끔해요.
codex --auto-edit로 시작하는 걸 추천드려요. 잘못 수정돼도 브랜치를 통째로 버리면 되니까 원본이 다칠 일이 없거든요. 익숙해진 다음에 메인 브랜치에서 풀 액세스로 옮기는 흐름이 안정적이에요.세션 안에서 자주 쓰는 명령은 /status(현재 사용 한도 확인), /model(모델 변경), 그리고 codex resume --last(직전 세션 이어가기)예요.
| 요구사항 | 최소/권장 |
|---|---|
| Node.js | 22 이상 필수 |
| RAM | 최소 4GB / 권장 8GB |
| 디스크 | npm 패키지 약 50MB |
| 지원 OS | macOS, Linux 네이티브 / Windows는 PowerShell 또는 WSL2 |
| 설치 명령 | npm install -g @openai/codex |
| 승인 모드 | Read-only / Auto-edit / Full access |

AGENTS.md로 프로젝트 규칙 한 번에 잡기
AGENTS.md는 코덱스가 작업 시작 직전에 읽는 룰북이에요. 글로벌 디렉터리(~/.codex/)부터 시작해서 프로젝트 루트, 그리고 현재 작업 디렉터리까지 트리를 따라 내려가면서 모든 AGENTS.md를 합쳐서 컨텍스트로 주입해요. 같은 디렉터리에 AGENTS.override.md가 있으면 그쪽을 우선해서 읽고요.
한 번 잘 적어두면 매번 같은 컨벤션을 반복 설명할 필요가 없어요. 기본 사이즈 한도는 32 KiB(약 32,000자)이고, config.toml에서 project_doc_max_bytes 값을 늘리면 더 많은 룰을 넣을 수도 있어요. 처음이라면 작업 폴더에서 /init 명령으로 자동 생성된 템플릿을 받아 거기에 살을 붙이는 방식이 가장 빨라요.
실제로 잘 작동하는 AGENTS.md 구성은 보통 4가지 블록으로 나뉘어요. ① Tech Stack(Next.js 15, TypeScript strict 등 사용 기술 명시), ② Conventions(파일 구조, 네이밍 룰), ③ Commands(npm test, lint 명령), ④ Do NOT(절대 건드리면 안 되는 영역). 이 네 블록만 7~8줄씩 적어둬도 결과가 눈에 띄게 깔끔해져요.
| 위치 | 적용 범위 | 우선순위 |
|---|---|---|
| ~/.codex/AGENTS.md | 모든 프로젝트 (전역 기본값) | 가장 낮음 |
| {repo}/AGENTS.md | 해당 리포지토리 전체 | 중간 |
| {repo}/하위/AGENTS.override.md | 해당 디렉터리만 | 가장 높음 |
| ~/.codex/AGENTS.override.md | 전역 임시 덮어쓰기 | 전역 최우선 |

실전 워크플로우 - 리팩토링, 리뷰, 디버깅 묶음 사용법
코덱스를 쓰다 보면 자연스럽게 자리잡는 패턴이 세 가지 있어요. ① 코드 정리(리팩토링), ② 변경 검토(리뷰), ③ 다중 파일 디버깅이에요. 핵심은 처음에 Read-only 모드로 제안만 받아본 뒤, /diff로 변경을 미리 확인하고, 안전하다 싶으면 Auto-edit로 넘기는 단계적 신뢰 패턴이거든요.
자주 쓰는 명령어는 /init, /diff, /review, /compact, /clear, /usage 정도예요. 특히 /review는 메인 브랜치 대비 변경분이나 특정 커밋 단위로 코드를 검토해주기 때문에, 커밋 직전 한 번 돌리는 습관만 들여놓으면 PR 코멘트 양이 눈에 띄게 줄어요. 대화가 길어졌을 때는 /compact로 요약 후 이어가면 컨텍스트 한도를 더 오래 쓸 수 있어요.
외부 도구 연동은 MCP(Model Context Protocol)로 처리해요. codex mcp add playwright -- npx -y @playwright/mcp 한 줄로 브라우저 테스트 자동화를 붙이거나, Context7 같은 문서 MCP를 연결해 최신 라이브러리 문서를 코덱스가 직접 참조하게 만들 수 있어요. 헤드리스로 CI/CD 파이프라인에 통합하고 싶다면 codex exec 명령을 쓰면 돼요.
| 명령어 | 주요 용도 |
|---|---|
| /init | AGENTS.md 자동 생성 |
| /diff | 제안된 변경 미리보기 |
| /review | 브랜치/커밋 단위 코드 리뷰 |
| /compact | 긴 대화 요약 후 이어가기 |
| /clear | 세션 초기화 |
| /usage | 현재 컨텍스트 점유율 확인 |
| codex resume --last | 직전 세션 이어가기 |
| codex exec | 헤드리스 모드 (CI/CD용) |

요금제 선택과 토큰 절약 실전 팁
코덱스 비용은 별도가 아니라 ChatGPT 플랜에 포함되는 구조예요. Plus($20/월)는 한 주에 몇 차례 집중 코딩 세션 정도, Pro($100/월·$200/월)는 매일 길게 돌리는 사람용이에요. Free와 Go는 트라이얼 수준만 풀려 있어서, 본격적으로 쓸 거면 Plus 이상부터 고민하는 게 현실적이에요.
중요한 변화 하나는 2026년 4월 2일자로 코덱스 과금 방식이 메시지당 크레딧에서 토큰 단위로 전환됐다는 점이에요. 같은 한 메시지여도 입력·캐시·출력 토큰을 얼마나 썼느냐에 따라 크레딧이 다르게 빠져나가요. Pro $100 티어는 5월 31일까지 평소의 2배인 10x Plus 사용량 프로모를 적용 중이고, Pro $200 티어는 20x Plus가 상시 혜택으로 들어가 있어요. API 토큰 가격은 GPT-5.5가 입력 100만 토큰당 5달러, 출력 100만 토큰당 30달러로 GPT-5.4 대비 정확히 2배예요. Batch와 Flex 모드는 절반 가격, Priority 모드는 2.5배 가격이에요.
/compact로 주기적으로 요약하기. OpenAI 내부 통계상 평균 코덱스 비용은 개발자당 월 100~200달러 선이에요.| 플랜 | 월 요금 | 코덱스 사용 강도 |
|---|---|---|
| Free / Go | $0 / $5 | 제한된 트라이얼 |
| Plus | $20 | 주 단위 가벼운 코딩 세션 |
| Pro $100 | $100 | 일상 코딩 (5월 31일까지 2x 프로모) |
| Pro $200 | $200 | 고강도 (20x Plus 상시 혜택) |
| Business / Enterprise | 별도 협의 | 팀 단위, 데이터 보안 강화 |
| API GPT-5.5 | $5 / $30 (1M 토큰) | 토큰 단위 종량제 |
| API GPT-5.5 Pro | $30 / $180 (1M 토큰) | 심층 추론·연구용 |

클로드 코드, 제미나이 CLI와 비교 그리고 직접 써본 인상
같은 가격대에서 코덱스가 가장 강한 곳은 터미널 워크플로우와 긴 컨텍스트예요. Terminal-Bench 2.0에서 GPT-5.5는 82.7%, Claude Opus 4.7은 69.4%로 13포인트 이상 차이가 나거든요. 128K~256K 토큰 구간의 장기 컨텍스트 처리에서도 GPT-5.5가 87.5%, Claude가 59.2%로 격차가 꽤 큰 편이에요.
반면 Claude Opus 4.7은 GitHub 이슈 해결을 측정하는 SWE-Bench Pro에서 64.3% 대 GPT-5.5 58.6%로 5.7포인트 앞서 있어요. 토큰 단가도 Claude 쪽이 약간 싼 편이라, 출력 토큰 월 1,000만 토큰 기준으로 GPT-5.5 표준은 약 300달러, Claude Opus 4.7은 약 250달러 정도로 차이가 나요. 그래서 한 도구로 다 끝내기보단 작업 성격에 따라 갈라 쓰는 흐름으로 가는 사람이 늘었어요. 제미나이 CLI는 무료 티어가 넉넉하고 구글 검색 통합이 강점이지만, 도구 호출 안정성은 코덱스 쪽이 한 단계 위라는 평이 일반적이에요.
직접 홈서버에 코덱스 CLI를 깔고 사이드 프로젝트 두 개(Next.js 기반)를 돌려봤는데, AGENTS.md를 한 줄도 안 적고 그냥 돌렸을 때와 7~8줄만 적어둔 뒤 돌렸을 때의 결과 차이가 생각보다 컸어요. 같은 리팩토링을 시켰는데 룰 적은 쪽은 한 번에 깔끔하게 끝났고, 안 적은 쪽은 컨벤션이 어긋난 부분을 다시 고치느라 두 번 더 돌리게 되더라고요. 그래서 처음 30분을 들여 AGENTS.md부터 4블록(Tech Stack, Conventions, Commands, Do NOT)으로 적어두는 걸 가장 우선 추천드린답니다.
| 도구 | 강점 | 약점 |
|---|---|---|
| GPT-5.5 + Codex | 터미널 워크플로우, 긴 컨텍스트, 토큰 효율 | SWE-Bench Pro에서 Claude에 밀림 |
| Claude Opus 4.7 + Code | GitHub 이슈 해결, 토큰 단가 | Terminal-Bench에서 13포인트 차이 |
| Gemini CLI | 무료 티어, 구글 검색 통합 | 도구 호출 안정성 떨어짐 |

자주 묻는 질문
GPT-5.5는 무료 ChatGPT에서도 쓸 수 있나요?
무료 플랜에서는 코덱스 자체가 트라이얼 수준만 열려 있고 GPT-5.5는 사용할 수 없어요. GPT-5.5는 Plus($20/월) 이상 유료 플랜에서 ChatGPT와 코덱스 양쪽으로 풀려 있고, GPT-5.5 Pro는 Pro·Business·Enterprise에서만 쓸 수 있는 구조예요.
한국에서 결제할 때 환율 부담은 어느 정도인가요?
OpenAI는 달러로 결제되기 때문에 환율 변동에 따라 원화 청구액이 달라져요. 환율 1,400원대 기준으로 Plus는 약 28,000원, Pro $100은 약 14만원, Pro $200은 약 28만원 선에서 청구된답니다. 카드 해외 결제 수수료가 1~3% 정도 더 붙는다는 점도 함께 보시는 게 좋아요.
윈도우에서도 코덱스 CLI를 쓸 수 있나요?
가능해요. 두 가지 옵션이 있는데, 첫째는 PowerShell에서 윈도우 네이티브 샌드박스로 돌리는 방식이고, 둘째는 WSL2에서 리눅스 환경으로 돌리는 방식이에요. 안정성과 호환성은 WSL2 쪽이 더 좋고, 설치 자체가 간편한 건 PowerShell 네이티브 쪽이에요. macOS와 Linux는 어떤 옵션이든 네이티브로 잘 돌아간답니다.
AGENTS.md를 안 적어도 코덱스가 동작하나요?
동작은 정상적으로 해요. 다만 코덱스가 프로젝트의 컨벤션을 알 방법이 없어서 매번 같은 설명을 반복해야 하고, 결과물도 기존 코드 스타일과 어긋나는 경우가 자주 생겨요. 7~8줄짜리 짧은 AGENTS.md만 적어둬도 한 번에 끝나는 작업 비율이 눈에 띄게 올라가는 편이에요.
코덱스 CLI에서 사용 한도가 다 떨어지면 어떻게 되나요?
두 가지 방법이 있어요. ChatGPT Plus와 Pro 이용자는 추가 크레딧을 구매해 그 자리에서 계속 쓸 수 있고, 다른 방법으로는 API 키로 로그인을 전환해서 토큰 단위 종량제로 이어 쓰는 것도 가능해요. 잠깐 한도를 늘리고 싶을 때는 가벼운 작업을 GPT-5.4-mini 모델로 돌려 한도 소모를 줄이는 우회법도 자주 쓰여요.
GPT-5.5 Pro를 꼭 써야 할까요?
일반적인 코딩 작업은 표준 GPT-5.5만으로도 충분히 처리돼요. GPT-5.5 Pro가 빛을 보는 영역은 어려운 수학 증명, 학술 논문 분석, 깊은 BrowseComp 검색처럼 추론을 길게 끌고 가야 하는 작업이거든요. API 단가도 표준판($5/$30) 대비 6배인 입력 30달러, 출력 180달러라서 비용 차이가 큰 만큼 작업 성격을 보고 선택하는 편이 합리적이에요.
결론
GPT-5.5와 코덱스 조합은 공개된 지 며칠 안 됐는데도 쓰임새가 빠르게 안정되는 추세예요. 핵심만 다시 추리면 ① npm 한 줄로 CLI 깔기, ② AGENTS.md를 4블록(Tech Stack, Conventions, Commands, Do NOT)으로 7~8줄씩 적어두기, ③ Read-only → Auto-edit로 단계적 신뢰 옮기기, ④ 안 쓰는 MCP 서버 끄기, ⑤ 가벼운 작업은 GPT-5.4-mini로 돌려 한도 절약하기, 이렇게 5가지예요.
한 번에 다 외우지 않아도 괜찮으니, 오늘은 일단 npm install -g @openai/codex 한 줄로 설치만 해보고 자주 쓰는 사이드 프로젝트 폴더에서 codex만 한 번 쳐보시기를 추천드린답니다. 첫 5분만 투자해보시면 이후 작업 패턴이 자연스럽게 잡혀갈 거예요.
댓글
댓글 쓰기