GPT 5.5 코딩 능력 코덱스 활용법 2026 - 설치부터 토큰 절약까지 5분 정리

A_modern_developer_workspace_with_202604300007.jpeg

GPT 5.5가 풀린 첫 주 동안 코덱스(Codex)로 사이드 프로젝트 두 개를 직접 갈아엎으면서 진짜 쓸만한 부분만 골라드릴게요!

OpenAI가 2026년 4월 23일에 공개한 이 모델은 Terminal-Bench 2.0에서 82.7%, SWE-Bench Pro에서 58.6%로 일반에 공개된 모델 중 에이전트 코딩 1위에 다시 올라선 상태거든요. 무엇보다 GPT-5.4 대비 같은 작업에 출력 토큰을 약 40% 적게 쓰면서도 더 좋은 결과를 낸다는 점이 핵심이에요.

근데 처음 코덱스를 켜면 모델 이름, 토큰 한도, AGENTS.md, 승인 모드 같은 게 한 번에 쏟아져서 뭐부터 만져야 할지 막막하더라고요. 그래서 GPT 5.5 코딩 능력 코덱스 활용법 2026 기준으로 설치부터 요금제 선택까지 한 번에 정리해드릴게요.

GPT 5.5의 등장과 코딩 성능 핵심 정리

GPT-5.5는 2026년 4월 23일에 ChatGPT와 코덱스로 먼저 공개됐고, 다음 날인 4월 24일 API에도 풀렸어요. 핵심 포인트는 GPT-5.4 대비 같은 코덱스 작업을 끝내는 데 출력 토큰을 약 40% 덜 쓰면서도 거의 모든 에이전트 코딩 벤치마크에서 더 높은 점수를 기록했다는 점이거든요.

특히 20시간짜리 장기 코딩 작업을 다루는 OpenAI 내부 평가인 Expert-SWE에서 73.1%를 기록해, GPT-5.4의 68.5%보다 4.6포인트 올라섰어요. ARC-AGI-2 검증판도 85.0%로 클로드 Opus 4.7(75.8%), 제미나이 3.1 Pro(77.1%)를 앞선 상태예요. 모델은 표준판 GPT-5.5와 더 많은 병렬 추론을 쓰는 GPT-5.5 Pro 두 종류로 나뉘어요.

📌 핵심 요약GPT-5.5는 토큰 효율과 에이전트 코딩 성능을 동시에 끌어올린 모델이에요. 일반 코딩에는 표준 GPT-5.5로 충분하고, GPT-5.5 Pro는 어려운 수학·연구·심층 검색 같은 무거운 작업에서만 추천드려요.
항목수치/상세
출시일 (ChatGPT/Codex)2026년 4월 23일
API 공개일2026년 4월 24일
Terminal-Bench 2.082.7% (SOTA)
SWE-Bench Pro58.6%
Expert-SWE (20시간 작업)73.1%
ARC-AGI-285.0%
API 컨텍스트1M 토큰
Codex 컨텍스트400K 토큰
토큰 효율GPT-5.4 대비 약 40% 감소
Abstract_neural_network_with_glowing_202604300007.jpeg

코덱스(Codex)는 어떤 도구이고 어디서 쓸 수 있나

코덱스는 OpenAI가 만든 코딩 에이전트로, 4가지 표면을 한 번에 지원해요. 터미널에서 도는 CLI, VS Code 확장, 맥용 데스크톱 앱, 그리고 웹 기반의 Codex Cloud예요. 이 4개가 모두 같은 ~/.codex/config.toml과 AGENTS.md, 캐시된 로그인을 공유하기 때문에 한 번 세팅해두면 다른 표면에서 그대로 이어 쓸 수 있어요.

실행 환경은 샌드박스 기반이라, 코덱스가 작업 디렉터리 바깥 파일을 건드리거나 허락받지 않은 네트워크 호출을 하는 걸 기본적으로 막아줘요. 풀 액세스로 도는 다른 도구들에 비해 실수 한 줄로 시스템이 망가질 가능성이 작은 편이에요. 인증은 ChatGPT 로그인 또는 API 키 둘 중 하나로 가능해요.

인터페이스지원 OS주요 특징
CLImacOS / Linux / WindowsRust 기반 오픈소스, 가장 빠름
VS Code 확장전 플랫폼IDE 통합, 같은 config 공유
데스크톱 앱macOS 전용GUI 작업, 컴퓨터 사용 기능
Codex Cloud (웹)브라우저클라우드 작업, diff 적용 가능
Multiple_devices_arranged_in_a_202604300008.jpeg

코덱스 CLI 설치와 첫 실행까지 5분 컷

설치는 npm 한 줄이면 끝나요. Node.js 22 이상이 필요하고, 패키지 자체는 50MB 정도로 가벼운 편이에요. 윈도우는 PowerShell 네이티브 샌드박스나 WSL2 둘 중 하나로 가야 안정적으로 동작해요.

설치 명령은 다음과 같아요: npm install -g @openai/codex. 그리고 작업 폴더에서 codex 한 줄을 치면 첫 실행 화면이 떠요. 처음에는 ChatGPT 로그인 또는 API 키 입력 중에 하나를 고르게 되는데, 매월 정해진 한도 안에서 쓰고 싶으면 ChatGPT 로그인이 유리하고, 토큰 단가로 정확히 과금하고 싶으면 API 키 쪽이 깔끔해요.

💡 첫 실행 안전 팁처음에는 git 브랜치를 따로 만들어둔 뒤 codex --auto-edit로 시작하는 걸 추천드려요. 잘못 수정돼도 브랜치를 통째로 버리면 되니까 원본이 다칠 일이 없거든요. 익숙해진 다음에 메인 브랜치에서 풀 액세스로 옮기는 흐름이 안정적이에요.

세션 안에서 자주 쓰는 명령은 /status(현재 사용 한도 확인), /model(모델 변경), 그리고 codex resume --last(직전 세션 이어가기)예요.

요구사항최소/권장
Node.js22 이상 필수
RAM최소 4GB / 권장 8GB
디스크npm 패키지 약 50MB
지원 OSmacOS, Linux 네이티브 / Windows는 PowerShell 또는 WSL2
설치 명령npm install -g @openai/codex
승인 모드Read-only / Auto-edit / Full access
Hands_typing_on_keyboard_202604300008.jpeg

AGENTS.md로 프로젝트 규칙 한 번에 잡기

AGENTS.md는 코덱스가 작업 시작 직전에 읽는 룰북이에요. 글로벌 디렉터리(~/.codex/)부터 시작해서 프로젝트 루트, 그리고 현재 작업 디렉터리까지 트리를 따라 내려가면서 모든 AGENTS.md를 합쳐서 컨텍스트로 주입해요. 같은 디렉터리에 AGENTS.override.md가 있으면 그쪽을 우선해서 읽고요.

한 번 잘 적어두면 매번 같은 컨벤션을 반복 설명할 필요가 없어요. 기본 사이즈 한도는 32 KiB(약 32,000자)이고, config.toml에서 project_doc_max_bytes 값을 늘리면 더 많은 룰을 넣을 수도 있어요. 처음이라면 작업 폴더에서 /init 명령으로 자동 생성된 템플릿을 받아 거기에 살을 붙이는 방식이 가장 빨라요.

실제로 잘 작동하는 AGENTS.md 구성은 보통 4가지 블록으로 나뉘어요. ① Tech Stack(Next.js 15, TypeScript strict 등 사용 기술 명시), ② Conventions(파일 구조, 네이밍 룰), ③ Commands(npm test, lint 명령), ④ Do NOT(절대 건드리면 안 되는 영역). 이 네 블록만 7~8줄씩 적어둬도 결과가 눈에 띄게 깔끔해져요.

⚠️ AGENTS.md 흔한 실수너무 길게 적으면 매 메시지마다 토큰을 다 까먹어서 사용 한도가 빨리 떨어져요. 32KiB 풀로 채우기보단 핵심만 1KB~3KB 정도로 압축하고, 도메인별 세부 규칙은 하위 폴더의 AGENTS.override.md로 분리하는 편이 효율적이에요.
위치적용 범위우선순위
~/.codex/AGENTS.md모든 프로젝트 (전역 기본값)가장 낮음
{repo}/AGENTS.md해당 리포지토리 전체중간
{repo}/하위/AGENTS.override.md해당 디렉터리만가장 높음
~/.codex/AGENTS.override.md전역 임시 덮어쓰기전역 최우선
Desk_with_manila_folders_notebook_202604300008.jpeg

실전 워크플로우 - 리팩토링, 리뷰, 디버깅 묶음 사용법

코덱스를 쓰다 보면 자연스럽게 자리잡는 패턴이 세 가지 있어요. ① 코드 정리(리팩토링), ② 변경 검토(리뷰), ③ 다중 파일 디버깅이에요. 핵심은 처음에 Read-only 모드로 제안만 받아본 뒤, /diff로 변경을 미리 확인하고, 안전하다 싶으면 Auto-edit로 넘기는 단계적 신뢰 패턴이거든요.

자주 쓰는 명령어는 /init, /diff, /review, /compact, /clear, /usage 정도예요. 특히 /review는 메인 브랜치 대비 변경분이나 특정 커밋 단위로 코드를 검토해주기 때문에, 커밋 직전 한 번 돌리는 습관만 들여놓으면 PR 코멘트 양이 눈에 띄게 줄어요. 대화가 길어졌을 때는 /compact로 요약 후 이어가면 컨텍스트 한도를 더 오래 쓸 수 있어요.

외부 도구 연동은 MCP(Model Context Protocol)로 처리해요. codex mcp add playwright -- npx -y @playwright/mcp 한 줄로 브라우저 테스트 자동화를 붙이거나, Context7 같은 문서 MCP를 연결해 최신 라이브러리 문서를 코덱스가 직접 참조하게 만들 수 있어요. 헤드리스로 CI/CD 파이프라인에 통합하고 싶다면 codex exec 명령을 쓰면 돼요.

⚠️ MCP 서버는 토큰 먹는 하마MCP 서버는 추가할 때마다 메시지에 컨텍스트가 더 실려서 사용 한도를 빠르게 까먹어요. 안 쓰는 서버는 비활성화하고, 진짜 필요한 1~2개만 켜두는 편이 한도 보전에 유리하답니다.
명령어주요 용도
/initAGENTS.md 자동 생성
/diff제안된 변경 미리보기
/review브랜치/커밋 단위 코드 리뷰
/compact긴 대화 요약 후 이어가기
/clear세션 초기화
/usage현재 컨텍스트 점유율 확인
codex resume --last직전 세션 이어가기
codex exec헤드리스 모드 (CI/CD용)
Isometric_workflow_diagram_with_…_202604300009.jpeg

요금제 선택과 토큰 절약 실전 팁

코덱스 비용은 별도가 아니라 ChatGPT 플랜에 포함되는 구조예요. Plus($20/월)는 한 주에 몇 차례 집중 코딩 세션 정도, Pro($100/월·$200/월)는 매일 길게 돌리는 사람용이에요. Free와 Go는 트라이얼 수준만 풀려 있어서, 본격적으로 쓸 거면 Plus 이상부터 고민하는 게 현실적이에요.

중요한 변화 하나는 2026년 4월 2일자로 코덱스 과금 방식이 메시지당 크레딧에서 토큰 단위로 전환됐다는 점이에요. 같은 한 메시지여도 입력·캐시·출력 토큰을 얼마나 썼느냐에 따라 크레딧이 다르게 빠져나가요. Pro $100 티어는 5월 31일까지 평소의 2배인 10x Plus 사용량 프로모를 적용 중이고, Pro $200 티어는 20x Plus가 상시 혜택으로 들어가 있어요. API 토큰 가격은 GPT-5.5가 입력 100만 토큰당 5달러, 출력 100만 토큰당 30달러로 GPT-5.4 대비 정확히 2배예요. Batch와 Flex 모드는 절반 가격, Priority 모드는 2.5배 가격이에요.

💡 토큰 절약 5가지① AGENTS.md 다이어트(32KiB 한도 풀로 채우지 않기) ② 안 쓰는 MCP 서버는 끄기 ③ 가벼운 작업은 GPT-5.4-mini로 돌리기(약 70% 비용 감소) ④ Fast mode(1.5배 빠르고 2.5배 비싼)는 정말 급할 때만 ⑤ 긴 세션은 /compact로 주기적으로 요약하기. OpenAI 내부 통계상 평균 코덱스 비용은 개발자당 월 100~200달러 선이에요.
플랜월 요금코덱스 사용 강도
Free / Go$0 / $5제한된 트라이얼
Plus$20주 단위 가벼운 코딩 세션
Pro $100$100일상 코딩 (5월 31일까지 2x 프로모)
Pro $200$200고강도 (20x Plus 상시 혜택)
Business / Enterprise별도 협의팀 단위, 데이터 보안 강화
API GPT-5.5$5 / $30 (1M 토큰)토큰 단위 종량제
API GPT-5.5 Pro$30 / $180 (1M 토큰)심층 추론·연구용
Stacked_coins_with_graphs_202604300010.jpeg

클로드 코드, 제미나이 CLI와 비교 그리고 직접 써본 인상

같은 가격대에서 코덱스가 가장 강한 곳은 터미널 워크플로우와 긴 컨텍스트예요. Terminal-Bench 2.0에서 GPT-5.5는 82.7%, Claude Opus 4.7은 69.4%로 13포인트 이상 차이가 나거든요. 128K~256K 토큰 구간의 장기 컨텍스트 처리에서도 GPT-5.5가 87.5%, Claude가 59.2%로 격차가 꽤 큰 편이에요.

반면 Claude Opus 4.7은 GitHub 이슈 해결을 측정하는 SWE-Bench Pro에서 64.3% 대 GPT-5.5 58.6%로 5.7포인트 앞서 있어요. 토큰 단가도 Claude 쪽이 약간 싼 편이라, 출력 토큰 월 1,000만 토큰 기준으로 GPT-5.5 표준은 약 300달러, Claude Opus 4.7은 약 250달러 정도로 차이가 나요. 그래서 한 도구로 다 끝내기보단 작업 성격에 따라 갈라 쓰는 흐름으로 가는 사람이 늘었어요. 제미나이 CLI는 무료 티어가 넉넉하고 구글 검색 통합이 강점이지만, 도구 호출 안정성은 코덱스 쪽이 한 단계 위라는 평이 일반적이에요.

직접 홈서버에 코덱스 CLI를 깔고 사이드 프로젝트 두 개(Next.js 기반)를 돌려봤는데, AGENTS.md를 한 줄도 안 적고 그냥 돌렸을 때와 7~8줄만 적어둔 뒤 돌렸을 때의 결과 차이가 생각보다 컸어요. 같은 리팩토링을 시켰는데 룰 적은 쪽은 한 번에 깔끔하게 끝났고, 안 적은 쪽은 컨벤션이 어긋난 부분을 다시 고치느라 두 번 더 돌리게 되더라고요. 그래서 처음 30분을 들여 AGENTS.md부터 4블록(Tech Stack, Conventions, Commands, Do NOT)으로 적어두는 걸 가장 우선 추천드린답니다.

도구강점약점
GPT-5.5 + Codex터미널 워크플로우, 긴 컨텍스트, 토큰 효율SWE-Bench Pro에서 Claude에 밀림
Claude Opus 4.7 + CodeGitHub 이슈 해결, 토큰 단가Terminal-Bench에서 13포인트 차이
Gemini CLI무료 티어, 구글 검색 통합도구 호출 안정성 떨어짐
Two_laptops_facing_each_other_202604300011.jpeg

자주 묻는 질문

GPT-5.5는 무료 ChatGPT에서도 쓸 수 있나요?

무료 플랜에서는 코덱스 자체가 트라이얼 수준만 열려 있고 GPT-5.5는 사용할 수 없어요. GPT-5.5는 Plus($20/월) 이상 유료 플랜에서 ChatGPT와 코덱스 양쪽으로 풀려 있고, GPT-5.5 Pro는 Pro·Business·Enterprise에서만 쓸 수 있는 구조예요.

한국에서 결제할 때 환율 부담은 어느 정도인가요?

OpenAI는 달러로 결제되기 때문에 환율 변동에 따라 원화 청구액이 달라져요. 환율 1,400원대 기준으로 Plus는 약 28,000원, Pro $100은 약 14만원, Pro $200은 약 28만원 선에서 청구된답니다. 카드 해외 결제 수수료가 1~3% 정도 더 붙는다는 점도 함께 보시는 게 좋아요.

윈도우에서도 코덱스 CLI를 쓸 수 있나요?

가능해요. 두 가지 옵션이 있는데, 첫째는 PowerShell에서 윈도우 네이티브 샌드박스로 돌리는 방식이고, 둘째는 WSL2에서 리눅스 환경으로 돌리는 방식이에요. 안정성과 호환성은 WSL2 쪽이 더 좋고, 설치 자체가 간편한 건 PowerShell 네이티브 쪽이에요. macOS와 Linux는 어떤 옵션이든 네이티브로 잘 돌아간답니다.

AGENTS.md를 안 적어도 코덱스가 동작하나요?

동작은 정상적으로 해요. 다만 코덱스가 프로젝트의 컨벤션을 알 방법이 없어서 매번 같은 설명을 반복해야 하고, 결과물도 기존 코드 스타일과 어긋나는 경우가 자주 생겨요. 7~8줄짜리 짧은 AGENTS.md만 적어둬도 한 번에 끝나는 작업 비율이 눈에 띄게 올라가는 편이에요.

코덱스 CLI에서 사용 한도가 다 떨어지면 어떻게 되나요?

두 가지 방법이 있어요. ChatGPT Plus와 Pro 이용자는 추가 크레딧을 구매해 그 자리에서 계속 쓸 수 있고, 다른 방법으로는 API 키로 로그인을 전환해서 토큰 단위 종량제로 이어 쓰는 것도 가능해요. 잠깐 한도를 늘리고 싶을 때는 가벼운 작업을 GPT-5.4-mini 모델로 돌려 한도 소모를 줄이는 우회법도 자주 쓰여요.

GPT-5.5 Pro를 꼭 써야 할까요?

일반적인 코딩 작업은 표준 GPT-5.5만으로도 충분히 처리돼요. GPT-5.5 Pro가 빛을 보는 영역은 어려운 수학 증명, 학술 논문 분석, 깊은 BrowseComp 검색처럼 추론을 길게 끌고 가야 하는 작업이거든요. API 단가도 표준판($5/$30) 대비 6배인 입력 30달러, 출력 180달러라서 비용 차이가 큰 만큼 작업 성격을 보고 선택하는 편이 합리적이에요.

결론

GPT-5.5와 코덱스 조합은 공개된 지 며칠 안 됐는데도 쓰임새가 빠르게 안정되는 추세예요. 핵심만 다시 추리면 ① npm 한 줄로 CLI 깔기, ② AGENTS.md를 4블록(Tech Stack, Conventions, Commands, Do NOT)으로 7~8줄씩 적어두기, ③ Read-only → Auto-edit로 단계적 신뢰 옮기기, ④ 안 쓰는 MCP 서버 끄기, ⑤ 가벼운 작업은 GPT-5.4-mini로 돌려 한도 절약하기, 이렇게 5가지예요.

한 번에 다 외우지 않아도 괜찮으니, 오늘은 일단 npm install -g @openai/codex 한 줄로 설치만 해보고 자주 쓰는 사이드 프로젝트 폴더에서 codex만 한 번 쳐보시기를 추천드린답니다. 첫 5분만 투자해보시면 이후 작업 패턴이 자연스럽게 잡혀갈 거예요.

데크

최신 IT 트렌드부터 하드웨어, 생산성 도구까지 — 직접 써보고 솔직하게 정리하는 테크 블로그입니다.

댓글

이 블로그의 인기 게시물

2026 클로드 Opus 4.7 vs Sonnet 4.6 모델 비교 및 선택 가이드

Notion 생산성 활용 완벽 가이드: 2026년 무료로 쓰는 7가지 실전 노하우

2026 클로드 코드 바이브 코딩 입문 비개발자도 앱 만드는 방법 완벽 정리