- AI 에이전트가 자율적으로 구매·지불·정산을 수행하기 위해 여러 결제 프로토콜이 병렬적으로 등장하고 있음
- ACP, UCP, AP2, x402 등은 모두 결제를 다루지만, 상거래·B2B·에이전트 간 결제처럼 서로 다른 문제 영역을 겨냥함
- 인터넷은 본래 정보 전달을 목적으로 설계되어 결제 계층이 존재하지 않았고, HTTP 402 상태 코드는 1997년에 정의됐으나 실제로 구현되지 않음
- 에이전트 거래에서는 신뢰 계층이 결제 이전의 전제 조건으로 부상하며, ERC-8004와 Visa TAP 같은 프로토콜이 이 역할을 담당
- 커머스 영역에서는 OpenAI·Stripe의 ACP와 Google·Shopify의 UCP가 핵심 축을 이루며, 각각 ChatGPT와 Gemini 환경에서 활용 중
- 에이전트 간 결제는 컴퓨팅·데이터·API 사용에 대한 대규모 마이크로페이먼트 가능성을 열며, 자율적 자원 거래 구조를 예고함
- 향후 에이전트 경제는 단일 표준이 아니라, 역할이 다른 프로토콜이 계층적으로 결합된 스택 구조로 진화할 가능성이 큼
에이전틱 결제 프로토콜 난립의 배경
- ACP, UCP, A2P, AXTP, x402 등 다양한 약어가 등장하며 에이전틱 결제 영역이 혼란스러운 상태임
- 프로토콜이 많아진 이유는 모두 같은 문제를 푸는 것이 아니기 때문
- 상거래, B2B 결제, 에이전트 간 결제는 요구 조건과 제약이 서로 다름
- 이를 하나의 문제로 취급하면 오히려 구조를 이해하기 어려워짐
인터넷 프로토콜의 구조와 결제 계층의 부재
- 인터넷은 TCP/IP, DNS, HTTP/S 같은 여러 프로토콜이 함께 작동하며 하나의 매끄러운 사용자 경험 형성
- TCP/IP: 주소 지정과 라우팅, 데이터의 안정적 전송 담당
- DNS: 사람이 읽을 수 있는 도메인 이름을 IP 주소로 변환
- HTTP/S: 웹 페이지와 미디어 요청·전송 담당, HTTPS는 암호화를 통해 보안 강화
- gRPC, WebSocket 등 새로운 프로토콜이 지속적으로 추가되며 인터넷은 정적인 구조가 아닌 진화하는 시스템
- HTTP 상태 코드 402(Payment Required) 는 1997년에 정의되었지만 실제로 사용된 적은 없음
- 인터넷은 처음부터 정보 전달을 목적으로 설계되었고, 결제는 별도의 금융 시스템을 통해 사후적으로 연결됨
- 브라우저에서 시작된 요청이 판매자, 결제 게이트웨이, Visa·ACH 같은 금융 네트워크로 순차 전달
- ‘장바구니 담기’부터 ‘결제 정산’까지 전 과정을 포괄적으로 다루는 단일한 결제 프로토콜은 존재하지 않음
에이전트가 드러낸 결제 계층의 공백
- 키보드와 화면을 전제로 설계된 기존 인프라는 기계 속도로 판단하고 행동하는 소프트웨어 에이전트에 적합하지 않음
- 에이전트가 사람을 대신해 구매를 수행할 때 새로운 문제들이 노출됨
-
새로운 고객 유형: 에이전트가 어떤 상점과 상품을 선택할지 스스로 결정해야 하며, 판매자는 인간이 아닌 에이전트를 대상으로 한 최적화 필요
→ Agent Engine Optimization(AEO) 개념 부상
-
새로운 결제 채널: 채팅 인터페이스가 곧 결제 창구가 되며, 기존의 전환 퍼널·A/B 테스트·장바구니 이탈 메일은 의미 약화
-
새로운 사기 위험: 에이전트가 승인된 사용자와 합법적인 결제 수단을 사용하는지, 도난된 자격 증명을 자동으로 남용하는지 즉시 검증 필요
신뢰 계층: 거래 상대 확인
- MCP와 A2A는 에이전트 간 통신을 담당하지만, ERC-8004 명세에서는 에이전트 발견과 신뢰를 본질적으로 다루지 못함이 명시됨
- 에이전트 간 거래 이전에 정당성 확인이 선행되어야 하며, 판매자는 무분별한 봇이 아니라 신뢰 가능한 에이전트만 허용해야 함
- 이를 해결하기 위한 두 가지 접근이 등장
-
ERC-8004(Trustless Agents): MetaMask, Google, Coinbase, Ethereum Foundation이 참여한 온체인 기반 신원·평판·검증 레지스트리로 Draft EIP 단계
- 에이전트 등록 정보에 MCP 엔드포인트, A2A 에이전트 카드, ENS 이름, DID 등을 함께 명시 가능
- 기존 에이전트 통신 프로토콜을 대체하지 않고, 신뢰와 정체성 정보를 보완하는 구조
-
Visa Trusted Agent Protocol(TAP): Visa가 개발 중인 프로토콜로, 판매자가 신뢰 가능한 에이전트를 일반 봇과 구분할 수 있도록 검증 가능한 서명 제공
- 커머스 목적을 가진 Visa 신뢰 에이전트임을 증명
- 로열티 계정이나 기기 식별자를 통해 특정 소비자를 대신하고 있음을 확인
- 판매자가 검증 가능한 유효 결제 자격 증명을 함께 확인 가능
-
핵심: 신뢰는 결제의 출발점이며, “어떻게 결제할 것인가”보다 “이 에이전트를 믿을 수 있는가”가 먼저 해결되어야 함
커머스 프로토콜: 가장 빠르게 확장 중인 영역
-
에이전틱 커머스는 상품 탐색, 선택, 결제라는 구매 순간 전체를 에이전트에 위임하는 구조
- 이를 표준화하기 위해 두 가지 핵심 프로토콜이 부상
-
Agentic Commerce Protocol(ACP): OpenAI와 Stripe가 공동 개발한 프로토콜로, 장바구니를 구성하고 PSP로 전달할 결제 토큰 생성 방식 정의
- ChatGPT 환경에서 Walmart, Etsy, Instacart와 함께 실제 운영 중
- 장바구니 구조, 결제 토큰 생성, 체크아웃 완료 절차를 명확히 규정한 거래 중심 표준
-
Universal Commerce Protocol(UCP): Google과 Shopify가 주도하는 프로토콜로, 판매자가 에이전트에 노출될 서버를 직접 구성
- Google Search와 Gemini에 순차 적용 예정
- 판매자가 capability manifest를 게시하고, 에이전트가 이를 발견·협상하는 오케스트레이션 프레임워크
- 상거래 영역에서 DNS와 유사한 역할 수행
-
구조적 차이: UCP는 초기 구현 부담이 크지만 전 과정에서 높은 유연성 제공, ACP는 기존 결제 시스템과의 연동이 상대적으로 용이
- ChatGPT와 Gemini 양쪽에서 모두 노출되려면 ACP와 UCP를 함께 지원해야 하는 상황
결제 네트워크 수준의 프로토콜
-
Visa Intelligent Commerce(VIC): Visa가 개발한 프로토콜로, 에이전트가 Visa 네트워크에서 결제를 완료할 수 있도록 카드와 유사한 보안 토큰 생성
- 현재 테스트 단계이며 2026년 하반기 출시 예정
-
Mastercard Agent Pay(MAP): Mastercard가 개발한 프로토콜로, Mastercard 네트워크에서 사용 가능한 보안 토큰 생성
- 두 표준은 구조와 목적이 거의 동일하며, 핵심적인 차이는 각각 자사 결제 네트워크에서만 작동한다는 점
- 네트워크 수준에서 발급되는 토큰을 통해 소비자 보호, 차지백 처리, 사기 대응이 기존 카드 결제와 동일한 방식으로 유지됨
B2B 결제 흐름의 차별화된 요구사항
- 소비자 커머스가 주목을 받지만, 실제 거래 규모는 B2B 결제가 훨씬 큼
- 송장 결제, 공급업체 지급, 급여 지급 등 기업 간 정산이 대부분을 차지
- B2B 결제 흐름이 갖는 특성
- 결제 금액이 크고, 실행 이후 되돌리기 어려움
- 송장 매칭, 승인 절차, 감사 추적 같은 내부 통제 필요
- ACH나 전신송금처럼 속도는 느리지만 구조적으로 유연한 레일 사용
- 이 영역에서는 에이전트가 중간 계층을 거치기보다 결제 레일과 직접 통신하는 경우가 많음
- 활용되는 결제 레일
-
스테이블코인(USDC, USDT): 온체인에서 직접 결제가 이루어지며, 트랜잭션 안에 규칙과 로직을 포함 가능
- Catena Labs, Payman 같은 기업에서 실제 사용 중
-
전통적 레일(ACH, Wire): 에이전트가 결제 정보를 준비한 뒤 기존 금융 레일로 전송
- 스테이블코인은 카드 결제에 가까운 성공 보장과 높은 프로그래머빌리티를 제공하지만, 업계 전반에서 통용되는 명확한 표준은 아직 형성되지 않음
에이전트 간 결제: 가장 큰 잠재력
- 인터넷의 가치 있는 자원 대부분이 API 키와 구독 모델 뒤에 묶여 있는 구조
- 기존 접근 방식은 계정 생성, 선불 충전, 키 발급 이후에야 서비스 사용 가능
- 수십억 개의 에이전트가 코드 작성, 상호 거래, 필요 시점의 자원 사용을 수행하는 환경에서는 이 모델이 확장되지 않음
- 현재 드러나는 두 가지 주요 마찰 지점
-
토큰 소진 문제: 에이전트가 작업 도중 한도에 도달하면 사람이 직접 충전해야만 작업 지속 가능
-
API 키 문제: 에이전트가 새로운 서비스를 필요로 할 때마다 사용자가 직접 가입하고 자격 증명을 생성해 전달해야 함
- 이러한 제약으로 인해 에이전트는 완전한 자율성을 갖지 못하며, 법인 카드나 핵심 자격 증명을 맡기지 못한 주니어 개발자와 유사한 위치에 머무름
에이전트 네이티브 프로토콜
-
Google Agent to Pay(AP2): A2A 프레임워크의 일부로, 사람이 에이전트에게 결제 권한을 위임하기 위한 mandate 구조 정의
- x402, UCP와 함께 작동하도록 설계된 추상 계층의 프로토콜로, 서로 배타적인 관계는 아님
- 검증 가능한 자격 증명을 기반으로 다음과 같은 mandate를 구분
- cart mandate: 에이전트가 구매할 수 있는 범위
- intent mandate: 사람이 실제로 원하는 목적
- payment mandate: 저장된 결제 자격 증명
-
HTTP x402: Coinbase와 Cloudflare가 개발한 방식으로, 접근이 제한된 리소스에 요청 시 HTTP 402를 반환하고 스테이블코인 결제를 유도
- Base 네트워크와 Cloudflare 환경에서 테스트 진행 중
-
Agent Transaction Protocol(AXTP): Circuit과 Chisel이 개발 중인 프로토콜로, 에이전트가 MCP 서버 이용 비용을 지불하거나 그 대가로 수익을 얻을 수 있도록 설계
- 컴퓨팅 자원, 데이터, API 호출 단위로 즉시 분할되는 대규모 마이크로페이먼트가 가능해지며, 지금까지 제대로 수익화되지 않았던 영역에서 방대한 신규 거래량 형성 가능
전체 프로토콜 구조와 전망
- 현 시점의 에이전틱 결제 생태계는 정리되지 않은 혼재 상태
-
Google 중심 스택 형성: A2A → AP2 → UCP로 이어지는 구조가 등장하며, 커머스와 비커머스 결제를 모두 포괄
- 각 프로토콜은 서로 다른 추상화 계층에서 역할을 분담
-
에이전트 통신 계층: 에이전트 간 메시지 교환 방식 표준화 (MCP, A2A)
-
신뢰 계층: 에이전트의 정체성과 신뢰성 판단, 신원·평판 관리 (ERC-8004, Visa TAP)
-
위임 계층: 결제 권한과 자격 증명 보유 여부 확인 (AP2 mandates, VIC/MAP 토큰)
-
거래 흐름 계층: 무엇을 사고 어떻게 결제할지에 대한 발견·협상·체크아웃 관리 (ACP, UCP)
-
인증 계층: 거래의 정당성 검증, 보안 유지, 사기 방지, 취소 처리
-
결제 레일 계층: 실제 결제 실행, 카드·ACH·스테이블코인 활용
주요 시사점
- 현재의 표준들은 아직 형성 단계에 있으며 불완전하고 채택도 제한적
- 향후 WAP이나 Betamax처럼 사라질 가능성도 배제할 수 없음
- 다만 이는 AI 에이전트 자체가 사라진다는 가정을 전제로 하며, 그 가능성은 낮음
- 판매자, 결제 사업자, 금융 기관이 주목해야 할 지점
-
Google의 영향력: 과거 인터넷 표준을 주도해온 전례가 있으며, A2A·AP2 및 연관 스택이 장기적으로 유지될 가능성 큼
-
커머스 우선 전략: ACP와 UCP를 지원하면 ChatGPT와 Gemini라는 두 주요 소비자 LLM 환경에 모두 노출 가능
-
신뢰 인프라의 중요성: 에이전트 트래픽이 늘어날수록 신원과 평판 문제는 더 복잡해지며, ERC-8004와 Visa TAP이 이 지점을 겨냥
-
B2B 결제의 기회: 거래 규모가 크고 아직 표준이 정리되지 않은 영역으로, 스테이블코인 채택은 진행 중이나 명확한 기준은 부재
-
에이전트 네이티브 결제의 잠재력: 빠르고 저렴하며 상시 작동하고 프로그래밍 가능한 스테이블코인이 유력한 해법, x402는 출발점이지만 아직 성숙 단계는 아님
- 다음 단계의 에이전틱 결제 환경은 프로토콜 간 조합과 계층 간 기능 상속을 통해 형성될 가능성 큼
- 자원을 스스로 발견하고, 조건을 협상하며, 대가를 지불하는 소프트웨어로의 전환은 어떤 표준이 살아남든 이미 진행 중