자체 호스팅 AI 청구: 청구 시스템을 재구축하지 않고 사용량 측정

고객이 제어하는 배포가 매우 다른 속도로 AI를 사용하기 시작할 때, 자체 호스팅 AI 청구는 제품 결정이 됩니다. 한 고객은 매달 몇 개의 요약만 실행할 수 있습니다. 다른 고객은 매일 수천 개의 파일, 티켓, 프롬프트 또는 검색 쿼리를 처리할 수 있습니다.
이러한 차이는 단일 소프트웨어 라이선스로 가격을 책정하기 어렵습니다. 앱은 자체 호스팅 상태를 유지할 수 있지만, AI 사용에는 여전히 실제 변동 비용이 있습니다. 더 나은 모델은 연결된 AI 트래픽을 측정하고, 가치 지표를 명확히 설명하며, 높은 사용량이 생성된 추론에 대해 비용을 지불하도록 하는 것입니다.
ShareAI Builder는 이러한 상황을 위해 설계되었습니다. Builder는 ShareAI 외부에서 애플리케이션을 소유하고 유지 관리합니다. 적격 AI 요청은 ShareAI를 통해 라우팅될 수 있으며, Builder는 마진 또는 추가 요금을 구성할 수 있습니다. 고객은 라우팅된 사용량에 대해 ShareAI에 비용을 지불하고, ShareAI는 생성된 수익을 기반으로 Builder에게 매월 지급합니다.
자체 호스팅 AI 청구가 자체 모델을 필요로 하는 이유
자체 호스팅 소프트웨어는 주변적인 배포 패턴이 아닙니다. Replicated의 2025년 자체 호스팅 소프트웨어 설문조사 대부분의 공급업체가 이미 자체 호스팅 배포를 지원하며, 많은 업체가 그 범위가 계속 확장될 것으로 예상한다고 보고했습니다. 이는 모든 고객이 제어하는 환경이 다르게 작동하기 때문에 중요합니다.
AI는 두 번째 변동성 계층을 추가합니다. 모델 제공업체는 일반적으로 입력, 출력, 도구, 호출 또는 기타 사용 단위로 가격을 책정합니다. OpenAI API 가격 책정 페이지 는 유용한 공개 사례입니다: 모델과 모드에 따라 비용이 변경되므로 UI에서 간단해 보이는 기능이 내부적으로 매우 다른 경제성을 가질 수 있습니다.
이러한 이유로 AI 가격 책정 조언은 가치 지표, 하이브리드 가격 책정 및 사용량 가시성으로 이동했습니다. OpenView의 사용량 기반 가격 책정 가이드 고객이 소비하는 것과 가치를 받는 방식에 따라 사용량 기반 가격 책정을 구성합니다. Bessemer의 AI 가격 책정 플레이북 AI에 대해서도 동일한 점을 강조합니다: 모든 쿼리는 컴퓨팅 비용을 수반하므로 팀은 기존 SaaS보다 더 일찍 가격 책정 규율이 필요합니다.
자체 호스팅 공급업체에게 실질적인 질문은 간단합니다: 어떤 AI 활동을 라이선스에 포함시킬 것인지, 어떤 활동을 고객이 비용을 지불하는 사용량으로 전환할 것인지?
가격을 책정하기 전에 측정해야 할 것
좋은 자체 호스팅 AI 청구는 공급업체와 고객 모두가 이해할 수 있는 사용 기록에서 시작됩니다. 구매자가 고도로 기술적이지 않은 경우 토큰만으로 시작하지 마십시오. 고객, 배포, 기능 및 비즈니스 작업에서 시작한 다음 비용 관리를 위해 토큰 및 모델 세부 정보를 아래에 유지하십시오.
| 사용 신호 | 왜 중요한가 |
|---|---|
| 고객 또는 계정 ID | AI 사용을 상업적 관계와 연결합니다. |
| 배포 ID 또는 환경 | 프로덕션, 스테이징 및 고객이 제어하는 설치를 분리합니다. |
| 작업 공간, 팀 또는 부서 | 엔터프라이즈 고객이 사용량을 적절한 그룹에 할당할 수 있도록 돕습니다. |
| 기능 또는 워크플로 이름 | AI 요청이 발생한 이유를 설명합니다. |
| 모델 또는 요청 유형 | 경량 작업을 더 비싼 생성 또는 추론과 분리합니다. |
| 문서, 티켓, 프롬프트, 파일 또는 작업 | 기술적 사용을 고객이 인식하는 가치 지표에 매핑합니다. |
| 포함된 크레딧 및 충전금 | 갑작스러운 청구서를 방지하고 헤비 유저에게 유료 경로를 제공합니다. |
이 구조는 지원을 더 쉽게 만듭니다. 고객이 AI 청구서가 증가한 이유를 묻는다면, 답변은 실제 활동에 관한 것이어야 합니다: 더 많은 티켓 요약, 더 많은 파일 처리, 더 많은 워크스페이스 활성화, 또는 더 많은 프리미엄 모델 호출이 제품을 통해 라우팅된 경우입니다.
ShareAI Builder가 자체 호스팅 AI 청구에 적합한 이유
ShareAI는 자체 호스팅 애플리케이션을 구축, 호스팅, 배포 또는 관리하지 않습니다. 애플리케이션은 공급업체와 고객이 제어하는 환경에 남아 있습니다. ShareAI는 Builder가 ShareAI를 통해 라우팅하기로 선택한 AI 추론 트래픽에 대해 AI 마켓플레이스, API, 라우팅, 사용량, 청구, 추가 요금 및 지급 계층을 제공합니다.
- Builder는 기존 앱에서 적격 AI 추론 트래픽을 ShareAI에 연결합니다.
- Builder는 해당 앱 트래픽에 대한 마진 또는 할증료를 설정합니다.
- 고객은 라우팅된 AI 사용량에 대해 ShareAI에 직접 비용을 지불합니다.
- ShareAI는 마켓플레이스를 통해 추론을 라우팅합니다.
- ShareAI는 라우팅된 트래픽에서 발생한 수익을 기준으로 Builder에게 매월 지급합니다.
모델이 빌더 콘솔 앱 트래픽을 연결하고 상업적 규칙을 설정하며 사용량을 추적할 준비가 되었을 때 시작할 장소입니다. 팀이 아직 API 경로를 설계 중이라면, ShareAI API 참조 요청을 매핑하는 동안 가까이에 두십시오.
자체 호스팅 팀을 위한 롤아웃 패턴
1. 연결된 AI 기능 하나로 시작하십시오.
사용이 가치 있고 설명하기 쉬운 기능을 선택하십시오: 지원 티켓 요약, 문서 추출, 지식 기반 답변, RAG 쿼리, 보고서 생성 또는 AI 재작성 작업. 첫날에 가능한 모든 AI 작업을 라우팅하는 것은 피하십시오.
2. 배포 수준에서 사용량 태그 지정
라우팅된 요청은 나중에 청구서를 설명할 수 있는 충분한 컨텍스트를 포함해야 합니다. 최소한 고객, 배포, 환경, 워크스페이스, 기능, 모델 및 사용 단위를 캡처하십시오. 동일한 고객이 여러 배포를 실행하는 경우 특히 중요합니다.
3. 각 계획에 포함된 할당량 제공
대부분의 고객은 AI 청구가 알려진 할당량으로 시작할 때 더 편안합니다. 월별 크레딧 풀, 파일 수, 티켓 볼륨 또는 워크스페이스 예산을 포함할 수 있습니다. 핵심은 할당량이 소진되었을 때 어떤 일이 발생하는지 정의하는 것입니다.
4. 초과 요금을 ShareAI를 통해 처리
배포가 포함된 사용량을 초과할 경우, 설정된 Builder 마진과 함께 적격한 유료 AI 트래픽을 ShareAI를 통해 처리합니다. 이를 통해 가벼운 고객은 예측 가능성을 유지하고, 무거운 고객은 그들이 생성한 추가 추론을 자금으로 충당할 수 있습니다.
5. 고객 언어로 사용량 표시
고객은 원시 토큰 원장을 읽고 싶어하지 않는 경우가 많습니다. 비즈니스 단위를 먼저 표시하세요: 처리된 문서, 요약된 티켓, 생성된 답변, 완료된 워크플로우, 또는 사용된 프리미엄 AI 작업. 관리자와 재무 팀을 위해 기술적 비용 세부 정보를 사용할 수 있도록 유지하세요.
고객이 편안함을 느끼는 가격 책정 패턴
| 패턴 | 가장 잘 작동하는 경우 | 피해야 할 것 |
|---|---|---|
| 포함된 크레딧 및 추가 충전 | 사용량이 고르지 않지만 고객이 여전히 예측 가능성을 원하는 경우. | AI 사용량에 실제 제한이 있을 때 요금제를 무제한으로 부르는 것. |
| 문서 또는 파일당 | 제품이 계약서, 송장, PDF, 보고서 또는 기록을 처리하는 경우. | 명확한 정책 없이 실패한 재시도에 대해 요금을 부과하는 것. |
| 티켓, 대화 또는 답변당 | 이 제품은 고객, 직원 또는 내부 팀을 지원합니다. | 구매자가 해결된 작업을 기준으로 생각할 때 원시 토큰으로만 가격을 책정합니다. |
| 작업 공간 또는 부서 예산 | 엔터프라이즈 고객은 내부 할당 및 통제가 필요합니다. | 모든 사용량을 통합하여 누가 소비했는지 설명할 수 없게 만듭니다. |
| 프리미엄 모델 추가 요금 | 사용자는 고가치 작업을 위해 더 강력하고 더 비싼 모델을 선택할 수 있습니다. | 청구서가 도착할 때까지 비용 차이를 숨깁니다. |
최적의 패턴은 제품에 따라 다릅니다. 자체 호스팅 지원 플랫폼은 티켓 및 대화로 AI 가격을 책정할 수 있습니다. 문서 워크플로 제품은 페이지, 파일 또는 추출물로 가격을 책정할 수 있습니다. DevTools 제품은 실행, 코드 리뷰 또는 분석 작업으로 가격을 책정할 수 있습니다.
고객이 제어하는 배포에서 주장하지 말아야 할 것
자체 호스팅 구매자는 아키텍처 세부 사항에 관심이 있습니다. 명확한 언어는 신뢰를 구축하며, 특히 AI 트래픽이 고객 제어 환경을 벗어날 때 그렇습니다.
- ShareAI가 자체 호스팅 앱을 호스팅한다고 암시하지 마십시오.
- ShareAI가 에어갭 배포를 연결한다고 암시하지 마십시오.
- 구현이 해당 주장을 별도로 검증하지 않은 경우 준수, 데이터 거주 또는 개인 호스팅 보장을 주장하지 마십시오.
- Builder 마진을 임의의 세금으로 취급하지 마십시오. AI 기능이 창출한 가치와 연결하십시오.
- 빌더 수익과 제공자 보상을 혼동하지 마십시오. 빌더는 앱 트래픽 마진에서 수익을 얻습니다. 제공자는 적격 컴퓨팅 용량을 제공함으로써 수익을 얻습니다.
- 마이그레이션 계획 없이 기존 고객의 상업 모델을 변경하지 마십시오.
가장 간단한 설명은 다음과 같습니다: 앱은 자체 호스팅 상태를 유지하며, 고객이 해당 AI 기능을 사용하기로 선택할 경우 적격 연결 AI 사용량은 ShareAI를 통해 라우팅되고 청구될 수 있습니다.
FAQ: 자체 호스팅 AI 청구
자체 호스팅 AI 청구란 무엇입니까?
자체 호스팅 AI 청구는 고객이 제어하는 배포에서 발생하는 AI 사용량을 추적하고 청구하는 관행입니다. 일반적으로 문서, 티켓, 프롬프트, 작업 공간 또는 프리미엄 AI 작업과 같은 명확한 단위에 사용량이 연결될 때 가장 효과적입니다.
ShareAI가 자체 호스팅 앱을 호스팅합니까?
아니요. ShareAI는 앱 빌더, 호스팅 플랫폼, CMS 또는 배포 도구가 아닙니다. 빌더는 ShareAI 외부에서 애플리케이션을 소유하고 운영합니다. ShareAI는 라우팅된 AI 사용량, 고객 결제, 마진 및 적격 추론 트래픽에 대한 지급 계층을 처리합니다.
자체 호스팅 공급업체가 AI를 별도로 계량해야 하는 경우는 언제입니까?
사용량이 고객, 배포, 작업 공간 또는 기능에 따라 크게 달라질 때 AI를 별도로 계량하십시오. 한 고객이 다른 고객보다 100배 더 많은 추론을 소비할 수 있다면, 고정 가격은 마진 위험을 숨기고 나중에 지원 마찰을 초래할 수 있습니다.
자체 호스팅 팀이 처음으로 계량해야 할 것은 무엇입니까?
고객이 이해하는 가치 단위로 시작하십시오. 지원 소프트웨어의 경우, 요약된 티켓이나 응답된 대화일 수 있습니다. 문서 도구의 경우, 페이지, 파일 또는 추출물이 될 수 있습니다. 토큰, 모델 및 라우팅 세부 정보는 백그라운드에서 사용할 수 있도록 유지하십시오.
제품이 기본 라이선스를 유지하면서 사용량 기반 AI를 추가할 수 있습니까?
예. 많은 자체 호스팅 제품은 접근, 지원 및 핵심 기능을 위한 소프트웨어 라이선스 또는 구독을 유지하면서 AI 크레딧, 충전 또는 AI 중심 작업을 위한 유료 라우팅 사용량을 추가할 수 있습니다.
ShareAI를 통해 라우팅된 빌더 사용량에 대한 비용은 누가 지불합니까?
ShareAI를 통해 라우팅된 Builder 사용의 경우, 고객은 라우팅된 AI 사용에 대해 ShareAI에 직접 비용을 지불합니다. Builder는 마진 또는 추가 요금을 구성할 수 있으며, ShareAI는 생성된 수익을 기준으로 Builder에게 매월 지급합니다.
빌더 지급금과 제공자 보상의 차이점은 무엇입니까?
빌더의 수익은 빌더가 소유, 유지, 판매 또는 제공하는 앱의 트래픽에 연결됩니다. 제공자의 보상은 ShareAI 네트워크에 적격한 컴퓨팅 용량을 기여하는 것에 연결됩니다. 이들은 연결된 마켓플레이스 역할이지만 동일한 수익 경로는 아닙니다.
이 모델이 에어갭 배포에 적합합니까?
ShareAI 경로화된 수익화는 적격 AI 요청이 ShareAI를 통해 라우팅될 수 있는 연결된 배포에 적합합니다. 완전히 에어갭된 배포는 고객이 명시적으로 연결성을 도입하고 승인하지 않는 한 별도의 아키텍처와 상업 모델이 필요합니다.
BYOK가 ShareAI 경로화된 AI 사용보다 더 나은가요?
BYOK는 고객이 자신의 모델 제공자 계정을 가져와 관리하려는 경우에 작동할 수 있습니다. ShareAI 경로화된 사용은 빌더가 모델 액세스, 라우팅, 고객 결제, 마진 관리 및 월별 수익을 하나의 사용 계층을 통해 이동시키고자 할 때 더 좋습니다.
팀은 고객에게 AI 제한을 어떻게 설명해야 하나요?
먼저 비즈니스 용어로 제한을 설명하세요: 처리된 문서, 요약된 티켓, 완료된 워크플로, 사용된 프리미엄 모델 또는 소비된 워크스페이스 예산. 그런 다음 고객이 더 많은 사용이 필요할 때 유료 경로를 설명하세요.
에이전시가 자체 호스팅된 클라이언트 프로젝트에 이 모델을 사용할 수 있습니까?
네, 에이전시가 제공된 AI 워크플로를 소유하거나 유지하고 적격 사용을 ShareAI를 통해 라우팅할 때 가능합니다. 에이전시는 마진을 구성하고 클라이언트가 AI 기능을 계속 사용할 때 월별로 수익을 얻을 수 있지만, 수익이 보장된다고 주장하지 않아야 합니다.
자체 호스팅된 AI 청구를 구현하기 위한 첫 번째 단계는 무엇입니까?
하나의 고가치 연결된 AI 기능을 선택하고, 사용 단위를 정의하며, 고객 및 배포별로 각 요청에 태그를 지정하고, 포함된 사용과 유료 사용을 결정하세요. 그런 다음 적격 유료 트래픽을 ShareAI Builder를 통해 라우팅하세요.
설명할 수 있는 경로로 시작하세요
최고의 자체 호스팅된 AI 청구 모델은 가장 복잡한 것이 아닙니다. 고객이 이해할 수 있고, 관리자가 모니터링할 수 있으며, 제품 팀이 청구 인프라를 처음부터 다시 구축하지 않고 지원할 수 있는 모델입니다.
하나의 가치 있는 AI 경로로 시작하여 이를 깔끔하게 측정하고 사용하세요. 빌더 콘솔 라우팅된 사용을 연결할 준비가 되었을 때 마진을 구성하고 월별 빌더 수익을 추적하세요.
구현 중심의 Builder 콘텐츠에 대해 더 알아보려면, ShareAI Developers 아카이브를 둘러보세요.