Sub2API：订阅配额分发的AI API网关与管理平台

Sub2API 将多上游 AI 订阅聚合，通过平台生成的 API Key 实现统一鉴权、Token 级计费、智能调度与流量管理，适合需要共享订阅额度与成本管控的私有部署或SaaS场景。

GitHub Wei-Shaw/sub2api 更新 2026-03-01 分支 main 星标 2.4K 分叉 459

Go Gin Ent Vue Vite TailwindCSS PostgreSQL Redis Docker Compose API 网关配额管理 Token计费限流并发多账号整合

💡 深度解析

这个项目解决的核心问题是什么，它如何在技术上实现把上游订阅额度以 API 形式安全分发？

核心分析 ¶

项目定位：Sub2API 的核心价值是把多个按额度/订阅计费的上游 AI 账号池化并以受控的 API 形式对外分发，同时在平台端做 token 级的精确计费与审计，从而避免直接暴露上游凭证并实现精细化成本分摊。

凭证隔离与平台 API Key：平台生成并管理平台级 API Key，下游仅使用这些 Key 访问服务，上游凭证保存在后端（PostgreSQL）或加密配置中，避免凭证泄露。
智能调度与粘滞会话：基于 README 的 Smart Scheduling 与粘滞策略，平台可按权重/粘滞规则在上游账号池中选择目标账号，降低单账号短期被限流的概率。
精确计费链路：通过在请求/响应路径或上游回调中提取 token/调用量信息并写入 PostgreSQL，结合 Redis 的实时计数，实现 token 级别的成本计算与分摊。

部署与密钥管理：使用 README 的 docker 一键脚本并在 .env 中替换自动生成的密钥，确保 JWT_SECRET 和 TOTP_ENCRYPTION_KEY 被安全备份。
计量验证：在小规模测试环境用实际上游账单做对账，验证本地计量（请求解析或估算）与上游账单的一致性。
调度策略：为不同上游账号设置权重与粘滞策略，初期使用保守并发与速率限制，观察上游限流与耗尽情况后再调优。

注意：若上游不提供服务端详尽的使用回调或计费字段，平台需要依赖本地估算 token 使用，这会带来计费偏差风险。

总结：Sub2API 在架构上实现了凭证隔离、上游账号池化、智能路由与 token 级计费，适合需要将订阅额度安全分发并进行精确成本分摊的团队，但需在部署前验证计量精度并保证密钥安全。

90.0%

为什么选择 Go + PostgreSQL + Redis 构建这个网关，这套技术栈带来了哪些架构优势？

项目设计判断：Sub2API 采用 Go + PostgreSQL + Redis 是为了在低延迟高并发的代理场景中同时满足实时计数和可靠持久化的需求，这套组合在工程实践中成熟且便于横向扩展。

Go (高并发与低延迟)：Go 的协程与内存占用特性适合处理大量并发请求，减少代理层的延迟与上下文切换开销。使用 Gin 可快速实现轻量级路由与中间件。
PostgreSQL (可靠持久化与复杂查询)：账单、审计和配置需要事务与关系查询能力，Postgres 提供 ACID 保证与丰富的索引/查询优化选项，便于事后回溯与报表分析。
Redis (实时计数与速率控制)：限流、并发控制与会话粘滞需要毫秒级响应，Redis 的内存计数器与原子操作（例如 INCR、Lua 脚本）能有效支撑高频写读场景，减轻主库负担。

注意：README 未提供明确的集群化部署指南，单机或默认 Docker Compose 在极高吞吐下可能成为瓶颈，需要额外设计高可用方案。

总结：这套技术栈权衡了性能与一致性，适合 Sub2API 的代理、限流与计费需求，但生产级高可用需要运维投入。

88.0%

在什么场景下 Sub2API 最适合使用？有哪些明显的限制或不适用场景？

适用场景：Sub2API 最适合那些希望把订阅式 AI 产品的额度在受控环境下分发和计费的组织，例如：

注意：在进入商用前应与上游服务条款和法律顾问核对分发与计费的合规性，并在测试环境验证计量一致性。

总结：Sub2API 非常适合内部配额分发、自托管需求和中小规模受控对外分发，但对于需要法律明确许可或超大规模高可用部署的场景需谨慎评估并补充额外的架构与合规工作。

86.0%

Sub2API 的计费与记账机制如何保证 token 级精确计费？在什么情况下会出现计费差异？

问题核心：Sub2API 宣称支持 token 级别计费，但精确度依赖于上游返回的使用数据或平台本地的估算逻辑。理解计费链路与误差来源对保证账单一致性至关重要。

基于上游回传的真实使用量：最佳且最精确的做法是上游在响应体或异步回调中返回使用量字段（token/调用量），平台直接采集并记账到 PostgreSQL。
请求侧本地估算：当上游不提供详尽回传时，平台在请求/响应链路解析 prompt/response 长度并按模型 tokenizer 规则估算 token，这是次优方案。