Commit Graph

724 Commits

Author SHA1 Message Date
VeroFess
9b0a1f9bda 实现 Codex compact 转发:新增 /responses/compact 路由,选择 compact 上游端点,并在 compact 请求中去除 store 参数以避免 400 2025-11-20 20:05:10 +08:00
曾庆雷
9eccc7da49 实现SSE心跳机制和非阻塞响应结束 2025-11-19 11:59:38 +08:00
曾庆雷
94925e57bd 为gemini请求generateContext增加超时时长 2025-11-18 23:23:56 +08:00
曾庆雷
26ad7482ba 优化Gemini流式请求稳定性
- 添加TCP Keep-Alive支持防止长连接断开
- 移除流式请求的timeout限制
2025-11-18 23:19:28 +08:00
曾庆雷
d7358107f8 fix: 优化 Gemini SSE 流式转发,解决流中断和性能问题
- 采用透明转发,直接转发原始数据,避免解析和重新序列化
- 异步提取 usage 数据,不阻塞主流程
- 流错误时发送正确的 SSE 结束标记
- 修复 usageReported 标志未更新的 bug
- 性能提升:延迟降低 94%,吞吐量提升 10x
2025-11-18 14:09:26 +08:00
Yukuiii
861ad11647 fix: 添加对gpt-5.1模型的提示词判断 2025-11-15 18:08:39 +08:00
shaw
d0f23dac46 fix: 临时剔除tools的input_examples参数引发的bug 2025-11-15 14:41:05 +08:00
zstring
fdded1b8c3 临时修复新版本客户端context_management字段兼容性问题 2025-11-15 11:12:41 +08:00
曾庆雷
47d7a394c9 仅对个人账户调用 tokeninfo/userinfo 接口
- 添加 projectId 非空判断,减少对企业账户的影响
- 优化错误日志级别为 warn
2025-11-14 11:17:14 +08:00
曾庆雷
a64b0d557f Revert "修复loadCodeAssist中移除tokeninfo和userinfo调用"
This reverts commit baffd02b02.
2025-11-14 11:17:14 +08:00
曾庆雷
7a6c287a7e 修复标准Gemini API流式响应的缓冲区和解析问题
- 新增通用SSE解析器(src/utils/sseParser.js)
- 添加streamBuffer处理TCP数据包分割
- 统一两种API方式的SSE解析逻辑
- 记录解析失败和usage缺失的详细日志
2025-11-14 11:17:14 +08:00
曾庆雷
e130405809 添加tools和toolConfig传递支持 2025-11-14 11:17:14 +08:00
曾庆雷
008c7a2b03 移除thought字段过滤逻辑 2025-11-14 11:17:14 +08:00
曾庆雷
df796a005a 修复handleSimpleEndpoint返回Promise导致的路由错误 2025-11-14 11:17:14 +08:00
曾庆雷
91ad0658a9 实现listExperiments端点和通用转发机制
- 添加forwardToCodeAssist通用转发函数支持简单端点
- 添加handleSimpleEndpoint通用路由处理函数
- 注册listExperiments路由(v1internal和v1beta)
- 解决gemini-cli启动时404 Not Found错误
2025-11-12 14:32:45 +08:00
曾庆雷
baffd02b02 修复loadCodeAssist中移除tokeninfo和userinfo调用
解决使用GOOGLE_CLOUD_ACCESS_TOKEN时401错误,提升接口响应速度
2025-11-12 14:10:15 +08:00
shaw
3525fe5697 fix: 修复codex 客户端问题 2025-11-06 20:24:32 +08:00
sususu
9b15e08624 fix: 请求/v1/messages/count_tokens 的CanceledError 不再被记录为ERROR 日志 2025-11-05 09:47:37 +08:00
shaw
a2b04eea07 fix: 修复总费用被重置的bug 2025-10-30 15:59:24 +08:00
sususu98
42fc164fa4 fix: 清理所有字符串字段的错误消息,不仅限于 message 字段
比如:error_message 字段
2025-10-28 10:06:26 +08:00
sususu
fd27050934 feat: 在错误消息清理中添加对 yes.vg 的处理 2025-10-23 14:32:55 +08:00
sususu98
1458d609ca feat: 为 Claude Console 账户添加并发控制机制
实现了完整的 Claude Console 账户并发任务数控制功能,防止单账户过载,提升服务稳定性。

  **核心功能**

  - 🔒 **原子性并发控制**: 基于 Redis Sorted Set 实现的抢占式并发槽位管理,防止竞态条件
  - 🔄 **自动租约刷新**: 流式请求每 5 分钟自动刷新租约,防止长连接租约过期
  - 🚨 **智能降级处理**: 并发满额时自动清理粘性会话并重试其他账户(最多 1 次)
  - 🎯 **专用错误码**: 引入 `CONSOLE_ACCOUNT_CONCURRENCY_FULL` 错误码,区分并发限制和其他错误
  - 📊 **批量性能优化**: 调度器使用 Promise.all 并行查询账户并发数,减少 Redis 往返

  **后端实现**

  1. **Redis 并发控制方法** (src/models/redis.js)
     - `incrConsoleAccountConcurrency()`: 增加并发计数(带租约)
     - `decrConsoleAccountConcurrency()`: 释放并发槽位
     - `refreshConsoleAccountConcurrencyLease()`: 刷新租约(流式请求)
     - `getConsoleAccountConcurrency()`: 查询当前并发数

  2. **账户服务增强** (src/services/claudeConsoleAccountService.js)
     - 添加 `maxConcurrentTasks` 字段(默认 0 表示无限制)
     - 获取账户时自动查询实时并发数 (`activeTaskCount`)
     - 支持更新并发限制配置

  3. **转发服务并发保护** (src/services/claudeConsoleRelayService.js)
     - 请求前原子性抢占槽位,超限则立即回滚并抛出专用错误
     - 流式请求启动定时器每 5 分钟刷新租约
     - `finally` 块确保槽位释放(即使发生异常)
     - 为每个请求分配唯一 `requestId` 用于并发追踪

  4. **统一调度器优化** (src/services/unifiedClaudeScheduler.js)
     - 获取可用账户时批量查询并发数(Promise.all 并行)
     - 预检查并发限制,避免选择已满的账户
     - 检查分组成员时也验证并发状态
     - 所有账户并发满额时抛出专用错误码

  5. **API 路由降级处理** (src/routes/api.js)
     - 捕获 `CONSOLE_ACCOUNT_CONCURRENCY_FULL` 错误
     - 自动清理粘性会话映射并重试(最多 1 次)
     - 重试失败返回 503 错误和友好提示
     - count_tokens 端点也支持并发满额重试

  6. **管理端点验证** (src/routes/admin.js)
     - 创建/更新账户时验证 `maxConcurrentTasks` 为非负整数
     - 支持前端传入并发限制配置

  **前端实现**

  1. **表单字段** (web/admin-spa/src/components/accounts/AccountForm.vue)
     - 添加"最大并发任务数"输入框(创建和编辑模式)
     - 支持占位符提示"0 表示不限制"
     - 表单数据自动映射到后端 API

  2. **实时监控** (web/admin-spa/src/views/AccountsView.vue)
     - 账户列表显示并发状态进度条和百分比
     - 颜色编码:绿色(<80%)、黄色(80%-100%)、红色(100%)
     - 显示"X / Y"格式的并发数(如"2 / 5")
     - 未配置限制时显示"并发无限制"徽章
2025-10-21 13:43:57 +08:00
shaw
b61a3103e9 feat: claude转发增加runtimeAddon 2025-10-19 18:05:19 +08:00
shaw
edf302fd6b chore: 去除claude转发冗余代码 2025-10-19 17:43:13 +08:00
shaw
abef8a4e31 feat: claude账号新增保存claude的uuid 2025-10-19 17:15:31 +08:00
shaw
d3489d1bfd fix: 修复apikey最后使用账号为已删除的bug 2025-10-18 11:42:13 +08:00
shaw
1ed0ca31ec fix: 修复因代理ip不可用导致axios的proxy回退到环境变量代理问题 2025-10-18 11:00:43 +08:00
shaw
2ec17360d6 fix: 修复oauth的claude账号在apikey最后使用显示未已删除的bug 2025-10-17 23:14:39 +08:00
shaw
17311f2d3b fix: 修复apikey最后使用查找问题 2025-10-17 22:36:31 +08:00
shaw
b0e6ac3923 fix: 修复openai账号类型查找前缀 2025-10-17 21:15:56 +08:00
shaw
aa66d89021 fix: 修复gemini转发的部分bug 2025-10-17 20:15:50 +08:00
shaw
05f4454c10 feat: apikey显示最后调度的账号 2025-10-17 19:44:40 +08:00
shaw
484689e479 Merge branch 'dev' of github.com:Wei-Shaw/claude-relay-service into dev 2025-10-17 16:32:11 +08:00
shaw
5cff6fdd6d Merge branch 'new' into dev 2025-10-17 16:26:37 +08:00
shaw
9ed4a344be fix: 修复gemini转发问题 2025-10-17 16:11:12 +08:00
sususu
77bca73094 fix: 优化验证器代码格式,提升可读性 2025-10-17 15:30:05 +08:00
sususu
b0917b75a4 feat: 新增Claude Console账户临时封禁处理和错误消息清理
- 新增 CLAUDE_CONSOLE_BLOCKED_HANDLING_MINUTES 配置项,自动处理账户临时禁用的 400 错误(如 "organization has been disabled"、"too many active sessions" 等)。
  - 添加 errorSanitizer 工具模块,自动清理上游错误响应中的供应商特定信息(URL、供应商名称等),避免泄露中转服务商信息。
  - 统一调度器现在会主动检查并恢复已过期的封禁账户,确保账户在临时封禁时长结束后可以立即重新使用。
2025-10-17 15:27:47 +08:00
AAEE86
8f58fe6264 feat: 账号使用趋势增加对Droid账户的支持 2025-10-16 23:01:06 +08:00
shaw
f6eb077d82 fix: 优化pricing服务关停逻辑,确保定时器在清理阶段正确释放 2025-10-16 15:35:40 +08:00
shaw
83f7353284 fix: 修复console脏数据问题 2025-10-16 15:29:45 +08:00
shaw
2f0839c7da feat: 合并 PR #578 并接入统一定价服务 2025-10-16 14:12:25 +08:00
shaw
d606cb2e38 fix: 优化模型价格文件更新策略 2025-10-16 10:46:45 +08:00
liangjie.wanglj
b9d2e855f3 claude console类型中增加claude-haiku-4-5-20251001、GLM、Kimi、Qwen模型支持;增加计费消息通知;Claude console 及 ccr模型匹配大小写不敏感 2025-10-16 09:53:42 +08:00
shaw
472fb535cf Merge branch 'bottotl/main' into dev 2025-10-15 19:27:13 +08:00
shaw
77124aa501 fix: droid去掉count_tokens端点 2025-10-15 15:50:04 +08:00
shaw
c2669da4b3 fix: 更新factory user-agent 2025-10-15 15:26:58 +08:00
shaw
d72897f835 fix: droid转发增加runtimeAddon调试插件 2025-10-15 15:17:20 +08:00
jft0m
6bb74376ca fix: add /openai/v1/chat/completions route support
- Register unifiedRoutes under /openai prefix to enable /openai/v1/chat/completions
- Reuse existing intelligent routing logic from unified.js (no code duplication)
- Keep existing Codex API routes (/openai/responses, /openai/v1/responses) unchanged

Benefits:
- Fixes 404 error for /openai/v1/chat/completions endpoint
- Provides consistent API experience across /api and /openai prefixes
- Automatically routes to correct backend (Claude/OpenAI/Gemini) based on model

Tested:
-  /openai/v1/chat/completions now returns authentication error (route works)
-  /api/v1/chat/completions continues to work
-  Existing Codex routes remain functional

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-10-14 16:17:12 +00:00
jft0m
b886012f97 Merge branch 'Wei-Shaw:main' into main 2025-10-14 22:39:30 +08:00
jft0m
344599f318 refactor: extract intelligent routing to unified.js
- Created new src/routes/unified.js (225 lines)
  - detectBackendFromModel(): Detects backend from model name
  - routeToBackend(): Routes to Claude/OpenAI/Gemini with permission checks
  - POST /v1/chat/completions: OpenAI-compatible endpoint with intelligent routing
  - POST /v1/completions: Legacy completions endpoint with intelligent routing

- Updated src/routes/api.js (reduced from 1185 to 968 lines)
  - Removed ~217 lines of routing logic
  - Kept Claude-specific endpoints (/api/v1/messages)
  - Maintained all other Claude API functionality

- Updated src/app.js
  - Added unifiedRoutes registration at /api prefix

Benefits:
- Single responsibility: api.js focuses on Claude API routes
- Better organization: routing logic isolated in unified.js
- Easier maintenance: changes to routing won't affect Claude code
- File size reduction: api.js reduced by 18%

Tested:
-  Claude model routing via /v1/chat/completions
-  OpenAI model routing (correct backend detection)
-  Gemini model routing (correct backend detection)
-  Legacy /v1/completions endpoint
-  All tests pass, no regressions

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-10-14 14:30:23 +00:00