Merge branch 'pr/gemini-ratelimit' into dev

2026-05-06 15:01:37 +00:00 · 2025-11-22 16:36:50 +08:00
parent 823be8acfc 6f9ac4aa84
commit 22e10c57ea
2 changed files with 70 additions and 38 deletions
--- a/2
+++ b/2
@@ -1 +1 @@
-1.1.200
+1.1.201
--- a/src/routes/standardGeminiRoutes.js
+++ b/src/routes/standardGeminiRoutes.js
@@ -6,7 +6,6 @@ const geminiAccountService = require('../services/geminiAccountService')
 const unifiedGeminiScheduler = require('../services/unifiedGeminiScheduler')
 const apiKeyService = require('../services/apiKeyService')
 const sessionHelper = require('../utils/sessionHelper')
-const { parseSSELine } = require('../utils/sseParser')

 // 导入 geminiRoutes 中导出的处理函数
 const { handleLoadCodeAssist, handleOnboardUser, handleCountTokens } = require('./geminiRoutes')
@@ -135,6 +134,9 @@ async function normalizeAxiosStreamError(error) {

 // 专门处理标准 Gemini API 格式的 generateContent
 async function handleStandardGenerateContent(req, res) {
+  let account = null
+  let sessionHash = null
+
  try {
    if (!ensureGeminiPermission(req, res)) {
      return undefined
@@ -142,7 +144,7 @@ async function handleStandardGenerateContent(req, res) {

    // 从路径参数中获取模型名
    const model = req.params.modelName || 'gemini-2.0-flash-exp'
-    const sessionHash = sessionHelper.generateSessionHash(req.body)
+    sessionHash = sessionHelper.generateSessionHash(req.body)

    // 标准 Gemini API 请求体直接包含 contents 等字段
    const { contents, generationConfig, safetySettings, systemInstruction, tools, toolConfig } =
@@ -213,7 +215,7 @@ async function handleStandardGenerateContent(req, res) {
      sessionHash,
      model
    )
-    const account = await geminiAccountService.getAccount(accountId)
+    account = await geminiAccountService.getAccount(accountId)
    const { accessToken, refreshToken } = account

    const version = req.path.includes('v1beta') ? 'v1beta' : 'v1'
@@ -323,6 +325,17 @@ async function handleStandardGenerateContent(req, res) {
      responseData: error.response?.data,
      stack: error.stack
    })
+
+    // 处理速率限制
+    if (error.response?.status === 429) {
+      logger.warn(`⚠️ Gemini account ${account.id} rate limited (Standard API), marking as limited`)
+      try {
+        await unifiedGeminiScheduler.markAccountRateLimited(account.id, 'gemini', sessionHash)
+      } catch (limitError) {
+        logger.warn('Failed to mark account as rate limited in scheduler:', limitError)
+      }
+    }
+
    res.status(500).json({
      error: {
        message: error.message || 'Internal server error',
@@ -335,6 +348,8 @@ async function handleStandardGenerateContent(req, res) {
 // 专门处理标准 Gemini API 格式的 streamGenerateContent
 async function handleStandardStreamGenerateContent(req, res) {
  let abortController = null
+  let account = null
+  let sessionHash = null

  try {
    if (!ensureGeminiPermission(req, res)) {
@@ -343,7 +358,7 @@ async function handleStandardStreamGenerateContent(req, res) {

    // 从路径参数中获取模型名
    const model = req.params.modelName || 'gemini-2.0-flash-exp'
-    const sessionHash = sessionHelper.generateSessionHash(req.body)
+    sessionHash = sessionHelper.generateSessionHash(req.body)

    // 标准 Gemini API 请求体直接包含 contents 等字段
    const { contents, generationConfig, safetySettings, systemInstruction, tools, toolConfig } =
@@ -414,7 +429,7 @@ async function handleStandardStreamGenerateContent(req, res) {
      sessionHash,
      model
    )
-    const account = await geminiAccountService.getAccount(accountId)
+    account = await geminiAccountService.getAccount(accountId)
    const { accessToken, refreshToken } = account

    const version = req.path.includes('v1beta') ? 'v1beta' : 'v1'
@@ -511,7 +526,6 @@ async function handleStandardStreamGenerateContent(req, res) {

    // 处理流式响应并捕获usage数据
    // 方案 A++：透明转发 + 异步 usage 提取 + SSE 心跳机制
-    let streamBuffer = '' // 缓冲区用于处理不完整的行
    let totalUsage = {
      promptTokenCount: 0,
      candidatesTokenCount: 0,
@@ -538,55 +552,61 @@ async function handleStandardStreamGenerateContent(req, res) {
        // 更新最后数据时间
        lastDataTime = Date.now()

-        // 1️⃣ 立即转发原始数据（零延迟，最高优先级）
+        const chunkStr = chunk.toString()
+
+        // 尝试解析 SSE 数据
+        // upstream 返回格式: data: {"response": {...}}
+        // standard API 期望格式: data: {...}
+
+        let processedChunk = chunk
+
+        if (chunkStr.startsWith('data: ')) {
+          try {
+            const jsonStr = chunkStr.substring(6).trim()
+            if (jsonStr !== '[DONE]') {
+              const data = JSON.parse(jsonStr)
+              if (data.response) {
+                // 提取内部的 response 对象并重新包装为 SSE
+                const newPayload = JSON.stringify(data.response)
+                processedChunk = Buffer.from(`data: ${newPayload}\n\n`)
+              }
+            }
+          } catch (e) {
+            // 解析失败，直接转发原始数据
+            // logger.warn('Failed to parse SSE chunk:', e)
+          }
+        }
+
+        // 1️⃣ 立即转发处理后的数据
        if (!res.destroyed) {
-          res.write(chunk) // 直接转发 Buffer，无需转换和序列化
+          res.write(processedChunk)
        }

        // 2️⃣ 异步提取 usage 数据（不阻塞转发）
-        // 使用 setImmediate 将解析放到下一个事件循环
        setImmediate(() => {
          try {
-            const chunkStr = chunk.toString()
-            if (!chunkStr.trim()) {
+            const str = processedChunk.toString()
+            if (!str.trim() || !str.includes('usageMetadata')) {
              return
            }

-            // 快速检查是否包含 usage 数据（避免不必要的解析）
-            if (!chunkStr.includes('usageMetadata')) {
-              return
-            }
-
-            // 处理不完整的行
-            streamBuffer += chunkStr
-            const lines = streamBuffer.split('\n')
-            streamBuffer = lines.pop() || ''
-
-            // 仅解析包含 usage 的行
-            for (const line of lines) {
-              if (!line.trim() || !line.includes('usageMetadata')) {
-                continue
-              }
-
+            // 简单的解析尝试
+            const match = str.match(/"usageMetadata":\s*({[^}]+})/)
+            if (match && match[1]) {
              try {
-                const parsed = parseSSELine(line)
-                if (parsed.type === 'data' && parsed.data.response?.usageMetadata) {
-                  totalUsage = parsed.data.response.usageMetadata
-                  logger.debug('📊 Captured Gemini usage data:', totalUsage)
-                }
-              } catch (parseError) {
-                // 解析失败但不影响转发
-                logger.warn('⚠️ Failed to parse usage line:', parseError.message)
+                const usage = JSON.parse(match[1])
+                totalUsage = usage
+                logger.debug('📊 Captured Gemini usage data:', totalUsage)
+              } catch (e) {
+                // ignore
              }
            }
          } catch (error) {
-            // 提取失败但不影响转发
            logger.warn('⚠️ Error extracting usage data:', error.message)
          }
        })
      } catch (error) {
        logger.error('Error processing stream chunk:', error)
-        // 不中断流，继续处理后续数据
      }
    })

@@ -682,6 +702,18 @@ async function handleStandardStreamGenerateContent(req, res) {
      stack: error.stack
    })

+    // 处理速率限制
+    if (error.response?.status === 429) {
+      logger.warn(
+        `⚠️ Gemini account ${account.id} rate limited (Standard Stream API), marking as limited`
+      )
+      try {
+        await unifiedGeminiScheduler.markAccountRateLimited(account.id, 'gemini', sessionHash)
+      } catch (limitError) {
+        logger.warn('Failed to mark account as rate limited in scheduler:', limitError)
+      }
+    }
+
    if (!res.headersSent) {
      const statusCode = normalizedError.status || 500
      const responseBody = {
@@ -1 +1 @@
 .1.200
 .1.201