ShareAI 自動故障切換:同模型路由 + BYOI 實現零停機AI

當一個AI供應商出現問題,你嘅用戶唔應該受影響。. ShareAI自動故障切換 通過路由到 同一個模型 喺多個供應商之間保持請求流暢——咁樣體驗保持一致,你唔需要發緊急補丁。你仲可以 BYOI(帶自己嘅基礎設施) 將私人端點設為默認或者私人後備層。.
點解停機會有影響(同埋點解單一供應商=單一故障點)
真實嘅事故模式
停機好少會令 所有嘢 完全癱瘓。通常係模型特定嘅小問題、速率限制爆發、地區性嘅服務中斷或者維護時間。如果你嘅技術堆疊綁死喺單一API,呢啲就會變成用戶可見嘅漏洞。.
“重試同祈禱”嘅隱藏成本”
無路由嘅重試只會增加延遲、耗盡配額,仲會增加放棄率。業務成本會喺SLA、流失率同支援負擔中顯現。.
ShareAI嘅“同模型故障切換”係咩意思
模型等效路由
如果 model-x 喺供應商A開始失敗嘅時候,ShareAI會路由到 同一個模型(或者最接近嘅等效模型) 喺供應商B—有防護措施保持行為一致。咁樣將停機變成一個 路由決策, ,唔係產品故障。.
對終端用戶同產品代碼係無形嘅
你嘅集成只需要調用一個端點。故障切換喺控制平面發生—無功能標誌,無緊急重新部署 對你嘅應用程式。.
符合你目標嘅政策調節
設定每個端點政策,例如 優先延遲, 優先成本, ,或者 嚴格供應商順序. 你決定幾咁進取咁轉移失敗——同埋轉俾邊個。.
兩種方法喺生產環境中使用ShareAI
預設編排層(永遠開啟嘅多供應商)
經ShareAI發送每個請求。你可以即時獲得健康檢查、同模型路由同埋供應商A/B測試。探索 模型市場 去揀你嘅主要同備用: 瀏覽模型
即插即用安全網(只限事故)
保留你現有嘅SDK,但將ShareAI連接作為 後備路徑. 當你嘅主要失敗時,自動將流量切換到ShareAI,無用戶可見嘅中斷。.
按功能路由
例子:聊天默認使用供應商X;嵌入因價格使用供應商Y;兩者都有自動轉移到備用嘅功能。.
用ShareAI帶上你自己嘅基礎設施(BYOI)
插入私人推理
連接自託管端點(VPC、本地、合作夥伴POP)。使用BYOI作為 主要容量 或者作為一個 私人後備 層級,只有你嘅組織可以睇到。由 供應商指南 同儀表板開始: 供應商指南 • 提供者儀表板
鑰匙、配額、流量分配
每個模型附加多個API鑰匙(同供應商);按環境/團隊定義配額同流量分配。.
地區同數據駐留
將流量固定喺允許嘅地區,或者通過 地理位置設置 請求新地區以滿足合規性同延遲目標: 地理位置設置
自動故障轉移點樣運作(內部運作)
健康同延遲探測
ShareAI 持續檢查供應商/模型/地區嘅健康狀況同延遲。閾值觸發 電路斷路器 即時轉移流量。.
模型等效地圖
一個精心設計嘅地圖會喺唔同供應商之間對齊模型ID(並評分「最接近嘅等效物」),咁樣故障切換可以盡可能保留指令跟隨行為、分詞特性同埋上下文限制。.
設計上嘅安全重試
冪等鍵同指數回退可以避免重複工作,同時減少尾部延遲。.
可觀察性
你會見到 跟蹤、故障切換原因同成本/延遲差異 喺控制台同日誌入面。睇睇 文件 當你準備好進一步嘅儀表化時: 文件首頁
快速開始:發出你第一個有韌性嘅請求
5步設置
1. 登入 並創建一個API密鑰。. 登入或者註冊 • 創建API Key
2. 喺控制台選擇一個 主要 每個模型嘅供應商。.
3. 添加 備份 供應商(同可選嘅BYOI端點)。.
4. 啟用 同模型路由 同定義後備政策(延遲/成本/順序)。.
5. 發送你嘅第一個請求(喺下面)並模擬一個事故嚟睇自動故障切換。.
代碼:一個請求,自動供應商故障切換
JavaScript(fetch)
const res = await fetch("https://api.shareai.now/v1/chat/completions", {;
Python(requests)
import os
想要更深入嘅講解?由呢度開始 API 參考 快速入門: API 參考. 。或者即時試下 遊樂場 (非常適合喺唔寫代碼嘅情況下驗證故障切換政策): 開放操場
喺事故期間保持體驗順暢
智能超時同部分回應
快速從失敗嘅供應商中失敗;如果你嘅UX支持,流式傳輸部分結果,然後從後備完成。.
緩存常見嘅提示
緩存靜態提示(FAQ,模板系統提示),喺事故期間即時提供。.
排隊同批量處理非緊急工作
批量處理繁重嘅工作(例如,摘要),喺健康容量恢復後盡快恢復——唔會丟失任務。.
透明嘅溝通
喺應用內添加一個與供應商狀態同你自己嘅路由狀態相關嘅橫幅。指引讀者到你嘅 發佈/更新日誌 當行為改變時: 睇版本發佈
控制支出同時保持在線
成本上限同後備順序
設置一個 最大倍數 用於後備(例如,“≤1.2×主要CPM”)。如果後備超過咗,路由到下一個最適合嘅選項。.
每個團隊嘅預算同提醒
為每個工作空間/項目設置預算;對故障轉移高峰發出警報,避免財務部門措手不及。.
事故後報告
檢視有幾多流量故障轉移、原因同埋成本/延遲差異,以改進政策。.
安全同合規,即使跨供應商都適用
地區固定:需要時保持數據喺地區內。. 零保留模式:需要時停用請求記錄。. 可審核性:導出日誌同追蹤記錄以符合受監管環境。關於供應商地理位置同控制,請參閱 地理位置設置 喺控制台: 允許位置
常見問題
我可唔可以強制ShareAI使用指定模型ID?
可以——鎖定到特定供應商+模型ID。或者喺冇完全相同模型時允許最接近嘅故障轉移。.
如果冇完全相同嘅模型存在點算?
使用 最接近嘅等效 策略嚟根據能力、上下文大小同成本揀最近嘅模型。你可以控制係平穩降級定係直接失敗。.
我點樣測試故障轉移而唔影響生產環境?
使用 遊樂場 或者用一個測試密鑰嚟模擬供應商失敗(例如,暫時封鎖一個供應商)並檢查追蹤: 遊樂場
BYOI 需要公開入口嗎?
唔需要。你可以運行 私人/VPC 端點,並將佢哋註冊為只對你嘅組織可見嘅供應商。從呢個開始 供應商指南: 供應商指南
結論
中斷係無可避免嘅。有咗 ShareAI自動故障切換 同埋 自帶自己嘅工具, ,佢哋唔一定要造成干擾。路由到 同一個模型 跨供應商,保持 SLA 完整,控制成本同合規性——全部都唔需要改變你嘅應用程式代碼。當一個供應商失敗時,ShareAI 會保持你在線。.