API AI Không Lưu Trữ Dữ Liệu: Những Điều Các Nhà Xây Dựng Cần Xác Minh

API AI không lưu trữ dữ liệu đang trở thành một câu hỏi sản xuất bình thường, đặc biệt đối với các Nhà xây dựng có ứng dụng xử lý vé hỗ trợ khách hàng, tin nhắn chăm sóc sức khỏe, bản thảo pháp lý, hồ sơ nhân sự, quy trình tài chính hoặc tài liệu kinh doanh riêng tư.
Phiên bản ngắn gọn rất đơn giản: không lưu trữ dữ liệu có nghĩa là nhà cung cấp AI xử lý yêu cầu, trả lại phản hồi và không lưu giữ nội dung khách hàng sau khi yêu cầu hoàn tất.
Phiên bản thực tế thì phức tạp hơn.
Bạn vẫn cần kiểm tra các điểm cuối nào được bao phủ, liệu các tệp tải lên có được bao gồm không, điều gì xảy ra trong các lần thử lại và lỗi, liệu nhật ký giám sát lạm dụng có chứa các lời nhắc hoặc phản hồi không, liệu bộ nhớ đệm có lưu trữ dữ liệu dẫn xuất không, và liệu ứng dụng của bạn có đang ghi lại nội dung chính xác mà bạn hy vọng nhà cung cấp sẽ loại bỏ không.
Đối với các Nhà xây dựng sử dụng ShareAI làm thị trường AI và lớp API phía sau một ứng dụng hiện có, điều này quan trọng vì hai lý do. Thứ nhất, lưu lượng suy luận nhạy cảm cần một kế hoạch định tuyến sạch. Thứ hai, nếu bạn kiếm tiền từ việc sử dụng AI định tuyến thông qua ShareAI, mô hình thanh toán và lợi nhuận không nên tạo ra các thực hành ghi nhật ký hoặc lưu trữ lỏng lẻo xung quanh nội dung khách hàng.
Ý nghĩa của không lưu trữ dữ liệu trong API AI
Không lưu trữ dữ liệu có nghĩa là nội dung khách hàng không được lưu trữ bởi nhà cung cấp AI ngoài những gì cần thiết để xử lý yêu cầu.
Trong API AI, nội dung khách hàng có thể bao gồm lời nhắc, hướng dẫn hệ thống, phản hồi mô hình, tệp tải lên, văn bản trích xuất, nhúng, ngữ cảnh truy xuất, đầu vào công cụ, đầu ra công cụ, hình ảnh, âm thanh, bản ghi, tải trọng tài liệu và siêu dữ liệu có thể tiết lộ các mẫu sử dụng nhạy cảm.
Cụm từ quan trọng là nội dung khách hàng. Một số hệ thống vẫn cần siêu dữ liệu hoạt động để thanh toán, giới hạn tốc độ, ngăn chặn lạm dụng, định tuyến hoặc đảm bảo độ tin cậy. Không lưu trữ dữ liệu không tự động có nghĩa là không có dấu vết của yêu cầu ở bất kỳ đâu. Nó có nghĩa là nội dung chính nó không nên được lưu giữ trong nhật ký phía nhà cung cấp, cơ sở dữ liệu, đường ống đánh giá, tập dữ liệu đào tạo hoặc công cụ hỗ trợ.
Sự khác biệt đó là lý do tại sao hợp đồng quan trọng hơn trang đích.
Không lưu trữ dữ liệu không giống như không đào tạo
Nhiều nhóm hỏi nhà cung cấp một câu hỏi: “Bạn có đào tạo trên dữ liệu của chúng tôi không?”
Điều đó là không đủ.
Một nhà cung cấp có thể hứa không đào tạo mô hình trên dữ liệu API trong khi vẫn giữ lại lời nhắc và phản hồi để giám sát lạm dụng, gỡ lỗi, phân tích, hỗ trợ hoặc lý do pháp lý. Các kiểm soát dữ liệu nền tảng của OpenAI, ví dụ, phân biệt giữa việc sử dụng đào tạo và lưu giữ giám sát lạm dụng, và mô tả không lưu trữ dữ liệu như một kiểm soát riêng biệt cho các khách hàng và điểm cuối đủ điều kiện. Kiểm soát dữ liệu nền tảng OpenAI.
Đối với các đánh giá mua sắm và kỹ thuật, hãy coi đây là các câu hỏi riêng biệt:
| Câu hỏi | Điều này cho bạn biết gì |
|---|---|
| Dữ liệu của chúng ta có được sử dụng để huấn luyện không? | Liệu các lời nhắc và kết quả đầu ra có cải thiện các mô hình trong tương lai không. |
| Dữ liệu của chúng ta có được giữ lại không? | Liệu các lời nhắc, tệp và kết quả đầu ra có còn trong hệ thống của nhà cung cấp sau khi xử lý không. |
| Những điểm cuối nào được bao gồm? | Liệu trò chuyện, tệp, công cụ, công việc hàng loạt, hình ảnh hoặc tác nhân có tuân theo cùng một quy tắc không. |
| Hợp đồng nói gì? | Liệu cam kết có thể được thực thi đối với khối lượng công việc thực tế của bạn không. |
Nếu câu trả lời không rõ ràng, hãy giả định rằng việc giữ lại tiêu chuẩn được áp dụng cho đến khi nhà cung cấp xác nhận khác bằng văn bản.
Tại sao các Nhà xây dựng nên quan tâm trước khi định tuyến suy luận nhạy cảm
Các Nhà xây dựng là chủ sở hữu ứng dụng, người bảo trì, cơ quan và nhóm sản phẩm đã có một ứng dụng bên ngoài ShareAI.
Ứng dụng đó có thể gửi lưu lượng AI từ nền tảng hỗ trợ, sản phẩm phân tích, công cụ tài liệu, chatbot, tự động hóa quy trình làm việc, trợ lý CRM, cổng thông tin nội bộ hoặc ứng dụng tự lưu trữ. Nếu những yêu cầu đó chứa dữ liệu nhạy cảm, việc giữ lại trở thành một phần của kiến trúc sản phẩm.
Rủi ro không chỉ là đào tạo nhà cung cấp. Nó cũng là các bản sao không cần thiết.
Một công cụ tự động hỗ trợ có thể gửi một khiếu nại của khách hàng kèm theo chi tiết tài khoản. Một quy trình làm việc tài liệu có thể gửi một điều khoản hợp đồng. Một sản phẩm chăm sóc sức khỏe có thể gửi thông tin sức khỏe được bảo vệ. Một trợ lý tài chính có thể gửi ngữ cảnh giao dịch. Nếu nội dung đó được lưu trữ bởi nhà cung cấp AI, được ghi lại bởi một cổng, sao chép vào một hệ thống quan sát, và được lưu giữ bởi backend của bạn, thì mức độ phơi nhiễm sẽ tăng nhanh chóng.
Các nhóm bị quản lý đã suy nghĩ theo cách này. GDPR bao gồm các nguyên tắc giới hạn lưu trữ và giảm thiểu dữ liệu trong Điều 5 của quy định: Quy định (EU) 2016/679. Đối với các quy trình làm việc chăm sóc sức khỏe tại Hoa Kỳ, bản tóm tắt Quy tắc Bảo mật HIPAA của HHS giải thích sự cần thiết của các biện pháp bảo vệ hành chính, vật lý và kỹ thuật đối với thông tin sức khỏe điện tử được bảo vệ: Bản tóm tắt Quy tắc Bảo mật HIPAA của HHS.
Ngay cả khi một nhóm không bị quản lý chính thức, cùng một kỷ luật sản phẩm vẫn được áp dụng: không lưu giữ nội dung của khách hàng trừ khi sản phẩm thực sự cần nó.
Danh sách kiểm tra API AI không lưu giữ dữ liệu
Sử dụng danh sách kiểm tra này trước khi định tuyến lưu lượng suy luận nhạy cảm qua bất kỳ API AI, cổng, hoặc nhà cung cấp mô hình nào.
1. Xác nhận các điểm cuối cụ thể được bao phủ
Hỏi liệu không lưu giữ dữ liệu có bao gồm điểm cuối mà bạn thực sự sử dụng hay không. Đừng giả định rằng các hoàn thành trò chuyện, tải lên tệp, đầu vào hình ảnh, nhúng, công việc hàng loạt, cuộc gọi công cụ, phiên đại lý, bộ nhớ đệm gợi ý, và thực thi mã đều có cùng hành vi lưu giữ. Các tính năng có trạng thái thường cần lưu trữ để hoạt động.
2. Tách biệt đầu vào, đầu ra và tệp
Một số nhà cung cấp xử lý gợi ý khác với tệp tải lên hoặc đầu ra được tạo ra. Một chính sách lưu giữ hữu ích nên nói rõ điều gì xảy ra với gợi ý của người dùng, gợi ý của hệ thống, đầu ra của mô hình, tệp tải lên, văn bản được phân tích, dữ liệu hình ảnh hoặc âm thanh, kết quả công cụ, và ngữ cảnh được truy xuất.
3. Kiểm tra giám sát lạm dụng và nhật ký hỗ trợ
Việc lưu giữ API AI tiêu chuẩn thường tồn tại vì lý do an toàn, phát hiện lạm dụng, độ tin cậy, hoặc hỗ trợ. Điều đó có thể hợp lý, nhưng vẫn có nghĩa là nội dung có thể được lưu trữ. Hỏi liệu gợi ý và phản hồi có xuất hiện trong nhật ký giám sát lạm dụng, nhật ký hỗ trợ, mẫu đánh giá, sự kiện phân tích, hoặc dấu vết gỡ lỗi hay không.
4. Xem xét các lần thử lại, lỗi và hết thời gian chờ
Các chính sách lưu giữ thường mô tả các yêu cầu thành công. Các hệ thống sản xuất cũng có lỗi. Hãy hỏi điều gì xảy ra khi một yêu cầu thất bại, hết thời gian chờ, thử lại, kích hoạt bộ phân loại an toàn hoặc tạo ra lỗi từ nhà cung cấp.
5. Kiểm tra bộ nhớ đệm và trạng thái ứng dụng
Bộ nhớ đệm gợi ý, bộ nhớ hội thoại, tìm kiếm tệp, kho vector, công cụ được lưu trữ và xử lý hàng loạt đều có thể yêu cầu trạng thái được lưu trữ. Điều đó không làm chúng trở nên xấu. Nó có nghĩa là chúng nên được xem xét riêng biệt với suy luận không trạng thái.
6. Kiểm tra nhật ký ứng dụng của bạn
Không lưu giữ dữ liệu tại nhà cung cấp AI không khắc phục được nhật ký trong hệ thống của bạn. Kiểm tra nhật ký backend của bạn, cổng API, proxy ngược, trình theo dõi lỗi, công cụ APM, sự kiện phân tích, kho dữ liệu, bảng điều khiển hỗ trợ và màn hình quản trị nội bộ.
7. Xác minh khu vực, các bộ xử lý phụ và hợp đồng
Đối với các khối lượng công việc nhạy cảm, hãy làm cho việc xem xét pháp lý và vận hành trở nên cụ thể. Xác nhận nhà cung cấp nào xử lý yêu cầu, khu vực nào xử lý lưu lượng, các bộ xử lý phụ nào có thể truy cập dữ liệu, liệu hợp đồng có đề cập đến việc không lưu giữ dữ liệu hay không và liệu chính sách có bao gồm tất cả các mô hình trong tuyến của bạn hay không.
Cách ShareAI phù hợp với lớp định tuyến và kiếm tiền
ShareAI là một thị trường AI do con người vận hành và API. Khách hàng và nhà phát triển sử dụng nó để truy cập hơn 150 mô hình thông qua một API, so sánh tín hiệu thị trường và định tuyến yêu cầu dựa trên lựa chọn mô hình, giá cả, tính sẵn sàng, độ trễ và độ tin cậy.
Các nhà xây dựng sử dụng ShareAI theo cách khác nhau.
Một Nhà xây dựng mang đến một ứng dụng đã tồn tại bên ngoài ShareAI. ShareAI không xây dựng ứng dụng, lưu trữ ứng dụng hoặc hoạt động như một trình xây dựng ứng dụng không mã. Thay vào đó, Nhà xây dựng có thể định tuyến lưu lượng suy luận AI từ ứng dụng đó qua ShareAI, đặt phụ phí hoặc biên lợi nhuận, để khách hàng thanh toán cho ShareAI cho việc sử dụng được định tuyến và nhận thanh toán hàng tháng dựa trên thu nhập tạo ra.
Đối với các ứng dụng ưu tiên quyền riêng tư hoặc nhạy cảm, mô hình kiếm tiền đó nên được kết hợp với việc xem xét lưu giữ cẩn thận.
ShareAI có thể hỗ trợ lớp lưu lượng AI và thanh toán. Nó không loại bỏ nhu cầu xác minh lưu giữ của nhà cung cấp, nhật ký cấp ứng dụng, hợp đồng khách hàng, ràng buộc khu vực hoặc nghĩa vụ dữ liệu được quy định. Một thiết lập Nhà xây dựng tốt giữ cho mô hình kinh doanh và đường dẫn dữ liệu dễ hiểu cùng một lúc.
Câu hỏi đúng không phải là “Chúng ta có thể kiếm tiền từ việc sử dụng AI không?” Mà là: chúng ta có thể định tuyến, lập hóa đơn và định giá việc sử dụng AI mà không lưu giữ nội dung của khách hàng lâu hơn thời gian sản phẩm thực sự yêu cầu không?
Một mẫu Builder đơn giản cho việc sử dụng AI nhạy cảm
Đối với lưu lượng suy luận nhạy cảm, bắt đầu với đường dẫn dữ liệu nhỏ nhất có ích:
- Loại bỏ dữ liệu cá nhân hoặc bí mật không cần thiết trước khi gọi API.
- Chỉ gửi các trường mà mô hình cần cho nhiệm vụ.
- Chuyển yêu cầu qua lớp API AI hoặc lớp thị trường đã chọn.
- Lưu trữ siêu dữ liệu vận hành để tính phí và đảm bảo độ tin cậy, không lưu nội dung khách hàng thô trừ khi cần thiết.
- Mặc định xóa các lời nhắc và kết quả khỏi nhật ký.
- Giữ một ma trận lưu giữ bằng văn bản cho ứng dụng, cổng, nhà cung cấp, công cụ quan sát và hệ thống hỗ trợ của bạn.
- Kiểm tra lại ma trận bất cứ khi nào bạn thêm mô hình, điểm cuối, công cụ hoặc nhà cung cấp mới.
Điều này đặc biệt quan trọng đối với các Builder có mức sử dụng AI không đồng đều. Người dùng nặng có thể tạo ra nhiều chi phí và lưu lượng nhạy cảm hơn người dùng nhẹ. Giá dựa trên mức sử dụng có thể công bằng hơn, nhưng nhóm sản phẩm vẫn cần giữ mô hình lưu giữ sạch sẽ.
Khi việc không lưu giữ dữ liệu có thể không đủ
Không lưu giữ dữ liệu là hữu ích, nhưng nó không phải là một kiến trúc bảo mật hoàn chỉnh.
Bạn có thể cần các kiểm soát mạnh hơn khi khách hàng yêu cầu triển khai riêng hoặc cách ly cấp VPC, lời nhắc bao gồm dữ liệu sức khỏe, pháp lý, tài chính hoặc nhân viên được quy định, quy trình làm việc phụ thuộc vào các tệp được lưu trữ hoặc trạng thái đại lý chạy dài, hợp đồng khách hàng hạn chế các nhà thầu phụ hoặc khu vực, kiểm toán viên yêu cầu bằng chứng ngoài các trang chính sách của nhà cung cấp, hoặc sản phẩm của bạn cần xem xét chi tiết lời nhắc và kết quả.
Trong những trường hợp đó, hãy coi việc không lưu giữ dữ liệu là một kiểm soát trong thiết kế rộng hơn. Kết hợp nó với việc giảm thiểu dữ liệu, xóa thông tin, kiểm soát truy cập, đánh giá nhà cung cấp cụ thể theo điểm cuối, quy tắc ghi nhật ký nội bộ và tài liệu hướng tới khách hàng.
Câu hỏi thường gặp
API AI không lưu giữ dữ liệu là gì?
Các API AI không lưu trữ dữ liệu xử lý nội dung khách hàng để hoàn thành yêu cầu mà không lưu giữ các lời nhắc, đầu ra, tệp hoặc nội dung yêu cầu khác sau khi xử lý. Phạm vi chính xác phụ thuộc vào nhà cung cấp, điểm cuối, hợp đồng và tính năng.
Việc không lưu trữ dữ liệu có giống với việc không huấn luyện mô hình không?
Không. Chính sách không huấn luyện bao gồm việc liệu dữ liệu khách hàng có cải thiện các mô hình tương lai hay không. Việc không lưu trữ dữ liệu bao gồm việc liệu nội dung khách hàng có được lưu trữ sau yêu cầu hay không. Một nhà cung cấp có thể tránh huấn luyện trên dữ liệu của bạn trong khi vẫn lưu giữ các lời nhắc hoặc đầu ra trong một khoảng thời gian giới hạn.
Các nhà phát triển có cần không lưu trữ dữ liệu cho mọi tính năng AI không?
Không phải lúc nào cũng cần. Một trình tạo FAQ công khai có thể không cần các kiểm soát giống như một công cụ tóm tắt y tế hoặc trợ lý tài liệu pháp lý. Các nhà phát triển nên điều chỉnh yêu cầu lưu trữ theo mức độ nhạy cảm của lưu lượng, cam kết với khách hàng và nghĩa vụ hợp đồng.
ShareAI có thể đảm bảo không lưu trữ dữ liệu cho mọi tuyến nhà cung cấp không?
Đừng giả định điều đó. ShareAI là một thị trường AI và lớp API để truy cập mô hình, định tuyến, thanh toán và kiếm tiền cho nhà phát triển. Các nhà phát triển vẫn cần xác minh yêu cầu lưu trữ, hành vi của nhà cung cấp, hợp đồng khách hàng và quy tắc ghi nhật ký nội bộ cho khối lượng công việc thực tế của họ.
Điều này có ý nghĩa gì đối với các nhà phát triển ShareAI?
Các nhà phát triển có thể định tuyến việc sử dụng AI từ một ứng dụng hiện có thông qua ShareAI, đặt phụ phí hoặc biên lợi nhuận, để khách hàng thanh toán cho việc sử dụng định tuyến qua ShareAI và nhận các khoản thanh toán hàng tháng. Nếu ứng dụng xử lý dữ liệu nhạy cảm, nhà phát triển nên thiết kế đường dẫn định tuyến và ghi nhật ký cẩn thận trước khi kiếm tiền từ việc sử dụng đó.
Một ứng dụng ưu tiên quyền riêng tư nên kiểm tra điều gì trước khi thêm AI?
Một ứng dụng ưu tiên quyền riêng tư nên kiểm tra việc giảm thiểu dữ liệu, lưu trữ của nhà cung cấp, nhật ký cổng, nhật ký nội bộ, quy tắc vùng và bộ xử lý phụ, phạm vi điểm cuối, tiết lộ cho khách hàng, và liệu bất kỳ tính năng nào có lưu trữ lời nhắc, tệp, đầu ra hoặc trạng thái cuộc trò chuyện hay không.
Các cổng API có đủ để giải quyết rủi ro lưu trữ không?
Không. Một cổng có thể tập trung hóa định tuyến, chính sách, thanh toán và khả năng quan sát, nhưng nó cũng có thể trở thành một nơi khác mà nội dung được ghi nhật ký. Các nhóm cần cấu hình cổng, ứng dụng và công cụ quan sát để không lưu giữ nội dung thô của khách hàng một cách không cần thiết.
Sự khác biệt giữa không lưu trữ dữ liệu và triển khai riêng tư là gì?
Không lưu trữ dữ liệu thường là một cam kết lưu trữ bên trong kiến trúc nhà cung cấp hoặc cổng. Triển khai riêng tư là một mô hình cơ sở hạ tầng và cách ly. Triển khai riêng tư có thể cung cấp nhiều kiểm soát hơn, nhưng nó cũng có thể yêu cầu nhiều công việc vận hành hơn.
Có nên lưu trữ các lời nhắc AI để gỡ lỗi không?
Chỉ khi sản phẩm, khách hàng và mô hình tuân thủ cho phép. Nhiều nhóm có thể gỡ lỗi với các lời nhắc đã được chỉnh sửa, ID yêu cầu, siêu dữ liệu mô hình, độ trễ, số lượng token và các lớp lỗi thay vì nội dung thô của khách hàng.
Tần suất nên xem xét cài đặt lưu trữ là bao nhiêu?
Xem xét cài đặt lưu trữ bất cứ khi nào bạn thêm mô hình, nhà cung cấp, điểm cuối, công cụ, quy trình làm việc tệp, tính năng đại lý, nhà cung cấp ghi nhật ký hoặc đường dẫn thanh toán. Một kế hoạch lưu trữ chỉ hữu ích nếu nó tuân theo kiến trúc sản xuất.
Bước đầu tiên an toàn nhất cho một Nhà xây dựng là gì?
Lập bản đồ toàn bộ đường dẫn suy luận. Ghi lại nơi nội dung khách hàng đi vào, hệ thống nào nhìn thấy nó, những gì được ghi nhật ký, thời gian lưu trữ, ai có thể truy cập và những gì khách hàng được thông báo. Sau đó chọn API, định tuyến, thanh toán và thiết lập kiếm tiền phù hợp với đường dẫn đó.
Bước tiếp theo
Nếu bạn đang xây dựng với các API AI, hãy bắt đầu bằng cách làm cho đường dẫn lưu lượng truy cập trở nên rõ ràng. Sau đó chọn lớp định tuyến và thanh toán giữ cho việc truy cập mô hình, sử dụng và kiếm tiền trở nên dễ hiểu.
ShareAI cung cấp cho nhà phát triển một API cho hơn 150 mô hình và cung cấp cho Nhà xây dựng một cách để định tuyến lưu lượng suy luận do ứng dụng điều khiển thông qua ShareAI với mô hình phụ phí rõ ràng, thanh toán khách hàng và thanh toán hàng tháng.
Khám phá thiết lập kỹ thuật trong tài liệu ShareAI, xem xét các mô hình có sẵn trong chợ mô hình ShareAI, hoặc mở Bảng điều khiển Nhà xây dựng khi bạn sẵn sàng kiếm tiền từ việc sử dụng AI được định tuyến từ một ứng dụng bạn đã sở hữu.