Bytedance bí mật sử dụng công nghệ OpenAI

VNZ-NEWS
Vn-Z.vn Ngày 18 tháng 12 năm 2023, Theo báo chí nước ngoài đưa tin, ByteDance, công ty đang tụt lại phía sau trong cuộc cạnh tranh AI , muốn "đi tắt đón đầu", công ty này đã bí mật sử dụng công nghệ của OpenAI trong quá trình phát triển mô hình ngôn ngữ lớn của riêng mình, điều này vi phạm điều khoản dịch vụ của OpenAI. Hiện tại, tài khoản của ByteDance đã bị OpenAI đình chỉ.

Trong lĩnh vực AI, cách tiếp cận của ByteDance thường bị coi là hành vi “bất lịch sự” và vi phạm trực tiếp các điều khoản dịch vụ của OpenAI. Điều khoản dịch vụ của OpenAI nêu rõ rằng các mô hình do công ty xuất khẩu không thể được sử dụng “để phát triển bất kỳ mô hình AI nào cạnh tranh với các sản phẩm và dịch vụ của chúng tôi”. ByteDance đã mua quyền truy cập vào OpenAI thông qua Microsoft, nhưng Microsoft cũng có chính sách tương tự như OpenAI.

bytedance-7877.webp

Các tài liệu nội bộ của Bytedance mà phương tiện truyền thông nước ngoài thu được xác nhận rằng Bytedance dựa vào giao diện lập trình ứng dụng (API) của OpenAI ở hầu hết mọi giai đoạn phát triển để phát triển mô hình ngôn ngữ lớn cơ bản có tên mã là “Project Seed”, bao gồm các mô hình Đào tạo và đánh giá. Các nhân viên tham gia Project Seed nhận thức rõ về hậu quả tiêu cực của cách làm này. Theo hồ sơ trò chuyện của nhân viên ByteDance trên Lark, phiên bản nước ngoài của Feishu, một nền tảng liên lạc nội bộ, họ đã thảo luận về cách minh oan bằng chứng thông qua "giải mẫn cảm dữ liệu". Theo truyền thông nước ngoài, nhân viên của ByteDance sử dụng rộng rãi công nghệ của OpenAI, đến mức nhân viên của “Seed Project” thường xuyên đạt giới hạn truy cập tối đa của API OpenAI.

Các tài liệu nội bộ cho thấy ByteDance đang sử dụng công nghệ của OpenAI nhiều hơn trong giai đoạn đầu của “chương trình hạt giống”. Vài tháng trước, công ty đã yêu cầu nhóm ngừng sử dụng văn bản do GPT tạo "ở bất kỳ giai đoạn phát triển mô hình nào". Trong khoảng thời gian này, công ty đã nhận được sự chấp thuận để phát hành mô hình AI lớn Beanbao của riêng mình, đưa dự án AI này lên mạng. Tuy nhiên, ByteDance tiếp tục sử dụng API theo những cách vi phạm điều khoản dịch vụ của OpenAI và Microsoft, bao gồm cả việc đánh giá hiệu suất của các mô hình đằng sau Beanbao. Một người có hiểu biết trực tiếp về những gì đang diễn ra bên trong ByteDance cho biết: “Họ nói rằng họ muốn đảm bảo mọi thứ đều hợp pháp, nhưng họ thực sự không muốn bị bắt”.

Người phát ngôn của Bytedance, Jodi Seth trả lời rằng dữ liệu do GPT tạo ra đã được sử dụng để chú thích các mô hình trong quá trình phát triển ban đầu của "Dự án hạt giống" và đã bị xóa khỏi Bytedance vào khoảng giữa năm nay. Seth cho biết trong một tuyên bố: "ByteDance đã nhận được sự cho phép của Microsoft để sử dụng API GPT. Chúng tôi sử dụng GPT để thúc đẩy các sản phẩm và tính năng ở các thị trường ngoài Trung Quốc, nhưng sử dụng mô hình tự phát triển của chúng tôi để thúc đẩy Beanbao. Beanbao chỉ có sẵn ở Trung Quốc". .

Người phát ngôn của OpenAI, Niko Felix đã đưa ra tuyên bố xác nhận rằng tài khoản của ByteDance đã bị đình chỉ. "Tất cả khách hàng API phải tuân thủ chính sách sử dụng của chúng tôi để đảm bảo công nghệ của chúng tôi được sử dụng tốt. Mặc dù ByteDance hiếm khi sử dụng API của chúng tôi nhưng chúng tôi đã đình chỉ tài khoản của họ trong khi điều tra thêm. Nếu chúng tôi thấy việc sử dụng của họ không phù hợp với chính sách của công ty và chúng tôi sẽ yêu cầu họ thực hiện những thay đổi cần thiết hoặc chấm dứt tài khoản của họ", Felix nói.

Người phát ngôn của Microsoft, Frank Shaw, cho biết trong một tuyên bố: “Các giải pháp AI của Microsoft như dịch vụ Azure OpenAI là một phần trong khuôn khổ truy cập hạn chế của chúng tôi, có nghĩa là tất cả khách hàng phải đăng ký và nhận được sự chấp thuận từ Microsoft để truy cập. Chúng tôi cũng đặt ra các tiêu chuẩn và cung cấp tài nguyên để giúp khách hàng của chúng tôi sử dụng các công nghệ này một cách có trách nhiệm và tuân thủ Điều khoản dịch vụ của chúng tôi. Chúng tôi cũng có sẵn các quy trình để phát hiện hành vi lạm dụng và ngăn chặn các doanh nghiệp khi họ vi phạm Quy tắc ứng xử của chúng tôi." "AI Outpost" của Ifeng Technology sẽ tiếp tục chú ý đến vấn đề này.

Mới đây, truyền thông nước ngoài đưa tin Bytedance đang sử dụng công nghệ OpenAI để phát triển mô hình ngôn ngữ lớn của riêng mình, điều này vi phạm điều khoản dịch vụ của OpenAI.

Đáp lại, ByteDance tuyên bố rằng khi sử dụng các dịch vụ liên quan đến OpenAI, công ty này nhấn mạnh họ phải tuân thủ các điều khoản sử dụng. "Chúng tôi cũng đang liên hệ với OpenAI để làm rõ những hiểu lầm có thể xảy ra do các báo cáo bên ngoài gây ra."

Dưới đây là nội dung phần giới thiệu về việc sử dụng dịch vụ OpenAI của ByteDance:

1. Vào đầu năm nay, khi nhóm kỹ thuật bắt đầu tiến hành khám phá ban đầu các mô hình lớn, một số kỹ sư đã áp dụng dịch vụ API của GPT để nghiên cứu dự án thử nghiệm trên các mô hình nhỏ hơn. Mô hình này chỉ để thử nghiệm, chưa có kế hoạch đưa lên mạng và chưa bao giờ được sử dụng bên ngoài. Hoạt động này đã bị ngừng sau khi công ty giới thiệu tính năng kiểm tra đặc tả lệnh gọi GPT API vào tháng 4.

2. Ngay từ tháng 4 năm nay, nhóm Byte Big Model đã đưa ra các yêu cầu nội bộ rõ ràng là không thêm dữ liệu do mô hình GPT tạo ra vào tập dữ liệu đào tạo của Byte Big Model và đào tạo nhóm kỹ thuật tuân thủ điều khoản dịch vụ khi sử dụng GPT. .

Vào tháng 3 và tháng 9, công ty đã tiến hành một đợt kiểm tra nội bộ khác và thực hiện các biện pháp để đảm bảo hơn nữa rằng các lệnh gọi API tới GPT tuân thủ các yêu cầu quy định. Ví dụ: sự giống nhau giữa dữ liệu đào tạo mô hình và GPT được lấy mẫu theo đợt để ngăn người chú thích dữ liệu sử dụng GPT một cách riêng tư.

4. Trong vài ngày tới, chúng tôi sẽ tiến hành kiểm tra toàn diện một lần nữa để đảm bảo tuân thủ nghiêm ngặt các điều khoản sử dụng các dịch vụ liên quan.
 
Trả lời

Swings Onlyone

Rìu Vàng Đôi
VIP User
mất bò mới lo làm chuồng, chờ nó to quá to rồi mới có lòng cảnh giác. hiện đã ngăn k nổi nó lớn mạnh mà chỉ có thể làm chậm quá trình này bằng rất nhiều nỗ lực đáng thương