Có thể trích xuất các bản sao của hình ảnh được sử dụng để đào tạo các mô hình AI tổng quát

Có thể trích xuất các bản sao của hình ảnh được sử dụng để đào tạo các mô hình AI tổng quát

Nút nguồn: 1942543

Các mô hình AI sáng tạo có thể ghi nhớ hình ảnh từ dữ liệu đào tạo của chúng, có thể cho phép người dùng trích xuất dữ liệu cá nhân có bản quyền, theo nghiên cứu.

Các công cụ như DALL-E, Stable Diffusion và Midjourney được đào tạo dựa trên hàng tỷ hình ảnh được lấy từ internet, bao gồm cả dữ liệu được bảo vệ bởi bản quyền như tác phẩm nghệ thuật và biểu trưng. Họ học cách ánh xạ các biểu diễn trực quan của các đối tượng và phong cách sang ngôn ngữ tự nhiên. Khi họ được cung cấp một mô tả văn bản làm đầu vào, họ sẽ tạo ra một hình ảnh khớp với chú thích làm đầu ra.

Công nghệ mới đã gây ra một cuộc tranh luận pháp lý mới về bản quyền: những công cụ này có vi phạm quyền sở hữu trí tuệ không vì chúng nhập các hình ảnh có bản quyền mà không được phép?

Các vụ kiện đã được nộp chống lại các nhà sản xuất các công cụ AI phổ biến nhất vì vi phạm bản quyền. Các công ty xây dựng mô hình chuyển văn bản thành hình ảnh lập luận rằng vì phần mềm của họ tạo ra những hình ảnh độc đáo nên việc họ sử dụng dữ liệu bản quyền là sử dụng hợp lý. Nhưng những nghệ sĩ đã nhìn thấy phong cách và tác phẩm của họ bị bắt chước bởi những công cụ này tin rằng họ đã bị lừa.

Giờ đây, nghiên cứu do các nhà nghiên cứu làm việc tại Google, DeepMind, Đại học California, Berkeley, ETH Zurich và Đại học Princeton dẫn đầu đã chứng minh rằng có thể trích xuất các hình ảnh được sử dụng để huấn luyện các mô hình này. Các mô hình AI sáng tạo ghi nhớ hình ảnh và có thể tạo các bản sao chính xác của chúng, làm dấy lên những lo ngại mới về bản quyền và quyền riêng tư.

khuếch tán_extract_research

Một số ví dụ về hình ảnh mà các nhà nghiên cứu đã trích xuất được từ Khuếch tán ổn định

Đồng tác giả của nghiên cứu cho biết: “Trong một cuộc tấn công thực sự, khi kẻ thù muốn trích xuất thông tin cá nhân, chúng sẽ đoán nhãn hoặc chú thích được sử dụng cho một hình ảnh. Đăng ký.

“Thật may mắn cho kẻ tấn công, phương pháp của chúng tôi đôi khi có thể hoạt động ngay cả khi dự đoán không hoàn hảo. Ví dụ: chúng ta có thể trích xuất chân dung của Ann Graham Lotz bằng cách chỉ nhắc tên của cô ấy cho Stable Diffusion, thay vì chú thích đầy đủ từ tập huấn luyện (“Sống trong ánh sáng với Ann Graham Lotz”).

khuếch tán_extract_research_2

Chỉ những hình ảnh được mô hình ghi nhớ mới có thể được trích xuất và mức độ một mô hình có thể ghi nhớ dữ liệu khác nhau tùy thuộc vào các yếu tố như dữ liệu huấn luyện và kích thước của nó. Các bản sao của cùng một hình ảnh có nhiều khả năng được ghi nhớ hơn và các mô hình chứa nhiều tham số hơn cũng có nhiều khả năng ghi nhớ hình ảnh hơn.

Nhóm đã có thể trích xuất 94 hình ảnh từ 350,000 ví dụ được sử dụng để đào tạo Khuếch tán ổn định và 23 hình ảnh từ 1,000 ví dụ từ Google's Ảnh người mẫu. Để so sánh, Stable Diffusion có 890 triệu tham số và được đào tạo trên 160 triệu hình ảnh, trong khi Imagen có hai tỷ tham số – không rõ có bao nhiêu hình ảnh được sử dụng để đào tạo chính xác.

Các nhà nghiên cứu cho biết: “Đối với Khuếch tán ổn định, chúng tôi thấy rằng hầu hết các hình ảnh được ghi nhớ đều được nhân đôi từ 100 lần trở lên trong tập huấn luyện, nhưng một số chỉ là 10 lần”. “Đối với mô hình Imagen của Google, một mô hình lớn hơn so với Stable Diffusion và được đào tạo trên một tập dữ liệu nhỏ hơn, việc ghi nhớ dường như diễn ra thường xuyên hơn nhiều. Ở đây, chúng tôi tìm thấy một số hình ảnh ngoại lệ chỉ xuất hiện một lần duy nhất trong toàn bộ tập huấn luyện, nhưng vẫn có thể trích xuất được.”

Họ không chắc tại sao các mô hình lớn hơn có xu hướng ghi nhớ nhiều hình ảnh hơn, nhưng tin rằng điều đó có thể liên quan đến việc có thể lưu trữ nhiều dữ liệu huấn luyện hơn trong các thông số của nó.

Tỷ lệ ghi nhớ đối với các mô hình này khá thấp và trong thực tế, việc trích xuất hình ảnh sẽ rất tẻ nhạt và phức tạp. Những kẻ tấn công sẽ phải đoán và thử nhiều lời nhắc để dẫn dắt mô hình tạo ra dữ liệu đã ghi nhớ. Tuy nhiên, nhóm đang cảnh báo các nhà phát triển hạn chế đào tạo các mô hình AI tổng quát trên dữ liệu nhạy cảm riêng tư.

“Việc ghi nhớ tệ đến mức nào phụ thuộc vào việc áp dụng các mô hình tổng quát. Trong các ứng dụng mang tính riêng tư cao, chẳng hạn như trong lĩnh vực y tế (ví dụ: đào tạo về chụp X-quang ngực hoặc hồ sơ y tế), việc ghi nhớ là điều không mong muốn, ngay cả khi nó chỉ ảnh hưởng đến một bộ phận rất nhỏ người dùng. Hơn nữa, các bộ đào tạo được sử dụng trong các ứng dụng nhạy cảm về quyền riêng tư thường nhỏ hơn các bộ được sử dụng để đào tạo các mô hình nghệ thuật tổng quát hiện tại. Do đó, chúng tôi có thể ghi nhớ nhiều hơn, bao gồm cả những hình ảnh không bị trùng lặp,” họ nói với chúng tôi.

Một cách để ngăn chặn việc trích xuất dữ liệu là giảm khả năng ghi nhớ trong các mô hình. Ví dụ: loại bỏ các bản sao trong tập dữ liệu huấn luyện sẽ giảm thiểu khả năng hình ảnh được ghi nhớ và trích xuất. Ổn định AI, những người tạo ra Khuếch tán ổn định, được cho là đã đào tạo mô hình mới nhất của họ trên một bộ dữ liệu chứa ít bản sao hơn một cách độc lập với phát hiện của các nhà nghiên cứu.

Giờ đây, các mô hình chuyển văn bản thành hình ảnh đã được chứng minh có thể tạo ra các bản sao chính xác của hình ảnh mà chúng đã được đào tạo, không rõ điều này có thể ảnh hưởng đến các trường hợp bản quyền như thế nào.

“Một lập luận phổ biến mà chúng tôi thấy mọi người đưa ra trực tuyến là một số biến thể của 'những mô hình này không bao giờ ghi nhớ dữ liệu huấn luyện'. Bây giờ chúng tôi biết rằng điều này rõ ràng là sai. Nhưng liệu điều này có thực sự quan trọng hay không trong cuộc tranh luận pháp lý thì còn phải tranh luận,” các nhà nghiên cứu kết luận.

“Ít nhất bây giờ, cả hai bên trong những vụ kiện này đều có một số sự thật hữu hình hơn mà họ có thể dựa vào: vâng, việc ghi nhớ xảy ra; nhưng nó rất hiếm; và dường như nó chủ yếu xảy ra đối với những hình ảnh có tính trùng lặp cao.” ®

Dấu thời gian:

Thêm từ Đăng ký