Trí tuệ nhân tạo sáng tạo tái tạo các video mà mọi người đang xem bằng cách đọc hoạt động não bộ của họ

Được xuất bản lại bởi Plato

Người theo dõi: 0

khả năngloại máy để đọc được suy nghĩ của chúng tôi đã có những bước tiến vững chắc trong những năm gần đây. Giờ đây, các nhà nghiên cứu đã sử dụng công nghệ tạo video AI để cung cấp cho chúng ta một cửa sổ nhìn vào tâm trí.

Động lực chính đằng sau nỗ lực giải thích các tín hiệu não là hy vọng rằng một ngày nào đó chúng ta có thể cung cấp các cửa sổ giao tiếp mới cho những người bị hôn mê hoặc bị các dạng tê liệt khác nhau. Nhưng cũng có những hy vọng rằng công nghệ này có thể tạo ra các giao diện trực quan hơn giữa con người và máy móc, đồng thời có thể có các ứng dụng cho người khỏe mạnh.

Cho đến nay, hầu hết các nghiên cứu đều tập trung vào nỗ lực tái tạo độc thoại nội tâm.s của bệnh nhân, sử dụng hệ thống AI để chọn ra những từ họ đang nghĩ đến. Các kết quả hứa hẹn nhất cũng đến từ việc cấy ghép não xâm lấn mà dường như không phải là một phương pháp thực tế đối với hầu hết mọi người.

Tuy nhiên, giờ đây, các nhà nghiên cứu từ Đại học Quốc gia Singapore và Đại học Trung văn Hồng Kông đã chỉ ra rằng họ có thể kết hợp quét não không xâm lấn và công nghệ tạo hình ảnh AI để tạo ra các đoạn video ngắn giống một cách kỳ lạ với các clip mà các đối tượng đang xem. khi dữ liệu não bộ của họ được thu thập.

Công trình là sự mở rộng nghiên cứu của cùng tác giả xuất bản cuối năm ngoái, nơi họ cho thấy họ có thể tạo ra những hình ảnh tĩnh gần giống với những bức ảnh mà các đối tượng đã được hiển thị. Điều này đạt được bằng cách đào tạo một mô hình đầu tiên trên một lượng lớn dữ liệu được thu thập bằng máy quét não fMRI. Sau đó, mô hình này được kết hợp với Công cụ khuếch tán ổn định AI tạo hình ảnh nguồn mở để tạo ra hình ảnh.

Trong một bài báo mới xuất bản trên máy chủ in sẵn arXiv, các tác giả thực hiện một cách tiếp cận tương tự, nhưng điều chỉnh nó để hệ thống có thể diễn giải các luồng dữ liệu não bộ và chuyển đổi chúng thành video thay vì ảnh tĩnh. Đầu tiên, họ đào tạo một mô hình trên một lượng lớn fMRI để nó có thể tìm hiểu các đặc điểm chung của những lần quét não này. Điều này sau đó đã được tăng cường để nó có thể xử lý một loạt các lần quét fMRI thay vì từng lần quét riêng lẻ, sau đó được đào tạo lại về sự kết hợp của các lần quét fMRI, các đoạn video gợi ra hoạt động não đó và các mô tả văn bản.

Một cách riêng biệt, các nhà nghiên cứu đã điều chỉnh mô hình Khuếch tán ổn định được đào tạo trước để tạo ra video thay vì hình ảnh tĩnh. Sau đó, nó được đào tạo lại trên cùng các video và mô tả văn bản mà mô hình đầu tiên đã được đào tạo. Cuối cùng, hai mô hình đã được kết hợp và tinh chỉnh cùng nhau trên các lần quét fMRI và các video liên quan của chúng.

Kết quả là hệ thống có thể thực hiện các bản quét fMRI mới mà nó chưa từng thấy trước đây và tạo ra các video gần giống với chủ đề con người trong clip had đã được xem tại thời điểm đó. Mặc dù không phải là một sự kết hợp hoàn hảo, nhưng đầu ra của AI nhìn chung khá gần với video gốc, tái tạo chính xác cảnh đám đông hoặc đàn ngựa và thường khớp với bảng màu.

Để đánh giá hệ thống của họ, các nhà nghiên cứu đã sử dụng một bộ phân loại video được thiết kế để đánh giá mức độ hiểu ngữ nghĩa của cảnh của mô hình—ví dụ: liệu nó có nhận ra video là cảnh cá bơi trong bể cá hay một gia đình đang đi trên đường— ngay cả khi hình ảnh hơi khác một chút. Mô hình của họ đạt 85%, tức là cải thiện 45% so với mô hình hiện đại nhất.

Mặc dù các video mà AI tạo ra vẫn còn trục trặc, nhưng các tác giả cho biết dòng nghiên cứu này cuối cùng có thể có ứng dụng trong cả khoa học thần kinh cơ bản và cả tương lai. giao diện não-máy. Tuy nhiên, họ cũng thừa nhận những nhược điểm tiềm tàng của công nghệ. Họ viết: “Các quy định của chính phủ và nỗ lực từ các cộng đồng nghiên cứu là cần thiết để đảm bảo tính riêng tư của dữ liệu sinh học của một người và tránh mọi hành vi sử dụng công nghệ này với mục đích xấu”.

Đó có thể là một cái gật đầu trước những lo ngại rằng sự kết hợp của công nghệ quét não AI có thể khiến mọi người có thể ghi lại suy nghĩ của người khác một cách xâm phạm mà không có sự đồng ý của họ. Alo lắng là Ngoài ra đã lên tiếng vào đầu năm nay khi các nhà nghiên cứu sử dụng một cách tiếp cận tương tự để tạo ra một bức tranh thô bản sao của giọng nói trong đầu mọi người, mặc dù các chuyên gia đã chỉ ra rằng đây sẽ là không thực tế nếu không phải là không thể cho tới tương lai dự đoán trước được.

Nhưng cho dù bạn coi đó là một sự xâm phạm đáng sợ vào quyền riêng tư của mình hay một cách mới thú vị để giao tiếp với công nghệ, thì có vẻ như những người đọc tâm trí máy móc đang tiến gần hơn đến thực tế.

Ảnh: Claudia Dewald từ Pixabay