Người dùng quảng cáo thì thầm JAX là API chuyển giọng nói thành văn bản nhanh nhất

Người dùng quảng cáo thì thầm JAX là API chuyển giọng nói thành văn bản nhanh nhất

Nút nguồn: 2607028

Mark Zuckerberg có thể đã phổ biến thuật ngữ “metaverse”, nhưng người sáng lập và Giám đốc điều hành Meta có thể không còn giới thiệu metaverse cho người dùng và nhà quảng cáo với sự nhiệt tình như trước đây nữa. Hoặc có vẻ như vậy. Gần đây, Meta đã cho thấy sự tập trung nhiều hơn vào AI tổng quát.

AI sáng tạo là một tập hợp các kỹ thuật máy học cho phép máy tính tạo văn bản, vẽ tranh và tạo các phương tiện khác giống với đầu ra của con người. Giờ đây, Meta đang cố gắng thu hút người dùng và nhà quảng cáo bằng các video dạng ngắn giống như TikTok và các công cụ AI của mình.

Công ty công nghệ có trụ sở tại California gần đây công bố việc tạo ra một đơn vị sản phẩm mới tập trung vào trí tuệ nhân tạo – Meta AI. Bộ phận do giám đốc sản phẩm hiện tại Chris Cox đứng đầu và kết hợp một số nhóm trên Meta.

Ngoài ra đọc: Big Tech từ bỏ Metaverse để theo đuổi sự cường điệu của AI Chatbot

Meta ra mắt DinoV2

Nhóm Meta đang phát triển các nhân vật AI có thể giúp người dùng theo nhiều cách, Zuckerberg tuyên bố. Điều này bao gồm các thử nghiệm với trải nghiệm trò chuyện AI trong WhatsApp và Messenger, bộ lọc hình ảnh AI và định dạng quảng cáo trong Instagram cũng như video AI và trải nghiệm đa phương thức.

Năm ngoái, Meta AI đã giới thiệu Make-A-Video, một hệ thống thông minh nhân tạo cho phép người dùng tạo video từ lời nhắc văn bản. Gần đây, nó đã tung ra một số sản phẩm AI, bao gồm DinoV2 và SAM.

Được phát hành vào ngày 17 tháng 2, DinoV3 là một mô hình AI tổng quát có thể nhanh chóng tạo nội dung XNUMXD cho thế giới ảo. Theo một blog đăng bài, mô hình có thể tạo các hình dạng ba chiều (3D) với cấu trúc liên kết, chi tiết hình học phong phú và kết cấu từ dữ liệu như hình ảnh và video.

Meta cho biết DinoV2 sử dụng phương pháp học tự giám sát, một kỹ thuật cho phép mô hình học từ một lượng lớn dữ liệu chưa được gắn nhãn mà không cần bất kỳ sự hỗ trợ ghi nhãn bên ngoài nào. Công cụ này có thể rất hữu ích cho người tạo nội dung video và trong các ứng dụng khác.

Meta cho biết họ đã sử dụng mô hình này với sự cộng tác của Khôi phục chuyển tiếp để “lập bản đồ các khu rừng, từng cây, trên các khu vực có kích thước bằng các lục địa.” DinoV2 có thể xác định và nhận dạng các đối tượng khác nhau trong video như người, vật nuôi và các vật phẩm khác. Nó cũng có thể xác định mối quan hệ giữa các đối tượng này và toàn bộ cảnh.

Doanh nhân kỹ thuật số Abah mô tả mô hình trên Twitter là “một bước đột phá để đạt được các mô hình thị giác máy tính cấp ngành. Việc sử dụng phương pháp học tự giám sát là một yếu tố thay đổi cuộc chơi và chắc chắn sẽ tạo ra làn sóng trong ngành công nghệ.”

Những người khác bày tỏ sự quan tâm đến việc sử dụng DinoV2 trong nông nghiệp, y học và các ngành công nghiệp khác. SAM, mặt khác, là một mô hình AI mới có thể xác định các đối tượng riêng lẻ từ bên trong một hình ảnh. Nó đi kèm với một bộ dữ liệu gồm các chú thích hình ảnh có sẵn cho các nhà nghiên cứu sử dụng.

Các vấn đề về metaverse của Meta

Trong những tháng gần đây, ngày càng có nhiều công ty công nghệ lớn trở nên nguội lạnh trên metaverse khi trọng tâm chuyển sang cơn sốt chatbot AI mới.

Vào tháng Hai, gã khổng lồ công nghệ Trung Quốc Tencent Holdings cắt giảm nhân sự tại đơn vị thực tế mở rộng (XR) và gấp kế hoạch cho phần cứng thực tế ảo (VR). Cả Meta và Microsoft đều đã thu nhỏ lại các kế hoạch metaverse của họ một cách đáng kể.

Bộ phận Phòng thí nghiệm thực tế của Meta, một bộ phận của doanh nghiệp tập trung vào VR và metaverse, đã thua lỗ kể từ khi thành lập và báo cáo khoản lỗ hơn 13.7 tỷ đô la vào năm ngoái. Công ty đang trên đà cắt giảm hơn 21,000 việc làm trong năm nay.

microsoft đóng cửa cánh tay metaverse VR AltspaceVR vào ngày 10 tháng XNUMX và cũng sa thải toàn bộ nhân viên tại các dự án thực tế mở rộng nổi tiếng HoloLens và Bộ công cụ thực tế hỗn hợp (MRTK).

Việc cắt giảm trùng khớp với sự cường điệu hiện tại xung quanh các chatbot AI, bắt đầu với thành công đột phá của OpenAI ChatGPT. Microsoft đang dẫn đầu một cuộc chi tiêu mạnh tay vào công nghệ AI, với hàng tỷ đô la đổ vào việc mua lại sức mạnh ChatGPT cho công cụ tìm kiếm Bing của mình.

Khi cuộc di cư của những gã khổng lồ công nghệ toàn cầu đặt ra câu hỏi liệu metaverse có đang mất dần sức hút hay không, Meta đã trở nên tích cực hơn trong việc phát triển AI của mình, trong một động thái có thể thúc đẩy tham vọng metaverse của nó một cách nghịch lý.

Việc công ty tham gia vào các công cụ tạo ra như DinoV2 có thể được coi là một động thái hướng tới metaverse, thế giới ảo nơi mọi người có thể tương tác với nhau như họ làm trong thế giới thực. Với DinoV2, Meta hy vọng sẽ tạo ra trải nghiệm tuyệt vời hơn cho người dùng và vượt qua ranh giới của những gì có thể với công nghệ AI.

Cuộc đua AI nóng lên

Trọng tâm AI của Meta là một phần của xu hướng lớn hơn trong ngành công nghệ, khi các công ty chạy đua để kết hợp trí tuệ nhân tạo vào các sản phẩm và dịch vụ của họ. Ví dụ, Adobe gần đây đã tiết lộ một số công cụ AI, bao gồm Adobe Sensei.

Như MetaNews trước đây báo cáo, Sensei sử dụng máy học để tự động hóa các tác vụ và cải thiện trải nghiệm người dùng. Các công cụ AI của Adobe cũng bao gồm Adobe Stock, một công cụ hỗ trợ AI giúp người dùng tìm thấy hình ảnh phù hợp cho dự án của họ.

Ngoài ra còn có Adobe Experience Cloud, sử dụng AI để cá nhân hóa trải nghiệm của khách hàng. Tuy nhiên, Adobe không có sản phẩm nào có thể so sánh trực tiếp với DinoV2 hay SAM.

Tuy nhiên, thực tế là DinoV2 cần một lượng dữ liệu cũng có nghĩa là độ chính xác của dữ liệu có thể là một thách thức lớn đối với mô hình AI vì dữ liệu không chính xác hoặc không nhất quán có thể ảnh hưởng tiêu cực đến hiệu suất và độ chính xác của mô hình.

Dấu thời gian:

Thêm từ MetaNews