Користувачі захоплюються Whisper JAX як найшвидшим API перетворення мовлення в текст

Користувачі захоплюються Whisper JAX як найшвидшим API перетворення мовлення в текст

Вихідний вузол: 2607028

Можливо, Марк Цукерберг популяризував термін «метавсесвіт», але засновник і генеральний директор Meta, можливо, більше не представляє метавсесвіт користувачам і рекламодавцям з таким ентузіазмом, як раніше. Або так здається. Останнім часом Meta приділяє більше уваги генеративному ШІ.

Генеративний штучний інтелект – це набір методів машинного навчання, які дозволяють комп’ютерам генерувати текст, малювати зображення та створювати інші засоби масової інформації, які нагадують результат людини. Тепер Meta намагається залучити користувачів і рекламодавців до своїх коротких відео та інструментів штучного інтелекту, схожих на TikTok.

Каліфорнійська технологічна компанія нещодавно оголошений створення нового продуктового підрозділу, орієнтованого на штучний інтелект – Meta AI. Підрозділ очолює нинішній директор із продуктів Кріс Кокс і об’єднує кілька команд у Meta.

Читайте також: Велика техніка залишила Metaverse в погоні за ажіотажем чат-ботів ШІ

Meta представляє DinoV2

За словами Цукерберга, команда Meta розробляє персонажів ШІ, які можуть допомогти користувачам у багатьох відношеннях. Сюди входять випробування чату зі штучним інтелектом у WhatsApp і Messenger, фільтри зображень зі штучним інтелектом і формати реклами в Instagram, а також відео та мультимодальний досвід зі штучним інтелектом.

Минулого року Meta AI представила Make-A-Video, штучно інтелектуальну систему, яка дозволяє користувачам створювати відео з текстової підказки. Нещодавно компанія випустила кілька продуктів штучного інтелекту, зокрема DinoV2 і SAM.

DinoV17, випущений 2 квітня, є генеративною моделлю ШІ, яка може швидко генерувати 3D-ресурси для віртуальних світів. За словами а блог, модель здатна створювати тривимірні (3D) форми з топологією, багатими геометричними деталями та текстурами з таких даних, як зображення та відео.

DinoV2 використовує самоконтрольоване навчання, техніку, яка дозволяє моделі навчатися з величезних обсягів немаркованих даних без будь-якої зовнішньої допомоги з маркування, каже Мета. Інструмент може бути дуже корисним для творців відеоконтенту та в інших програмах.

Meta заявила, що використовувала модель у співпраці з Відновити вперед «нанести на карту ліси, дерево за деревом, на ділянках розміром з континенти». DinoV2 може ідентифікувати та розпізнавати різні об’єкти у відео, наприклад людей, домашніх тварин та інші предмети. Він також здатний визначити зв’язки між цими об’єктами та сценою в цілому.

Цифровий підприємець Абах описаний модель у Twitter як «новаторський крок до досягнення моделей комп’ютерного зору галузевого рівня. Використання самоконтрольованого навчання кардинально змінює ситуацію та обов’язково спричинить хвилю в технологічній індустрії».

Інші висловили зацікавленість у використанні DinoV2 у сільському господарстві, медицині та інших галузях. SAMЗ іншого боку, це нова модель ШІ, яка може ідентифікувати окремі об’єкти на зображенні. Він поставляється з набором даних анотацій зображень, які доступні для використання дослідниками.

Проблеми метавсесвіту Мети

Останніми місяцями зростає кількість великих технологічних компаній, які охолоджуються щодо метавсесвіту, оскільки фокус зміщується на захоплення новими чат-ботами ШІ.

У лютому китайський технологічний гігант Tencent Holdings скоротила персонал підрозділу розширеної реальності (XR) і згорнула плани щодо апаратного забезпечення віртуальної реальності (VR). І Meta, і Microsoft значно скоротили свої плани метавсесвіту.

Підрозділ Meta Reality Labs, частина бізнесу, зосереджена на віртуальній реальності та метавсесвіті, втрачає гроші з моменту свого заснування та повідомила про збитки понад 13.7 мільярда доларів минулого року. Цього року компанія збирається скоротити понад 21,000 XNUMX робочих місць.

Microsoft 10 березня закрила підрозділ AltspaceVR у сфері метавсесвіту VR, а також звільнила весь персонал своїх популярних проектів розширеної реальності HoloLens і Mixed Reality Tool Kit (MRTK).

Скорочення збігаються з поточним ажіотажем навколо чат-ботів штучного інтелекту, який почався з прориву OpenAI ChatGPT. Microsoft лідирує в розробці технологій штучного інтелекту, вклавши мільярди доларів у придбання повноважень ChatGPT для свого пошуку Bing.

Оскільки вихід світових технічних гігантів підняв питання про те, чи метавсесвіт втрачає обертів, Meta стала більш агресивною у розробці штучного інтелекту, що парадоксальним чином може посилити її метавсесвітні амбіції.

Вихід компанії на генеративні інструменти, такі як DinoV2, можна розглядати як рух до метавсесвіту, віртуального світу, де люди можуть взаємодіяти один з одним, як це відбувається в реальному світі. За допомогою DinoV2 Meta сподівається створити більш захоплюючий досвід для користувачів і розширити межі того, що можливо за допомогою технології ШІ.

ШІ гонка нагрівається

Зосередження Meta на штучному інтелекті є частиною більшої тенденції в індустрії технологій, оскільки компанії стрімко впроваджують штучний інтелект у свої продукти та послуги. Adobe, наприклад, нещодавно представила кілька інструментів ШІ, включаючи Adobe сенсей.

Як повідомляв MetaNews раніше повідомляє, Sensei використовує машинне навчання для автоматизації завдань і покращення взаємодії з користувачем. Інструменти Adobe AI також включають Adobe Stock, інструмент на основі AI, який допомагає користувачам знаходити правильні зображення для своїх проектів.

Існує також Adobe Experience Cloud, яка використовує AI для персоналізації взаємодії з клієнтами. Однак Adobe не має продуктів, які можна прямо порівняти з DinoV2 або SAM.

Однак той факт, що DinoV2 потребує великої кількості даних, також означає, що точність даних може бути серйозною проблемою для моделі ШІ, оскільки неправильні або суперечливі дані можуть негативно вплинути на продуктивність і точність моделі.

Часова мітка:

Більше від МетаНовини