Alibaba führt KI-Modelle ein, die Bilder verstehen und komplexere Gespräche führen

Neuauflage von Plato

Verfolger: 0

Der Bereich der künstlichen Intelligenz (KI) heizt sich auf. Gerade gestern, Das südkoreanische Unternehmen Naver kündigte die Einführung von HyperClova X an, ein neuer generativer KI-Dienst, der mit ChatGPT konkurrieren soll. Jetzt stellt Chinas Internetriese zwei Open-Source-KI-Modelle vor, die Bilder verstehen und komplexere Gespräche führen können.

Am Freitag stellte Alibaba neue KI-Modelle vor, die im Vergleich zu ihren früheren Angeboten Bilder verstehen und komplexere Gespräche führen sollen. Diese Veröffentlichung erfolgt in einer Zeit intensiven globalen Wettbewerbs um die Technologieführerschaft.

Das chinesische Technologieunternehmen gab bekannt, dass seine beiden neuartigen Modelle Qwen-VL und Qwen-VL-Chat als Open-Source-Tools zur Verfügung gestellt werden, was bedeutet, dass Forscher, Pädagogen und Unternehmen auf der ganzen Welt diese Modelle zur Entwicklung ihrer eigenen Modelle nutzen können eigene KI-Anwendungen ohne die Notwendigkeit, ihre individuellen Systeme zu trainieren. Dieser Ansatz spart nicht nur Zeit, sondern senkt auch die Kosten erheblich.

Die Nachricht kommt nur einen Monat, nachdem Alibaba Tongyi Wanxiang auf den Markt gebracht hat, ein KI-Bildgenerierungstool, das mit DALL-E und Midjourney von OpenAI konkurriert. Mit Tongyi Wanxiang, das von der Cloud-Abteilung von Alibaba ins Leben gerufen wurde, können Benutzer Textaufforderungen entweder auf Chinesisch oder Englisch eingeben, und das KI-Tool generiert entsprechende Bilder in verschiedenen Stilen, etwa Skizzen oder 3D-Cartoons. Derzeit steht das Tool zum Betatest ausschließlich Unternehmenskunden in China zur Verfügung.

Die beiden neuen KI-Sprachmodelle wurden ebenfalls von der Cloud-Einheit des Unternehmens, Alibaba Cloud, entwickelt. Entsprechend Berichte, sagte der Technologieriese, dass Qwen-VL als Weiterentwicklung seines 7-Milliarden-Parameter-Modells Tongyi Qianwen konzipiert sei. Dieses dynamische Modell zeigt eine bemerkenswerte Fähigkeit, sowohl Bilder als auch Textaufforderungen mühelos zu verarbeiten. Seine Vielseitigkeit reicht von der effektiven Beantwortung weitreichender Fragen zu verschiedenen Bildern bis hin zur Erstellung fesselnder Bildunterschriften für diese Bilder.

Alibaba fügte außerdem hinzu, dass Qwen-VL mehrere Aufgaben gleichzeitig ausführen kann. Es kann nicht nur offene Fragen zu verschiedenen Bildern beantworten, sondern auch Bildunterschriften für diese Bilder erstellen.

Aber der eigentliche Star der Show ist Qwen-VL-Chat. Diese KI übernimmt komplexere Interaktionen, wie den Vergleich mehrerer Bilder und die Abwicklung von Befragungsrunden. Das ist aber noch nicht alles: Alibaba rühmt sich damit, Geschichten zu erzählen, Bilder auf der Grundlage von von Benutzern eingereichten Fotos heraufzubeschwören und sogar in Bildern dargestellte mathematische Probleme zu lösen.

Als cooles Beispiel nannten sie ein Krankenhausschild auf Chinesisch. Qwen-VL-Chat kann es entschlüsseln und Aufschluss darüber geben, wo sich verschiedene Krankenhausabteilungen befinden.

Mittlerweile dreht sich ein Großteil der „Genialität“ der aktuellen KI typischerweise um Text. Aber die Zeiten ändern sich. Qwen-VL-Chat und die neueste Version von OpenAIs ChatGPT sorgen für Abwechslung und reagieren auf Bilder mit Text auf ziemlich beeindruckende Weise. Es ist, als würde die KI lernen, eine neue visuelle Sprache zu sprechen!

SEO-gestützte Content- und PR-Distribution. Holen Sie sich noch heute Verstärkung.
PlatoData.Network Vertikale generative KI. Motiviere dich selbst. Hier zugreifen.
PlatoAiStream. Web3-Intelligenz. Wissen verstärkt. Hier zugreifen.
PlatoESG. Automobil / Elektrofahrzeuge, Kohlenstoff, CleanTech, Energie, Umwelt, Solar, Abfallwirtschaft. Hier zugreifen.
PlatoHealth. Informationen zu Biotechnologie und klinischen Studien. Hier zugreifen.
ChartPrime. Verbessern Sie Ihr Handelsspiel mit ChartPrime. Hier zugreifen.
BlockOffsets. Modernisierung des Eigentums an Umweltkompensationen. Hier zugreifen.
Quelle: https://techstartups.com/2023/08/25/alibaba-launches-qwen-vl-and-qwen-vl-chat-ai-models-that-understand-images-and-have-more-complex-conversations/

Zeitstempel: 25. August 2023

Zeitstempel: 15. Juni 2023

Neuauflage von Plato

Binance, die größte Krypto-Börse der Welt, stellt 2,000 neue Mitarbeiter ein, obwohl Coinbase 18 % seiner Belegschaft entlassen hat

Das Klima-Startup Make Sunsets setzt giftige Chemikalien in die Atmosphäre frei, um die Sonne zu blockieren, was Wissenschaftler alarmiert

Generative KI trifft auf Online-Shopping: Amazon stellt KI-Tool zur Beantwortung von Käuferfragen vor – TechStartups

Google stellt PaLM 2 vor, seine leistungsstärkste Allzweck-KI, um den KI-Chatbot von Microsoft herauszufordern

Die Kava-Kette lebt jetzt auf Fireblocks und öffnet Cosmos DeFi für institutionelle Anleger

LoanDepot gehackt: Zweitgrößter Nichtbank-Hypothekenkreditgeber der USA von Cyberangriff betroffen – TechStartups

Character.AI ist das angesagteste generative KI-Startup, über das alle reden; verzeichnete in der ersten Woche 1.7 Millionen Downloads

Über uns

Vertikale Suche & Ai

Plattform

Bleiben Sie in Verbindung

Konto