UA24 — Новини України

Microsoft hat kürzlich die Einführung von drei neuen KI-Modellen angekündigt, die Texte, Audio und Bilder generieren können. Diese Initiative zielt darauf ab, die Konkurrenz im Bereich der künstlichen Intelligenz zu stärken, trotz der bestehenden Partnerschaft mit OpenAI.

Die Technologiebranche steht vor einem neuen Wendepunkt, da Microsoft kürzlich die Einführung von drei bahnbrechenden KI-Modellen angekündigt hat. Diese Modelle, die in der Lage sind, Texte, Audios und Bilder zu generieren, sollen die Wettbewerbsfähigkeit des Unternehmens im Bereich der künstlichen Intelligenz erhöhen. Laut einem Bericht von TechCrunch ist dies ein strategischer Schritt, der die Ambitionen von Microsoft im KI-Sektor unterstreicht, insbesondere im Kontext der bestehenden Partnerschaft mit OpenAI.

Die neuen Modelle tragen die Namen MAI-Transcribe-1, MAI-Voice-1 und MAI-Image-2. Die MAI-Transcribe-1 ist speziell auf die Spracherkennung und die Umwandlung gesprochener Sprache in Text in 25 verschiedenen Sprachen ausgelegt. Laut Microsoft arbeitet dieses Modell 2,5-mal schneller als die vorherige Version Azure Fast, was einen signifikanten Fortschritt in der Spracherkennungstechnologie verdeutlicht.

Die zweite Neuheit, MAI-Voice-1, bietet die Möglichkeit, Klang zu erzeugen und innerhalb von nur einer Sekunde bis zu 60 Sekunden Audio zu erstellen. Diese Funktion ermöglicht es Nutzern, ihre eigene Stimme anzupassen, was neue Möglichkeiten für die Personalisierung von Audioinhalten eröffnet. Die dritte Neuheit, MAI-Image-2, ist darauf ausgelegt, Videos zu erstellen, was einen wichtigen Schritt in der Entwicklung visueller KI-Technologien darstellt.

Es ist erwähnenswert, dass das Modell MAI-Image-2 bereits am 19. März in der Testumgebung MAI Playground vorgestellt wurde. Nun sind alle drei Modelle auf der Plattform Microsoft Foundry verfügbar, und es wurden neue Tools für die Arbeit mit Text und Sprache im MAI Playground hinzugefügt, die sie einem breiten Nutzerkreis zugänglich machen.

Die Entwicklung dieser neuen Modelle wurde von dem Team MAI Superintelligence geleitet, das unter der Leitung von Mustapha Suleiman, dem CEO von Microsoft AI, arbeitet. Dieses Team wurde im November 2025 gegründet, um die Forschung im Bereich der künstlichen Intelligenz zu intensivieren und voranzutreiben.

Microsoft betont, dass sie einen „menschenzentrierten“ Ansatz bei der Entwicklung ihrer Modelle verfolgen. Dies bedeutet, dass das Training der Modelle unter Berücksichtigung der realen Kommunikationsweisen erfolgt, was sie benutzerfreundlicher und praktischer macht. Darüber hinaus plant Microsoft, weiterhin neue Modelle zu veröffentlichen und diese in ihre Produkte zu integrieren, was auf einen strategischen Ansatz zur Weiterentwicklung der künstlichen Intelligenz hinweist.

Das Unternehmen erwartet zudem, auf dem Markt wettbewerbsfähig zu bleiben, insbesondere durch die Senkung der Kosten für seine Dienstleistungen. Die Preise für die neuen Modelle beginnen bei 0,36 US-Dollar pro Stunde für die Spracherkennung, 22 US-Dollar für 1 Million Zeichen bei der Sprachgenerierung sowie 5 US-Dollar für 1 Million Texttokens und 33 US-Dollar für 1 Million Bildtokens.

Trotz der Einführung eigener Modelle hat Microsoft bestätigt, dass die Zusammenarbeit mit OpenAI fortgesetzt wird. Laut Mustapha Suleiman hat die Überprüfung der Partnerschaftsbedingungen dem Unternehmen ermöglicht, seine eigenen Forschungen im Bereich der überlegenen Intelligenz aktiver voranzutreiben. Microsoft hat über 13 Milliarden US-Dollar in die Entwicklung von OpenAI investiert und nutzt weiterhin deren Modelle in seinen Produkten im Rahmen einer langfristigen Vereinbarung.

Insgesamt unterstreicht die Einführung der neuen KI-Modelle von Microsoft nicht nur die wachsende Konkurrenz auf dem Markt, sondern zeigt auch das Bestreben des Unternehmens, an der Spitze der Technologien zu bleiben, die unsere Interaktion mit Informationen und Technologien grundlegend verändern können.

Microsoft startet neue KI-Modelle im Wettbewerb mit OpenAI