UA24 — Новини України

Компанія Microsoft оголосила про запуск трьох нових базових моделей штучного інтелекту, які здатні створювати текст, аудіо та зображення, що дозволить їй посилити свої позиції на ринку.

Компанія Microsoft нещодавно оголосила про запуск трьох нових базових моделей штучного інтелекту, які здатні генерувати текст, аудіо та зображення. Цей крок має на меті підсилити конкуренцію з іншими лабораторіями в сфері штучного інтелекту, незважаючи на існуюче партнерство з OpenAI. Про це повідомляє видання TechCrunch.

Нові моделі отримали назви MAI-Transcribe-1, MAI-Voice-1 та MAI-Image-2. Модель MAI-Transcribe-1 спеціалізується на розпізнаванні мовлення та його перетворенні в текст на 25 різних мовах. За інформацією компанії, ця модель працює у 2,5 рази швидше, ніж попередня версія Azure Fast, що свідчить про значний прогрес у технологіях розпізнавання мовлення.

Друга модель, MAI-Voice-1, має можливість генерувати звук та створювати до 60 секунд аудіо всього за одну секунду. Вона також дозволяє користувачам налаштовувати власний голос, що відкриває нові можливості для персоналізації аудіо-контенту. Третя модель, MAI-Image-2, призначена для створення відео, що є важливим кроком у розвитку візуальних технологій штучного інтелекту.

Варто зазначити, що модель MAI-Image-2 вже була представлена у тестовому середовищі MAI Playground 19 березня. Тепер усі три моделі доступні на платформі Microsoft Foundry, а також були додані нові інструменти для роботи з текстом і голосом в MAI Playground, що робить їх доступними для широкого кола користувачів.

Розробкою нових моделей займалася команда MAI Superintelligence, яка працює під керівництвом генерального директора Microsoft AI Мустафи Сулеймана. Ця команда була створена у листопаді 2025 року з метою активізації досліджень у сфері штучного інтелекту.

У компанії Microsoft підкреслили, що вони роблять акцент на «людиноцентричному» підході до розробки моделей. Це означає, що навчання моделей відбувається з урахуванням реальних способів спілкування, що робить їх більш зручними та практичними у використанні. Крім того, Microsoft планує продовжувати випуск нових моделей та інтегрувати їх у свої продукти, що свідчить про стратегічний підхід до розвитку штучного інтелекту.

Компанія також розраховує конкурувати на ринку, зокрема, за рахунок зниження вартості своїх послуг. Ціни на нові моделі стартують від 0,36 долара за годину для розпізнавання мовлення, від 22 доларів за 1 мільйон символів для генерації голосу, а також від 5 доларів за 1 мільйон токенів тексту та 33 доларів за 1 мільйон токенів зображень.

Попри запуск власних моделей, у Microsoft підтвердили, що продовжують співпрацю з OpenAI. За словами Мустафи Сулеймана, перегляд умов партнерства дозволив компанії активніше розвивати власні дослідження у сфері надінтелекту. Microsoft інвестувала понад 13 мільярдів доларів у розвиток OpenAI та продовжує використовувати її моделі у своїх продуктах в рамках багаторічної угоди.

Таким чином, запуск нових моделей штучного інтелекту від Microsoft не лише підкреслює зростаючу конкуренцію на ринку, але й демонструє прагнення компанії залишатися на передовій технологій, що можуть змінити спосіб, яким ми взаємодіємо з інформацією та технологіями в цілому.

Microsoft запускає нові моделі штучного інтелекту, що конкурують з OpenAI