Meta запускає нову модель штучного інтелекту Muse Spark, яка потребує у 10 разів менше ресурсів
Компанія Meta представила Muse Spark — нову модель штучного інтелекту, яка об'єднує текст, зображення та інструменти в єдиній системі, споживаючи при цьому значно менше обчислювальних ресурсів.
Компанія Meta, відома своїми інноваціями у сфері технологій, оголосила про запуск нової моделі штучного інтелекту під назвою Muse Spark. Ця модель, за словами представників компанії, є революційною, оскільки вона об'єднує текст, зображення та інструменти в одній системі, споживаючи при цьому більш ніж у 10 разів менше обчислювальних ресурсів у порівнянні з попередніми моделями.
Видання Interesting Engineering повідомляє, що Muse Spark була представлена як перша розробка підрозділу Meta, відомого як Superintelligence Labs. Ця модель використовує мультимодальне мислення та здатна виконувати завдання завдяки роботі агентів, що працюють паралельно. Це означає, що Muse Spark може одночасно обробляти текстову інформацію, зображення та різні інструменти, що значно підвищує її ефективність.
У компанії Meta підкреслюють, що нова модель допомагає краще вирішувати складні завдання, хоча визнають, що система ще має свої недоліки. Muse Spark відображає загальну тенденцію розвитку штучного інтелекту, яка полягає в тому, що сучасні моделі не лише генерують текст, але й аналізують візуальні та реальні дані.
Однією з ключових функцій Muse Spark є її здатність аналізувати зображення, розв'язувати задачі в STEM-дисциплінах та розпізнавати об'єкти з урахуванням контексту. Модель також підтримує покрокове пояснення на основі зображень, що в Meta називають «візуальним ланцюгом мислення». Це дозволяє користувачам отримувати практичні інструкції, наприклад, для ремонту техніки, з візуальними підказками.
Крім того, Muse Spark здатна створювати інтерактивний контент, включаючи прості ігри на запит користувачів. Однак, незважаючи на ці можливості, у галузі штучного інтелекту такі функції ще працюють нерівномірно. Попри прогрес, стабільність роботи в реальних умовах поки що залишається нижчою, ніж результати тестів.
Однією з ключових інновацій Muse Spark є функція «режим роздумів», яка активує кілька агентів мислення одночасно для більш ефективного вирішення складних завдань. Meta повідомляє, що Muse Spark продемонструвала 58% у тесті Humanity’s Last Exam і 38% у завданнях FrontierScience Research. Ці показники оцінюють здатність моделі до складного мислення, але їх важко порівнювати між різними системами через різні методи оцінювання.
У компанії також зазначають, що модель стала більш надійною, зберігаючи при цьому різноманітність відповідей. Вони стверджують, що Muse Spark краще справляється із завданнями, які не були включені в навчальні дані, хоча незалежних підтверджень цих тверджень поки що недостатньо.
Розробка Muse Spark супроводжувалася значними змінами в інфраструктурі компанії. За словами Meta, протягом останніх дев'яти місяців компанія перебудувала процес навчання моделей, зосередившись на архітектурі, оптимізації та якості даних. Це, як стверджують у компанії, дозволило досягти подібних результатів із більш ніж у 10 разів меншими обчислювальними витратами в порівнянні з попередньою моделлю Llama 4 Maverick.
Meta також підкреслює, що навчання з підкріпленням залишається ключовим елементом їхнього підходу. Зі збільшенням масштабів навчання компанія спостерігає стабільне покращення як у тренуванні, так і в тестуванні моделей. Muse Spark розглядається як крок до створення так званого «персонального суперінтелекту» — систем, які здатні розуміти середовище користувача та надавати індивідуальну допомогу.
Одним з перших напрямів застосування Muse Spark називають медицину. Для цього навчальні дані були створені у співпраці з лікарями, щоб покращити пояснення медичних тем. Наразі Muse Spark доступна на платформах Meta, а також має обмежений доступ через API для розробників.
Запуск нової моделі свідчить про зміни в конкуренції у сфері штучного інтелекту. Компанії зосереджуються не лише на створенні розумніших моделей, але й на розробці систем, здатних працювати в реальному світі, хоча питання надійності та перевірки залишаються відкритими.