НВ (Новое Время)
Нова модель. Google представила ШІ, який допомагає роботам орієнтуватися в реальному світі
Google презентувала нову модель штучного інтелекту Gemini Robotics-ER 1.6, яка дозволяє роботам краще розуміти навколишнє середовище, планувати дії та визначати завершення завдань у реальн
Google презентувала нову модель штучного інтелекту Gemini Robotics-ER 1.6, яка дозволяє роботам краще розуміти навколишнє середовище, планувати дії та визначати завершення завдань у реальних умовах.
Про це пише видання Interesting Engineering .
Модель Gemini Robotics-ER 1.6 створили, щоб подолати одну з головних проблем робототехніки — здатність мислити не лише за інструкціями. Вона використовує так зване « втілене мислення», що дає змогу роботам аналізувати зображення, планувати кроки і вирішувати, коли завдання виконано.
Це означає перехід від простого виконання команд до систем, які можуть самостійно ухвалювати рішення залежно від ситуації.
Нова версія покращує просторове мислення і здатність працювати з кількома джерелами зображень одночасно. Роботи можуть об'єднувати дані з різних камер і краще орієнтуватися навіть у складних або змінних умовах.
Модель також навчилася розпізнавати прилади. Вона може зчитувати показники манометрів, індикаторів і цифрових дисплеїв, які часто використовують у промисловості.
Роботи тепер точніше визначають об'єкти, рахують їх і розуміють зв’язки між ними. Вони можуть « вказувати» на предмети під час аналізу, щоб розбити складні завдання на простіші кроки.
Це важливо для роботи в реальному середовищі, де потрібно взаємодіяти з об'єктами, рухатися серед перешкод і приймати рішення за неповної інформації.
Ще одне покращення — здатність перевіряти, чи правильно виконано завдання. Це допомагає вирішити, чи потрібно повторити дію, чи переходити далі.
Функцію зчитування приладів розробляли разом із Boston Dynamics. У компанії зазначили, що такі можливості дозволять роботам Spot самостійно бачити, розуміти і реагувати на виклики в реальному середовищі.
Модель поєднує аналіз зображень і виконання коду. Вона може збільшувати фрагменти, знаходити ключові елементи, як-от стрілки чи позначки, і точно обчислювати значення.
Точність зчитування приладів зросла з 23% у попередніх версіях до 93% у новій. Також система краще дотримується правил безпеки, наприклад уникає небезпечних дій з об'єктами.
У Google заявили, що це їхня найбезпечніша модель для роботів на цей момент, яка краще виявляє ризики і дотримується фізичних обмежень.
Gemini Robotics-ER 1.6 вже доступна розробникам через Gemini API і Google AI Studio разом з інструментами для тестування і створення застосунків.
Теги: Google
Gemini
Роботи
Штучний інтелект
Якщо ви знайшли помилку в тексті, виділіть її мишкою і натисніть Ctrl + Enter