UA24 — Новини України

Google презентувала нову модель штучного інтелекту Gemini Robotics-ER 1.6, яка дозволяє роботам краще розуміти навколишнє середовище, планувати дії та визначати завершення завдань у реальних умовах. Про це пише видання Interesting Engineering . Модель Gemini Robotics-ER 1.6 створили, щоб подолати одну з головних проблем робототехніки — здатність мислити не лише за інструкціями. Вона використовує так зване « втілене мислення», що дає змогу роботам аналізувати зображення, планувати кроки і вирішувати, коли завдання виконано. Це означає перехід від простого виконання команд до систем, які можуть самостійно ухвалювати рішення залежно від ситуації. Нова версія покращує просторове мислення і здатність працювати з кількома джерелами зображень одночасно. Роботи можуть об'єднувати дані з різних камер і краще орієнтуватися навіть у складних або змінних умовах. Модель також навчилася розпізнавати прилади. Вона може зчитувати показники манометрів, індикаторів і цифрових дисплеїв, які часто використовують у промисловості. Роботи тепер точніше визначають об'єкти, рахують їх і розуміють зв’язки між ними. Вони можуть « вказувати» на предмети під час аналізу, щоб розбити складні завдання на простіші кроки. Це важливо для роботи в реальному середовищі, де потрібно взаємодіяти з об'єктами, рухатися серед перешкод і приймати рішення за неповної інформації. Ще одне покращення — здатність перевіряти, чи правильно виконано завдання. Це допомагає вирішити, чи потрібно повторити дію, чи переходити далі. Функцію зчитування приладів розробляли разом із Boston Dynamics. У компанії зазначили, що такі можливості дозволять роботам Spot самостійно бачити, розуміти і реагувати на виклики в реальному середовищі. Модель поєднує аналіз зображень і виконання коду. Вона може збільшувати фрагменти, знаходити ключові елементи, як-от стрілки чи позначки, і точно обчислювати значення. Точність зчитування приладів зросла з 23% у попередніх версіях до 93% у новій. Також система краще дотримується правил безпеки, наприклад уникає небезпечних дій з об'єктами. У Google заявили, що це їхня найбезпечніша модель для роботів на цей момент, яка краще виявляє ризики і дотримується фізичних обмежень. Gemini Robotics-ER 1.6 вже доступна розробникам через Gemini API і Google AI Studio разом з інструментами для тестування і створення застосунків. Теги: Google Gemini Роботи Штучний інтелект Якщо ви знайшли помилку в тексті, виділіть її мишкою і натисніть Ctrl + Enter