Американські інженери розробили «розумне» намисто SpeeChin, яке розпізнає беззвучні команди англійською та китайською мовами. Для цього пристрій знімає на вбудовану інфрачервону камеру підборіддя й обличчя користувача, обробляє зображення і визначає команду. Опис розробки опублікований у Proceedings of Association of Computing Machinery on Interactive, Mobile, Wearable and Ubiquitous Technologies.

Відзначимо, що сьогодні майже на всіх сучасних смартфонах є віртуальні помічники, які здатні розпізнавати й виконувати голосові команди користувача. Хоча останнім часом вони навчилися робити це досить точно, промовляти команди зручно не у всіх ситуаціях. Наприклад, говорити з помічником у громадських чи просто людних місцях може бути психологічно дискомфортно або неефективно — штучний інтелект просто не почує користувача через шум навколо. Крім того, люди, котрі мають голосові вади, наразі або зовсім не можуть звертатись до голосових помічників, або натрапляють на труднощі при їх використанні. Для таких випадків інженери розробляють альтернативні методи дистанційного управління гаджетами, такі як SpeeChin.

Пристрій-намисто, що був створений винахідниками з Корнелльського університету, розпізнає 54 беззвучні команди англійською та 44 – китайською мовами. Надягнутий на шию й розміщений на грудній клітці, за допомогою інфрачервоної камери він знімає знизу підборіддя та обличчя користувача. Отримуване зображення у реальному часі проходить обробку й нейромережі розпізнають на ньому мовлення. Цікаво, що дизайн SpeeChin розроблений таким чином, щоб камера була постійно спрямована на підборіддя власника: зокрема, для підвищення стійкості розробники спроєктували крила з кожного боку камери, а знизу помістили монету.

Щоб перевірити ефективність роботи SpeeChin, інженери провели декілька досліджень за участю 20 користувачів. Десять із них давали беззвучні команди англійською, у той час, як інші — китайською. Серед команд були, наприклад, “відповісти”, “зателефонувати”, “камера”, “ОК, Google” або “WeChat”. У цей час вбудована у пристрій камера фіксувала рух обличчя людини з-під підборіддя й передавала зображення за допомогою під’єднаного до неї кабелю на комп’ютер, де воно аналізувалося нейромережею (у майбутньому винахідники хочуть реалізувати передачу даних по Bluetooth на смартфон із запущеним спеціальним додатком).
Результати показали, що рішення розпізнає команди англійською із середньою точністю у 90,5%, а китайською — у 91,6%. Щоправда, коли користувачі почали ходити, точність визначення команд значно зменшилася – до 72% для англійських та до 65% для китайських – і стала різко змінюватися залежно від учасника. При цьому SpeeChin має й інші обмеження. Наприклад, у яскравому сонячному світлі на вулиці камері може бути складно відокремлювати людську шкіру від фону. Крім того, її роботі можуть завадити довге волосся або одяг. Втім, розробники все одно впевнені у перспективах свого рішення.