Статья:

Информационные технологии для людей с ограниченными возможностями

Журнал: Научный журнал «Студенческий форум» выпуск №31(124)

Рубрика: Технические науки

Выходные данные
Серкова Е.В. Информационные технологии для людей с ограниченными возможностями // Студенческий форум: электрон. научн. журн. 2020. № 31(124). URL: https://nauchforum.ru/journal/stud/124/77609 (дата обращения: 29.12.2024).
Журнал опубликован
Мне нравится
на печатьскачать .pdfподелиться

Информационные технологии для людей с ограниченными возможностями

Серкова Елена Владимировна
студент, Российский экономический университет имени Г. В. Плеханова, РФ, г. Москва

 

В 2011 году Всемирная организация здравоохранения опубликовала доклад, по данным которого 15% населения мира (или около миллиарда человек) живут с инвалидностью. Из них 200 тысяч человек испытывают серьезные трудности в повседневной жизни. Фактор, приведший к инвалидности, может быть скорректирован путем дорогостоящих операций. Но для большинства людей это недоступно. Более дешевым и не требующим какого-либо вмешательства в организм человека способом облегчения жизни инвалида является использование различных приложений или технических устройств.

В последние десятилетия городская среда стала более адаптированной под людей с нарушениями слуха. Некоторые проблемы повседневной жизни глухие люди могут решить с помощью своего смартфона. Например, вести разговор с собеседником по телефону. Это реализуется с помощью приложений, распознающих речь человек и создающих их в текстовой форме. Приложение RogerVoice автоматически генерирует субтитры к телефонному разговору в режиме реального времени. Главное условия для его функционирования – наличие подключения к сети. Речь собеседника отображается на дисплее в виде текстовых сообщений. Пользователь может выбрать язык распознавания, настроить размер генерируемого текста. Приложение использует технологии Text-Call и Text-to-Speech для создания субтитров и обратного ответа.

Text-to-Speech (TTS) – это система преобразования текста в звучащую речь. Синтезатор может иметь ограниченную или неограниченную словарную базу.  В первом случае речь составляется из заранее записанных слов, фраз и предложений. Диктор записывает большое количество предложений.

Затем полученные записи переводятся в цифровой формат, преобразуются с использованием различных методов сжатия и кодирования. Эти файлы получают имена, группируются по категориям, систематизируются для составления речевой базы.  Во втором случае в качестве элементов речи используют фонемы и слоги, которые по фонетическим правилам формируют слова.

Несмотря на то, что использование смартфона связано в первую очередь с восприятием зрительной информации, это устройство может упростить жизнь незрячих людей. Несколько лет назад был запущен проект Be My Eyes («Будь моими глазами»), установивший связь между людьми с нарушениями зрения и теми, кто желает им помочь. Таким образом страдающий слепотой человек может получить информацию о сроке годности продукта, названии улицы, состоянии дорожного движения.

Жизнь людей с такими заболеваниями, как диабет или артериальная гипертензия, связана с круглосуточным контролем своего состояния. Приложение MySugr Companion позволяет человеку, страдающему диабетом, вести подробный журнал своего состояния: осуществлять учет съеденной пищи, лекарств, уровня сахара крови [2]. Приложение получилось креативным: в ежедневный мониторинг вносится элемент игры: за ведение журнала пользователь получает очки, помогающие справиться с «сахарным монстром».

Разнообразные приложения существуют и для контроля артериального давления. Одно из наиболее удобных для использования – это My Heart. Простота пользовательского интерфейса обуславливает его использование даже людьми в возрасте.  Приложение напоминает пользователю о необходимости измерить давление, позволяет охарактеризовать его кратко или развернуто, внести данные о пульсе, весе. My Heart строит интерактивные графики, наглядно отражающие изменение давления. Также оно поддерживает экспорт данных в виде отчета в pdf-формате и отправку его лечащему врачу.

В более тяжелых случаях инвалидности, когда человек оказывается парализован (например, при боковом амиотрофическом склерозе, после инсульта), необходима разработка не только приложений, но и специализированных устройств, облегчающих жизнь малоподвижного человека. Примером могут послужить устройства с технологией Text-to-Speech.

При создании синтезатора речи необходимо решить следующие задачи: ограничение подвижности при вводе текста, целесообразность использования технологии предикативного ввода текста;

Важный вклад в развитие ассистивных устройств и технологий внесла компания Tobii Dynavox. Совместно с докторами из Бостонской детской больницы Tobii Dynavox разработала проект «Банк сообщений» (англ. — ‘Message banking'). Этот сервис позволяет людям записывать разнообразные фразы, как общие, так и отражающие индивидуальность каждого человека. Использовать Банк сообщений достаточно просто. Пользователю необходимо загрузить на сайт компании записанные в аудиофайлы фразы, принять или откорректировать предложенную суперкомпьютером IBM Watson транскрипцию и присвоить каждому файлу определенную категорию [1].

Другой проект, активно развиваемый компанией - «Голосовой банк» (англ. — ‘Voice banking'). В этом случае пациенту нужно записать несколько тысяч предложений (5-7 часов аудиозаписи). По этим данным воссоздается компьютерные голос, максимально похожий на голос человека. Если качество речи значительно ухудшилось, достаточно нескольких секунд бессвязных звуков, чтобы подобрать из базы голосов наиболее близкий к оригиналу [1].

Для увеличения скорости ввода информации разработчики Tobii Dynavox используют в своих синтезаторах речи систему предикативного ввода текста SwiftKey. Она базируется на методах обработки естественного языка и машинном обучении. SwiftKey учитывает контекст (как слова объединятся в речи). Также система предполагает возможность редактировать словарь наиболее используемых слов и фраз путем добавления их непосредственно в базу.  Дополнительный сервис SwiftKey Cloud позволяет провести более полный анализ речи пользователя, подключившись к аккаунтам Google, Facebook [3].  

Метод ввода данных выбирается в зависимости от степени парализации больного. Технология отслеживания взгляда использует бесконтактные оптические методы и функционирует следующим образом: айтрекер производит инфракрасную подсветку глазного яблока, свет отражается и фиксируется камерами, затем путем алгоритмических вычислений определяется направление взгляда. «Щелчок» виртуальной мышкой осуществляется одним из следующих способов: моргание, задерживание взгляда в одной точке, механический переключатель, если позволяют физические возможности.

При сохранении некоторой подвижности мышц, возможно использовать механический переключатель (мышь или джойстик) или инфракрасные сенсоры, фиксирующие сокращение какой-либо мышцы. Особое внимание разработчики уделяют интерфейсу устройства. Экранная клавиатуры выстроена так, чтобы путь до наиболее часто встречающихся символов (e,t,a) был коротким.

Итак, из-за сложности или дороговизны, люди с ограниченными возможностями не всегда могут быть исцелены силами медицины. Но развитие информационных технологий позволяет существенно упростить их жизнь, адаптировать к окружающему миру. Создание приложений для людей с ограниченными возможностями особенно популярно среди молодых разработчиков. Эта тенденция свидетельствует о том, что задача позволить людям с ограниченными возможностями чувствовать себя более здоровыми и полноценными важна для разработчиков современных технологий.

 

Список литературы:
1. Рыбин С. В. СИНТЕЗ РЕЧИ Учебное пособие по дисциплине "Синтез речи". – СПб: Университет ИТМО, 2014. – 92 с
2. MySugr— [Электронный Ресурс] — URL: https://mysugr.com/ (дата обращения: 20.08.20).
3. Tobii Dynavox — [Электронный Ресурс] — URL: https://www.tobiidynavox.com/  (дата обращения: 13.08.20).