http://www.w3.org/1999/xlink http://www.w3.org/1999/xlink http://www.w3.org/1999/xlink

Статус проекта: проект не получил поддержку

Разработка кроссплатформенной системы синтеза речи с открытым исходным кодом для пользователей с инвалидностью по зрению

  • Конкурс Первый конкурс 2023
  • Грантовое направление Социальное обслуживание, социальная поддержка и защита граждан
  • Номер заявки 23-1-016237
  • Дата подачи 27.10.2022
  • Запрашиваемая сумма 4 773 500,00
  • Cофинансирование 200 000,00
  • Общая сумма расходов на реализацию проекта  4 973 500,00
  • Сроки реализации 01.02.2023 - 31.07.2024
  • Организация АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ "ЦЕНТР РАЗВИТИЯ ДОСТУПНОСТИ "ИНКЛЮЗИВНЫЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ"
  • ИНН 7735191690
  • ОГРН 1217700294217

Краткое описание

Проект направлен на повышение цифровой инклюзии и обеспечения всеобщего доступа инвалидов по зрению к технологиям, компенсирующим нарушения зрения при работе с современными компьютерами и мобильными устройствами.

В рамках проекта будет разработана система синтеза речи, представляющая собой программное обеспечение для вывода любой текстовой информации в форме синтезированной речи. Система позволит людям с ограничениями зрения эффективно работать с современными компьютерными технологиями на двух языках: русском, как на государственном языке Российской Федерации, и английском, как на языке международного общения и языке обозначения множества универсальных терминов и названий.

В ходе реализации проекта, данное программное обеспечение будет подготовлено в четырёх версиях для поддержки различных операционных систем и программ невизуального экранного доступа, использующихся инвалидами по зрению для работы с компьютерами и мобильными устройствами.

Будут разработаны следующие варианты системы синтеза речи:

- версия для работы через интерфейс SAPI5 на операционных системах Windows;

- версия для работы через интерфейс программы NVDA на операционных системах Windows;

- версия для работы через интерфейс android.speech.tts на операционных системах Android;

- версия для работы через интерфейс Speech Dispatcher на операционных системах семейства Linux.

Исходный код разработанной системы будет открыт на условиях общепринятой разрешительной лицензии свободного ПО, что обеспечит высокий потенциал дальнейшего развития и более широкого внедрения данного технического решения. На сегодняшний день аналогов такой системы под разрешительной (невирусной копилефт) лицензией свободного ПО не существует.

Вся система разрабатывается по модульной архитектуре с максимальной изоляцией отдельных функциональных компонентов. Это обеспечивает более лёгкую расширяемость и портируемость на различные операционные системы.

Во-первых, изоляция модулей поддержки языка позволяет ускорить процесс разработки поддержки новых языков и упростить их подготовку и обновление для пользователей на разных операционных системах. В перспективе это позволит максимально быстро получить поддержку существенного числа новых языков, до сих пор не имеющих решений по синтезу речи, в частности, нескольких десятков активно используемых языков народов России.

Во-вторых, изоляция компонентов синтезирования речевого сигнала обеспечивает возможность достаточно быстрой интеграции новых технологий синтеза речи без необходимости полной переработки. Эти технологии в будущем могут быть встроены в разрабатываемую систему без необходимости повторять разработку поддержки конкретных языков.

Таким образом, реализуемый проект сможет сразу обеспечить готовое решение по синтезу речи на русском и английском языке, адаптированное для использование инвалидами по зрению, а также создать современную программную платформу для дальнейшего развития технологий синтеза речи по модели свободного ПО.

Цель

  1. Разработать программное обеспечение для вывода текстовой информации в форме синтезированной речи, расширяющее возможности эффективного обучения и реабилитации слепых и слабовидящих граждан России и обеспечивающее высокий потенциал дальнейшего развития и более широкого внедрения данного технического решения.

Задачи

  1. Разработать программное обеспечение синтеза речи
  2. Распространить информацию о выпуске программного обеспечения синтеза речи

Обоснование социальной значимости

Заболеваемость патологией органов зрения в РФ составляет около 11 тыс. на 100 тыс. населения. Уровень слепоты и слабовидения в России достигает 19 человек на 10 тыс. населения. Ежегодно же в России число лиц, впервые ставших инвалидами из-за нарушения зрения, составляет около 45 тыс.[1]

Люди с существенными нарушениями зрения постоянно сталкиваются с затруднением или невозможностью прочитать текстовую информацию напрямую. Проект призван решить данную проблему посредством разработки программного обеспечения, которое реализует функциональность синтеза речи по тексту, то есть будет выполнять преобразование электронного текста в звуковой сигнал, имитирующий человеческую речь, с учётом специфических требований пользователей с нарушениями зрения.

Системы синтеза речи крайне востребованы среди лиц с инвалидностью по зрению, что подтверждается практикой реабилитации данной категории граждан и наличием национальных стандартов, описывающих подобные технические решения, в частности, ГОСТ Р 52873-2021[2].

Согласно результатам исследования, проведённого компанией Яндекс[3], люди с нарушениями зрения, проживающие на территории России, активно используют как компьютеры, так и мобильные устройства. При этом, наиболее распространёнными настольной и мобильной операционными системами являются Windows и Android. Также ввиду изменившихся условий конъюнктуры в 2022 году резко возросла актуальность альтернативных операционных систем семейства Linux.

Это обуславливает актуальность задачи разработки системы синтеза речи для инвалидов по зрению с учётом её кроссплатформенности, то есть способности работать на разных операционных системах.

Поскольку системы вывода текстовой информации в форме синтезированной речи являются одним из ключевых компонентов набора вспомогательных компьютерных технологий, использующихся слепыми и слабовидящими людьми, то они должны быть доступны как для конечных потребителей в лице самих инвалидов по зрению, так и для разработчиков других программных продуктов, в которые требуется встраивать функцию синтеза речи.

Это обуславливает актуальность задачи разработки системы синтеза речи для инвалидов по зрению как программного обеспечения с открытым исходным кодом, чтобы данные наработки могли использоваться всей IT-индустрией.

В рамках реализации проекта планируется разработать кроссплатформенную систему синтеза речи с открытым исходным кодом, учитывающую специфику пользователей с инвалидностью по зрению.

Готовые реализации такой системы будут поддерживать операционные системы, системные интерфейсы и программное обеспечение, являющиеся наиболее востребованными среди инвалидов по зрению, проживающих на территории России, а также те операционные системы, чья актуальность возрастает в следствии процессов импортозамещения.

К моменту завершения проекта исходный код разработанной системы будет открыт на условиях общепринятой разрешительной лицензии свободного ПО. То есть разработанная система синтеза речи сможет быть использована не только конечными пользователями, но и другими разработчиками, которым требуется технология синтеза речи, в том числе для продуктов, чей исходный код не может быть раскрыт.

Уже существующие синтезаторы речи в полной мере не решают всех поставленных проблем по одной или нескольким причинам:

1) Альтернативные решения разрабатываются и распространяются на коммерческой основе, поэтому доступ к ним целевой аудитории затруднён. Особенно в отношении зарубежных продуктов.

2) Альтернативные решения либо имеют закрытый исходный код, либо их код открыт на условиях вирусных копилефт лицензий, не позволяющих встраивать синтезатор речи в компьютерные системы, чей код не может быть раскрыт.

3) Альтернативные решения с открытым исходным кодом не предоставляют достаточную степень универсальности чтобы обеспечить быстрое и эффективное развитие системы синтеза речи в отношении расширения числа поддерживаемых языков, в частности, добавления поддержки языков народов России.

Таким образом, на сегодняшний день ни одно из существующих альтернативных решений в полной мере не способно обеспечить решение всех проблем целевой группы, чем и обусловлена необходимость реализации проекта по Разработке новой кроссплатформенной системы синтеза речи с открытым исходным кодом для пользователей с инвалидностью по зрению.

Сноски:

1. Оценка главного офтальмолога РФ, директора МНИИ глазных болезней им. Гельмгольца Владимира Нероева. - URL: https://zreni.ru/articles/oftalmologiya/692-8-oktyabrya-vsemirnyy-den-zreniya.html

2. ГОСТ Р 52873-2021 "Комплексы электронно-цифровые интерактивные, рассчитанные на использование людьми с инвалидностью и другими ограничениями жизнедеятельности. Системы вывода текстовой информации в форме синтезированной речи. Технические требования". - URL: https://docs.cntd.ru/document/1200180661

3. Технические предпочтения пользователей с нарушениями зрения в 2020 году. Исследование Яндекса. - URL: https://habr.com/ru/company/yandex/blog/515460/

География проекта

Территория Российской Федерации

Целевые группы

  1. Люди с инвалидностью по зрению, проживающие в РФ и нуждающиеся в программном обеспечении, которое преобразовывает текстовую информацию в воспринимаемую на слух речь.

Контактная информация

г Москва, г Зеленоград, р-н Крюково, к 1509, кв 111