http://www.w3.org/1999/xlink http://www.w3.org/1999/xlink http://www.w3.org/1999/xlink

Статус проекта: снята с экспертизы

Разработка многоязычной системы синтеза речи с открытым исходным кодом для пользователей с инвалидностью по зрению

  • Конкурс Первый конкурс 2024
  • Грантовое направление Поддержка проектов в области науки, образования, просвещения
  • Номер заявки 24-1-015511
  • Дата подачи 16.10.2023
  • Запрашиваемая сумма 2 320 000,00
  • Cофинансирование 2 533 720,00
  • Общая сумма расходов на реализацию проекта  4 853 720,00
  • Сроки реализации 01.02.2024 - 31.07.2025
  • Организация АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ "ЦЕНТР РАЗВИТИЯ ДОСТУПНОСТИ "ИНКЛЮЗИВНЫЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ"
  • ИНН 7735191690
  • ОГРН 1217700294217

Краткое описание

Проект направлен на повышение цифровой инклюзии и обеспечения всеобщего доступа инвалидов по зрению к технологиям, компенсирующим нарушения зрения при работе с современными компьютерами и мобильными устройствами.
В рамках проекта будет разработана многоязычная система синтеза речи, представляющая собой программное обеспечение для вывода любой текстовой информации в форме синтезированной речи. Система позволит людям с ограничениями зрения эффективно работать с современными компьютерными технологиями на двух языках: русском, как на государственном языке РФ, и английском, как на языке международного общения и языке обозначения множества универсальных терминов и названий. Также будет заложена технологическая основа для расширения списка поддерживаемых языков с целью охвата остальных языков народов России в рамках дальнейшего развития проекта после реализации запрашиваемого гранта.
В ходе реализации проекта, программное обеспечение будет подготовлено в трёх версиях для поддержки различных операционных систем и программ невизуального экранного доступа, использующихся инвалидами по зрению для работы с компьютерной техникой:
- версия для работы через интерфейс SAPI5 на операционных системах Windows;
- версия для работы через интерфейс Speech Dispatcher на операционных системах семейства GNU/Linux, в том числе из Единого реестра российского ПО для ЭВМ и БД;
- версия в виде общедоступных исходных кодов.
Исходный код разработанной системы будет открыт на условиях общепринятой разрешительной лицензии свободного ПО, что обеспечит высокий потенциал дальнейшего развития и более широкого внедрения данного технического решения. На сегодняшний день аналогов такой системы под разрешительной (невирусной копилефт) лицензией свободного ПО не существует.
Вся система разрабатывается по модульной архитектуре с максимальной изоляцией отдельных функциональных компонентов. Это обеспечивает более лёгкую расширяемость и переносимость на различные операционные системы.
Создание такой системы ускорит процесс разработки поддержки новых языков на разных операционных системах. В перспективе это позволит максимально быстро получить поддержку существенного числа новых языков, до сих пор не имеющих решений по синтезу речи, в частности, нескольких десятков активно используемых языков народов России.
Таким образом, реализуемый проект сможет сразу обеспечить готовое решение по синтезу речи на русском и английском языке, адаптированное для использование инвалидами по зрению, а также создать современную программную платформу для дальнейшего развития технологий синтеза речи по модели

Цель

  1. Разработать программное обеспечение для вывода текстовой информации в форме синтезированной речи, расширяющее возможности эффективного обучения и реабилитации слепых и слабовидящих граждан России и обеспечивающее высокий потенциал дальнейшего развития и более широкого внедрения данного технического решения.

Задачи

  1. Разработать программное обеспечение синтеза речи
  2. Распространить информацию о выпуске программного обеспечения синтеза речи
  3. Обеспечить консультативное сопровождение процесса апробирования и внедрения программного обеспечения синтеза речи в организациях-партнёрах

Обоснование социальной значимости

Заболеваемость патологией органов зрения в РФ составляет около 11 тыс. на 100 тыс. населения. Уровень слепоты и слабовидения в России достигает 19 человек на 10 тыс. населения. Ежегодно же в России число лиц, впервые ставших инвалидами из-за нарушения зрения, составляет около 45 тыс.[1]
Люди с существенными нарушениями зрения постоянно сталкиваются с затруднением или невозможностью прочитать текстовую информацию напрямую. Проект призван решить данную проблему посредством разработки программного обеспечения, которое реализует функциональность синтеза речи по тексту, то есть будет выполнять преобразование электронного текста в звуковой сигнал, имитирующий человеческую речь, с учётом специфических требований пользователей с нарушениями зрения.
Системы синтеза речи крайне востребованы среди лиц с инвалидностью по зрению, что подтверждается практикой реабилитации данной категории граждан и наличием национальных стандартов, описывающих подобные технические решения, в частности, ГОСТ Р 52873-2021[2].
Согласно результатам исследования, проведённого компанией Яндекс[3], люди с нарушениями зрения, проживающие на территории России, активно используют компьютеры. При этом, наиболее распространённой операционной системой является Windows. Также ввиду изменившихся условий конъюнктуры в 2022 году резко возросла актуальность альтернативных операционных систем семейства GNU/Linux.
Это обуславливает актуальность задачи разработки системы синтеза речи для инвалидов по зрению с учётом её кроссплатформенности, то есть способности работать на разных операционных системах, в том числе системах из Единого реестра российского ПО для ЭВМ и БД.
Поскольку системы вывода текстовой информации в форме синтезированной речи являются одним из ключевых компонентов набора вспомогательных компьютерных технологий, использующихся слепыми и слабовидящими людьми, то они должны быть доступны как для конечных потребителей в лице самих инвалидов по зрению, так и для разработчиков других программных продуктов, в которые требуется встраивать функцию синтеза речи.
Это обуславливает актуальность задачи разработки системы синтеза речи для инвалидов по зрению как программного обеспечения с открытым исходным кодом, чтобы данные наработки могли использоваться всей IT-индустрией.
В рамках реализации проекта планируется разработать кроссплатформенную систему синтеза речи с открытым исходным кодом, учитывающую специфику пользователей с инвалидностью по зрению.
Готовые реализации такой системы будут поддерживать операционные системы, системные интерфейсы и программное обеспечение, являющиеся наиболее востребованными среди инвалидов по зрению, проживающих на территории России, а также те операционные системы, чья актуальность возрастает в следствии процессов импортозамещения.
К моменту завершения проекта исходный код разработанной системы будет открыт на условиях общепринятой разрешительной лицензии свободного ПО. То есть разработанная система синтеза речи сможет быть использована не только конечными пользователями, но и другими разработчиками, которым требуется технология синтеза речи, в том числе для продуктов, чей исходный код не может быть раскрыт.
Уже существующие синтезаторы речи в полной мере не решают всех поставленных проблем по одной или нескольким причинам:
1) Альтернативные решения разрабатываются и распространяются на коммерческой основе, поэтому доступ к ним целевой аудитории затруднён. Особенно в отношении зарубежных продуктов.
2) Альтернативные решения либо имеют закрытый исходный код, либо их код открыт на условиях вирусных копилефт лицензий, не позволяющих встраивать синтезатор речи в компьютерные системы, чей код не может быть раскрыт.
3) Альтернативные решения с открытым исходным кодом не предоставляют достаточную степень универсальности чтобы обеспечить быстрое и эффективное развитие системы синтеза речи в отношении расширения числа поддерживаемых языков, в частности, добавления поддержки языков народов России.
Таким образом, на сегодняшний день ни одно из существующих альтернативных решений в полной мере не способно обеспечить решение всех проблем целевой группы, чем и обусловлена необходимость реализации проекта по Разработке новой кроссплатформенной системы синтеза речи с открытым исходным кодом для пользователей с инвалидностью по зрению.
Сноски:
1. Оценка главного офтальмолога РФ, директора МНИИ глазных болезней им. Гельмгольца Владимира Нероева. - URL: https://zreni.ru/articles/oftalmologiya/692-8-oktyabrya-vsemirnyy-den-zreniya.html
2. ГОСТ Р 52873-2021 "Комплексы электронно-цифровые интерактивные, рассчитанные на использование людьми с инвалидностью и другими ограничениями жизнедеятельности. Системы вывода текстовой информации в форме синтезированной речи. Технические требования". - URL: https://docs.cntd.ru/document/1200180661
3. Технические предпочтения пользователей с нарушениями зрения в 2020 году. Исследование Яндекса. - URL: https://habr.com/ru/company/yandex/blog/515460/

География проекта

Территория Российской Федерации

Целевые группы

  1. Люди с инвалидностью по зрению, проживающие в РФ и нуждающиеся в программном обеспечении, которое преобразовывает текстовую информацию в воспринимаемую на слух речь.

Контактная информация

г Москва, г Зеленоград, р-н Крюково, к 1509, кв 111