Включить в печать
опубликовано 11 авг ‘10 15:30

ФСБ отфильтрует голоса кавказской национальности за 24 млн рублей

текст: Андрей Сидельников /Infox.ru
Федеральная служба безопасности проводит конкурс на создание программного обеспечения, которое позволит идентифицировать кавказские языки при телефонных разговорах. В первую очередь заказчика интересует автоматическое распознавание «аварского, ингушского, кабардино-черкесского, карачаевского, балкарского и даргинского языков».

На сайте zakupki.gov.ruразмещен лот на «Создание автоматизированного атласа

На сайте zakupki.gov.ru размещен лот на «Создание автоматизированного атласа национальных языков РФ». Речь идет о создании системы, способной при автоматическом анализе телефонных разговоров идентифицировать язык, на котором ведется общение.

Техническое задание

Анализ документов, опубликованных в описании лота, дает представление о том, на что готов потратить заказчик 24 миллиона рублей. Речь идет о создании программного обеспечения, способного анализировать аудиозапись речи носителя языка и идентифицировать этот язык.

Программа должна работать в операционной системе «Windows XP и выше», содержать базу данных звуковых примеров, толковый словарь, инструкцию пользователя, обеспечивать возможность импорта/экспорта и пополнения данных.

В задании перечислены языки, которые должны отрабатываться программным комплексом: «аварский, ингушский, кабардино-черкесский, карачаевский, балкарский и даргинский» (названия языков процитированы из опубликованного документа).

База данных и звуковые примеры собираются на основе спонтанной речи и прочитанных вслух текстов так называемыми информантами-носителями, которыми должны являться только мужчины от 20 до 60 лет, с образованием не ниже среднего.

Заказчик хочет получить 20 дисков с программным обеспечением с возможностью инсталляции софта на неограниченное количество компьютеров. Инсталляционные комплекты не должны иметь ограничений срока действия, при этом срок гарантийного обслуживания составит три года.

Заказчик и исполнители

В описании лота указан заказчик – войсковая часть 68240, а также имена, телефоны и электронные адреса контактных лиц. Несложный анализ этих данных с применением популярных поисковых сервисов позволяет идентифицировать заказчика как одно из подразделений ФСБ РФ.

Войсковая часть 68240 известна также заказами на разработку программы автоматического распознавания тревожных ситуаций по индивидуальным особенностям поведения и внешнего облика человека за 15 миллионов рублей; на разработку носителей данных для архивного хранения за 45 миллионов рублей; на монокуляр ночного видения за 2 миллиона.

Не останутся без внимания ФСБ и носители русского языка. Та же войсковая часть разместила заказ на «Создание автоматизированного атласа современного русского языка» стоимостью 24 миллиона рублей, а также на «Создание автоматизированного справочника дефектных особенностей в русской речи» за 12 миллионов рублей.

Заявки на участие в конкурсе представили Московский государственный лингвистический университет, ООО «Центр речевых технологий» из Санкт-Петербурга и ростовское НИИ «Спецвузавтоматика».

КОММЕНТАРИИ (5)
nazar
пост #1 / 19:33, 11 авг '10
деньги этого стоят. Но создать такую прогу НЕВОЗМОЖНО.
поскольку нельзя создать даже программу которая бы меняла текст оставляя смысл.
деньги в трубу.
polemarh > nazar
пост #2 / 22:41, 11 авг '10
Ну вот говорить что не возможно - это зря. Раньше ведь думали что при езде на автомобиле человек будет разбиваться о встречный воздух.
nazar > polemarh
пост #3 / 08:12, 12 авг '10
это пустословие и не более. докажите, что можно?!
Sid > nazar
пост #4 / 11:17, 12 авг '10
Но речь идет не о замене текста, и даже не о распознавании слов. Речь идет только об идентификации языка. Программа должна только определять, на каком языке идет разговор. Затем подтягивают переводчика (сотрудника), если нужно.
nazar > Sid
пост #5 / 14:19, 12 авг '10
я то же пишу об этом и считаю это лишней тратой денег.
представьте сколько нужно будет записать голосов, наречий роботу в систему!
у каждого человека голос индивидуален как и произношение.
можно попытаться создать определитель нерусского произношения но данная задача невыполнима.