-
Здравствуйте!
1. Есть такие программы по изменению голоса одного лица на другие (с разной степенью точности уровня настройки) с целью приколов и скрытия своего голоса типа программ MorphVOX Voice Changer Software 2.0 или Vodi или Scramby FunVocoder в общем см. http://www.softsoft.ru/search/3465/page2.htm чтобы было понятно, которые изменяют голос одного человека на другой (персонаж фильма, актеры и прочие).
2. Имеется база данных наговоренных слов (несколько сотен) в Wav формате - 44 кГц, 16 Бт. Качество высокое.
3. Нужно, чтобы написанная программа (или уже может быть уже имеющаяся где-то?) при вводе звукового файла с микрофона другим человеком (или из другого файла) смогла достаточно быстро обработать входной файл так, чтобы он оказался очень сильно похожим на тип произношения из базы - по тону, стилю, речевым параметрам. Обеспечить максимальную скорость такого преобразования не так важно. Можно не поддерживать режим реального времени. Главное - обеспечить качество преобразования. Вначале в качестве наговариваемых слов можно использовать те же слова из базы данных, что уже были сделаны, чтобы можно было точнее сравнивать. В дальнейшем желательно, чтобы вводимые слова, которых уже нет в базе, были достаточно близко по типу произношения к тем, которые уже есть в базе. Идеально, чтобы система их не отличала. Интерфейс – самый простой.
4. Язык Pascal, среда - Delphi 6 - если можно написать программу или просто описать алгоритм или приведите ссылку на ресурс, где можно посмотреть.
5. Спасибо за любой ответ или совет. -
Сергей М. © (27.10.09 10:00) [1]Это что, курсовой ?)
-
Это имеет значение, как это называется? Если Вам удобнее считать за курсовой - пусть будет курсовой. Мне главное - получить ответ. Жду.
-
Сергей М. © (27.10.09 20:45) [3]
> Это имеет значение, как это называется?
Имеет.
Ибо сама постановка вопроса выдает полное дилетантсво.
И это при задаче, вполне тянущей на научный труд.
Ликбез:
Фролов А.В., Фролов Г.В. Синтез и распознавание речи. Современные решения -
Спасибо, Сергей, за ссылку на книгу. Хорошо знаю ее как и многие другие книги, статьи и патенты по данной теме. Книга хорошая в плане простоты подачи материала и описания состояния проблемы (насколько это вообще можно сделать в книге, где любая подобная информация очень быстро устаревает на момент выхода книги в печать), хорошо структуированная, но как там написано самим автором во введении, больше подходит для студентов соответствующих специальностей для начального ознакомления с темой.
Проблема действительно очень сложная (и я вполне отдаю в этом отчет за последние 15 лет), но с моей точки зрения решаемая на хорошем уровне, особенно сейчас при появлении новых вычислительных ресурсов и накопленных знаний и опыта в этой области в разных областях. -
brother © (28.10.09 04:34) [5]> больше подходит для студентов соответствующих специальностей
> для начального ознакомления с темой
а ты как хотел?
> но с моей точки зрения решаемая на хорошем уровне
тебе же сказали:
> Ибо сама постановка вопроса выдает полное дилетантсво.
> И это при задаче, вполне тянущей на научный труд.
или ты что от нас хочешь услышать? -
Сергей М. © (28.10.09 08:25) [6]
> Имеется база данных наговоренных слов
Бестолковая сама по себе база, ни к селу ни к городу.
Применить ее напрямую ни к формантному ни к фонемному анализу/синтезу не получится. -
Сергей М. © (28.10.09 09:21) [7]
-
Инна (30.10.09 14:25) [8]
> которые изменяют голос одного человека на другой (персонаж
> фильма, актеры и прочие).
а вам самому удалось поговорить голосом актера, при помощи данных программ, или просто прочитали описание и загорелись?
одно дело тембр поменять типа мальчик\девочка и совсем другое полная имитация коголибо -
> [8] Инна (30.10.09 14:25)
> одно дело тембр поменять типа мальчик\девочка и совсем другое
> полная имитация коголибо
Ага, "забуратинить" и на аналоговой аппаратуре несложно.:)