Конференция "Media" » Cовет или написание проги на Delphi связанное с обработкой звука [D6, WinXP]
 
  • val2009 © (26.10.09 21:08) [0]
    Здравствуйте!

    1. Есть такие программы по изменению голоса одного лица на другие (с разной степенью точности уровня настройки) с целью приколов и скрытия своего голоса типа программ MorphVOX Voice Changer Software 2.0 или Vodi или Scramby FunVocoder в общем см.  http://www.softsoft.ru/search/3465/page2.htm чтобы было понятно, которые  изменяют голос одного человека на другой (персонаж фильма, актеры и прочие).

    2. Имеется база данных наговоренных  слов (несколько сотен) в Wav формате - 44 кГц, 16 Бт. Качество высокое.

    3. Нужно, чтобы написанная программа (или уже может быть уже имеющаяся где-то?) при вводе звукового файла с микрофона другим человеком (или из другого файла) смогла достаточно быстро обработать входной файл так, чтобы он оказался очень сильно похожим на тип произношения из базы - по тону, стилю, речевым параметрам. Обеспечить максимальную скорость такого преобразования не так важно. Можно не поддерживать режим реального времени. Главное - обеспечить качество преобразования. Вначале в качестве наговариваемых слов можно использовать те же слова из базы данных, что уже были сделаны, чтобы можно было точнее сравнивать. В дальнейшем желательно, чтобы вводимые слова, которых уже нет в базе, были достаточно близко по типу произношения к тем, которые уже есть в базе. Идеально, чтобы система их не отличала. Интерфейс – самый простой.

    4. Язык Pascal, среда - Delphi 6 - если можно написать программу или просто описать алгоритм или приведите ссылку на ресурс, где можно посмотреть.  

    5. Спасибо за любой ответ или совет.
  • Сергей М. © (27.10.09 10:00) [1]
    Это что, курсовой ?)
  • val2009 © (27.10.09 20:07) [2]
    Это имеет значение, как это называется? Если Вам удобнее считать за курсовой - пусть будет курсовой. Мне главное - получить ответ. Жду.
  • Сергей М. © (27.10.09 20:45) [3]

    > Это имеет значение, как это называется?


    Имеет.
    Ибо сама постановка вопроса выдает полное дилетантсво.
    И это при задаче, вполне тянущей на научный труд.

    Ликбез:
    Фролов А.В., Фролов Г.В. Синтез и распознавание речи. Современные решения
  • val2009 © (28.10.09 01:40) [4]
    Спасибо, Сергей, за ссылку на книгу. Хорошо знаю ее как и многие другие книги, статьи и патенты по данной теме. Книга хорошая в плане простоты подачи материала и описания состояния проблемы (насколько это вообще можно сделать в книге, где любая подобная информация очень быстро устаревает на момент выхода книги в печать), хорошо структуированная, но как там написано самим автором во введении, больше подходит для студентов соответствующих специальностей для начального ознакомления с темой.

    Проблема действительно очень сложная (и я вполне отдаю в этом отчет за последние 15 лет), но с моей точки зрения решаемая на хорошем уровне, особенно сейчас при появлении новых вычислительных ресурсов и накопленных знаний и опыта в этой области в разных областях.
  • brother © (28.10.09 04:34) [5]
    > больше подходит для студентов соответствующих специальностей
    > для начального ознакомления с темой

    а ты как хотел?

    > но с моей точки зрения решаемая на хорошем уровне

    тебе же сказали:

    > Ибо сама постановка вопроса выдает полное дилетантсво.
    > И это при задаче, вполне тянущей на научный труд.

    или ты что от нас хочешь услышать?
  • Сергей М. © (28.10.09 08:25) [6]

    > Имеется база данных наговоренных  слов


    Бестолковая сама по себе база, ни к селу ни к городу.
    Применить ее напрямую ни к формантному ни к фонемному анализу/синтезу не получится.
  • Сергей М. © (28.10.09 09:21) [7]

    > val2009 ©   (26.10.09 21:08)  


    http://www.klingbeil.com/spear/
  • Инна (30.10.09 14:25) [8]

    > которые  изменяют голос одного человека на другой (персонаж
    > фильма, актеры и прочие).

    а вам самому удалось поговорить голосом актера, при помощи данных программ, или просто прочитали описание и загорелись?
    одно дело тембр поменять типа мальчик\девочка и совсем другое полная имитация коголибо
  • Inovet © (30.10.09 21:10) [9]
    > [8] Инна   (30.10.09 14:25)
    > одно дело тембр поменять типа мальчик\девочка и совсем другое
    > полная имитация коголибо

    Ага, "забуратинить" и на аналоговой аппаратуре несложно.:)
 
Конференция "Media" » Cовет или написание проги на Delphi связанное с обработкой звука [D6, WinXP]
Есть новые Нет новых   [134430   +3][b:0][p:0.001]