Конференция "Media" » Степень "похожести" двух аудио фрагментов [D7, WinXP]
 
  • разведчик (03.07.07 13:50) [0]
    Какие технологии/алгоритмы используются для решения подобной задачи?
  • Jeer © (03.07.07 15:43) [1]
    - спектральный (фурье или вейвлет) анализ и/или корреляционные методы
  • Сергей М. © (03.07.07 16:04) [2]

    > разведчик   (03.07.07 13:50)


    Дай четкое определение термину "похожесть"..
  • разведчик (03.07.07 16:24) [3]
    Есть локальный аудио образец. И есть эфир.
    Надо считать количество прогонов образца в эфире.
  • Jeer © (03.07.07 16:27) [4]

    > Сергей М. ©   (03.07.07 16:04) [2]


    Твой вопрос вообще вне конкурса - найти два муз.фрагмента, похожих по смысловому содержанию воспроизводимого, причем один должен быть в стиле рэп, а другой - римейк на тему "Лунная соната".
  • Jeer © (03.07.07 16:28) [5]

    > разведчик   (03.07.07 16:24) [3]


    Если фрагмент точно из муз.произведения - можно.
  • Сергей М. © (03.07.07 16:30) [6]
    А этот "образец" в эфире "прогоняется" без какой-либо обработки ?

    Я имею ввиду, к примеру, "растяжку/сжатие" шкалы реального времени воспроизведения и/или пич-бэнд ...
  • Сергей М. © (03.07.07 16:31) [7]

    > Jeer ©   (03.07.07 16:27) [4]


    Не, Серег)

    Я не о том.

    см. [6]
  • разведчик (03.07.07 16:35) [8]
    Образец эталонный. Всегда есть.
    Его гоняют в эфире без какой-либо обработки.
    Нужно просто определять в аудио потоке его наличие.
    Ну то есть считать.
    Образец представляет собой речь, но может быть на фоне музона
  • Jeer © (03.07.07 16:40) [9]

    > Сергей М. ©   (03.07.07 16:31) [7]
    >
    >


    Да понятно, что наличие преднамеренных искажений шкалы времени, мультипликативных и/или аддитивных искажений значительно затруднит распознавание.
  • разведчик (03.07.07 16:43) [10]
    Если фрагмент точно из муз.произведения - можно.

    Собственно и хотелось бы получить подсказку или направление для поиска
  • Jeer © (03.07.07 16:44) [11]

    > разведчик   (03.07.07 16:43) [10]


    См. [1]
  • разведчик (03.07.07 16:47) [12]
    То есть я так понял, что если это будет только речь (а там спектр невнятный) то все будет довольно проблематично?
  • @!!ex © (03.07.07 16:55) [13]
    Тут уже обсуждался этот вопрос. Где то пол годика годик назад. Ищи.
    Дай все исходные данные задачи, тогд аможно будет облегчить алгоритм проверки.
    Например сравнить два сигнала одинаковой длины, с полным соответствием тайминга волн - не проблема вообще.
  • Jeer © (03.07.07 17:05) [14]

    > разведчик   (03.07.07 16:47) [12]


    Не только спектр тембра - для речи можно выделять темп произнесения.
    По сути это нижний спектр модуляции - полоса в районе долей - единиц герц.
  • разведчик (03.07.07 17:17) [15]
    Все исходные данные я уже описал. Что за образец будет конкретно сейчас неизвестно. Длительность примерно около минуты. Речь в нем будет стопроцентно.
  • @!!ex © (03.07.07 17:49) [16]
    ОТносительно простой способ, работающий, если трэк не искажен, не изменен, и уровень шума не большой.
    Берешь исходный трэк. Из него берешь некоторый кусок.(Не вижу смысла проверять всесь трэк)
    Делишь его на кучу небольших кусков.
    В процессе прослушиваняи эфира сравниваешь все с самым первым куском(тупо сравнение волны с некоторой точностью), как только кусок прошел тест, выделяешь потом в котором проверяешь второй, и так далее пока не будет проверен весь трэк. Если на каком то куске проверка обломилась, поток деактивируется.
    понятно что одновременно могут существовать несколько потоков, а при спцифической однообразности музыки современной и неудачно подобранном куске для проверки может количество потоков размножится до сотен.
    Если еще проверять не один трэк, а несколько.. Супердум на 30 процов справится, :))
    Все приведенное выше не проверенно на практике, чисто теоретические соображения, но я немного занимался сравнением звуковых потоков, поэтому это все же соображения основанные на некотором опыте, хоть и не большом.
  • разведчик (03.07.07 18:13) [17]
    Ну и тогда самое интересное:
    А что за библиотеки для этого "сравнения волн" использовать?
  • Jeer © (03.07.07 18:19) [18]

    > Если на каком то куске проверка обломилась, поток деактивируется.

    Ну да - эфирный треск, например.

    Простейший способ:
    -прогнать трэк через soundforge и определиться с нижней частью спектра
    -прогнать наиболее характерный отрывок через ФНЧ и получить эталонный сигнал

    Далее, гнать входной поток через такой же ФНЧ и считать корреляцию.
  • @!!ex © (03.07.07 18:49) [19]
    > Ну да - эфирный треск, например.

    Это уже от выбранного метода сравнения зависит и точности.

    I>
    > А что за библиотеки для этого "сравнения волн" использовать?

    Хм. Напиши, да используй? Ктож за тебя писать будет?
  • Jeer © (04.07.07 10:01) [20]

    > @!!ex ©   (03.07.07 18:49) [19]
    >
    > > Ну да - эфирный треск, например.


    > Это уже от выбранного метода сравнения зависит и точности.
    >
    >


    И при чем тут голова ?
  • @!!ex © (04.07.07 10:59) [21]
    > [20] Jeer ©   (04.07.07 10:01)

    Метод настроенный на то, что в эфире может быть треск, его нормально обработают, что непонятного то?
  • Jeer © (04.07.07 11:51) [22]

    > Метод настроенный на то


    Надеюсь ты понимаешь, что произнеся слово "метод" ты не внес никакой информативности ?
  • @!!ex © (04.07.07 12:17) [23]
    > [22] Jeer ©   (04.07.07 11:51)

    Конечно понимаю. Методов вагонами. Об этом я и говорю.
    Однако в посте [18] тебе было достаточно информации чтобы сделать вывод:

    > Ну да - эфирный треск, например


    При том, что метод я опять же не укаызвал.
  • Jeer © (04.07.07 13:21) [24]

    > @!!ex ©   (04.07.07 12:17) [23]


    > тебе было достаточно информации чтобы сделать вывод


    Конечно достаточно, т.к. можно предположить наличие мешающих факторов, но если не определен (не озвучен) один из методов их устранения, можно долго-долго говорить "халва".

    В том же [18] как раз и приведен мной один из методов, вполне поддающийся алгоритмизации.

    В твоем же случае [16] приведена некоторая абстрактная последовательность действий, не имеющая каких-либо видимых обоснований, что она будет работать, за что тобой и получено по шее:))
 
Конференция "Media" » Степень "похожести" двух аудио фрагментов [D7, WinXP]
Есть новые Нет новых   [134464   +62][b:0][p:0.001]