Конференция "Прочее" » Понимание текста компьютером
 
  • Larin © (05.07.18 08:09) [0]
    А как на данном этапе развития технологий обстоят дела с пониманием текста, написанного человеком, компьютером (программами)? Может ли она успешно переписываться с человеком (как в мессенджере) или из текста (новостного, научного) извлекать суть?
  • KSergey © (05.07.18 08:18) [1]
    Что такое "извлекать суть"?

    По поводу ботов - вроде новости у всех на слуху про Сири, Алису, майкрософтовскую девочку как-то еще звали (но она оказалось плохой девочкой, её придушили)
  • RWolf © (05.07.18 10:15) [2]
  • KSergey © (05.07.18 11:56) [3]
    > RWolf ©   (05.07.18 10:15) [2]

    Прикольно
    чуешь себя и свою деятельность динозавром )
  • KilkennyCat © (05.07.18 17:17) [4]
  • kilkennycat © (05.07.18 17:19) [5]

    > KSergey ©   (05.07.18 11:56) [3]

    неприкольно - безграмотно.
  • Mystic © (05.07.18 20:30) [6]
    Успешно переписываться может, а вот с пониманием проблемы. Если мы задаём вопрос, и нам надо определить, в какую из наперёд заданных категорий попалает ответ, то мы можем это сделать. Если же нам надо получить произвольную информацию, то тут сложнее потому как нейросеть выдаёт вероятности, а информация кодируется обычно дискретной структурой.

    Насколько я знаю, те системы, которые парсят текст, то они сохраняют его сейчас в виде графовой базы данных, и потом просто стараются максимизировать вероятность попадания.
  • KilkennyCat © (05.07.18 21:31) [7]
    и интонации понимает?
  • Mystic © (05.07.18 23:08) [8]

    > и интонации понимает?


    Да, принципиальных проблем там нет.
  • ухты © (06.07.18 01:05) [9]
    А если сказать, например, " да нет", поймут ? )
  • KilkennyCat © (06.07.18 01:34) [10]

    > хты ©   (06.07.18 01:05) [9]

    ага, или "да ладно?!"

    а еще интересует юридический вопрос. несет ли робот ответственность.
  • Германн © (06.07.18 02:49) [11]

    > RWolf ©   (05.07.18 10:15) [2]

    Не верю что это был робот. Точнее что это был ИИ. ИИ не будет "а"кать. Т.е. вставлять бессмысленный звук А перед началом фразы. Что можно заметить на 44-й секунде перед фразой "Хорошо, тогда в таком случае я перезвоню...".
  • KSergey © (06.07.18 07:45) [12]
    > kilkennycat ©   (05.07.18 17:19) [5]
    > неприкольно - безграмотно.

    Вот бы как-то развернуть ответ.
  • KSergey © (06.07.18 07:50) [13]
    > Германн ©   (06.07.18 02:49) [11]
    > Не верю что это был робот. Точнее что это был ИИ. ИИ не будет "а"кать.

    Там есть еще несколько примеров. По ним становится понятнее.
    У меня сложилось впечатление, что там записанные фразы реального человека, которые монтируются, а не синтез речи. Может не везде, но явно часто вставлены целые большие куски фраз и фразы. Плюс при вставках чисел - явные нестыковки интонации (как всегда бывает с безграмотно записанными отдельными фразами для автоинформатора).
    В том числе вот этот самый фрагмент про "я перезвоню", который, кстати, выглядит совершенно "не в тему" в данном случае ("я перезвоню и расскажу вам о нашем товаре", хотя речь про получение на почте)
  • Larin © (06.07.18 10:16) [14]

    > Mystic ©   (05.07.18 20:30) [6]
    > Успешно переписываться может, а вот с пониманием проблемы.
    >  Если мы задаём вопрос, и нам надо определить, в какую из
    > наперёд заданных категорий попалает ответ, то мы можем это
    > сделать. Если же нам надо получить произвольную информацию,
    >  то тут сложнее потому как нейросеть выдаёт вероятности,
    >  а информация кодируется обычно дискретной структурой.
    >
    > Насколько я знаю, те системы, которые парсят текст, то они
    > сохраняют его сейчас в виде графовой базы данных, и потом
    > просто стараются максимизировать вероятность попадания.


    То есть получается, что все эти распиаренные хваленные нейросети - всего лишь сравнение вероятностей?
    Я правильно понимаю?
  • Игорь Шевченко © (06.07.18 10:33) [15]
  • картман © (06.07.18 10:54) [16]

    > То есть получается, что все эти распиаренные хваленные нейросети
    > - всего лишь сравнение вероятностей?

    твои мозги, меж прочим, работают так же. А по поводу понимания текстов компьютером - все брехня. Ну, может не совсем, а примерно как тушь, увеличивающая ресницы на 300%
  • Pavia © (06.07.18 12:53) [17]

    > То есть получается, что все эти распиаренные хваленные нейросети
    > - всего лишь сравнение вероятностей?Я правильно понимаю?

    Распиаренные - да. Хваленные - да.
    Всего лишь сравнение вероятностей - нет.
    Сравнение вероятности это конечная стадия НС и не основная. И насколько понимаю в задачи о чтении она не участвует.
    НС это в первую очередь оптимизация целевой функции.
  • картман © (06.07.18 15:02) [18]

    > НС это в первую очередь оптимизация целевой функции.

    обобщить до потери смысла - прерогатива Копира на данном сайте - кончай с плагиатом))
  • KilkennyCat © (06.07.18 15:13) [19]

    > KSergey ©   (06.07.18 07:45) [12]

    там было "скину" вместо "сообщу", "отправлю" и т.д. Фирма, ведущая официальный диалог с клиентом должна разговаривать нормально.
  • kilkennycat © (06.07.18 15:21) [20]

    > Larin ©   (06.07.18 10:16) [14]

    Насколько мне известно, даже ассоциативный механизм мозга до сих пор неясен. Не говоря уж об озарениях.
    Так что, когда говорят, что нейросеть - это ИИ - то да, хваленый пиар.
    Вот когда нейросеть на любую фразу типа: "Отправите барахло - ноги повыдираю" ответит как человек,то есть с учетом громадного кол-ва факторов (погода на улице, пролитый борщ на штаны, задержки зарплаты и у любовницы, кавказский акцент собеседника и хилая собственная мышечная масса и т.д.) - вот тогда будет ИИ.
  • ухты © (06.07.18 16:13) [21]

    > твои мозги, меж прочим, работают так же
    как все просто ))
  • KSergey © (06.07.18 16:20) [22]
    > KilkennyCat ©   (06.07.18 15:13) [19]
    > там было "скину" вместо "сообщу", "отправлю" и т.д. Фирма,
    >  ведущая официальный диалог с клиентом должна разговаривать нормально.

    А, про это.
    Не, ну мы же про ИИ / не ИИ говорим; а это так, детали конкретной имплементации, быть может даже умышленные )
  • ухты © (06.07.18 16:40) [23]
    Тут вот чм2018 в ИИ загрузили, получили вот это (финал германия - бразилия)
    https://naviny.by/sites/default/files/2018_wch.jpg тиаких картинок много,
    как видно мельдоний пока круче ИИ ;)
  • ухты © (06.07.18 16:42) [24]
    пысы: а чего превью на картинки не сделали, на код понаделали кучу, и никому не надо, а картинки постят куда как чаще ))
  • KilkennyCat © (06.07.18 21:38) [25]

    > ухты ©   (06.07.18 16:40) [23]

    они просто на -1 забыли умножить, тогда всё верно, германия на последнем месте
  • картман © (07.07.18 01:50) [26]

    > как все просто ))

    Эмерджентность нужно учитывать, а не только мельдоний
  • Германн © (07.07.18 02:16) [27]
    2 KSergey ©   (06.07.18 07:50) [13]
    Так это же какой запас фраз нужно хранить! А ещё и интонацию надо учитывать.
  • aka © (07.07.18 20:48) [28]
    Подход к решения проблемы не тот. Вы неверное иногда замечали, как человек местами путает слова в контексте? Например: Машина каша -> Кашина маша итд. Или когда работал в одной телефонной компании, замел как люди повально часто путают местами цифры в номерах телефонов. Например: 94558 -> 95845, 58756 -> 55687. Почему-то путают в 90% именно так. В этом зарыт секрет ИИ, нутром чую. Только пока никому про это особо не распространяйтесь, может чего сами напишем))
  • Pavia © (07.07.18 22:34) [29]

    > Так это же какой запас фраз нужно хранить!

    https://habr.com/company/microsoft/blog/352598/
    Меньше 1000
  • Pavia © (07.07.18 23:06) [30]

    > 94558 -> 95845, 58756 -> 55687. Почему-то путают в 90% именно
    > так. В этом зарыт секрет ИИ, нутром чую

    К примеру вот тут я человеку помог с оптимизацией за счёт перестановок.
    Метод отжига. Если задать больше точек любопытные лабиринты получаются.
    http://forum.sources.ru/index.php?showtopic=412988&st=0&#entry3773002
    Я там особо не сильно старался. Так как это лишь примитив. На самом деле более обобщённая теория это ГА с применением регулировок*.
  • KilkennyCat © (08.07.18 00:00) [31]

    > Pavia ©   (07.07.18 22:34) [29]

    считается, что 300 хватает для общения
  • картман © (08.07.18 00:19) [32]

    > 300 хватает для общения

    эт смотря кому))
  • asail © (08.07.18 14:51) [33]

    > эт смотря кому))

    Шутите, парниша?
  • картман © (08.07.18 17:54) [34]
    Ни капли. К тому же, я его упомянул в этой ветке))
  • KSergey © (09.07.18 07:53) [35]
    > Германн ©   (07.07.18 02:16) [27]
    > Так это же какой запас фраз нужно хранить! А ещё и интонацию надо учитывать.

    Вы так говорите, как-будто речь про бобинный магнитофон )
  • KilkennyCat © (09.07.18 22:28) [36]

    > Pavia ©   (07.07.18 22:34) [29]
    > https://habr.com/company/microsoft/blog/352598/

    почитал. жуткая речь.
  • Германн © (10.07.18 01:14) [37]

    > KSergey ©   (09.07.18 07:53) [35]
    >
    > Вы так говорите, как-будто речь про бобинный магнитофон
    > )

    А чем собственно бобинный магнитофон (кстати мы много красоты потеряли с исчезновением таковых) радикально отличается от прочих средств записи и чтения информации?
    :)
  • Inovet © (10.07.18 07:00) [38]
    Удалено модератором
  • KSergey © (10.07.18 07:02) [39]
    Удалено модератором
  • Игорь Шевченко © (10.07.18 10:48) [40]
    Удалено модератором
  • Mystic © (13.07.18 18:20) [41]

    > То есть получается, что все эти распиаренные хваленные нейросети
    > - всего лишь сравнение вероятностей?
    > Я правильно понимаю?


    Распознавание образов чаще всего да. Но вообще нейросеть это просто функция, которая принимает на входе вектор действительных значений и возвращает тоже вектор, возможно другой размерности. Для распознавание образом они используются почти один в один, для игры в шахматах нейросеть используются в некоторых местах более общего алгоритма MCTS, ...
  • Кто б сомневался © (15.07.18 15:04) [42]

    > RWolf ©   (05.07.18 10:15) [2]
    > https://www.youtube.com/watch?v=f2bQJCGxmNc


    Какой же это робот, это же человек. Слышно же как дышит в микрофон. Да и роботы так не разговаривают.
  • Кто б сомневался © (15.07.18 15:14) [43]
    Робот - это когда бот переводит речь в текст, анализируют ее и отвечает синтезируя речь. Как например Сири, Google Assistent, Alexa.
    Ксати яблочная Сири самая глупая среди остальных ботов, Вилса про это часто говорит.

    А так сейчас очень хорошо развито распознавание голоса в текст. Я частенько начитываю в Android голосом какие то заметки в блокнот (Google Keeper), вполне неплохо справляется, только лучше интернет для этого включить.
    И наоборот - текст в голос - к примеру Google Translate позволяет сфоткать текст, распознать его,  перевести и озвучить.
    Либо иногда я общаюсь через Google Translate переводчик с кем то - говорю, GT распознает голос, переводит на нужный язык и воспроизводит на этом языке.
    И наоборот. Т.е. если общаюсь с иностранцем смарт с GT обычно лежит на столе для случая если что-то не понятно..

    В этом плане Apple сильно отстает от Google.
  • KSergey © (15.07.18 16:06) [44]
    > Кто б сомневался ©   (15.07.18 15:04) [42]
    > Какой же это робот, это же человек. Слышно же как дышит
    > в микрофон. Да и роботы так не разговаривают.

    Вы слишком буквально и узко спорите на автоматизированную речь, так это назовём.
    Видно, что в данном примере парни ловко используют записанные довольно крупные фразы, которые подставляются в диалог по заданному сценарию для тупого выяснения ответов на конкретные вопросы.
    Хотя, конечно, к теме этого топика вряд ли относится. В этом примере  явно ожидается в ответ конкретное ключевое слово, и при его отсутствии абонента долбят по кругу одним и тем же вопросом.
  • KilkennyCat © (16.07.18 00:49) [45]

    > Кто б сомневался ©   (15.07.18 15:14) [43]
    >  отвечает синтезируя речь.

    синтез не обязан быть побуквенным или имитировать голосовые связки со всем остальным ротом
 
Конференция "Прочее" » Понимание текста компьютером
Есть новые Нет новых   [118688   +18][b:0][p:0.001]