PHP DM Gate v0.9 » Понимание текста компьютером

Larin © (05.07.18 08:09) [0]

А как на данном этапе развития технологий обстоят дела с пониманием текста, написанного человеком, компьютером (программами)? Может ли она успешно переписываться с человеком (как в мессенджере) или из текста (новостного, научного) извлекать суть?

<Цитата>
KSergey © (05.07.18 08:18) [1]

Что такое "извлекать суть"?

По поводу ботов - вроде новости у всех на слуху про Сири, Алису, майкрософтовскую девочку как-то еще звали (но она оказалось плохой девочкой, её придушили)

<Цитата>
RWolf © (05.07.18 10:15) [2]

https://www.youtube.com/watch?v=f2bQJCGxmNc

<Цитата>
KSergey © (05.07.18 11:56) [3]

> RWolf © (05.07.18 10:15) [2]

Прикольно
чуешь себя и свою деятельность динозавром )

<Цитата>
KilkennyCat © (05.07.18 17:17) [4]

http://delphimaster.ru/chat/

<Цитата>
kilkennycat © (05.07.18 17:19) [5]

> KSergey © (05.07.18 11:56) [3]

неприкольно - безграмотно.

<Цитата>
Mystic © (05.07.18 20:30) [6]

Успешно переписываться может, а вот с пониманием проблемы. Если мы задаём вопрос, и нам надо определить, в какую из наперёд заданных категорий попалает ответ, то мы можем это сделать. Если же нам надо получить произвольную информацию, то тут сложнее потому как нейросеть выдаёт вероятности, а информация кодируется обычно дискретной структурой.

Насколько я знаю, те системы, которые парсят текст, то они сохраняют его сейчас в виде графовой базы данных, и потом просто стараются максимизировать вероятность попадания.

<Цитата>
KilkennyCat © (05.07.18 21:31) [7]

и интонации понимает?

<Цитата>
Mystic © (05.07.18 23:08) [8]

> и интонации понимает?

Да, принципиальных проблем там нет.

<Цитата>
ухты © (06.07.18 01:05) [9]

А если сказать, например, " да нет", поймут ? )

<Цитата>
KilkennyCat © (06.07.18 01:34) [10]

> хты © (06.07.18 01:05) [9]

ага, или "да ладно?!"

а еще интересует юридический вопрос. несет ли робот ответственность.

<Цитата>
Германн © (06.07.18 02:49) [11]

> RWolf © (05.07.18 10:15) [2]

Не верю что это был робот. Точнее что это был ИИ. ИИ не будет "а"кать. Т.е. вставлять бессмысленный звук А перед началом фразы. Что можно заметить на 44-й секунде перед фразой "Хорошо, тогда в таком случае я перезвоню...".

<Цитата>
KSergey © (06.07.18 07:45) [12]

> kilkennycat © (05.07.18 17:19) [5]
> неприкольно - безграмотно.

Вот бы как-то развернуть ответ.

<Цитата>
KSergey © (06.07.18 07:50) [13]

> Германн © (06.07.18 02:49) [11]
> Не верю что это был робот. Точнее что это был ИИ. ИИ не будет "а"кать.

Там есть еще несколько примеров. По ним становится понятнее.
У меня сложилось впечатление, что там записанные фразы реального человека, которые монтируются, а не синтез речи. Может не везде, но явно часто вставлены целые большие куски фраз и фразы. Плюс при вставках чисел - явные нестыковки интонации (как всегда бывает с безграмотно записанными отдельными фразами для автоинформатора).
В том числе вот этот самый фрагмент про "я перезвоню", который, кстати, выглядит совершенно "не в тему" в данном случае ("я перезвоню и расскажу вам о нашем товаре", хотя речь про получение на почте)

<Цитата>
Larin © (06.07.18 10:16) [14]

> Mystic © (05.07.18 20:30) [6]
> Успешно переписываться может, а вот с пониманием проблемы.
> Если мы задаём вопрос, и нам надо определить, в какую из
> наперёд заданных категорий попалает ответ, то мы можем это
> сделать. Если же нам надо получить произвольную информацию,
> то тут сложнее потому как нейросеть выдаёт вероятности,
> а информация кодируется обычно дискретной структурой.
>
> Насколько я знаю, те системы, которые парсят текст, то они
> сохраняют его сейчас в виде графовой базы данных, и потом
> просто стараются максимизировать вероятность попадания.

То есть получается, что все эти распиаренные хваленные нейросети - всего лишь сравнение вероятностей?
Я правильно понимаю?

<Цитата>
Игорь Шевченко © (06.07.18 10:33) [15]

https://habr.com/post/416211/

<Цитата>
картман © (06.07.18 10:54) [16]

> То есть получается, что все эти распиаренные хваленные нейросети
> - всего лишь сравнение вероятностей?

твои мозги, меж прочим, работают так же. А по поводу понимания текстов компьютером - все брехня. Ну, может не совсем, а примерно как тушь, увеличивающая ресницы на 300%

<Цитата>
Pavia © (06.07.18 12:53) [17]

> То есть получается, что все эти распиаренные хваленные нейросети
> - всего лишь сравнение вероятностей?Я правильно понимаю?

Распиаренные - да. Хваленные - да.
Всего лишь сравнение вероятностей - нет.
Сравнение вероятности это конечная стадия НС и не основная. И насколько понимаю в задачи о чтении она не участвует.
НС это в первую очередь оптимизация целевой функции.

<Цитата>
картман © (06.07.18 15:02) [18]

> НС это в первую очередь оптимизация целевой функции.

обобщить до потери смысла - прерогатива Копира на данном сайте - кончай с плагиатом))

<Цитата>
KilkennyCat © (06.07.18 15:13) [19]

> KSergey © (06.07.18 07:45) [12]

там было "скину" вместо "сообщу", "отправлю" и т.д. Фирма, ведущая официальный диалог с клиентом должна разговаривать нормально.

<Цитата>
kilkennycat © (06.07.18 15:21) [20]

> Larin © (06.07.18 10:16) [14]

Насколько мне известно, даже ассоциативный механизм мозга до сих пор неясен. Не говоря уж об озарениях.
Так что, когда говорят, что нейросеть - это ИИ - то да, хваленый пиар.
Вот когда нейросеть на любую фразу типа: "Отправите барахло - ноги повыдираю" ответит как человек,то есть с учетом громадного кол-ва факторов (погода на улице, пролитый борщ на штаны, задержки зарплаты и у любовницы, кавказский акцент собеседника и хилая собственная мышечная масса и т.д.) - вот тогда будет ИИ.

<Цитата>
ухты © (06.07.18 16:13) [21]

> твои мозги, меж прочим, работают так же
как все просто ))

<Цитата>
KSergey © (06.07.18 16:20) [22]

> KilkennyCat © (06.07.18 15:13) [19]
> там было "скину" вместо "сообщу", "отправлю" и т.д. Фирма,
> ведущая официальный диалог с клиентом должна разговаривать нормально.

А, про это.
Не, ну мы же про ИИ / не ИИ говорим; а это так, детали конкретной имплементации, быть может даже умышленные )

<Цитата>
ухты © (06.07.18 16:40) [23]

Тут вот чм2018 в ИИ загрузили, получили вот это (финал германия - бразилия)
https://naviny.by/sites/default/files/2018_wch.jpg тиаких картинок много,
как видно мельдоний пока круче ИИ ;)

<Цитата>
ухты © (06.07.18 16:42) [24]

пысы: а чего превью на картинки не сделали, на код понаделали кучу, и никому не надо, а картинки постят куда как чаще ))

<Цитата>
KilkennyCat © (06.07.18 21:38) [25]

> ухты © (06.07.18 16:40) [23]

они просто на -1 забыли умножить, тогда всё верно, германия на последнем месте

<Цитата>
картман © (07.07.18 01:50) [26]

> как все просто ))

Эмерджентность нужно учитывать, а не только мельдоний

<Цитата>
Германн © (07.07.18 02:16) [27]

2 KSergey © (06.07.18 07:50) [13]
Так это же какой запас фраз нужно хранить! А ещё и интонацию надо учитывать.

<Цитата>
aka © (07.07.18 20:48) [28]

Подход к решения проблемы не тот. Вы неверное иногда замечали, как человек местами путает слова в контексте? Например: Машина каша -> Кашина маша итд. Или когда работал в одной телефонной компании, замел как люди повально часто путают местами цифры в номерах телефонов. Например: 94558 -> 95845, 58756 -> 55687. Почему-то путают в 90% именно так. В этом зарыт секрет ИИ, нутром чую. Только пока никому про это особо не распространяйтесь, может чего сами напишем))

<Цитата>
Pavia © (07.07.18 22:34) [29]

> Так это же какой запас фраз нужно хранить!

https://habr.com/company/microsoft/blog/352598/
Меньше 1000

<Цитата>
Pavia © (07.07.18 23:06) [30]

> 94558 -> 95845, 58756 -> 55687. Почему-то путают в 90% именно
> так. В этом зарыт секрет ИИ, нутром чую

К примеру вот тут я человеку помог с оптимизацией за счёт перестановок.
Метод отжига. Если задать больше точек любопытные лабиринты получаются.
http://forum.sources.ru/index.php?showtopic=412988&st=0&#entry3773002
Я там особо не сильно старался. Так как это лишь примитив. На самом деле более обобщённая теория это ГА с применением регулировок*.

<Цитата>
KilkennyCat © (08.07.18 00:00) [31]

> Pavia © (07.07.18 22:34) [29]

считается, что 300 хватает для общения

<Цитата>
картман © (08.07.18 00:19) [32]

> 300 хватает для общения

эт смотря кому))

<Цитата>
asail © (08.07.18 14:51) [33]

> эт смотря кому))

Шутите, парниша?

<Цитата>
картман © (08.07.18 17:54) [34]

Ни капли. К тому же, я его упомянул в этой ветке))

<Цитата>
KSergey © (09.07.18 07:53) [35]

> Германн © (07.07.18 02:16) [27]
> Так это же какой запас фраз нужно хранить! А ещё и интонацию надо учитывать.

Вы так говорите, как-будто речь про бобинный магнитофон )

<Цитата>
KilkennyCat © (09.07.18 22:28) [36]

> Pavia © (07.07.18 22:34) [29]
> https://habr.com/company/microsoft/blog/352598/

почитал. жуткая речь.

<Цитата>
Германн © (10.07.18 01:14) [37]

> KSergey © (09.07.18 07:53) [35]
>
> Вы так говорите, как-будто речь про бобинный магнитофон
> )

А чем собственно бобинный магнитофон (кстати мы много красоты потеряли с исчезновением таковых) радикально отличается от прочих средств записи и чтения информации?
:)

<Цитата>
Inovet © (10.07.18 07:00) [38]

Удалено модератором

<Цитата>
KSergey © (10.07.18 07:02) [39]

Удалено модератором

<Цитата>
Игорь Шевченко © (10.07.18 10:48) [40]

Удалено модератором

<Цитата>
Mystic © (13.07.18 18:20) [41]

> То есть получается, что все эти распиаренные хваленные нейросети
> - всего лишь сравнение вероятностей?
> Я правильно понимаю?

Распознавание образов чаще всего да. Но вообще нейросеть это просто функция, которая принимает на входе вектор действительных значений и возвращает тоже вектор, возможно другой размерности. Для распознавание образом они используются почти один в один, для игры в шахматах нейросеть используются в некоторых местах более общего алгоритма MCTS, ...

<Цитата>
Кто б сомневался © (15.07.18 15:04) [42]

> RWolf © (05.07.18 10:15) [2]
> https://www.youtube.com/watch?v=f2bQJCGxmNc

Какой же это робот, это же человек. Слышно же как дышит в микрофон. Да и роботы так не разговаривают.

<Цитата>
Кто б сомневался © (15.07.18 15:14) [43]

Робот - это когда бот переводит речь в текст, анализируют ее и отвечает синтезируя речь. Как например Сири, Google Assistent, Alexa.
Ксати яблочная Сири самая глупая среди остальных ботов, Вилса про это часто говорит.

А так сейчас очень хорошо развито распознавание голоса в текст. Я частенько начитываю в Android голосом какие то заметки в блокнот (Google Keeper), вполне неплохо справляется, только лучше интернет для этого включить.
И наоборот - текст в голос - к примеру Google Translate позволяет сфоткать текст, распознать его, перевести и озвучить.
Либо иногда я общаюсь через Google Translate переводчик с кем то - говорю, GT распознает голос, переводит на нужный язык и воспроизводит на этом языке.
И наоборот. Т.е. если общаюсь с иностранцем смарт с GT обычно лежит на столе для случая если что-то не понятно..

В этом плане Apple сильно отстает от Google.

<Цитата>
KSergey © (15.07.18 16:06) [44]

> Кто б сомневался © (15.07.18 15:04) [42]
> Какой же это робот, это же человек. Слышно же как дышит
> в микрофон. Да и роботы так не разговаривают.

Вы слишком буквально и узко спорите на автоматизированную речь, так это назовём.
Видно, что в данном примере парни ловко используют записанные довольно крупные фразы, которые подставляются в диалог по заданному сценарию для тупого выяснения ответов на конкретные вопросы.
Хотя, конечно, к теме этого топика вряд ли относится. В этом примере явно ожидается в ответ конкретное ключевое слово, и при его отсутствии абонента долбят по кругу одним и тем же вопросом.

<Цитата>
KilkennyCat © (16.07.18 00:49) [45]

> Кто б сомневался © (15.07.18 15:14) [43]
> отвечает синтезируя речь.

синтез не обязан быть побуквенным или имитировать голосовые связки со всем остальным ротом

<Цитата>