PHP DM Gate v0.9 » компоненты к kol

rdnks (28.07.11 04:47) [0]

Так же кому не жалко и кто переводил на кол адекватный xml-парсер и какие-либо протоколы к im-сетям (irc, jаbbеr и тому подобное) прошу поделиться, дабы не изобретать велосипед. На данный момент перевожу jabbеr. Достаточно трудоемко, в части отсутствия нормального парсера. Возможно даже библиотеки с интерфейсом к ним. Заранее thx.

<Цитата>
awkward © (28.07.11 12:24) [1]

А что значит "нормальный парсер"? в коллекции дополнительных библиотек для КОЛ был вполне себе работоспособный XMLParser.

<Цитата>
rdnks (28.07.11 16:03) [2]

Что есть в коллекции kolxml - нашел только функции генерирования xml-структуры, но не её парсирования. Возможно плохо разобрался, есть ли примеры? Или не тот компонент имею ввиду?

<Цитата>
awkward © (28.07.11 16:47) [3]

надо смотреть большую коллекцию разных модулей... там я именно парсер находил. к сожалению, архива под рукой нет, только сам паскалевский модуль лежит (Я использовал его в одной программке). Обзывался он именно XMLParser и содержал несколько объявлений объектов

<Цитата>
awkward © (28.07.11 16:50) [4]

если вдруг сильно надо и не найти полный "пакет", то выложил временно тут http://dl.dropbox.com/u/21204832/XMLParser.zip

<Цитата>
rdnks (28.07.11 18:45) [5]

благодарю, вроде как раз то что нужно было

<Цитата>
rdnks (11.08.11 23:17) [6]

парсер оказался неоконченным. Проблемы с парсированием, отказ работы с CDATA и прочее. Естественно ни о какой работе с жабопротоколом и речи быть не может. Вообщем править его трудоемко было, запутан токенайзер какбы, легче было свой собрать. Взял за основу этот и джановский из vcl. Как дотестирую и пару фичей внесу - могу выложить. Может пригодиться.

<Цитата>
Гость (12.08.11 01:09) [7]

> Как дотестирую и пару фичей внесу - могу выложить. Может
> пригодиться.
>

Ждем.

<Цитата>
rdnks (24.08.11 01:16) [8]

прошу простить) на работе ужос и мракобесие было. Не забил на обещание, нехватка времени. Вернулся к парсеру и вдруг столкнулся с работой в юникоде. Пользуюсь седьмыми дельфями, проработал условия на unicode_ctrls всё отлично. Но так же есть замечательная кодировка utf8, с которой в никсах намучался и тут покоя не дает xD Вообщем есть системная функция, utf8tostring, возвращающая String как AnsiString (d7 же). Но как эта функция пашет в новых дельфях? Как упоминалось string там уже стал жирным стрингом) В самом коле не предусмотрено функций для работы с кодировками, использовать multibytetowidechar и обратно - некрасиво. С другой стороны у меня есть свои кодеки для конвертирования кодировок (для всех возможных карт, кроме карт языков восточной азии). Но только использование модуля с ними прибавит ~50-60 кб в виде таблиц кодировок, а сама функция кодирования-декодирования у о utf8 у меня медленная, с текстом в 5мб задержка секунд в 20 уже при приведении в widechar. Так же не представляю как работать с UCS2-BE. Привел его к little endian, не представляю даже что из этого выйдет.

<Цитата>
rdnks (01.09.11 22:44) [9]

нет ответа)
Ладно, пока сырая версия тут. Буду постепенно исправлять. Работает с ucs, utf8, ansi как в юникодном приложении, так и в ansi (принудительно переводит через cp1251). WinXP D7.

http://btdompost.hop.ru/tmp/KOLXMLParser.7z

<Цитата>
Compiler © (19.09.11 08:19) [10]

> http://btdompost.hop.ru/tmp/KOLXMLParser.7z

Не качается

<Цитата>
RusSun © (19.09.11 16:53) [11]

to Compiler ©
http://narod.ru/disk/25628811001/XMLParser.zip.html

<Цитата>
RusSun © (20.09.11 09:25) [12]

http://narod.ru/disk/25706043001/KOLXMLParser.7z.html

<Цитата>
L`Autour (20.09.11 14:55) [13]

последний архив не открывается

<Цитата>
RusSun © (20.09.11 19:16) [14]

http://narod.ru/disk/25769988001/KOLXMLParser.zip.html
Здесь с демкой.
KOLXMLParser.7z похоже у меня битым архив. Так что остается ждать awkward или rdnks снова выложат.

<Цитата>
awkward © (21.09.11 08:21) [15]

я думаю, у меня тот же самый файлик

<Цитата>
rdnks (26.09.11 14:26) [16]

похоже хостер неправильно отдает 7z архивы. Но у меня этим архиватором прекрасно распаковалось. Вечером перезалью.

<Цитата>
rdnks (26.09.11 22:28) [17]

хост не закрыли =)), значит будет пока тут
http://btdompost.hop.ru/pages.php?id=others

<Цитата>
rdnks (02.03.12 11:50) [18]

по сути дела убил три недели чтобы собрать парсер с рекомендациями w3.org. Получился медленный процессор))) Только уже не знаю, имеет ли смысл использовать его в приложениях kol, так как добавляет к весу порядка 80 кб, и это только начало. Основная проблема - поддерживаемые кодировки. Для однобайтовых кодировок существуют таблицы в виде массивов. Есть два решения - все таблицы вбить в одну и сжать, например, по хаффману(соответственно при инициализации распаковывать, что повлияет на озу), или же включать поддерживаемые кодировки символами условной компиляции. Как было бы адекватней? Есть еще более насущные проблемы, но и так радует обработка doctypedecl и enity. И да, процессор невалидирущий, и предопределен как standalone. То есть обработки внешних деклараций нет. Если есть сочувствующие - могу выложить сорцы позже.

<Цитата>
Гость (11.02.16 12:10) [19]

Люди!
У кого есть парсер с демкой. Слезно прошу поделиться.

<Цитата>
RusSun © (11.02.16 17:37) [20]

> У кого есть парсер с демкой. Слезно прошу поделиться.

Перевыложил https://yadi.sk/d/xl0K4Ne3ofu6q

<Цитата>