-
Всем доброго. Понадобилось побыстренькому прикрутить парсер XML к программе, обратил внимание на MSXML, как парсер. Теперь стала задача разобрать DOM HTML-ки.
Вопрос 1: Умеет ли MSXML разбирать страницы сайта?
В интернете ходят слухи что он подавится HTML-кой потому что там нет строгих правил как в XML, т.е. теги могут не закрываться. Кто что об этом думает? Сторонние парсеры мало интересуют, нужен стандартный для любой винды инструмент.
Вопрос 2: Стоит ли использовать для таких случаев ActiveX IE? Если мне нужен только исходный код страницы, не начнет ли ишачок мне загружать все подряд что в странице прописано?
-
> В интернете ходят слухи что он подавится HTML-кой потому > что там нет строгих правил как в XML, т.е. теги могут не > закрываться.
правильно. html <> xml, поэтому парсить html xml-парсером невозможно.
-
Хорошо. Какие будут предложения? И что на счет второго вопроса?
-
> И что на счет второго вопроса?
без понятия. я парсингом хтмля на дельфи не занимался.
-
|