PHP DM Gate v0.9 » "Вытаскивание" нужной информации из HTML-страницы. <span class="vd">[D7, WinXP]</span>

PeSmaker © (26.08.10 17:20) [0]

Подскажите, пожалуйста, как вытащить нужную информацию из Интернета. Лучше бы не через idHTTP. Заранее благодарен.

<Цитата>
Медвежонок Пятачок © (26.08.10 17:27) [1]

а при чем здесь вообще идшттп, если вопрос про вынимание инфы из страницы?
вопрос подразумевает что страница уже есть и дело только за выниманием.
в противном случае вопрос задан неверно.

<Цитата>
PeSmaker © (26.08.10 17:32) [2]

Медвежонок Пятачок, мне нужно взять информацию из страницы в интернете,а не из страницы, которая находится на компе. Хотя, страницу можно программно сохранить на комп, а потом вынимать оттуда инфу =)
Мне в принципе все-равно, пожалуйста, подскажите, что делать в случае, когда дело только за выниманием =)

<Цитата>
Dennis I. Komarov © (26.08.10 17:41) [3]

> взять информацию из страницы в интернете,а не из страницы,
> которая находится на компе.

А в чем принципиальная разница?

> подскажите, что делать в случае, когда дело только за выниманием

Взять страницу, найти в ней нужную инфу, вынуть

З.Ы.
Страницы разные бывают, и инфа тоже...

<Цитата>
Медвежонок Пятачок © (26.08.10 17:42) [4]

мне нужно взять информацию из страницы в интернете,а не из страницы, которая находится на компе

значит у тебя нет страницы.
и вопрос о вынимании инфы из нее вообще не стоит.

<Цитата>
PeSmaker © (26.08.10 17:43) [5]

Медвежонок Пятачок, если для тебя не стоит, то подскажи как это делать...пожалуйста....

<Цитата>
PeSmaker © (26.08.10 17:45) [6]

Dennis I. Komarov, что ты имеешь ввиду... как программно ее найти и вынуть

<Цитата>
Dennis I. Komarov © (26.08.10 17:46) [7]

> PeSmaker © (26.08.10 17:45) [6]

Читай ЗЫ

<Цитата>
PeSmaker © (26.08.10 17:48) [8]

Dennis I. Komarov, давай я скину страницу, и что из нее нужно вынуть!!!

<Цитата>
PeSmaker © (26.08.10 17:50) [9]

страница: http://ua.oriflame.com/recruits/
нужно вынуть:
внизу номер и действие каталога, в нашем случае:
КАТАЛОГ 11
8/8/2010 - 28/8/2010

ЗЫ:
и желательно картинку каталога =)

<Цитата>
Медвежонок Пятачок © (26.08.10 17:53) [10]

Медвежонок Пятачок, если для тебя не стоит, то подскажи как это делать...пожалуйста....

Вынуть что-то можно только из того, что уже находится в оперативной памяти твоего компа.

<Цитата>
PeSmaker © (26.08.10 17:54) [11]

Медвежонок Пятачок, тут ты не прав...

<Цитата>
Медвежонок Пятачок © (26.08.10 18:01) [12]

Я прав.
Читаем исходный вопрос:

Вытаскивание" нужной информации из HTML-страницы

Так вот, "вынуть инфу из с страницы" если она не в памяти твоего компа нельзя.

<Цитата>
PeSmaker © (26.08.10 18:04) [13]

Мне лучше помогите как вынуть инфу,а не умничать.......

<Цитата>
Anatoly Podgoretsky © (26.08.10 19:01) [14]

> PeSmaker (26.08.2010 17:20:00) [0]

:Если начинать с такого уровня, то придется писать маленькую книгу.

<Цитата>
app © (26.08.10 19:05) [15]

> PeSmaker (26.08.2010 18:04:13) [13]

Повежливее.

<Цитата>
Плохиш © (26.08.10 21:44) [16]

> PeSmaker © (26.08.10 17:20)

TWebBrowser

<Цитата>
0x00FF00 © (26.08.10 23:04) [17]

здесь можно обойтись вообще без Delphi:
$ wget -qO- http://ua.oriflame.com/recruits/ | grep -A1 Каталог | sed s/.*\<img\ src=\"\\$.*\\$.jpg.*/http:\\/\\/ua.oriflame.com\\1.jpg/\;s/.*\<span\ id.*\>\\$.*\\$\<\\/span\>.*/\\1/

http://ua.oriflame.com/catalog-images/brochure/uk_UA/201011/93E2C8951ECF4A8222DA2EF3C1AE91F60715D9C4/1_s.jpg

--
Каталог 11
8/8/2010 - 28/8/2010

ArchLinux 2.6.35

<Цитата>
stas © (27.08.10 11:45) [18]

PeSmaker © (26.08.10 18:04) [13]
1. Как закачать страницу в переменную string разобрался?
2. Смотри RegExpr (регулярные выражения) скачать можно бесплатно.

<Цитата>
Sapersky (27.08.10 14:08) [19]

Лучше бы не через idHTTP

Можно через Synapse, httpsend.pas -> HttpGetText.
Поиск нужной строки - можно регулярками, можно просто StrPos. Какую именно строку искать - открой страницу текстовым редактором и ищи некое уникальное выражение рядом с "Каталог 11", которого нет в другом месте страницы. Для надёжности можно несколько строк искать... регулярки, как я понимаю, как раз для этого и предназначены. Картинка - выдёргиваешь ссылку рядом с "Каталог 11" и закачиваешь HttpGetBinary.

<Цитата>