Конференция "Начинающим" » "Вытаскивание" нужной информации из HTML-страницы. [D7, WinXP]
 
  • PeSmaker © (26.08.10 17:20) [0]
    Подскажите, пожалуйста, как вытащить нужную информацию из Интернета. Лучше бы не через idHTTP. Заранее благодарен.
  • Медвежонок Пятачок © (26.08.10 17:27) [1]
    а при чем здесь вообще идшттп, если вопрос про вынимание инфы из страницы?
    вопрос подразумевает что страница уже есть и дело только за выниманием.
    в противном случае вопрос задан неверно.
  • PeSmaker © (26.08.10 17:32) [2]
    Медвежонок Пятачок, мне нужно взять информацию из страницы в интернете,а не из страницы, которая находится на компе. Хотя, страницу можно программно сохранить на комп, а потом вынимать оттуда инфу =)
    Мне в принципе все-равно, пожалуйста, подскажите, что делать в случае, когда дело только за выниманием =)
  • Dennis I. Komarov © (26.08.10 17:41) [3]

    > взять информацию из страницы в интернете,а не из страницы,
    >  которая находится на компе.

    А в чем принципиальная разница?

    > подскажите, что делать в случае, когда дело только за выниманием

    Взять страницу, найти в ней нужную инфу, вынуть

    З.Ы.
     Страницы разные бывают, и инфа тоже...
  • Медвежонок Пятачок © (26.08.10 17:42) [4]
    мне нужно взять информацию из страницы в интернете,а не из страницы, которая находится на компе

    значит у тебя нет страницы.
    и вопрос о вынимании инфы из нее вообще не стоит.
  • PeSmaker © (26.08.10 17:43) [5]
    Медвежонок Пятачок, если для тебя не стоит, то подскажи как это делать...пожалуйста....
  • PeSmaker © (26.08.10 17:45) [6]
    Dennis I. Komarov, что ты имеешь ввиду... как программно ее найти и вынуть
  • Dennis I. Komarov © (26.08.10 17:46) [7]

    > PeSmaker ©   (26.08.10 17:45) [6]

    Читай ЗЫ
  • PeSmaker © (26.08.10 17:48) [8]
    Dennis I. Komarov, давай я скину страницу, и что из нее нужно вынуть!!!
  • PeSmaker © (26.08.10 17:50) [9]
    страница: http://ua.oriflame.com/recruits/
    нужно вынуть:
    внизу номер и действие каталога, в нашем случае:
    КАТАЛОГ 11
    8/8/2010 - 28/8/2010

    ЗЫ:
    и желательно картинку каталога =)
  • Медвежонок Пятачок © (26.08.10 17:53) [10]
    Медвежонок Пятачок, если для тебя не стоит, то подскажи как это делать...пожалуйста....

    Вынуть что-то можно только из того, что уже находится в оперативной памяти твоего компа.
  • PeSmaker © (26.08.10 17:54) [11]
    Медвежонок Пятачок, тут ты не прав...
  • Медвежонок Пятачок © (26.08.10 18:01) [12]
    Я прав.
    Читаем исходный вопрос:

    Вытаскивание" нужной информации из HTML-страницы

    Так вот, "вынуть инфу из с страницы" если она не в памяти твоего  компа нельзя.
  • PeSmaker © (26.08.10 18:04) [13]
    Мне лучше помогите как вынуть инфу,а не умничать.......
  • Anatoly Podgoretsky © (26.08.10 19:01) [14]
    > PeSmaker  (26.08.2010 17:20:00)  [0]

    :Если начинать с такого уровня, то придется писать маленькую книгу.
  • app © (26.08.10 19:05) [15]
    > PeSmaker  (26.08.2010 18:04:13)  [13]

    Повежливее.
  • Плохиш © (26.08.10 21:44) [16]

    > PeSmaker ©   (26.08.10 17:20)  

    TWebBrowser
  • 0x00FF00 © (26.08.10 23:04) [17]
    здесь можно обойтись вообще без Delphi:
    $ wget -qO- http://ua.oriflame.com/recruits/ | grep -A1 Каталог | sed s/.*\<img\ src=\"\\\(.*\\\).jpg.*/http:\\/\\/ua.oriflame.com\\1.jpg/\;s/.*\<span\ id.*\>\\\(.*\\\)\<\\/span\>.*/\\1/

    http://ua.oriflame.com/catalog-images/brochure/uk_UA/201011/93E2C8951ECF4A8222DA2EF3C1AE91F60715D9C4/1_s.jpg

    --
    Каталог 11
    8/8/2010 - 28/8/2010



    ArchLinux 2.6.35
  • stas © (27.08.10 11:45) [18]
    PeSmaker ©   (26.08.10 18:04) [13]
    1. Как закачать страницу в переменную string разобрался?
    2. Смотри RegExpr (регулярные выражения) скачать можно бесплатно.
  • Sapersky (27.08.10 14:08) [19]
    Лучше бы не через idHTTP

    Можно через Synapse, httpsend.pas -> HttpGetText.
    Поиск нужной строки - можно регулярками, можно просто StrPos. Какую именно строку искать - открой страницу текстовым редактором и ищи некое уникальное выражение рядом с "Каталог 11", которого нет в другом месте страницы. Для надёжности можно несколько строк искать... регулярки, как я понимаю, как раз для этого и предназначены. Картинка - выдёргиваешь ссылку рядом с "Каталог 11" и закачиваешь HttpGetBinary.
 
Конференция "Начинающим" » "Вытаскивание" нужной информации из HTML-страницы. [D7, WinXP]
Есть новые Нет новых   [134437   +29][b:0][p:0.001]