Конференция "Сети" » Page Rank [D7, WinXP]
 
  • Pirog (22.08.09 22:43) [0]
    Нужно из программы подключиться к данному сервису Google, а не к сайтам-посредникам предоставляющим данную услугу. Подскажите пожалуйста адрес, протокол, технологию...куда вообще подключаться, как работать?
  • Infarkt © (22.08.09 23:18) [1]
    Что это за сервис такой?? И что за сайты-посредники?

    Google PageRank (от Larry Page Rank) (иногда просто PR) — алгоритм расчёта авторитетности страницы, используемый поисковой системой Google.
    Wiki.
  • Pirog (22.08.09 23:37) [2]

    > Infarkt ©   (22.08.09 23:18) [1]
    >
    > Что это за сервис такой?? И что за сайты-посредники?

    посредники это те которые используют скрипты подсчета с другого сервиса, а не сами считающие странички.....
    это те кто считает, сервисы подсчета PR. Зачем мне обсчитывать каждый сайт, если можно обратится к основателю подсчета PR сервису гугла. Не хочу вот я считать 1000 страничек в проге :-)
  • Pirog (23.08.09 15:30) [3]
    Ещё вопрос по теме: как подсчитать для PR контрольную сумму URL ?
  • Rouse_ © (23.08.09 15:34) [4]
  • Pirog (23.08.09 16:32) [5]

    > Rouse_ ©   (23.08.09 15:34) [4]
    >
    > http://rouse.drkb.ru/network.php#fwpagerank


    спасибо! наверное когда то робило.....будем разбираться
  • Pirog (23.08.09 20:06) [6]

    > Rouse_ ©   (23.08.09 15:34) [4]


    Поодскажите пожалуйста откуда берутся значения для:

    GOOGLE_MAGIC = $E6359A60; // 0xE6359A60

     A := $9E3779B9;        // 0x9E3779B9
     B := $9E3779B9;
  • Rouse_ © (24.08.09 15:37) [7]

    > Поодскажите пожалуйста откуда берутся значения для:

    Когда я писал этот компонент мне пришлось реверсить плагин для IE, называемый GoogleToolbar - вот оттуда и выдрал.
  • Rouse_ © (24.08.09 15:44) [8]

    > спасибо! наверное когда то робило

    Кстати проверил - данный код отлично работает и по сей день :)
  • indahouse (29.08.09 21:53) [9]
    Нет, не работает. Точнее - не всегда. Более чем в половине случаев возвращает -1. По факту - 403 от гугля, что часто бывает следствием нехорошей чексуммы.
  • Ruzzz (31.08.09 11:38) [10]
    Rouse_ огромное спасибо за вашу работу :) Я немного подредактировал ваш файл, постарался немного оптимизировать и сделать "красивей", вот код http://dumpz.org/11931/

    По поводу того что говорил indahouse, иногда действительно не получается получить ответ от гугла, и как мне кажется что ошибка может быть начиная с 233-ой строки (см. ссылку), т.е. там где идет обработки последних символов. Вполне возможно что неправильно обрабатываются строки некоторой длины.
  • Ruzzz (31.08.09 12:02) [11]
    Хотя, для тех сайтов, для которых получается -1 пробовал убирать http:// чтобы изменить длину, все равно текст приходит пустой. Нужно посмотреть есть ли зависимость у таких сайтов от остатка от деления на 12
  • Rouse_ © (31.08.09 16:42) [12]

    > Нет, не работает

    Примеры плохих адресов на которых "не всегда работает" в студию.


    > что часто бывает следствием нехорошей чексуммы.

    Она либо правильная либо нет - третьего не дано :)


    > Хотя, для тех сайтов, для которых получается -1 пробовал
    > убирать http:// чтобы изменить длину, все равно текст приходит
    > пустой

    Это не нужно, там все это автоматом делается. Проблема может быть в другом, если в программе включен RangeCheckError то может быть неверный рассчет из-за переполнения, ибо для демок я в этом плане никогда код (ну по крайней мере в 2006-ом году) не причесывал :)
  • Andrews (12.11.09 12:17) [13]
    Повально не работают те адреса, в которых встречается амперсанд, например www.europortal-str.ru/index.php?m=3&sid=&id=9

    у этой страницы pr=1 (проверил по prchecker.info)

    получаем же -1.
  • Rouse_ © (15.11.09 18:52) [14]

    > Andrews   (12.11.09 12:17) [13]
    >
    > Повально не работают те адреса, в которых встречается амперсанд

    Понял - разберусь.
  • имя (26.11.09 15:40) [15]
    Удалено модератором
 
Конференция "Сети" » Page Rank [D7, WinXP]
Есть новые Нет новых   [134439   +32][b:0][p:0.001]