Зачем PPS-системы выдают свои фиды не в стандартном XML

Расширенный поиск по форуму

Новая тема

Страницы: 12 >последняя »

Автор

Поиск в теме:

Waylon Smithers

+ + +

С нами с 18.12.04
Сообщения: 88
Рейтинг: 24

Добавлено: 03/03/05 в 00:12

цитата

Зачем PPS-системы выдают свои фиды не в стандартном XML, который парсить станндартными инструментами, а сочиняют каждый свое программистское счастье?

Sterx

programmer

С нами с 08.12.02
Сообщения: 7615
Рейтинг: 5760

Добавлено: 03/03/05 в 00:15

цитата

наверное, потому что не все родились программерами

крипта на ByBit

Vaio

Начальник Чукотки

С нами с 16.07.02
Сообщения: 998
Рейтинг: 413

Добавлено: 03/03/05 в 00:21

цитата

I have a dream...

С нами с 26.06.04
Сообщения: 1033
Рейтинг: 303

Добавлено: 03/03/05 в 00:32

цитата

Sterx писал:

наверное, потому что не все родились программерами

5 балов

Добавьте места в сигнатуре!

arachnO

no sign

С нами с 25.07.03
Сообщения: 3623
Рейтинг: 1403

Добавлено: 03/03/05 в 14:49

цитата

Sterx писал:

наверное, потому что не все родились программерами

skype:megaarachno

Vad

С нами с 18.05.00
Сообщения: 4988
Рейтинг: 881

Добавлено: 03/03/05 в 15:25

цитата

программистами не рождаются - это последствия родовой травмы

arachnO

no sign

С нами с 25.07.03
Сообщения: 3623
Рейтинг: 1403

Добавлено: 03/03/05 в 15:45

цитата

ну спасибо Вад

skype:megaarachno

Xrenoder

Cкриптоманьяк

С нами с 14.09.00
Сообщения: 1181
Рейтинг: 245

Добавлено: 03/03/05 в 16:22

цитата

Потому что
1. На большом трафе надо заботиться не о "стандартных средствах", а о меньшей нагрузке.
2. О средствах парсинга фида заботиться вообще не надо, поскольку скрипт парсинга поставляется вместе с фидом.
3. Парсить массив данных с разделителями проще, чем парсить xml

Таким образом, применение xml-фида я лично считаю совершенно неоправданым и излишним в данном случае.

Dr.Syshalt

Чингачгук, вождь красноглазых

С нами с 14.05.04
Сообщения: 4744
Рейтинг: 1824

Добавлено: 03/03/05 в 17:23

цитата

Xrenoder писал:

1. Какая разница в смысле нагрузки на сервер в том, в каком формате идут выдаваемые данные? Ты всего лишь делаешь некий запрос к базе, форматируешь то, что она выдает и выплевываешь результат клиенту. Кода написано уже столько для XML, что выдумывать ничего нового не надо - причем не только на php/perl, но и на куда более шустрых языках.
2. А если стандартный кого не устраивает? В том и плюс xml, что ты получаешь данные в стандартных форматах и сам решаешь, как ты их будешь обрабатывать.
3. А это кому как

Если у тебя, к примеру, в данных попадаются символы разделителя, которые тебе приходися экранировать - то задача становится менее тривиальной, чем простой split(). Ну, у perl'а всяких модулей полно - а если не на perl писать? Вообще можно и варианты на выбор предоставлять, это ж всего лишь фронт-енд к данным

unimaximus

Монстр

С нами с 16.10.02
Сообщения: 1052
Рейтинг: 198

Добавлено: 03/03/05 в 17:35

цитата

Хреновелосипедостроитель

)))

XML технологии рулят.

Sams

Best4U.Biz

С нами с 21.02.04
Сообщения: 1252
Рейтинг: 1441

Добавлено: 03/03/05 в 17:37

цитата

Тпру....

А кто это не дает XML ?
Умакс
MakeThemCry
Ренго
Клик
точно дают.

Кто НЕ дает ?

PPC - не думай о конвертации | Pay Per Lead/Action - то, во что эволюционируют ППС | лучший хостинг

arachnO

no sign

С нами с 25.07.03
Сообщения: 3623
Рейтинг: 1403

Добавлено: 03/03/05 в 17:41

цитата

SEP по дефолту по-моему отдает в тексте а не в XML
правда я юзаю все равно выдачу в формате Уни

skype:megaarachno

begemot

С нами с 25.12.03
Сообщения: 1003
Рейтинг: 462

Добавлено: 04/03/05 в 01:24

цитата

Xrenoder писал:

Потому что
1. На большом трафе надо заботиться не о "стандартных средствах", а о меньшей нагрузке.
2. О средствах парсинга фида заботиться вообще не надо, поскольку скрипт парсинга поставляется вместе с фидом.
3. Парсить массив данных с разделителями проще, чем парсить xml
Таким образом, применение xml-фида я лично считаю совершенно неоправданым и излишним в данном случае.

солидарен,
парсинг XML, и вообще парсинг, забирает уйму ресурсов,
кроме того использование XML для результатов поиска это перебор.

Sutra - лучшая система управления трафом

arachnO

no sign

С нами с 25.07.03
Сообщения: 3623
Рейтинг: 1403

Добавлено: 04/03/05 в 11:00

цитата

begemot, не нравится стандартный парсер XML для php/perl (да, не спорю, он не быстрый) - кто тебе мешает парсить фид регулярками стандартными?

skype:megaarachno

begemot

С нами с 25.12.03
Сообщения: 1003
Рейтинг: 462

Добавлено: 04/03/05 в 11:58

цитата

мешает отсутствие дурки в голове

и надеюсь всегда будет мешать

ps: как вообще может возникать такой вопрос ?

Sutra - лучшая система управления трафом

Sams

Best4U.Biz

С нами с 21.02.04
Сообщения: 1252
Рейтинг: 1441

Добавлено: 04/03/05 в 12:15

цитата

begemot писал:

Хех... С чего начали, и чем закончили... %)

Не нравится XML - так текстовый фид (тот, что "с разделителями") тоже у многих есть.

Да и вобще, чего вы паритесь ? Сколько надо поисков, что-бы парсинг дал заметную нагрузку ? Даже при самой дубовй реализации - сколько их надо что-бы загрузить плохонький дедик (цел2000/1гиг/..) ? И сколько это принесет ? Чесслово, стоимость дедика, в этой сумме, просто не заметна.

PPC - не думай о конвертации | Pay Per Lead/Action - то, во что эволюционируют ППС | лучший хостинг

С нами с 26.06.04
Сообщения: 1033
Рейтинг: 303

Добавлено: 04/03/05 в 12:40

цитата

Sams: 200-300к серчей убьет твой целерон в считанные минуты....

Добавьте места в сигнатуре!

Sams

Best4U.Biz

С нами с 21.02.04
Сообщения: 1252
Рейтинг: 1441

Добавлено: 04/03/05 в 13:49

цитата

DE писал:

Sams: 200-300к серчей убьет твой целерон в считанные минуты....

Ну давай посчитаем... 200к серчей~=20к кликов~=(при самом дерьмовом раскладе) 0.03*20000=$600 в день=$18000 в месяц, или (при нормальном) 0.2*20000=$4000 в день, = $120000 в мес. Так ? И ты хочешь сказать, что для разделения нагрузки тебе будет "слишком дорого" взять 2-ой сервак (за 100-300 баков) ? Так стоит-ли изгаляться с нестандартными фидами/скриптами, постоянно их правя, доделывая и т.д. (потому как х.з. что захочется вписать в титл или деск очередному рекламодателю, или какая новыя фичи/даныые появятся в фиде) ради уменьшения затрат максимум на 1% ?

И потом, это как-же надо писать что-бы именно парсинг (а не запрос фида, обработка реврайтов и дени, ...) давал бОльшую нагрузку ?

PPC - не думай о конвертации | Pay Per Lead/Action - то, во что эволюционируют ППС | лучший хостинг

bog

пенсионер

С нами с 07.11.02
Сообщения: 2612
Рейтинг: 1166

Добавлено: 04/03/05 в 15:16

цитата

Как минимум могу привести 4 момента:
1. Sams, нагрузка на сервер в течении дня неравномерная. А еще чаще, бывают ситуации, когда придут к тебе на сервер несколько ботов одновременно, сделают сотню реквестов в секунду и считай что сдох сервак. Так что бывает что даже незначительная экономия ресурсов оказывается критичной для работы сервера.

2. ХМЛ - это жесткий стандарт чуствительный к ошибкам. В случае если по каким-то причинам ХМЛ файл не загрузился до конца, или в нем есть ошибки ты не получишь результатов вообще.

3. Сам стандарт ХМЛ подразумевает что для передачи любой информации потребуется создание файла раза в 3 большего чем сам обьем передаваемой полезной информации. Т.е. считай твой сервак, и сервак который отдает фид жрет в 3 раза больше трафа чем надо.

4. Когда я делал автофид, столкнулся с тем, что на многих крупных хостинг компаниях по дефолту ХМЛ не поддерживается, т.е. надо или пересобирать РНР (невсем доступно) или делать собственный парсер (а в чем тогда смысл ? ;)). Кстати фиды некоторых РРС, построенные на стандартных функциях ХМЛ - на таких серваках не работают вообще.

Остальное вроде сказали уже

Здесь ищу и даю работу^так делаю деньги
тут читаю инфу^веду блог, а вы?

Sams

Best4U.Biz

С нами с 21.02.04
Сообщения: 1252
Рейтинг: 1441

Добавлено: 04/03/05 в 15:48

цитата

bog писал:

При большой нагрузке именно от ботов, для них лучше держать "закешированный" ответ (с измененными клик-линками, чтоб правил не нарушать). Это дает еще и несколько плюсов (в т.ч. по деньгам).

bog писал:

2. ХМЛ - это жесткий стандарт чуствительный к ошибкам. В случае если по каким-то причинам ХМЛ файл не загрузился до конца, или в нем есть ошибки ты не получишь результатов вообще.

Это как-бы да. Хотя ... а зачем мне результат с ошибками ?

bog писал:

3. Сам стандарт ХМЛ подразумевает что для передачи любой информации потребуется создание файла раза в 3 большего чем сам обьем передаваемой полезной информации. Т.е. считай твой сервак, и сервак который отдает фид жрет в 3 раза больше трафа чем надо.

И сколько того трафу ? Выдача морды фида (особенно если с графикой) сьедает в разы больше. (А твой "автофид" просто умножает этот траф на кол-во ППС ;) Но т.к. это окупается, видимо, более высокими бидами - ни кто на это не жалуется. Так ? )

bog писал:

4. Когда я делал автофид, столкнулся с тем, что на многих крупных хостинг компаниях по дефолту ХМЛ не поддерживается, т.е. надо или пересобирать РНР (невсем доступно) или делать собственный парсер (а в чем тогда смысл ? ;)). Кстати фиды некоторых РРС, построенные на стандартных функциях ХМЛ - на таких серваках не работают вообще.

Хм.. Возможно. Хотя лично я еще не встречал таких хостингов.

PPC - не думай о конвертации | Pay Per Lead/Action - то, во что эволюционируют ППС | лучший хостинг

Paxan

С нами с 22.12.99
Сообщения: 681
Рейтинг: 168

Добавлено: 04/03/05 в 16:49

цитата

Цитата:

И сколько того трафу ? Выдача морды фида (особенно если с графикой) сьедает в разы больше.

у нас на одном из сервачков, под фидом, входящий трафик практически равен исходящему, разница в 15%

Не продается

Dr.Syshalt

Чингачгук, вождь красноглазых

С нами с 14.05.04
Сообщения: 4744
Рейтинг: 1824

Добавлено: 04/03/05 в 21:15

цитата

bog писал:

И вот ведь что интересно - убьют сервак не слайсы CPU, поеденные выдачей XML или CSV (без разницы) - убьет его количество запросов к базе :) Диск-то по определению на многие порядки медленнее CPU/памяти. То есть вообще-то это решается созданием connection pool с ограниченным количеством коннекций к базе, кэшированием результатов, и т.п. - немножко на другом уровне. При чем тут XML vs CSV?

bleed

С нами с 19.02.03
Сообщения: 1284
Рейтинг: 354

Добавлено: 04/03/05 в 22:04

цитата

Вставлю свои пять копеек:
по моему опыту разборки различных фидов мне проще было всегда там где нет xml а был простой CSV, считаю что CSV обработать проще, быстрее и ресурсов это заберет меньше.
Хотя каждому свое, потому лучше было бы если предлагали 2 вида на любителя xml & csv.
А по поводу трафика, это да xml фид ест его в несколько раз больше чем хотелось бы...

Stek

www.phpdevs.com

С нами с 24.10.02
Сообщения: 16633
Рейтинг: 16105

Добавлено: 04/03/05 в 22:26

цитата

фиды - не та область где необходим xml . csv файл распарсить гораздо быстрее, + съкономленный траффик.
А потом не надо забывать, что xml парсеры сами по себе так же требуют память.

Пишу на php/mysql/django за вменяемые деньги.
Обращаться в личку.

bog

пенсионер

С нами с 07.11.02
Сообщения: 2612
Рейтинг: 1166

Добавлено: 05/03/05 в 15:54

цитата

Dr.Syshalt писал:

И вот ведь что интересно - убьют сервак не слайсы CPU, поеденные выдачей XML или CSV (без разницы) - убьет его количество запросов к базе

Э... это вы о чем вообще ?

Во первых я говорю о конечных вебмастерах.
Во вторых, ты думаешь что кто то из РРС с которыми ты работаешь берет результаты из своей базы ? ;)
Так я тебя разочарую, все они так же являются просто реселерами более крупных РРС, и соответственно также получают от них фид. (кстати в xml\wsl формате. Который крупные РРС используют не потому что это лучше, а потому что это стандарт индустрии, и есть стандартные кроссплатформенные решения для его обработки).

Sams писал:

1. как отличить бота от пользователя ;) боты они знаешь ли разные бывают, а не только с юзерагентом гуглбот

2. в стандартных скриптах такие возможности не предусматриваются, так что о чем речь ? А то если теоретизировать, то можно все данные гзипом упаковывать, а вместо ХМЛ\КСВ использовать унсилирайзед файл, который даже и парсить не надо. Скрипт получит готовый массив для вывода.

Sams писал:

а зачем мне результат с ошибками ?

Ты тож немного не понял, результаты были бы без ошибки, просто если где то вдруг появиться лишний перевод строки, или ни дай бог из 2048 байтов в файле, сервер успел считать только 2047 - то стандартные ХМЛ парсеры выдают ошибку и 0 результатов.
КСВ выведет столько результатов - сколько успело нормально считаться. Можешь посмотреть на форумах как часто у людей результаты не показываются при использовании ХМЛ фидов, и немного подумать почему такое происходит.

В теории можно много рассуждать о том что проще\удобнее\быстрее, и конечно многие теоретические програмеры будут двумя руками за ХМЛ, но на практике, когда у вас будет реально большое кол-во трафика и большая нагрузка на сервер, то вы будете думать не о удобстве, а о скорости, надежности и ресурсоемкости. А хмл с этой точки зрения - отстой.

Здесь ищу и даю работу^так делаю деньги
тут читаю инфу^веду блог, а вы?

Новая тема

Страницы: 12 >последняя »

Текстовая реклама в форме ответа
Заголовок и до четырех строчек текста
Длина текста до 350 символов
Купить рекламу в этом месте!

Перейти:

Спонсор раздела

Зачем PPS-системы выдают свои фиды не в стандартном XML

Опросы