С нами с 18.12.11
Сообщения: 75
Рейтинг: 5
|
Добавлено: 07/09/12 в 18:42 |
Напоминаю, запись на обучение заканчивается 10 сентября!
|
|
|
|
С нами с 20.01.03
Сообщения: 18003
Рейтинг: 9760
|
Добавлено: 07/09/12 в 22:48 |
FXIX писал: | схуяли. нихуя подобного.
вообще за километр рядом не стояло такое. утверждения такие. |
мое имхо, куда хочу туда и ставлю
|
|
|
|
С нами с 20.01.03
Сообщения: 18003
Рейтинг: 9760
|
Добавлено: 07/09/12 в 22:51 |
xDiver писал: | а чем это предложение отличается от "пхп шаг за шагом" ?
на мой взгляд тоже самое, просто в удобной для меня форме и за цену, которую не жалко будет потерять |
сравнение я не приводил, это к тому, что имея начальную базу научиться не проблема, а как это уже не столь важно
|
|
|
|
Люблю то, что делаю!
С нами с 22.10.06
Сообщения: 5053
Рейтинг: 4418
|
Добавлено: 08/09/12 в 10:06 |
а чего такой разброс по времени:
Запись на курс обучения проводится до 10 сентября 2012
Обучение начнется с 20 сентября
кстати в последнем год не указан
а по существу интересное предложение.
Знания лишнии не будут.
|
|
|
|
С нами с 18.12.11
Сообщения: 75
Рейтинг: 5
|
Добавлено: 08/09/12 в 10:35 |
Lexikon писал: | а чего такой разброс по времени:
Запись на курс обучения проводится до 10 сентября 2012
Обучение начнется с 20 сентября
кстати в последнем год не указан
а по существу интересное предложение.
Знания лишнии не будут. |
Обучение начнется с 20 сентября 2012 года.
запись до 10 потому что если кто-то не успел оплатить, чтобы успел, а доступ на форум будет давать за несколько дней до 20.
|
|
|
|
Уставший AWM
С нами с 04.01.07
Сообщения: 1702
Рейтинг: 1233
|
Добавлено: 08/09/12 в 17:09 |
Записался, посмотрим
|
|
|
|
С нами с 18.12.11
Сообщения: 75
Рейтинг: 5
|
Добавлено: 10/09/12 в 10:50 |
Запись на обучение продлена до 15 сентября.
|
|
|
|
С нами с 18.12.11
Сообщения: 75
Рейтинг: 5
|
Добавлено: 13/09/12 в 10:48 |
Записывайтесь! Осталось 3 дня до окончания набора на курс обучения.
|
|
|
|
Турбо Cуслик со стажем
С нами с 27.03.08
Сообщения: 4069
Рейтинг: 447
|
Добавлено: 13/09/12 в 19:36 |
Оффтопик: типа дедлайн организовал, люблю технарей такие упыри по жизни. Щас ты в итоге не продавец не технать так блять друг джейсона.
|
|
Время всех ставит на место! растопчет и разотрет в порошок. доказано и не раз :)
|
3
|
|
|
red apple
С нами с 23.06.09
Сообщения: 2216
Рейтинг: 2999
|
Добавлено: 14/09/12 в 21:37 |
Оффтопик: Учение Свет!
|
|
|
|
programmer
С нами с 08.12.02
Сообщения: 7614
Рейтинг: 5760
|
Добавлено: 14/09/12 в 22:02 |
ТС заставь их регулярки учить. ну что за парсер без регулярок
|
|
|
|
С нами с 18.12.11
Сообщения: 75
Рейтинг: 5
|
Добавлено: 15/09/12 в 06:39 |
Будет обучение регуляркам.
|
|
|
|
Добрых Дел Мастер
С нами с 03.05.08
Сообщения: 3143
Рейтинг: 1227
|
Добавлено: 15/09/12 в 09:43 |
Sterx писал: | ТС заставь их регулярки учить. ну что за парсер без регулярок |
в 19 веке висим?
последний раз регулярки в парсерах видел лет 5 назад
|
|
пришел к победе коммунистического труда
|
0
|
|
|
С нами с 20.01.03
Сообщения: 18003
Рейтинг: 9760
|
Добавлено: 15/09/12 в 10:49 |
FXIX писал: | последний раз регулярки в парсерах видел лет 5 назад |
а щас как парсеры работают??
|
|
|
|
Добрых Дел Мастер
С нами с 03.05.08
Сообщения: 3143
Рейтинг: 1227
|
Добавлено: 15/09/12 в 11:13 |
SAV писал: | а щас как парсеры работают?? |
http://code.google.com/p/phpquery/
http://querypath.org/
http://simplehtmldom.sourceforge.net/
по крайней мере в той части работы парсера, которая требует задачи типа: получить определенный тег\получить определенные теги\получить теги по class или id или параметру\получить теги по местоположению\получить любые параметры у тега\присвоить любым параметрам любые значения у тега.
первая либа работает с валидным кодом. пытается приводить невалидную верстку к валидной. но лучше через tidy сначала прогонять. tidy это универсальный валидатор, для html, css. там куча настроек итд, он сам по себе может неплохо подготавливать и чистить.
вторая либа больше для генерации верстки. не парсить а создавать и менять. вот для этого.
третья либа самая зачетная. старая. жрет все. работает корректно.
вот лучше про это рассказать. как действительно парсить. А не про это дерьмо preg_match("~<p class=""class1>(.*?)</p>~isu", $subject, $matches) ...
|
|
пришел к победе коммунистического труда
|
1
|
|
|
Турбо Cуслик со стажем
С нами с 27.03.08
Сообщения: 4069
Рейтинг: 447
|
Добавлено: 15/09/12 в 15:26 |
SAV писал: | а щас как парсеры работают?? |
Вот так:
Zenno
стоимость 1 потока Lite версии всего 45$, подешевле данного курса, зато сколько преимуществ, что включено , Автоматический пробив капчей:
виды пробиваемых капчей
Потратив всего несколько минут вы поймете основные принципы работы программы. Уже через пару дней на вашем компьютере будут десятки сделанных вами регеров, парсеров, постеров, аплоадеров, социальных закладочников и многое, многое другое!
встроеный язык програмиирования PHP, можеет вобще все: от регистрации аков до спама куда хочеш. Главное знать чего хочеш При этом не обязательно особо уметь программировать.
zenno + Xrum УТВЕРЖДАЮ зе бест для дорвейщика!
|
|
Время всех ставит на место! растопчет и разотрет в порошок. доказано и не раз :)
|
0
|
|
|
С нами с 29.11.07
Сообщения: 91
Рейтинг: 56
|
Добавлено: 15/09/12 в 20:15 |
Для простого php парсера http://simplehtmldom.sourceforge.net/ самое что ни на есть оно Если уж и приходится пользоваться регулярками, то лучше завернуть в библиотечные функции, которые будут лично понятны, и пользоваться в дальнейшем именно ими.
Зенно и прочие программные броузеры использовать только если на странице нужны выпарсить DOM, которые генерируется сложным яваскриптом. Если речь идет о простом статическом сайте, то обычный парсер будет работать намного быстрее.
Ну и да. Не забывайте про python и perl. Будет вам нормальная многопоточность.
|
|
|
|
programmer
С нами с 08.12.02
Сообщения: 7614
Рейтинг: 5760
|
Добавлено: 15/09/12 в 21:55 |
FXIX писал: | А не про это дерьмо preg_match("~<p class=""class1>(.*?)</p>~isu", $subject, $matches) ... |
ну ну
|
|
|
|
Добрых Дел Мастер
С нами с 03.05.08
Сообщения: 3143
Рейтинг: 1227
|
Добавлено: 15/09/12 в 22:07 |
Sterx писал: | ну ну |
как там эта фраза, не помню точно. но слышал раз 10 от разных людей. "если тебе в коде понадобилась регулярка - ты что-то делаешь неправильно".
|
|
пришел к победе коммунистического труда
|
0
|
|
|
programmer
С нами с 08.12.02
Сообщения: 7614
Рейтинг: 5760
|
Добавлено: 15/09/12 в 22:22 |
ага, слушай. а еще программь больше. больше 5 лет. лет 8 например
|
|
|
|
Добрых Дел Мастер
С нами с 03.05.08
Сообщения: 3143
Рейтинг: 1227
|
Добавлено: 15/09/12 в 22:42 |
я слышал от тех кто 10 лет программит.
давай примеры. необходимости regexp-регулярок в деле парсинга html-тегов\параметров с html\xhtml-документа. если уж речь про парсеры тут в основном идет.
я не говорю что они вообще не нужны. понятно что регулярки ахуительны когда надо с произвольной строки вынуть некий шаблонный кусок. формализуемый. но это не к парсерам относится. а если и относится то на 5-10%. типа: из строки "Вес:10грамм" вынуть отдельно "10" и "грамм". я дохуя парсеров написал. пока не понадобились регулярки, чтобы вынимать из верски - данные.
|
|
пришел к победе коммунистического труда
|
0
|
|
|
Турбо Cуслик со стажем
С нами с 27.03.08
Сообщения: 4069
Рейтинг: 447
|
Добавлено: 16/09/12 в 06:37 |
видимо не так дохуя например такое руками сделать просто жопа
выдергивает объявления с avito
Код: |
preg_match_all('/priceValidUntil" content="(.*)".*<a itemprop="url" href="(.*)".*title="(.*)"/U',$txt,$urlz);
|
сразу в комплекте имеем, ценик, время публикации, урл страницы с объявлением, название товара короткое + название товара длиное.
и это для всех товаров со страницы.
тоже самое когда парсиш тотже гугл или другой поисковик. Все сводится к поиску уникальных меток. Чему тут учить не понятно совершенно, в любой книжке по ПХП за 100р можно это прочитать.
и опятьже зачем уметь програмировать если есть зенно который как небо и земля, ничего даже знать не надо просто тыкать мышкой это как в свое время дельфи появился где ненадо было заморачиваться с объектами, тупа накидал на форму классов и все визуально просто и понятно.
|
|
Время всех ставит на место! растопчет и разотрет в порошок. доказано и не раз :)
|
1
|
|
|
С нами с 29.11.07
Сообщения: 91
Рейтинг: 56
|
Добавлено: 16/09/12 в 12:10 |
FXIX писал: | как там эта фраза, не помню точно. но слышал раз 10 от разных людей. "если тебе в коде понадобилась регулярка - ты что-то делаешь неправильно".
|
Может вот эта?
Цитата: | Some people, when confronted with a problem, think “I know, I’ll use regular expressions.” Now they have two problems.
— Jamie Zawinski |
Некоторые столкнувшись с проблемой думают "Я знаю. Нужно использовать регулярные выражения." Сейчас у них уже две проблемы.
|
|
|
|
Добрых Дел Мастер
С нами с 03.05.08
Сообщения: 3143
Рейтинг: 1227
|
Добавлено: 16/09/12 в 12:44 |
да. она
|
|
пришел к победе коммунистического труда
|
1
|
|
|
С нами с 27.09.03
Сообщения: 5454
Рейтинг: 2506
|
Добавлено: 17/09/12 в 00:09 |
exolon писал: | Для простого php парсера http://simplehtmldom.sourceforge.net/ самое что ни на есть оно Если уж и приходится пользоваться регулярками, то лучше завернуть в библиотечные функции, которые будут лично понятны, и пользоваться в дальнейшем именно ими.
|
он у меня подвисал на некоторых сайтах. хороший обзор парсеров тут http://habrahabr.ru/post/114323/
|
|
|
|