С нами с 17.10.08
Сообщения: 91
Рейтинг: -128
|
Добавлено: 22/08/13 в 19:06 |
Привет!
Начал делать свою небольшую сетку адалт-тюбов, по русский траф пока что. Естественно, первый вопрос - где брать видео. Посмотрел по форумам, понял что все парсят или покупают готовые базы. Дал задачу программерам тоже парсер писать, уже заканчиваем. Думаю, что можно было и скачать готовый или купить, но почему-то решил делать свое, а не брать готовое. Вроде бы довольно неплохо получается, добавляем разные функции (парсинг по критериям, например, таким как длительность роликов или проверка смены ссылок и т.д.).
Что скажете? Парсер - это вообще нужная вещь? Или пустая трата времени?
|
|
|
|
☠Мейнстрим авантюрист
С нами с 15.03.07
Сообщения: 3553
Рейтинг: 2064
|
Добавлено: 22/08/13 в 21:32 |
Нужная. Главное что бы не 1 туб умел парсить.
|
|
|
|
С нами с 27.09.03
Сообщения: 5454
Рейтинг: 2506
|
Добавлено: 22/08/13 в 22:56 |
Modul писал: | Парсер - это вообще нужная вещь? Или пустая трата времени? |
если тебе он нужен - то нужная, иначе - ненужная)
а так вообще свои парсеры есть у очень многих, так что не парься, доделывайте.
|
|
|
|
С нами с 17.10.08
Сообщения: 91
Рейтинг: -128
|
Добавлено: 23/08/13 в 15:02 |
Отлично. Спасибо. Тогда делаем дальше.
Если кому-то будет актуально - пишите в личку, можем сделать под ваши задачи. На данный момент парсим redtube и youjizz.com, с авто-переводом или транслитерацией. Ручное добавление категорий, тегов, фильтрация по длительности видео, фейковый рейтинг. Есть ручное добавление, есть авто, как обычно, наверное.
|
|
|
|
С нами с 27.09.03
Сообщения: 5454
Рейтинг: 2506
|
Добавлено: 23/08/13 в 15:28 |
Modul писал: | Если кому-то будет актуально - пишите в личку, можем сделать под ваши задачи. На данный момент парсим redtube и youjizz.com |
что-то мало, если надо парсер под десяточек-другой тубов, обращайтесь)
|
|
|
|
С нами с 17.10.08
Сообщения: 91
Рейтинг: -128
|
Добавлено: 24/08/13 в 02:32 |
grozny писал: | что-то мало, если надо парсер под десяточек-другой тубов, обращайтесь) |
ну пока что мало, позже будет больше.
хотя, честно говоря, я пока не очень представляю себе насколько это необходимо. мы парсим не просто автоматом массово, а в полурочном режиме, добавляя описания, проставляя категории и теги, поэтому одного даже redtube пока что хватит с головой, чтобы месяц добавлять )
|
|
|
|
С нами с 17.10.08
Сообщения: 91
Рейтинг: -128
|
Добавлено: 24/08/13 в 21:49 |
Слушайте, а как обстоят дела с обходом удаляющихся ссылок? Вот на redtube, например, ролик с утра парсишь, а к вечеру уже нерабочая ссылка на него. Мы эту проблему обошли, но интересно - так везде? Существующие парсеры с этим как-то справляются?
|
|
|
|
С нами с 29.12.09
Сообщения: 43
Рейтинг: 43
|
Добавлено: 24/08/13 в 23:43 |
Я написал несметное количество всех этих парсеров. Для каждого источника индивидуальный подход: какие-то сайты дают фиды с удалёнными линками, какие-то - нет, нужно проверять линки постоянно. Если говорить про redtube, то создатели позаботились о вебмастерах и предоставили API для доступа к инфе ( http://api.redtube.com/docs/#getDeletedVideos ).
|
|
|
|