С нами с 02.08.07
Сообщения: 11
Рейтинг: 13
|
Добавлено: 18/02/13 в 14:20 |
Что такое A-Parser?
Это быстрый парсер с уклоном на универсальность, удобность и производительность.
На данный момент умеет парсить:
Поисковые системы
- Google
- Bing
- Yahoo
- Yandex
- QIP - парсинг яндекса через search.qip.ru с выдачей до 5000 результатов с одного запроса
- AOL - парсер search.aol.com, этот поисковик использует американскую выдачу Google
Каждый парсер может парсить ссылки, анкоры, сниппеты, количество страниц
Для гугла умеет обходить ограничение в 1000 результатов(скоро и для всех остальных парсеров так же будет), т.е. по одному запросу собирает всю выдачу
Для Яндекса есть возможность распознавания каптчи через сервис AntiGate(или любой другой с поддержкой их API)
Парсеры кейвордов
Сервисы поиска ключевых слов
- Yandex WordStat - собирает все кейворды и количество показов до указанной страницы. Так же собирает дополнительные кейворды, показы по главному кейворду и дату обновления статистики. Может сам подставляет найденные ключевые слова в запросы до указанного уровня. Поддерживает распознавание каптчи через АнтиКаптчу.
Подсказки поисковых систем
- Подсказки и релейтед кеи Google
- Подсказки и релейтед Bing
- Подсказки, релейтед и трендовые кеи Yahoo
- Подсказки и релейтед Yandex
Для подсказок Google и Yandex умеет автоматически собирать все кеи(подстановки до указанного уровня), для всех остальных парсеров такая возможность скоро так же появится
Параметры сайтов и доменов
- Rank::Alexa - парсер Alexa Rank, парсит глобальный рейтинг, топ рейтинг по стране, саму страну и количество бек-линков
- Rank::MajestiSEO - парсер количества беклинков с сервиса majesticseo.com, парсит количество ссылающихся страниц, количество уникальных IP-адресов, подсетей класса C и количество уникальных доменов
- Rank::SEMrush - проверяет рейтинг SEMrush, количество SE траффика и его стоимость, количество Ads траффика и его стоимость
- Rank::OpenSiteExplorer - проверяет рейтинг домена\страницы по OpenSiteExplorer, а так же количество беклинков и бекдоменов
- SE::Google::Position - проверка позиции домена по ключевому слову в Google
- SE::Yandex::Position - проверка позиции домена по ключевому слову в Yandex
- SE::QIP::Position - проверка позиции домена по ключевому слову в search.qip.ru
- SE::Google::PageRank - PR страниц и доменов
- SE::Google::SafeBrowsing - проверка домена в блеклисте гугла(подпись harm в выдачи)
- SE::Yandex::TIC - проверка тематического индекса цитирования домена в Яндексе(тИЦ)
- SE::DMOZ - наличие сайта в каталоге DMOZ
- SE::Google::TrustCheck - проверка сайта на траст(доверие) гугла(дополнительный блок ссылок в выдаче и т.п.)
- Net::Whois - определяет зарегистрирован домен или нет, а так же дату окончания регистрации
- SE::Bing::LangDetect - определение языка сайта через поисковик Bing
- Net::DNS - парсер резолвит домены в IP адреса
- Rank::Category - автоматически определяет категорию сайта на английском языке, категории такие же как в dmoz.org, например google.com - Computers/Internet/Searching
- Rank::CMS - определение около 200 видов CMS на основе признаков. Определяет все популярные форумы, блоги, CMS, гестбуки, вики и множество других типов движков
Парсеры различных сервисов
- SE::YouTube - полноценный парсер YouTube, парсит ссылку на ролик, титл, описание, длину ролика, дату добавления, имя пользователя и количество просмотров. Поддерживает все фильтры YouTube
- SE::Google::Maps - парсер ссылок в результатах выдачи в картах Гугла(Google Maps), позволяет искать сайты привязанные к определенной местности
- SE::Yandex::Direct - парсер direct.yandex.ru, парсит список всех объявлений(титл, текст, домен) и кол-во объявлений по определенному запросу
- SE::Google::Images - парсер Google Images, парсит прямые ссылки на картинки, сниппеты, разрешение и размер
- SE::Bing::Translator - переводчик через сервис bing.com/translator/, поддерживает все языки сервиса, включая автоопределение языка оригинала текста
- Util::AntiGate - распознавание каптчи через сервис AntiGate, служит для настройки и тестирования распознавания каптч
Парсинг контента
- HTML::LinkExtractor - парсит внешние и внутренние ссылки с указанного сайта, может ходить по внутренним ссылкам до выбранного уровня.
- Net::HTTP - скачивает указанную страницу, поддерживает многостраничный парсинг.
Планируется еще много парсеров в ближайшем будущем, все созданно для того чтобы быстро добавлять новые парсеры.
Обработка и фильтрация результатов
- Фильтрация любого результата по вхождению строки, эквивалентности строк, регулярному выражению, больше, меньше, равно и т.п.
- Уникализация любого результата по строке, домену, главному домену, папке, строке без учета параметров.
- Парсинг любого результата с использованием регулярных выражений.
Не было бы никакого A-Parser'а если бы не он не имел все нижеперечисленные преимущества, оставляя остальные парсеры далеко в стороне:
- Полностью интерактивный мега-юзабильный веб интерфейс
- Быстрое добавление заданий - Quick Task, когда не нужны никакие настройки, а хочется только побыстрому спарсить результаты
- Расширенный редактор заданий, позволяет комбинировать несколько парсеров в одном задании, к примеру можно одновременно парсить ссылки со всех парсеров поисковых систем, делать уник по всем результатам прямо в процессе работы и т.д.
- Очередь заданий - статистика в реальном времени, выполнение одновременно нескольких заданий и т.д.
- Встроенные подсказки для элементов управления позволяют просматривать хелп непосредственно в интерфейсе
- Поддержка русского и английского языка
- Огромная скорость работы, подробнее тут: Производительность
- Поддержка двух самых популярных платформ - Linux и Windows, производительность под Windows фактически не отличается от Linux версии
- User API - интеграция возможностей парсера в свои скрипты, подробнее тут: User API, взаимодействие с другими программами и скриптами
- Открытая разработка, багтрекер, выслушивание всех мнений и их реализация
- Первоклассная тех поддержка, знакомая многим по моему старому проекту - A-Poster'у
- Данный список можно еще долго продолжать, в ближайшее время все уникальные возможности и подробное их описание появится в Wiki
Более подробное описание и скриншоты
Wiki - дополнительная информация, инструкции и т.д.
Скриншот интерфейса:
На данном скриншоте показан пример добавления задания на парсинг одновременно трёх поисковых систем - Google, Bing и Yahoo, одновременная уникализация по домену всех результатов
Ценовая политика
На данный момент продается версия Pro(все парсеры) и Enterprise(все парсеры + API)
- Цена лицензии - 200$
- Первый год обновления бесплатны, после первого года использования абонентская плата за обновления - 15$ за каждые 3 месяца(возможность работы без обновлений сохраняется)
- Цена лицензии с API: +50$ к стоимости основной лицензии
- Всем клиентам кто имеет лицензию на A-Poster - цена всего 150$
- Комплект A-Parser + A-Poster всего за 300$!
- Специальное предложение - всем покупателям A-Parser'а предоставляются приватные прокси на 20 потоков на 2 недели!
Лицензия позволяет запускать A-Parser на одном сервере\компьютере(напоминаю поддерживается работа на всех версиях Windows и Linux). Переносить можно бесплатно, нельзя запускать на нескольких компьютерах одновременно.
Для покупки парсера зарегистрируйтесь на сайте http://a-parser.com и свяжитесь со мной по любому из следующих контактов:
Предварительно перед покупкой с удовольствием отвечу на любые ваши вопросы, а также возможно обсуждение реализации недостающего вам функционала.
|
|
|
|
С нами с 20.11.10
Сообщения: 1
|
Добавлено: 18/02/13 в 14:28 |
Долго же ты терпел
отличный парсер, кстати
|
|
|
|
С нами с 16.07.06
Сообщения: 886
Рейтинг: 892
|
Добавлено: 18/02/13 в 16:04 |
Продукты у Forbidden-a отличные
|
|
|
|
С нами с 02.08.07
Сообщения: 11
Рейтинг: 13
|
Добавлено: 13/03/13 в 21:18 |
Прошёл ровно год с выхода первой бета-версии парсера, за это время A-Parser вырос до стабильной версии и зарекомендовал себя с лучшей стороны среди SEO-гуру, оставив всех конкурентов далеко позади.
Всего за год была проделана огромная работа:
- Выпущено 39 обновлений
- Сделано 195 улучшений
- Закрыта 141 ошибка
Теперь A-Parser содержит в себе 40 полноценных парсеров поисковых систем и различных сервисов.
В честь такого праздника всем новым пользователям, которые приобретут A-Parser в период с 13.03.2013 до 20.03.2013, предоставляется 2 года бесплатных обновлений.
|
|
|
|
С нами с 02.08.07
Сообщения: 11
Рейтинг: 13
|
Добавлено: 18/03/13 в 10:25 |
A-Parser - версия 0.9.389
Парсер SE::Google теперь поддерживает распознавание каптчи через сервис АнтиКаптча
В парсере Net::HTTP появилась возможность загружать только заголовки страницы, для увеличения скорости и экономии трафика
Парсер SE::Yandex теперь парсит время индексации страницы, с возможностью фильтрации результатов по этому параметру
Улучшен парсер Check::BackLink:
- Теперь можно определить был ли редирект на странице нахождения беклинка
- В результат можно вывести актуальные ссылки страницы беклинка и проверяемой ссылки, а так же анкор проверяемой ссылки
- Можно вывести весь список найденных ссылок(анкоров и nofollow) подпадающих под проверяемую ссылку
Добавлена кнопка выхода из парсера(повторный запрос пароля)
Исправлен парсер HTML::LinkExtractor - при использовании опции перехода по соседним ссылкам неверно добавлял дополнительные ссылки.
Связанные задачи:
Цитата: | Ошибка #427: Fix HTML::LinkExtractor parse to level option(wrong anchors adding to parsing queue)
Улучшение #401: Подключение antigate.com к парсеру Google
Улучшение #414: Сделать парсер http заголовков
Улучшение #416: Яндекс - дата индекса ссылки
Улучшение #422: сделать кнопку логаута
Улучшение #423: Улучшение модуля Check::BackLink
Улучшение #428: Normalize urls for HTML::LinkExtractor and Check::BackLink |
|
|
|
|
С нами с 02.08.07
Сообщения: 11
Рейтинг: 13
|
Добавлено: 29/03/13 в 15:39 |
|
|
|
|
С нами с 02.08.07
Сообщения: 11
Рейтинг: 13
|
Добавлено: 11/04/13 в 08:13 |
A-Parser - версия 1.0.11
Обновилось API, добавлено 3 метода:
- addTask - полноценное добавление задания, со всеми настройками
- getTaskState - получение состояния задания(статистика выполнения, текущий статус)
- changeTaskStatus - изменение статуса задания(пауза\старт\стоп\удаление)
Подробнее на страницы руководства: User API, взаимодействие с другими программами и скриптами
В конструкторе запросов теперь возможно разделять запрос через произвольный разделитель
Парсер SE::YouTube теперь дополнительно парсит ссылку на превью ролика
Исправлено:
- Парсер SE::YouTube в связи с изменением верстки
- Парсер SE::Yandex - исправлено определение даты попадания в индекс
Связанные задачи:
Цитата: | Ошибка #412: Can't edit task created from quick task menu
Ошибка #413: In quick task need to set unique queries for Parse to level with suggests
Ошибка #440: Fix {origquery} macros(bug introduced in 1.0.0)
Ошибка #445: Не работает парсер Youtube
Ошибка #449: SE::Yandex: баги с поиском даты
Улучшение #273: в API нету добавления задания
Улучшение #439: Разделение запроса через произвольный разделитель
Улучшение #441: сохранение прокси без указания типа(http://, socks://)
Улучшение #444: Парсер Youtube - ссылка на превью ролика
Улучшение #446: Get task state and change task status with API |
|
|
|
|
С нами с 02.08.07
Сообщения: 11
Рейтинг: 13
|
Добавлено: 29/04/13 в 14:09 |
|
|
|
|
С нами с 02.08.07
Сообщения: 11
Рейтинг: 13
|
Добавлено: 16/05/13 в 07:24 |
A-Parser - версия 1.0.27
Results Builder - конструктор результатов, позволяет редактировать и создавать новые результаты, поддерживает:
- Поиск и извлечение данных по регулярному выражению
- Замена по регулярному выражению
- Разделение строки по произвольному разделителю
- Замена подстроки в строке
- Извлечение домена/главного домена из ссылки
- Приведение к верхнему\нижнему регистру
- Удаление HTML-тегов из текста
- Преобразование HTML-entities(спец-символов начинающихся с амперсанда &) в соответствующий UTF-8 текст
Новый парсер SE::Google::Compromised - проверка наличия надписи This site may be compromised в гугле
Исправлено:
- Обработка каптчи в парсере SE::Google
- Парсинг ссылок в SE::Yandex содержащих дополнительную информацию в виде превью к играм, а так же ссылок помеченных как "инфицированные"
|
|
|
|
С нами с 02.08.07
Сообщения: 11
Рейтинг: 13
|
Добавлено: 31/05/13 в 11:34 |
A-Parser - полностью обновленный сайт
Несколько важных новостей:
- У нас полностью новый сайт, с полной интеграции с форумом. Все пользователи, новости и задачи были успешно перенесены
- Мы подключили мерчант InterKassa, теперь мы принимаем к оплате:
Подробнее на странице покупки A-Parser'а: Купить A-Parser
- У нас новый саппорт: Viktoria (контакты)
- Ко всем существующим видам связи(ICQ, Skype, Jabber, GoogleTalk, E-mail) мы добавили онлайн-чат с оператором на сайте
Подписывайтесь на новости и общайтесь на форуме!
|
|
|
|
С нами с 03.06.13
Сообщения: 300
Рейтинг: 37
|
Добавлено: 03/06/13 в 16:34 |
Оффтопик: Постинг ссылок разрешен только по достижению 30 постингов или 30 дней с момента регистрации
Оффтопик: Постинг ссылок разрешен только по достижению 30 постингов или 30 дней с момента регистрации
A-Parser - версия 1.0.37
Улучшения:
- При добавлении быстрого задания теперь количество попыток выполнить запрос(Request retries) установлено в 200
Исправления:
- Исправлен парсер SE::YouTube в связи с изменением в выдачи
- Исправлено импортирование заданий(ошибка появилась в предыдущей версии)
- Исправлена обработка каптчи у парсера SE::Google подсчет количества результатов(ошибка появилась в предыдущей версии)
- Исправлен подсчет количества результатов(ошибка появилась в предыдущей версии)
Связанные задачи:
Цитата: | Ошибка #516: SE::YouTube broken
Ошибка #515: Bug when importing/loading tasks(introduced in 1.0.27)
Ошибка #479: Fix again Google captcha
Ошибка #478: Fix counting results from arrays(bug introduced in 1.0.27)
Улучшение #523: Tasks added from Quick Task now have Request retries = 200
Улучшение #480: Validating parser/preset exists before adding task |
|
|
|
|
С нами с 02.08.07
Сообщения: 11
Рейтинг: 13
|
Добавлено: 11/06/13 в 14:18 |
|
|
|
|
С нами с 03.06.13
Сообщения: 300
Рейтинг: 37
|
Добавлено: 14/06/13 в 07:20 |
Оффтопик: Постинг ссылок разрешен только по достижению 30 постингов или 30 дней с момента регистрации
A-Parser - версия 1.0.60
Улучшения в CaptchaKiller для парсера SE::Google
Исправлена загрузка каптчи в SE::Yandex::WordStat и работа фильтров в SE::YouTube
|
|
|
|
С нами с 03.06.13
Сообщения: 300
Рейтинг: 37
|
Добавлено: 03/07/13 в 11:22 |
|
|
|
|
С нами с 03.06.13
Сообщения: 300
Рейтинг: 37
|
Добавлено: 12/07/13 в 13:01 |
A-Parser - версия 1.0.71
Мини-апдейт, исправляет ошибки:
- В предыдущей версии перестал работать Util::AntiGate, следствием чего перестала работать возможность распознавания каптчи(в парсерах Google, Yandex и т.п.)
- В конструкторе результатов(Results builder) не работала функция замены по регулярному выражению(Regex Replace)
- Парсер падал если не мог создать папку с результатами
Подробнее тут: 1.0.71
В данный момент ведется активный перенос парсера на обновленную платформу и сокращение времени выпуска новых версий(на данный момент компиляция всем пользователям занимает около 2ух дней)
|
|
|
|
С нами с 03.06.13
Сообщения: 300
Рейтинг: 37
|
Добавлено: 26/07/13 в 09:18 |
A-Parser - версия 1.0.81
В этой версии только экстренные исправления в связи с изменением в выдаче:
- SE::YouTube
- Rank::Alexa
- Rank::MajesticSEO
Также исправлена некорректная работа парсера при использовании UTF-8 в регулярных выражениях
Подробнее тут: 1.0.81
Перенос парсера на новую платформу, начатый около 2ух недель назад, подходит к концу и в ближайшее время будет доступна бета-версия.
|
|
|
|
С нами с 03.06.13
Сообщения: 300
Рейтинг: 37
|
Добавлено: 05/08/13 в 08:21 |
|
|
|
|
С нами с 02.08.07
Сообщения: 11
Рейтинг: 13
|
Добавлено: 10/08/13 в 14:37 |
A-Parser - версия 1.0.95
Исправление парсера SE::Yandex::WordStat - Яндекс целиком изменил сервис и мы одни из первых исправили парсер
Версия с поддержкой каптчи выйдет немного позже.
Также исправлен парсинг ссылок объявлений в парсере SE::Yandex
Подробнее тут: 1.0.95
|
|
|
|
С нами с 03.06.13
Сообщения: 300
Рейтинг: 37
|
Добавлено: 19/08/13 в 07:57 |
A-Parser - версия 1.0.99
Вновь исправлен SE::Yandex::WordStat в связи с изменением в выдаче, также возвращена поддержка работы с антигейтом и теперь автоматически сохраняются хорошие сессии для экономии прокси и каптч
Улучшения в Extract Top Domain(в Query Builders, Results Builders и в уникализации результатов) - теперь парсер корректно определяет все региональные поддомены вида *.org.ru, *.co.uk и др.
Обновлен список языков для всех парсеров гугла SE::Google::*
Исправления:
- В парсере HTML::LinkExtractor некорректно обрабатывались ссылки mailto: и javascript:, также теперь по умолчанию этот парсер не переходит по редиректам
- В парсере SE::Bing исправлена ошибка при которой A-Parser мог падать в некоторых случаях
- Исправлено зависание при парсинге SE::Baidu
- В интерфейсе иногда могли пропадать настройки парсеров
- Исправлен SE::YouTube в связи с изменением в выдаче
Подробнее тут: 1.0.99
|
|
|
|
С нами с 03.06.13
Сообщения: 300
Рейтинг: 37
|
Добавлено: 26/08/13 в 08:20 |
A-Parser - версия 1.0.111
Расширение API:
Парсеры SE::Yandex::WordStat и SE::Yandex::WordStat::ByDate полностью исправлены после последних обновлений Яндекса. Средняя скорость проверки теперь составляет 5000 кейвордов в минуту без использования антигейта.
В парсеры SE::Bing::Suggest и SE::Yahoo::Suggest добавлена опция Parse to level позволяющая автоматически подставлять найденые подсказки опять в запросы, тем самым происходит парсинг вглубь до 10 уровней вложенности
В парсере Rank::MajesticSEO теперь можно проверить количество беклинков у конкретной страницы сайта
Исправлены:
- SE::DMOZ - в связи с изменение в выдаче
- Опция Match subdomains(проверка сабдоменов) во всех парсерах позиций сайта(Positions) - ошибка появилась в предыдущей версии
Подробнее тут: 1.0.111
|
|
|
|
С нами с 03.06.13
Сообщения: 300
Рейтинг: 37
|
Добавлено: 06/09/13 в 13:48 |
A-Parser - версия 1.0.119
Новый метод уникализации DataBase - не использует оперативную память, 100% точность. Убраны старые методы Dynamic, DynamicHash, 16-64mb как неактуальные, подробности тут
Реализовано лимитирование потоков, в случае превышения потоков в задании парсер выдаст ошибку и не запустит задание. На Windows лимит установлен в 2000 потоков, на Linux в 10000(или меньше если ulimit -n меньше)
Исправлена обработка каптчи в парсере SE::Yandex. Также теперь можно указать регион поиска в цифровом формате через Extra query string, возможность выбора региона из списка сохраняется
В API добавлена возможность переопределить настройки пресета в методах oneRequest и bulkRequest. Добавлен новый метод getParserPreset - позволяет изучить доступные настройки для каждого парсера. Обновлен модуль AParser.pm
Добавлен парсер новой поисковой системы SE:: DuckDuckGo
Обновлен список доменов гугла в парсере SE::Google. Также теперь парсер гугла может определять ошибочно был введен запрос или нет(результат {misspell})
Исправления:
- Иногда ссылка на первый ролик в SE::YouTube парсилась некорректно
- Исправлено падение в некоторых случаях после постановки задания на паузу
- Исправлен двойной запуск задачи после паузы, баг появился в одной из предыдущих версий
- При дублировании задания частично пропадали настройки Results Builder
Подробнее тут: 1.0.119
|
|
|
|
С нами с 03.06.13
Сообщения: 300
Рейтинг: 37
|
Добавлено: 02/10/13 в 09:51 |
|
|
|
|
С нами с 03.06.13
Сообщения: 300
Рейтинг: 37
|
Добавлено: 14/10/13 в 08:05 |
|
|
|
|
С нами с 03.06.13
Сообщения: 300
Рейтинг: 37
|
Добавлено: 25/10/13 в 08:15 |
A-Parser - версия 1.0.154
В связи с тем что WordStat теперь можно парсить только используя аккаунты появился новый парсер SE::Yandex::Register - автоматически регистрирует тысячи аккаунтов используя антигейт.
На скриншоте пример регистрации 1000 аккаунтов за 15 минут. Скорость ограничена возможностями антигейта.
Парсеры SE::Yandex::WordStat и SE::Yandex::WordStat::ByDate теперь поддерживают авторизацию и позволяют парсить миллионы кейвордов и проверять частотность без использования антигейта. Теперь затраты на каптчу только при регистрации аккаунтов!
Другие улучшения:
- Теперь A-Parser поддерживает неограниченное число вложенных запросов(при использовании опции Parse to level)
- Теперь все парсеры позиций сайтов по ключевым словам могут сравнивать искомую позицию по домену, по главному домену и по полной ссылке(опция Match type)
- В парсер SE::Yandex добавлен результат geo, который определяет является ли запрос гео-зависимым(предупреждение о показе результатов для конкретного региона)
Исправления:
- Исправлен парсер подсказок SE::Google::Suggest в связи с изменением в выдаче
- Исправлен парсер SE:: DuckDuckGo - в связи с изменением в выдаче некорректно определял последнюю страницу
- При использовании очень больших файлов запросов парсер мог вылетать при возобновлении работы задания после паузы
Подробнее тут: Версия 1.0.154
|
|
|
|
С нами с 03.06.13
Сообщения: 300
Рейтинг: 37
|
Добавлено: 09/11/13 в 07:35 |
|
|
|
|