A-Parser - продвинутый парсер ПС, PR, WS, более 35 парсеров!

Расширенный поиск по форуму

Новая тема

Страницы: « первая <1 234 5 6 7 8 9 10 11 >последняя »

Автор

Поиск в теме:

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 25/03/15 в 12:56

цитата

A-Parser - 1.1.224 - улучшенные возможности по уникализации результатов, множество исправлений

Все возможности новой версии можно протестировать в демо версии A-Parser'а

Улучшения

Добавлена возможность уникализировать результаты созданные с помощью Конструктора результатов
Добавлена возможность передавать дополнительные параметры на сервис распознавания каптчи(например специальные настройки для CapMonster)
В парсер SE::Bing::Images добавлена возможность отключить безопасный поиск
В парсер SE::YouTube добавлен фильтр по 4K видео
Добавлена возможность применять Конструктор запросов после подстановок запросов
В парсер SE::Bing добавлена возможность парсить связанные кейворды в глубину, автоматически подставляя новые кейворды в запросы(Parse to level)
Переработан выбор файлов запросов, теперь вложенные директории отображаются только при клике по ним

Исправления в связи с изменениями в выдачи

Исправлен парсер SE::Yandex::WordStat
Исправлен парсер SE::Yahoo
Исправлен парсер SE::AOL
Исправлен парсинг связанных ключевых слов в парсере SE::Bing
Исправлен парсинг времени последнего кэширования страницы в парсере SE::Yandex
Исправлен регистратор аккаунтов SE::Yandex::Register
Исправлен парсинг связанных ключевых слов в парсере SE::Yandex

Исправления

Некорректно работала опция сохранения переноса строк для Windows (CRLF)
Иногда задание могло зависнуть в состоянии pausing/stopping

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 05/05/15 в 06:05

цитата

A-Parser - 1.1.247 - новые парсеры поисковиков Ask и Comcast, произвольные шаблоны в конструкторе результатов

Улучшения

В конструкторе результатов и фильтрах теперь возможно использовать произвольный шаблон в качестве аргумента для преобразования или фильтрации
В парсер SE::Yandex добавлена возможность выбора домена yandex.com для парсинга
Добавлен новый поисковик SE::Ask с американской выдачей Google
Добавлен новый поисковик SE::Comcast с американской выдачей Google
Добавлена статистика для завершенных заданий, а также отображение общего времени выполнения задания
Добавлен объект $request, который доступен при форматировании результата и позволяет извлечь любую информацию о текущем запросе, а также о всех редиректах выполненных перед конечным запросом

Исправления

Парсер мог заблокировать файл результата после завершения задания
Исправлена некорректная обработка <base href= в некоторых случаях
Парсер вылетал при использовании инструмента генерации произвольного User-Agent tools.ua.random() в тестовом парсинге
В быстром задании не работал выбор запросов из файла
Некорректно обрабатывался редирект с автоматическим выбором схемы(ссылки вида //domain.com/)

Исправления в связи с изменениями в выдачи

В парсере Rank::Alexa исправлен парсинг страны и регионального рейтинга
Улучшен парсинг тИЦ в парсере SE::Yandex::TIC
Исправлен парсер SE::Yahoo
Исправлено определение блокировки IP-адреса в парсере Rank::Ahrefs
Исправлен парсер SE::Yandex::WordStat::ByDate
Парсер Rank::Category перешел на семантический анализатор от Ашманова

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 19/05/15 в 10:20

цитата

Программа LinkAParser - объединение функционала генератора PandoraBox и парсера A-Parser

С помощью данного софта задействованы основные возможности парсера A-Parser при генерации сайтов программой PandoraBox.

Обсуждение на форуме A-Parser'а и ссылка на сайт генератора

Применяет возможности А-Парсера для:

Парсинга релевантного текста
Парсинга релевантных картинок
Парсинга релевантных видео роликов

Понимает какие ключи уже обработаны и не парсит одно и тоже дважды
С программой идут готовые пресеты, которые достаточно импортировать и можно запускать генерацию
Спаршенные данные программа структурировано раскладывает в файлы и папки
Спаршенный текст программа чистит от мусора по множеству признаков

В комплекте с программой идет набор дополнительных макросов:

Макрос вывода релевантного текста с подмешанными ключами
Макрос вывода релевантного текста без ключей
Макрос вывода релевантной картинки
Макрос вывода релевантной картинки как локальной(проксирование скриптом)
Макрос вывода релевантного видео ролика

Для работы необходима лицензия парсера A-Parser Enterprise

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 27/05/15 в 11:55

цитата

Сборник рецептов #3: мобильные сайты, несколько парсеров, позиции ключевых слов

Итак, продолжаем серию статей с рецептами применения A-parser: комплексные примеры с одновременным использованием различного функционала парсера.

Проверяем наличие мобильной версии для 1000000 сайтов

Работаем с большими объемами данных и учимся искать совпадения в raw data.

за 8 часов работы данного задания мы узнали что почти 41% самых посещаемых сайтов не имеют мобильных версий. Кто знает, возможно обзаведясь мобильной версией, они стали бы еще более посещаемыми?

По списку запросов получаем страницы, CMS, PR, e-mail из whois

Комплексное задание, выполняемое в 2 этапа, в котором мы учимся работать с несколькими парсерами, регулярными выражениями, а также красиво выводим результаты во многоуровневые каталоги и несколько файлов.

на первом этапе используется 1 парсер, на втором - 3
в конструкторе результатов используется регулярное выражения для извлечения необходимой информации
результаты выводятся в виде вложенных папок и текстовых файлов по следующей схеме:

Код:

PR_1
\Joomla
\domain.com
contacts.txt
cache.txt
\Drupal
\WordPress
\no CMS
PR_2
PR_3

Узнать позиции по кеям, как?

Знакомимся с парсером

SE::Google::Position и проверяем на каком месте в поисковой выдачи находится ключевое слово.

Детальнее о самом парсере здесь.

Предыдущие сборники:

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 02/06/15 в 12:30

цитата

Сборник рецептов #4: поиск в выдаче, парсинг интернет-магазина и скачиваем файлы

Очередной, 4-й выпуск сборника рецептов. Поехали!

Анализ выдачи гугла на наличие ключа в тайтле и дескрипшене

Пользуемся возможностями шаблонизатора Template Toolkit. Используем циклы и поиск. А также сохраняем разные результаты в разные файлы.

В данном примере осуществляется поиск ключа в анкорах и сниппетах, и в зависимости от результата, сохраняет их в 1 из 3 соответствующих файлов. Все подробности, а также сохранение в 4-ре файла по ссылке выше.

Парсинг товаров с сайта

Парсим интернет-магазин и формируем свою HTML-страницу с результатами.

Суть задания заключается в том, чтобы спарсить названия и характеристики товара из интернет-магазина, сохранив привязку к категории и фото товара. Как все это сделать - по ссылке выше.

Скачиваем файлы

Сохраняем на жесткий диск различные документы из поисковой выдачи, с определением их типа, а также возможностью формировать уникальное имя файла.

Ну а здесь нам необходимо парсить из выдачи Гугла ссылки на документы формата doc, xls и pdf. Так же необходимо скачивать данные документы, при этом обеспечить уникальность имени файла. Детали - по ссылке выше.

Предыдущие сборники:

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 18/06/15 в 13:28

цитата

Сборник рецептов #5: ссылки из JS, паблик прокси и карта сайта

5-й выпуск сборника рецептов. Здесь мы научимся парсить ссылки из страниц, где их подгружает JS-скрипт, будем собирать паблик прокси и составлять карту сайта.

Подгрузка ссылок через JS
Есть очень много сайтов, где контент загружается специальным скриптом (AJAX). К примеру, это может быть поиск на сайте. И как спарсить с таких сайтов информацию? Ведь если посмотреть код страницы в браузере - то, к примеру, ссылки там есть, а парсер их не видит... Решение есть, и оно довольно не сложное. Как это сделать - по ссылке выше.

Сборщик паблик прокси: как лучше и насколько это эффективно
Всем известно, что в интернете есть очень много сайтов, где выкладывают публичные прокси (что это на Википедии). Если возникает необходимость в использовании таких прокси - появляется проблема в их сборе, при этом, естественно нужны только живые. Наверное так же известно, что используя А-парсер, можно их собирать. А вот как это делать и насколько это эффективно - читайте по ссылке выше.

Карта сайта с помощью A-parser
Карта сайта простыми словами - это XML-файл, который помогает поисковикам лучше индексировать сайт. Некоторые SEOшники считают ее отсутствие грубейшей ошибкой. Существует очень много сервисов и инструментов для создания таких карт, ну а мы попробуем создать ее с помощью A-parser. Что из этого получится, и как это делать - читайте по ссылке выше.

Предыдущие сборники:

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 10/07/15 в 10:32

цитата

Сборник рецептов #6: парсим базу номеров телефонов и сохраняем результаты красиво

6-й выпуск сборника рецептов. Здесь мы попробуем собирать скрытые номера мобильных телефонов из доски объявлений и научимся сохранять результаты работы А-парсера в таблицы с возможностью сортировки.

Парсим базу мобильных телефонов
Базы телефонов могут использоваться по-разному, но основной вид их использования - рассылка смс рекламного характера. А если базу еще и возможно отсортировать по городу, интересу или другим характеристикам, т.е. сделать таргетированную рассылку, то эффективность сильно возрастает. Подобные базы собираются разными способами, мы же поговорим о том, как это сделать с помощью А-парсера.

Вывод результатов в таблицу
Бывает, возникает необходимость в красивом и удобном выводе данных, полученных в результате парсинга. И если обычного текстового вида недостаточно, нужно искать другие способы вывода. Об одном таком способе и пойдет речь в статье по ссылке выше.

Предыдущие сборники:

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 22/07/15 в 12:00

цитата

A-Parser - версия 1.1.269 - получение списка задач по API, только мобильные для WordStat

Два месяца у нас работает профессиональный саппорт, который помогает составлять задания любой степени сложности. Доработана документация, регулярно появляются интересные решения на нашем форуме, которые теперь собраны в едином Каталоге примеров. Также создан большой FAQ, в котором собраны ответы на часто задаваемые вопросы.

Версия 1.1.269 является одной из последних в ветке 1.1.х, в скором времени будет доступна бета версия 1.2, которая принесет новый виток развития A-Parser, следите за новостями

Улучшения

Теперь по API можно получить список активных заданий, а также опционально список завершенных заданий
Для парсера SE::Yandex::WordStat добавлена возможность получать статистику только для мобильного трафика
В парсере HTML::LinkExtractor теперь обрабатываются только http(s) ссылки
При использовании автоопределения языка в парсере SE::Bing::Translator теперь можно вывести в результат язык исходного текста

[B]Исправления в связи с изменениями в выдачи
[/B]

Исправлен парсер SE::YouTube
Исправлен парсер Rank::MajesticSEO
Исправлен парсер SE::Ask
Исправлен парсер SE::Yandex
Исправлен парсер Rank::Ahrefs
Исправлен парсинг рекламных объявлений в SE::Google
Исправлен парсер Rank::Archive

Исправления

В парсере SE::Bing::Translator исправлен парсинг арабского языка
Парсер Net:: DNS не поддерживал кириллические домены
Исправлен парсинг подсказок в парсер SE::Google при использовании подстановок
Парсер SE::Yahoo использовал много CPU

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 04/08/15 в 11:24

цитата

Сборник рецептов #7: парсим RSS, качаем картинки и фильтруем результат по заголовкам

7-й выпуск сборника рецептов. Здесь мы рассмотрим вариант парсинга RSS, будем скачивать картинки в зависимости от их характеристик и научимся фильтровать результат по хедерам.

Парсинг RSS
На сегодняшний день RSS остаются довольно популярным вариантом доставки новостей и контента пользователям. В связи с этим его используют почти на всех сайтах, где бывает более-менее периодическое обновление информации. А для нас это возможность быстро спарсить свежие обновления сайта, не анализируя сам сайт. И один из способов, как это сделать описан по ссылке выше.

Как фильтровать результат по определенным хедерам?
Как известно, А-парсер предназначен для парсинга, в основном, текстовой информации. Но кроме этого им вполне реально парсить и другие обьекты (файлы, картинки и т.п.). При этом существует возможность фильтровать их по заголовкам ответа сервера. Об этом по ссылке выше.

Скачивание картинок указанного разрешения и размера
Если выше мы фильтровали результат только по хедерам и рассматривали вариант с документами, то в данной статье мы будем скачивать картинки и фильтровать их по размеру и разрешению. Как это сделать - можно увидеть по ссылке выше.

Еще больше различных рецептов в нашем Каталоге примеров!

Предыдущие сборники:

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 18/08/15 в 09:54

цитата

Сборник рецептов #8: парсим 2GIS, Google translate и подсказки Youtube

8-й выпуск сборника рецептов. В нем мы будем парсить базу организаций из каталога 2GIS, научимся парсить подсказки из Youtube и напишем кастомный парсер Google translate.

Парсинг 2GIS
2GIS - это довольно большой справочник организаций России (и не только...) с возможностью просмотра их расположения на карте. База содержит более 1580000 организаций в 270 городах России. После парсинга представляет интерес как справочник сайтов, электронных адресов и телефонов организаций.

Парсинг Google Translate
В данной статье рассмотрен способ написания кастомного парсера Google translate на основе

Net::HTTP. Также реализована возможность задавать направление перевода. Можно использовать для пакетного перевода больших обьемов текста.

Парсинг подсказок Youtube
Парсинг подсказок поисковых систем - довольно популярный способ поиска ключевых слов. В данной статье также используется

Net::HTTP, с помощью которого создается кастомный парсер подсказок Youtube. Реализована возможность задавать язык и страну, а также использовать уже спаршенные подсказки в качестве новых запросов на нужную глубину.

Еще больше различных рецептов в нашем Каталоге примеров!

Предыдущие сборники:

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 16/09/15 в 07:06

цитата

Сборник рецептов #9: проверяем сезонность ключевых слов и их полезность

9-й выпуск Сборника рецептов. В нем мы будем работать с ключевыми словами: проверять их сезонность и искать свободные ниши в рунете, проверяя "полезность" ключевиков.

Определение сезонности ключевых слов через Wordstat
Использование нужных ключевых слов в нужное время - один из способов привлечения дополнительного трафика на сайт. Для определения сезонности ключевых слов существует немало различных способов и сервисов. О том, как это делать с помощью А-Парсера - читайте по ссылке выше.

Поиск свободных ниш в RU сегменте интернета
Используя на сайте не только сезонные, а и "полезные" ключевые слова, можно значительно повысить шансы попасть в ТОП10 поисковиков. И если о сезонности мы писали ранее, то о "полезности", а точнее о "незанятости" ключевых слов мы поговорим в данной статье. Полезные или незанятые - это такие КС, которые пользователи часто ищут, но конкуренция по которым не очень высокая. Как их искать - читайте по ссылке выше.

Еще больше различных рецептов в нашем Каталоге примеров!

Предыдущие сборники:

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 07/10/15 в 06:20

цитата

A-Parser - 1.1.292 - парсинг JSON, улучшения использования памяти, множество исправлений

Улучшения

Поддержка разбора JSON структур в шаблонизаторе
Добавлена опция "Конструктор запросов на всех уровнях", позволяющая использовать конструктор запросов на всех уровнях вложенного парсинга
При просмотре статистики работы задания теперь отображается общее число HTTP запросов
Новый инструмент отладки Gladiator, позволяющий быстро локализовать возможные утечки памяти

Исправления в связи с изменениями в выдачи

Исправлено определение наличия каптчи на этапе логина в парсере SE::Yandex::WordStat
Полностью переработан Rank::Ahrefs
Исправлен парсинг времени кэширования в SE::Yandex
Исправлен SE::Google::Images
Исправлен SE::Bing
Исправлен SE::Yahoo::Suggest
Исправлен SE::AOL

Исправления

Исправлен парсер SE::Yandex::TIC - ресурсы у которых тИЦ был неопределен отображались как тИЦ = 0, исправлено на тИЦ = -1
Исправлено множество утечек памяти
При замене в регулярных выражениях не работал символ переноса \n
При использовании большого числа переменных в конструкторе запросов или результатов они могли не влезать в видимую область

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 14/10/15 в 08:31

цитата

Сборник рецептов #10: пишем кастомный парсер поисковика и парсим дерево категорий

10-й выпуск Сборника рецептов. В нем мы сделаем кастомный парсер поисковика search.disconnect.me и научимся парсить категории из сайтов с сохранением иерархии и путей к ним.

Парсер search.disconnect.me или альтернатива inurl Google
В одном из сообщений на форуме был упомянут довольно интересный сервис search.disconnect.me. Также в последнее время все чаще стали появляться сообщения о проблемах при парсинге Гугла с поисковыми операторами. А так как вышеупомянутый сервис позволяет парсить Гугл, при этом не выдавая каптч и без бана прокси, можно попробовать сделать для него парсер на основе

Net::HTTP. Что из этого получилось - можно посмотреть по ссылке выше.

Парсинг дерева категорий с сохранением структуры
В версии 1.1.292 появилась новая опция Query Builders on all levels. С ее помощью можно регулировать, когда применять Конструктор запросов при парсинге "в глубину". И благодаря этой опции стало возможным парсить дерево категорий из сайтов с сохранением структуры. Как это работает - можно посмотреть по ссылке выше.

Еще больше различных рецептов в нашем Каталоге примеров!

Предыдущие сборники:

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 22/10/15 в 10:26

цитата

A-Parser - 1.1.323 - парсинг с помощью XPath, поддержка JavaScript в шаблонизаторе, тестировщик заданий

Улучшения

Добавлен новый Тестировщик заданий, позволяющий тестировать все задание целиком, включая использование нескольких парсеров, конструкторов запросов и результатов. Тестировщик позволяет просматривать результаты по каждому созданному файлу, а также отображает логи выполнения по каждому запросу
Для парсера Net::Whois добавлена опция Recursive query, которая позволяет получать расширенную версию WHOIS(контактные email адреса и т.п.)
Добавлена поддержка XPath запросов, сильно упрощающая разбор HTML документов
Добавлен новый инструмент tools.js, позволяющий исполнять JavaScript из шаблонизатора, теперь помимо возможности использовать JavaScript для обработки и вывода результатов стало возможно частично исполнять скрипты встроенные в HTML(Выборочная обработка JavaScript: расшифровка телефонов)

Исправления в связи с изменениями в выдачи

Исправлен парсинг рекламных объявлений в SE::Google
Исправлен парсер Rank::Ahrefs
Исправлен парсер Rank::DMOZ

Исправления

При использовании динамического имени файла append text теперь пишется один раз
Исправлена работа с ссылками, которые содержат некоторые символы Юникода в Net::HTTP
Исправлена обработка каптчи в SE::Yandex::Register
Исправлен парсинг подсказок в SE::Google::Suggest

NuPogodi

С нами с 03.10.15
Сообщения: 4

Добавлено: 02/11/15 в 05:03

цитата

Пользуюсь постоянно! Оперативная тех поддержка, частые обновления. Правда использую лишь малую часть из того, на что он способен!

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 03/11/15 в 08:11

цитата

Сборник рецептов #11: парсим Авито, работаем с JavaScript, анализируем тексты и участвуем в акции!

Розыгрыш призов, условия акции смотри в конце!

11-й выпуск сборника рецептов. В нем мы разберем пример парсинга Авито, научимся расшифровывать телефонные номера, скрытые за JS и будем анализировать тексты.

Парсинг Авито
Если просмотреть сайты с вакансиями для фрилансеров, то можно увидеть, что очень часто требуется парсить популярный сайт объявлений avito.ru. Чаще всего в результате нужна база телефонов, реже - списки объявлений и цены. Данная информация может быть необходима маркетологам, для изучения ситуации на рынке, спамерам для рассылки смс и т.д...
Задачу по парсингу Авито можно решить также с помощью А-Парсера. О том как это сделать - читайте по ссылке выше.

Выборочная обработка JavaScript: расшифровка телефонов
Бывает, что при парсинге различных ресурсов можно наткнуться на информацию, которая скрыта скриптом на JavaScript. До недавнего времени A-Parser не умел обрабатывать JS, и такие сайты оставались в "зоне недоступности". Но начиная с версии 1.1.318 A-Parser научился выборочно работать с JS. Поэтому теперь есть возможность более эффективно парсить такие ресурсы и получать нужную информацию.
Как это делать и больше подробностей о поддержке JS в А-Парсере читайте по ссылке выше.

Анализ текста
Иногда возникает необходимость проанализировать спаршенный или написанный текст по различным параметрам (например: тошнота, водность, определить тематику и язык, найти наиболее повторяющиеся слова и т.п.). Для этого существует много различных приложений и онлайн-сервисов. Парсинг одного из таких сервисов будет показан по ссылке выше.

Почти 3 месяца назад у нас появилась Платная услуга по составлению заданий для А-Парсера. Она оказалась очень актуальна среди новых пользователей парсера, а также среди тех, у кого не хватает времени на его изучение. За время ее существования было составлено более 70 заданий, при этом 75% состояли из 2-х и более пресетов. Среднее время на составление одного заказа, от согласования деталей до получения готового набора пресетов, составляет около 4 часов. При этом, каждый пресет тщательно тестируется, а получаемый результат обсуждается с клиентом.

Так как A-Parser - это программа для парсинга различной информации, 26 ноября, во Всемирный день информации, будет разыграно:

5 пакетов прокси (100 потоков на месяц)
3 бесплатных составления 1-го задания для А-Парсера

В акции принимают участие все, кто ретвитнет нашу новость об этой акции в Twitter. Подписывайтесь на наши каналы в Twitter: русскоязычный @a_parser и англоязычный @a_parser_en и следите за новостями на сайте! Победители акции будут определены случайно с помощью сервиса random.org. Видео определения победителей будет выложено вместе с результатами акции.

Еще больше различных рецептов в нашем Каталоге примеров!

Предыдущие сборники:

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 27/11/15 в 10:48

цитата

Снижение комиссии при оплате PayPro и Итоги акции

В связи с плохой проходимостью платежей в системе Interkassa было принято решение снизить комиссию PayPro до 3%. PayPro теперь является рекомендуемым способом оплаты, который принимает все популярные платежные системы: PayPal, Visa/MasterCard, QIWI, Yandex.Money, Wire Transfer

Напоминаю что всегда доступен прием WebMoney без комиссии

Одновременно с этим мы перевели Members Area на русский язык, добавили систему уведомлений на e-mail, а также готовим инструкцию по использованию нашего магазина

Итоги акции:

Итак, сегодня 26 ноября, а значит пора подводить итоги нашей акции!
Всего участников оказалось не так и много - 14 человек. Поэтому шансы получить 1 из 8-ми призов были довольно велики.
Было проведено определение победителей, видео по ссылке: http://files.a-parser.com/Video/Action_26_11_15.avi

Искренне поздравляем всех счастливчиков! А те, кому не повезло в этот раз - не отчаивайтесь, вскоре будут новые акции! Поэтому следите за нашими новостями на сайте или в Твиттере.

Победители, для уточнения деталей и получения призов, свяжитесь через Твиттер с выигрышных аккаунтов с администрацией А-Парсера @a_parser.

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 08/12/15 в 10:48

цитата

A-Paeser - 1.1.355 - улучшения работы с регионами в Google и Яндексе, новые методы API, множество исправлений

Улучшения

В парсере SE::Yandex теперь также собираются ссылки на колдунщики(внутренние сервисы Яндекса), что позволяет более точно определять позиции сайтов в выдаче
В парсере SE::Yandex улучшено определение misspell(исправленных) запросов
В парсере SE::Yandex домен Яндекса теперь выбирается автоматически в зависимости от выбранного региона
В парсере SE::Google улучшена работа с сессиями
В парсере SE::Bing добавлен выбор локации
В интерфейсе парсера теперь доступен список последних сообщений с форума поддержки
Для парсера SE::Yandex добавлена поддержка турецкого домена yandex.com.tr
В парсере Net::HTTP добавлена поддержка шаблонизатора в поле Cookies
Теперь у начального текста, формата результата и конечного текста, общее пространство переменных, что позволяет решать задачи по выводу статистики
В макрос num добавлена возможность указать шаг итераций, формат {num:START:END:STEP}
Добавлен новый метод API getParserInfo - выводит список всех доступных результатов, который может вернуть парсер
Добавлен новый метод API update - обновляет исполняемый файл парсера до последней доступной версии, после успешного ответа A-Parser будет автоматически перезапущен
Метод API info теперь дополнительно выдает список всех доступных парсеров

Исправления в связи с изменениями в выдаче

В SE::Google исправлено указание локации
В SE::Bing исправлен парсинг серпа и связанных ключевых слов
В SE::Yandex исправлен сбор сниппетов и анкоров
В SE::Yahoo исправлен парсинг выдачи и работа с региональными доменами
Исправлены Rank::Category, SE::Bing::Images, SE::Bing::LangDetect, SE::Baidu, SE::AOL, SE::Google::SafeBrowsing, SE::Yandex::Register

Исправления

Исправлено игнорирование максимального числа активных заданий
В парсере HTML::LinkExtractor исправлена обработка относительных ссылок
Исправлена перезапись результатов при паузе\старте или при перезапуске парсера и одновременно включенной опции "Перезаписать файл"
Исправлена работа функции tools.parseJSON если страница была декодирована в UTF-8
Исправлен вывод результатов в Тестировщике заданий

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 15/12/15 в 11:45

цитата

A-Parser: вводный видео урок, обзор возможностей

Денис Бартаев рассказывает о базовых возможностях A-Parser

В выпуске рассматриваются:

Основные настройки рядового парсера на примере SE::Yandex
Настройки Антигейт
Настройки прокси с проверкой статуса и без
Основные инструменты тестирования результатов парсинга
Базовые методы работы с шаблонизатором результатов, переменные парсеров
Примеры создания заданий, и описание процедуры работы с Редактором заданий

Подписывайтесь на наш канал!

A-Parser на СПИК 2015 - запись доклада Леонида Гроховского

A-Parser на СПИК 2015! Почти половина доклада посвящена обзору некоторых возможностей A-Parser

Как использовать парсеры для SEO? Как проверять индексацию страниц, как узнать позиции сайта. Об этом в докладе "Парсеры на службе у SEO-специалистов" рассказывает Леонид Гроховский. Подписывайтесь на его канал https://www.youtube.com/user/Grohovskiy
И на наш https://www.youtube.com/channel/UCvypGICrfCky8tPtebmIvQw

Тезисы:

Проверка индексации сайтов
Сбор сниппетов
Парсинг подсвеченных слов из сниппетов
Проверка позиций и входных страниц
Сбор запросов и подсказок
Определение частотности для списка запросов
Парсинг VK
Выкачивание базы у любого сайта
Взаимодействие с A-Parser через API

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 25/12/15 в 11:34

цитата

A-Parser - 1.1.370 - планировщик заданий, улучшения в парсерах Google и Яндекса

В новой версии добавлен планировщик заданий, позволяющий легко запланировать выполнение задач, требующих периодичного исполнения, например такие как анализ позиций сайтов или ссылочных показателей

Другие улучшения

В опции Check next page для парсера Net::HTTP добавлен параметр Limit, позволяющий ограничивать максимальное число переходов на следующую страницу
В парсере SE::Google улучшена работа с сессиями
Парсеры SE::Google и SE::Yandex оптимизированы при работе без антигейта
Для парсера SE::Bing::Translator добавлены все новые языки
В API при добавлении задания появилась возможность указать флаг removeOnRestart, при указании которого задания будут автоматически удалены при перезапуске парсера

Исправления в связи с изменениями в выдачи

SE::Ask - парсилась только первая страница
SE::Google - исправлен парсинг сниппетов
Исправлены SE::MailRu, SE::Dogpile, SE::Google::pR, SE::QIP и SE::QIP::position

Исправления

При использовании нескольких форматов запросов и опции Parse to level парсер мог вылетать с ошибкой
В парсере SE::Google могла повторно отправляться каптча при использовании антигейта
Исправлен баг с отображением формата результата после импорта пресета
Исправлен баг с отображением переменных в Конструкторе результатов

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 14/01/16 в 12:54

цитата

A-Parser - 1.1.388 - новый парсер disconnect.me, улучшения в экспорте заданий

Улучшения

Добавлен парсер SE::DisconnectMe - поисковая система от бывших сотрудников Google, можно выбирать один из трех вариантов выдачи: Google, Bing, Yahoo
Теперь при сохранении пресета задания, сохраняется название файла запросов или сам список запросов
При экспорте задания, появилась возможность указать включать или нет запросы в код пресета, а также теперь отображается список настроек парсеров которые будут включены в код
В очереди заданий добавлена возможность свернуть\развернуть одновременно все задания на странице
В очереди заданий для свернутых заданий теперь отображается время выполнения
Увеличена скорость парсинга SE::Google

Исправления в связи с изменениями в выдачи

В SE::Google::Images больше не парсится параметр size
Исправлены SE::Google, SE::Google::TrustCheck, SE::Google::Compromised, SE::Ask, SE::Dogpile, Rank::Mustat, Rank::Category, SE::AOL

Исправления

A-Parser мог падать при использовании парсеров SE::Yandex::WordStat, SE::Dogpile, а также при использовании Просмотра логов после перезапуска парсера
В парсере Net::Whois не определялась дата экспайра для некоторых доменов
В парсере SE::Bing не корректно обрабатывались ссылки содержащие символ &

Обновление партнерской программы

Участвуйте в нашей партнерской программе рекламируя A-Parser в своих блогах и на форумах! Размер комиссии - 15%:

A-Parser Lite: $18
A-Parser Pro: $30
A-Parser Enterprise: $42

В обновленном интерфейсе доступна удобная статистика заработанных средств и выплат, а также список привлеченных пользователей

Подробнее про условия участия в партнерской программе читайте в соответствующем разделе

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 08/02/16 в 15:20

цитата

A-Parser: видео урок по парсингу 2ГИС

Денис Бартаев рассказывает о парсинге информации о компаниях и их телефонов из базы 2ГИС

В выпуске рассматриваются

Использование парсера-паука HTML::LinkExtractor и его настройка для фильтрации ссылок
Работа с параметром Parse To Level
Использование парсера Net::HTTP и его настройка для выборки данных со страницы с помощью регулярных выражений
Создание Excel-таблицы из результатов парсинга

Подписывайтесь на наш канал!

Оставляйте в комментариях свои идеи и пожелания для будущих видео

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 15/02/16 в 11:44

цитата

Сборник рецептов #12: парсим Instagram, собираем статистику и делаем свои парсеры подсказок

12-й выпуск Сборника рецептов. В нем мы рассмотрим пример парсинга Instagram, проверим новую возможность вывода статистики и научимся составлять кастомные парсеры подсказок. А также:

Обзор вариантов представления результатов
Универсальный чекер страниц
Парсинг трафика и стоимости по ключевым словам из SEMrush
Обновление и улучшение пресетов для парсинга Авито и 2GIS

Парсинг Instagram
Instagram на сегодня является одним из самых популярных приложений для обмена фото с элементами социальной сети (осенью 2015 года аудитория превысила 400 млн пользователей). Такая популярность делает данный сервис привлекательным для парсинга, с целью получения различной информации. Как парсить Инстаграм с помощью А-Парсера - по ссылке выше.

Статистика по результатам парсинга
Начиная с версии 1.1.336 в А-Парсере появилась возможность вести и обрабатывать статистику парсинга, благодаря поддержке шаблонизатора в Начальном и Конечных текстах. Теперь в выдаче можно подсчитать количество ссылок на каждом домене, количество сабдоменов для каждого домена, частоту каждого сабдомена; получить списки доменов, имеющих сабдомены и многое другое... Несколько примеров показаны по ссылке выше.

Как сделать свой парсер подсказок?
В A-Parser уже существуют парсеры подсказок для Google, Yandex, AOL, Bing и Yahoo. Но есть и другие сервисы, которые также выдают подсказки. О том, как сделать свой парсер подсказок, а также примеры для Baidu, Rambler, Mail.Ru, LiveInternet, DuckDuckGo и GooglePlay смотрите по ссылке выше.

Кроме этого еще несколько рецептов:

В А-Парсере результат можно форматировать практически как угодно. О 4-х самых популярных форматах читайте в Обзоре вариантов представления результата на примере оценки позиций сайтов
У вебмастеров часто возникает задача поиска страниц с ошибками на сайте. И если это сайт-визитка, то решить ее можно вручную. А вот если это большой сайт, и не один... Тогда есть A-Parser: Универсальный чекер страниц
Улучшенные пресеты для парсинга 2GIS, Авито и пресет для парсинга трафика и стоимости по ключевым словам из SEMrush

Еще больше различных рецептов в нашем Каталоге примеров!

A-Parser Support

С нами с 03.06.13
Сообщения: 309
Рейтинг: 37

Добавлено: 29/02/16 в 10:02

цитата

A-Parser - 1.1.434 - парсинг частотности Яндекс.Директ с большой скоростью, улучшения использования памяти

В этой версии проделана большая работа по добавлению поддержки агрегации запросов. Теперь парсер частотности ключевых слов

SE::Yandex::Direct::Frequency может получать данные со скоростью 20000-50000 слов\минуту

Улучшения

Уменьшено потребление памяти при использовании большого числа потоков и\или нескольких парсеров в одном задании
Уменьшено потребление памяти при большой очереди завершенных заданий
В парсере SE::Yandex::Direct::Frequency добавлена возможность выбрать все регионы или выбрать несколько определенных
В парсере SE::Yandex::Direct::Frequency добавлена поддержка Яндекс аккаунтов, а так же поддержка AntiGate и парсинг по 500 ключевых слов за один запрос
В парсере SE::Yandex::Direct::Frequency добавлена возможность выбора периода за последний месяц, за определенный месяц, за квартал или за год
Для Windows и Linux улучшена поддержка юникода в именах файлах, независимо от языка интерфейса ОС
Добавлена возможность просматривать логи только неудачных запросов
В API добавлена возможность указать флаг removeOnComplete при добавлении задания, тем самым задания будут автоматически удалятся после завершения
В просмотре логов теперь можно выделить данные для копирования
В парсере Net::HTTP добавлен параметр Max cookies count, ограничивающий число Cookie для сохранения
В парсере Net::HTTP расширен список кодов ответов, а также добавлена возможность указать регулярное выражения для проверки кода ответа
В очереди заданий теперь можно искать необходимые задания по названию, номеру, подстроке в запросах, имени файлов запросов и результатов
В парсере HTML::LinkExtractor добавлена опция Check next page, позволяющая расширить логику перехода по ссылкам
Добавлена опция Page as new query, которая передает переход на следующую страницу как новый запрос, тем самым позволяя убрать ограничение на количество страниц для перехода

Исправления в связи с изменениями выдачи

В парсере SE::Yandex исправлен парсинг связанных ключевых слов
В парсере SE::Youtube исправлен парсинг количества видео по запросу
Исправлен парсинг Google Blogs в парсере SE::Google
Исправлены SE::AOL, SE::Ask, SE::Baidu, SE::Google, SE::Google::pR, SE::DisconnectMe, SE::QIP, SE::Yandex

Исправления

Исправлено отображение длинных выпадающих меню
Исправлена кодировка запросов в просмотре логов
Исправлено падение при использовании опции Parse to level в некоторых ситуациях
Исправлено падение в парсере SEO::ping
Прокси с авторизацией теперь сохраняются корректно в файл живых прокси alive.txt
Исправлена работа с прокси при указании пустой пары логин\пароль для авторизации
В парсере SE::Yandex::WordStat теперь при использовании опции Remove + from keywords плюсы удаляются также для фраз правого столбика
Исправлено экранирование символа + в HTTP запросах