Суть:
Есть файлы с кучей строк вида:
Код: |
51687a|885|0|0|0|0|http://mycj.com/galleries/2a21d1/|http://mycj.com/porn/thumbs/51687a.jpg||fat webmaster jerkin' on stats|159|212||10|http://divinesponsor.com/gallery/0456/index.php|Pictures|1312650621|none|1|2a21d1|| |
Скрипт запускаеца по крону раз в неделю, скажем, берёт этот файл по указанному пути domain.com/porn/data/*_base.dat (по маске, доменов и файлов много), копирует его себе в /tmp. Затем парсит из каждой строки первый урл (в примере он
http://mycj.com/galleries/2a21d1/ , это галера) и ломится на него. Если урл (он может быть как на серваке со скриптом, так и на хосте спонсора, FHG) вернул 200 - берёт следующую строку, если урл не 200 - удаляет эту строку целиком из файла (записав её в первозданном виде в deleted.log), копирует урл тумбы (второй урл в примере) к себе в /tmp, и берёт следующую строку. Переколбасив весь файл и удалив строки, галеры в которых не 200 (скорее всего те, которые 404 и те, которые редирект куда-то там) - копирует файл с результатом туда, где он его взял изначально (обратно в domain.com/porn/data/) с исходным именем. Сразу после копирования проверяет размер файла (это ротатор, файл - его база, у него свой крон и файл может оказаться недописанным если процессы совпадут по времени), если размеры разные - копирует ещё раз и проверяет - короче пока файлы не будут эдентичные. Затем удаляет тумбы из созданного списка (если это возможно, т.е. тумба не лежит на другом серваке), ненужные. Затем берёт новый файл.
Доменов в корне десятки, файлов в каталоге может быть с нужной маской тоже десятки (мультиниш), строк в файле может быть десятки тысяч. Возможна работа по конфигу (пути к каталогу с базой ротаторов), но лучше чтоб он по маске тупо хуячил, ибо иначе я буду забывать вписать новые домены (склероз, алкоголизм, недосыпание - даром не проходят
).
Написать надо срочно, ибо конкретно лопухнулся и часть своих галер сейчас 404 висит, сцуко
Написать надо грамотно, т.к. потестировать его мона только на живой базе ротатора и вообще дело ответственное - то, что живое удалять низя.
p.s. Афтар может потом данный скрипт барыжить пользователям dtr ротатора, под эгидой "вычисти свои ротаторы от галерей спонсоров, которые, блять, подохли или редиректят с галер трафик на всякую, не продающуюся, ёбань".
Последний раз редактировалось: Woland (10/09/11 в 23:03), всего редактировалось 1 раз