SexBlogs.Name
С нами с 13.10.03
Сообщения: 3159
Рейтинг: 962
|
Добавлено: 14/11/05 в 19:46 |
Возможно ли скриптом рапознать поля на сайте? Тоесть заходим на страницу ищем поля - распознаем хуизху - пляшем дальше?
может некоректно слегка написано - но понятно я думаю..
|
|
|
|
С нами с 07.01.04
Сообщения: 2868
Рейтинг: 1536
|
Добавлено: 14/11/05 в 19:48 |
В форме что ли?
Возможно конечно.
|
|
|
|
SexBlogs.Name
С нами с 13.10.03
Сообщения: 3159
Рейтинг: 962
|
Добавлено: 14/11/05 в 19:59 |
ага в форме
и как понять для урла эта форма.. или для имени или же для мыла? точне как заставить скрипт понять
|
|
|
|
С нами с 07.01.04
Сообщения: 2868
Рейтинг: 1536
|
Добавлено: 14/11/05 в 20:16 |
Ну вебмастер может от балды любые имена этим полям дать. Например f1 и f2
|
|
|
|
SexBlogs.Name
С нами с 13.10.03
Сообщения: 3159
Рейтинг: 962
|
Добавлено: 14/11/05 в 20:26 |
может
потому и спросил как это организовать что бы получалось как можно меньше нераспознанных... методика может какая есть..
|
|
|
|
С нами с 03.08.04
Сообщения: 129
Рейтинг: 263
|
Добавлено: 14/11/05 в 21:00 |
можно смотреть текст рядом с полем... или хотя бы в рамках одной <TR>...</TR>
составить словарик для каждого типа поля (опытным путем)
|
|
|
|
Genuine Quality
С нами с 28.08.05
Сообщения: 652
Рейтинг: 910
|
Добавлено: 14/11/05 в 21:03 |
100% не распознаешь, если для общего случая делать, а вот сделать вероятность побольше можно, статистическим методом например...
имхо, это единственная возможность. + еще ручное обучение, могло бы оч. неплохо получиться
|
|
|
|
SexBlogs.Name
С нами с 13.10.03
Сообщения: 3159
Рейтинг: 962
|
Добавлено: 14/11/05 в 21:16 |
bjim писал: | можно смотреть текст рядом с полем... или хотя бы в рамках одной <TR>...</TR>
составить словарик для каждого типа поля (опытным путем) |
это я и вижу реально возможным вариантом ну еще конечно посмотреть названия полей ...
вот тут спросил может есть что лучше...
кстати а нет ли готового скриптика подобного где нить? то есть чисто скрипта-анализатора-самообучалки?
|
|
|
|
С нами с 07.01.04
Сообщения: 2868
Рейтинг: 1536
|
Добавлено: 14/11/05 в 21:30 |
Я писал когда-то, но без самообучения. Пишется элементарно.
|
|
|
|
С нами с 07.06.00
Сообщения: 3516
Рейтинг: 1802
|
Добавлено: 15/11/05 в 00:41 |
100% поможет только ручное обучение. Анализаторы соседних тегов -- довольно геморная процедура, да и где гарантия, что анализатор захватит именно "нужный" текст описания поля.
Софтина обучается легко, т.к. обрабатывающих скриптов достаточно ограниченное количество => достаточно быстро получишь повторяемость названий полей (переменных).
|
|
|
|
SexBlogs.Name
С нами с 13.10.03
Сообщения: 3159
Рейтинг: 962
|
Добавлено: 15/11/05 в 06:12 |
ага ясно всем спасибо
последний вопрос - под обучаемостью тут понимается ручное добавление названий полей в сам скрипт на основании анализа какогото определенного колличества страниц.
|
|
|
|
С нами с 03.08.04
Сообщения: 129
Рейтинг: 263
|
Добавлено: 15/11/05 в 07:25 |
Наверное можно и так - но в общем виде обучение выглядит имхо так: показываем скрипту поле - указываем, какого класса это поле (логин, емайл, и т.д.). А скрипт уже сам должен сделать для себя выводы (смотреть, что там рядом, какое имя поля и т.д.).
И так N раз. Пока он сам не начнет догадываться.
|
|
|
|
С нами с 07.06.00
Сообщения: 3516
Рейтинг: 1802
|
Добавлено: 15/11/05 в 07:37 |
Скрипт парсит форму. Пытается заполнить. Ручная проверка. Если поля заполнены не верно далее:
bjim > ... показываем скрипту поле - указываем, какого класса это поле (логин, емайл, и т.д.). А скрипт уже сам должен сделать для себя выводы (смотреть, что там рядом, какое имя поля и т.д.).
И так N раз. Пока он сам не начнет догадываться.
|
|
|
|
SexBlogs.Name
С нами с 13.10.03
Сообщения: 3159
Рейтинг: 962
|
Добавлено: 15/11/05 в 07:54 |
понял спасибо
|
|
|
|
С нами с 07.06.00
Сообщения: 3516
Рейтинг: 1802
|
Добавлено: 15/11/05 в 08:00 |
еще... вполне целесообразно заносить в базу УРЛ распознанной страницы, имя (если удалось опознать) обрабатывающего движка (скрипта) и его характерные особенности (например какая-нибудь фраза или специфическое хиден-поле). Эта инфа может понадобится для дальнейшего анализа и и облегчения "самостоятельной" деятельности скрипта.
|
|
|
|
SexBlogs.Name
С нами с 13.10.03
Сообщения: 3159
Рейтинг: 962
|
Добавлено: 15/11/05 в 08:57 |
ага ок так и будем делать
|
|
|
|
SexBlogs.Name
С нами с 13.10.03
Сообщения: 3159
Рейтинг: 962
|
Добавлено: 15/11/05 в 12:31 |
кстати а сколько может стоить подобный скрипт?
то есть чисто само ядро (обучалка - распозновалка) ...
ну то есть я непрограмер к сожалению - если примерно прикинуть объем работ...
|
|
|
|
С нами с 16.04.05
Сообщения: 754
Рейтинг: 352
|
Добавлено: 16/11/05 в 01:42 |
200 $ - (анализатор + постер (shell + web))
307-032-118
|
|
|
|
Bitcoin
С нами с 18.11.01
Сообщения: 4709
Рейтинг: 3066
|
Добавлено: 16/11/05 в 03:45 |
Посмотри как в скрипте адам сабмиттера сделано.
|
|
Tube.Cash выкупит ваш трафик на галеры, заплатит за переходы с эмбедов
|
5
|
|
|