Реклама на сайте Advertise with us
Тема: Html страничку как текст Расширенный поиск по форуму
 
Внимание! В связи с устареванием топика эта страница была взята из кэша.
Автор Сообщение
Информация о пользователе Guest


Зарегистрирован: 16.03.03
Сообщения: 167
Ссылка на сообщениеДобавлено: 02/09/04 в 20:51     

Подскажите софт или скрипт (сервис), который позволяет любую страничку с графикой представить как голый текст.
т.е. замену alt тегов но текст и прочего. типа того, как гугл с кешированными страниами позволяет сотворить. но хотелось бы с html'ками на локале

K началу

 
Информация о пользователе dDan


Зарегистрирован: 18.08.04
Сообщения: 632
Ссылка на сообщениеДобавлено: 02/09/04 в 21:02     

Это твой браузер может сделать Вид->В виде HTML

K началу

 
Информация о пользователе pivo


Зарегистрирован: 12.08.04
Сообщения: 52
Ссылка на сообщениеДобавлено: 03/09/04 в 03:07     

вид>просмотр хтмл кода>

и правишь его в блокноте ...ctrl+S - сохраняешь

K началу

 
Информация о пользователе maul


Зарегистрирован: 09.11.03
Сообщения: 1151
Ссылка на сообщениеДобавлено: 03/09/04 в 03:22     

Помедленней, я записываю icon_smile.gif
Честно говоря, не очень что-то понятно чего хочет топикстартер. Видимо какой-то онлайн сервис, который показывает html-код страницы. Но зачем?

K началу

 
Информация о пользователе Ded


Зарегистрирован: 25.01.03
Сообщения: 649
Ссылка на сообщениеДобавлено: 03/09/04 в 04:24     

Guest писал:
Подскажите софт или скрипт (сервис), который позволяет любую страничку с графикой представить как голый текст.
т.е. замену alt тегов но текст и прочего. типа того, как гугл с кешированными страниами позволяет сотворить. но хотелось бы с html'ками на локале


в пхп есть оператор который вытаскивает весь текст без всяких тегов.
то есть написание скрипта сводится нахождению этой функции в доках пхп.

K началу

 
Информация о пользователе Guest


Зарегистрирован: 16.03.03
Сообщения: 167
Ссылка на сообщениеДобавлено: 03/09/04 в 18:37     

Поясняю на примере lenta.ru - как это делает гугл
вот скешированная страничка:
http://216.239.59.104/search?q=cache:AkjfaAgLhGYJ:www.lenta.ru/+lenta.ru&hl=en&ie=UTF-8
т.е. баннеры, картинки - все как есть
а вот как мне надо - картинок нет страничка - чистый текст
http://216.239.59.104/search?q=cache:AkjfaAgLhGYJ:www.lenta.ru/+lenta.ru&hl=en&lr=&ie=UTF-8&strip=1
Т.е. мне не надо сам html код мне нужна страничка, такая какой ее видит серфер и с заменой графики на содержимое alt и tittle'ов

K началу

 
Информация о пользователе iSEX


Зарегистрирован: 08.06.04
Сообщения: 579
Ссылка на сообщениеДобавлено: 03/09/04 в 20:28     

pivo писал:
и правишь его в блокноте ...ctrl+S - сохраняешь


В блокноте не работает сочетание клавиш "ctrl+S"... icon_smile.gif

K началу

 
Информация о пользователе exFinancier


Зарегистрирован: 04.04.04
Сообщения: 357
Ссылка на сообщениеДобавлено: 03/09/04 в 20:32     

iSEX писал:
В блокноте не работает сочетание клавиш "ctrl+S"... icon_smile.gif


еще как работает smail125.gif

K началу

 
Информация о пользователе dDan


Зарегистрирован: 18.08.04
Сообщения: 632
Ссылка на сообщениеДобавлено: 03/09/04 в 20:45     

Както непонятно что именно тебе надо поподробней можно

K началу

 
Информация о пользователе iSEX


Зарегистрирован: 08.06.04
Сообщения: 579
Ссылка на сообщениеДобавлено: 03/09/04 в 20:58     

exFinancier писал:
еще как работает


Да, действительно, в XP такое сочетание клавиш работает.
Не работает в блокноте от Win 98 icon_smile.gif

K началу

 
Информация о пользователе Guest


Зарегистрирован: 16.03.03
Сообщения: 167
Ссылка на сообщениеДобавлено: 03/09/04 в 21:58     

Ded писал:
в пхп есть оператор который вытаскивает весь текст без всяких тегов.
то есть написание скрипта сводится нахождению этой функции в доках пхп.

Порылся, нашел только функцию выдирающую мета теги.
Может вспомнишь как функция приблизительно называется?
может нестандартная она?

K началу

 
Информация о пользователе webboxxx


Зарегистрирован: 06.03.03
Сообщения: 405
Ссылка на сообщениеДобавлено: 03/09/04 в 22:51     

string strip_tags ( string str [, string allowable_tags])

K началу

 
Информация о пользователе just_beginner


Зарегистрирован: 07.05.04
Сообщения: 606
Ссылка на сообщениеДобавлено: 04/09/04 в 01:40     

2Topicstarter: Поройся в разделе "Функции обработки строк". Думаю что для скрипта там много полезного найдешь.

K началу

 
Информация о пользователе begemot


Зарегистрирован: 25.12.03
Сообщения: 172
Ссылка на сообщениеДобавлено: 04/09/04 в 17:30     

Guest:
я кажется знаю что ты хочешь,
скажи - тебе с сохранением структуры страницы (отступы и тд) или
тупо текст выдрать ?

K началу

 
Информация о пользователе Guest


Зарегистрирован: 16.03.03
Сообщения: 167
Ссылка на сообщениеДобавлено: 05/09/04 в 12:40     

begemot писал:
Guest:
я кажется знаю что ты хочешь,
скажи - тебе с сохранением структуры страницы (отступы и тд) или
тупо текст выдрать ?

В идеале - с сохранением структы
Идеально - для делфи
Но счас потянет все, лучше с открытым кодом:)

K началу

 
Информация о пользователе begemot


Зарегистрирован: 25.12.03
Сообщения: 172
Ссылка на сообщениеДобавлено: 05/09/04 в 14:28     

Guest писал:
В идеале - с сохранением структы
Идеально - для делфи
Но счас потянет все, лучше с открытым кодом:)

под linux есть lynx,
он умеет сохранять дамп web страницы в виде отформатированного текста, не знаю есть ли версия под WIN.
Еще помню что в перле есть библиотека для этих целей, из раздела HTML::Parser

K началу

 
Информация о пользователе Nikola


Зарегистрирован: 19.07.01
Сообщения: 2246
Ссылка на сообщениеДобавлено: 05/09/04 в 15:37     

iSEX писал:
Да, действительно, в XP такое сочетание клавиш работает.
Не работает в блокноте от Win 98 icon_smile.gif


Вы ещё пользуетесь этим недоделанным подобием текстового редактора? icon_smile.gif

K началу

 
Информация о пользователе iSEX


Зарегистрирован: 08.06.04
Сообщения: 579
Ссылка на сообщениеДобавлено: 05/09/04 в 16:55     

Nikola писал:
Вы ещё пользуетесь этим недоделанным подобием текстового редактора? icon_smile.gif


Мне 98 винда нравится больше, чем ХР icon_smile.gif
А блокнотом иногда многим приходится пользоваться. Например, чтобы быстренько исходный код паги отредактировать. F4 и понеслась... А вот сохранять не совсем удобно без традиционного Ctrl +S icon_sad.gif

K началу

 
Информация о пользователе Nikola


Зарегистрирован: 19.07.01
Сообщения: 2246
Ссылка на сообщениеДобавлено: 06/09/04 в 22:17     

iSEX писал:
Мне 98 винда нравится больше, чем ХР icon_smile.gif
А блокнотом иногда многим приходится пользоваться. Например, чтобы быстренько исходный код паги отредактировать. F4 и понеслась... А вот сохранять не совсем удобно без традиционного Ctrl +S icon_sad.gif


Не, во-первых у меня тже есть 98 на одной партиции. А во-вторых про то что блокнот давно уже заменил на более удобный редактор.

K началу

 
Информация о пользователе iSEX


Зарегистрирован: 08.06.04
Сообщения: 579
Ссылка на сообщениеДобавлено: 07/09/04 в 07:46     

Nikola писал:
Не, во-первых у меня тже есть 98 на одной партиции. А во-вторых про то что блокнот давно уже заменил на более удобный редактор.


Я тоже пользуюсь более удобным Ultra Edit, но бывает срочняком нужно открыть код, тогда на помощь приходит старый блокнот icon_smile.gif
Тем более что запускается он из WinCommander одной клавишей F3/F4 icon_smile.gif

K началу

 
Информация о пользователе MIR


Зарегистрирован: 03.02.03
Сообщения: 964
Ссылка на сообщениеДобавлено: 07/09/04 в 10:09     

Guest писал:
Идеально - для делфи
Но счас потянет все, лучше с открытым кодом:)


Есть такая штучка - Delphi World ( http://www.delphiworld.narod.ru/ )
- там здоровенная подборка кусков кода на всякие разные темы. Вот оттуда (работоспособность не проверял):
Код:

Как получить текст HTML Документа из TWebBrowser без тегов:

uses mshtml, activex;

procedure GetHtmlCode(WebBrowser: TWebBrowser; FileName: string);
var
htmlDoc: IHtmlDocument2;
PersistFile: IPersistFile;
begin
htmlDoc := WebBrowser.document as IHtmlDocument2;
PersistFile := HTMLDoc as IPersistFile;
PersistFile.save(StringToOleStr(FileName), true);
end;


Код:

Как получить текст HTML Документа из TWebBrowser без тегов 2:
var
  Document: IHTMLDocument2;
begin
Document := WB.Document as IHtmlDocument2;
if Document < >  nil then
   Memo1.Text := (Document.all.Item(NULL, 0) as IHTMLElement).OuterHTML;


Или еще проще - сохраняешь HTML в файл, потом читаешь оттуда посимвольно, если встретился тэг < до тех пор пока не закрылся > игнорируешь символы, иначе пишешь в выходной файл.

K началу

 
Текстовая реклама в форме ответа
Заголовок и до четырех строчек текста
Длина текста до 350 символов
Купить рекламу в этом месте!
Внимание! В связи с устареванием топика эта страница была взята из кэша.

Спонсор раздела Стань спонсором этого раздела!

Реклама на сайте Advertise with us

Опросы

Рецепт новогоднего блюда 2022



Обсудите на форуме обсудить (11)
все опросы »