Внимание! В связи с устареванием топика эта страница была взята из кэша.
|
Guest
Зарегистрирован: 16.03.03
Сообщения: 167
|
Добавлено: 02/09/04 в 20:51
|
|
Подскажите софт или скрипт (сервис), который позволяет любую страничку с графикой представить как голый текст. т.е. замену alt тегов но текст и прочего. типа того, как гугл с кешированными страниами позволяет сотворить. но хотелось бы с html'ками на локале
|
K началу
|
|
|
dDan
Зарегистрирован: 18.08.04
Сообщения: 632
|
Добавлено: 02/09/04 в 21:02
|
|
Это твой браузер может сделать Вид->В виде HTML
|
K началу
|
|
|
pivo
Зарегистрирован: 12.08.04
Сообщения: 52
|
Добавлено: 03/09/04 в 03:07
|
|
вид>просмотр хтмл кода> и правишь его в блокноте ...ctrl+S - сохраняешь
|
K началу
|
|
|
maul
Зарегистрирован: 09.11.03
Сообщения: 1151
|
Добавлено: 03/09/04 в 03:22
|
|
Помедленней, я записываю  Честно говоря, не очень что-то понятно чего хочет топикстартер. Видимо какой-то онлайн сервис, который показывает html-код страницы. Но зачем?
|
K началу
|
|
|
Ded
Зарегистрирован: 25.01.03
Сообщения: 649
|
Добавлено: 03/09/04 в 04:24
|
|
Guest писал: | Подскажите софт или скрипт (сервис), который позволяет любую страничку с графикой представить как голый текст. т.е. замену alt тегов но текст и прочего. типа того, как гугл с кешированными страниами позволяет сотворить. но хотелось бы с html'ками на локале |
в пхп есть оператор который вытаскивает весь текст без всяких тегов. то есть написание скрипта сводится нахождению этой функции в доках пхп.
|
K началу
|
|
|
Guest
Зарегистрирован: 16.03.03
Сообщения: 167
|
Добавлено: 03/09/04 в 18:37
|
|
Поясняю на примере lenta.ru - как это делает гугл вот скешированная страничка: http://216.239.59.104/search?q=cache:AkjfaAgLhGYJ:www.lenta.ru/+lenta.ru&hl=en&ie=UTF-8 т.е. баннеры, картинки - все как есть а вот как мне надо - картинок нет страничка - чистый текст http://216.239.59.104/search?q=cache:AkjfaAgLhGYJ:www.lenta.ru/+lenta.ru&hl=en&lr=&ie=UTF-8&strip=1 Т.е. мне не надо сам html код мне нужна страничка, такая какой ее видит серфер и с заменой графики на содержимое alt и tittle'ов
|
K началу
|
|
|
iSEX
Зарегистрирован: 08.06.04
Сообщения: 579
|
Добавлено: 03/09/04 в 20:28
|
|
pivo писал: | и правишь его в блокноте ...ctrl+S - сохраняешь |
В блокноте не работает сочетание клавиш "ctrl+S"...
|
K началу
|
|
|
exFinancier
Зарегистрирован: 04.04.04
Сообщения: 357
|
Добавлено: 03/09/04 в 20:32
|
|
iSEX писал: | В блокноте не работает сочетание клавиш "ctrl+S"...  |
еще как работает
|
K началу
|
|
|
dDan
Зарегистрирован: 18.08.04
Сообщения: 632
|
Добавлено: 03/09/04 в 20:45
|
|
Както непонятно что именно тебе надо поподробней можно
|
K началу
|
|
|
iSEX
Зарегистрирован: 08.06.04
Сообщения: 579
|
Добавлено: 03/09/04 в 20:58
|
|
exFinancier писал: | еще как работает |
Да, действительно, в XP такое сочетание клавиш работает. Не работает в блокноте от Win 98
|
K началу
|
|
|
Guest
Зарегистрирован: 16.03.03
Сообщения: 167
|
Добавлено: 03/09/04 в 21:58
|
|
Ded писал: | в пхп есть оператор который вытаскивает весь текст без всяких тегов. то есть написание скрипта сводится нахождению этой функции в доках пхп. |
Порылся, нашел только функцию выдирающую мета теги. Может вспомнишь как функция приблизительно называется? может нестандартная она?
|
K началу
|
|
|
webboxxx
Зарегистрирован: 06.03.03
Сообщения: 405
|
Добавлено: 03/09/04 в 22:51
|
|
string strip_tags ( string str [, string allowable_tags])
|
K началу
|
|
|
just_beginner
Зарегистрирован: 07.05.04
Сообщения: 606
|
Добавлено: 04/09/04 в 01:40
|
|
2Topicstarter: Поройся в разделе "Функции обработки строк". Думаю что для скрипта там много полезного найдешь.
|
K началу
|
|
|
begemot
Зарегистрирован: 25.12.03
Сообщения: 172
|
Добавлено: 04/09/04 в 17:30
|
|
Guest: я кажется знаю что ты хочешь, скажи - тебе с сохранением структуры страницы (отступы и тд) или тупо текст выдрать ?
|
K началу
|
|
|
Guest
Зарегистрирован: 16.03.03
Сообщения: 167
|
Добавлено: 05/09/04 в 12:40
|
|
begemot писал: | Guest: я кажется знаю что ты хочешь, скажи - тебе с сохранением структуры страницы (отступы и тд) или тупо текст выдрать ? |
В идеале - с сохранением структы Идеально - для делфи Но счас потянет все, лучше с открытым кодом:)
|
K началу
|
|
|
begemot
Зарегистрирован: 25.12.03
Сообщения: 172
|
Добавлено: 05/09/04 в 14:28
|
|
Guest писал: | В идеале - с сохранением структы Идеально - для делфи Но счас потянет все, лучше с открытым кодом:) |
под linux есть lynx, он умеет сохранять дамп web страницы в виде отформатированного текста, не знаю есть ли версия под WIN. Еще помню что в перле есть библиотека для этих целей, из раздела HTML::Parser
|
K началу
|
|
|
Nikola
Зарегистрирован: 19.07.01
Сообщения: 2246
|
Добавлено: 05/09/04 в 15:37
|
|
iSEX писал: | Да, действительно, в XP такое сочетание клавиш работает. Не работает в блокноте от Win 98  |
Вы ещё пользуетесь этим недоделанным подобием текстового редактора?
|
K началу
|
|
|
iSEX
Зарегистрирован: 08.06.04
Сообщения: 579
|
Добавлено: 05/09/04 в 16:55
|
|
Nikola писал: | Вы ещё пользуетесь этим недоделанным подобием текстового редактора?  |
Мне 98 винда нравится больше, чем ХР  А блокнотом иногда многим приходится пользоваться. Например, чтобы быстренько исходный код паги отредактировать. F4 и понеслась... А вот сохранять не совсем удобно без традиционного Ctrl +S
|
K началу
|
|
|
Nikola
Зарегистрирован: 19.07.01
Сообщения: 2246
|
Добавлено: 06/09/04 в 22:17
|
|
iSEX писал: | Мне 98 винда нравится больше, чем ХР  А блокнотом иногда многим приходится пользоваться. Например, чтобы быстренько исходный код паги отредактировать. F4 и понеслась... А вот сохранять не совсем удобно без традиционного Ctrl +S  |
Не, во-первых у меня тже есть 98 на одной партиции. А во-вторых про то что блокнот давно уже заменил на более удобный редактор.
|
K началу
|
|
|
iSEX
Зарегистрирован: 08.06.04
Сообщения: 579
|
Добавлено: 07/09/04 в 07:46
|
|
Nikola писал: | Не, во-первых у меня тже есть 98 на одной партиции. А во-вторых про то что блокнот давно уже заменил на более удобный редактор. |
Я тоже пользуюсь более удобным Ultra Edit, но бывает срочняком нужно открыть код, тогда на помощь приходит старый блокнот  Тем более что запускается он из WinCommander одной клавишей F3/F4
|
K началу
|
|
|
MIR
Зарегистрирован: 03.02.03
Сообщения: 964
|
Добавлено: 07/09/04 в 10:09
|
|
Guest писал: | Идеально - для делфи Но счас потянет все, лучше с открытым кодом:) |
Есть такая штучка - Delphi World ( http://www.delphiworld.narod.ru/ ) - там здоровенная подборка кусков кода на всякие разные темы. Вот оттуда (работоспособность не проверял):
Код: | Как получить текст HTML Документа из TWebBrowser без тегов:
uses mshtml, activex;
procedure GetHtmlCode(WebBrowser: TWebBrowser; FileName: string); var htmlDoc: IHtmlDocument2; PersistFile: IPersistFile; begin htmlDoc := WebBrowser.document as IHtmlDocument2; PersistFile := HTMLDoc as IPersistFile; PersistFile.save(StringToOleStr(FileName), true); end;
|
Код: | Как получить текст HTML Документа из TWebBrowser без тегов 2: var Document: IHTMLDocument2; begin Document := WB.Document as IHtmlDocument2; if Document < > nil then Memo1.Text := (Document.all.Item(NULL, 0) as IHTMLElement).OuterHTML;
|
Или еще проще - сохраняешь HTML в файл, потом читаешь оттуда посимвольно, если встретился тэг < до тех пор пока не закрылся > игнорируешь символы, иначе пишешь в выходной файл.
|
K началу
|
|
|