+ + +
С нами с 12.07.03
Сообщения: 99
Рейтинг: 5
|
Добавлено: 26/03/08 в 13:47 |
|
|
|
|
С нами с 30.05.03
Сообщения: 2173
Рейтинг: 1141
|
Добавлено: 26/03/08 в 14:40 |
самый простой способ: открываешь этот тхт файл в экселе, делаешь знак & разделителем, и у тебя урлы будут в первом столбце
|
|
|
|
С нами с 21.09.03
Сообщения: 7329
Рейтинг: 2144
|
Добавлено: 26/03/08 в 14:55 |
cut -d\& -f1 file_in.txt > file_out.txt
|
|
|
|
+ + +
С нами с 12.07.03
Сообщения: 99
Рейтинг: 5
|
Добавлено: 26/03/08 в 16:32 |
Цитата: | cut -d\& -f1 file_in.txt > file_out.txt |
И что это означает? Куда и как это "втыкать"? Я же не программист
|
|
|
|
легионер МММ
С нами с 18.04.03
Сообщения: 6239
Рейтинг: 786
|
Добавлено: 26/03/08 в 16:43 |
Код: | <?
$path_to_in_file = 'in.txt';
$path_to_out_file = 'out.txt';
$arr_list = file($path_to_in_file);
$w = fopen($path_to_out_file,"w");
foreach($arr_list as $link)
{
$arr_res = parse_url($link);
fwrite($w,'http://'.$arr_res['host'].$arr_res['path']."\n");
}
fclose($w);
?> |
|
|
|
|
+ + +
С нами с 12.07.03
Сообщения: 99
Рейтинг: 5
|
Добавлено: 26/03/08 в 17:46 |
alt писал: | Код: | <?
$path_to_in_file = 'in.txt';
$path_to_out_file = 'out.txt';
$arr_list = file($path_to_in_file);
$w = fopen($path_to_out_file,"w");
foreach($arr_list as $link)
{
$arr_res = parse_url($link);
fwrite($w,'http://'.$arr_res['host'].$arr_res['path']."\n");
}
fclose($w);
?> | |
Что-то я не понял... Скрипт просто в конце всех ссылок дописывает двойное подчеркивание "__".
То есть, если было:
http://site.ru/page_1.html>[1]</a>
то делается:
http://site.ru/page_1.html>[1]</a>__
А нужно, чтобы делал:
http://site.ru/page_1.html
|
|
|
|
« ... full on ... »
С нами с 17.03.07
Сообщения: 670
Рейтинг: 1686
|
Добавлено: 26/03/08 в 18:03 |
Немного переделал вариант alt: ( parse_url не верно работает из-за того, что нет знака вопроса):
Код: | <?php
$path_to_in_file = 'in.txt';
$path_to_out_file = 'out.txt';
$arr_list = file($path_to_in_file);
$w = fopen($path_to_out_file,"w");
foreach($arr_list as $link)
{
$link = substr($link, 0, strpos($link, "&"));
fwrite($w, $link."\r\n");
}
fclose($w);
?> |
|
|
|
|
+ + +
С нами с 12.07.03
Сообщения: 99
Рейтинг: 5
|
Добавлено: 26/03/08 в 18:25 |
ADSenex писал: | Немного переделал вариант alt: (parse_url не верно работает из-за того, что нет знака вопроса):
Код: | <?php
$path_to_in_file = 'in.txt';
$path_to_out_file = 'out.txt';
$arr_list = file($path_to_in_file);
$w = fopen($path_to_out_file,"w");
foreach($arr_list as $link)
{
$link = substr($link, 0, strpos($link, "&"));
fwrite($w, $link."\r\n");
}
fclose($w);
?> | |
Этот вариант скрипта работает почти правильно. К сожалению, он удаляет из списка урлы, если они НЕ содержат в себе "мусора" (в файле 'in.txt'). Типа:
http://site.ru
http://site.ru/
http://site.ru/page.html
Нужно, чтобы такие "чистые" урлы в списке оставались, а не вылетали.
|
|
|
|
легионер МММ
С нами с 18.04.03
Сообщения: 6239
Рейтинг: 786
|
Добавлено: 26/03/08 в 19:02 |
violar писал: | Этот вариант скрипта работает почти правильно. К сожалению, он удаляет из списка урлы, если они НЕ содержат в себе "мусора" (в файле 'in.txt'). Типа:
http://site.ru
http://site.ru/
http://site.ru/page.html
Нужно, чтобы такие "чистые" урлы в списке оставались, а не вылетали. |
=))
делаешь так:
Код: | <?php
$path_to_in_file = 'in.txt';
$path_to_out_file = 'out.txt';
$arr_list = file($path_to_in_file);
$w = fopen($path_to_out_file,"w");
foreach($arr_list as $link)
{
if(eregi("&",$link)) $link = substr($link, 0, strpos($link, "&"));
fwrite($w, $link."\r\n");
}
fclose($w);
?> |
|
|
|
|
127.0.0.1
С нами с 26.04.06
Сообщения: 1092
Рейтинг: 557
|
Добавлено: 26/03/08 в 23:34 |
все намного проще:
Код: |
<?
$in="1.txt";
$out="2.txt";
$z=fopen($out,"w");
foreach(file($in) as $str) {
fputs($z,substr($str,0,strpos($str,".html")+5)."\n");
}
fclose($z);
?>
|
|
|
|
|
С нами с 21.09.03
Сообщения: 7329
Рейтинг: 2144
|
Добавлено: 27/03/08 в 00:07 |
violar писал: | И что это означает? Куда и как это "втыкать"? |
Это командная строка unix. Специально придуманная фишка для "непрограммистов". Без всяких скриптов в один "пук" решается твоя задача. file_in.txt - текстовый файл с исходными урлами. file_out.txt - текстовый файл с результатом.
Цитата: | Я же не программист |
Ну мне как-то отсюда не видно, сорри Ну раз уж не программист, то занимайся "скриптами"
|
|
|
|
♥♥♥
С нами с 28.08.04
Сообщения: 7098
Рейтинг: 5671
|
Добавлено: 27/03/08 в 00:47 |
нотепад++
там замена с регэкспами есть
очень быстрый вариант
|
|
|
|
легионер МММ
С нами с 18.04.03
Сообщения: 6239
Рейтинг: 786
|
Добавлено: 27/03/08 в 04:10 |
localhost писал: | все намного проще:
|
Нет, ты не прав, все намного проще
=)))
Код: |
<?
$in="1.txt";
$out="2.txt";
$z=fopen($out,"w");
foreach(file($in) as $str) fputs($z,substr($str,0,strpos($str,".html")+5)."\n");
fclose($z);
?>
|
|
|
|
|
+ + +
С нами с 12.07.03
Сообщения: 99
Рейтинг: 5
|
Добавлено: 27/03/08 в 21:40 |
alt писал: |
Код: | <?php
$path_to_in_file = 'in.txt';
$path_to_out_file = 'out.txt';
$arr_list = file($path_to_in_file);
$w = fopen($path_to_out_file,"w");
foreach($arr_list as $link)
{
if(eregi("&",$link)) $link = substr($link, 0, strpos($link, "&"));
fwrite($w, $link."\r\n");
}
fclose($w);
?> | |
Спасибо! Это именно то, что мне нужно...
|
|
|
|