С нами с 18.02.04
Сообщения: 498
Рейтинг: 126
|
Добавлено: 29/10/05 в 15:15 |
есть тхт файл в котором содержится дофига много кифраз,по одной на строку,среди них весьма много дублей,с помошью чего можно удалить все дубли,так чтоб фразы остались каждая оригинальная в единственном числе?
разные фразы могут состоять из одинаковых слов но стоящих в различном порядке,если фразы отличаются порядком слов,они тоже считаются оригинальными...
кто в курсе,подскажите пожалуйста,буду благодарен
|
|
|
|
С нами с 19.11.03
Сообщения: 3973
Рейтинг: 2362
|
Добавлено: 29/10/05 в 15:34 |
попробуй скриптом , если я тебя правильно понял , в папку с кейверд файлом ложишь скрипт
unique.php
Код: |
<?php
/**
* Путь к файлу на сервере
* сделай для папки в которой лежит файл chmod 0777
*/
$path = "/home/data/keywords.dat";
echo "Start...<br>";
$data = file($path);
$new_data = array_unique ($data);
$size = sizeof($new_data);
$f = fopen("new_keywords.dat","a");
for($counter=0;$counter<$size;$counter++)
fwrite($f,$new_data[$counter]."\n");
fclose($f);
echo "Complete";
exit;
?>
|
При условии что файл не большой , запускаешь скрипт и получаешь в этой же папке уже обработаный файл new_keywords.dat
|
|
|
|
С нами с 18.02.04
Сообщения: 498
Рейтинг: 126
|
Добавлено: 30/10/05 в 14:58 |
спаибо,попробую так
|
|
|
|
С нами с 26.09.03
Сообщения: 856
Рейтинг: 783
|
Добавлено: 30/10/05 в 16:36 |
господа, если дело происходит на сервере, то не стоит придумывать велосипед
Код: |
sort -u input_file > output_file
|
|
|
Фортуна улыбается тем, кого не замечает Фемида
|
3
|
|
|
С нами с 18.02.04
Сообщения: 498
Рейтинг: 126
|
Добавлено: 30/10/05 в 21:47 |
Twister писал: | господа, если дело происходит на сервере, то не стоит придумывать велосипед
Код: |
sort -u input_file > output_file
| |
ваабще-то мне нужно на локальной машине это сделать
|
|
|
|
С нами с 03.08.04
Сообщения: 129
Рейтинг: 263
|
Добавлено: 30/10/05 в 22:13 |
<?php
$fp = fopen("output.txt", "wt");
fputs($fp, join("", array_unique(file("input.txt"))));
fclose($fp);
?>
|
|
|
|
С нами с 26.09.03
Сообщения: 856
Рейтинг: 783
|
Добавлено: 30/10/05 в 23:06 |
Mon$teR писал: | ваабще-то мне нужно на локальной машине это сделать |
ну коли так то самое практичное
EditPlus, Tools>Sort, Remove duplicates
|
|
Фортуна улыбается тем, кого не замечает Фемида
|
3
|
|
|
С нами с 18.02.04
Сообщения: 498
Рейтинг: 126
|
Добавлено: 30/10/05 в 23:18 |
спасибо всем,попробую...
|
|
|
|
С нами с 07.01.04
Сообщения: 2868
Рейтинг: 1536
|
Добавлено: 30/10/05 в 23:55 |
ну, варианты анологичны тому, что я тебе в аське на пхп написал - чем не подходит?
|
|
|
|
С нами с 18.02.04
Сообщения: 498
Рейтинг: 126
|
Добавлено: 31/10/05 в 01:31 |
ещё раз сенкс,бро! =)
просто я думал может кто именно прогу подскажет,которая подобными фукциями обладает,чтоб на локалке её пустить...
PS: в твоей компетентности я ни разу не сомневался
|
|
|
|