Cleaner keywords — удаляем плохие ключевые слова

Cleaner keywords

Написал скрипт на PHP для очистки от плохих ключевых слов. Код ниже:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
<?php 
###############################################################
#
#	Cleaner keywords by beerhack from http://beerhack.name
#	ICQ: 274717
#
###############################################################

$filename = 'viagra.txt'; //Имя файла для очистки. Файл должен быть в той же директории где и сам скрипт
$lang = 'en'; //Допустимые буквы: ru - русские; en - английские ; ruen - русские и английские
$sym = '-.)($_€,"'.chr(39); //Допустимые символы. .chr(39) — это одинарная кавычка
 
/* настройки выше, ниже ничего не трогать */
 
for($i=0;$i<strlen($sym);$i++){
	$sympattern .= '\\'.$sym[$i];
}
if($lang=='en'){
	$pattern = "/[^a-zA-Z0-9 $sympattern]+/";
}elseif($lang=='ru'){
	$pattern = "/[^а-яА-Я0-9 $sympattern]+/";
}elseif($lang=='ruen'){
	$pattern = "/[^a-zA-Zа-яА-Я0-9 $sympattern]+/";
}
$keys = @file($filename); 
$fgood = fopen('good-'.$filename,'w'); //файл с очищенными кеями
$fbad = fopen('bad-'.$filename,'w'); //файл с отсеянными плохими кеями
foreach ($keys as $key) 
{ 
	$key = trim($key);
	if(!preg_match($pattern, $key)){
		fwrite($fgood,$key."\r\n");
	} else {
		fwrite($fbad,$key."\r\n");
	}
}
fclose($fgood); 
fclose($fbad); 
?>

Либо можно скачать по ссылке Cleaner keywords. Пароль к файлу: beerhack.name

В настройках скрипта можно задать:

  • Имя файла с ключевыми словами для очистки — переменная $filename. Текст файла должен быть в ANSI кодировке. Каждое ключевое слово должно быть с новой строки.
  • Допустимые буквы, русские или английские, или и те и другие — переменная $lang
  • Допустимые символы — переменная $sym

В результате будут созданы 2 текстовых файла: первый с приставкой good-, в нём будут записаны очищенные ключевые слова; второй файл с приставкой bad-, в нём будут записаны отсеянные плохие ключевые слова.

23.07.2012
Метки:

Комментарии:

  1. Спасибо!
    Утащил, к себе)
    Очень интересует скрипт, позволяющий очищать по стоплисту. Можете такой сделать?

    Ответить