diff -urN spamoracle-1.2-orig/Makefile spamoracle-1.2/Makefile --- spamoracle-1.2-orig/Makefile 2002-08-26 12:53:27 +0400 +++ spamoracle-1.2/Makefile 2002-10-25 19:58:12 +0400 @@ -1,7 +1,7 @@ ### Configuration section # The laguages you're interested in, besides English -LANGUAGES=-DFRENCH #-DSPANISH -DITALIAN -DGERMAN +LANGUAGES=-DFRENCH -DRUSSIAN -DGERMAN #-DSPANISH -DITALIAN # How to invoke the C preprocessor CPP=gcc -E -P $(LANGUAGES) - diff -urN spamoracle-1.2-orig/README.RUS spamoracle-1.2/README.RUS --- spamoracle-1.2-orig/README.RUS 1970-01-01 03:00:00 +0300 +++ spamoracle-1.2/README.RUS 2002-10-25 20:09:50 +0400 @@ -0,0 +1,9 @@ + + В данной версии добавлена поддержка русских кодировок (работает +для KOI8-R и CP1251). Unicode не работает, но и за спам не считается. +Проверено на достаточно большой базе. + +-- + + vsl@altlinux.ru + diff -urN spamoracle-1.2-orig/wordsplit.mlp spamoracle-1.2/wordsplit.mlp --- spamoracle-1.2-orig/wordsplit.mlp 2002-08-26 13:35:26 +0400 +++ spamoracle-1.2/wordsplit.mlp 2002-10-25 21:04:30 +0400 @@ -35,10 +35,10 @@ aaaaaaeceeeeiiii\ ПnoooooВouuuuypy" -let normalize s = - for i = 0 to String.length s - 1 do - s.[i] <- tbl.[Char.code s.[i]] - done +let normalize s = s +(* for i = 0 to String.length s - 1 do + s.[i] <- tbl.[Char.code s.[i]] + done *) } @@ -62,6 +62,10 @@ '\164' (* Euro *) 'д' 'ж' 'э' 'Д' 'Ж' 'Э' 'ъ' #endif +#ifdef RUSSIAN + 'а' 'б' 'в' 'г' 'д' 'е' 'ё' 'ж' 'з' 'и' 'й' 'к' 'л' 'м' 'н' 'о' 'п' 'р' 'с' 'т' 'у' 'ф' 'х' 'ц' 'ч' 'ш' 'щ' 'ъ' 'ы' 'ь' 'э' 'ю' 'я' + 'А' 'Б' 'В' 'Г' 'Д' 'Е' 'Ё' 'Ж' 'З' 'И' 'Й' 'К' 'Л' 'М' 'Н' 'О' 'П' 'Р' 'С' 'Т' 'У' 'Ф' 'Х' 'Ц' 'Ч' 'Ш' 'Щ' 'Ъ' 'Ы' 'Ь' 'Э' 'Ю' 'Я' +#endif ] let uppercase_letter =