11

Odp: Regula 2.0.6

dorzuciłbym się do tematu bo też chodzi mi o regulę
specyfikacja: TB 3.65.03, regula 2.1.0
ustawiłem wsio jak w helpie opisano, natomiast w zakładce BAYES wartość spam score ustawiłęm na powyżej 350 a ham na poniżej 0
w ogólnych: przerwij sprawdzanie dla score 600
(przenoszenie do śmieci powyżej 99)
jak sprawdzam regula managerem logi:
(przykładowa wiadomość)

=== BEGIN MESSAGE at 2006-06-30 14:15:54 ===
Subject: RF Online Final Now Live!
Sender:  "Codemasters" <codem@codemasters.com>
Date:    30 Jun 2006 01:44:09 +0100
Msg-Id:  <YOSEMITEThRKkvRdNuo0001fdde@mail.codemasters.com>
Match: Simple rule "RcvAllDomains" (RCV_SPAMMER_DOMAIN: o2.pl), score: 0.
Match: RegExp rule "Text" (TEXT_WITH_NUMBERS: Digits between letters), score: 80.
Match: RegExp rule "Text" (TEXT_UPPERCASE_WORDS: Several words in upper case letters), score: 50.
Match: Simple rule "UrlArgList" (HTML_LNK_ARGS: Arguments in URL), score: 40.
Match: Simple rule "TextWord" (TEXT_BAD_WORD: Free), score: 40.
Match: Simple rule "Text" (TEXT_BAD_WORD: Gain), score: 50.
Match: Simple rule "SpamSubjText" (TEXT_BAD_WORD: Offer), score: 40.
Match: Simple rule "Text" (TEXT_BAD_WORD: Pay), score: 40.
Match: Simple rule "Text" (TEXT_BAD_WORD: Purchase), score: 50.
Match: Simple rule "SpamSubjText" (SUBJTEXT_BAD_WORD: Promotion), score: 40.
Match: Simple rule "SpamText" (TEXT_BAD_WORD: remove), score: 70.
Match: RegExp rule "Text" (TEXT_BAD_WORD: Visit out/us...), score: 70.
Match: Simple rule "Text" (TEXT_BAD_WORD: Wish to receive), score: 80.
Message reached a score of 600, processing aborted.
Bayes learned this mail as SPAM.
Final score is: 100 (650), 13 rules matched >>> SPAM.
Message processed in 360 mSec.

to ciągle zastanawia mnie linijka: Final score is: 100 (650), 13 rules matched >>> SPAM.
w praktycznie każdej tego typu wiadomości jest 100 (xxx- w zależności jakie ustawię przerwanie dla score)
tym sposobem praktycznie wszystko będzie powyżej 100 i zawsze będzie odsiewane hmm

patrzyłem polskiej instrukcji w dziale pliki reguł > spam-score dla innych wartości ale nic z tego nie zrozumiałem sad

szukałem po forum jakichkolwiek wskazówek, ale przyznaję że chętnie przeczytałbym opis "działającej konfiguracji z modyfikacjami dla głupich" bo niewiele wyniosłem z polskiej instrukcji dla reguli (doceniam oczywiście wkład wniesiony w jej napisanie)

pees: od pewnego czasu forum się strasznie wlecze

12

Odp: Regula 2.0.6

W powyższym podanym przez ciebie przykładzie moduł Bayesa wogóle nie został użyty. Dla samej części Bayesa byś miał wpis dla przykładu:

Bayes words:
 S:replica (V=100/P=100)
 replicas (V=100/P=100)
 markings (V=100/P=100)
 sticker (V=100/P=100)
 watches (V=100/P=99)
 magnified (V=99/P=98)
 dollars (V=98/P=96)
 premium (V=95/P=91)
 finest (V=93/P=86)
 accurate (V=92/P=85)
 battery (V=92/P=83)
 includes (V=90/P=80)
 hand (V=88/P=76)
 stores (V=88/P=75)
 watch (V=86/P=71)
 these (V=83/P=66)
 thousands (V=82/P=64)
 moves (V=82/P=63)
 themselves (V=81/P=62)
 real (V=19/P=62)
 signature (V=20/P=60)
 detail (V=80/P=59)
 smallest (V=79/P=59)
 charge (V=75/P=50)
 less (V=74/P=48)
 much (V=72/P=45)
 move (V=72/P=43)
 they (V=71/P=42)
 sell (V=70/P=40)
 original (V=30/P=39)
Bayes result: 80% spam probability.
Match: Intern rule "BayesScore" (BAYES), score: 80.

Wartość 100 jest ostateczną wartością podawaną dla Bata. W nawiasie masz wynik sprawdzania widomości danymi regułami. Każda wiadomość o wewnętrznym Score większym od 350 będzie traktowana jako SPAM i miała 100 punktów w numeracji Bata.

13

Odp: Regula 2.0.6

oootóż na taką właśnie odpowiedź liczyłem - dziękować smile
(wnioskuję że trzeba kombinować z ustawieniem odpowiedniej wartości przerwania dla score większego niż xxx?)

a w sprawie modułu bayesa, to w logach r.managera mam tylko simple rules hmm
(opcję łatwego filtrowania mam wyłączoną)

Match: Simple rule "RcvAllDomains" (RCV_SPAMMER_DOMAIN: o2.pl), score: 0.
Match: RegExp rule "Text" (TEXT_WITH_NUMBERS: Digits between letters), score: 80.
Match: RegExp rule "Text" (TEXT_UPPERCASE_WORDS: Several words in upper case letters), score: 50.
Match: Simple rule "UrlArgList" (HTML_LNK_ARGS: Arguments in URL), score: 40.
Match: Simple rule "TextWord" (TEXT_BAD_WORD: Free), score: 40.
Match: Simple rule "Text" (TEXT_BAD_WORD: Gain), score: 50.
Match: Simple rule "SpamSubjText" (TEXT_BAD_WORD: Offer), score: 40.
Match: Simple rule "Text" (TEXT_BAD_WORD: Pay), score: 40.
Match: Simple rule "Text" (TEXT_BAD_WORD: Purchase), score: 50.
Match: Simple rule "SpamSubjText" (SUBJTEXT_BAD_WORD: Promotion), score: 40.
Match: Simple rule "SpamText" (TEXT_BAD_WORD: remove), score: 70.
Match: RegExp rule "Text" (TEXT_BAD_WORD: Visit out/us...), score: 70.
Match: Simple rule "Text" (TEXT_BAD_WORD: Wish to receive), score: 80.
Message reached a score of 600, processing aborted.
Bayes learned this mail as SPAM.
Final score is: 100 (650), 13 rules matched >>> SPAM.

zatem czy podany przez Ciebie kod jest również przeklejony z regula managera ?

14

Odp: Regula 2.0.6

Tak pochodzi z Regula Managera, a występuje według właściwości opisanych w plikach reguł. Jeżeli będzie na samym końcu hierarchii to może modył Bayesa wogóle nie być używany.