1

Temat: Implementacja OCR

Witam!

Chciałbym się zapytać szanownych forumowiczów czy nie spotkaliście się z wtyczką, która potrafiła by rozpoznać spam za pomocą czytania obrazków typu GIF, JPG, etc. Jak nam zapewne wszystkim wiadomo 90% spamu, który przechodzi niewykryty przez programy antyspamowe zawiera w liście mały plik reklamujący albo afrodyzjaki, albo jakiś ROLEX ew. jeszcze inne popularne gadżety.
Wiem, że jest taki program jak np. SinapsiAntispam (-OCR Heuristic Analysis)  ale niestety jak pisze autor współpracuje tylko z MS Outlook i Mozillą.

Pozdrawiam i z góry dziękuję za cenne informacje.

2

Odp: Implementacja OCR

Według mnie taka wtyczka to już nadmiar szczęścia, ponieważ do jej poprawnego działania należałoby użyć bardzo rozbudowanych mechanizmów. Cóż bowiem działoby się w przypadku obrazków z cyrylicą, które nie są np. u mnie rzadkością?

Ja korzystam z BayesIt! (wersja 0.8.4) i praktycznie tego rodzaju spam jest rozpoznawany zawsze. W tej chwili na 344 wiadomości w moim folderze ze śmieciami aż 160 ma ząłączniki obrazkowe i wszystkie zostały wykryte przez BayesIt!.

3

Odp: Implementacja OCR

Zygmunt napisał/a:

Według mnie taka wtyczka to już nadmiar szczęścia, ponieważ do jej poprawnego działania należałoby użyć bardzo rozbudowanych mechanizmów. Cóż bowiem działoby się w przypadku obrazków z cyrylicą, które nie są np. u mnie rzadkością?
--ciach

Po pojawieniu się cyrylicy (jakiejkolwiek literki) od razu 100pkt smile i do ŚMIECI.

Mam świadomość tego, że takie rozwiązanie na komputerze osobistym to raczej nietrafiony pomysł chociażby z tego względu, że proces ten mógłby zajmować dużą część pracy procesora co w niektórych przypadkach było by nie do zniesienia.

Napisałem tego posta bo ostatnio zwrócił moją uwagę Panda GateDefender - sprzętowy antywirus + antyspam, który m.in. potrafi czytać OCR-em załączniki graficzne skutecznie eliminując niepożądane listy.

Pozdrawiam