Popfile

Kirjoittaja Sami, 25.2.2003

Roskapostin kanssa taistelu alkaa olla Pinserissä jo ikuisuusaihe. Nyt alkaa kuitenkin vaihteeksi taas vaikuttaa siltä, että taistelu on kääntymässä voiton puolelle. Syynä tähän on muutaman viikon koeajossa ollut sähköpostisuodatin nimeltään Popfile.

Siinä missä perinteisemmät roskapostisuodattimet pohjautuvat erilaisiin luetteloihin tai hakemistoihin tunnetuista roskapostin lähettäjistä ja aiheista, Popfile käyttää postin suodattamiseen eräänlaista “tekoälyä”, Bayespäättelyä. Se lukee jokaisen saapuvan sähköpostiviestin läpi ja antaa kaikille viestistä löytyville sanoille todennäköisyyspisteitä. Näiden pisteiden perusteella ohjelma lyö sähköpostiviestiin leiman siitä, mihin kategoriaan se arvelee postin kuuluvan. Leimojen perusteella postit voi sitten poistaa, merkitä tai arkistoida omassa lempisähköpostiohjelmassaan. Aivan – Popfile on yhteensopiva käytännössä kaikkien nykyaikaisten sähköpostiohjelmien kanssa.

Mistä Popfile sitten tietää sanojen todennäköisyyksiä ja annettavia leimoja? Ne opetetaan sille. Kun ohjelma otetaan käyttöön, siihen syötetään haluttu määrä “koreja” (bucket) – minulla on käytössä esimerkiksi korit “roskaposti”, “pinseriin liittyvä posti”, “työposti”, “muut henkilökohtaiset” sekä “bulkkiposti”. Alussa Popfile ei ymmärrä korien eroja eikä tiedä mikä viesti kuuluu mihinkin. Sitä täytyy opettaa. Kun ohjelmalle on pari kertaa näytetty mihin koriin viesti olisi pitänyt laittaa, se alkaa oppia. Ohjelman näkemät sanat alkavat saada merkityksiä. Jo muutaman kymmenen viestin jälkeen Popfile suodattaa postia itsevarmasti. Virheitäkin toki sattuu, mutta silloin ohjelmaa taas ojennetaan: “Tämä viesti olisi pitänyt laittaa tähän koriin”. Tätä kutsutaan TOE (Train On Error) -menetelmäksi.

Tyypillinen osumatarkkuus Popfilellä on n. 95%, eli noin joka kahdeskymmenes saapuva viesti luokitellaan väärin. Riippuen postista, tarkkuus voi olla parempikin (tai huonompi). Ohjelma on tällä hetkellä vielä kehitteillä, joten sen asentaminen ja käyttäminen vaatii hieman paneutumista. Se tukee vain POP-sähköpostilaatikoita ja toimii selaimen kautta käytettävällä käyttöliittymällä. Leimatun postin lajittelu vaatii sen, että osaa tehdä suodattimia omassa sähköpostiohjelmassaan. Onneksi kuitenkin Popfilen sivuilla on hyvä ohjeistus ohjelman käyttöönotosta.

Popfile toimii kaikissa koneissa, joissa voi käyttää Perliä. Siitä on saatavilla myös Windows-asennuspaketti, joka asentaa koneeseen kaiken tarvittavan (myös Perl-tulkin).

Tästä tulikin pitkä ja ylistävä juttu yhdestä ohjelmasta, mutta hyvää kannattaa aina kehua. Eli suosittelen Popfileä lämpimästi kaikille spammista kärsiville. Popfile löytyy osoitteesta popfile.sourceforge.net.

Ei vielä kommentteja

Kukaan ei ole vielä kommentoinut tätä juttua. Ehkä sinä voisit kirjoittaa ensimmäisen kommentin?

Kirjoita kommentti


Tämä linkki on ansa roskapostittajille.