Naapurustosta

Kirjoittaja Sami, 6.3.2003

Bloginaapurusto kirvoitti lukijoista kommentteja – mahtavaa! Sain uusia ehdotuksia naapuruuslaskennan toteuttamiseen. Henrin ehdotuksesta naapurustolaskuri tiputtaa blogin naapureista pois sellaiset blogit, joissa osuus aktiivisista on itse asiassa pienempi kuin kaikkien blogien listassa.

Marko ehdotti kokonaan uutta algoritmia naapuruston laskemiseen. Pystytin sen alkuperäisen rinnalle, joten naapurustoja voi tutkia nyt kahdella eri tavalla. Algoritmi #1 on se alkuperäinen, joka siis laskee miten monta blogin lukijaa lukee myös toista blogia. Algoritmi #2 tekee kahden blogin naapuruutta verratessa kaksi joukkoa: ne, jotka lukevat molempia blogeja ja ne, jotka lukevat jompaakumpaa blogia. Näiden lukumäärä jaetaan keskenään ja tuloksena saatava prosentti määrittelee korkeuden listoilla. Tämä kakkosalgoritmi on selvästi vähemmän riippuvainen lukijoiden määrästä (Pinseri ei enää olekaan ihan jokaisen ykkösnaapuri), vaan sen sijaan pyrkii tekemään useita erilaisia naapurustoja.

Molemmat toivat selkeitä parannuksia listan antamiin tuloksiin. Voit klikkailla sivuilla kahden eri laskentatavan välillä ja vertailla niiden antamia tuloksia. Kuulisin erittäin mielelläni, kumpi laskentatapa antaa juuri sinun mielestäsi oikeamman näköisiä tuloksia. Ja naapurustojahan pääsi siis katselemaan top-listan kautta.

Päässäni on hiljalleen muotoutumassa kolmaskin laskentamalli, mutta se saa odottaa pahimpien työkiireiden ohi. Näitä kaavoja miettiessä on muuten saanut huomata, kuinka edellisistä matematiikan luennoista alkaa olla aikaa pitkälti toistakymmentä vuotta. Aivot menevät solmuun. Intouduinpa peräti lueskelemaan erästä collaborative filteringiä käsittelevää tutkielmaakin tärppien toivossa. Ja koko ajan päässä on sellainen tunne, että jotain tämäntapaista on aikoinaan ollut jonkin tietojenkäsittelyopin peruskurssin harjoitustehtävänä…

Tässä jutussa puhuin näemmä koko ajan naapureista. Aiemmin ne olivat sukulaisblogeja. Terminologia on vielä hakusessa – kumpikohan kuulostaisi paremmalta?

[päässä soi: Liam Lynch: My United States of Whatever]

    Jutussa “Naapurustosta” on 2 kommenttia:

    • Mikko Saari says:

      Algoritmi kaksi vaikutti mielekkäämmältä. Luulisin omalla blogillani (Gameblog) olevan enemmän sukulaisuutta Ruutukaappaukseen kuin Pinseriin – nämä siis olivat algoritmien kaksi ja yksi tarjoamat ykkösvaihtoehdot.

    • Henri says:

      Minullakin tuo algoritmi 2 antoi parempia tuloksia. Taisi peräti kymmenen ensimmäisen joukossa olla yksi ihminen, jota en tunne netin ulkopuolella, joten kuvittelisin myös osittain samojen ihmisten seuraavan nettitemmellystämme.

      Tuo kakkosalgoritmi tosin taitaa hieman syrjiä paljon luettuja blogeja vain niiden suosion vuoksi.

Kirjoita kommentti


Tämä linkki on ansa roskapostittajille.