Aš tikrai neesu paieškos variklių specialistas (tiesa, šiokius tokius SEO pagrindus turiu, bet čia ne apie tai). Sakykit ką norit, bet aš sugalvojau geresnį paieškos būdą negu visi sudėtingi informacijos relevantiškumo algoritmai pas google. Suprantu, kad dabar yra be galo daug įvairių paieškos sistemų (nekalbant apie tris gigantes) ir aš turbūt bandysiu išrasti arba dviratį arba blogą paieškos variklio receptą, tačiau parašyti apie tai norėjosi jau ilgai (juodraštis blog:e voliojosi apie mėnesį).
Tiesa, atėjus web2.0 madai atsirado web2.0 paieškos sistemos (dabar mąstau – google viena iš jų?), tačiau pačio wordpress.com naudojamas Snap taip ir neišpopuliarėjo. Bent jau nemačiau, kad kas nors Lietuvos internete jį propaguotų. O dalykas tikrai smagus. Ko vertos vien puslapių priešžiūros (previews?). Tiesa, dabar buvau užsukęs, tai supratau, kad jie teikia labiau svetainių ekranvaizdžių (site screenshots) paslaugas.
Ką pasakė google šiuo atveju? Kažką panašaus į “mes turime suindeksuoti visą internetą”. Na manau, kad jiems tai labai gerai sekasi. Kitą vertus – nežinau kaip ten pas juos su informacijos pateikimu. Teisingiau žinau, kaip tai atrodo, bet klausimas ar jie apie tai pagalvojo taip pat gerai kaip ir apie pačios informacijos indeksavimą. Taip, minimalizmas veža. Bet manau, kad ir tai gali būti patobulinta iki forever.
Kokios paieškos norėčiau. Turbūt tiek, kaip kūrėjas, tiek, kaip ir vartotojas. Ir kodėl, mano manymu, ji geresnė? Čia trumpas sąrašas minčių apie paiešką:
- sistema turi iš karto žinoti kur ir kaip ieškoti. svarstau netgi apie paieškos kategorizavimą (su paieškos šliuzais ir pan.);
- turi būti pateiktas paieškos rezultatų “krepšelis” (taip taip, visai kaip online parduotuvėje tik rezultatai nemokami);
- paieška privalo turėti šliuzus, bei informacijos šaltinių kategorijas (na manau, kad čia greičiau būtų atskiri šaltiniai, bet apie tai – po to);
Vienas dalykas išplaukė prisiminus kai kuriuos susirinkimus dėl įvairių projektų ir viename iš ginčų buvo numestas juokelis, kad programuojama sistema turi žinoti, ko vartotojas atėjo į svetainę (beveik kaip gauminos dirbtinis intelektas .). Čia, turbūt, būtų panašiai. Tik šiek tiek paprasčiau. Nes sakykite, ką norite, bet visos paieškos sistemos neturėtų rodyti daugiau paieškos rezultatų, negu reikia. Suprantu, kad “negu reikia” yra be galo slidus terminas, tačiau jis, mano manymu, čia tiktų labiausiai.
Kaip tai veiktų? Pasiskolinsiu nuvalkiotą frazę, kad “99% blog:ų yra visiškas šūdas”. Gal netiksliai citavau, bet esmė čia labiau yra skaičiuose nei žodžiuose. Jeigu imsime tą standartinį 1% informacijos iš visų paieškos rezultatų – manote galutinis rezultatas būtų blogas? Galiu duoti paprastą pavyzdį. Ieškokime “svetainių talpinimo” googlėje, yahoo! bei msn. Gavome:
- Google: 343.000 rezultatų. 1% = 3430 rezultatai;
- Yahoo!: 49.600 rezultatai. 1% = 496 rezultatai;
- MSN: 8.340 rezultatai. 1% = 84 rezultatai;
Tai dabar papasakokite man per kelis pirmus puslapius jūs eisite ieškodami svetainių talpinimo paslaugų? Tiesa apie turinio dubliavimą aš nerašysiu. Turbūt MSN šiuo atveju pateikė kokybiškiausius rezultatus. Nepykite, nevarčiau kiekvieno variklio SERP:ų. Galite pabandyti padaryti išvadas patys.
Na ok, “svetainių talpinimas” yra per nelyg platus terminas Lietuvos internetui. Galima pabandyti paieškoti kažko labiau specifinio. Tarkime “perl hostingas”. Rezultatų jau mažiau. Tačiau negi nesutiktumėte, kad jie būtų žymiai tikslesni, jeigu paieška vyktų jau tarp anksčiau darytos paieškos “svetainių talpinimui”? Čia man atėjo mintis į galvą apie paieškos rezultatų krepšelį. Kadangi dabar web2.0 laikai, tai vaizdas būtų maždaug toks: nusitempi pirmus (tarkim) du (tarkim) šimtus paieškos rezultatų į krepšelį ir vykdai paiešką atskirai jame.
Kažkuri paieškos sistema (berods alta-vista) kažkada anksčiau suteikdavo šią galimybę, tačiau dėl sąsajos nepatogumo ji buvo visiškai obsolete ir pasitraukė iš vaizdo. O gaila. Dabar informacijai išaugus N šimtus kartų toks dalykas labai praverstų. Tiesa, pagal paieškos rezultatų gausą reiktų tą naudingą 1% rezultatų apriboti ne tiesiniu, bet logaritminiu skaičiavimu, nes naudingų rezultatų kiekis auga ne tiesiogiai proporcingai su bendrų rezultatų kiekiu, o truputį (o gal ir daug) lėčiau.
Dar vienas svarbus faktorius paieškoje – personalizacija. Tikiu ir žinau, kad galima sudėti norimą informaciją į kategorijas (kaip kad mokomuosius dalykus mokykloje ir kitose mokymo instancijose). Juk ne veltui tituliniuose paieškos puslapiuose budavo sudėtos pagrindinės kategorijos ir pakategorės. Prisipažinkite, kas iš jūsų spaudė ant jų nuorodas, kad nors kiek patikslintų savo paiešką? Suprantama, personalizacija paieškos metu – neoptimalu. Bet pačioje pradžioje (tarkim prieš pradedant naudotis paieškos varikliu pastoviai informacijos paieškai) ji gali suteikti padėti pateikti jums žymiai relevantiškesnius rezultatus jūsų paieškos terminui. Kiek pažįstate sodininkų, kurie laisvalaikiu programuotų (ir vice-versa). Taip pat spėju būtų smagu nustatyti tą 1% teisingų rezultatų (aišku su galimybe matyti likusius 99).
Čia yra tik du (1%, kategorijos) aspektai, kuriuos [nepilnai] aprašiau. Šio straipsnio juodraštis blog:e gulėjo apie mėnesį, todėl dauguma minčių – išsivadėjo kaip vakarykštis alus. Jeigu kas šia tema į galvą dar užsuks – būtinai parašysiu. Šiam kartui tiek.
Krepšelį manau galima per Google API kaip nors pagaminti. Nori tuo užsiimt? :)
O dėl personalizacijos, tai bijau nusišnekėt, bet berods google kažką panašaus taip pat bando prasukt.
Bandyti, tai bando, bet klausimas kiek žmonių tuo naudojasi .)
Šiais Web2.0 laikais nepamirškim ir vartotojų masės įtakos turinio rezlutatams. Jei prireikia ko nors konkretaus, dažnai paieškai renkuosi del.icio.us. Čia, galima sakyti, jau ir yra pačių vartotojų nuomone prafiltruotas tas 1% turinio. Dažniausiai užtenka peržiūrėti tik pirmą puslapį ir gaunu sau reikiamus rezultatus.
:) na siaip reikia pripazinti vinea, kad jei ieskai konkrecios informacijos, paprastai tikrai nesinaudoji google, eini i konkretu saltini kur apie tai vien ir raso.
O visa infomracija sukisti i viena sistema, na taip baze didele bet kokia nauda :) kad filtras ant filtro :) ?
nohobo, bet kartais būna ir taip, kad ieškai informacijos tokia tema, kuria neieškojai anksčiau.
neblogos mintys. Verčia pamąstyti čia tema.