Det siste året (2009-2010) har jeg kjørt Google CSE som nettstedssøk på skifte.com. Dette var et eksperiment for å lære mer om Google spesielt, og SEO generelt. Og selvsagt for å finne ut hvor bra et slikt eksternt driftet søk faktisk er og hvordan det kan "tunes". Nå har jeg dumpet Google til fordel for Yahoo BOSS.
Google Custom Search Engine, eller Google Site Search forekommer i to forskjellige versjoner; en gratisversjon, og en bedriftsversjon som koster penger. Hvor mye det koster avhenger av størrelse på nettsted og antall søk per år, men på dette lille nettstedet klarte jeg med fint med den billigste varianten som koster 100 amerikanske bucks i året. Yahoo BOSS er for øyeblikket gratis å bruke (Les om planlagte BOSS usage fees).
Google Site Search, eller Yahoo BOSS?
Etter et år dumpa jeg Google til fordel for Yahoo BOSS. Årsaken er todelt:
- Google koster som nevnt (minst) 100$ per år. Yahoo BOSS er gratis.
- Lysten til å kjøre søkeeksperimentet videre med å teste ut noe annet.
Så langt, etter noen få uker med Yahoo-søk, er jeg ikke sinnsykt imponert. Jeg mener Google er Yahoo totalt overlegen som nettstedssøk på en rekke områder. Kort oppsummert kan følgende punkter nevnes:
- Kontrollpanel. Google har et eget kontrollpanel for dine egne tilpassede søkemotorer. Her kan en administere og konfigurere søkemotoren(e) ved å skru på forskjellige knotter som f.eks avgrensninger og indeksering. Yahoo har sin site explorer hvor en kan legge til RSS'er og nettstedskart, samt fjerne URL'er. Men det er stort sett det.
- Forespørselsbasert indeksering. I kontrollpanelet finnes det en "index now"-knapp som gjør at nytt innhold indekseres raskere. Det betyr ikke at innhold blir raskere søkbart fra google.com, men kun internt på nettstedet.
- Synonymordbok. I det samme kontrollpanelet kan en laste opp synonymordbok i XML-format. En kan altså si at søkeord A og B betyr det samme og at de dermed gir like treff.
- Forslag ved feilstaving. Både Yahoo og Google tilbyr forslag, eller suggest, ved feilstaving. Men her er Google bedre for norske nettsteder. Engelsk "feilstavingskontroll" har jeg ikke testet i særlig grad.
- Avgrensninger. Fasettert søk, eller "drilldown" er enkelt å sette opp i kontrollpanelet for Google Site Search, men totalt fraværende hos Yahoo. Hvis fasetter er angitt i Google-kontrollpanelet vil disse komme ut i XML'en for hvert søk slik at en kan presentere de hvor en vil på søkeresultatsiden slik at brukeren kan avgrense søket til en, eller flere kategorier.
- Dokumentasjon. API'et for Google Site Search er bra dokumentert, mens en må lete litt rundt for å finne begrensninger, muligheter og eksempler for Yahoo BOSS. BOSS API Guide er uansett et godt utgangspunkt.
Etter min mening er altså Google en bedre pakke, men har en behov for alt i den pakken? Større nettsteder har kanskje det, mens små og middels store nettsteder / blogger muligens ikke har det. Dessuten er det til tross for en noe tynn dokumentasjon enklere å komme i gang med Yahoo. Og det enkle er jo ofte det beste. Er det ikke? Det jeg savner mest i mitt nye Yahoo-søk er å enklere kunne filtrere ut sider jeg ikke vil ha med i trefflista. Det er mulig å få det til ved å legge på en del querystringparametre, men Google tilbyr en mye enklere løsning for slikt i sitt kontrollpanel.
Felles for de to nettstedssøkene
Begge kan levere søkeresultatene i XML-format - noe som betyr at en kan utforme søkeresultatene akkurat slik en selv vil. Ingen av de tilbyr noen som helst form for bildevisning i resultatlisten, men bildevisning i søkeresultater fra Google og Yahoo er uansett relativt enkelt å få til.
Annnonser, og branding av søkemotor er ikke nødvendig i noen av de to. Merk at dette ikke gjelder for gratisversjonen av Google nettstedssøk.
Innhold blir ikke søkbart så snart det er publisert. Hvor lang forsinkelsen vil være avhenger av en rekke faktorer. Små og lite populære nettsteder blir ikke like hyppig crawlet og indeksert som større, mer populære nettsteder. Videre er det aldri noen garanti for at alt nytt innhold faktisk blir indeksert. Her spiller generell søkemotoroptimalisering og antall "deeplinks" inn til nettstedet en sentral rolle.
Google Site Search hostes av Google, mens Yahoo BOSS kjører mot Yahoo sin egen indeks. En drifter altså ingen av disse to selv.
So long, Google
For dette nettstedet holder det lenge med nettstedssøket Yahoo tilbyr. Jeg har ikke laget noen integrasjon / mashup mot andre datakilder, og bruker det på sin aller enkleste form. Et par kjekke ting Yahoo BOSS tilbyr, som ikke finnes i Google Site Search, er muligheten til å liste ut relaterte søkeord og de mest brukte tag'ene per side fra Delicious. Om en side fra nettstedet ditt er bookmark'a og tagget på Delicious vil du altså kunne se det i XML'en returnert fra Yahoo for så å bruke det til å for eksempel vekte de forskjellige treffene mot hverandre. En side som er bookmark'a flere ganger på Delicious kan antas å være mer relevant enn andre - og kan dermed vises på toppen av resultatlisten, eller framheves på andre måter.
Relaterte søkeord genereres for hvert av treffene og kan listes ut for å foreslå hvordan brukeren kan spisse søket sitt mot et gitt emne.
I søkeresultatene på dette nettstedet forekommer det en del pekere til ikke-eksisterende sider. Det skyldes omstrukturering av nettstedet, og de lukes sakte, men sikkert ut. Min feil, ikke Yahoo.
Har du erfaringer fra bruk av nettstedssøk fra Google, Yahoo, eller andre? Har du andre synspunkter? Bruk kommetarfeltet og fyr løs! :)
Det finnes 3 kommentarer
Flott artikkel med oppsummering av fordeler og ulemper med søkene, Anders.
Jeg lurer imidlertid på om du har funnet ut en god måte å ekskludere deler av siden på.
Søk etter "acdc" på Skifte.com gir meg treff som jeg ikke ønsker på 1. plass, antakelig pga. tagcloud til høyre.
Kan denne kommenteres bort med Yahoo eller Google?
Takk for det, V! Ja, har planer om en "follow up"-bloggpost på akkurat det etter en liten SEO-strafferunde her.
Så vidt jeg vet kan en ikke på noen enkel måte få en ekstern "crawler" til å hoppe over en spesifik del av en side. Innhold lastet inn med javascript blir vel også i større og større grad indeksert.
Et triks som derimot fungerer er å kjøre meta robots="noindex,follow" på listesider + fjerne irrelevante lenker (tagcloud e.l) på de sidene som faktisk indekseres slik at søket ikke gir flere treff enn ønskelig. Nå sier jo søket at blogginnlegget om geolocation antakelig er en bra match for ditt søk på ACDC, mens bloggposten om ACDC ikke er med i det hele tatt. Najs.
Da jeg relanserte nettstedet glemte jeg meta robots. Dvs at søket for det meste indekserte liste- og arkivsidene istedet for permalenkene / bloggvisningssidene (muligens pga det ble tolket som "duplicate content").
Det er pt ikke forferdelig mange lenker inn, og nettstedet er heller ikke stort. Da blir indekseringa noe treg og ufullstendig, samt at en risikerer at lenketekst blir indeksert uten at lenka blir fulgt (dvs målsiden indekseres ikke) slik at en side som _lenker til_ sida om ACDC dukker opp i resultatene som et relevant treff.
Hei Anders!
Spennende å lese om dine erfaringer med Google og Yahoo site search. Jeg tror du kan være interessert i å komme på vår neste Oslo Enterprise Search meetup, hvor Mikael Svenson skal sammenligne forskjellige gratis alternativer. Foredraget heter "Er gratis søk egentlig noe tess?", og du kan lese mer om det her: http://www.meetup.com/enterprise-search-oslo/calendar/15288966/
Håper vi sees!