enterprise search mortens jensby convergens
DESCRIPTION
VidenDanmark afholdt den 8.10.2009 seminar om Enterprise Search Best Practice 2009. Ved seminaret var der præsentationer fra Findwise, Convergens, Scanjour, Metier, COWI og Creuna. Der blev præsenteret en række søgeteknologier: Fast, Google Search Application, Autonomy, Sharepoint. Seminaret blev understøttet af et seminar 2.0 - system. Se hele dokumentationen på http://videndanmark.dk/8-10-Search-2009.441.0.html.TRANSCRIPT
Google Search Appliance Enterprise Search 2009
VidenDanmark8. oktober 2009
Morten Jensby Mortensen,Convergens
Indhold
• Hvem er Convergens?
• Hvad er Google Search Appliance?
• Cases - Odense Kommune
• Optimering af ES implementering
• Innovationskraft
• Økonomi
Hvem er Convergens A/S
• Etableret 1998
• Lønsom, med solid egenkapital (>7,0 mill.)
• En snes højtuddannede medarbejdere
• Stærk kundeportefølje
• Standardiserede produkter og ydelser
Hvem er Convergens A/S
• Vi laver løsninger til ”den procesorienterede arbejdsplads”
• Dokumenthåndtering, portaler, intranet,
workflow, web... Og enterprise search
• IBM Premier Business Partner
• Google Enterprise Partner
Dokumenthåndtering arkitektur (FESD2, SOA)
Hvad er Google Search Appliance?
• Google’s bud på intern søgning er Google Search Appliance (GSA).
• En komplet teknisk løsning. Én appliance/server
• Hurtig tilkobling – på eget netværk!
GSA’en har følgende hovedfunktioner; den crawler og indexerer de databaser, dokumentbeholdere og servere som man giver den adgang til, og håndterer
Hvad er Google Search Appliance?
• Hurtigheden og relevansenHemmeligheden er, ud over en enorm søgekraft, en løbende tilretning og forbedring af de algoritmer, der sikrer at brugerne får relevante søgeresultater. Google bruger faktorer fra over 100 variabler til hver søgning.
Teknologien og beregningsmetoderne fra ”Google på nettet” er genbrugt, og opdateres løbende, i GSA’en, for at understøtte relevans og hurtighed i den interne søgning.
Google’s bud på intern søgning er Google Search Appliance (GSA).
GSA’en har følgende hovedfunktioner; den crawler og indexerer de databaser, dokumentbeholdere og servere som man giver den adgang til, og håndterer
Hvad er Google Search Appliance?
• Den tværgående søgningGSA’en kan indexere over 220 filtyper
Den store gevinst ligger i at man kan søge i indhold på tværs af platforme og dokumentbeholdere, og stadigvæk overholde virksomhedens sikkerhedssystem.
Brugerne kan kun se søgeresultaterne hvis de har adgang til kildematerialet.
GSA’en har følgende hovedfunktioner; den crawler og indexerer de databaser, dokumentbeholdere og servere som man giver den adgang til, og håndterer
Hvad er Google Search Appliance?
• Brugeroplevelsen er måske den vigtigste vinkel på søgning.
• Brugerne forventer grænseløs, hurtig, enkel søgning med relevante søgeresultater.
• Omvendt vil brugerne se det som et problem og en begrænsning hvis ikke virksomheden kan tilbyde samme søgemuligheder, som brugerne kender hjemmefra når der søges på nettet.
Søgeproblemer-/usikkerheder i OK
• “Vi synes vi spilder tid på at lede...”
• Sikkerhedsmodel – understøttes denne i søgeløsning?
• Understøttes søgning i vores ESDH?
• (der har været snakke om at “googleficere” komplekset siden 2004)
Case: Odense Kommune
Case: Odense KommuneTeknologien i spil: GSA og Connector(er...)
Case: Odense KommuneEmnesager og referatdatabaser
Emnesagsbaserne i to forvaltninger
Referat databaser
Case: Odense Kommune
Vores egen GSA – eksempler:
Søgning på ”profile pia”
Returnerer 3 pia’er fra NAB
Returnerer hits fra kundedb
Returnerer hit fra ”keymatch”
Returnerer ”alm.” hits fra intranettet
GSA – Arla opskrifter:
GSA – Aalborg Uni:
GSA – DTU:
Optimering af ES implementering
Fra nettet kender alle “mente du” funktionen – som også findes i GSA’en. Eks. fra DTU’s implementering:
Optimering af ES implementering
Tilsvarende kan der uploades keymatch lister til GSA’en. Eks. fra DTU:
Optimering af ES implementering
Hvordan optimerer vi søgningen? Hvordan sikrer vi at investeringen i søgeteknologi udnyttes optimalt?
Udvikling af optimeringsydelser i samarbejde med DBC (tidligere Dansk BiblioteksCenter) – eksempler:
Keymatch- Guide brugeren mod specifikke links
Synonym ordbog- Uploade tilpasset og domæne specifik synonym liste
Related queries (relaterede søgninger) - “Du kan også prøve:”
Source biasing- Overrule og tilrette relevansen
Optimering af ES implementering
Synonym ordbog
GSA’en leveres med dansk sprogpakke, og dermed også en synonym ordbog.
For at forbedre søgekvaliteten kan man selv uploade en tilpasset og domæne specifik synonym liste hvorved søgeresultatet automatisk udvides.
Brugeren søger på termen "dokumentation" men hun får ikke de resultater der indeholder alternative termer - eksempelvis "guide", "manual", "manualer".
Der skal således udarbejdes en synonym liste – fint understøttet af rapport genereret af GSA’en over søgninger der ikke har givet et resultat!
Optimering af ES implementering
Related queries (relaterede søgninger)
Brugeren søger på “dokumentation” og over søgeresultatet fremkommer:
Du kan også søge på: guide, manual
Eller ved at knytte related queries til forskellige frontends tilbydes differentierede søgeforslag. Når der på den udadvendte/kunderettede frontend søges på “Nokia N96” fremkommer denne:
Du kan også søge på: Nyeste Nokia telefoner
Hvorimod når søgningen foretages på den internt rettede frontend tilbydes denne søgning, ved søgning på samme term:
Du kan også søge på: N96 produktblad, N96 datasheet
Optimering af ES implementering
Source biasing
Man kan overrule og tilrette relevansen. Eksempler hvor det giver mening at ændre på GSA’ens egen relevans score:
Aalborg universitet - ved søgning på person rangeres pedellen højere end dekanen I søgeresultatet...
Primær produkt information i form af PDF’er skal vægtes højere end relateret “procesinformation” I form af Word og Excel dokumenter.
Hvad er Google Search Appliance?
INNOVATIONSKRAFT
Fra ComOn d. 21.04: ”To nye måder at søge på Google”:
“Den ene funktion har fået navnet NEWS TIMELINESom navnet måske afslører, så handler News Timeline om at sætte ting i historisk kontekst. Man for eksempel vælge at finindstille søgningerne til dage, uger, år eller årtier og få resultaterne opstillet i kolonner som en kalender.Opdelingen kan også målrettes til at søge efter eksempelvis film, billeder, citater, blogs, aviser og så videre.
Den anden versionering af søgemaskinen ligger i SIMILAR IMAGES
Den gør, som den siger: Finder billeder der minder om hinanden. Hovedtanken er, at det nogen gange kan være svært at beskrive det billede man søger med ord. I stedet kan man bede søgemaskinen om at finde billeder, der minder om det billede, man allerede har fundet.”
GSA’en har følgende hovedfunktioner; den crawler og indexerer de databaser, dokumentbeholdere og servere som man giver den adgang til, og håndterer
Hvad er Google Search Appliance?
INNOVATIONSKRAFT
NEWS TIMELINE (Søgning efter sager, projekter, kunder etc. ??)
GSA’en har følgende hovedfunktioner; den crawler og indexerer de databaser, dokumentbeholdere og servere som man giver den adgang til, og håndterer
Hvad er Google Search Appliance?
INNOVATIONSKRAFT
Medierne her til morgen:
GSA’en har følgende hovedfunktioner; den crawler og indexerer de databaser, dokumentbeholdere og servere som man giver den adgang til, og håndterer
Hvad er Google Search Appliance?• GOOGLE INNOVATIONSKRAFT
NYE GSA Features (nogle af dem)
• Stærke intranet og videnstyringsfeatures. Eks. medarbejdersøgning
• Indsnæver søgningen. Eks. baseret på organisatoriske og tids variable,
• Personaliseringsmulighed. Lav policies med differensieret søgeresultat
• Notifikationsmails. Få automatisk mail med links til dokumenter der opfylder forudbestemte søgekriterier
• Vigtige søgeord. Definer søgeord så specifikke resultater vises før andre søgeresultarer.
• Avancerede rapporteringsværktøjer. Integreret mulighed for at se, og analysere, alle søgninger, brugeradfærd og klik.
• Grafisk præsentation af data fra andre virksomhedsløsninger i dit søgeresultat. One Box modulet som er integreret i GSA’en giver mulighed for at vise data fra stort set alle kilder i real tid.
GSA’en har følgende hovedfunktioner; den crawler og indexerer de databaser, dokumentbeholdere og servere som man giver den adgang til, og håndterer
GSA priser
GSA priser pr. Q3 2009 DKK ved kurs 7,5
2 års support og opgradering
GB-7007-500K-EU € 26.000 195.000 GB-7007-1M-EU € 43.000 322.500 GB-7007-2M-EU € 86.000 645.000 GB-7007-3M-EU € 129.000 967.500
GB-7007-5M-EU € 215.000 1.612.500GB-7007-10M-EU € 344.000 2.580.000
Hot backup koster € 18.000 135.000
Priserne starter således ved indexering af 500.000 dokumenter og GSA’erne kan opgraderes når behovet opstår.
Bemærk at samme boks nu kan indexere op til 10 millioner dokumenter, samt når man går fra 3 millioner dokumenter og op, er det inklusiv hot backup
• Google søgningen som vi kender den – bare internt
• Sikkerhedsmodel understøttet
• Stærke brugs-/brugergevinster
• Optimeringsfeatures
• INNOVATIONSKRAFT
• Hurtigt at komme igang
Opsummering
For yderligere information
•kontakt venligst Convergens a/s
•Morten Jensby Mortensen•23245666•[email protected]