web – browsere, søking, m.m
DESCRIPTION
Web – browsere, søking, m.m. Pensum: Olsen, kap. 8-17. Historikk. 1991 – første Browser utviklet av Tim Berners-Lee 1993 Mosaic (NCSA, Marc Andreessen) 1995 Netscape (Andreessen et al) 1995 Internet Explorer (Microsoft, basert på Mosaic). Oppgave. Vise Web sider - PowerPoint PPT PresentationTRANSCRIPT
Web – browsere, søking, m.m.
Pensum:Olsen, kap. 8-17
Historikk 1991 – første Browser utviklet av
Tim Berners-Lee 1993 Mosaic (NCSA, Marc
Andreessen) 1995 Netscape (Andreessen et al) 1995 Internet Explorer (Microsoft,
basert på Mosaic)
Oppgave Vise Web sider Utfører GET-kommandoer for å
hente sidene Presenterer sidene ut fra tag-
informasjonen Forenkle administrasjon (favoritter,
sidehistorikk, oppsett…) Utføre programmer (script og
applets)
Surfing Kort tid mellom klikkene Skanner sider mer enn å lese Følger linker Mye bilder, lite tekst Krever kjappe responstider
Skjema - form Meget viktig funksjon Vi kan nå bruke HTML også for inndata Gir muligheter for en lang rekke applikasjoner:
Billettbestilling Banksystemer Ordresystemer m.m.
Data fra forms blir hentet ut på serversiden Med form-begrepet kan vi altså bruke HTML
som et grensesnitt mot andre systemer Gir standardisering på brukersiden, grunnlaget
er nå lagt for B2C applikasjoner
Mer Script, applets:
En del kontroller kan gjøres i brukergrensesnittet i Browseren
Mer dynamiske brukergrensesnitt Cookies:
Server kan identifisere bruker Plug-ins:
Vi kan utvide funksjonaliteten til browseren Sertifikater:
Browseren kan identifisere serverapplikasjonen (f.eks. et banksystem), serveren kan identifisere bruker (en bankkunde), kryptografert overførsel (HTTPS)
Web Inhomogene data:
Hjemmesider til personer Hjemmesider til organisasjoner Offisielle rapporter Stiler, kursinnleveringer, øvingsoppgaver Amatørorganisasjoner Aviser Blogger …
Lavt formaliseringsnivå Mesteparten av data er formalisert på
tegn/layout nivå (HTML, PDF) Samtidig er noe formalisert på høyt nivå
(billettbestillingssystem, banksystem) Vi må skille mellom systemer:
der data er lagret som tilgjengelig som f.eks. HTML (”ekte Web”)
der data ligger i lukkede databaser og der Web brukes kun for brukergrensesnitt
Tilgjengelig/utilgjengelig Mye er tilgjengelig for alle, men ikke alt Mye data er lukket inne bak
innloggingsprosedyrer: Banksystemer Bibliografiske databaser Noen avisarkiv m.m.
Her har en ofte høyere formaliseringsnivå
Enveis linker Vi kan linke dit vi vil, ingen
sentralisering Men ulempen er at linken kan gå til
en side som er fjernet/endret Toveis linker ville rettet på dette,
men ville vært langt vanskeligere å administrere
Søking
Precision =# relevant returned# returned
Recall =# relevant returned# relevant in total
Web søking Komplisert ved:
Datamengden Inhomogen database Naturlig språk
Forenklet ved: At vi ofter ute etter å finne noe
informasjon, og der mye av det vi finner løser vårt informasjonsbehov
Søkemotorer Stikkordbasert Prioritering basert på antall
forekomster Prioritering basert på viktigheten
til siden (Google) Prioritering basert på betaling,
annonser
Information overload
No Query # returned1. information AND retrieval 80,0002. “information retrieval” 20,0003. full AND text AND information
AND retrieval 10,0004. “information retrieval” AND “full text” 2,0005. “full text information retrieval” 406. information AND overload 10,0007. “information overload” 4,0008. “information retrieval” AND
“information overload” 40
Filtrering Vi ønsker kanskje å fjerne en viss
type sider fra søket eller fra eposten (porno, SPAM..)
Kan eliminere ut fra ord i teksten, ut fra farge på bilder (hudfarge)
Kan eliminere sider på visse adresser, epost fra visse avsendere
Kan la noen kategorisere sidene for oss
I praksis Ingen av metodene fungerer 100% Et filter kan fjerne mesteparten av
SPAM men ikke alt Fjerner også noen genuine
meldinger/sider Problem:
Formalisering
Kvalitet Siden alle kan legge inn data på Web får
vi et demokratisk system Til gjengjeld har vi ingen kontroll med
kvaliteten av det som blir lagt ut Derfor må vi vurdere informasjonen ut
fra hvem som har generert denne Det er kanskje en fordel, som vi ser er
verken myndigheter eller media ”objektive”.
Portaler Organiserer informasjonen på Web Hele Web (Yahoo) For et firma, bransje, markedsplass, etc. ”Alt på ett sted” tanke Data organiseres ofte i menyer, greit om
vårt informasjonsbehov kan klassifiseres på samme måte
Kjente organisasjoner i den fysiske verden (f.eks. vg, nrk, tv2) forsøker å utnytte sin posisjon til å etablere portaler
Tilstedeværelse på Web Mange har sin hjemmeside på nettet Demokratisk at vi alle kan ha vår side her Problemet er å skape trafikk – hvordan gjør vi
det? Kan vi gjøre linken kjent? Kan vi bli ”utvalgt” av søkemotorene?
Lettere for VG enn for Ola Nordmann Lettere for et hotell i Honningsvåg enn i
London Undersøkelser viser at 75% av trafikken går til
noen få Web steder
Mobil databehandling Relativt nytt – ”hot” tema Du har kontoret ditt der du er Fantastisk nyttig for enkelte, mer marginalt for andre Vi kan snakke mens vi er mobile, ikke like lett å håndtere
PC’en Mange nettløsninger:
Mobiltelefoni (GSM, WAP, GPRS, UMTS) Radiosamband (Bluetooth, WLAN)
Flere typer av enheter: mobiltelefon, PDA, PC
Enkle brukergrensesnitt blir viktig: Talestyrte systemer (du kan be om avgangstider for fly) Automatiske systemer (henter fram avg. tid for det flyet du er
booket på) Push-teknologi (SAS sender deg informasjon om flyet)
Push teknologi
0700 a.m. Thursday 4. October 0700 a.m. Thursday 4. October
WeatherTemp: 25HUMIDITY: 87%WIND: WSW at 9mphSUNRISE: 06:08 amForecast: Partly sunny, COLDER, …
WeatherTemp: 25HUMIDITY: 87%WIND: WSW at 9mphSUNRISE: 06:08 amForecast: Partly sunny, COLDER, …
Headline news:New airline mergerBlue chips rally on Wall StreetHurricane warning
Headline news:New airline mergerBlue chips rally on Wall StreetHurricane warning
Trains delayed.
email (filtered):FROM SUBJECT RECEIVEDJoe Meeting 10/04 08:43
email (filtered):FROM SUBJECT RECEIVEDJoe Meeting 10/04 08:43
09.00 Department meeting10.00 Lecture12.00 Lunch with project team14.30 Airport
09.00 Department meeting10.00 Lecture12.00 Lunch with project team14.30 Airport
Buses on schedule.
Traffic, no delays.
Freezer temp. lowAlarms working.
Dynamiske Web sider (server scripts)
Eksempel – framhenting av informasjon om ansatte
Kode for skjemaet<FORM> ACTION=”http://www.firm.com/employee.asp” METHOD=post id=userdata name=userdata> <p>To get contact information, give last name of employee: </p> <INPUT type=text name=lastname size=40 maxlength=60> <INPUT name=info type=submit value=”Get info”></FORM>
Prosedyre Skjemaet vises av browser Vi fyller ut navn og trykker knappen Data fra skjemaet sendes til serveren Serveren starter applikasjonen (asp) Applikasjonen plukker ut navnet Slår opp i databasen og genererer en Web side med
resultatet
Script
<%@ Language=VBScript %><% set DBObj= Server.CreateObject("ADODB.Connection")DBObj.Open "Employee"%><HTML><HEAD><TITLE>Directory</TITLE></HEAD><BODY><H2>Contact information for <%=Request.Form("name")%> </H2> <%set stdset=dbObj.Execute("SELECT * FROM employeeTable WHERE name = '" & Request.Form("name") & "'")if stdset.eof then Response.Write("<p>No persons fulfilled search request</p>")else Response.Write("<p>Phone:" & stdset("phone") & "</p>") Response.Write("<p>Email:" & stdset("email") & </p><br>")end ifstdset.closedbObj.close%></BODY></HTML>
Dette kjøres på serveren
Henter fram data om personen med det oppgitte navnet
Legger svaret inn i en HTML side
Viktig Med dette kan vi bruke Web som et
standardisert grensesnitt til andre applikasjoner
Vi kan tilby bank, billett, og andre tjenester uten å måtte installere egne programmer hos brukerne
Serveren kan holde orden på hva brukeren har gjort, så nå frir vi oss fra den tilstandsfrie standard Web-løsningen
Basis for B2C applikasjoner
Script i browser Kan gjøre det mulig å utføre enkle
valg og kontroller i browseren Små programmer som browseren
kan utføre uavhengig av server Øker funksjonaliteten i Web
grensesnitt
Peer to Peer computing Utnytter at datamaskiner står i nett Programmer som administrerer
nettverket Med eller uten en sentral maskin Robuste systemer, uavhengig av
enkeltkomponenter i systemet Eksempler:
Fildeling (musikk, video, …) Store beregninger (mange PC er erstatter
en supercomputer)