Je komt bij de zoekmachines vaak speciale kreten en begrippen tegen. Daarom een verklarende woordenlijst.
[-a–b–c–d-e-f–g–h–i-j-k-l-m-n-o–p-q-r–s–t–u-v-w-x-y-z-]
De mate waarin zoektermen, zoals gebruikt in opvragingen (queries) in elkanders nabijheid verkeren. De opvrager kan in sommige zoekmachines parameters opgeven waarin de nabijheid van verschillende zoektermen kan worden opgegeven.
Agent Name Delivery
De tactiek van het op maat presenteren van site pagina’s aan de zogenaamde spiders van zoekmachines. Normale bezoekers krijgen iets anders te zien dan deze spiders. Op deze wijze kan plaatsing van een sitepagina in de zoekmachine beïnvloed worden. Dit wordt meestal gedaan d.m.v. SSI door te kijken naar de inhoud van het veld HTTP_USER_AGENT. De meeste browser programma’s bieden deze variabele aan als “Mozilla” (coined from Mosaic and Godzilla). Spiders van zoekmachines heten bijv. “Gulliver”, “Infoseek sidewinder”, “Lycos spider” and “Scooter”.
Zie Gateway Page.
Common Gateway Interface – een standaard protocol voor communicaties tussen browser programma en de server software.
CGI Program
Elk programma dat voor in- en output gebruik maakt van het CGI protocol. In de praktijk wordt dit protocol gebruikt voor het verwerken van “forms” en database queries. Op deze wijze kan informatie verzameld en clientsgewijs verstrekt worden. (dynamische pagina inhoud).
Channel listings
Lijst met links naar bepaalde (op populariteit geselecteerde) web sites. De links op de lijst worden door zoekmachines en directories
onderhouden en ingedeeld in categorieën of channels. De sites op de lijst worden geselecteerd door een beheerder, meestal op grond van gunstige plaatsing in de zoekmachines.
Client
Een computer, programma of proces dat informatie opvraagt van een ander programma, computer of proces. Een web browser (Netscape,
Internet explorer) zijn client programma’s.
Click through
Het proces waarbij op een link naar een bepaalde site ge-klikt wordt, om deze te bezoeken.
Een beslissend moment in het behalen van resultaat bij de presentatie van web gegevens in de zoekmachine. Een goede omschrijving levert
betere waarden voor <click through>.
Crawler
Zie Spider.
Een link naar een website die niet meer bestaat, waarvan de server niet reageert of is verhuisd naar een ander site adres. De meeste
zoekmachines zorgen ervoor dat de opgenomen links of verwijzingen regelmatig worden gecontroleerd op het aanwezig zijn van dead links.
Het toenemen van het aantal geïndexeerde pagina’s maakt het echter steeds moeilijker alle sites regelmatig te controleren. Verwijderde pagina’s kunnen op normale wijze gerapporteerd worden aan zoekmachines om hun opname te annuleren.
De-listing
Het verwijderen van de pagina’s van een site uit de index van een zoekmachine. Aan de verwijdering kunnen verschillende oorzaken ten
grondslag liggen, waar onder de kwaliteit van de server, en pogingen tot spam-indexing.
Description
Beschrijvende tekst in een webpagina, onzichtbaar voor de bezoeker van de pagina, en gebruikt door zoekmachines om naast het gevonden
URL een aanduiding van de site- of pagina inhoud te geven (samen met de title). Sommige spiders halen deze tekst uit de pagina zelf, andere
halen deze uit de descripton meta tag.
De meeste directories gebruiken de opgaaf van de registratie.
Directory
Server of verzameling servers die pagina’s of web adressen verzamelen en indexeren op trefwoorden of eigenschappen. Directories (ook Indexen) worden meestal handmatig of semi-automatisch samengesteld en gevuld met informatie die door webbeheerders zelf aan de sites wordt verstrekt (site submission) (voorbeeld whatsnew.com), ook kan de inhoud onder redactie staan: (zoals het geval is bij Yahoo).
Domain / Domein
Groep van Internetadressen, organisatorisch of geografisch gerangschikt. We onderscheiden top-level domeinen .edu, .gov, .org , .nl ar, .ca, .fr,.ro enz). Gewone domeinen zijn vaak verbonden aan één bepaalde website, meestal verbonden aan firmanaam of ander typerend kenmerk van de site.
Het belang van goed gekozen domeinnamen is dat een geschikte domeinnaam beter scoort in zoekmachines dan een site die in de subdirectory van een ander domein resideert; Voorbeeld : ( http:/www.cetest.nl/index.htm versus http://www.box.cetest/index.htm, beide verwijzen naar dezelfde pagina.)
Doorway Page
Zie Gateway Page.
Het komt voor dat een web site de inhoud van een goedgeplaatste site kopieert, en deze op een andere site publiceert. Het is nu niet ondenkbaar dat de nieuwe (kopie) site even goed of beter scoort dan de originele en op deze wijze ‘webverkeer” steelt van de originele site. Indien U dit overkomt, maak dan de dief attent op Uw eigendomsrechten, waarschuw de beheerder van de zoekmachine en de provider van de neiuwe site. Zorg voor bewijsmateriaal zoals een print van uw site.
False Drop
Zoekresultaat dat niet relevant is bij de gevraagde zoektermen. Oorzaken:
De geretourneerde pagina bevat wel de zoektermen, maar in een verkeerde volgorde of verkeerde context.
De site waarop her resultaat betrekking heeft maakt gebruik van “spam-indexing” , en is sinds de aanmelding en positionering van inhoud
gewijzigd. De directory of zoekmachine heeft een fout in haar database.
FFA
FFA = Free For All link Pagina’s vol met linkjes waar niemand naar kijkt. Ons advies: niet doen! FFA site’s zorgen er alleen voor dat u heel veel spam gaat ontvangen.
Font and background spoofs
Verzamelnaam voor verschillende manieren om tekst te verschuilen in web pagina’s, onzichtbaar voor de surfer, maar juist bedoeld voor de
spiders van de zoekmachine. Meestal door tekst dezelfde kleur te geven als de achtergrond. De meeste spiders sanctioneren heden ten dage deze vorm van spamdexing. Pas op indien U bewust verschillende tinten van dezelfde kleur toepast voor tekst en achtergrond.
Frames
Een HTML techniek waarbij meer dan één HTML document tegelijkertijd wordt gepresenteerd. Dit gebeurt door het browser window te verdelen in meerdere windows. Frame pagina’s worden minder eenvoudig herkend door zoekspiders. Het opnemen van extra verwijzingen in de <NOFRAMES> sectie kan de indexeerbaarheid verbeteren. Gebruikt Uw site frames, overweeg dan het toevoegen van essentiële links om al
Uw pagina’s voor de spiders bereikbaar te maken.
Een gateway pagina is een op een bepaalde zoekmachine toegesneden “hoofdpagina”. Elke zoekmachine hanteert haar eigen criteria over hoe
een aangeboden pagina verwerkt en gepositioneerd wordt. Door verschillende gateway pagina’s te creëren kan voor elke zoekmachine optimaal resultaat worden verkregen. Gateway pagina’s verwijzen vervolgens al dan niet automatisch door naar de hoofdindex van de Site.
Er zijn behalve het bovenstaande verschillende argumenten om gateway pagina’s toe te passen.
– optimaal zoekresultaat voor een spider gaat niet altijd samen met esthetiek van de lay-out.
– de auteur van de pagina wil niet dat de zoek informatie t.b.v. spiders bekend en geplagieerd wordt door de hoofdpagina te kopieren.
Voorbeeld van een gateway pagina:
http://www.cetest.nl/index2.htm
of
http://www.isquare.com/gateway.htm
Verborgen tekst op een web pagina. Deze teksten zijn wel toegankelijk voor spiders. Meestal is de oorzaak dat de ontwerper de tekst in dezelfde kleur laat weergeven als de achtergrond. Verborgen tekst kan ook worden opgenomen in comment statements of comment tags. Ook het toepassen van meer dan één title tag kan toegepast worden om tekst te verbergen. Over het algemeen worden deze technieken beschouwd als spamdexing en gesanctioneerd door de zoekmachine door de pagina niet te indexeren of de positie te verlagen. De techniek stamt uit 1996/1997 en gaf destijds het gewenste resultaat, nl. een hogere positie in de zoekresultaten.
Hit
Een hit is in browser termen het opvragen van een HTML element. Dat kan een pagina zijn, maar ook een grafische file uit zo’n pagina; er
kunnen dus meerdere hits optreden bij het opvragen van Uw home pagina.
Een indexpagina van Uw site met daarop 10 buttons die elk een andere graphics file opvragen, levert dus 11 hits op. In zoekmachines of
directories is een hit een gevonden site adres (URL), op basis van geleverde zoektermen.
HTML
HyperText Markup Language – de programmeertaal voor web pagina lay-out.
HTTP
Hypertext transfer protocol – het belangrijkste protocol voor data-overdracht op het World Wide Web tussen servers en clients.
Zie Directory.
Zoekterm, één van de termen waarmee u een zoekopdracht samenstelt.
Keyword phrase
Zoekzin, combinatie van de termen waarmee u een zoekopdracht samenstelt.
Het proces dat wordt toegepast om een gecombineerde zoekopdracht te realiseren, zie ook Meta Search Engine.
Meta search engine
Een zoekprogramma dat op basis van één zoekopdracht automatisch aan 10 of meer zoekmachines een zoekopdracht verstrekt, de resultaten samenvat en presenteert, vaak in de vorm van en HTML pagina. Dogpile , Metafind en Copernic zijn voorbeelden van meta search engines.
Metatag
Een kenmerk van HTML-taal, waarbij een tekstfragment voor browsers onzichtbaar gemaakt wordt. Een spider van een zoekmachine echter kan aan deze tekst fragmenten een bijzondere betekenis toekennen. Er zijn verschillende tags, de belangrijkste zijn “keywords” en “description”. Het KEYWORD kenmerk geeft aan de spider door dat het volgende tekstfragment informatie bevat over specifieke zoektermen waarvan de auteur vindt dat deze de inhoud van de site kenmerken. Het DESCRIPTION kenmerk geeft een omschrijving weer van de inhoud van de site zoals deze door de zoekmachine gepresenteerd zou kunnen worden.
Mirror Sites
Volledige kopie van een bepaalde site, meestal op een andere statische lokatie, het doel is het verkeer naar de originele site wat te ontlasten. Kan ook misbruikt worden als spamdexing, om de relevantie van de pagina’s te verhogen. Infoseeks sniffer kan dit type spamdexing detecteren.
Multiple Keyword tags
Het toepassen van meer dan één metatag statement voor keywords. Niet aanbevelenswaardig. Overtollige statements worden genegeerd door de spiders, of de pagina wordt herkend als spamdexed.
Multiple Titles
Het herhalen van de het titel-meta statement van een pagina om de relvantie te verhogen. Wordt meestal ontdekt.
Het wijzigen van de pagina met als doel een betere positie in de zoekmachines te verwerven. Zoekmachines presenteren de gevonden resultaten in brokjes van 10-of 20 pagina’s. Het is essentieel bij die eerste 20 resultaten te behoren, om zo potentiële bezoekers te trekken.
Optimalisatie gebeurt door de volgorde van tekstfragmenten te wijzigen, door het toepassen van keyword meta-tags, door de pagina titel juist te kiezen (title-tag), door aan figuren de juiste attributen toe te kennen, door het herstructureren van de eerste 250 woorden op de pagina, of door de juiste headings op de pagina te gebruiken. Voorbeeld: een grote foto boven aan de pagina schermt informatieve tekst af. Plaats deze bij voorkeur lager op de pagina.
Een maat voor het aantal “links” naar de betreffende web-site of webpagina. Sommige zoekmachines gebruiken deze maatstaf voor het
bepalen van de populariteit en dus van de positionering. De redenering is dat als sites de moeite nemen naar een andere door te linken, deze dus interessante informatie bevat.
Placement
Zie Positioning.
Politeness window
Om bepaalde servers niet over te belasten, limiteren spiders hun activiteiten per server tot een bepaald aantal pagina’s per server. Indien Uw pagina’s op een grote server zijn geplaatst, is het mogelijk dat deze nimmer aan de beurt komen. Deze pagina’s worden dan niet geïndexeerd. Een belangrijk argument voor een eigen server.
Portal
zie gateway page
Positionering is het ordenen van zoekresultaten op volgorde van relevantie. Het meest significante zoekresultaat bij een bepaalde zoekopdracht wordt als eerste gepresenteerd.
Positioning Technique
De techniek van het juist positioneren en de optimalisatie en verificatie daarvan.
Een woord, groep woorden, zin of zinsdeel die eventueel gecombineerd met syntactische elementen een zoekopdracht voor een zoekmachine
vormt.
Zie Positioning.
Referrer
Het adres van de pagina die uw bezoeker bezocht vóórdat deze de uwe bezocht. Een goed server’s log-file houdt dit voor u bij. Indien Uw bezoeker via een zoekmachine bij U kwam herkent men in de log tevens de keywords waarmee uw site werd gevonden.
RegistrationDe aanmeldprocedure voor een bepaald Site Adres (URL) bij een of meerdere zoekmachines of directories.
Relevancy Algorithm
De methode waarop de zoekmachine de relevantie van de inhoud vaststeld in relatie tot de verstrekte of gevraagde keywords. Elke zoekmachine heeft haar eigen algorithme, en verandert dit van tijd tot tijd.
Re-submission
Het herhalen van een verzoek om registratie bij een zoekmachine. Dergelijke verzoeken kunnen nuttig zijn omdat de inhoud van pagina’s is gewijzigd, maar wordt over het algemeen met enig wantrouwen bekeken, omdat dergelijke verzoeken mogelijk te maken hebben met pogingen tot spamdexing. Meestal worden herhaalde pogingen tot registratie herkend en Infoseek verwijderd indexeringen van registraties die korter op elkaar volgen dan 24 uur. Voornamelijk Alta Vista en InfoSeek worden door spammers misbruikt door hun snelle indexering, vaak slechts enkele uren. deze lenen zich daardoor goed voor experimenten. Incidenteel heraanbieden wordt niet gezien als spamdexing.
Robot
Elk browser programma dat zelfstandig hypertext links op web pagina’s volgt zonder menselijke invloed.
De spiders die door de zoekmachine worden gebruikt zijn voorbeelden van robots.
Een ander voorbeeld zijn de e-mail adres “grazers” die een gehele site afgrazen op zoek naar e-mail adressen (en deze vervolgens te gebruiken voor bijv. reclame doeleinden).
robots.txt
Tekst file in het hoogste site level met als doel de toegang van zoek spiders tot delen van de site te beperken. Alleen robot programma’s (spiders) die compatible zijn met de “Robots Exclusion Standard” maken gebruik van en gehoorzamen aan deze informatie.
Het onderstaande voorbeeld verbiedt robot programma’s de toegang tot de site-directory ” /secret” (dit werkt alleen op vrijwillige basis, een ieder heeft vrij toegang tot /secret).User-agent: *
Disallow: /secret
In principe een gewone internetsite waarvan de server voorzien is van geavanceerde zoek- en database software, zodat dynamisch zoekopdrachten in real time kunnen worden opgevraagd. De database inhoud wordt over het algemeen verzameld middels spider programma’s die systematisch aangemelde en andere sites benaderen en hun inhoud indexeren.
Enkele belangrijke zoekmachines zijn Google, Bing, Hotbot, Lycos, Infoseek, Northern Light en Webcrawler. Opmerking: Yahoo is een directory, geen zoekmachine. Het begrip Search Engine zowel voor zoekmachines als directories door elkaar gebruikt.
Server
Een computer, programma of proces dat data verstrekt op verzoek van een client. Op het internet worden alle pagina’s op servers opgeslagen.
Uw provider beheert de server van uw site.
Syphoning
Benaming voor verschillende methoden van diefstal van de gegevens van populaire sites, om op deze wijze verkeer naar een andere site te
leiden. Het gebruik van keywords die duidelijk met de site niets van doen hebben zoals de naam van andere (grote) ondernemingen,
organisaties en websites.
Skewing
De techniek -door de search engines toegepast- om bepaalde groepen sites in de zoekresultaten kunstmatig te bevoordelen t.o.v. anderen. Meestal op grond van een menselijke beoordeling van de site (reviewing). Wordt momenteel door Infoseek experimenteel toegepast.
Sniffer
De naam van de door de Infoseek engine toegepaste spider ter preventie van spamdexing. Sniffer detecteert de toepassing van mirror pagina’s, font and background spoofing, multiple title tags, keyword stuffing en ander manieren van spamdexing.
Spamming
Zie ook spamdexing. Algemene benaming voor bulk reclame e-mail, de benaming in de zoek machine is daarvan afgeleid.
Elke techniek of methode die de positionering van een bepaalde website verbetert ten koste van de kwaliteit van de index van de zoekmachine.
Spider
Software programma’s op de computer van een search engine of zoekmachine die het web “afspeuren” naar sites, met als doel deze te integreren in de database van de zoekmachine.
Splash page
Als een gateway page, maar met een aanvullende functie nl het verzorgen van een (reclame) boodschap voordat de site kan worden bereikt.
Spoofing
Zie spamdexing .
SSI
Server Side Includes. HTML statements die, bij een daarvoor geschikte serversoftware, mogelijkheid bieden op de plaats van het statement andere informatie in te voegen. Dit kan statische informaties zijn (andere web pagina), maar ook dynamische informatie uit bijvoorbeeld een database.
De verzameling van verscheidene soorten datatransport van een server naar een client.
Het adres van een bepaald web item, pagina of bestand. Universal Resource Locator. Geeft een wereldwijd (webwijd) ondubbelzinnige
aanduiding daarvan. Het eerste deel ervan geeft aan op welke wijze de inhoud verwerkt (begrepen) moet worden: http: voor webpagina’s, ftp:
voor file transfer , telnet: voor copute rlogin procedure’s, mailto: voor e-mail adressen.
URL Submission
Zie Registration.
Het proces van tekst schrijven, speciaal voor web pagina’s. De kwaliteit ervan is bij bepaalde zoekmachines van belang in verband met de plaatsing en positionering.