Re: CRT je poměr roboti:zobrazení

From: Michal Illich (illich@empyreum.cz)
Date: 28. 07. 2001, 12:35 CEST


> kvalitní reklamní ploše, a to navrcholu.cz a lupa.cz. Oba
> vkladají banner na straně serveru a na straně klienta nalezneme
> značky <a> a <img>. Další zajímavostí je značka <META
> NAME="robots" CONTENT="ALL,FOLLOW">. Překladatel z HTML do

	Vecne mate pravdu, prakticky je to totiz slozitejsi. "Web", mereny na
pocet unikatnich URL je nekonecny - vzdy najdete dalsi a dalsi stranky.
Cile robota jsou tak trochu paradoxni:

	(a) mit v databazi co nejvic stranek
	(b) netahat pitomosti (protoze je nikdo k vyhledavani nechce a za
konektivitu se obvykle plati)

	Samozrejme tim vznika rozpor. Ten se obvykle resi tak, ze jak na bazi
automaticke, tak i lidskou kontrolou se nektera URL zakazuji. Pokud muzu
mluvit za vyrobce fulltextu tak (prinejmensim nas Empyreum Fulltext,
nejspis temer i vsichni ostatni) se branime obema zpusoby.

	"Spravne reseni" je jasne: webmaster si na web umisti soubor robots.txt
do rootu domeny, odkud jsou servirovane bannery. Bohuzel vetsina ceskych
webmasteru vubec netusi, jak s roboty pracovat :( (ani jak ku vlastnimu
prospechu, ani k hladsimu chodu inetu).

	Obecne bych rekl, ze kazdy robot, ktery pravidelne indexuje .cz, se
postupem casu "otrka" a prestane indexovat hity z reklamnich systemu,
tedy procento robotich kliknuti bude velmi male.

	Preji prijemny den,

Michal Illich, Empyreum



This archive was generated by hypermail 2.1.2 : 10. 08. 2001, 11:45 CEST