Dobry podvecer, Neda mi to, aby se vam nevmisil do rozhovoru :-) Ondrej Fryc - bilezbozi.cz s.r.o. napsal: > na to, ze kdyz nadefinujete robots.txt prilis > siroce, budete mit mesicne desitky GB > stazenych dat jenom od fulltextu. Ano, u velkych obchodu tech dat muze byt opravdu hodne. Nicmene reseni IMHO neni restrikce v robots.txt, resp. je to reseni ze vsech nejhorsi. Proc? 1) Slusne vyhledavace jsou setrne. Napr. Google spideruje dynamicke stranky (s parametry v URL) mene casto a nikdy jich nenacita z jednoho webu moc naraz. Vetsinou se to interpretuje jako vada dynamickych stranek, pokud vsak chcete usetrit vykon serveru a prenos dat, je to vyhoda. 2) Hodne zalezi na optimalizaci kodu. Obrazky robot nestahuje, takze jde jen o HTML. Pak zalezi na tom, zda je podil cisteho textu na strance 10% nebo 60%. 3) Nejdulezitejsi na konec: navstevnost z fultextu je tou nejcilenejsi navstevnosti vubec. Weby, ktere maji navstevnost skoro jen z fulltextu dosahuji nekolikanasobne vyssiho konverzniho pomeru, nez navstevnost z katalogu. Jinymi slovy, pri ctvrtinove navstevnosti lze dosahnout stejneho a vyssiho obratu. To uz IMHO stoji za to, robota na stranky pustit. > skutecne se domnivam, ze na Google prijde > pouze MAXIMALNE 3% potencialnich > zakazniku, To je hrozne zajimava otazka, ktera by si zaslouzila podrobnejsi pruzkum. Mam cim dal silnejsi pocit, ze my, "pocitacovi experti", v tomto obycejne uzivatele seredne podcenujeme. Zlom asi nastal uz pred casem lokalizaci Googlu do cestiny, ale my jeste stale uvazujeme ze setrvacnosti o Googlu jako o nastroji odborniku. Donedavana jsem se dost divil vzdy, kdyz jsem potkal Obycejneho Uzivatele(TM), ktery sice prohlizeci rika Internet (takze kdyz mu spadne, spadne mu Internet), URL nezadava do prohlizece, nybrz zasadne do Seznamu, ale klicova slova hleda, svete div se, v Googlu. Od leta jsem to na vlastni oci videl uz asi petkrat a to jsem potkal zivych Obycejnych Uzivatelu(TM) sotva deset. Ted uz se ale nedivim, protoze jsem zrovna vcera delal statistiku navstevnosti jednoho naseho projektu. Web je urcen vyhradne Obycejnym Uzivatelum(TM). Zkuseny Uzivatel(TM) na nej prakticky nevkroci. Optimalizovan je plus/minus stejne pro vsechny vyhledavace i katalogy (tj vsude vyleze na hlavni klicova slova na prvni strance). A zde jsou vysledky: 38%: http://search.seznam.cz/ 9%: http://www.atlas.cz/ 8%: http://katalog.centrum.cz/ 7%: http://www.google.com/ 6%: http://search.centrum.cz/ 3%: http://katalog.atlas.cz/ 3%: http://hledani.tiscali.cz/ 3%: http://dir.seznam.cz/ 2%: http://search.quick.cz/ Jak je videt, vyrazne prevazuje vyhledavani nad brouzdanim katalogem (prvnich pet referreru s vyjimkou Centra je fulltextove hledani, i kdyz castecne v katalozich). Google ma 7%, cili vice nez dvojnasobek vami odhadovaneho maxima. Ciste katalogy (katalog.centrum, dir.seznam, katalog.atlas) skoro propadly. To je ovsem vysledek jen ceske verze stranek, kdybychom se podivali na anglickou verzi, tak je to jeste vyraznejsi: 25%: http://www.google.com/ 18%: http://search.yahoo.com/ 10%: http://aolsearch.aol.com/ 4%: http://dmoz.org/ 2%: http://www.google.de/ 2%: http://www.google.co.uk/ 2%: http://search.lycos.com/ Zde uz ma Google 29%, presneji 57%, nebot web neni registrovan v Yahoo! a vysledky ze search.yahoo a aolsearch jsou dosazeny take pres Google. Pro srovnani, navstevnost anglicke verze je triapulkrat vetsi nez ceske. Zdravi, Marek Prokop
This archive was generated by hypermail 2.1.2 : 04. 11. 2002, 20:44 CET