Безплатни ресурси за е-бизнес / е-търговия (електронна търговия)Безплатни ресурси за е-бизнес / е-търговия (електронен бизнес / електронна търговия) за малки и средни предприятия
е-бизнес е бизнес обучение курсове семинари предстоящи обучения по е-търговия е търговия електронна търговия основи на електронната търговия: безплатен абонамент статии съвети консултация дистанционно обучение по електронен бизнес собствен бизнес в Интернет е-бизнес обучение е-търговия статии е-книги електронни книги по електронна търговия от дома малък среден бизнес самообучение самоподготовка съвети по електронен бизнес самообучаване безплатен абонамент он-лайн бюлетин курсове семинари по онлайн он-лайн онлайн бизнес за малки и средни предприятия със онлайн собствен бизнес в Интернет задочно обучение WEB търговия за малкия и среден бизнес статия LifeConsult Лайф консулт Христо Янков Life consult София България 0888751921
София 1574, ул. Г.Милев 158, офис 1226
 GSM 0888-751-921    оffiсе@lifесоnsult.infо
  
 Бизнесът в Интернет- консултантски услуги, обучение, WEB-решения Начало 
» Вашата колекция
e-mail:
» Нови статии
:: Маркетинг във Facebook

:: Какво представлява партньорската програма?

:: анонс 12.2010

:: Хакерски атаки по електронната поща (вложени линкове)


всички статии



Аспекти на електронната търговия
Търси в      ИЛИ    


Търсещите машини: Индексиране на страниците
Христо Янков : hristo_yankov@lifeconsult.info


Какви са причините, поради които конкретна страница от вашия сайт може да не бъде индексирана или да изчезне от резултатите, макар индексацията на сайта като цяло да е минала успешно?

Когато става въпрос за истинска търсачка трябва да знаем, че на нея е необходим само адреса на началната страница. Всички останали страници, които желаем да бъдат индексирани, трябва да бъдат достъпни чрез вътрешни за сайта линкове, започващи от нея. На базата на тези знания можем да обособим следните четири групи от възможни причини, поради които страници от сайта да не бъдат индексирани:

I. Страницата не съществува физически

Съвсем естествено е страница, която не съществува да не бъде индексирана от търсачката. Това се получава, когато страницата е изтрита или преименувана без да са променени линковете към нея.


II. Страницата е недостъпна за търсачката:

1. Линкът, сочещ към страницата, не може да бъде проследен от търсачката, защото:

  • хостът е недостъпен;
  • линкът е сгрешен;
  • линкът е изписан грешно с големи и малки букви, в случай на сървъри, които правят разлика между големи и малки букви.
  • линкът е динамично генериран от страна на клиента (браузъра) с помоща на скриптови езици (Java script, VB script). Такива линкове не могат да бъдат разпознати от търсачките;
  • вътрешните линкове са осъществени с помоща на скриптови езици (Java, VBscript, Java script), Flash или някаква друга мултимедийна форма, която не може да бъде проследена от търсачката.
  • не е възможно прочитане на цялото съдържание на страница в лимитираното за интернет-връзката време. Линковете, които се съдържат в частта от страницата, която не е заредена няма да могат да бъдат проследени. Получава се в случаите, когато:
    • размерът на страниците е много голям;
    • сайтът е разположен на доста натоварен хост, който не може да удовлетвори заявката;
    • връзката е с лошо качество;

2. Динамично генерирани страници

  • вътрешните линкове са към динамично генерирани страници от страна на сървъра. Линковете към такива страници се познават по въпросителния знак в URL-адреса на страницата, след който са разположени параметрите на страницата. Някои търсачки не могат да проследяват такива адреси (например http://domain.com/file.php?param1=par1&param2=param2 )
  • страници, генерирани вследствие обръщение към база данни;
  • страници, които са криптирани или компресирани и използват специален алгоритъм за разкомпресиране в браузъра. Такива са обикновено защитени срещу копиране страници, които могат да се гледат, но не и да се копират чрез браузъра, а проследяването им от търсачките е невъзможно.

3. специални страници

  • страници, до които е забранен достъпа на търсещите машини чрез използване на метатага robots или файла robots.txt [вж.1]
  • страници, които пренасочват към други страници с помоща на скриптове от страна на клиента или сървъра. Такива страници няма да бъдат индексирани, а в някои случаи няма да бъде проследена и връзката към страницата, към която те сочат.
  • страници, към които е извършено пренасочване с помоща на скриптове от страна на клиента или сървъра. Пренасочването в повечето случаи не може да бъде разпознато, което нарушава логическия път до новата страница и тя няма да бъде индексирана;
  • защитени с парола страници: съвсем естествено е те да не бъдат достъпни и за търсачките.

III. Използване на фреймове
Те създават известни затруднения на търсачките и могат да доведат до непълно или неправилно индексиране на такива страници. Много често подстраниците, участващи в различните фреймове се индексират (и визуализират) поотделно, а основната страница (която е съставена от тях) не се индексира.


IV. Ограничения на търсещата мащина

Всяка търсачка има определен алгоритъм и ограничения при индексиране на сайта:

  • лимит на страниците, които да индексира при посещение на сайта ( 5, 20, 50...);
  • дълбочина на линковете: т.е. тя проследява линковете от началната страница само до определено ниво (второ, трето), а до останалите страници няма да бъде достигнато. Възможно е при повторните посещения да се индексират линкове на по-дълбоко ниво, които да се добавят към съществуващите вече страници. Някои машини се ограничават само до линковете от първо ниво - т.е. тези, които са достъпни САМО от заглавната ви страница.
  • в случай на спамване на търсещата машина с ключови думи тя може да откаже да индексира конкретна страница.

 


Ето и някои от причините, поради които можете да загубите вече индексирана страница:

  • инцидентна загуба на данни от базата на съответната търсеща машина;
  • повторно индексиране от търсещата машина в момент, в който страницата ви е недостъпна по една или друга причина;
  • ако са индексирани повече страници, отколкото е окончателния ви за съответната търсачка рейтинг, тя може да премахне някои от вече индексираните страници от списъка си (намиращи се на по-дълбоко ниво или считани от нея за второстепенни)

Когато регистрирате сайта си в директориите, трябва да имате предвид следното:

  • страниците ви се преглеждат от хора;
  • трябва да регистрирате всяка една страница поотделно и да укажете в коя под-под-категория желаете тя да попадне;
  • според преценката на оператора, страницата ви може да бъде разположена в друг подраздел на избраната от вас категория или изобщо в друга категория.

 

В заключение искам да отбележа, че на търсещата машина е необходимо известно време преди да посети сайта. Това време е различно за различните търсачки и обикновено е указано на интернет-страницата им, но много често не се спазва. Ето защо трябва да им дадете достатъчно време за реакция (1-1,5 месеца), преди да се притеснявате, че нещо не е в ред. В повечето случаи това време е напълно достатъчно и страниците на сайта биват индексирани, макар често да не могат да бъде открити в списъка с резултатите, поради тяхната многобройност. Ако сте сигурни, че сайтът ви не е индексиран, просто трябва да го подадете на съответната търсачка и отново да изчакате необходимото за регистрация време. Ако това пак се повтори, можете да се свържете директно с поддръжката и да ги попитате "защо?".

_ _ _ _ _ _ _ _ _

Препратки:

[1]
Какво трябва да знаем за META таговете?

обратно в статията

 




  печат (^)               изпрати на познат (^)               добави към колекцията си (^)

Доколко полезна беше статията за Вас?  Ваш коментар(^)
0 1 2 3 4 5


.
 ©2002-2018 Life consult