Co to jest indeksowanie witryn? Jak to się stało? Odpowiedzi na te i inne pytania znajdziesz w artykule. Indeksowanie stron internetowych (indeksowanie w wyszukiwarkach) to proces dodawania informacji o witrynie do bazy danych przez robota wyszukiwarek, który jest następnie wykorzystywany do wyszukiwania informacji o projektach internetowych, które przeszły taką procedurę.
Dane o zasobach internetowych to najczęściej słowa kluczowe, artykuły, linki, dokumenty. Można również indeksować dźwięk, obrazy itp. Wiadomo, że algorytm wykrywania słów kluczowych jest zależny od wyszukiwarki.
Istnieją pewne ograniczenia dotyczące typów indeksowanych informacji (pliki flash, javascript).
Zarządzanie inicjacją
Indeksowanie witryny to złożony proces. Aby nim zarządzać (na przykład, aby zabronić załączania określonej strony), musisz użyć pliku robots.txt i instrukcji takich jak Zezwól, Zabroń, Opóźnienie indeksowania, Agent użytkownika i inne.
Również tagi i rekwizyty są używane do indeksowania, ukrywania zawartości zasobu przed robotami Google i Yandex (Yahoo używa tagu).
W wyszukiwarce Goglle nowe witryny są indeksowane od kilku dni do tygodnia, a w Yandex - od jednego do czterech tygodni.
Czy chcesz, aby Twoja witryna pojawiała się w zapytaniach wyników wyszukiwania? Następnie musi zostać przetworzony przez Rambler, Yandex, Google, Yahoo i tak dalej. Musisz poinformować wyszukiwarki (pająki, systemy) o istnieniu Twojej witryny, a następnie zaindeksują ją w całości lub w części.
Wiele witryn nie było indeksowanych od lat. Informacje, które się na nich znajdują, nie są widoczne dla nikogo poza ich właścicielami.
Metody przetwarzania
Indeksowanie witryny można przeprowadzić na kilka sposobów:
- Pierwsza opcja to dodawanie ręczne. Musisz wprowadzić dane swojej witryny za pomocą specjalnych formularzy oferowanych przez wyszukiwarki.
- W drugim przypadku robot wyszukiwarki sam znajduje Twoją witrynę internetową za pomocą linków i indeksuje ją. Może znaleźć Twoją witrynę, korzystając z linków z innych zasobów, które prowadzą do Twojego projektu. Ta metoda jest najbardziej wydajna. Jeśli wyszukiwarka znajdzie witrynę w ten sposób, uzna ją za istotną.
Czas
Indeksowanie witryny nie jest zbyt szybkie. Terminy różnią się, od 1-2 tygodni. Linki z autorytatywnych zasobów (z doskonałym PR i Titz) znacznie przyspieszają umieszczenie strony w bazie danych wyszukiwarki. Dziś Google uważany jest za najwolniejszy, choć do 2012 roku mógł wykonać tę pracę w tydzień. DoNiestety, sytuacja bardzo szybko się zmienia. Wiadomo, że Mail.ru współpracuje ze stronami internetowymi w tym obszarze od około sześciu miesięcy.
Zaindeksowanie witryny w wyszukiwarkach nie jest możliwe dla każdego specjalisty. Na czas dodawania nowych stron do bazy witryny już przetworzonej przez wyszukiwarki internetowe ma wpływ częstotliwość aktualizacji jej zawartości. Jeśli w zasobie stale pojawiają się nowe informacje, system uzna je za często aktualizowane i przydatne dla ludzi. W tym przypadku jej praca jest przyspieszona.
Możesz śledzić postęp indeksowania witryny internetowej w specjalnych sekcjach dla webmasterów lub w wyszukiwarkach.
Zmiany
Więc już ustaliliśmy, w jaki sposób witryna jest indeksowana. Należy zauważyć, że bazy danych wyszukiwarek są często aktualizowane. W związku z tym liczba dodanych do nich stron Twojego projektu może się zmieniać (zarówno zmniejszać, jak i zwiększać) z następujących powodów:
- sankcje wyszukiwarek wobec witryny;
- obecność błędów na stronie;
- zmiana algorytmów wyszukiwarek;
- obrzydliwy hosting (niedostępność serwera, na którym znajduje się projekt) i tak dalej.
Odpowiedzi Yandex na często zadawane pytania
"Yandex" to wyszukiwarka używana przez wielu użytkowników. Zajmuje piąte miejsce wśród światowych systemów wyszukiwania pod względem liczby przetworzonych zapytań badawczych. Jeśli dodałeś do niej witrynę, dodanie jej do bazy danych może zająć zbyt dużo czasu.
Dodanie adresu URL nie gwarantuje jego indeksowania. To tylko jedna z metod, którymi mówi się robotowi systemowemuo nowym zasobie. Jeśli jest niewiele linków do witryny z innych witryn lub nie ma ich wcale, dodanie jej pomoże Ci szybciej ją znaleźć.
Jeżeli indeksowanie nie wystąpiło, musisz sprawdzić, czy nie wystąpiły jakiekolwiek awarie na serwerze w momencie tworzenia dla niego aplikacji z robota Yandex. Jeśli serwer zgłosi błąd, robot zakończy swoją pracę i spróbuje wykonać ją w kolejce w obie strony. Pracownicy Yandex nie mogą zwiększyć szybkości dodawania stron do bazy danych wyszukiwarki.
Indeksowanie witryny w Yandex to dość trudne zadanie. Nie wiesz jak dodać zasób do wyszukiwarki? Jeśli są do niej linki z innych stron internetowych, to nie musisz dodawać specjalnej strony - robot automatycznie ją znajdzie i zindeksuje. Jeśli nie masz takich linków, możesz użyć formularza „Dodaj adres URL”, aby poinformować wyszukiwarkę, że witryna istnieje.
Pamiętaj, że dodanie adresu URL nie gwarantuje, że Twoje dzieło zostanie zindeksowane (lub zindeksowane).
Wiele osób zastanawia się, ile czasu zajmuje indeksowanie witryny w Yandex. Pracownicy tej firmy nie dają gwarancji i nie przewidują terminów. Z reguły odkąd robot dowiedział się o witrynie, jej strony w wyszukiwaniu pojawiają się w ciągu dwóch dni, czasem w ciągu kilku tygodni.
Proces
"Yandex" to wyszukiwarka, która wymaga dokładności i uwagi. Indeksowanie witryny składa się z trzech części:
- Robot wyszukiwania indeksuje strony zasobów.
- Treść(treść) witryny jest zapisywana w bazie danych (indeksie) systemu wyszukiwania.
- W ciągu 2-4 tygodni, po aktualizacji bazy danych, możesz zobaczyć wyniki. Twoja witryna pojawi się (lub nie będzie) w wynikach wyszukiwania.
Kontrola indeksowania
Jak sprawdzić indeksowanie witryny? Można to zrobić na trzy sposoby:
- Wprowadź nazwę swojej firmy w pasku wyszukiwania (na przykład „Yandex”) i sprawdź każdy link na pierwszej i drugiej stronie. Jeśli znajdziesz tam adres URL swojego pomysłu, robot wykonał swoje zadanie.
- Możesz wpisać adres URL swojej witryny w pasku wyszukiwania. Będziesz mógł zobaczyć, ile arkuszy internetowych jest wyświetlanych, tj. indeksowanych.
- Zarejestruj się na stronach webmasterów w Mail.ru, Google, Yandex. Po przejściu weryfikacji witryny będziesz mógł zobaczyć wyniki indeksowania i inne usługi wyszukiwarek stworzone w celu poprawy wydajności Twojego zasobu.
Dlaczego Yandex zawodzi?
Indeksowanie witryny w Google odbywa się w następujący sposób: robot wprowadza do bazy danych wszystkie strony witryny, niskiej jakości i wysokiej jakości, bez wybierania. Ale w rankingu znajdują się tylko przydatne dokumenty. A „Yandex” natychmiast wyklucza wszystkie śmieci internetowe. Może indeksować każdą stronę, ale wyszukiwarka ostatecznie wyeliminuje wszystkie śmieci.
Oba systemy mają indeks przyrostowy. Obie strony niskiej jakości wpływają na ranking witryny jako całości. Działa tu prosta filozofia. Ulubione zasoby danegoużytkownik zajmie wyższe pozycje w swoim wydaniu. Ale ta sama osoba będzie miała trudności ze znalezieniem strony, której ostatnio nie lubił.
Dlatego najpierw należy zakryć kopie dokumentów internetowych przed indeksowaniem, sprawdzić puste strony i zapobiec indeksowaniu treści o niskiej jakości.
Przyspieszenie Yandex
Jak mogę przyspieszyć indeksowanie witryn w Yandex? Wykonaj następujące kroki:
- Zainstaluj przeglądarkę Yandex na swoim komputerze i używaj jej do przeglądania stron witryny.
- Potwierdź prawa do zarządzania zasobami w Yandex. Webmaster.
- Opublikuj link do artykułu na Twitterze. Wiadomo, że Yandex współpracuje z tą firmą od 2012 roku.
- Dodaj wyszukiwanie z Yandex dla witryny. W sekcji „Indeksowanie” możesz wprowadzić własne adresy URL.
- Wprowadź kod „Yandex. Metrica” bez zaznaczania „Przesyłanie stron do indeksowania jest zabronione”.
- Utwórz mapę witryny, która istnieje tylko dla robota i nie jest widoczna dla odbiorców. Od niego rozpocznie się weryfikacja. Adres mapy witryny jest wprowadzany w pliku robots.txt lub w odpowiednim formularzu w polu „Webmaster” - „Ustawienia indeksowania” - „Pliki mapy witryny”.
Działania pośrednie
Co należy zrobić, zanim strona internetowa zostanie zindeksowana przez Yandex? Wyszukiwarka krajowa powinna traktować witrynę jako główne źródło. Dlatego jeszcze przed publikacją artykułu konieczne jest dodanie jego treści do formy „Teksty szczegółowe”. W przeciwnym razieplagiatorzy skopiują rekord do swojego zasobu i będą pierwsi w bazie danych. W rezultacie zostaną uznani za autorów.
Baza danych Google
W przypadku Google odpowiednie są te same zalecenia, które opisaliśmy powyżej, tylko usługi będą się różnić:
- Google+ (zastępując Twittera);
- Google Chrome;
- Narzędzia Google dla programistów - „Skanuj” - „Wyglądaj jak Googlebot” - opcja „Skanuj” - opcja „Indeks”;
- wyszukaj w zasobie od Google;
- Google Analytics (zamiast Yandex. Metrics).
Zakaz
Co to jest zakaz indeksowania witryn? Możesz ją nałożyć zarówno na całą stronę, jak i na jej oddzielną część (link lub fragment tekstu). W rzeczywistości istnieje zarówno globalny, jak i lokalny zakaz indeksowania. Jak to jest realizowane?
Rozważmy zakaz dodawania strony internetowej do bazy danych wyszukiwarki w Robots.txt. Korzystając z pliku robots.txt, możesz wykluczyć indeksowanie jednej strony lub całego nagłówka zasobu w następujący sposób:
- Agent użytkownika:
- Disallow: /kolobok.html
- Nie zezwalaj: /foto/
Pierwszy punkt mówi, że instrukcje są zdefiniowane dla wszystkich PS, drugi wskazuje, że indeksowanie pliku kolobok.html jest zabronione, a trzeci nie pozwala na dodanie całego upchania folderu foto do folderu Baza danych. Jeśli chcesz wykluczyć wiele stron lub folderów, określ je wszystkie w Robots.
Aby zapobiec indeksowaniu określonego arkusza internetowego, możesz użyć metatagu robots. Różni się od robots.txtfakt, że daje instrukcje wszystkim PS na raz. Ten metatag jest zgodny z ogólnymi zasadami formatu html. Należy go umieścić w tytule strony pomiędzy tagami. Na przykład wpis dotyczący bana może być napisany tak:.
Ajax
Jak Yandex indeksuje witryny Ajax? Obecnie technologia Ajax jest używana przez wielu twórców witryn internetowych. Oczywiście ma ogromny potencjał. Dzięki niemu możesz tworzyć szybkie i wydajne interaktywne strony internetowe.
Jednak robot wyszukiwarki „widzi” listę stron internetowych inaczej niż użytkownik i przeglądarka. Na przykład osoba patrzy na wygodny interfejs z ruchomymi kartami internetowymi. W przypadku robota indeksującego zawartość tej samej strony może być pusta lub prezentowana jako pozostała część statycznej treści HTML, w przypadku której skrypty nie działają.
Możesz użyć adresu URL zdo tworzenia witryn Ajax, ale wyszukiwarka go nie używa. Zwykle część adresu URL pojest oddzielona. Należy to wziąć pod uwagę. Dlatego zamiast adresu URL, takiego jak https://site.ru/example, tworzy aplikację do strony głównej zasobu znajdującego się pod adresem https://site.ru. Oznacza to, że zawartość arkusza internetowego może nie dostać się do bazy danych. W rezultacie nie pojawi się w wynikach wyszukiwania.
Aby usprawnić indeksowanie witryn Ajax, Yandex wsparł zmiany w robocie wyszukiwania i zasadach przetwarzania adresów URL takich witryn internetowych. Dziś webmasterzy mogą wskazać wyszukiwarce Yandex potrzebę indeksowania, tworząc odpowiedni schemat w strukturze zasobów. Do tego potrzebujesz:
- Zastąp symbolw adresie URL stronna !. Teraz robot zrozumie, że może ubiegać się o wersję HTML treści tego arkusza internetowego.
- HTML wersja treści takiej strony powinna być umieszczona pod adresem URL, gdzie ! zastąpione przez ?_escaped_fragment_=.