Современная электронная библиотека ModernLib.Net

SEO – искусство раскрутки сайтов

ModernLib.Net / Интернет / Джесси Стрикчиола / SEO – искусство раскрутки сайтов - Чтение (Ознакомительный отрывок) (стр. 4)
Автор: Джесси Стрикчиола
Жанр: Интернет

 

 


Для сегодняшних поисковых движков одного анализа документа недостаточно, поэтому они также смотрят на семантическую связность.

Семантическая связность – это слова или фразы, которые обычно ассоциируются друг с другом. Поисковые движки активно создают свои собственные словари, которые помогают им определить, как связаны определенные термины или темы. Сканируя свои огромные базы данных контента, они могут применить теорию нечетких множеств и некоторые уравнения (это описано по адресу http://forums.searchenginewatch.com/showthread.php?threadid=48) для связывания терминов и начать понимать web-страницы более похожим на человеческий образом.

Профессиональному специалисту по оптимизации не обязательно применять инструменты измерения семантической связности для оптимизации web-сайтов, но для тех продвинутых специалистов, которые хотят использовать каждую возможность, измерения семантической связности могут помочь в следующих областях:

• измерение целевых ключевых фраз;

• измерение ключевых фраз для включения в страницу по определенной теме;

• измерение связей текста (на других сайтах с высоким рейтингом);

• поиск страниц, которые предоставляют релевантные ссылки по теме.

Несмотря на то, что источник этого материала имеет сугубо технический характер, специалисту по оптимизации нужно знать только принципы, чтобы получить эту ценную информацию. Важно помнить, что несмотря на то, что мир информационного поиска имеет сотни технических и часто трудных для понимания терминов, их можно разделить на группы, которые способен понять даже новичок в области оптимизации.

В табл. 2.1 объясняются некоторые часто встречающиеся типы информационного поиска.

Таблица 2.1. Часто встречающиеся типы поиска

Модели информационного поиска (поисковые движки) используют теорию нечетких множеств (ответвление нечеткой логики, созданной доктором Lotfi Zadeh в 1969 г.) для обнаружения семантической связности между двумя словами. Вместо использования словаря для обоснования связи двух слов, система информационного поиска может применить свои большие базы данных контента для угадывания этой связи.

Несмотря на то, что этот процесс может показаться сложным, основы его просты. Поисковые движки полагаются на машинную логику (правда/ложь, да/нет и т. д.). Машинная логика имеет некоторые преимущества перед человеческой, но она не способна мыслить подобно человеку. И те вещи, которые интуитивно понятны человеку, может быть очень сложно понять компьютеру. Например, апельсины и бананы – это фрукты, но апельсины и бананы не круглые. Для человека это интуитивно понятно.

Чтобы машина поняла эту концепцию и подобные ей, ключом может стать семантическая связность. Огромные знания человечества (содержащиеся в Интернете) могут быть занесены в индекс системы и проанализированы, чтобы искусственным образом создать те связи, которые уже создали люди. Таким образом, машина узнает, что апельсин круглый, а банан – нет (потому что она просканировала тысячи вхождений в свой индекс слов "банан" и "апельсин" и заметила, что "круглый" и "банан" вместе встречаются редко, а "апельсин" и "круглый" вместе встречаются часто).

Именно здесь вступает в игру нечеткая логика и применение теории нечетких множеств помогает компьютеру понять, как термины связаны (путем измерения того, как часто и в каком контексте они используются вместе).

На этом понятии основана родственная концепция латентного семантического анализа (latent semantic analysis, LSA). Его идея состоит в том, что, взяв огромный составной индекс из миллиардов web-страниц, поисковый движок может "выучить", какие слова связаны и какие концепции имеют отношение друг к другу.

Например, используя LSA, поисковый движок поймет, что trips (путешествия) в zoo (зоопарк) часто включают в себя viewing wildlife и animals (наблюдение за дикой природой и животными), причем это может быть частью tour (тура).

Теперь выполним поиск в Google по ~zoo ~trips (тильда – это оператор поиска, подробнее об этом далее в этой же главе). Google выводит "связанные" термины жирным шрифтом и распознает, какие термины часто встречаются совместно (вместе, на одной странице, либо в непосредственной близости) в его индексах.

Некоторые формы LSA имеют слишком высокую вычислительную стоимость. Например, в настоящее время поисковые движки недостаточно "умны" для того, чтобы "обучаться" так же, как это делают некоторые более новые обучающиеся компьютеры в Массачусетском технологическом институте. Например, они не могут узнать из своего индекса, что зебры и тигры – это полосатые животные, хотя они могут обнаружить, что "полосы" и "зебры" более семантически связаны, чем "полосы" и" утки".

Латентное семантическое индексирование (latent semantic indexing, LSI) делает еще один шаг вперед, используя семантический анализ для идентификации связанных web-страниц. Например, поисковый движок может заметить одну страницу (в которой говорится о докторах) и другую (в которой говорится о терапевтах) и на основе других общих слов, имеющихся в этих двух страницах, определить, что между этими страницами есть связь. В результате страница с упоминанием докторов может быть показана по запросу, в котором используется слово терапевт.

В такие технологии в течение многих лет вкладываются деньги. Например, в апреле 2003 г. компания Google приобрела компанию Applied Semantics (http://www.appliedsemantics.com/), которая известна своей технологией семантической обработки текста. Эта технология теперь работает в рекламной программе AdSense компании Google и, скорее всего, применяется также и в основных алгоритмах поиска.

Все это дает нам общее понятие о том, как поисковые движки распознают связи между словами, фразами и идеями в сети Интернет. Поскольку семантическая связность играет все большую роль в алгоритмах поисковых движков, то можно ожидать и большего акцента на теме страниц, сайтов и ссылок. В будущем будет очень важно реализовать способность поисковых движков к пониманию идей и тем, а также к распознаванию контента, ссылок и страниц, которые не очень хорошо соответствуют схеме web-сайта.

<p>Анализ ссылок</p>

При анализе ссылок поисковый движок измеряет, кто делает ссылки на сайт (или страницу) и что там говорится об этом сайте (странице). Он также хорошо представляет, кто с кем связан партнерскими отношениями (при помощи исторических данных по ссылкам, регистрационных записей о сайтах и прочих источников), кому стоит доверять (по авторитету ссылающихся сайтов и контекстуальным данным о сайте, на котором находится страница), кто ссылается на этот сайт, что они говорят об этом сайте и т. д.

Анализ ссылок идет гораздо дальше, чем подсчет количества имеющихся на данную web-страницу (или сайт) ссылок, поскольку ссылки не одинаковы. Ссылки с высокоавторитетной страницы высокоавторитетного сайта будут значить больше, чем другие ссылки с меньшим авторитетом. Сайт или страница могут быть признаны авторитетными после комбинированного анализа шаблонов ссылок и семантического анализа.

Предположим, что вас интересуют сайты об уходе за собаками. Чтобы определить коллекцию web-страниц, которые посвящены теме ухода за собаками, поисковый движок может использовать семантический анализ. Затем поисковый движок может определить, какие из этих сайтов по уходу за собаками имеют больше всего ссылок со всего множества сайтов по уходу за собаками. Эти сайты, скорее всего, и являются наиболее авторитетными по данной теме.

Реально такой анализ несколько сложнее. Например, представьте себе, что есть пять сайтов по уходу за собаками, имеющих множество ссылок по данной теме со страниц по всему Интернету:

• сайт А имеет 213 тематических ссылок;

• сайт В имеет 192 тематические ссылки;

• сайт С имеет 203 тематические ссылки;

• сайт D имеет 113 тематических ссылок;

• сайт Е имеет 122 тематические ссылки.

Далее может оказаться так, что сайт А, сайт В, сайт D и сайт Е – все они ссылаются друг на друга, но ни один из них не ссылается на сайт С. Большинство тематических ссылок сайта С приходит с других страниц, которые тематически релевантны, но имеют мало ссылок. При таком сценарии сайт С определенно не является авторитетным, поскольку на него не ссылаются "правильные" сайты.

Эта концепция группирования сайтов по их релевантности называется "соседством ссылок" (link neighborhood). Ваши соседи говорят что-то по теме вашего сайта, а количество и качество ссылок от ваших соседей говорит о важности вашего сайта для данной темы.

Степень, в которой поисковый движок полагается на оценку "соседства ссылок", не ясна и, скорее всего, она у разных движков разная. Кроме того, ссылки с нерелевантных страниц все равно помогают рейтингу целевых страниц. Тем не менее основная идея такова: ссылка с релевантного сайта должна учитываться как более ценная, чем ссылка с нерелевантного сайта.

Еще один фактор определения ценности ссылки – это способ ее реализации и место размещения. Например, сам использованный для ссылки текст (тот реальный текст, который попадет на вашу web-страницу, когда пользователь щелкнет ссылку) также является сильным сигналом для поискового движка.

Это называется "якорным текстом” (anchor text). И если этот текст насыщен ключевыми словами (релевантными для терминов вашего поиска), то он сделает для ваших рейтингов в поисковых движках больше, чем если бы эта ссылка не была насыщена ключевыми словами. Например, якорный текст Dog Grooming Salon будет для сайта салона по уходу за собаками гораздо более ценным, чем якорный текст Click here. Однако будьте осторожны. Если у вас есть 10 000 ссылок с якорным текстом Dog Grooming Salon и очень мало других ссылок на ваш сайт, то это выглядит неестественно и может привести к проблемам с вашим рейтингом.

Семантический анализ ценности ссылки – это не только якорный текст. Например, если у вас есть якорный текст Dog Grooming Salon на той странице, которая совсем не об уходе за собаками, то ценность такой ссылки меньше, чем когда эта страница посвящена уходу за собаками. Поисковые движки смотрят и на содержимое страницы, находящееся вокруг ссылки, и на общий контекст, и на авторитет того web-сайта, который дает ссылку.

Все эти факторы являются компонентами анализа ссылок, который мы обсудим более подробно в главе 7.

<p>Проблемные слова, устранение неоднозначности, разнообразие</p>

Обратная сторона монеты – это слова, которые представляют собой постоянную проблему для поисковых движков. Одна из самых больших трудностей – это устранение неоднозначностей. Например, когда кто-то пишет boxers, то что он имеет в виду? Боксеров, породу собак или тип трусов? Еще один пример такого же типа – jaguar, который одновременно обозначает ягуара, марку машины, футбольную команду, операционную систему и гитару. Что конкретно имел в виду пользователь?

Поисковые движки все время работают с такими неоднозначными запросами. Эти два приведенных примера содержат в себе врожденные проблемы, но данная проблема гораздо шире. Например, если кто-то пишет такой запрос, как cars, то что он хочет?

• Почитать обзоры?

• Отправиться на автомобильный салон?

• Купить автомобиль?

• Почитать о новых автомобильных технологиях?

Запрос cars настолько общий, что нет никакого реального способа понять намерение пользователя по одному только запросу. (Исключением являются те случаи, когда предыдущие запросы этого же пользователя дают дополнительные подсказки, которыми поисковый движок может воспользоваться для улучшения определения намерения пользователя.)

Именно поэтому поисковые движки предлагают разнообразные результаты. Например, на рис. 2.22 показан другой общий поиск (по GDP).

Рис. 2.22. Пример разнообразных результатов


Это приводит нас к важной концепции ранжирования. Возможно, что строгий анализ релевантности и популярности ссылок на рис. 2.22 сам по себе и не дал бы попадания страницы Investopedia.com на первую страницу результатов, но потребность в разнообразии привела к повышению рейтинга этой страницы.

Строгая система ранжирования на основе релевантности и важности могла бы выдать множество дополнительных страниц с правительственных сайтов, обсуждающих GDP (валовый национальный продукт) Соединенных Штатов. Однако большинство пользователей, вероятно, будут вполне удовлетворены уже показанными правительственными страницами и показ дополнительного их количества, скорее всего, не поднимет уровень удовлетворения результатами поиска.

Внесение некоторого разнообразия позволяет компании Google дать удовлетворительный ответ тем пользователям, которые ищут нечто отличное от правительственных страниц. Проведенное компанией Google тестирование показало, что такой подход с разнообразием приводит к повышению уровня удовлетворения ее пользователей.

Например, данные по поискам без внесения разнообразия показали меньший процент кликов в страницах SERP, большее количество уточнений запросов, и даже более высокий процент выполненных затем похожих операций поиска.

Когда Google действительно серьезно подходит к устранению неоднозначности, он идет другим путем. Посмотрите страницы SERP на рис. 2.23.

Рис. 2.23. Устранение неоднозначности в поисковых запросах


Такие результаты с устранением неоднозначности появляются во многих поисках, когда Google думает, что пользователь ищет нечто такое, чего не выдает его запрос. Особенно часто они появляются для очень общих поисковых фраз.

Идея преднамеренного внесения разнообразия в алгоритм имеет смысл и может повысить удовлетворенность пользователей для таких запросов, как:

• названия компаний (когда пользователи хотят получить как положительные, так и отрицательные отзывы, помимо официальных сайтов компании);

• поиски по товарам (когда результаты предложений с сайтов электронной коммерции могут забить страницы SERP, а Google пытается дать обзоры и некоммерческий релевантный контент);

• поиски новостей и по политическим вопросам (когда разумно предоставить слово всем сторонам проблемы, а не только блогам лево– или праворадикальной ориентации, которые хорошо приманивают ссылки).

Когда новизна имеет значение

В основном поисковым движкам имеет смысл выдавать результаты из старых источников, которые прошли проверку временем. Однако в некоторых случаях результаты должны выдаваться из новых источников информации.

Например, когда есть срочная новость (такая, как землетрясение), то поисковые движки начинают получать запросы уже через секунды, а первые статьи появляются в Интернете уже через 15 минут.

В таких ситуациях необходимо найти и проиндексировать новую информацию почти в реальном масштабе времени. Google называет эту концепцию "запрос заслуживает свежих данных" (query deserves freshness, QDF). Согласно статье в New York Times (http://www.nytimes.com/2007/06/03/business/yourmoney/03google.html?pagewanted=3), QDF учитывает несколько факторов:

• объем поиска;

• освещение в новостях;

• освещение в блогах;

• данные панелей инструментов (возможно).

QDF применяется для самых последних новостей, но может использоваться и для других ситуаций (таких, как новые скидки или выпуски новых товаров), по которым появляется много запросов и которые широко освещаются в средствах массовой информации.

<p>Несколько причин, по которым эти алгоритмы иногда дают сбои</p>

Как мы уже описывали в данной главе, поисковые движки делают изумительные вещи. Тем не менее, иногда этот процесс работает не так хорошо, как вы ожидаете. Отчасти это происходит потому, что пользователи часто вводят такие поисковые фразы, которые дают очень мало информации об их намерениях (например, при поиске по слову car: хотят ли они купить машину, почитать обзоры, научиться водить машину, узнать, как спроектировать машину, либо что-то еще?). Другая причина состоит в том, что некоторые слова имеют множество значений, например, jaguar (это и животное, и машина, и гитара).

Дополнительную информацию о причинах сбоев алгоритмов поиска вы можете прочитать в статье господина Hamlet Batista на сайте SEOmoz:

http://www.seomoz.org/blog/7-reasons-why-search-engines-dont-return-relevant-results-100-of-the-time

Анализируем факторы ранжирования

Сайт SEOmoz выполнил опрос ведущих специалистов по оптимизации, чтобы определить, что по их мнению является самым важным фактором ранжирования (http://www.seomoz.org/article/search-ranking-factors).

Вот сводка девяти самых важных факторов:

• использование ключевых слов в теге title;

• якорный текст входящей ссылки;

• глобальный авторитет ссылок данного сайта;

• возраст сайта;

• популярность ссылки во внутренней структуре ссылок самого сайта;

• тематическая релевантность входящих ссылок;

• популярность ссылок на сайт внутри тематического сообщества;

• использование ключевых слов в тексте;

• глобальная популярность ссылок тех сайтов, которые ссылаются на сайт. Сделаем краткий обзор всех этих факторов.

• Использование ключевых слов в теге title.

Тег title был четко поставлен на первое место. Слова в теге title многое говорят (либо должны говорить) о теме страницы. Это полезный для индексирования поисковыми движками элемент. Одна из причин состоит в том, что это хорошо заметный элемент web-страницы и потому он, вероятно, будет использован как название для этой страницы.

Также широко признается, что поисковые движки придают самый большой вес тем словам, которые появляются в начале названия. По этой причине всегда полезно размещать самые важные ключевые слова в начале тега title, но старайтесь избегать "фаршировки ключевыми словами" (эту концепцию мы обсудим более подробно в главе 6).

• Якорный текст входящей ссылки.

Когда одна web-страница делает ссылку на другую, то использованный для этой ссылки якорный текст также применяется поисковыми движками как сильный сигнал. Web-мастера и издатели, которые делают ссылки на другие web-страницы со своего сайта, часто помещают в эти ссылки насыщенный ключевыми словами якорный текст. Это привлекло огромное внимание собирателей ссылок, которые стараются обеспечить на других web-сайтах насыщенные ключевыми словами текстовые ссылки на web-сайты своих клиентов.

• Глобальный авторитет ссылок данного сайта.

Этот показатель учитывает суммарный авторитет ссылок сайта (в отличие от авторитета ссылок конкретной страницы сайта). Как указано в опросе SEOmoz, он предназначен для регистрации количества и качества ссылок сайта. Есть три быстрых способа получения представления о нем:

– посмотрите на рейтинг PageRank для начальной страницы домена. Несмотря на то, что исходный алгоритм PageRank имеет ошибки, он все же может дать общее представление о глобальной популярности ссылок сайта (но не даст вам представления о релевантности этих ссылок). Однако обратите внимание, что начальная страница не всегда имеет самый высокий рейтинг PageRank по сайту;

– используйте поиск Site Explorer компании Yahoo! (https://siteexplorer.search.yahoo.com/). Он даст вам примерное число всех входящих ссылок домена и позволит загрузить до 1 000 результатов прямо в электронную таблицу;

– используйте рейтинг домена mozRank компании Linkscape (http://www.seomoz.org/linkscape).

• Возраст сайта.

Этот показатель часто удивляет новичков в мире оптимизации. Причина ценности такого сигнала в том, что сайт, существующий давно, несомненно, что-то делает правильно для того сообщества, которому он служит. Спамерские сайты и сайты плохого качества в конечном итоге столько не выдерживают. Кроме того, спама в 1998 г. было меньше, так что созданные в 1998 г. сайты с меньшей вероятностью являются спамерскими (по сравнению с более новыми сайтами).

• Популярность ссылки во внутренней структуре ссылок самого сайта.

Поисковые движки используют самого издателя, чтобы узнать, что он считает самой важной частью своего сайта. Например, если до какой-то страницы можно добраться с начальной страницы только после пяти щелчков мышью, то, вероятно, она не является очень важной.

С другой стороны, включенная в глобальную навигацию по сайту страница (на которую в результате этого ссылается каждая страница сайта) явно будет более важной страницей. Релевантность этих внутренних ссылок также является фактором (чем больше релевантность, тем лучше).

• Тематическая релевантность входящих ссылок.

Релевантность ссылающихся на целевую страницу (и целевое ключевое слово) сайтов и страниц также является важным фактором. Ссылки с другого сайта из посторонней темы тоже полезны, но высоко релевантные ссылки на сайт значат гораздо больше.

• Популярность ссылок на сайт внутри тематического сообщества.

Этот показатель создает авторитет вашего сайта. Если у вас есть много ссылок от членов тематического сообщества, то это очень серьезное выражение доверия вашему сайту.

• Использование ключевых слов в тексте.

Поисковые движки смотрят также и на текст страницы. Размещение релевантного ключевого слова в теге title – это хорошо, но оно дает эффект только в том случае, если содержимое страницы ему соответствует. Не ограничивайте содержимое точным целевым словом – поисковые движки ищут также и синонимы (чтобы увеличить релевантность страницы для темы поиска).

• Глобальная популярность ссылок тех сайтов, которые ссылаются на ваш сайт.

Еще один фактор ранжирования – важность ссылающегося сайта. Является ли этот сайт проверенным авторитетом в своей области? Если да, то это, вероятно, скажется в его рейтинге Global Link Popularity.

<p>Негативные факторы ранжирования</p>

Опрос SEOmoz выявил также пять самых главных негативных факторов. Рассмотрим их.

• Сервер часто недоступен для пауков.

Поисковые движки хотят, чтобы их пользователи получали хорошие впечатления. Если ваш сайт частенько не работает, то он по определению не может обеспечить пользователю хорошее впечатление. Поэтому если паук поискового движка не может получить доступ к вашим web-страницам, то движок будет считать, что он имеет дело с сайтом низкого качества.

• Контент очень похож на другие web-страницы или дублирует их.

Поисковые движки хотят предоставлять много уникального контента. Если ваш web-сайт не богат контентом или в основном дублирует контент других web-сайтов, то это будет расцениваться как отрицательный сигнал для рейтинга.

Более подробно обсудим дублированный контент в главе 6.

• Внешние ссылки на сайты низкого качества или спамерские сайты.

Еще один способ испортить рейтинг вашего сайта – это делать ссылки на сайты низкого качества или спамерские сайты. Вообще говоря, одна плохая исходящая ссылка может и не повредить, но если вы будете делать ссылки на большое количество сайтов плохого качества, то это, несомненно, может испортить ваши рейтинги.

Еще более осложняет этот аспект то, что вы можете сделать ссылку на вполне хороший домен, который затем поменяет владельца. Возможно, что следующий владелец этого домена вовсе не является тем, на кого бы вы хотели сослаться, но, к сожалению, ничего и не знаете о том, что того сайта, на который вы вначале ссылались, больше нет, а заменил его спамерский сайт.

• Участие в схемах обмена ссылками или активная продажа ссылок.

Поисковые движки также не хотят, чтобы издатели продавали ссылки со своих сайтов для передачи авторитета ссылок (или "сока ссылок”, как это называют многие работающие в данной области). Поисковые движки не хотят, чтобы издатели участвовали в теневых схемах обмена ссылками, таких как распространение счетчиков посещений со скрытыми в них ссылками.

• Дублирование названий или метатегов на многих страницах.

Поскольку тег title является очень мощным сигналом, то нежелание создавать другие теги title может быть негативным сигналом ранжирования. Соответственно, дублирование в массовом масштабе метатегов description и keywords может потенциально рассматриваться как негативный фактор ранжирования.

<p>Прочие факторы ранжирования</p>

Обсуждавшиеся нами до настоящего момента факторы ранжирования – это только основные факторы. Поисковые движки учитывают много других сигналов. Рассмотрим некоторые из них.

• Скорость сбора ссылок.

Если в течение некоторого времени ваш сайт приобретал в среднем по 5 ссылок в день, а затем ссылки внезапно стали приходить со скоростью 10 штук в день, то это может рассматриваться как позитивный фактор ранжирования.

С другой стороны, если скорость поступления новых ссылок падает до 2 в день, то это может быть сигналом о том, что ваш сайт стал менее релевантным. Кроме того, если ваш сайт внезапно начинает получать по 30 новых ссылок в день, то вы либо стали гораздо релевантнее, либо начали получать ссылки спамерским способом. Дьявол кроется здесь в деталях и один из самых важных вопросов – откуда приходят эти новые ссылки. Концепция учета временных факторов при анализе ссылок описана в принадлежащем компании Google патенте США, который можно найти по следующему адресу:

http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PG01&p=1&u=%2Fnetahtml%2FPTO%2Fsrchnum.html&r=1&f=G&l=50&s1=%2220050071741%22.PGNR.&OS=DN/20050071741&RS=DN/20050071741

Либо его можно найти поиском по номеру патента: 20050071741.

• Данные по использованию.

В качестве сигнала ранжирования можно интерпретировать и другие факторы. Например, если пользователь делает щелчок на странице SERP и приходит на ваш сайт, а затем нажимает кнопку Back и щелкает по другой ссылке в том же наборе результатов поиска, то это может рассматриваться как отрицательный сигнал для ранжирования. Или если чаще щелкают по тем ссылкам, которые находятся в SERP ниже вашей, то это может рассматриваться как позитивный сигнал ранжирования для них и как негативный сигнал для вас.

Используют ли поисковые движки такой сигнал и какой вес они ему придают, неизвестно. Этот сигнал ранжирования имеет много помех и вряд ли широко применяется. Использовать его можно в основном для персонализации и для обратной связи по релевантности.

• Пользовательские данные.

Персонализация – это передний край поиска, о котором говорят больше всего, она может делаться несколькими способами. Например, поисковый движок может сделать геолокационный поиск, чтобы примерно вычислить, где вы находитесь. На основе этих данных поисковый движок сможет показать адаптированные для вашего местоположения результаты. Это полезно, например, в том случае, когда вы ищете местный ресторан.

Другой способ получения поисковым движком данных о пользователе – это создание пользователем профиля для поискового движка и добровольное предоставление некоторой информации. Простой пример – предпочитаемый язык. Если пользователь указывает, что он предпочитает португальский, то поисковый движок может подстроить результаты под это предпочтение.

Поисковые движки могут также учитывать историю поисков данного пользователя. Движок регистрирует все выполненные вами запросы. По этим данным он сможет увидеть, что недавно вы интересовались автомобилями класса люкс и сможет использовать эту информацию для настройки результатов вашего поиска по слову jaguar.

• Песочница Google.

Как мы уже упоминали в этой главе, для борьбы со спамом поисковые движки используют несколько методов. Один из методов стал известен как "песочница Google" – это фильтр, которым Google ограничивает скорость роста рейтинга PageRank для новых доменов.

Такой подход полезен для фильтрации спамерских доменов, поскольку они часто быстро исчезают. Песочница может в принципе создать такую ситуацию, когда web-сайт будет отловлен улучшенными алгоритмами (или ручным способом) еще до того, как он станет высокопроизводительным. Это как минимум увеличит стоимость работы спамеров.

Использование продвинутых методов поиска

Одним из самых основных инструментов специалиста по оптимизации являются сами поисковые движки. Они предоставляют богатый набор команд, которые можно использовать для выполнения расширенного поиска, диагностики и конкурентного анализа. Вот некоторые из самых основных операторов:

• [-keyword]

исключает данное ключевое слово из результатов поиска (например, [loans – student] показывает результаты для всех типов loans, кроме student loans);

• [+keyword]

принудительно включает ключевое слово. Это особенно полезно для включения в запрос стоп-слов – таких ключевых слов, которые обычно выбрасываются из поискового запроса, поскольку они ничего не дают (например, определенный артикль the), или если ваше ключевое слово при помощи автоматического морфологического поиска преобразуется в множество ключевых слов (например, если вы хотите искать телевизионное шоу The Office, то несомненно захотите включить в запрос артикль the);


  • Страницы:
    1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11