Современная электронная библиотека ModernLib.Net

SEO – искусство раскрутки сайтов

ModernLib.Net / Интернет / Джесси Стрикчиола / SEO – искусство раскрутки сайтов - Чтение (Ознакомительный отрывок) (стр. 3)
Автор: Джесси Стрикчиола
Жанр: Интернет

 

 


Учтите, что страницы SERP все время меняются (т. к. движки тестируют новые форматы и компоновки), т. е. изображения на рис. 2.1 и 2.3 могут соответствовать действительности всего несколько недель или месяцев (до тех пор, пока Google, Yahoo! и Microsoft не перейдут на новые форматы).

<p>Как вертикальные результаты встраиваются в SERP</p>

Однако эти "стандартные" результаты, безусловно, не все, что могут предложить поисковые движки. Для многих типов запросов поисковые движки показывают "вертикальные результаты” ("быстрые ответы”, которые Google называет "все в одной коробке"). Они содержат не просто ссылки на другие сайты, которые должны помочь ответить на вопросы пользователя, а представляют собой множество дополнительных возможностей для практического специалиста по оптимизации.

На рис. 2.4 показан пример результатов такого типа. Запрос выдает карту с адресом и опцией получения маршрута проезда. Этот результат получен из поиска в Google Maps, он пытается дать пользователю ответ на его вопрос прямо в результатах поиска.

Рис. 2.4. Результат местного поиска бизнеса


На рис. 2.5 показан другой пример. На этом рисунке поиск в Google по слову weather (в сочетании с названием города) возвращает прямой ответ, т. е. пользователю даже не нужно щелкать по ссылке на web-сайт (если все, что он хотел узнать – это температура).

Рис. 2.5. Поиск погоды в Google


На рис. 2.6 показан пример поиска широко известного художника. Поиск в Google знаменитого художника Edward Hopper возвращает изображения некоторых самых известных его работ. Этот пример несколько отличается от показанных на рис. 2.4 и 2.5 результатов типа "быстрый ответ". Если пользователя заинтересовала первая показанная картина, то он может щелкнуть по ней, чтобы увидеть ее в более крупном размере или получить о ней дополнительную информацию. Для практика по оптимизации попасть в такую "коробку" результатов – это существенное достижение.

Рис. 2.6. Поиск в Google по имени художника


На рис. 2.7 показан пример из Yahoo!. Запрос в Yahoo! по chicago restaurants дает список популярных заведений с местного портала Yahoo!. Высокое место (в этих результатах) заняли пиццерии под названием Giordanos Pizzeria, что наверняка очень хорошо для этого заведения.

Рис. 2.7. Поиск в Yahoo! ресторанов в Чикаго


На рис. 2.8 показан пример "быстрого ответа" из Yahoo!. Поиск в Yahoo! по how many pounds in a ton (сколько фунтов содержится в тонне) дает быстрый ответ: 1 Ton = 2000 Pounds (2000 фунтов). Движок Bing компании Microsoft также дает вертикальные результаты и быстрые ответы.

Рис. 2.8. Результат "быстрый ответ" из Yahoo!


На рис. 2.9 показан пример поиска знаменитости (charlie chaplin).

Рис. 2.9. Результаты поиска в Bing актера Чарли Чаплина


Результаты поиска включают серию изображений знаменитого актера Чарли Чаплина.

В следующем примере (рис. 2.10) показаны результаты поиска в Bing видеофильмов с участием Megan Fox. На самом верху результатов поиска вы получаете целый набор популярных видеофильмов. Щелкните по видеофильму и видео начнет воспроизводиться прямо в результатах поиска.

Рис. 2.10. Результаты поиска в Bing видеофильмов с участием Megan Fox


Как видно, большое разнообразие вертикальной интеграции в результаты поиска означает, что для многих популярных запросов стандартный набор в 10 ссылок на внешние страницы уже не является правилом. Движки соревнуются, предоставляя более релевантные результаты и более точные ответы на запросы, на которые (по их мнению) лучше отвечают вертикальные результаты (а не web-результаты).

Из этого следует, что владельцы сайтов и web-маркетологи должны учитывать то влияние, которое подобное встраивание результатов вертикального поиска может оказать на их рейтинги и трафик. Для многих из поисков (показанных на предыдущих рисунках) высокий рейтинг (даже первая или вторая позиции естественных результатов) может и не дать много трафика, поскольку над ними представлены вертикальные результаты.

Вертикальные результаты также означают определенные возможности, поскольку имеются местные движки поиска (от изображений до новостей и товаров). В главе 8 мы расскажем, как их включить в эти результаты.

Системы ранжирования на основе алгоритмов: просмотр, индексирование и ранжирование

Практикам по оптимизации полезно знать, как работают просмотр, индексирование и ранжирование, поскольку это помогает им определить, какие действия необходимо предпринять для достижения своих целей. В этом разделе в основном описываются способы работы Google, Yahoo! и Microsoft, но, возможно, он неприменим для других популярных поисковых движков, таких как Baidu (Китай) и Naver (Корея).

Поисковые движки имеют несколько основных целей и функций. В их число входят следующие:

• просмотр и индексирование миллиардов документов (страниц и файлов), доступных в Интернете;

• ответы на запросы пользователей (с выдачей списков релевантных страниц).

Мы рассмотрим основы этих функций с нетехнической точки зрения.

<p>Просмотр и индексирование</p>

Представьте себе, что Интернет – это сеть станций в подземке большого города. Каждая станция – уникальный документ (обычно web-страница, но иногда это файл формата PDF, JPEG или другого формата). Поисковому движку нужен способ "проползти" по всему городу и найти по дороге все станции, поэтому он использует самый лучший из имеющихся маршрутов: ссылки между web-страницами (рис. 2.11).

Рис. 2.11. Лондонская подземка здесь используется как аналогия для обследования пауком


На нашем рисунке такие станции, как Embankment, Picadilly Circus и Moorgate, являются страницами, а соединяющие их линии представляют ссылки с этих страниц на другие страницы Интернета. Как только Google (нарисован внизу) доберется до Embankment, он увидит ссылки на Charing Cross, Westminster и Temple и сможет получить доступ к любой из этих страниц.

Структура ссылок сети Интернета связывает между собой все страницы, которые были сделаны публичными в результате установления ссылок на них. При помощи ссылок автоматизированные роботы поисковых движков, называемые "пауками" (именно поэтому они изображены в таком виде), могут добраться до многих миллиардов взаимосвязанных документов.

Когда поисковые движки находят эти страницы, их следующая задача состоит в том, чтобы сделать анализ кода этих страниц и сохранить элементы этих страниц в огромных массивах жестких дисков (чтобы при необходимости их можно было извлечь для ответа на запрос). Чтобы справиться с этой монументальной задачей по хранению миллиардов страниц (к которым можно получить доступ в доли секунды), поисковые движки создают огромные центры обработки данных.

Одна из ключевых концепций создания поискового движка – это решить, откуда начать поиск по сети. Несмотря на то, что теоретически начать можно из многих мест, в идеале следует начинать с доверенного набора web-сайтов. Фактором оценки доверия к вашему сайту можно считать расстояние (в количестве кликов) между вашим сайтом и наиболее доверенными сайтами. Мы более подробно обсудим роль доверия в алгоритмах поиска в разд. "Как ссылки влияют на рейтинги поисковых движков” главы 7.

<p>Извлечение и рейтинги</p>

В большинстве случаев поиск ответов начинается так, как показано на рис. 2.12.

Рис. 2.12. Начало поиска пользователя


Следующий шаг этого поиска начинается тогда, когда поисковый движок возвращает список релевантных страниц Интернета (в том порядке, который должен с наибольшей вероятностью удовлетворить пользователя). Этот процесс требует от поискового движка "перелопачивания" имеющихся у него миллиардов документов и выполнения двух задач:

• возвращения только тех результатов, которые относятся к запросу пользователя;

• ранжирования результатов по их важности (с учетом доверия и авторитета данного сайта). Именно на релевантность и важность должен влиять процесс поисковой оптимизации.

Релевантность – это степень, в которой содержимое возвращенного в результате поиска документа совпадает с намерением и терминами запроса пользователя. Релевантность документа увеличивается, если термины или фраза запроса пользователя встречаются в нем несколько раз и содержатся в заголовке страницы или в заголовках документа (или если ссылки на эту страницу ведут с релевантных страниц и используют релевантный якорный текст).

Релевантность можно считать первым шагом к "участию в игре". Если вы не релевантны запросу, то движок поиска не рассматривает вас на предмет включения в результаты поиска по данному запросу. Более подробно мы обсудим определение релевантности в разд. "Определение намерения пользователя и выдача релевантного и свежего контента” данной главы.

Важность (или популярность) – это относительная важность, измеряемая по цитированию (когда одна работа ссылается на другую, как это часто бывает в научных и деловых документах) данного документа (соответствующего запросу пользователя). Популярность данного документа увеличивается с каждым новым ссылающимся на него документом. В научном мире эта концепция известна под названием "анализ цитирования".

Представьте себе, что важность – это способ определения той конкретной страницы (из группы одинаково релевантных страниц), которая будет показана первой (второй, третьей и т. д.) в результатах поиска. Важными составляющими этого процесса являются относительный авторитет сайта и то доверие, которое движок поиска имеет к нему. Конечно, процесс оценки несколько сложнее и не все страницы одинаково релевантны. В конечном итоге, порядок ранжирования определяется комбинацией релевантности и важности.

Итак, когда вы видите страницу результатов поиска (рис. 2.13), то можете предположить, что поисковый движок (в данном случае это Yahoo!) считает, что страница Superhero Stamps на USPS.com имеет самый высокий комбинированный показатель по релевантности и популярности для запроса marvel superhero stamps, в то время как страница Yahoo! Shopping имеет более низкий комбинированный показатель по релевантности и популярности.

Рис. 2.13. Пример результатов поиска по marvel superhero stamps


Популярность и релевантность определяются не вручную (для этого потребовалось бы привлечь все население Земли). Движки создают математические уравнения (алгоритмы), которые "отделяют зерна от плевел", а затем ранжируют зерна по качеству. Эти алгоритмы состоят из сотен компонентов. В области поискового маркетинга они часто называются факторами ранжирования или алгоритмическими критериями ранжирования.

Мы более подробно обсудим факторы (Google предпочитает термин "сигналы") ранжирования в разд. "Анализируем факторы ранжирования” данной главы.

<p>Оценка контента на web-странице</p>

Поисковые движки уделяют большое внимание содержимому каждой web-страницы, которую они находят, поскольку именно это содержимое определяет, о чем данная страница.

Представьте себе, что поисковый движок выполняет подробный анализ всех слов и фраз, которые имеются на web-странице, а затем строит карту этих данных, чтобы принять решение относительно показа вашей страницы в результатах запроса пользователя. Эта карта (которую часто называют семантической картой) стремится определить связи между концепциями, чтобы поисковый движок мог лучше понимать, как сопоставлять запросам пользователей нужные web-страницы.

Если нет семантического совпадения содержимого web-страницы и запроса, то страница имеет гораздо меньшую вероятность показа. Поэтому размещенные вами на данной странице слова и "тема" этой страницы играют при ранжировании огромную роль.

На рис. 2.14 показано, как поисковый движок разбивает страницу, когда рассматривает ее (страница взята с сайта Stone Temple Consulting).

Рис. 2.14. Разбивка web-страницы


Навигационные элементы страницы на многих страницах сайта выглядят одинаково. Эти навигационные элементы не игнорируются и играют важную роль, но они не помогают поисковому движку определить, какой уникальный контент имеется на странице. Для этого поисковый движок сосредоточивается на той части рисунка, которая помечена как Real content (реальный контент).

Определение уникального контента страницы – это важная часть того, что делает поисковый движок. Именно это понимание уникального контента страницы используется поисковым движком для определения тех типов поисковых запросов, для которых данная web-страница может быть релевантной. Поскольку навигация обычно не является уникальной для конкретной страницы, то она никак не помогает поисковому движку в решении этой задачи.

Но это вовсе не значит, что навигационные ссылки не важны. Однако навигационные ссылки не учитываются при определении уникального контента web-страницы, т. к. эти ссылки используются на многих web-страницах.

Поисковый движок должен также решить задачу определения ценности контента. Несмотря на то, что частью этого процесса является определение реакции сообщества на данный контент (при помощи анализа ссылок), некоторые выводы поисковые движки могут сделать и из того, что они видят на странице.

Например, есть ли точно такой же контент на другом web-сайте? Каков размер уникального контента, который видит поисковый движок: два предложения или больше 500 слов? Не повторяются ли в этом контенте слишком часто одни и те же ключевые слова?

Это несколько примеров того, на что может смотреть поисковый движок при определении ценности контента.

<p>Какой контент поисковые движки могут видеть на web-странице</p>

Программы индексирования и пауки поисковых движков – это исключительно мощные программы. Они просматривают сотни миллиардов web-страниц, анализируют контент всех страниц, а также способ связи этих страниц друг с другом. Затем они организуют всю полученную информацию в базы данных, которые в ответ на запрос пользователя могут выдать (в течение нескольких десятых секунды) высоко организованный набор результатов.

Это потрясающее достижение, но оно имеет свои ограничения. Программное обеспечение очень механистично, оно может понять только часть страницы (для большинства web-страниц). Паук поискового движка анализирует HTML-код web-страницы. Если вы хотите понять, как это делается, то сможете увидеть, воспользовавшись вашим браузером для просмотра исходного кода.

Два моментальных снимка экрана на рис. 2.15 показывают, как сделать это в браузере FireFox (левый рисунок) и в браузере Internet Explorer (правый рисунок).

Рис. 2.15. Просмотр исходного кода в вашем браузере


При просмотре исходного кода вы видите точный код web-сайта, который web-сервер отправил в ваш браузер. Именно это и видит паук поискового движка (поисковый движок видит также и HTTP-заголовки данной страницы). Паук игнорирует многое из того, что содержится в коде. Например, поисковые движки в основном игнорируют такой код, который показан на рис. 2.16 (поскольку он не имеет отношения к содержимому web-страницы).

Рис. 2.16. Пример исходного кода web-страницы


Паук поискового движка больше всего интересуется той информацией, которая содержится в HTML-тексте страницы. На рис. 2.17 показан пример HTML-текста для web-страницы (использована начальная страница сайта SEOmoz.org).

Рис. 2.17. Пример HTML-текста в исходном коде


Несмотря на то, что на рисунке есть HTML-коды, мы можем ясно видеть в этом коде обычный текст. Это именно тот уникальный контент, который ищет паук.

Кроме того, поисковые движки читают и некоторые другие элементы. Один из этих элементов – заголовок страницы (один из самых главных факторов при ранжировании данной web-страницы). Это текст, который демонстрируется в строке заголовков браузера (синяя полоса над меню браузера).

На рис. 2.18 показан тот код, который видит паук. В качестве примера использован сайт Trip Advisor (http://www.tripadvisor.com).

Рис. 2.18. Метатеги в исходном HTML-коде


Первый красный эллипс на рисунке обозначает тег заголовка страницы. Этот тег часто (но не всегда) используется как заголовок вашей позиции в результатах поискового движка. Исключением из этого правила являются данные вашего сайта, полученные из каталогов Yahoo! или DMOZ. Иногда поисковые движки могут видеть в качестве заголовка вашей страницы то, что было использовано в ваших данных в этих каталогах (а не тег заголовка страницы). Есть также и метатеги, которые позволяют вам блокировать это (такие, как тег noodp (который говорит поисковому движку, что не следует использовать заголовки DMOZ) и тег noydir (который говорит движку Yahoo! что не следует использовать листинг каталогов Yahoo!)).

В любом случае, на рис. 2.19 показано то, что происходит, когда вы ищете stone temple consulting (начальная страница Stone Temple Consulting находится по адресу http://www.stonetemple.com). Обратите внимание, что заголовок результатов поиска совпадает с заголовком начальной страницы Stone Temple Consulting.

Рис. 2.19. Результаты поиска, показывающие тег заголовка страницы


В дополнение к заголовкам страниц, поисковые движки читают также и метатег keywords. Это список ключевых слов, которые вы хотите ассоциировать со страницей. Спамеры (люди, которые пытаются манипулировать результатами поисковых движков в нарушение их указаний) много лет назад разрушили ценность этого тега для оптимизации (и поэтому его ценность нынче минимальна). Google вовсе не использует этот тег для ранжирования, но Yahoo! и Bing вроде бы уделяют ему внимание (вы можете прочитать об этом более подробно по адресу http://searchengineland.com/meta-keywords-tag-101-how-to-legally-hide-words-on-your-pages-for-search-engines-12099). Тратить много времени на метатег keywords не рекомендуется (поскольку в плане оптимизации это вам ничего не даст).

Второй красный эллипс на рис. 2.18 обозначает пример метатега keywords.

Поисковые движки читают также и метатег description (третий красный эллипс на рис. 2.18). Однако метатег description не оказывает никакого влияния на рейтинги поисковых движков (http://searchengineland.com/21-essential-seo-tips-techniques-11580).

Тем не менее метатег description играет ключевую роль, поскольку поисковые движки часто используют его как описание вашей страницы в результатах поиска. Поэтому хорошо написанный метатег description может иметь существенное влияние на количество кликов по вашему элементу в результатах поиска. Потраченное на этот тег время даст ценные результаты. На рис. 2.20 показан поиск по trip advisor, который является примером использования метатега description в качестве описания в результатах поиска.

Рис. 2.20. Метатег description в результатах поиска


Примечание

Ключевые слова пользователя обычно показаны в результатах поиска жирным шрифтом. Иногда жирным шрифтом показываются и близкие синонимы. На рис. 2.20 есть такой пример: TripAdvisor в начале описания выделен жирным шрифтом.

Четвертый элемент, который читают поисковые движки, – это атрибут alt для изображений. Этот атрибут первоначально использовался для отображения хоть чего-нибудь в том случае, когда просмотр изображения был невозможен. Это было предназначено для двух групп пользователей:

• плохо видящих людей, не имеющих возможности просматривать изображения;

• тех людей, которые отключают изображения для ускорения просмотра страниц (но это актуально только для тех, у кого нет высокоскоростного подключения к Интернету).

Поддержка плохо видящих людей остается основной причиной использования атрибута alt. Вы можете прочитать об этом на странице Web Accessibility Initiative по адресу: http://www.w3.org/WAI/.

Поисковые движки также читают и текст, содержащийся в атрибуте alt тега image. Этот тег используется для того, чтобы дать указание web-странице показать изображение. Вот пример тега изображения с сайта Alchemist Media:

http://www.alchemistmedia.com/img/btob2009.jpg

" alt="BtoB Interactive Marketing Guide" border="0" />

Часть "src=" – это местонахождение того изображения, которое нужно показать. Та часть, которая начинается с alt и за которой следует BtoB Interactive Marketing Guide, считается атрибутом alt.

Атрибут alt – это то, что читает поисковый движок. Движок интерпретирует его, чтобы определить, о чем это изображение, и чтобы лучше понять, о чем эта страница.

Последний элемент, который читают поисковые движки – это тег noscript. В общем случае поисковые движки не пытаются интерпретировать код JavaScript, который может присутствовать на web-странице (хотя это уже начинает меняться). Однако некоторые пользователи не разрешают выполнять код JavaScript при загрузке страниц (по данным авторов, таких пользователей примерно 2 %). Для этих пользователей в том месте, где на web-странице имеется JavaScript, не будет показано вообще ничего (если страница не содержит тега noscript).

Вот очень простой пример JavaScript, который это демонстрирует:

document.write("It is a Small World After All!")

Тег noscript содержит текст "Your browser does not support JavaScript!". Поисковый движок прочитает этот текст и расценит его как информацию о web-странице. В этом примере вы могли также вставить в тег noscript текст типа "it is a Small World After All!" (Мир тесен в конце концов!).

Тег noscript следует использовать только для того, чтобы обозначить содержимое JavaScript. (Размещение здесь другого контента или ссылок может быть интерпретировано поисковым движком как спам.) Кроме того, это предупреждение браузера может превратиться в поисковый фрагмент (а это уже будет плохо).

Чего не могут видеть поисковые движки

Целесообразно также сделать обзор тех типов контента, которые поисковые движки не могут видеть.

Например, несмотря на то, что поисковые движки могут обнаружить, что вы показываете изображение, но они не могут определить, изображение чего именно вы показываете (если не учитывать ту информацию, которую вы им даете в атрибуте alt). Однако они способны определить цвет пиксела и (во многих случаях) установить порнографический характер изображения по количеству телесного цвета в изображении JPEG. Поэтому поисковый движок не может сказать, что показано на изображении – Барт Симпсон, лодка, дом или торнадо. Кроме того, поисковые движки не распознают содержащийся в изображении текст. Поисковые движки экспериментируют с технологиями оптического распознавания символов (optical character recognition, OCR), чтобы извлекать текст из изображений, но эти технологии еще не имеют широкого применения при поиске.

Кроме того, обычный здравый смысл оптимизации всегда подсказывал, что поисковые движки не умеют читать Flash-файлы, но это несколько преувеличено. Поисковые движки уже начинают извлекать информацию из Flash-файлов, как это показано в объявлении компании Google по адресу http://googlewebmastercentral.blogspot.com/2008/06/improved-flash-indexing.html. Однако поисковому движку нелегко определить, что именно содержится во Flash. Одна из самых больших проблем состоит в том, что когда поисковые движки смотрят внутрь Flash, то они по-прежнему ищут текстовый контент, но Flash – это изобразительное средство и у дизайнера нет никаких причин (кроме поисковых движков), чтобы встраивать внутрь него текст. Здесь нет также никаких семантических подсказок, которые присутствуют в HTML-тексте (таких, как теги заголовков страниц, жирный текст и т. д.) даже тогда, когда HTML используется совместно с Flash.

Третий тип контента, который поисковые движки видеть не могут, – это изобразительные элементы всего того, что содержится во Flash, поэтому этот аспект Flash ведет себя точно так же, как изображения. Например, когда текст преобразуется в векторную форму (визуализируется графически), то текстовая информация (которую могут читать поисковые движки) теряется. Мы обсудим методы оптимизации Flash в главе 6.

Аудио– и видеофайлы поисковым движкам тоже читать непросто. Как и в случае изображений, эти данные анализировать нелегко. Есть несколько исключений, когда поисковые движки могут извлечь некоторое ограниченное количество данных (таких, как теги ID3 из файлов МР3 или текстовые примечания, изображения и маркеры глав из расширенных подкастов формата ААС). Однако в конечном итоге отличить видеоизображение игры в футбол от лесного пожара невозможно.

Поисковые движки не могут также прочитать никакого контента внутри программы. Поисковому движку нужно найти в исходном коде web-страницы текст, который удобочитаем для человеческого глаза (как мы уже говорили ранее). То, что вы можете видеть его после загрузки страницы в браузер, не помогает – он должен быть видим и читаться в исходном коде этой страницы.

Пример технологии, которая предоставляет значительное количество читаемого человеком (но не видимого поисковыми движками) контента, – это AJAX. AJAX (основанный на JavaScript метод динамического отображения контента на web-странице после извлечения данных из базы данных (без необходимости обновления всей страницы целиком)). Этот метод часто используется в инструментальных средствах, когда посетитель сайта может сделать ввод данных, а инструмент AJAX затем извлекает и отображает правильный контент.

Проблема возникает потому, что контент извлекается скриптом, работающем на клиентском компьютере (машине пользователя), после ввода информации пользователем. Это может привести к получению множества вариантов вывода. Кроме того, до этого ввода данных контент в коде HTML данной страницы отсутствует, так что поисковый движок его видеть не может.

Аналогичные проблемы возникают и с другими формами JavaScript, которые до выполнения действия пользователем не визуализируют контент в HTML.

В пятой версии HTML была создана конструкция, известная как тег embed, чтобы дать возможность встраивать в HTML-страницы дополнительные модули (программы, находящиеся на компьютере пользователя, а не на web-сервере вашего web-сайта). Этот тег часто используется для встраивания видео– и аудиофайлов в web-страницы. Тег embed говорит дополнительному модулю, где он должен искать используемый файл с данными. Встраиваемый при помощи дополнительных модулей контент совершенно невидим для поисковых движков.

Фреймы и плавающие рамки – это метод встраивания содержимого другой web-страницы в вашу web-страницу. Плавающие рамки используются чаще (чем обычные фреймы) для встраивания контента с другого web-сайта. Вы можете очень просто сделать плавающую рамку при помощи примерно такого кода:

" width="100 %" height="300">

Your browser does not support iframes.

Фреймы обычно используются для подразделения контента web-сайта, но их можно использовать и для встраивания контента с других web-сайтов, как это представлено на рис. 2.21 с сайтом http://accounting.careerbuilder.com на web-сайте Chicago Tribune.

Рис. 2.21. Визуализированная в браузере страница с фреймами


Это пример хорошей работы по втягиванию контента (при условии, что у вас есть разрешение на это) с другого сайта и размещению его на вашем сайте. Однако поисковые движки распознают фрейм для втягивания контента другого сайта и соответственно игнорируют контент внутри фрейма (поскольку это контент другого издателя). Иначе говоря, они не считают втянутый с другого сайта контент частью уникального контента вашей web-страницы.

Определение намерений пользователя и выдача релевантного и свежего контента

Современные коммерческие поисковые движки основаны на науке информационного поиска. Эта наука существует с середины двадцатого столетия, когда системы информационного поиска работали на компьютерах в библиотеках, исследовательских центрах и правительственных лабораториях. В начале разработки поисковых систем исследователи обнаружили, что основную часть функционала поиска составляют два самых важных компонента: релевантность и важность (которым мы уже дали определения в этой же главе). Для измерения этих факторов поисковые движки выполняют анализ документов (в том числе семантический анализ концепций документа) и анализ ссылок (цитирования).

<p>Анализ документа и семантическая связность</p>

При анализе документа поисковый движок ищет поисковые термины в важных областях документа (заголовке страницы, метаданных, тегах заголовков и в теле текста). Он также пытается автоматически измерить качество документа (при помощи анализа документа и множества прочих факторов).


  • Страницы:
    1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11