< >
Зарегистрируйтесь за 30 секунд

Руководство по оценке качества поиска (часть 3)

Рекомендации по интернет-спаму

1.1 Что такое интернет-спам?

Интернет-спам – это термин для сайтов, которые созданы вебмастерами с целью обмануть поисковые системы и привести пользователей на свой сайт. В этих рекомендациях мы иногда упоминаем интернет-спам как «спам», а вебмастеров, которые используют методы обмана – спамерами.

На следующих страницах вы узнаете как определять некоторые из таких обманных методов. Когда вы видите, что их используют, вы присваиваете метку Спам. Обратите внимание, что надоедающие, низкокачественные страницы, как например страницы с множеством всплывающих окон и рекламы, не обязательно спам.

1.2 Связь между оценками и спамом

В рекомендациях по оцениванию, в части 1 Общих рекомендаций вы узнали, что целевые страницы оцениваются в соответствии с их полезностью для пользователя для определенного запроса. Вы не сможете присвоить странице оценку, не зная запроса.

Спам-метка не зависит от связи между запросом и целевой страницей. Странице нужно присваивать метку Спам, если она создана с использованием обманных методов - не важно, какой запрос или как полезна может оказаться страница.

Некоторые спам-страницы имеют очень низкое качество и очень мало полезного для пользователей контента или вообще не имеют такового. Таким страницам обычно присваивается низкая оценка, Релевантная - или Не по теме, в добавок к метке Спам.

Другие спам-страницы, качество которых не так плохо и на которых есть определенный полезный контент, могут быть оценены как Релевантная - или Релевантная +.

В некоторых особых случаях, страница может получить оценку Витальная, и также получить метку Спам. К примеру, если имеет место скрытая переадресация и целевая страница - это цель запроса, страница получит оценку Витальная и метку Спам. Вы изучите "скрытые переадресации" в Разделе 2.3 Рекомендаций по спаму.

1.3 Почему Спамеры Создают Спам-Страницы?

Обычно спамеры создают спам-страницы, чтобы заработать денег. Иногда они зарабатывают деньги напрямую, размещая прибыльные ссылки на спам-странице.

Есть два основных типа прибыльных ссылок:

•Pay-Per-Click (Оплата-За-Клик) (PPC) реклама

Аффилиаты (представлены в разделе 4.1 Рекомендаций по спаму)

При размещении PPC рекламы на интернет странице, каждый раз, когда на рекламу кликают, владелец сайта получает прибыль. Другое название  PPC рекламы это “спонсированные ссылки”. PPC реклама размещена на многих, многих страницах. Некоторые страницы с PPC рекламой - спам, но многие также и не являются спамом. Страницам не следует присваивать метку Спам если они созданы для предоставления существенной информации или для помощи пользователям. Страницы являются спамом, если они существуют главным образом для заработка денег и не помогают пользователям.

Иногда спам-страницы не имеют прибыльных ссылок. Такие страницы созданы, чтобы изменить ранжирование поисковой системы или даже чтобы навредить  компьютерам пользователей скрытыми загрузками. Они являются спамом, потому что используют обманные методы, даже если вы не видите, как именно они зарабатывают деньги.

1.4 Когда выполнять проверку на спам

Существуют страницы, как например главные страницы известных официальных сайтов (к примеру, http://www.apple.com), которые вы можете не проверять на спам. Однако, даже вебмастеры для сайтов с высокой репутацией время от времени используют методы обмана. Поэтому, мы просим вас использовать следующие быстрые и несложные техники по обнаружению спама на всех страницах, которые вы оцениваете.

Нажмите “Ctrl-A” (или "⌘" и "A" на компьютерах Apple) на целевой странице, чтобы увидеть скрытый текст. Вы узнаете об использовании “Ctrl-A” в разделе 2.1.1 Рекомендаций по спаму.

Опустите страницу вниз и с правой стороны поищите скрытый текст на областях вне нормальной области просмотра. Вы узнаете больше о скрытом тексте вне нормальной области просмотра в разделе 2.1.5 Рекомендаций по спаму.

2.1 Поиск технических сигналов

При оценивании страницы на спам, начните с просмотра следующих "технических сигналов":

Скрытый текст и скрытые ссылки

Наполнение ключевыми словами

Скрытые  переадресации

Маскировка переадресаций под JavaScript и 100% фреймы.

Данный раздел описывает эти технические сигналы и обеспечивает вас советами и инструментами для их идентификации.

2.2 Скрытый Текст и Скрытые Ссылки

Вебмастеры добавляют скрытый текст и/или скрытые ссылки, чтобы привлечь поисковые системы и пользователей на свои страницы. Скрытый текст видно поисковой системе, но не пользователям, которые могут счесть его отвлекающим и надоедающим. Вот некоторые вещи, которые вам следует знать о скрытом тексте:

Он может быть полностью невидим для человеческого глаза

Он может быть того же цвета, что и цвет фона на странице, или цвета, который похож на цвет фона, что делает его почти незаметным и невидимым.

Он может быть отформатирован очень, очень мелким шрифтом (к примеру, 1-ничным) так что его нельзя заметить.

Он может быть размещен вне нормальной области просмотра.  К примеру, может быть большое черное пространство между нормальной областью просмотра и "скрытой" областью текста полностью в нижней части страницы или ближе к правому краю.

Иногда скрытого текста может быть всего строчка или две, но иногда - целая страница.

Большинство скрытого текста находится на сайтах, чтобы обмануть поисковые системы, но иногда вы будете встречать скрытый текст, не являющийся спамом.

К примеру, если вебмастер прячет только дату обновлений, это не спам. Скрытый текст можно обнаружить следующим образом:

Нажатием Ctrl-A (или "⌘" и "A" на компьютерах Apple).

Отключением CSS.

Отключением  JavaScript.

Просмотром кода страницы

Просмотром областей вне нормальной области просмотра страницы.

2.1.1 Нажатие Ctrl-A на Целевой Странице

После нажатия на URL, нажмите одновременно клавиши “Ctrl” и “A” (комбинация клавиш для “Выбрать Все” для пользователей ПК), или "⌘" и "A" или "Command" и "A" (комбинации клавиш для пользователей компьютеров Apple) и опуститесь в самый низ страницы. Этот метод иногда позволяет открыть спрятанный внизу страницы текст.

Крошечный текст не всегда можно обнаружить при помощи Ctrl-A. Вам следует пристально всматриваться в горизонтальные линии или панели на странице, потому что иногда они содержат скрытый текст. Простой метод для обнаружения этого типа скрытого текста состоит в том, чтобы скопировать подозрительную линию или панель, вставить в свой текстовый редактор и увеличить размер шрифта. Также, вы можете пробовать использовать методы, описанные ниже.

2.1.2 Отключение CSS

Отключение CSS иногда показывает скрытый текст. Вам не нужно проверять каждую страницу на скрытый текст в CSS, но пожалуйста, делайте так, если у вас появились подозрения относительно страницы.

2.1.3 Отключение JavaScript

Иногда для сокрытия текста спамеры используют JavaScript.

Важно: Когда вы закончили с поиском спама на определенной странице, пожалуйста, не забудьте вернуться и включить JavaScript. Если вы этого не сделаете, нектотрые составные сайта, который вы проверяете, не будут доступны.

2.1.4 Просмотр кода страницы

Просмотр кода страницы иногда показывает скрытый текст. Ищите большие области ключевых слов в коде. Наполнение ключевыми словами обсуждается в Разделе 2.2 Рекомендаций по Спаму.

Обратите внимание, что метка Спам не должна присваиваться, когда вы видите ключевые слова только в мета тегах. Мета теги легко идентифицировать, потому что они начинаются со слов "мета название". 

2.1.5 Просмотр областей вне нормальной области просмотра страницы.

С подозрением относитесь к большим пустым областям внизу и в крайнем правом углу страницы. Используйте вертикальную и горизонтальную прокрутку, чтобы увидеть, появляется ли там текст на областях страницы вне основной области просмотра.

2.2 Перенасыщение Ключевыми словами

Перенасыщение ключевыми словами: Вебмастеры иногда загружают страницы чрезмерным количеством ключевых слов. Вот описания того, что вы можете встретить:

Ключевые слова много раз повторяются на странице.

Слова, связанные с ключевиками, повторяются на странице множество раз.

Множественные варианты неправильного написания слова на странице.

Страницы с большим количеством того, что выглядит как несуразица или различные ключевые слова.

Страницы с, кажущимся программно или автоматически сгенерированным текстом, который не имеет смысла.

Вебмастеры также иногда загружают страницы нерелевантными ключевыми словами на темы, не связанные с запросом, как то ипотека, мобильные телефоны, рингтоны, ставки, погода и т.д. Вне зависимости от того, связаны или не связаны ключевые слова с запросом, намерение одно - обмануть поисковые системы и пользователей на странице.

Иногда сложно решить, когда ключевые слова на странице следует рассматривать как перенасыщение ключевыми словами. Мы просим вас присваивать метку Спам, если вы считаете, что количество ключевых слов на странице чрезмерно и будет надоедать и отвлекать реального пользователя.

Если вы не считаете, что количество ключевиков на странице будет мешать пользователю, пожалуйста, не присваивайте метку Спам.

Обратите внимание: Скрытый текст и перенасыщение ключевыми словами часто совмещены. Скрытый текст часто содержит перенасыщение ключевиками.

Распознавание перенасыщения ключевыми словами

Некоторые перенасыщения ключевыми словами видны человеческому глазу и вам не придется использовать никакие специальные техники, чтобы их увидеть. В других случаях, они скрыты. Вы обнаружите скрытые перенасыщения ключевиками, используя методы из раздела 2.1 Рекомендаций по спаму.

Важно: скрытое перенасыщение ключевыми словами всегда считается спамом (если это не одни только мета теги).

2.2.1 Перенасыщение ключевыми словами в URL

URL также может содержать перенасыщение ключевыми словами. Такие URL создаются при помощи компьютера основываясь на словах запроса и часто форматируются с большим количеством дефисов. Это яркий сигнал о спаме.

Вот примеры перенасыщения ключевиками в URL.  Мы удалили гиперлинки из этих примеров, потому что

некоторые из них перестали работать а другие стали вредоносными.  Вам не нужно переходить на целевую страницу, чтобы увидеть наличие перенасыщения ключевыми словами в URL и чтобы понять, что они - спам.

2.3 Скрытые Переадресации

Скрытые Переадресации: Мы говорим скрытая переадресация, когда страница переадресовывает пользователя с URL на одном домене к другому URL на другом домене, с намерением спама. Поисковые системы "видят" первую страницу, пока пользователя перенаправляют на другую страницу, и виден другой  контент. Вот некоторые другие моменты, которые вам следует знать о скрытых переадресациях:

Во время переадресации вы можете заметить что страница переадресовывает через несколько URL прежде, чем закончить на целевой странице.

Скрытые переадресации могут перевести пользователя через несколько сменных доменов; нажимая на тот же URL несколько раз вы каждый раз можете переходить на разные целевые страницы

Некоторые скрытые переадресации переводят пользователей на известные торговые сайты, как то Amazon, eBay, Zappos, и т.д.

Распознавание  скрытых  переадресаций:

Сравнение двух URL: Сравните URL в задаче по оцениванию с URL целевой страницы, чтобы увидеть, есть ли смысл в том, чтобы один переводил на другой. Переадресация со старой страницы компании на новую на другом домене это не скрытость, переадресации с одной страницы на домене на другую на том же домене, это так же не скрытые переадресации.

Посмотрите на регистраторов домена: Если вы заметили, что возможно имела место скрытая переадресация, вам следует проверить “whois” регистратора (или владельца) двух доменов. Если регистратор тот же, скорее всего переадресация не "скрытая". Пожалуйста, посмотрите раздел 2.3.1 Рекомендаций по спаму для инструкций по проверке “whois”.

2.3.1 Использование “Whois”

Вот инструкции по проверке“whois” регистратора домена:

Перейдите на сайт провайдера “whois”. Вот два, которые вы можете увидеть: http://www.domaintools.com/ и http://whois.mtgsy.net/default.php. Некоторые компьютеры также позволяют вам

запускать из окна терминала команды по типу whois пример.com

Введите URL домена в поле поиска на странице “whois”. Иногда, вам понадобится удалить некоторые первые и последние символы. К примеру, если UR http://supportapj.dell.com/support/, вы введете просто “dell.com” в поле поиска whois провайдера.

Откройте другую “whois” страницу.

Введите URL другого домена в поле поиска на другой странице “whois”.

Сравните регистраторов двух URL. Если вы обнаружите, что у них один и тот же регистратор домена, вы типично решите, что страница - не спам. Если вы решите, что они отличаются и не связаны, это скорее всего спам.

Помните, что домены с тем же регистратором могут выглядеть совсем по разному. К примеру, Barnes and Noble, сайт продажи книг, владеет следующими доменами: www.barnesandnoble.com, www.bn.com, и www.books.com.

2.4 Клоакинг

"Клоакинг" говорят, когда вебмастер показывает различные страницы поисковой системе и пользователям. Настоящий клоакинг довольно редок, но спамеры используют другие методы, чтобы показывать различные страницы поисковым системам, но не пользователям. Два такие метода, используемые спамерами, это:

JavaScript переадресации

100% фрейм

2.4.1 JavaScript Переадресации

Спамеры используют JavaScript переадресации, чтобы показать поисковым системам одну страницу, пока пользователь пересылается на другую. Если сначала посмотреть на страницу с включенным JavaScript, а потом на страницу с отключенным JavaScript, можно увидеть разницу.

2.4.2 100% Фрейм

Вебмастеры иногда скрывают то, что видят пользователи, используя фрейм. Существует два фрейма (страницы), но один фрейм занимает 100% страницы. Пользователь видит один фрейм (страницу), но поисковые системы видят оба.

3.1 Полезные страницы vs. Спам-страницы

Поисковые системы стремятся отображать страницы, полезные пользователям. В этом разделе вы узнаете, как определять, являются ли страницы спамом, или же они полезны пользователям. Мы будем говорить о:

Страницах с PPC рекламой и другим содержимым, которые созданы, чтобы помочь пользователям путем, который добавляет страницы с действительной пользой.

Страницах с PPC рекламой и другим содержимым, которые не имеют другой значимости, кроме заработка денег.

На некоторых страницах содержится только PPC реклама, или очень мало другого содержимого. Такие страницы мы называем “чистые PPC” страницы. Вы узнаете больше о PPC страницах в Разделе 4.2 Рекомендаций по Спаму. Когда страница с PPC рекламой добавляет содержимое, полезное пользователям, это не спам. Вот примеры полезного пользователям контента:

Функциональность сравнения цен: некоторые страницы предлагают сравнение цен для покупателей, ищущих продукт для покупки. Покупатель имеет возможность оценить все  варианты. Даже если пользователь нажмет на ссылку партнера, чтобы перейти на другой сайт для заказа, сравнение цен на странице может быть полезным.

Обзоры продуктов: Некоторые страницы предлагают оригинальные обзоры продуктов, которые полезны пользователю в его выборе при покупке. Обзоры постоянно предоставляются на книги, бытовую технику, отели.

Обратите внимание, что рецепты, тексты песен, цитаты, стихи, и т.д. обычно не имеют основных страниц.

Каждый может создать страницу и наполнить ее контентом.

Тексты песен, цитаты, афоризмы, стихи, и т.д..: Некоторые страницы отображают такой контент. Если страница создана, чтобы помочь пользователям найти тексты песен или стихи, это не спам.

Контактная информация: Некоторые страницы содержат контактную информацию компаний. Если контактная информация включает в себя адрес, номер телефона, карту, и т.д., страница полезна и не является спамом для пользователя, в добавок к ссылке на мерчанта. Так как такие виды кодов полезны пользователям, они обеспечивают дополнительную значимость.

Купон, скидка, или промо-код: Некоторые партнерские сайты предлагают купоны, промо-скидки или скидки клиентам, в добавок к ссылке на мерчант. Так как эти типы кодов полезны.

Рецепты: Некоторые страницы содержат рецепты. Если рецепты на странице полезны, к примеру, если они оригинальны или страница содержит обзоры оригинальных или неоригинальных рецептов, страница не является спамом.

3.2 Страницы со скопированным контентом и PPC рекламой

Скопированный контент - это контент, взятый из других источников. Иногда вебмастеры используют особое “скрейперское” ПО для поиска контента в интернете на свой вебсайт, связанного с определенными ключевиками. Также контент может быть скопирован с другого сайта простым "копипаст" методом.

3.1.1 Скопированный Текст и PPC Реклама

Содержимое, скопированное с таких источников, как    Wikipedia (http://www.wikipedia.org/ и Open Directory Project (http://www.dmoz.org/), сайтов, которые позволяют распространение их содержимого и могут даже поощрять это, все равно следует рассматривать как скопированное содержимое.

Копирование контента из таких источников необязательно нелегальное, и необязательно считается плагиатом. Вебмастеры, копирующие контент обычно не претендуют на то, чтобы быть создателями такого содержимого и могут указывать ссылки на источник. Однако, даже если они ссылаются на другой источник, это скопированный контент.

Такие копии часто устаревшие и ненадежные. Пользователи нуждаются в информации, которой они могут доверять. Копия статьи из Wikipedia на неизвестном вебсайте вместе с рекламой не очень полезна пользователям. Мы будем называть страницу спамом, если она содержит скопированный контент и создана для заработка от рекламы на странице.

3.1.2 Ленты и PPC Реклама

Веб издатели (BBC, CNN, Usenet, CNet, NYTimes, Atom, и другие) публикуют онлайн информацию, которая является быстродоступной для пользователей путем RSS или XML лент. Такие компании, как Searchfeed.com, предоставляют ленты PPC рекламы и ссылок на самых квалифицированных вебмастеров. Страница с легкодоступными лентами и PPC рекламой, созданная для прибыли - это спам.

3.1.3 Дорвеи

Дорвеи - это наборы страниц, созданных, чтобы поисковые системы доставляли пользователя к определенной странице. Все страницы похожи и не предоставляют значащего содержимого для пользователей. Вот пример: http://www.hair-removal-hair-laser.com/. Эта страница содержит ссылки для всех штатов США. Нажав на ссылку, вы будете полагать, что перейдете на специализированную страницу определенного штата, но если вы нажмете на другую ссылку, вы поймете, что на самом деле все страницы одинаковы. Эти страницы - это спам.

3.1.4 Шаблоны и Другие Сгенерированные Компьютером Страницы

Некоторые сайты используют шаблоны для массовой репродукции страниц в автоматическом режиме. Содержимое обычно копируется из источников, предоставляющих такой контент. Вы научитесь распознавать такие шаблоны, они обычно следуют одному формату или модели. Поищите незначительные вариации ключевых слов, которые наводят на мысли о автоматическом использовании инструмента по подбору ключевых слов. Если ключевое слово “ипотека,” вы можете увидеть такие слова как “ипотеки,” “заем под залог,” “займы под залог,” и т.д. в названии, фрагментах и/или URL.

Такие спам-страницы содержат другие страницы, которые обычно содержат комбинацию из скопированного контента, PPC рекламы и других спам-ссылок. Нажав на ссылку на такой странице вы перейдете на другие страницы с тем же доменом со схожим контентом и схожими ссылками.

3.1.5 Скопированные Форумы

Иногда вы будете встречать скопированные форумы (и рекламу. Когда на странице содержится только скопированный форум и PPC реклама, то страница - спам.

3.1.6 Распознавание Скопированного Контента

Вот некоторые вещи, которые могут помочь вам распознать скопированный контент:

Ищите точное предложение из текста на странице: Скопируйте и вставьте отличительные предложения в окно поиска поисковой системы. При вставке предложения в поле поиска, возьмите его в кавычки, таким образом поисковая система будет искать точную последовательность слов. Вы можете выбрать ряд правильных слов без знаков препинания и специальных символов, только чтобы убедиться, что ваш поиск не осложнен знаками препинания. В результатах поиска вы можете обнаружить, откуда было взято содержание. Если контент является оригинальным и не был скопирован из другого источника, он, вероятно, был написан, чтобы быть полезным для пользователей.

Ищите PPC рекламу, обрамляющую содержимое. Wikipedia и DMOZ не показывают рекламу. Если вы видите содержимое из:

Wikipedia или из DMOZ с PPC рекламой без оригинального содержимого на странице, это спам.

Познакомьтесь с форматами страниц Wikipedia и DMOZ: Заголовки разделов и ссылки на страницы Wikipedia обычно имеют один и тот же формат. Страницы DMOZ используют пути директорий, которые легко распознать. Кроме того, DMOZ страницы имеют такие ссылки: “создать сайт” и “стать редактором,” которые также часто находятся на скопированных страницах.

3.1.7 Другие советы по распознаванию спам-страниц

Вот некоторые дополнительные пути для распознания страниц со спамом

Посмотрите на форматирование URL: Посмотрите на форматирование URL, чтобы решить, имел ли место шаблон или другие автоматические методы использованы при создании. Часто вы будете встречать ключевые слова в URL, разделенные дефисом. Вот пример: thelawmail/2007/12/29/com-search-extreme-belladonna-users-search-expired-domain-names-search-expired-domains/.

Посмотрите, была ли страница создана, чтобы помочь пользователям: Ищите тексты песен, рецепты, цитаты, контактную информацию, номера телефонов, физические адреса, оригинальные обзоры, работающие комментарии и т.д.

Посмотрите, есть ли сгенерированная компьютером грамматика: Смотрите на текст на странице.

Когда он сгенерирован компьютером, он часто выглядит бессмысленным. Вы также можете увидеть гиперссылковые ключевые слова в тексте. Подумайте о том, как выглядит страница - как созданная человеком или как созданная машиной: страницы, созданные машинами, обычно не имеют за цель быть полезными пользователям и чаще всего являются спамом.

3.2 Поддельные страницы поиска с PPC рекламой

Поддельная страница поиска это страница со списком ссылок, которая выглядит как страница результатов поиска. Вы увидите поле поиска на странице, но если введете новый запрос, вы просто получите другой список ссылок. Если вы нажмете на несколько ссылок, вы увидите, что страница - это просто коллекция PPC ссылок замаскированных под результаты поисковой системы.

3.3 Поддельные блоги с PPC рекламой

Поддельный блог содержит поддельные записи блога, которые являются либо бессмысленными либо скопированными из другого источника. Поддельные блоги часто содержат перенасыщение ключевыми словами, о котором написано в разделе 2.2 Рекомендаций по спаму. Страница существует, так что PPC ссылки на ней можно нажать. PPC ссылки могут появляться в тексте поддельных записей в блоге или на других частях страницы. Поддельные блоги могут быть показаться полезными, имея функцию, позволяющую пользователю оставить комментарий, но эта функция не работает. Поддельные блоги это спам.

Спам-блоги: Спам-блоги отличаются от поддельных блогов. Спам-блоги - это реально работающие блоги, с реальными записями, но комментарии в них наполнены спамом с PPC рекламой и/или порно-ссылками. Мы не хотим принимать меры против блога потому, что кто-то другой разместил на нем спам. Если вы считаете, что блог хороший, легитимный блог, который наполнен спамом кем-то другим, пожалуйста, не присваивайте ему метку Спам.

3.4 Поддельные форумы с PPC Рекламой

Поддельный форум похож на поддельный блог. Он содержит то, что по всей видимости напоминает “сообщения", но это не так. Текст сообщения может быть бессмысленными или он может содержать ссылки КПП. Поддельные могут иметь, на первый взгляд, комментарии, регистрацию и вход в разделы, но либо эти функции не работают вовсе, либо вы будете перенаправлены обратно на ту же страницу. На реальных форумах вы увидите ответы на сообщения. На поддельных форумах либо нет ответа, либо ответ тоже является спамом.

Скопированные форумы с PPC рекламой: вы можете встретить скопированный полностью форум. Если вы заметили что-то подобное, скопируйте часть текста и введите в поле поиска. Скопированные форумы - это спам.

Спам-форумы: Спам-форумы отличаются от поддельных форумов. Спам-форум - это настоящий форум с настоящими сообщениями и настоящими ответами, но который содержит PPC рекламу и/или порно-ссылки. Мы не хотим принимать меры против форума потому, что кто-то другой разместил на нем спам. Если вы считаете, что форум хороший, что это легитимный форум, который наполнен спамом кем-то другим, пожалуйста, не присваивайте ему метку Спам.

3.5 Скопированный контент, который НЕ является спамом

Некоторое скопированное содержимое не является спамом. Вот некоторые примеры: тексты песен, стихи, пословицы, цитаты и т.д. Этот тип контента не имеет уникального или центрального управления.

Если страница, которую вы оцениваете, наполнена текстами песен, стихами, и т.д. из легитимного сайта, не присваивайте метку Спам. Если вы считаете что основной целью страницы является заработок денег, следует присвоить ей метку Спам.

4.1 Коммерческое намерение

В этом разделе мы поговорим о том, как спамеры зарабатывают деньги и как обнаружить коммерческое намерение. Большинство спам-страниц имеют коммерческое намерение. Спамеры создают спам-страницы чтобы заработать деньги и получить комиссионные, когда пользователь совершает покупку на партнерском мерчант-сайте или когда пользователь нажимает на PPC рекламу.

Страницы считаются спамом, если их основной целью является заработок денег, а не помощь пользователям.

Помните: Некоторые спам-страницы не имеют четко выраженного коммерческого намерения. Если страница создана для смены ранжирования в поисковых системах или даже чтобы навредить компьютерам пользователей скрытыми загрузками, это спам, даже если вы не можете увидеть, как страница приносит прибыль.

4.2 Тонкие Аффилиаты

Аффилиат зарабатывает деньги благодаря партнерской комиссии. Сайты-аффилиаты существуют с целью заработка денег. Аффилиаты часто показывают содержимое других, "реальных", мерчантов, как Amazon или eBay, или хороший сайт с отелями или туризмом. Когда пользователь нажимает на ссылку для совершения покупки или резервирования, их часто пересылают на реальной мерчант-сайт.

Тонкий Аффилиат - это сайт, который предлагает небольшую дополнительную информацию и не имеет особой ценности для пользователей, в сравнении с многими источниками в интернете. К примеру, аффилиат, который только скопировал содержимое из мерчант-сайта, считается тонким аффилиатом. Это спам-техника для получения прибыли.

4.2.1 Распознавание Тонких Аффилиатов

Чтобы легче было распознавать тонкие аффилиаты, вы можете выполнить следующие действия:

Поискать оригинальное содержимое на странице.  Качество страницы или сайта аффилиата зависит от того, сколько полезности, или оригинальной/дополнительной информации доступно на странице, которая не всегда доступна в других местах в интернете. Если страница имеет такой же "нарезанный" текст или функциональность, которые можно найти на десятках или сотнях других сайтов, это вероятно, спам.

Поискать регистраторов домена. Если после нажатия на кнопку, вы переходите на другой сайт, проверьте “whois” регистратора (или владельца) двух доменов. Если регистратор тот же, страница скорее всего не тонкий аффилиат. Пожалуйста, следуйте инструкциям по проверке “whois” в Разделе 2.3.1 Рекомендаций по спаму.

4.2.2 Распознавание Настоящих Мерчантов

Особенности, которые помогут вам определить, является ли сайт настоящим мерчантом, включают в себя:

ссылка "просмотреть корзину", которая остается на том же сайте

корзина, которая обновляется, когда вы добавляете в нее товары

политика возврата с физическим адресом

рабочий калькулятор стоимости доставки

ссылка на вишлист, или ссылка, чтобы отложить покупку на потом

возможность доставки через FedEx.

рабочий форум пользователей

возможность регистрации

рабочая регистрация подарков

Обратите  внимание:

Странице не обязательно иметь все перечисленные особенности, чтобы считаться настоящим мерчантом

Yahoo! Stores - настоящие мерчанты, они не являются тонкими аффилиатами.

Некоторые настоящие мерчанты небольшого размера переводят пользователя на другой сайт, чтобы завершить транзакцию, потому что используют третьих сторон для проведения транзакции. Такие мерчанты не являются тонкими аффилиатами.

Многие крупные интернет-ритейлеры предлагают партнерские программы. Некоторые из наиболее распространённых примеров - Amazon.com, eBay.com, Zappos.com, Allposters.com, Hotels.com, Orbitz.com, и Overstock.com.

4.2 Чистые PPC Страницы

Мы отсылаемся к страницам с PPC рекламой только (или с PPC рекламой и небольшим количеством другого контента) как к PPC страницам. Спамеры получают прибыль, когда пользователи нажимают на ссылку. Покупка необязательна. Чистые PPC страницы могут содержать ссылки на другие спам-страницы, которые также содержат PPC объявления. Чистые PPC страницы - это спам. Страницы с поддельными директориями также могут считаться чистыми PPC страницами.

4.3 Паркованные (Недействительные) Домены

Определение "Домена": Слово “домен” может иметь два значения для асессоров:

Оно может отсылать к одному из элементов DNS (Система Доменных Имен), как .com, .org, .edu, .net, .gov, .it, .uk, .cn, .es, и т.д., которые распределяют интернет-адреса.

Оно может отсылать к набору слов (URL) которые идентифицируют интернет-адрес определенного объекта как microsoft.com, harvard.edu, baidu.cn, и т.д.

В этом разделе, когда мы будем использовать слово "домен", мы будем отсылаться ко второму понятию.

Когда компании перестают существовать, поглощаются другими компаниями, меняют имя или не платят за регистрацию домена, доменное имя становится недействительным и может быть использовано кем-то другим.

Паркованные Домены: Иногда спамеры покупают недействительные или просроченные домены и выкладывают на страницу собственный контент. Такие сайты называются "паркованными доменами” или “недействительными доменами.” Их ценность для спамеров состоит в существовавших ранее ссылках. Страницы, которые ранее переводили пользователя на недействительный домен, теперь будут переводить на домен спамера.

Также спамеры приобретают следующие типы доменов, которые мы также будем считать паркованными доменами, так как внешне они похожи:

Домены, близкие по написанию к реальным доменам, в надежде на то, что пользователи неправильно введут имя домена или URL перейдут на их сайт, который содержит PPC рекламу.

Домены, которые могут вводить пользователи в поиске нужного сайта.

Типичный паркованный/недействительный содержит некоторые или все из следующих составных:

Список спонсированных ссылок.

Список популярных категорий.

Список категорий с ключевыми словами.

Распознавание Паркованных/Недействительных Доменов

Посмотрите на ссылки. Как правило, все ссылки на паркованный домен платные. На странице практически нет оригинального контента.

Посмотрите на имя домена (URL). На паркованном домене, имя домена (URL) не имеет никакого отношения к контенту на странице. Вы можете видеть ключевые слова, но ссылки обычно общие и страницы ссылок не связаны с запросом.

Поищите страницу в Интернет Архиве. Перейдите на http://www.archive.org/index.php и введите URL. Посмотрите, как страница выглядела ранее, при первом владельце, который ею управлял. Если сайт отличался, это скорее всего паркованный домен.

Скоро вы узнаете о форматах паркованных/недействительных доменов.

4.4 Страницы с Бесполезным Контентом и PPC Рекламой

Некоторые страницы с содержанием создаются только с целью размещение рекламы на них; спамеры платят писателям за создание статей по широкому кругу вопросов. Часто статьи очень общие и не дают достаточно полезной информации, но они являются оригинальными. Вы не найдете эти статьи на другом сайте. Хотя вы можете быть уверены, что намерение состоит в том, чтобы заработать деньги, если содержание имеет смысл и кажется оригинальным, вы не сможете назначить метку Спам таким страницам. Вы должны будете использовать собственное суждение.

Посмотрите на контент и спросите себя

- Контент вероятно полезен пользователям или он слишком общий, бедно написанный или бессмысленный?

- Имеет ли страница дополнительную значимость при сравнении с другими страницами в результатах поиска?

- Есть ли на странице слишком больше количество рекламы, которая отвлекает от основного содержимого?

- Вы бы доверяли содержимому?

- Вы бы с уверенностью ввели на этом сайте информацию о своей кредитной карте?

Попробуйте определить, была ли страница создана человеком, или же, машиной.

Постарайтесь определить, зачем страница создавалась.

5.0 Фишинговые сайты

Фишинг является попыткой недобросовестных людей получить доступ к конфиденциальной информации от интернет-пользователей. Некоторые из вас, возможно, получали сообщения по электронной почте, которые выглядят, как будто они пришли из легитимных компаний, но при ближайшем рассмотрении они таковыми не являются. Часто эти письма запрашивают конфиденциальную информацию.

Целевая страница следующего задания также запрашивает конфиденциальную информацию и также является фишингом.

Запрос [runescape gold], английский (US) URL http://

www.gprunescape.com/

Целевая страница должна заставить пользователей (и асессоров) быть внимательными и осторожными. Плохое правописание, плохая грамматика, непрофессиональность, страница кажется "спамовой". Что больше всего настораживает, так это то, что страница запрашивает банковские данные - пароль и пин-код.

Хотя мы не хотели бы взаимодействовать со страницей, этот вид фишинга не идет против Рекомендаций по спаму и страницу не следует помечать как спам или вредоносную.

Запомните, что отмечать нужно только страницы, попадающие под одну из спам-категорий, описанных в руководстве. Некоторые фишинговые страницы могут быть спамом, но эта - нет.

6.1 Спам и стадия решения

Это не редкость для задач входить в стадии "решении", потому что асессоры спорят, должна ли страница определяться как Не подлежит оцениванию: Не загрузилась, или оценкой из рейтинговой шкалы и меткой спама. Разногласия происходят потому, что асессоры видят разные страницы при нажатии на ссылку в задаче. Эти различия могут быть обусловлены сроками, или они могут быть обусловлены версиями браузера и/или различными настройками.

Когда задача переходит в стадию решения по этой причине, и страницы, которые вы видите, соответствуют

критериям Не подлежит оцениванию: Не загрузилась, пожалуйста, посмотрите еще раз. Так как другие асессоры видят спам, очевидно, что они смотрят на что-то другое, а не на то, что вы видите. Вот некоторые вещи, которые вы можете попробовать:

Обновите браузер до последней версии.

Посмотрите на код или отключите JavaScript.

Если вы все же не обнаружили спам, не следует присваивать метку Спам.

Помните, что спам-страницы часто перестают грузиться по истечении определенного времени. Если в один день вы заметили спам, но вы не можете загрузить страницу на следующий день, не меняйте свою оценку (не удаляйте метку Спам).

7.1 Заключение

Распознавание спама - это навык, который нужно развивать путем практики и выявления.

Помните, что страницу нужно рассматривать как целое. Обычно спам-страницы обладают следующими характеристиками:

PPC объявления на странице очень выделяются, и очевидно, что страница была создана для них.

Если вы выполните поиск текста, вы обнаружите, что содержимое было скопировано.

Если вы визуально уберете все спам-элементы страницы (PPC объявления и скопированный контент), ценности практически не останется.

Хорошие страницы обычно обладают следующими характеристиками:

Страница хорошо устроена. На ней может быть реклама, но она отделена и не отвлекает.

Если вы выполните поиск текста, оригинальная страница обычно выведется первой.

Страница будет полезной пользователю. Хорошая поисковая захочет иметь в списке результатов такую страницу.

Вот спам метки, которые вам нужно использовать:

Не спам: Если вы не считаете, что страница - это спам, присвойте ей метку Не спам.

Возможно спам: Если вы считаете, что страница может быть спамом, но вы не уверены, используйте метку Возможно спам.

Спам: Если вы считаете, что страница была создана с использованием обманных методов веб дизайна, описанных в этих рекомендациях, вам следует присвоить ей метку Спам.

Когда вы не уверены, какую метку выбрать, не забывайте задавать себе следующие вопросы:

Страница предоставляет пользователю достойный опыт поиска?

Содержит ли страница оригинальный контент, который был бы полезен пользователям?

Считаете ли вы, что страницу стоит включить в набор результатов поиска?

Страница создана для пользователей? Есть ли на ней человеческий элемент?

Если вы удалили PPC объявления и скопированный текст из страницы, остаётся ли какая-то польза? Если на эти вопросы вы отвечаете "да", значит страница, скорее всего, не спам.

При использовании материала ссылка на сайт igrovoy-avtomat.com строго обязательна.

Является уникальной собственностью casino-rating.org
Поделитесь с друзьями
"Мнение администрации сайта может не совпадать с мнением авторов статей"
Комментировать:

x