/ / Language: Русский / Genre:comp_www,

Яндекс для всех

М. Абрамзон

Рассказывается о ведущем поисковом ресурсе российской части Интернета — Яндексе. Описаны его сервисы для поиска документов и новостей, блогов и адресов, товаров и музыкальных произведений. Рассмотрены почтовый сервис и сервис для создания и размещения сайтов на Народ. ру. Читатель узнает о том, что такое "электронные деньги" и как с их помощью оплатить товар. Большое внимание уделяется общедоступным поисковым программам, которые Яндекс предлагает своим посетителям для поиска информации не только на сайтах, но и на своем компьютере. На компакт-диске находятся программы Яндекса, описанные в книге, и дополнительные материалы. Для начинающих пользователей Интернета.

Михаил Абрамзон

Яндекс для всех

Аркадий Волож — основатель и генеральный директор компании "Яндекс".

Является соучредителем и членом Совета директоров компании Infinet Wireless (производитель оборудования WiMAX в России). Был соучредителем компании CompTek International, одного из крупнейших дистрибьюторов сетевого и телекоммуникационного оборудования в России, и руководил этой компанией с 1989 по 2000 год. Принимал активное участие в процессе дерегулирования частот для беспроводных сетей, легализации IP-телефонии. У Аркадия высшее образование в области прикладной математики.

Введение

Так начинался "Яндекс"

В 2000 году акционерами CompTek — компании, создавшей и в течение долгого времени развивавшей проект Яndex, была учреждена компания "Яндекс". Компания ru-Net Holdings инвестировала 5 млн 280 тыс. долларов и получила в новой компании долю в 35,72 %. В число акционеров вошли также менеджмент и ведущие разработчики поисковой системы. Генеральным директором стал Аркадий Волож. Но история Яндекса началась задолго до этого события.

Десятью годами ранее в компании "Аркадия" начались разработки поискового программного обеспечения. Через два года были созданы две информационно-поисковые системы — Международная классификация изобретений, а также Классификатор товаров и услуг. Системы работали под DOS и позволяли проводить поиск, выбирая слова из заданного словаря с использованием стандартных логических операторов.

Еще через год "Аркадия" стала одним из подразделений компании CompTek и в течение двух последующих лет выполняла работы по усовершенствованию поисковых технологий. В сотрудничестве с лабораторией Ю. Д. Апресяна (Институт проблем передачи информации РАН) был разработан словарь, обеспечивающий поиск с учетом морфологии русского языка. Теперь пользователи могли задавать в запросе любые формы слов.

Эти разработки позволили создать "Библейский компьютерный справочник", справочник стандартов "Информ — Норматив", электронные научные издания "А. С. Грибоедов", "Пушкин. Электронный фонд русской классической литературы", словарь языка Грибоедова.

Следующим шагом стала разработка алгоритма построения гипотез, после чего морфологический разбор перестал быть привязанным к словарю — если какого-либо слова в словаре нет, то находятся наиболее похожие на него словарные слова, и по ним строится модель словоизменения.

Летом 1996 года руководство компании CompTek и разработчики поисковой системы пришли к выводу, что развитие самой технологии важнее и интереснее, чем создание прикладных продуктов на базе поиска. Исследования рынка показали своевременность и большие перспективы поисковых технологий.

Первая демонстрация продуктов серии Яndex (Яndex.Site, Яndex.Dict) была проведена на выставке Netcom'96 18 октября 1996 года. Первый из них обеспечивает поиск по своему сайту и установлен на сотнях серверов Рунета. Второй продукт, морфологическое расширение запроса, до сих пор используется для передачи запросов на AltaVista.

А уже 21 ноября была выполнена первая установка системы Яndex.Site на веб-сервере Издательского дома "Открытые системы". Это дало возможность искать информацию с учетом морфологии русского языка. И в том же ноябре всем пользователям была предоставлена бесплатная возможность русифицированного поиска необходимой информации с учетом морфологии русского языка с помощью поискового сервера AltaVista.

Еще через полгода появился Яndex.CD — поиск документов на CD-ROM, а затем Яndex.Lib — полнофункциональная библиотека Яndex для встраивания в различные приложения и базы данных. И наконец осенью 1997 года был открыт Yandex.Ru.

Основными нововведениями поисковой системы Yandex.Ru были проверка уникальности документа — этим достигалось исключение копий в различных кодировках, и отличительные свойства поискового алгоритма Yandex: поиск с учетом морфологии русского языка, с учетом расстояния и тщательно разработанный алгоритм оценки релевантности.

Оптимизация поискового алгоритма позволила реализовать проблему поиска по разным зонам текста, ограничение поиска на группу сайтов, поиск по ссылкам и изображениям. Также, впервые в Рунете, было введено понятие индекс цитирования — количество сайтов, ссылающихся на данный ресурс. Затем был открыт "Семейный Яндекс" с фильтрацией результатов поиска от мата и порнографии.

Название Яndex появилось в то время, когда будущий генеральный директор будущей компании Аркадий Волож и будущий директор по технологиям компании Илья Сегалович разрабатывали технологию поиска неструктурированной информации с учетом морфологии русского языка. Требовалось слово, отражающее суть новой технологии, которое бы хорошо звучало, легко писалось и запоминалось. Тогда на основе английского слова index был предложен вариант — yet another indexer ("еще один индексатор" или Языковой иНдекс). Кроме этого, Аркадий предложил букву "Я" в названии — специфически русскую — русской и оставить, для наглядности. Так появилось слово "Яndex".

Поиск, почта и все остальное

Сегодня Яндекс — это не только поиск. И поиск не только среди документов. Яндекс теперь вполне может быть назван порталом, предоставляющим посетителям разнообразные услуги.

Поиск в Интернете

В год, когда была образована компания "Яндекс", на канале НТВ прошла рекламная компания поисковой системы, во время которой был впервые озвучен слоган "Найдется все!" (рис. В.1). Сегодня этот лозунг знает каждый, кто использует Яндекс для поиска информации. В канун 2007 года на домашней странице портала выводилось сообщение — "Поиск по 1 372 783 513 вебстраницам". Это, конечно, далеко не весь Рунет, но его значительная часть.

Домашних страниц поискового сервера у Яндекса несколько. Это главная страница портала http://www.yandex.ru, через которую можно выполнить обычный и расширенный поиск. Аскетичный поиск Ya.ru, где на домашней странице нет ничего кроме поисковой строки. Есть также семейный поиск, поиск для слабовидящих и медиативный.

Кроме того, пользователь может настроить формат представления результатов поиска, а также вид домашней страницы Яндекса.

Сам поиск может вестись по нескольким направлениям:

􀂈 по веб-страницам;

􀂈 по новостям;

􀂈 картинок;

􀂈 товаров и услуг;

􀂈 в блогах;

􀂈 контактов фирм и организаций;

􀂈 легальной музыки;

􀂈 на картах.

Словари и энциклопедии

Поиск по словарям — тоже поиск, но более конкретный. Его результаты основываются на статьях словарей и энциклопедий, которые включены в состав электронной справочной литературы Яндекса. На конец 2006 года поиск мог проводиться среди 29 словарей. А кроме того, здесь же можно выполнить перевод слов с/на английский, немецкий, французский, испанский, итальянский и, конечно, русский язык.

Почта

У вас еще нет почтового ящика на Яндексе? Подумайте, не настала ли пора его получить. Размер ящика не ограничен, ограничен лишь размер одного письма — он не может превышать 10 Мбайт. Почта проверяется на спам и на вирусы. Для борьбы со спамом (а это страшная вещь — бывают дни, когда из сотен пришедших писем действительно нужных остается не более десятка) применяется разработанная Яндексом программа фильтрации спама и массовых рассылок "Спамооборона".

Почтовая система предоставляет и множество других "вкусностей". Это и импорт адресных книг из почтовых клиентов (кому хочется каждый раз заполнять адресную книгу заново?), и сбор почты с других серверов, и доступ к своему почтовому ящику по защищенному каналу. Все это и многое другое мы с вами рассмотрим в главе 2, посвященной этому сервису.

Яндекс-каталог

Каталог Яндекса появился позже поисковой системы. С одной стороны, это еще один сервис, привлекающий посетителей. С другой — дополнительная возможность организации поиска по отобранным модераторами каталога ресурсам. В дополнение к обычной рубрикации по темам (Бизнес, Дом, Развлечения, Отдых и пр.) Яндекс предлагает классификацию сайтов по типу содержащейся в них информации (Справки, Товары и услуги, Публикации и пр.). Несколько позже появилась рубрикация и по регионам.

Если большинство российских, да и не только российских, каталогов отталкивались в своем развитии от Yahoo! то в Яндексе была разработана собственная система рубрикации. И хотя количество рубрик в каталоге относительно небольшое, дополнительные признаки, которые проставляются для каждого сайта, позволяют перейти к нужной группе ссылок за минимальное количество щелчков. А для ранжирования ссылок в рубриках используется тематический индекс цитирования (тИЦ).

Яндекс и Народ

Одним из пользующихся популярностью сервисов, предоставляемых Яндексом, стал сервис бесплатного размещения сайтов. Причем это не просто хостинг, где пользователи могли разместить собственные сайты. Свое название "Народ" сервис подтвердил еще и тем, что помимо хостинга предложил воспользоваться набором подготовленных шаблонов, позволяющих создать страницу пользователю, даже ничего не понимающему в вопросах программирования веб-страниц. После регистрации, пользователь мог выбрать один из шаблонов (сейчас их свыше ста), наполнить его своей информацией и пустить "в плавание" по широким просторам Интернета.

Этим сервисом воспользовались многие, а в некоторых учебных заведениях его применяют даже в процессе обучения. Создаются здесь персональные страницы и визитки предприятий, фотоальбомы и резюме, сайты увлеченных людей и интернет-магазины. Многие сайты были включены в каталог Яндекса, а это не такая простая задача. По данным тематического индекса цитирования составляется выборка ТОП 100 народных сайтов.

Яндекс. Деньги

Яндекс. Деньги — это платежная система, с помощью которой вы можете:

□ совершать платежи в Интернете;

□ совершенно безопасно хранить информацию о зачислениях и платежах;

□ управлять своими средствами через Интернет.

Эта система — не банк, в ней не открывается счет пользователя системы. Только кошелек — и пополнив его любым способом, можно оплачивать свои покупки в интернет-магазинах, передавать свои средства другим пользователям этой системы или получать переводы от них, через специальные обменные системы переводить или получать электронные деньги из других подобных систем, например, WebMoney. Средства, находящиеся в вашем кошельке, могут быть перечислены на ваш счет в любом банке, находящемся на территории России.

Система поддерживает два типа кошельков — Яндекс. Кошелек, доступ к которому осуществляется через сайт Яндекс. Денег, и Интернет. Кошелек, для работы с которым на компьютер пользователя устанавливается специальная программа. Кошельки между собой несовместимы и действуют полностью самостоятельно. Поэтому каждый может завести себе два различных кошелька и пользоваться ими независимо.

Несмотря на то что Яндекс. Деньги — не банк, все средства, находящиеся в этой системе, обеспечены реальными банковскими счетами компании-оператора, размещенными в следующих банках:

□ ИМПЭКСБАНК;

□ Росбанк;

□ Банк "ТАВРИЧЕСКИЙ";

□ Сбербанк.

□ Внешторгбанк;

Ленты новостей

Уже давно новости можно читать не только на сайтах, где они публикуются, но и подключившись к RSS-потокам. RSS — формат представления данных (международный стандарт для синдикации веб-контента). Аналогичные функции выполняет и формат Atom, но он имеет расширенные по сравнению с RSS характеристики.

Многие блоги (сетевые дневники) и многие новостные источники предоставляют информацию в формате RSS. Эти потоки состоят из сообщений, где каждое сообщение является записью в дневнике или новостью. Яндекс. Лента — специальный сервис для сбора таких информационных RSS-потоков в одном удобном для использования месте.

Из огромного списка возможных источников вы выбираете блоги (сетевые дневники) или новости, которые хотите читать, собираете из них ленту и читаете. В процессе чтения вы можете отмечать понравившиеся сообщения, чтобы потом просмотреть их отдельно. Нужные сообщения вы также сможете найти и с помощью поиска по вашей ленте.

Каждая лента в сервисе представляет собой набор RSS-потоков, сообщения из которых сортируются по времени поступления. Вы можете создать себе несколько лент (например, по тематикам) и наполнить их интересными лично вам потоками с помощью формы добавления потока.

Решения для корпоративных пользователей

По-настоящему богаты те, кто может себе позволить делиться с другими. Если исходить из этого, Яндекс — богатая компания. То, что было разработано для себя и является основой бизнеса, предлагается всем желающим. Как на платной основе, так и на бесплатной.

Корпоративным клиентам предлагаются два продукта — Спамооборона и Яндекс. Сервер.

Корпоративный продукт "Спамооборона" — это серверное решение для фильтрации спама. Основные свойства системы: полнота и высокая точность фильтрации, актуальная база знаний о спаме, наличие гибких настроек. Установив ее на корпоративном почтовом сервере, вы резко снизите количество спама, доходящего до почтовых ящиков ваших сотрудников.

Хотите, чтобы на вашем портале было легко найти любую информацию — установите Яндекс. Сервер. Большинство возможностей этого продукта теперь доступно в бесплатной версии, более чем достаточной для большинства интернет-проектов.

Персональные продукты

Персональный поиск Яндекса — это программа на вашем компьютере, осуществляющая поиск по файлам и письмам с учетом морфологии русского языка. Совершенно бесплатная, обладающая прекрасными поисковыми возможностями. Позволяет во много раз быстрее искать, к примеру, в базах почтовой программы The Bat! письма, чем выполнять поиск стандартными средствами почтовика.

Яндекс. Бар — это уже совсем иной продукт. Удобство его использования почувствует в первую очередь тот, кто много и часто пользуется Яндексом. А все потому, что в этот плагин, работающий и на MS IE, и на FireFox, включено большинство служб Яндекса, а также обеспечен доступ к вашим личным ресурсам (почте, ленте, денежным средствам).

Есть на Яндексе и другие сервисы и службы — игры и общение, соревнования по поиску и фотоальбомы. Сервисы постоянно развиваются, а количество их увеличивается. Но "нельзя объять необъятное", говорил незабвенный Козьма Прутков. И не отвлекаясь на новинки, разберем, чем же является Яндекс сегодня.

Илья Сегалович — директор "Яндекса" по технологиям и разработке, один из основателей компании.

Поисковыми технологиями Илья начал заниматься в 1990 году — в компании "Аркадия", где руководил группой программного обеспечения. В период с 1993 по 2О00 год, Илья работал в компании CompTek International, где возглавлял отдел поисковых систем. При непосредственной поддержке созданы Национальный корпус русского языка (Ruscorpora) и Российский семинар по оценке методов информационного поиска (РОМИП). Илья Сегалович имеет высшее образование в области геофизики. Вместе со своей женой Марией Илья поддерживает благотворительную студию "Дети Марии" (социальная помощь детям-сиротам и детям-инвалидам).

Глава 1

Поиск (Найдется всё!)

Главная задача информационно-поисковой системы — это поиск информации, релевантной информационным потребностям пользователя. Слово релевантность означает соответствие между желаемой и действительно получаемой информацией. Релевантность можно еще представить как меру близости между реально полученными документами и тем, что следовало бы получить из системы.

"CITForum: Поисковые системы"

1.1. Что такое "поисковая машина"

Каждому из нас в определенный момент времени бывает необходима информация, отсутствующая среди записей, заметок и данных на нашем компьютере. Где в таком случае вы будете ее искать? Одним из наиболее простых и удобных способов поиска является Интернет (далее также "Сеть"). Здесь есть все — техническая и экономическая информация, справочники и научные издания, расписания транспорта и онлайновые магазины, книги и курсы валют. Все можно найти, не отрываясь от стула. Но у этой хорошей стороны Интернета есть и обратная сторона — количество информации в Сети растет даже не по часам, а по минутам и секундам. Найти нужную информацию обычным серфингом уже невозможно. Простой и удобный протокол HTTP, используемый для серфинга, удобен для навигации и просмотра страниц, но совершенно не предназначен для поиска.

Первым шагом на пути систематизации информации, размещаемой в Интернете, стало создание каталогов сайтов, в которых ссылки на ресурсы группировались по тематическому признаку. Так построено большинство современных каталогов, но началом всему стал проект Yahoo! открытый в 1994 году. Вторым шагом после создания каталога стал поиск по размещенным в нем ссылкам. Понятно, что это был поиск не по всем ресурсам Интернета, а лишь по тем, которые присутствовали в каталоге. Даже сегодня, спустя десятилетия после появления первых каталогов, в них присутствует лишь малая толика интернет-ресурсов. В одном из самых крупных каталогов — DMOZ (Open Directory Project) находятся ссылки на 4 миллиона сайтов, распределенных по 590 000 категорий, а в базе Яндекса размещена информация свыше чем о 2 278 900 000 документов. Показатели для поиска несравнимые.

Поэтому не удивительно, что почти одновременно с появлением каталогов, появились и поисковые машины. Первой из них стал проект WebCrawler, появившийся в 1994 году. Следом за ним открылись поисковые системы Lycos и AltaVista, а в 1997 году Сергей Брин и Ларри Пейдж создали Google. В том же году была официально анонсирована и поисковая система Яндекс, ставшая самой популярной в русскоязычной части Интернета.

1.1.1. Компоненты поисковых машин

Информация в Сети не только пополняется, но и постоянно изменяется, но об этих изменениях никто никому не сообщает. Отсутствует единая система занесения информации, одновременно доступная для всех пользователей Интернета. Поэтому с целью структурирования информации, предоставления пользователям удобных средств поиска данных и были созданы поисковые машины.

Поисковые системы бывают разных видов. Одни из них выполняют поиск информации на основе того, что в них заложили люди. Это могут быть каталоги, куда сведения о сайтах, их краткое описание либо обзоры заносят редакторы. Поиск в них ведется среди этих описаний.

Вторые собирают информацию в Сети, используя специальные программы. Это поисковые машины, состоящие, как правило, из трех основных компонентов:

□ Агента;

□ Индекса;

□ Поискового механизма.

Агент, или более привычно — паук, робот (в англоязычной литературе — spider, crawler), в поисках информации обходит сеть или ее определенную часть. Этот робот хранит список адресов (URL), которые он может посетить и проиндексировать, с определенной для каждой поисковой машины периодичностью скачивает соответствующие ссылкам документы и анализирует их. Полученное содержимое страниц сохраняется роботом в более компактном виде и передается в Индекс. Если при анализе страницы (документа) будет обнаружена новая ссылка, робот добавит ее в свой список. Поэтому любой документ или сайт, на который есть ссылки, может быть найден роботом. И наоборот, если на сайт или любую его часть нет никаких внешних ссылок, робот может его не найти.

Робот — это не просто сборщик информации. Он обладает довольно развитым "интеллектом". Роботы могут искать сайты определенной тематики, формировать списки сайтов, отсортированных по посещаемости, извлекать и обрабатывать информацию из существующих баз данных, могут выполнять переходы по ссылкам различной глубины вложенности. Но в любом случае, всю найденную информацию они передают базе данных (Индексу) поисковой машины.

Поисковые роботы бывают различных типов:

Spider (паук) — это программа, которая скачивает веб-страницы тем же способом, что и браузер пользователя. Отличие состоит в том, что браузер отображает информацию, содержащуюся на странице (текстовую, графическую и т. д.), паук же не имеет никаких визуальных компонентов и работает напрямую с HTML-текстом страницы (аналогично тому, что вы увидите, если включите просмотр HTML-кода в вашем браузере).

Crawler (краулер, "путешествующий" паук) — выделяет все ссылки, присутствующие на странице. Его задача — определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Краулер, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.

Индексатор разбирает страницу на составные части и анализирует их. Выделяются и анализируются различные элементы страницы, такие как текст, заголовки, структурные и стилевые особенности, специальные служебные HTML-теги и т. д.

Индекс — это та часть поисковой машины, в которой осуществляется поиск информации. Индекс содержит все данные, которые были переданы ему роботами, поэтому размер индекса может достигать сотен гигабайт. Практически, в индексе находятся копии всех посещенных роботами страниц. В случае если робот обнаружил изменение на уже проиндексированной им странице, он передает в Индекс обновленную информацию. Она должна замещать имеющуюся, но в ряде случаев в Индексе появляется не только новая, но остается и старая страница.

Поисковый механизм — это тот самый интерфейс, с помощью которого посетитель взаимодействует с Индексом. Через интерфейс пользователи вводят свои запросы и получают ответы, а владельцы сайтов регистрируют их (и эта регистрация — еще один способ донести до робота адрес своего сайта). При обработке запроса поисковый механизм выполняет отбор соответствующих ему страниц и документов среди многих миллионов проиндексированных ресурсов и выстраивает их в порядке важности или соответствия запросу.

Названные выше компоненты не обязательно входят в состав поисковой машины так, как они здесь описаны. У разных поисковиков реализация может отличаться друг от друга. К примеру, связка Spider+Crawler+Индексатор может быть выполнена в виде единой программы, которая скачивает известные веб-страницы, анализирует их и ищет по ссылкам новые ресурсы.

1.1.2. Характеристики поисковых машин

В статье, посвященной поисковой машине Rambler (http://www.rambler.ru/ doc/architecture.shtml), называются основные характеристики, которые могут быть применены к любым поисковикам:

□ полнота;

□ точность;

□ актуальность;

□ скорость;

□ наглядность.

Полнота поиска характеризуется отношением количества найденных по запросу документов к общему количеству документов в Интернете, соответствующих данному запросу. Если по запросу "кристаллическая решетка" будет найдено 150 документов, а общее количество документов в Интернете, соответствующее этому запросу, составляет 1000, то полнота поиска составит 0,15. (Эта величина приблизительная, поскольку неизвестно точно, сколько же на самом деле существует в Интернете страниц, отвечающих условию поиска.) Чем более полно проанализированы и занесены в Индекс документы, тем выше будет показатель полноты поиска.

Точность поиска определяется как степень соответствия найденных документов запросу пользователя. Допустим, мы хотим найти документы, в которых встречается выражение "сын знахаря". В результатах поиска мы увидим документы, в которых встречается точно такое выражение. Но присутствуют и документы, содержащие искомые слова, но не выражения, например: "родители привозят сына в небольшой городок на Адриатическом побережье, к местному знахарю". И если всего найдено 200 документов, из которых только в 80 встречается именно искомое словосочетание, то точность поиска будет оценена как 80/200 (0,4). Чем точнее поиск, тем выше вероятность, что пользователь найдет нужные документы, тем меньше будет избыточной, лишней информации.

Для повышения точности результата в различных поисковых системах применяются различные способы. Каждый поисковик использует свои решения, в целом предназначенные для выполнения близких по сути задач. К примеру, вот что по этому поводу сказано на сайте Рамблера:

Повышение точности в поисковой машине Рамблер достигается за счет использования различных технологий на всех этапах обработки и поиска информации. Одним из наиболее интересных процессов является распознавание грамматических омонимов. Омонимы — это слова, которые имеют одинаковое написание, но различный смысл. Различают лексические и грамматические омонимы. Лексические омонимы относятся к одной части речи, как, например, существительное "бор": хвойный лес, стальное сверло и химический элемент. Грамматические омонимы относятся к разным частям речи, поэтому по написанию у них обычно совпадают только отдельные формы. Примерами грамматических омонимов могут служить слова "печь" (существительное русская печь и глагол печь пирожки) и "рядовой" (прилагательное рядовой сотрудник и существительное рядовой Иванов).

Омонимы не только увеличивают размер индексной базы (так как для каждого такого слова приходится хранить все его возможные значения), но и отрицательно сказываются на точности поиска. Если пользователь ищет слово "данные", ему неинтересно получить в найденном все документы, которые содержат слово "дать". Для того чтобы результаты поиска были точнее, модуль синтаксического анализа проводит разбор окружения слов-омонимов с целью установления их наиболее вероятных значений. Например, если рядом со словом "печь" стоит существительное ("пирожки", "картошка"), то с высокой вероятностью "печь" в данном контексте является глаголом. На сегодняшний день анализатор способен распознавать значения только грамматических омонимов.

Синтаксический анализ позволяет также с определенной вероятностью распознавать некоторые имена собственные. Например, если в тексте несколько слов подряд написано с большой буквы, они чаще всего представляют собой имя собственное (Петр Петрович, Московский Государственный Университет). Данные о таких конструкциях учитываются при индексации и обработке запроса.

Еще один способ повышения точности поиска — это выделение устойчивых обозначений и поиск их как отдельных лексических единиц. На сегодняшний день в Рамблере реализована система распознавания таких конструкций, как, например C++, б/у, п/п-к. Если по запросу С++ поднимать все тексты, в которых присутствуют латинская буква С, а также знак +, то получится огромное количество документов, далеко не все из которых соответствуют запросу; кроме того, это большая работа, значительно увеличивающая время поиска.

Источник: "Принципы работы поисковой машины Рамблер" (http://www.rambler.ru/doc/architecture.shtml).

А вот что на эту же тему пару лет назад сказал И. Сегалович, директор Яндекса по технологиям и разработке:

Алгоритм поиска учитывает социальную структуру Интернета. Он умеет отличать мнение людей от технической, вспомогательной и рекламной информации, то есть лучше распознавать, какой ресурс является авторитетным в своей области. Также введена дополнительная очистка результатов поиска от дубликатов. Теперь пользователь избавлен от повторения в списке найденного почти одинаковой информации. Поиск в Интернете — это серьезная наука, поэтому для повышения качества сервиса в Яндексе проводятся регулярные исследования. В прошлом году мы организовали отдел асессоров — пользователей, которые систематически по заданной методике оценивают релевантность результатов. Обратная связь от асессоров дает нам возможность настраивать параметры алгоритма ранжирования и увеличивать точность поиска. Стало удобнее работать с региональной информацией. Теперь Яндекс автоматически определяет, в каком городе находится компьютер, с которого поступил запрос, и, если уточнение по региону имеет смысл, предлагает повторить поиск, ограничив его сайтами данного региона. Поиск поддерживает шесть языков — к русскому и английскому добавились украинский, белорусский, французский и немецкий. Язык документов и сайтов определяется автоматически, а ограничить область поиска нужным языком можно в настройках или расширенном поиске. Расширенный поиск стал проще и функциональней, заданные с его помощью ограничения теперь видны на странице найденных результатов. Благодаря "умной подсказке" пользователи расширенного поиска смогут увидеть сформированный запрос, как если бы он был задан на русском языке.

Какова психология того, кто ищет информацию? Считается, что наиболее подходящие (релевантные) документы должны быть на первой-второй страницах результатов поиска. Если количество полученных результатов больше, человек вряд ли будет просматривать остальные страницы. И даже если в числе найденных есть документ, полностью отвечающий заданным условиям, но находится он на странице из второго десятка, ищущий этот документ не увидит — он просто не дойдет до этой страницы. Поэтому громадное значение приобретает и ранжирование документов в результатах поиска по их релевантности запросу.

По поводу релевантности Яндекс говорит, что это "соответствие ответа вопросу", но при этом важны две составляющие — полнота (ничто не забыто) и точность (отсутствие лишнего).

Релевантность различают как содержательную и формальную. Воспользовавшись словарями, представленными в Яндексе, предложу определения этих понятий:

содержательная релевантность — соответствие документа информационному запросу, определяемое неформальным путем;

формальная релевантность — соответствие, определяемое алгоритмически путем сравнения поискового предписания и поискового образа документа на основании применяемого в информационно-поисковой системе критерия выдачи.

В простейшем случае, релевантность текста определенному запросу — это процент вхождения запроса к общему объему текста. Для поисковых систем высокорелевантным текстом считается такой, где вхождение запроса в текст примерно равно 4–7 % — меньшего может не хватить, большее чревато тем, что система сочтет текст за поисковый спам и наложит на страницу некий понижающий фильтр или может вообще убрать страницу из результатов выдачи по искомому запросу.

Конечно, каждая поисковая система использует гораздо более сложные способы вычисления релевантности документов запросу пользователя. Тем не менее, несмотря на то что алгоритмы у всех поисковых машин разные, они построены на общих принципах — основные отличия результатов выдачи заключаются не в алгоритмах определения релевантности, а в конкретных способах реализации этих алгоритмов.

Какие же факторы, помимо вхождения слов запроса в текст документа, оказывают дополнительное влияние на его место среди других документов? Каждая поисковая машина, стремясь привлечь качеством выдачи запрашиваемой информации, разрабатывает собственные критерии подсчета релевантности. Это и плотность ключевых слов на странице, и разделы страниц, где находятся эти слова, объем содержания, тексты заголовков и ссылок и многое другое. Учитываются и такие рассчитываемые показатели сайтов, как индекс цитирования, тематический индекс цитирования, Page Rank. И при этом происходит постоянное изменение степени влияния на результаты тех или иных параметров, их состав и принцип расчета.

1.2. Как устроена поисковая машина Яndex

Поисковая машина Яndex относится ко второму рассмотренному ранее типу поисковых машин. У Яndexа есть свои пауки-агенты, есть свой Индекс и поисковый механизм. Эта поисковая машина ориентирована в первую очередь на российскую часть всемирного Интернета, т. е. индексируются в ней русскоязычные сайты, расположенные в доменах ru и su. Сделаны небольшие исключения для наиболее авторитетных зарубежных сайтов. Сложнее с русскоязычными сайтами, которые зарегистрированы в международных или региональных (государственных) доменах других стран — com, org, de, us и других, но они все же попадают в Индекс и учитываются при поиске.

Большинство значимых зарубежных нерусскоязычных сайтов может быть найдено по ссылке, при этом, в отличие от русскоязычных сайтов, в Индекс они не попадают. Упрощается ситуация в том случае, когда у компаний, таких как BMW, IBM и многих других, появляются русскоязычные версии сайтов, без проблем индексируемые Яндексом.

Поисковая машина — самый востребованный ресурс Яндекса. Ежедневно его посещают около четырех с половиной миллионов посетителей, при этом количество просмотренных поисковых страниц приближается к сорока миллионам. При этом пользователи, выполняющие на нем поиск, этого не замечают — складывается впечатление, что Яндекс работает индивидуально для каждого из них.

Так, при запросе средней "тяжести", то есть при поиске не очень частотного слова, время отклика системы (без учета времени передачи данных по каналу от поисковой системы к пользовательскому компьютеру) исчисляется десятыми долями секунды.

В условиях постоянного роста количества пользователей и их запросов главной задачей поисковой машины является сохранение приемлемых с точки зрения пользователей скорости и полноты выполнения запросов. Эта задача решается несколькими способами, каждый из которых является необходимым, но не достаточным в отрыве от других. Способы достижения высоких результатов на сегодня применяются следующие:

□ оптимизация базовых поисковых алгоритмов и архитектуры поиска;

□ регулярное увеличение мощностей вычислительных ресурсов поисковой системы;

□ использование архитектурной возможности масштабирования системы.

Оптимизация поисковых алгоритмов проводится постоянно. Результаты таких работ вводятся в действие до двух раз в год. Сказывается их внедрение на уменьшении нагрузки на поисковую машину (в год эта величина составляет 20–30 %), а также на уменьшении времени отклика.

Увеличение мощности — это постоянное обновление используемого оборудования. Сюда входит и переход на более мощные процессоры, увеличение оперативной памяти, увеличение объемов дисковых хранилищ. Способ хотя и необходимый, но крайне затратный. Результативность выполненного апгрейда можно косвенно оценить увеличением объема поисковой базы, находящейся в его распоряжении.

Третий способ — использование мастшабируемости системы. В двух словах суть его заключается в том, что каждый уровень системы распараллеливается на несколько одинаковых узлов. Например, при наличии десяти поисковых серверов, обрабатывающих поступающие запросы, очередной запрос будет направляться на тот из них, которых в данный момент времени будет свободен.

Аналогично обстоит дело и со сбором информации. Этим занимается робот-паук, который обходит страницы с заданными URL и скачивает их в базу данных, а затем архивирует и перекладывает в хранилище суточными порциями. Робот размещается на нескольких машинах, и каждая из них выполняет свое задание. Так, робот на одной машине может качать новые страницы, которые еще не были известны поисковой системе, а на другой — страницы, которые ранее уже были скачаны не менее месяца, но и не более года назад.

Хранилище у всех машин едино.

При необходимости работу можно распределить другим способом, например, просто распределив между роботами всю работу, учитывая лишь ее объемные показатели. Параллельная работа программы позволяет легко выдерживать дополнительную нагрузку — при увеличении количества страниц, которые нужно обойти роботу, достаточно просто распределить задачу на большее число машин.

В хранилище информация в сжатом виде собирается и разбивается на части. Эти части постепенно распределяются между множеством машин, на которых запущена программа-индексатор. Как только индексатор на одной из машин заканчивает обработку очередной части страниц, он обращается за следующей порцией. В результате на первом этапе формируется много маленьких индексных баз, каждая из которых содержит информацию о некоторой части Интернета. При увеличении нагрузки на машины, занимающиеся индексированием, проблема может быть решена простым добавлением машин в систему.

После того как все части информации обработаны, начинается объединение (слияние) результатов. Основная база участвует в анализе как одна из частей нового индекса. Так, если объединяются 70 новых частей, то в анализе участвует 71 фрагмент (70 новых + основная база предыдущей редакции). Специальная программа ("сливатор") составляет таблицы перенумерации документов базы. Содержимое всех частей объединяется. Среди страниц с одинаковыми адресами выбирается наиболее свежая версия; если при скачивании URL последней информацией была ошибка 404 (запрашиваемая страница не существует), она временно удаляется из индексной базы. Параллельно осуществляется склейка дублей — страницы, которые имеют одинаковое содержимое, но различные URL, объединяются в один документ.

Сборка единой базы из частичных индексных баз представляет собой простой и быстрый процесс. Сопоставление страниц не требует никакой интеллектуальной обработки и происходит со скоростью чтения данных с диска. Если информации, которая генерируется на машинах-индексаторах, получается слишком много, то процедура "сливания" частей проходит в несколько этапов. Вначале частичные индексы объединяются в несколько промежуточных баз, а затем промежуточные базы и основная база предыдущей редакции пересекаются. Таких этапов может быть сколько угодно. Промежуточные базы могут сливаться в другие промежуточные базы, а уже потом объединяться окончательно. Поэтапная работа незначительно замедляет формирование единого индекса и не отражается на качестве результатов.

Источник: "Принципы работы поисковой машины Рамблер" (http://www.rambler.ru/doc/architecture.shtml).

А вот что рассказывали о решении аналогичных задач на Яндексе.

Если применить к поиску на Яндексе традиционные термины Distributed Information Retrieval, то можно выделить следующие приемы распараллеливания.

1. Разделение коллекции документов — начиная с весны 2000 года, в Яндексе используется "параллельный поиск" в нескольких поисковых источниках. Параллельный поиск — это одновременный поиск в специализированных базах (коллекциях), предлагаемых поисковой системой. Обычно, источник — это отдельная база небольшого размера, отличная от "большой" базы документов. Подразумевается, что документы, индексируемые в такой базе, имеют некоторую регулярную структуру. Если при поиске по обычной базе находятся и документы из базы параллельного поиска, точно соответствующие запросу, то одновременно (параллельно) с обычным результатами поиска выдается список из нескольких найденных документов. База параллельных источников имеет существенно меньший размер, чем база веб-поиска. Обход и индексация документов в ней осуществляется отдельным роботом, поэтому обновление базы может происходить очень быстро (вплоть до ежеминутного).

В "Яндексе" есть четыре базы параллельного поиска:

• по новостям (обновление каждые 10 минут, ежедневно около 3000 новостей);

• по товарным предложениям интернет-магазинов (ежедневное обновление, примерно 300 000 товаров);

• по заголовкам статей энциклопедий (обновление раз в месяц, около 200 000 статей);

• по каталогу ("ручному" описанию веб-ресурсов).

Особый интерес с точки зрения традиционных поисковых технологий представляет техника разделения большой базы документов, то есть собственно базы веб-страниц. По состоянию на 2002 год она состояла из 60 млн документов и была разделена на 30 частей.

Среди особенностей текущей реализации разделения веб-коллекции в Яндексе можно отметить следующее:

• есть центр контроля и распределения URL;

• отсутствует репликация коллекции по машинам;

• распределение документов по коллекциям случайно.

2. Первая фаза обработки запроса: выбор коллекции, трансформации запроса — пользователь может явно указать, в какой коллекции следует искать. Если этого не сделано, то на основе лингвистического (точнее, эвристического) анализа запроса Яндекс может сделать допущение о приоритете специализированной коллекции или подходящей к характеру запроса рубрики каталога.

3. Вторая фаза обработки запроса: раздача запроса по коллекциям — обычно используются все коллекции. Собирающий сервер раздает в коллекции модифицированные запросы, в которых для каждого термина сообщается глобальное значение его обратной частоты (IDf в терминах традиционного IR). Для этого на всех "собирающих" серверах хранится глобальная статистика терминов. Она изменяется медленно, поэтому обновляется относительно редко. Статистика подсчитывается по считающейся наиболее универсальной — вебовской — коллекции. Таким образом, каждая поисковая машина ищет ответ на запрос с назначенными "сверху" глобальными частотами, и значения релевантности, вычисляемые в разных коллекциях, можно считать последовательными и вычисляемыми "в одной системе координат". Модификации запросов этим не ограничиваются, и для специализированных коллекций (например, "энциклопедии") могут быть и другими, в том числе и очень специфическими.

4. Третья фаза обработки запроса: исполнение и ранжирование запроса в коллекциях — запрос выполняется паралельно для всех коллекций.

Следует отметить, что веб-коллекции документов распределены по машинам произвольно и, вообще говоря, могут быть расположены все вместе на одной машине. Слияние результатов производится на том из собирающих (метапоисковых) веб-серверов, на который попадал пользователь при заходе по адресу www.yandex.ru. Процесс раздачи запроса, описанный здесь, позволяет корректно ранжировать слитый результат. При этом не требуется переранжирование результатов, полученных из разных неоднородных коллекций с использованием локальных IDF, а также не нужен динамический обмен данными между источниками для вычисления глобальнойIDF.

1.2.1. "Пауки"

Мы ищем в Яндексе информацию и новости, картинки и значения слов, товары и услуги. На сегодняшний день в базе данных накоплена информация о миллионах документов и сайтов, огромном количестве новостей, графических изображений, сотнях тысяч предлагаемых товаров и услуг. За обновление информации в ней отвечают различные роботы.

Вот они, те роботы, которые выполняют основную работу по поиску и индексированию информации:

□ Yandex/1.01.001 (compatible; Win16; I) — основной индексирующий робот;

□ Yandex/1.01.001 (compatible; Win16; P) — индексатор картинок;

□ Yandex/1.01.001 (compatible; Win16; H) — робот, определяющий зеркала сайтов;

□ Yandex/1.02.000 (compatible; Win16; F) — робот, индексирующий пиктограммы сайтов (favicons);

□ Yandex/1.03.003 (compatible; Win16; D) — робот, обращающийся к странице при добавлении ее через форму "Добавить URL";

□ Yandex/1.03.000 (compatible; Win16; M) — робот, обращающийся при открытии страницы по ссылке "Найденные слова";

□ YaDirectBot/1.0 (compatible; Win16; I) — робот, индексирующий страницы сайтов, участвующих в рекламной сети Яндекса.

А кроме них есть и несколько агентов, которые занимаются проверкой доступности сайта или документа, на который стоит ссылка в соответствующем сервисе. Их тоже несколько:

□ Yandex/2.01.000 (compatible; Win16; Dyatel; C) — "простукивалка" Яндекс. Каталога. Если сайт недоступен в течение нескольких дней, он снимается с публикации. Как только сайт начинает отвечать, он автоматически появляется в Каталоге.;

□ Yandex/2.01.000 (compatible; Win16; Dyatel; Z) — "простукивалка" Яндекс. Закладок. Ссылки на недоступные сайты помечаются серым цветом;

□ Yandex/2.01.000 (compatible; Win16; Dyatel; D) — "простукивалка" Яндекс. Директа. Она проверяет корректность ссылок из объявлений перед модерацией. Никаких автоматических действий не предпринимается;

□ Yandex/2.01.000 (compatible; Win16; Dyatel; N) — "простукивалка" Яндекс. Новостей. Она формирует отчет для контент-менеджера, который оценивает масштаб проблем и, при необходимости, связывается с партнером.

Если о наименованиях роботов информация не является закрытой (в любом случае, ее можно обнаружить в логах сайтов, которые эти роботы посещали), то сведения о том, на каком сетевом адресе работает тот или иной робот, закрыты. Связано это с необходимостью уменьшить вероятность некорректного использования этой информации в целях продвижения сайтов. С этой же целью сетевые адреса время от времени изменяются.

Зачем эта информация нужна вам? Если вы являетесь владельцем сайта, и у вас установлен механизм, собирающий информацию о ваших посетителях, в эти данные попадет и информация о посетивших ваш проект роботах. Вы будете в курсе, какие роботы и когда вас посещали и какие страницы просматривали.

1.2.2. Индекс

Огромный объем информации, размещенной в Интернете, приводит к разрастанию Индекса. С некоторой долей приближения информацию можно разделить на две категории — условно постоянную и переменную. К переменной информации можно отнести публикации информационных изданий и аналогичных сервисов, записи в блогах, предложения онлайновых магазинов, иные сервисы, где информация меняется с большой частотой.

Обработка быстроменяющейся информации потребовала иного подхода. Были разработаны новые технологии и алгоритмы, новые базы и поисковые роботы. Каждой отдельной базе соответствовал собственный Индекс. Поисковые базы были разработаны для поиска по словарям и энциклопедиям, по каталогу сайтов, по предложениям интернет-магазинов, новостям и блогам.

Но какие бы новые технологии ни создавались, какими бы совершенными ни становились технические средства, объем накапливаемой информации заставляет наращивать вычислительные мощности. Если первый Индекс размещался на обычном компьютере, стоявшем в буквальном смысле "в ногах" у разработчика, то теперь для размещения аппаратных средств построены специальные помещения, оборудованные всем необходимым для обеспечения непрерывной работы. А компьютер, положивший начало поисковой системе, теперь находится на выставке раритетов Яндекса.

1.2.3. Поисковый механизм

Начиная выполнять поиск с помощью Яндекса, мы может в явном виде указать, в какой базе (коллекции документов, типе документов) следует выполнять поиск. Если мы не указываем этого, то на основе анализа запроса Яндекс самостоятельно делает допущение о приоритете специализированной коллекции над основной, самостоятельно подбирает подходящую к запросу рубрику каталога.

Чаще всего для поиска используются все базы. При этом собирающий сервер раздает в них модифицированные запросы, прошедшие предварительную обработку. Эта обработка заключается в том, что каждому термину в запросе сообщается глобальное значение его обратной частоты, подсчитываемой по коллекции веб-страниц. Такая обработка требуется для того, чтобы поиск велся по единым правилам, и значения релевантности, вычисляемые в разных коллекциях, можно было бы считать последовательными и вычисляемыми "в одной системе координат".

Модификации запросов этим не ограничиваются, и для специализированных коллекций (например, "энциклопедий") могут быть и другими, в том числе и очень специфическими.

Запрос выполняется параллельно для всех коллекций, а слияние результатов, как и указывалось ранее, производится на том из собирающих (метапоисковых) веб-серверов, на который попадал пользователь при заходе по адресу www.yandex.ru. Результаты поиска по наиболее крупным источникам, если в них найден хоть один ответ, показываются рядом со ссылками из веба (справа — одна картинка и ссылка на остальные, а также ответ Маркета). Ответ остальных источников может показываться сверху или снизу результатов поиска, если он оказался достаточно релевантным — так работают Новости, Энциклопедии, Каталог.

1.3. Основы поиска в Яндексе

Поиск Яндекса — самый востребованный его ресурс. Огромная база данных, отличная скорость реакции, высокая релевантность ответа, возможность найти ответ на почти любой поставленный вопрос. Недаром одним из любимых слоганов поисковика было (и остается теперь) "Найдется все!" (рис. 1.1).

И даже его реклама в Московском метро среди назойливой рекламы разнообразных товаров и услуг выглядела как простая констатация факта, уверенная и правдивая.

Но не только скорость и качество повлияли на востребованность сервиса. Оказало свое влияние и удобство работы с поисковиком, разнообразие вариантов доступа к сервису. Российские, да и не только, поисковики зачастую грешат перегруженностью страницы ввода поискового запроса. Когда используешь сервис только для нахождения информации, все остальное в лучшем случае мешает, а часто — раздражает.

Яндекс предлагает различные варианты доступа к поисковой системе. Обычный, базовый вход выполняется по основному адресу — http://yandex.ru (рис. 1.2). "Весит" эта страница около 50 Кбайт и кроме логотипа других графических элементов не имеет (я не считаю в данном случае за графику отдельные элементы дизайна). Поэтому загружается страница очень быстро даже при использовании модемного соединения.

Что размещено на этой странице? Главный элемент — строка поиска. Чаще всего при вводе запросов используется обычный ее вариант, без дополнительных (расширенных) возможностей. По умолчанию поиск ведется во всех разделах, но можно выбрать более узкую зону поиска — поиск среди новостей, картинок, блогов, словарей. Ниже блока поиска — заголовки основных разделов каталога. Отдельным пунктом среди них выделены сайты вашего региона.

В зависимости от глубины обработки вашего IP-адреса, выводится информация о погоде в вашем городе и программа телевизионных передач на текущий момент (с учетом местного времени) по основным телеканалам. Присутствует и информация о курсе валют Центробанка — для кого-то она необходима. И очень кратко — буквально пять строчек — последние новости из ленты новостей.

Со страницы поиска можно перейти и на другие сервисы Яндекса, в том числе в личные, войти в почту, используя свой аккаунт, либо зарегистрировать новый, перейти на сервис Яндекс. Деньги.

1.3.1. Базовые возможности

Искать в Яндексе очень и очень просто. Вы задаете вопрос в том виде, в каком могли бы задать его приятелю, учителю, врачу, ученому. Единственное пожелание — вопрос не должен быть очень длинным и содержать множество слов. Оптимальное количество слов в запросе — от трех до шести. На мой взгляд, поиск выполняется быстрее и качественнее, если первоначальный запрос содержит не более трех слов, а при необходимости его уточнения выполняется поиск по дополнительным словам в уже найденном результате.

Поиск по одному слову может привести к неожиданным результатам. К примеру, вы хотите узнать о настройках привилегий пользователей в операционных системах. Вводите слово "привилегии" и получаете подборку ответов обо всех известных Яндексу привилегиях. И на первом месте будут ссылки на информацию о привилегиях депутатов. Да, где-то внутри списка на полусотне страниц наверняка будет и ссылка на нужную вам информацию. Но крайне редко кто-то просматривает более двух-трех страниц из полученных результатов.

Поисковая система Яндекса учитывает морфологию русского языка. Поэтому вне зависимости от того, в какой форме вы употребите слово в запросе, поиск будет вестись по всем возможным его формам. Для русского языка это особенно важно, поскольку слова могут употребляться в разных падежах, числах, склонениях. И если вы задали в запросе слово ель, то в результате поиска будут найдены документы, в которых содержатся слова "ель", "ели", "елка". Но обратите внимание — слово "ели" будет только в виде существительного, хотя в русском языке оно может быть использовано и в виде глагола ("есть", "ел", "едим"). Следовательно, Яндекс различает и части речи. И если вы ищете слово профессионал (существительное), будут найдены страницы со словами "профессионал", "профессионалы", но страницы со словом "профессиональный" (прилагательное) в результаты выведены не будут.

Однако не всегда использование морфологического анализа желательно. В ряде ситуаций необходимо найти слово в определенном его написании. Такая возможность также существует. Для отключения использования морфологического анализа перед требуемым словом в запросе достаточно поставить восклицательный знак.

Исключить морфологический анализ можно и другим путем — взять искомое слово в кавычки. Кавычки используются и в тех случаях, когда требуется найти определенное слововыражение, цитату. Например, если в строке поиска вы введете "мороз и солнце, день чудесный", то в результатах поиска будут приведены ссылки на страницы, содержащее искомое выражение.

В поисковой системе слова, начинающиеся с букв в разном регистре, считаются разными формами одного слова. Поэтому как бы вы ни написали слово пряжа, в результатах будут выведены ссылки не только на страницы, где говорится о ткачестве, изготовлении одежды, но и на страницы, где упоминается одноименный город в Карелии. Если вы хотите уточнить предмет поиска, следует воспользоваться оператором точной формы (вспомните — это восклицательный знак). По запросу! пряжа вам будут найдены документы, содержащие это слово в любом регистре. Но если запрос выполнить как! Пряжа, то в результате будут выданы документы, содержащие слово "Пряжа" с большой буквы. (В связи с этим очень часто приводятся примеры поиска распространенных сочетаний, совпадающих с именем собственным, например, группа! Черный кофе.)

Те, кто искали информацию с помощью Яндекса, знают, что среди найденных документов будут встречаться и такие, в которых содержится только часть слов, входящих в запрос. Что сделать, чтобы важное для вас слово присутствовало в документе в обязательном порядке? Для решения этой проблемы вам надо перед требуемым словом без пробела поставить знак +.

В русском языке, как и в любом другом, есть группа слов, которые встречаются в тексте значительно чаще других. К таким словам относятся предлоги, местоимения, частицы (еще их называют Стоп-слова). Они появляются в текстах так часто, что начинают мешать поиску. Поэтому большинство поисковых машин их игнорирует даже в том случае, когда они встречаются в тексте запроса. Но что делать, если для вашей фразы слово из такого стоп-списка требуется в обязательном порядке? Как и в предыдущем случае, использовать признак обязательности — знак +. Но это не единственный вариант — чуть ранее мы говорили о том, что можно исключить использование морфологического анализа, заключая искомое выражение в кавычки. И тогда поиск выражения "и маятник может шагать в ногу со временем" однозначно приведет вас на страницу замечательного польского писателя С. Е. Леца.

Вы уже догадываетесь, какой ответ будет на вопрос, — а как исключить слово из поиска? Ну не хочу я, чтобы на странице результатов по запросу о компаниях-производителях горных лыж присутствовали предложения горных курортов. В этом случае в строке запроса перед словом, которое вы хотите исключить, необходимо поставить знак —. И тогда запрос может выглядеть так: горные лыжи — курорт — тур — агентство.

Вот те минимальные сведения, знания которых вполне достаточно для выполнения большинства поисковых запросов. Но иногда требования к результатам поиска предъявляются более высокие, и в этом случае нужно использовать расширенный поиск.

1.3.2. Расширенные возможности поиска

Для того чтобы использовать расширенные возможности, перейдите по ссылке расширенный поиск, находящейся под строкой ввода запроса. Вы попадете на новую страницу, где, помимо поля ввода запроса, размещены поля для формирования сложных поисковых условий.

Все выбранные вами условия являются обязательными при обработке запроса. Например, если вы в дополнительных условиях установите требование, чтобы слова запроса находились на одной странице документа, а документ был в формате DOC (Microsoft Word), то в результате получите список документов, в которых искомые слова находятся на одной странице. Ни HTML-страницы, ни другие документы, содержащие искомые слова, в результат поиска включены не будут.

Группа условий Искомые слова

Дополнительные условия разбиты на две группы. Первая группа условий Искомые слова относится к словам и их размещению в документе.

Расположение слов друг относительно друга

С помощью первого блока условий (табл. 1.1) назначается требование по взаимному расположению искомых слов (иначе — расстояние между словами).

Возможность определять в запросе взаимное расположение слов на странице или в документе связана с тем, что в Яндексе используются специальные алгоритмы, учитывающие не только морфологию слов, но и их связь между собой (если в запросе указано несколько слов).

Яндекс — весьма самостоятельная система, и если вы ей не укажете строгие правила поиска, он будет искать по правилам, применяемым по умолчанию:

Если слова, идущие в запросе одно за другим, тесно связаны между собой, поиск будет происходить в пределах одного предложения. Если связь менее тесная — поиск будет вестись на расстоянии в несколько предложений. В том случае, если Яндекс определит, что слова между собой не связаны, они будут разыскиваться в пределах одного документа.

Пример, приводимый Яндексом

…запрос продажа автомобилей Украина отличается от запроса продажа автомобили Украины. В первом запросе "точно найденным документом" будет считаться документ, в котором слова "продажа" и "автомобиль" находятся "рядом" (скажем, в одном предложении), а слово "Украина" — "далеко" (скажем, где угодно в документе). Во втором запросе точно найденным документом будет считаться только такой, в котором слова "автомобиль" и "Украина" находятся достаточно близко. Яндекс решает так, потому что фраза "автомобили Украины" синтаксически согласована. То есть, с точки зрения Яндекса, первый запрос нацелен на поиск украинских автомобильных дилеров, а второй — на поиск любых продавцов "Таврий".

Используя настройки расширенного поиска, вы тем самым ужесточаете требования к его результатам и ограничиваете "своеволие" поисковой машины. Незначительный, вроде бы, нюанс, но может существенно сказаться на полученных результатах.

Расположение слов на странице

При обычном поиске заданные в запросе слова разыскиваются по всем элементам страницы (табл. 1.2). В данном контексте под элементами понимаются тело страницы, ее заголовок (тот текст, который виден в заголовке браузера), либо ссылки, ведущие со страницы. Вы можете ограничить ареал поиска, выбрав один из перечисленных элементов. И более того, вы можете ужесточить поиск среди ссылок, если в качестве дополнительного параметра укажете, на какой конкретно сайт должна вести ссылка. Это может пригодиться в том случае, если вы знаете сайт, информации на котором вы доверяете. И если в процессе поиска в тексте документа будут ссылки на информацию с этого сайта, вы заранее предполагаете, что сможете доверять и найденной информации.

Форма представления слова

Еще один элемент настройки — выбор формы представления слова в документе (табл. 1.3). С его помощью можно либо искать слово во всех его морфологических формах, либо в строгом соответствии с написанием в запросе. Использование этого элемента идентично использованию восклицательного знака перед словом в тексте запроса.

Группа условий Страницы

А вот эта группа настроек предназначена для отбора соответствующих запросу страниц, но по параметрам, не имеющим отношения к словам. Отбор выполняется по иным требованиям и позволяет сократить количество подобранных ссылок до минимума.

Первое, что предлагается в качестве дополнительного ограничения, — язык документа (страницы). Хотя Яндекс проводит индексирование сайтов только русскоязычной части Интернета, здесь также могут встречаться сайты и документы на разных языках. По умолчанию для поиска язык сайта или документа не важен (например, слово computer может встречаться как в текстах на русском, так и в текстах на английском языке). Если же вас интересуют тексты (страницы сайта, документы) только на определенном языке или группе языков, используйте опцию выбора языка. Можно выбрать определенный язык, а можно, используя клавиши <Shift> или <Ctrl>, выбрать несколько.

Во многих случаях важно не только наличие страницы или документа, но и дата их создания. К примеру, вы ищете новую информацию об Испании, куда хотели бы поехать в отпуск. Вам нужны публикации за последний месяц. Используя второй элемент настройки — дата, установите необходимый период. Это могут быть последние две недели, месяц, три месяца или год. Впрочем, совершенно не обязательно использовать эти предварительные настройки — вы можете установить и собственный период для отбора.

К сожалению, необходимо отметить, что отбор документов по времени работает плохо. И связано это не с особенностями поисковой машины. Отнюдь. Яндекс прекрасно понимает дату создания документа, получая ее из его свойств, и дату публикации или изменения страницы на сайте. Беда в другом. Далеко не все серверы выдают правильную дату документа или страницы. Это первое. А второе заключается в том, что на обновленной странице, где размещаются тексты, новости, объявления, дата самого текста может быть очень давней, а дата публикации страницы из-за публикации новостей, новой. Поэтому я бы не очень доверял использованию данной настройки.

Впрочем, этой настройке в большей степени можно доверять в том случае, когда вы ищете только документы, исключая поиск страниц. Яндекс понимает документы, созданные в нескольких форматах: HTML, PDF (Adobe Acrobat Reader), RTF, DOC (Microsoft Word), PPT (PowerPoint), SWF (Macromedia Flash). Если вас интересует несколько определенных форматов, удерживая клавишу <Shift> или <Ctrl>, выберите нужные.

Неплохая возможность есть для тех, кто разместил в Интернете свой сайт или публикацию. С помощью поля содержат ссылку можно указать сетевой адрес сайта или статьи. Результатом будет список страниц и документов, в которых, помимо ключевых слов, будет и указанная ссылка. Результаты поиска помогут увидеть заинтересованность в материалах вашего сайта или публикации. Но не надо думать, что все заинтересованные посетители будут ставить на вас ссылки. Поэтому к итогам надо относиться очень аккуратно и доверять им только как к определенному показателю, не более того.

Вы можете еще более ограничить область поиска, если укажете перечень сайтов, на которых нужно будет искать информацию. Заполните поле находятся на сайте перечнем сайтов (через запятую), и Яндекс будет проводить поиск только по их материалам. Эту особенность можно использовать и в том случае, если вам известен интересный сайт с полезной информацией, но не имеющий функции поиска. Введите в поле находятся на сайте его адрес, и Яндекс выдаст результаты по одному сайту. Не следует забывать, что владельцы сайта могли поставить запрет на индексирование определенных страниц или разделов сайта, поэтому в результатах могут быть приведены далеко не все страницы, содержащие разыскиваемую информацию.

Примечание

В документации к разделу расширенный поиск говорится о том, что должно быть еще одно поле — не находятся на сайте. Служит оно для противоположной цели — исключить из результатов поиска один или несколько сайтов. Но на странице расширенного поиска это поле отсутствует.

Поиск "по образцу" заключается в том, что вы вносите в поле похожи на страницу адрес документа, для которого хотели бы найти подобные материалы. В результате вы получите список страниц и документов, содержащих искомые слова и подобные предложенному вами образцу. По своему действию эта настройка подобна ссылке Похожие документы в результатах поиска.

И еще одно ограничение, которое вы можете наложить на выдачу результатов поиска. Заключается оно в том — на сайтах какого региона требуется искать результаты. Для этого введите в поле регион название города, области, государства. В результатах вашего запроса будут ссылки на документы и сайты, находящиеся в этом регионе. Но не все так однозначно. Будут пропущены сайты, владельцами которых являются организации или жители данного региона, но реально размещенные на хостингах, находящихся далеко за его пределами. Примеров таких множество. И наоборот. В результаты попадут сайты, совершенно не связанные с нужным регионом, но находящиеся на площадках компаний, предоставляющих услуги хостинга в нужном вам регионе.

По мере формирования условий поиска, выбранные назначения отображаются в нижней части страницы в поле после слова Итого. Те параметры, которые не изменялись, в итоговое выражение не включаются.

Итак, подведем небольшие итоги. С помощью расширенного поиска вы можете наложить ограничение на взаимное расположение слов в документе, их нахождение в отдельных его элементах, ограничить используемый язык документа, время создания или изменения, тип, регион и диапазон просматриваемых сайтов. Чем точнее вы сможете наложить ограничения, тем меньше и точнее будет сформированный результат поиска. Да, времени на подготовку запроса уйдет заведомо больше, чем при обычном запросе. Зато время на просмотр результатов существенно сократится.

И последнее, поскольку речь зашла о результатах. На странице настроек расширенного поиска вы можете назначить количество ссылок в результатах, которые будут выводиться на одной странице. Кому-то может быть достаточно того количества, которое предлагается по основным настройкам, а кому-то необходимо, чтобы это количество было больше или меньше.

1.3.3. Язык запросов

Для того чтобы Яндекс корректно понимал запросы, состоящие из нескольких слов, был разработан специальный язык запросов. Отдельные его элементы мы уже рассмотрели — это и специальные символы, используемые в обычном поиске, и дополнительные параметры, которые применяются при расширенном поиске. Но язык запросов содержит и иные команды, используемые для еще более точного формирования поискового выражения.

Взаиморасположение слов в документе

Когда в запросе указывается несколько слов, Яндекс самостоятельно определяет, на каком максимальном расстоянии должны находиться эти слова, чтобы искомая страница лучше отвечала на запрос. Но у вас есть возможность самим указать требования к расстоянию. Об этом мы уже говорили ранее, а теперь добавим к сказанному информацию по другим операторам.

Когда слова идут подряд

Самый простой способ — поместить эти слова в кавычки, например: "кому на Руси жить хорошо". В результате будут приведены ссылки на страницы, на которых встречается это выражение с указанным порядком слов.

Когда слова должны находиться в одном предложении

Наложить это ограничение на результаты поиска можно с помощью оператора &, поставив его между словами поиска. Например, если в запросе задать слова политика & России, среди результатов окажутся страницы, на которых эти слова могут содержаться в выражениях: "политика современной России", "политика России в XIX веке" и др.

Когда слова должны быть в одном документе

Вы не всегда знаете, могут ли находиться в одном предложении выбранные слова. Но желательно, чтобы они были хотя бы в одном документе. Добиться этого можно с помощью оператора &&. Поставьте его между необходимыми словами, и Яндекс найдет документы, где слова расположены в одном документе, неважно на каком расстоянии друг от друга.

Пример

Если в запросе ввести слова доставка & пицца && Казань, то будут найдены страницы, на которых слова "доставка" и "пицца" будут расположены в одном предложении, а где-то на странице будет слово "Казань".

Определяем порядок слов

Как было показано ранее, определив расстояние между словами, мы не можем сказать, в какой последовательности они должны появляться на странице или в документе. Исправить этот недостаток можно с помощью других операторов.

Слова следуют в определенном порядке на нужном расстоянии

Если требуется найти слова, расположенные строго на определенном расстоянии друг от друга (расстояние определяется количеством иных слов, расположенных между искомыми), применяется оператор /. Сразу после него записывается знак + для прямого порядка, и знак — для обратного следования слов, а после знака — число, показывающее, на каком месте после первого слова должно располагаться второе.

Пример

Если вы хотите вспомнить, как звали отца Татьяны Лариной, задайте вопрос Татьяна /+2 Ларина. В результатах поиска будут приведены страницы, на которых между словами "Татьяна" и "Ларина" находится еще одно слово. Имейте в виду, что знаки, которые могут находиться между словами, в расчет не берутся. Например, среди результатов была ссылка на страницу, содержащую текст: "Отец Татьяны — Дмитрий Ларин".

Слова расположены в заданной окрестности

Не всегда ясно, на каком расстоянии по отношению к первому, должно находиться второе слово. И где — до первого слова или после него. В этом случае можно применить другой оператор. В нем указывается минимальное и максимальное количество слов между первым и вторым словами запроса. Выглядит оператор так: /(n m). Используя знаки + и — вы укажете помимо расстояния, еще и расположение слов друг относительно друга.

Пример

Запрос крокодилы /(-2 +2) Амазонки найдет как страницы с текстом "Амазонка кишит крокодилами", так и "крокодилы в Амазонке".

Поиск любого из предложенных слов

В ряде случае необходимо найти страницы, содержащие один из возможных вариантов названия какого-либо предмета или явления. Причем вы точно не знаете, какой из вариантов использовался в интересующей вас статье. В этом случае вы можете перечислить все возможные синонимы, поставив между ними символ |. Результат поиска выдаст страницы, содержащие хотя бы одно из заданных слов.

Пример

Запрос печь | камин | обогреватель | чувал найдет страницы, где встречается хотя бы одно из этих слов.

Исключение слов из поиска

В ряде случаев вам заранее известно, что ответ на ваш запрос сформирует список ссылок, многие из которых вам не нужны. Но вы можете предположить, что ненужные ссылки будут содержать, помимо основного слова вашего запроса, дополнительные слова. Используя оператор —, можно заранее исключить ненужные страницы. Для этого слева от оператора запишите требуемое слово, а справа — слово, при наличии которого страницы будут исключены из результата поиска.

Пример

Вы хотите узнать, с чем, помимо автомобиля, связано слово "Таврия". В этом вам поможет запрос таврия ~~ (компания | машина | запчасти), максимально исключивший из результатов все, что связано с автомобилями.

В ряде случаев требуется исключить из поиска устоявшиеся выражения, в которых определенные и нужные вам слова находятся в одном предложении. Вам же требуется, чтобы были все указанные вами слова, но они были бы в разных предложениях. Ничего сложного, просто используйте оператор ~.

Пример

Если вы ищете информацию о г-же Кузькиной, то более информативные результаты даст запрос Кузькина ~ мать, который ищет страницы со словом "Кузькина", исключая страницы, где в одном предложении с ним есть слово "мать".

Усложняем запросы

А теперь хотелось бы напомнить вам об основах даже не математики, а арифметики. Что применяется для определения последовательности выполнения арифметических действий? Совершенно верно — круглые скобки. Так и в поисковой системе Яндекс вы можете применять круглые скобки для создания каких угодно сложных поисковых выражений.

Учет морфологии

Вспомним то, о чем мы уже говорили. Яндекс ищет все слова, включенные в запрос, с учетом морфологии. Если вы хотите отключить ее, перед нужным словом поставьте оператор!. Помните, что между оператором и словом пробела быть не должно.

Пример

Если вы ищете документы, в которых должно быть слово "громоотводящий", наберите его в строке поиска и поставьте перед ним восклицательный знак —! громоотводящий. Если восклицательный знак не поставить, то в результаты попадут документы, в которых искомое слово выглядит совершенно иначе: "Вот пускай и громоотводит".

Если одна или несколько форм слова совпадают с другими словами, поиск может находить лишние страницы. Указав нормальную форму слова с помощью оператора!! вы уберете многие из ненужных страниц.

Вне зависимости от формы слов, Яндекс воспринимает слова, набранные с большой и маленькой буквы, по-разному.

Дополнительные операторы

Кроме операторов, о которых уже было сказано, есть и другие, применяемые для выполнения запроса в определенных элементах страницы, либо в связанной со страницей информации. Среди них хотелось бы обратить внимание на следующие.

□ Оператор: site: — осуществляет поиск в пределах домена и всех его поддоменов.

Пример

Вывести все документы с домена domain.com, а также его поддоменов: site: domain.com.

□ Оператор: hostname: — выполняет поиск в указанном домене или субдомене.

Пример

Вывести все документы с поддомена news.domain.com: hostname: news.domain.com.

□ Оператор: intitle: — выполняет поиск по заголовкам документов.

Пример

Вывести все документы, в заголовке которых содержатся слова "каталог ссылок". Решение — intitle: каталог ссылок.

□ Оператор: link: URL — выводит документы, ссылающиеся на указанный URL.

Пример

link: http://www.domain.com/news.html.

В табл. 1.4 приведены эти и другие операторы языка запросов. Источник: http://help.yandex.ru/search/?id=481939.

1.4. Настраиваем домашнюю страницу

Как выглядит домашняя страница Яндекса (рис. 1.3), знают все, кто пользуется его сервисами. Но знаете ли вы, что ее можно видоизменить, настроить в соответствии с собственными интересами? Кого-то совершенно не интересует работа с каталогом, другим хотелось бы видеть на домашней странице новостные блоки, у третьих особые требования к выводу результатов поиска. Нет ничего сложного в том, чтобы настроить страницу "под себя". Как это делается, мы сейчас и разберем.

1.4.1. Для незарегистрированных пользователей

В верхней строке домашней страницы Яндекса есть ссылка Настройка. Щелкнув на ней, мы попадаем на страницу настройки. В центре размещен скриншот текущей настройки, а если изменения не проводились, то скриншот ее стандартного представления. Над изображением страницы — выбор региона. Слева от скриншота расположены кнопки переключения на пять типовых настроек — Стандартная, Газета, Навигационная, Поисковая, Новостная. Под скриншотом размещены кнопки Применить, Настроить, Сброс. Правая часть страницы отдана под блок дополнительных настроек, с помощью которых можно изменить параметры вывода результатов поиска, показа прогноза погоды, телепрограммы, афиши, настроить персональные службы.

Выполненные настройки могут быть сохранены несколькими способами. Первый заключается в использовании cookies и предназначен для служб, не требующих авторизации. Cookie — это небольшой текстовый файл, передаваемый сервером браузеру. При подключении браузера к серверу, выдавшего ему cookie, он будет передавать его серверу с каждым запросом как часть HTTP-заголовка. Срок хранения cookie зависит от настроек сервера. Одни из них действуют в течение одной сессии и удаляются после закрытия браузера. Другие сохраняются в виде файла и действуют в течение некоторого времени. Так сохраняется и cookie от Яндекса. У меня этот файл называется michael@yandex.txt и сохранен в рабочем каталоге используемого браузера.

Примечание

Для браузера MS IE в операционной системе Windows 2000 cookies находятся в папке [disk]: \Documents and Settings\[user]\Cookies.

Внимание

Если вы имеете на одном компьютере несколько браузеров, каждый из них будет использовать собственные полученные им cookies.

Сами по себе cookies не могут делать ничего, но когда пользователь обращается к серверу (набирает его адрес в строке браузера), сервер может считывать информацию, содержащуюся в cookies, и на основании ее анализа совершать какие-либо действия. Например, в случае с домашней страницей Яндекса — формировать ее в соответствии с вашими настройками.

Файл с настройками хранится на компьютере, поэтому если вы будете подключаться к Яндексу с другого рабочего места, ваши настройки будут недоступны, и вам придется выполнять их заново. Аналогичная проблема возникает и при использовании различных браузеров.

Примечание

При использовании надстроек к браузеру, например Maxthon для MS Internet Explorer, используются cookies, находящиеся в рабочей папке MS IE.

Как включить "куки" в различных браузерах

□ Internet Explorer 4 — в меню View (Вид) выберите пункт Internet Options (Свойства обозревателя) и откройте вкладку Advanced (Дополнительно). Установите флажок Always accept cookies (Всегда принимать cookies).

□ Internet Explorer 5 — в меню Tools (Инструменты) выберите пункт Internet Options (Настройки Интернета) и откройте вкладку Security (Безопасность). Выберите зону Internet (Интернет) и в ней опцию Custom Level (Персональные настройки). Установите для опции Allow cookies that are stored on your computer (Все cookies сохраняются на вашем компьютере) флажок Enabled (Включить).

□ Internet Explorer версии 5.ххх — в меню Tools (Сервис) | Internet Options (Свойства обозревателя) выберите вкладку Security (Безопасность), в области Уровень безопасности нажмите на кнопку Custom Level (Другой), найдите пункты Allow cookies that are stored on your computer (Разрешить использование файлов cookie) и Allow per-session cookies и установите флажки Enable (Включить).

□ Internet Explorer 6 — в меню Tools (Сервис) выберите Internet Options (Свойства обозревателя), откройте вкладку Privacy (Конфиденциальность) и нажмите на кнопку Advanced (Дополнительно). Установите флажок Override automatic cookie handling (Перекрыть автоматическую обработку файлов cookie) и оба флажка Accept (Принимать).

□ Mozilla 1.6 и выше — в меню Edit (Редактирование) выберите пункт Preferences (Настройки) | Privacy & Security (Конфиденциальность и безопасность) и в разделе Cookies (Временные настройки) отметьте Enable All Cookies (Загружать все временные файлы) или Enable cookies based on privacy settings.

□ Firefox 1.0 и выше — в меню Tools (Инструменты) выберите пункт Options (Настройки) | Privacy (Конфиденциальность), раздел Cookies (Временные настройки). Отметьте Allow sites to set cookies.

□ Opera 7.53 и выше — в меню Tools (Инструменты) выберите пункт Preferences (Настройки), раздел Advanced (Дополнительно). Зайдите в пункт Cookies (Временные настройки) и выберите Accept all normal cookies (Принимать все cookies).

□ Netscape — в меню Edit (Редактирование) выберите пункт Preferences (Настройки). Зайдите в Advanced (Расширенные настройки) и в разделе Cookies (Временные настройки) отметьте Accept All Cookies (Загружать все временные файлы).

1.4.2. Для зарегистрированных пользователей

Второй способ сохранения настроек доступен, если вы являетесь зарегистрированным пользователем Яндекса. Привязка к регистрации позволит вам восстанавливать настройки служб в случае их утраты, или когда они вам понадобятся на другом компьютере или в другом браузере. Для сохранения настройки зарегистрируйтесь, перейдите на страницу сохранения-восстановления и нажмите кнопку Сохранить. Для восстановления или использования сохраненной настройки, перейдите на эту же страницу и нажмите кнопку Восстановить.

Сохранение и восстановление настроек действует для следующих служб:

□ главная страница Яндекса — общий вид страницы и состав отдельных блоков;

□ Погода — город и степень подробности прогноза;

□ Афиша — город и любимые места;

□ Телепрограмма — регион вещания и список каналов;

□ Новости — основной регион;

□ Словари — основной язык для перевода, способ показа транскрипции, наличие экранной клавиатуры;

□ Деньги — город и способ оплаты;

□ Лента — состав информеров;

□ персональные индикаторы — показывать их или не показывать.

Настройки служб, требующих авторизации, сохраняются на сервере и вступают в силу сразу после регистрации пользователя.

1.4.3. Настройка региона

Многие службы Яндекса умеют формировать информацию с учетом региона проживания пользователя. На главной странице это заметно по прогнозу погоды, программе телепередач и афише, а в результатах поиска есть возможность выбора документов с сайтов своего региона.

Значение региона посетителя определяется по значению IP, с которым он зашел на Яндекс. Во многих случаях это оправданное решение, но встречаются посетители, чей регион и регион провайдера, через которого он работает, существенно различаются. В этом случае посетителю будет выведена информация, соответствующая региону его провайдера. Такая выдача информации не является корректной, поэтому в настройках предусмотрена возможность самостоятельного назначения региона (рис. 1.4).

Перейдя по ссылке Ваш регион, в первую очередь необходимо снять флажок по умолчанию — на основе ip. Этот флажок установлен в том случае, если до этого никакие настройки не осуществлялись. Выбор города можно выполнить двумя путями:

□ поиском, для чего в поле поиск по названию надо ввести несколько первых букв и выбрать требуемый город из числа предложенных;

□ пройтись по "дереву регионов" в правой части формы. Последовательно выбирайте регион (Россия, СНГ, Азия и т. д.), федеральный округ для России или государство, в ином случае область и город, расположенный в этой области.

После завершения выбора нажмите кнопку Сохранить. Выбранный город будет записан крупным шрифтом в верхней части формы и сохранится на вашем компьютере. Ваш выбор будет использоваться при формировании региональной информации аналогично городу, определенному автоматически.

Примечание

Ручной выбор города можно использовать для формирования информационных блоков, соответствующих данному региону. Это может быть удобным для подготовки к поездке в незнакомый город.

Назначить определенный город можно и для отдельной службы. Такое изменение не будет сказываться на других службах, но информационный блок этой службы на главной странице Яндекса покажет информацию для назначенного в ней региона (погода, афиша, телепрограмма).

1.4.4. Настройка главной страницы

Типовые формы главной страницы

Что вы хотите видеть на главной странице, когда входите на Яндекс? Вам доступно пять типовых вариантов ее оформления.

Вариант Стандартная

В верхней части страницы — пятерка последних новостей, взятых из новостной ленты Яндекса. Ниже размещена панель поиска, включающая строку ввода, кнопку переключения в расширенный режим, строку ссылок для перехода поиска в один из специализированных разделов — Новости, Маркет, Адреса, Блоги, Словари, Картинки. В этой же строке кнопка перехода на страницу, где размещены ссылки на все службы Яндекса.

Ниже панели поиска размещено два блока. Один из них — ссылки для перехода в разделы каталога сайтов. Во втором блоке представлена региональная информация — прогноз погоды, афиша, телепрограмма, котировки валюты. В нижней части страницы размещены ссылки на наиболее востребованные службы Яндекса.

В "подвале" страницы, помимо ссылок на информацию о компании, разработчиках и дизайнерах, размещена еще одна полезная ссылка — русская клавиатура. Ее могут использовать те посетители Яндекса, чьи компьютеры не поддерживают русскую раскладку. Щелчок на ссылке приводит к появлению под панелью поиска изображения клавиатуры с русскими буквами (рис. 1.5), пользоваться которой можно с помощью указателя мыши.

У виртуальной клавиатуры есть несколько отличий от настоящей. Вы можете изменить раскладку (размещение) букв на клавиатуре с обычной (qwerty) на раскладку по алфавиту. Добавлено несколько кнопок — выделить все и стереть все. Добавлена и специальная кнопка Я (не надо путать ее с кнопкой буквы я. Щелчок на этой дополнительной кнопке отменяет вывод виртуальной клавиатуры.

Осталось сказать про самую верхнюю строку главной страницы Яндекса. Здесь размещено несколько важных ссылок:

Сделать Яндекс стартовой страницей;

Помощь;

Настройка;

Зарегистрироваться;

Войти в почту.

Нажав на первую кнопку, вы назначите домашнюю страницу Яндекса в качестве начальной страницы вашего браузера, и при его запуске автоматически будете к ней подключаться. Ссылки Помощь и Настройки в пояснении не нуждаются. Ссылка Зарегистрироваться приводит на страницу регистрации на Яндексе. А ссылка Войти в почту предназначена тем, у кого есть здесь свой почтовый ящик. Если вы зарегистрируетесь на сайте, то вместо ссылки Войти в почту появятся ссылки Написать письмо, переход на страницу личных данных пользователя и кнопка Выход.

Коротко о прочих вариантах

Газета — отличие от стандартного варианта настройки состоит в отсутствии блока разделов каталога.

Навигационная — в этом варианте главной страницы отсутствует региональный блок. Зато есть блок разделов каталога.

Поисковая — максимально облегченная страница. На ней размещается только панель поиска и блок ссылок на наиболее востребованные сервисы Яндекса.

Новостная — верхний блок новостей находится на своем месте, но под панелью поиска размещение информации изменилось. Теперь региональный блок размещен в левой части страницы, а основную ее часть под панелью поиска занимает лента тематических новостей, в т. ч. новости спорта, культуры, Интернета.

Дополнительные настройки

Кроме выбора одной из основных форм домашней страницы Яндекса, вы можете сделать дополнительные настройки. Для каждой формы дополнительные настройки несколько отличаются друг от друга, что зависит от тех информационных блоков, которые на них присутствуют.

Вариант Стандартная

Для этой формы в качестве дополнительных настроек можно добавить индикатор писем, изменить формат вывода рубрик каталога, изменить настройки вывода котировок валюты, афиши и программы телевидения.

Выберите на странице Настройки форму Стандартная и нажмите на кнопку Настроить. Откроется новая страница, с помощью которой выполняются дополнительные настройки.

□ Если вы поставите флажок Показывать индикатор новых писем, то на домашней странице рядом со ссылкой Написать письмо появится ссылка Почта, рядом с которой будет показано количество новых непрочитанных писем.

□ В блоке ссылок на разделы каталога по умолчанию показаны все разделы верхнего уровня и названия отдельных разделов второго уровня. Кроме того, здесь же размещена ссылка на раздел Маркета. Настройка этого блока заключается в том, что вы можете отключить вывод разделов Маркета, а также включить вывод всех разделов второго уровня.

□ Настройка информера погоды заключается в возможности выбора региона для этого информационного блока, не изменяя данных о вашем регионе для остальных сервисов Яндекса.

□ Котировки — вы можете вывести на главную страницу от 1 до 6 различных котировок. В предлагаемом списке котировок курсы валют, сведения о работе биржи (РТС, ММВБ), курсы акций, курсы валют на бирже Украины. Для выбора котировок, которые вам необходимы, отметьте их в левом списке и нажмите на кнопку Добавить. Выбранные котировки будут помещены в правую колонку и будут выведены на главной странице. Дополнительно вы можете установить точность показываемых данных (две или четыре цифры после запятой).

□ Настройка информера Афиша выполняется аналогично настройке погоды. Разница лишь в том, что сведения о культурных и иных событиях для многих регионов отсутствуют.

□ Настройка программы телепередач также заключается в выборе региона, поскольку от него зависит набор доступных телеканалов. Регион для программы передач можно назначить независимо от региона, выбранного вами для других разделов Яндекса (как и для погоды).

□ После выбора региона (либо при использовании региона, установленного в ваших личных настройках), будет показан список доступных телеканалов. Вы можете выбрать интересующие вас и поместить их в список выбранных. Далее можно установить, какое количество передач одновременно будет показано в блоке телепрограмм на главной странице, определить, требуется ли их сортировка по каналам и надо ли выводить не только названия, но и более полные описания передач.

Выполнение настроек завершается либо их принятием (требуется щелкнуть на кнопке Сохранить), либо отменой (кнопка Сбросить).

Коротко о настройках прочих вариантов

Газета — эта форма главной страницы заключается в отсутствии настроек блока Каталога. Все остальное полностью соответствует настройкам формы Стандартная.

Навигационная — в этой форме отсутствует региональный блок. Поэтому настройка заключается только в установке информера новых писем и структуры каталога.

Поисковая — самая простая форма главной страницы допускает добавление только информера новых писем. Все остальные настройки недоступны.

Новостная — вместо настройки отображения структуры каталога, здесь присутствует настройка блока Новости. В списке доступных рубрик представлены все возможные новостные темы, а также региональные новости (но не по всем регионам России) и новости Украины и Израиля. Как и в случае настройки программы передач, перенесите интересующие вас рубрики в список Выбранные, но не забудьте, что количество выбранных рубрик не должно превышать пяти. Дополнительная настройка новостей заключается в назначении количества показываемых заголовков. Доступно три варианта:

• не более 3;

• не более 5;

• не более 7.

При выборе количества телепрограмм и новостных рубрик не забудьте, что при большом количестве информации они не будут умещаться на одном экране и для их просмотра придется экран прокручивать.

Настройка дополнительных страниц

Помимо выбора и настроек типовых форм, есть возможность настроить страницы отдельных разделов, таких как:

□ прогноз погоды;

□ афиша;

□ телепрограмма.

Настройка этих разделов (рис. 1.6) будет задействована при их просмотре и не повлияет на вывод соответствующих информеров главной страницы.

Настройка страницы прогноза погоды http://weather.yandex.ru/ заключается в выборе своего региона. Впрочем, если погода вашего региона вас почему-то не интересует, можно выбрать и другой. Всего Яндекс показывает прогноз погоды в 1681 городе 227 стран. Данные для прогноза представляются компанией ИА "Метеоновости" (http://www.hmn.ru/).

Афиша http://afisha.yandex.ru/ по сравнению с другими информерами охватывает крайне незначительное количество российских городов. В списке доступных 16 городов России и Киев. Рассчитывать, что здесь вы найдете информацию о различных культурных и спортивных событиях именно своего города, большинству пользователей не приходится.

Для настройки информационной страницы о событиях культурной и спортивной жизни, выберите интересующий вас город. Если для выбранного города информация отсутствует, Яндекс вас предупредит. Что ж, возможно, через некоторое время в Яндексе будет информация и о вашем городе. А пока посмотрим, что предлагается по Москве.

После выбора города вам будет доступно два списка. В одном перечень групп культурно-спортивных центров (кинотеатры, спортзалы, клубы). После выбора одной из групп во втором списке будет показан список развлекательных заведений, относящихся к этой группе. Пролистывая список, найдите интересующие вас заведения. Обратите внимание, что с правой стороны этого списка размещено несколько букв — они используются для быстрого перехода. К примеру, список кинотеатров Москвы довольно большой, но, щелкнув на букве м, вы можете перейти сразу к первому кинотеатру, чье название начинается с "М".

Отмеченный кинотеатр (либо другое развлекательное заведение) вы можете перенести, нажав на кнопку Добавить, в список выбранных заведений. Для удаления выбранного заведения из списка выбранных нажмите на кнопку Удалить. Добавлять или удалять записи можно только по одной. В информере на главной странице будет показана афиша только для выбранных вами развлекательных учреждений. Но это еще не все, что можно делать на странице настройки Афиши. Под кнопкой Удалить есть еще одна кнопка — Посмотреть. Если выбрать заведение и нажать на эту кнопку, откроется новое окно, в котором на карте города будет показано расположение этого заведения.

Настройка телепрограммы также несколько отличается от ее настройки в рамках той или иной формы главной страницы. Но основа остается той же — список доступных каналов зависит от выбранного вами региона. Поэтому первое, что необходимо сделать — выбрать регион. После этого в нижней части страницы обновится список доступных телеканалов. Они разделены на несколько групп:

□ центральные;

□ дециметровые;

□ региональные;

□ спутниковые.

Отметьте флажками те каналы, информацию о программах которых вы хотели бы видеть. В отличие от аналогичной настройки информера главной страницы, здесь отсутствуют ограничения по количеству выбранных каналов. Можете выбрать хоть все доступные. Эти настройки будут действительны для специальной страницы Яндекса — ТВ программа http://tv.yandex.ru/.

Примечание

Подобно настройкам главной страницы настройки отдельных информационных страниц также сохраняются либо через cookie, либо за счет привязки к вашему логину на Яндексе. Чтобы сделать такую привязку, авторизуйтесь через любой используемый вами сервис. После завершения настройки тематической страницы выберите в нижней части страницы настройки ссылку Если вы хотите использовать настройки на любом компьютере, свяжите их со своим логином на Яндексе.

1.4.5. Регистрация на Яндексе

В описании настроек и возможностей их хранения мы неоднократно говорили о том, что для упрощения доступа к настройкам с любого компьютера их удобнее хранить не локально, а на самом Яндексе, связав со своим логином. Настала пора разобраться, как и для чего регистрируются на Яндексе.

Зарегистрироваться на Яндексе очень просто. Найдите в верхней строке главной страницу ссылку Зарегистрироваться. Она приведет вас на страницу регистрации в сервисе персональных данных Паспорт http://passport.yandex.ru/. Эти данные после регистрации могут быть использованы для получения почтового ящика на mail.yandex.ru, пространства для собственного сайта на Народе, чтении RSS-потоков, в ряде иных сервисов.

Процесс регистрации разбит на два шага. На первом от вас требуется только ввести логин, под которым вы хотите присутствовать на сервисах, и заполнить сведения о своем имени и фамилии. Логин должен состоять из символов A-z, 0–9, -, начинаться с буквы, заканчиваться буквой или цифрой и содержать не более 20 символов. Компания Яндекс обязуется не разглашать эти сведения и хранить их в соответствии с Соглашением о конфиденциальности информации (http://rules.yandex.ru/confidential.xml).

Если придуманный вами логин еще никто на сервисах Яндекса не использует, вы переходите ко второму шагу. Но что будет, если ваш логин уже занят? В этом случае и может пригодиться внесенная вами на первом шаге информация. На основе ваших данных служба регистрации попытается сформировать для вас подборку логинов, никем пока еще не занятых. Это может быть ваш логин, к которому будет добавлена цифра, либо число, обозначающее текущий год. Логин может быть сформирован на основе объединения ваших полных значений имени и фамилии либо их частей.

Вполне возможно, что один из вариантов вас вполне устроит. Тогда щелкните на нем мышью и переходите к шагу 2. Если варианты неинтересные, и вам они не нравятся, повторите попытку регистрации, введя для себя новый логин. После успешной проверки логина на его отсутствие на сервисах Яндекса вы перейдете к шагу 2.

Теперь вам потребуется ввести еще небольшую порцию информации. Начинается она с ввода пароля. Правильный подбор пароля очень важен, поскольку только он защищает вашу регистрацию на Яндексе. И если вы вдруг почувствуете, что кто-то получил доступ к вашим данным — немедленно меняйте пароль.

Пароль не должен содержать менее 4 символов, не может совпадать с логином. Может состоять из заглавных и прописных латинских букв, содержать цифры и элементы пунктуации. Это не должен быть простой пароль, который очень легко подобрать простым перебором, например, "12345", "qwerty", "internet" или что-то подобное. Никогда не применяйте в качестве пароля свое имя или фамилию, день рождения или номер телефона. Не рекомендуется использовать имена и обычные существительные.

И еще. Пароль, каким бы сложным он ни был, должен легко запоминаться. Удачным способом можно назвать вариант, когда выбирается русское слово или словосочетание и записывается в английской раскладке клавиатуры. Например, пароль "двенадцать" в английской раскладке будет выглядеть так: "ldtyflwfnm". Получился набор букв, который невозможно запомнить или подобрать. Почему рекомендуется легкозапоминаемый пароль? Вам не потребуется его где-то записывать, и никто не сможет его узнать, даже просматривая ваши бумаги или данные на компьютере.

Как обычно, после ввода пароля требуется его повторный ввод для подтверждения правильности. А для особо забывчивых рекомендуется использовать контрольный вопрос. Он может оказаться полезным, если вы забудете пароль доступа к сервисам Яндекса. Есть возможность использовать один из предлагаемых вопросов:

В следующем поле вы можете ввести уже имеющийся у вас адрес электронной почты, на который будет выслан запрос на подтверждение. (Правила использования этого адреса описаны в разделе Конфиденциальность Пользовательского соглашения.)

Для чего добавлено поле, в котором вам предлагается ввести номер своего мобильного телефона? С его помощью вы сможете восстановить свой забытый пароль, получив SMS-сообщение с кодом на этот номер. После внесения номера своего телефона необходимо пройти процедуру подтверждения. Это делается для того, чтобы Яндекс был уверен в правильности введенного номера. Сама процедура подтверждения заключается в том, что вам будет отправлено SMS сообщение с числовым кодом подтверждения. Этот код необходимо ввести на странице Мои телефоны в поле для подтверждения рядом с номером телефона. Время доставки сообщения зависит от оператора вашей сети и обычно составляет несколько минут (максимальное время доставки сообщения 24 часа).

Номер телефона должен быть набран в формате +1 234 567 89 01. Поддерживаются номера телефонов всех основных операторов России, стран СНГ, Европы, Ближнего и Дальнего зарубежья. На странице http://help.yandex.ru/ passport/?id=989255 приведен перечень всех поддерживаемых операторов, вы можете с ним ознакомиться.

Важно!

В том случае, если вы вводите номер, на который уже высылался код подтверждения, сообщение на него отправлено не будет — на один и тот же номер нельзя высылать несколько кодов подтверждения.

И последнее поле, которое требуется заполнить, предназначено для ввода контрольного числа. Это сделано для защиты от автоматической регистрации с помощью программ-роботов. Контрольное число показывается в виде графического изображения, поэтому при входе в режим регистрации убедитесь, что у вас в браузере включена загрузка графики. Теперь остается нажать кнопку OK, и вы становитесь зарегистрированным пользователем.

Платежный пароль

В ряде случаев, помимо обычного пароля для авторизации на Яндексе, требуется специальный платежный пароль. Он необходим для работы с сервисом Яндекс. Деньги. Этот пароль обладает несколькими отличительными свойствами:

□ передается по защищенному соединению (используется протокол SSL), что исключает возможность его перехвата;

□ после авторизации на сервисе в случае вашей неактивности в течение 15 минут авторизация автоматически пропадает, даже если окно браузера не закрыто. Это сделано для того, чтобы никто во время вашего отсутствия не смог получить доступ к вашей конфиденциальной информации и денежным средствам.

Требования к платежному паролю для обеспечения его надежности предъявляются повышенные. Он должен включать не менее шести (для обычного пароля — не менее четырех) символов.

При заведении платежного пароля от вас потребуется ввести дополнительную личную информацию:

□ адрес электронной почты. После ввода всех данных на этот адрес будет выслано письмо с просьбой о подтверждении. От вас потребуется перейти по указанной в письме ссылке, после чего дееспособность пароля будет подтверждена;

□ кодовое число;

□ телефон;

□ дата рождения.

Эта информация может быть востребована для вашей идентификации, если вы забудете свой платежный пароль и вам потребуется новый.

Есть еще один блок данных, которые вам желательно было бы заполнить. Это — сведения о документе, подтверждающем вашу личность. Они потребуются, если вы не сможете восстановить забытый пароль и вам придется обращаться в компанию Яндекс для получения нового. Кроме того, эти данные потребуются для вывода ваших денежных средств из кошелька.

Платежный пароль можно использовать не только для доступа к сервисам с повышенной степенью защиты, но и для обычной авторизации (доступа к почтовому сервису, подпискам и т. д.). С одной стороны, это проще — не надо запоминать два разных пароля. С другой — при авторизации на сервисах, не связанных с денежными средствами, пароль передается по открытым, незащищенным каналам, что может привести к его перехвату.

Если у вас появится подозрение, что вашим платежным паролем кто-то воспользовался, немедленно измените его. Для этого после авторизации зайдите в раздел Платежные данные и, пройдя по ссылке Изменить платежный пароль, в предложенной форме введите старый и новый платежные пароли.

А что делать, если вы вдруг забыли платежный пароль? Придется обратиться к помощи Яндекса для получения нового пароля (старый пароль вам никто не восстановит и не пришлет). Сделать придется следующее:

1. Зайдите на страницу ввода платежного пароля. На ней есть ссылка Вспомнить платежный пароль.

2. На указанный вами при регистрации пароля почтовый адрес будет выслано письмо со ссылкой.

3. Получив письмо, пройдите по указанной ссылке. Но ни в коем случае не открывайте присланную вам ссылку, если только инициатором ее получения были не вы.

4. На странице, куда вы попадете, введите контрольную информацию и новый платежный пароль.

5. К контрольной информации относятся ранее введенные данные:

• кодовое число;

• телефон;

• дата рождения.

6. Если введенные данные будут соответствовать введенным при формировании забытого пароля, система заменит его на вновь введенный.

При вводе контрольной информации будьте особо внимательны — для исключения возможности подбора данных предоставляется всего 4 попытки. В том случае, если все попытки были неверными, возможность автоматической замены пароля будет заблокирована. В этом случае остается единственный вариант — написать в службу поддержки компании Яндекс и прибыть туда лично. Все же деньги — это деньги, и компания заботится об их сохранности.

1.4.6. Авторизация

А теперь о том, как авторизоваться и что нужно при этом помнить. Самый простой способ авторизации — с главной страницы войти в почтовую систему Яндекса. Ссылка на вход находится в верхнем правом углу страницы. В форме авторизации два поля — для ввода логина и пароля. Кроме них, есть еще флажок не спрашивать 2 недели. Если вы работаете на личном компьютере, к которому, кроме вас, ни у кого нет доступа, вам будет удобно выбрать эту опцию. Тогда в течение двух недель вы сможете заходить на сервисы Яндекса, требующие авторизации, без ввода логина и пароля. Но через две недели пароль будет запрошен заново.

Если к вашему компьютеру имеют доступ другие пользователи, такой опцией лучше не пользоваться. И желательно не использовать никакие иные режимы запоминания авторизации. В этой ситуации после закрытия браузера информация, вводимая вами в форме авторизации, будет на данном компьютере удалена, и в следующий раз вам потребуется вводить логин и пароль заново. Аналогично действует и щелчок на ссылке Выход, размещенной на страницах Яндекса в верхней строке страницы.

1.4.7. Настройка персональных служб

После регистрации на Яндексе для вас будет доступна еще одна ссылка на странице настроек — Настройка персональных служб. Щелкнув на этой ссылке, вы попадете на сервис Яндекс. Паспорт — страницу Настройка Яндекса. Здесь уже можно настроить те службы и индикаторы, которые связаны с вашей учетной записью.

Начнем с индикаторов. Об одном из них мы уже говорили. Он показывает количество непрочитанных писем в вашем почтовом ящике. Его значение обновляется каждый раз при обновлении любой страницы Яндекса, на которой вы будете находиться. Кроме того, значение индикатора обновляется и без обновления страницы.

Для зарегистрированного пользователя доступно еще два индикатора. Один из них показывает количество новых сообщений в Ленте, другой — доступные средства в кошельке Яндекс. Деньги. Настройка индикаторов заключается лишь в том, чтобы поставить флажок для тех из них, данные которых вы хотели бы видеть на странице Яндекса. Конечно, вы должны понимать, что смысл выводить эти индикаторы на главную страницу есть только в том случае, если у вас есть почтовый ящик, вы настроили свою информационную Ленту и завели кошелек на сервисе Яндекс. Деньги.

Следующие настройки — Почты, фильтрацию спама (использование Спамо-обороны), закладок Каталога, Ленты, регистрацию IP-адреса для XML-запросов — мы рассмотрим в соответствующих разделах.

1.4.8. Настройка результатов поиска

Хотя мы еще не рассматривали процесс формирования результатов поиска, определить, в каком виде они будут выводиться, можно уже сейчас. Ссылка на настройку страницы результатов находится в том же блоке страницы настроек, что и настройка отдельных страниц Яндекса.

Цель выполнения таких настроек — сделать результаты поиска максимально удобными. А понятие "удобство" у каждого свое. Кому-то хотелось бы видеть максимальную информацию о найденном документе, другому достаточно самого минимума. Для одного на странице достаточно показывать десяток первых результатов, а другому хотелось бы просматривать сотню.

На странице все настройки разделены на 4 блока:

□ найденный документ;

□ страница результатов;

□ область поиска;

□ дополнительно.

Информация о найденном документе

Первый блок относится к выводу информации о найденном документе. Все изменения, вносимые вами, немедленно отображаются на примере в правой части страницы. Что можно изменить?

□ Полноту выводимой информации о документе — в число настраиваемых параметров входят адрес страницы (URL), размер документа, дата его создания или обновления, сведения о соответствии найденного документа запросу, ссылка на похожие документы, количество найденных фрагментов.

• Адрес страницы в неявном виде присутствует в заголовке документа, но чтобы его увидеть, необходимо подвести к нему указатель мыши. Но адрес документа можно получить и в явном виде, если включить в результат вывод адреса документа.

Примечание

В заголовок документа подставляется его название, данное автором и заключенное в теги <title>. Если автор не дал своему документу названия, вместо него будет подставлен адрес страницы.

• Дата документа — на мой взгляд, это довольно "скользкий" параметр. Он вполне адекватен документам в форматах офисных программ (MS Word, Excel), в формате PDF, но применительно к веб-страницам дату можно рассматривать лишь в отношении статических страниц.

• Соответствие запросу — эта информация отражает, насколько точно найденный документ соответствует искомому поисковому выражению. Возможны три варианта:

◊ если все слова запроса есть в тексте страницы, статус соответствия не отображается;

◊ если Яндекс считает, что страница соответствует запросу не полностью, но полностью подходящих результатов недостаточно, ссылка на эту страницу также будет включена в число результатов, но с отметкой "нестрогое соответствие";

отметка "найден по ссылке" говорит о том, что на самой странице искомых слов запроса не найдено, но страница обнаружена по ссылке и, возможно, также будет представлять интерес.

• На странице документа может быть найдено несколько вхождений слов запроса. Пользователю предоставляется возможность выбрать, какое количество найденных фрагментов будет отображаться в результате поиска. Допустимый диапазон выбора — от одного до пяти.

□ Отображение описания документа — выбор этого параметра означает, что, помимо названия и части текста, содержащего слова запроса, будет приведено описание документа, данное его автором. У этого параметра возможны три варианта:

• если нет фрагментов — описание будет отображено в том случае, если в тексте документа не будет найдено предложение, содержащее слова запроса, которое могло бы быть взято в качестве аннотации;

• всегда — описание будет приведено в любом случае;

• никогда — какой бы ни был результат поиска, авторское описание выводиться не будет.

□ Выделение найденных слов — сформированный результат содержит заголовок документа, его описание и фрагменты текста. Искомые слова при стандартных настройках будут выделены полужирным шрифтом и в описании, и во фрагментах. Вы можете отключить выделение поисковых слов в любой или в обоих частях результата поиска.

В результатах поиска присутствуют и иные сведения и ссылки, но они не настраиваются, поэтому о них мы поговорим при рассмотрении собственно результатов.

Настройка страницы вывода результатов поиска

Настройки, относящиеся к этому блоку, не оказывают влияния на отбор и отображение каждого отдельного результата. Все, что здесь можно настроить, имеет отношение только к самой странице.

Обычно поисковая форма, в которую вводится запрос, расположена в верхней части страницы. Но ее можно продублировать и в нижней части. Зачем? Допустим, среди результатов не окажется документа, отвечающего вашему пониманию релевантности запросу. Тогда вместо того, чтобы прокручивать страницу вверх, вы можете в нижней форме ввести новый запрос. Небольшое изменение структуры страницы избавит вас от лишних движений мыши.

Допустим, среди полученных результатов есть несколько документов, которые вы бы хотели изучить более подробно. Для этого вы щелкаете на ссылке и попадаете на нужную страницу. Но в каком окне она будет открыта? В Google по умолчанию ссылка открывается в окне результатов поиска. В Яндексе по умолчанию каждая ссылка открывается в новом окне. Вы можете настроить переход к документу так, как вам покажется более удобно. Документ может открываться:

□ в том же окне;

□ в новом окне;

□ в общем новом окне.

Последний вариант говорит о том, что первый документ будет открыт в новом окне, каждый последующий будет открываться в нем же. Конечно, можно обойтись и без изменения настроек, для чего придется использовать клавиатуру и мышь. Чтобы открыть документ в новом окне, достаточно подвести к ссылке указатель мыши щелкнуть на ней правой кнопкой и в открывшемся контекстном меню выбрать пункт Открыть в новом окне. Этого же результата в Internet Explorer можно добиться, если при нажатой клавише <Shift> щелкнуть на ссылке левой кнопкой мыши.

Следующий параметр, характеризующий страницу выдачи результатов, поможет вам настроить количество выводимых на нее документов. Первоначальное значение равно 10. Это довольно удобно, поскольку страница получается не очень большая и не требует долгого прокручивания для просмотра. Кроме того, размер страницы не получится большим, что удобно для работающих в Интернете через обычный модем. С другой стороны, при большом количестве полученных результатов для их просмотра вам придется выполнять переход от страницы к странице, подгружая их взамен просмотренных. При хорошем соединении (ADSL, XDSL, локальная сеть) вполне допустимо увеличить количество выводимых результатов на странице. В настройках вы можете назначить этому параметру значение от 10 до 50.

Для людей, экономящих трафик, либо работающих через медленные соединения, полезно обратить внимание на настройки, связанные с отображением графики на странице результатов. С помощью настроек вы сможете отключить вывод графических баннеров и блока картинок, а также пиктограмм сайтов на первой странице результатов.

Область поиска

В этом блоке всего два параметра, доступных для настройки. Первый определяет, на каком языке должны быть документы, попадающие в результат поиска. У вас есть возможность получения в результате поиска любых документов вне зависимости от языка. Во втором случае вы можете ограничить область поиска документами, относящимися к одному из доступных для фильтрации языков — русскому, белорусскому, украинскому, английскому, немецкому или французскому.

Второй параметр позволяет включить фильтр, соответствующий так называемому семейному поиску, исключающему, по возможности, вывод результатов, не предназначенных для несовершеннолетних.

Дополнительно

Помимо результатов поиска, на странице может быть выведена и дополнительная информация. Например, статистика слов, включенных в поисковое выражение. Если вы включите этот параметр, то перед списком результатов будет выведена строка с данными, сколько раз каждое из слов встречалось Яндексом среди всех проиндексированных им страниц. Числа приблизительные хотя бы потому, что в базу Яндекса постоянно добавляются новые страницы.

Возможно, вас интересуют результаты обработки вашего запроса не только поисковой системой Яндекс. В этом случае вы можете в настройках поставить флажок предлагать искать другими поисковыми системами. В результате в самом низу страницы будет добавлена строка со ссылками на поисковые системы Google, MSN, Yahoo! Rambler, Апорт! с уже подготовленными запросами. Щелкнув на ссылке, вы передадите в выбранную поисковую систему свой запрос и перейдете на страницу результатов поиска.

1.5. Поиск по вебу

Когда нам требуется найти какую-либо информацию, мы в первую очередь обращаемся к Интернету. Листать справочник? Работать в читальном зале? Перебирать карточки библиотечных каталогов? Для многих это вчерашний день. И справочники многие есть в открытом доступе в Сети, и многие библиотечные каталоги переводятся в электронный вариант, и вопросы в режиме реального времени можно задать специалистам (есть и такие сайты). И, самое главное, времени на поиск в Интернете чаще всего затрачивается намного меньше. Надо лишь уметь искать и разбираться в полученных результатах. Чем мы сейчас и займемся.

1.5.1. Простой поиск

Начинающие пользователи обычно используют самый простой вариант поиска — поиск "в лоб", при котором в поисковой строке набирается исходное выражение или слово и запускается процесс. Как мы уже видели при разборе языка запросов, в этом случае поиск ведется по принципу вхождения в анализируемые документы как всего выражения, так и отдельных его частей. Попробуем и мы провести такой поиск.

В качестве примера попробуем найти архитектурный проект жилого дома. Поиск будем вести по всем разделам. Впишем поисковое выражение в поле формы запроса, не используя дополнительных параметров. Если вы привыкли работать с клавиатурой, то вместо того, чтобы щелкнуть в форме поиска указателем мыши на кнопке Найти, можно на клавиатуре нажать на клавишу <Enter>. Несколько секунд (скорость в первую очередь зависит от скорости вашего соединения с Интернетом) — и откроется страница результатов. На этой странице есть тексты, поясняющие результаты поиска, и ссылки, дающие возможность сортировать найденное или уточнять запрос (рис. 1.7).

В случаях, когда поиск ведется по всем разделам, Яндекс будет искать не только документы и сайты, но и новости, товары, картинки, словарные статьи и иную информацию, соответствующую запросу. Если в "параллельных" базах что-то будет найдено, Яндекс покажет информацию среди результатов поиска. Вверху или внизу страницы будут результаты поиска по новостям, словарям, картам, афише, погоде, а в правой колонке — информация, полученная о товарах и картинках. В правой колонке также публикуются объявления службы Яндекс. Директ, в которых в качестве ключевых слов используются слова поискового запроса. Но если таких объявлений Яндекс не отыщет, вместо них будет присутствовать приглашение о размещении объявления по вашему запросу.

Добиться отсутствия результатов довольно сложно, разве что задавать в поиске заведомо несуществующие слова. Как правило, что-то в ответ на свой запрос вы получите. А вместе с результатом и дополнительную информацию.

Пролог

Прежде чем просматривать результат поиска, обратите внимание на строки, предваряющие его. Здесь размещена очень интересная и полезная информация. В первой строке — количество найденных страниц и сайтов, содержащих ключевые слова. Чем точнее поставлен вопрос, тем меньше будут эти значения, тем больше вероятность найти требуемое.

Пример

Результат поиска: страниц — 95 865, сайтов — не менее 1 885.

Следующая строка показывает статистику Индекса, а если точнее — сколько раз ключевые слова встречаются в проиндексированных документах. Чем чаще слово употребляется в текстах, тем больше будет это значение.

Пример

Статистика слов: архитектурный — 15 063 257, проект — 497 340 239, жилого — 59 541 623, дома — 787 144 580.

Обратите внимание, что если слова запроса были взяты в кавычки, например, при поиске цитаты, то в строке Статистика слов все слова будут приведены с предшествующим знаком! определяющим обязательность включения слова в поиск.

И, наконец, в последней строке приводятся статистические данные по количеству запросов, в которых было использовано каждое из ваших ключевых слов.

Пример

Запросов за месяц: архитектурный — 33 779, проект — 273 903, жилого — 26 366, дома — 1 062 700.

А что бывает, когда вы ошиблись в написании слова? Мы уже говорили, что Яндекс использует при обработке запроса морфологический анализ. В результате он способен определить, что вы написали слово с ошибкой и предложить свой вариант. Например, если в нашем примере вместо слова проект мы напишем прокт, Яндекс предложит нам корректный вариант, снабдив его предположением, не опечатка ли это. Впрочем, не всегда следует пользоваться этими подсказками. В некоторых случаях некорректное написание слова было выполнено специально. К примеру, всем известно слово "агентство", но не все пишут его правильно. Очень часто это слово пишут так: агенство (по информации Яндекса, в его Индексе это слово с ошибкой встречается 7 783 366 раз, а количество запросов за месяц составило 152 952.) Если вести поиск по правильному написанию, то документы, где слово написано с ошибкой, в результаты поиска не попадут.

Есть и другие случаи, когда Яндекс воспринимает правильно написанное слово иначе, предлагая другой вариант. По всей видимости, критерием "правильно-неправильно" в данном случае служит частота употребления слова. Поэтому редко встречающиеся слова, похожие на часто употребительные, могут быть восприняты как написанные с ошибкой.

Но, конечно, далеко не всегда Яндекс может правильно определить, какое слово было задумано посетителем.

Пример

Посетитель написал слово колеки, вместо того, чтобы написать калеки. Яндекс, подумав, решил, что должно было быть написано слово колени. С точки зрения Яндекса предложенное им слово находится ближе к исходному, чем первоначально задуманное посетителем.

В том случае, если на ваш запрос ничего не было найдено, Яндекс предложит вам повторить поиск. К примеру, если поисковое выражение стояло в кавычках, будет предложено выполнить аналогичный поиск, но кавычки убрать.

Орфографическая проверка

Предположение о том, что слово в строке поиска набрано неверно, строится не на пустом месте. Определить корректность написания слов помогает орфографический словарь либо статистика написания слова, полученная в результате индексирования интернет-страниц. Однако в наши дни новые слова, названия компаний, фамилии людей появляются не по одному каждый день, и уследить за ними одному Яндексу было бы проблематично. Создать словарь, в который были бы занесены все слова русского языка, и, самое главное, поддерживать его в актуальном состоянии, не сможет ни одна команда, как бы подготовлена и обеспечена она ни была. Зачастую слова приходят из других языков, совершенно не соответствуют правилам русского языка, нечитаемые и непроизносимые. При появлении таких слов в запросах Яндекс ранее предлагал их исправить, предполагая, что человек допустил опечатку.

В 2005 году был запущен новый алгоритм, участвующий в разборе и анализе таких ситуаций. Его цель — создание словаря исправлений. Запросы пользователей собираются и анализируются, обрабатывается статистика. Если оказывается, что по какому-то слову есть много вариантов исправлений, то из кластера выбирается похожее слово из числа наиболее распространенных в Интернете. Таким образом, появляется база пар "плохих" и "хороших" слов — слов с ошибками и исправленных, и каждое слово в запросе пользователя теперь проверяется по такому "народному" словарю. Набранная статистика позволяет отбирать наиболее употребляемые варианты написания слов, за счет чего и происходит поддержка орфографического словаря.

Транслитерация

Слова могут быть написаны с ошибкой, которую вы можете не заметить. Например, если в слове встречаются символы русского и английского алфавита, близкие по начертанию. Например, в слове "передача" первая буква "а" была взята из английского алфавита. Яндекс "с удовольствием" принял запрос, заменил некорректную букву на русскую "а" и в результатах поиска представил документы, содержащие корректное написание слова "передача". Самое интересное все же в том, что в этом же списке результатов могут присутствовать и документы, в которых ключевое слово написано именно так, как в вашем запросе. Аналогичным образом конвертируются слова, содержащие хотя бы одну русскую букву.

Конвертируются следующие буквы (полужирным выделены английские): e — е — ё, a — а, В — В (только прописные), c — с, g — д (только строчные), k — к, n — п (только строчные), o — о, p — р, u — и (только строчные), x — х, y — у.

Иначе обстоит дело, если слово набрано на транслите. Яндекс правильно преобразует его в слово на русском языке, например, слово "peredacha" будет представлено как "передача". При этом поиск в документах ведется по исходному слову, а русский вариант предлагается в качестве возможного в преобразовании с транслита. Если предположение Яндекса верно, щелкнув на слове передача, вы откроете страницу с результатами поиска по этому ключевому слову.

Не конвертируются слова, в которых есть хотя бы одна цифра. Например, в слове "переgача1" буква "g" не будет заменена на букву "д". Не конвертируются и слова, состоящие из одной буквы, например, предлог "c". И цифра "0" буквой "О" не заменяется. Она подпадает под предыдущее условие, что слова с цифрой не подлежат транслитерации. Обратите внимание на то, что транслитерация идет только в одном направлении — с латинского (английского) на русский. Но не обратно. И напомню, что надо делать, чтобы избежать конвертирования слова, если вам требуется поиск с точным его написанием. Для этого достаточно в поле запроса записать ключевое слово с предшествующим ему восклицательным знаком, например, так:!переgача.

Все, о чем было сказано ранее, в Яндексе называется прологом. Тем, что еще не является собственно результатом. И лишь после пролога выводится та часть, которая нам нужна более всего — результаты поиска.

Результаты поиска

Сколько бы ни было найдено документов, информация по каждому из них формируется на основе единых правил и включает одни и те же информационные блоки. Это — заголовок документа, его описание, фрагмент и статус. В свою очередь каждый из этих блоков может состоять из нескольких элементов.

Заголовок документа

Каждый результат имеет свой порядковый номер. Он служит только для удобства ориентирования на странице и иной функциональности не несет.

А вот следующая информация в заголовке результата уже имеет ценность. Это — название документа, в котором были найдены слова, входящие в запрос. Для веб-страниц название берется из тега <title>, поэтому полностью зависит от того, что в него включил разработчик. Если тег <title> не заполнен, вместо названия страницы вписывается ее адрес (URL). Для документов в других форматах название берется из их свойств, а если в свойствах файла название отсутствует, вместо него берется имя файла.

Если заголовок осмысленный, то даже по нему можно оценить соответствие найденной страницы запросу. Но могут быть и иные заголовки, не несущие какой-либо информации, например, page5. Вряд ли по этому названию удастся оценить найденное. Если в заголовок входят ключевые слова, они будут выделены в нем полужирным шрифтом.

Пример

Архитектурный проект жилого дома, 3 экземпляра, общей пл. 320.

Заголовок является ссылкой, поэтому щелчок на нем левой кнопкой мыши приведет к переходу на найденную страницу либо к загрузке файла. Будет ли ссылка открыта в этом же окне, либо в новом, зависит от настроек страницы результатов поиска.

Описание документа

Ниже заголовка может находиться строка, в которой выводится описание документа, сделанное его автором. Для веб-страницы это описание берется из тега <meta name="description">. Если такой тег на странице не найден, описание документа не приводится. Хотя возможен и иной вариант. Если документ найден на сайте, который есть в каталоге Яндекса, описание может быть взято из каталога. Если же сайт найден по ссылке, то в описании приводится ее текст.

Фрагмент текста

В число фрагментов, показываемых в результатах поиска, включаются части документа, содержащие слова запроса. Количество фрагментов не превышает пяти и определяется настройками результатов поиска. Каждый фрагмент содержит все или часть заданных для поиска слов. В соответствии с правилами сортировки обычно вначале списка находятся ссылки на документы, в которых слова расположены именно так, как это задано в условии поиска. Ключевые слова выделяются во фрагментах полужирным шрифтом, за исключением стоп-слов, даже если они входят в состав запроса.

Статус документа

Следом за фрагментами текста следует строка с адресом найденного документа. Это тот же самый адрес, который является ссылкой у заголовка. Отличие лишь в том, что по этой ссылке переход на найденную страницу не осуществляется — это только текст. Здесь же дается информация о размере страницы и дата последнего изменения, если сервер ее отдает. Любой из этих элементов может быть спрятан из показа путем настройки.

Следующая за описанием строка представляет набор ссылок. На тот момент, когда я готовил эту главу, количество их варьировалось от нуля до трех. Все зависело от причин, которые мы сейчас рассмотрим.

Первая ссылка ведет на сохраненную копию страницы в базе данных Яндекса. Такая ссылка появилась в конце 2006 года, заменив собой ссылку Найденные слова. Что это значит для пользователя? Раньше Яндекс хранил у себя только текст всех проиндексированных страниц. Поэтому, чтобы показать слова, которые были указаны в запросе на найденной странице, приходилось снова идти на исходный сайт. И возникала проблема, если со времени последней индексации страница изменилась, либо была удалена.

Замена хранения текста страницы на ее полноценную копию снимает эту проблему. Теперь, переходя по ссылке Сохраненная копия, вы увидите ту страницу, которая была проиндексирована роботом вне зависимости от того, изменялась она впоследствии или нет. Подобные копии сделаны для очень многих страниц, но еще не для всех. Поэтому не у всех найденных документов будет ссылка на их сохраненные копии.

Следующая ссылка, которая может присутствовать в этой строке выдачи результатов, показывает, сколько еще документов с найденного сайта отвечает вашему запросу. Переход по ней равносилен использованию в системе расширенного поиска ограничения на поиск по определенному сайту.

Наконец, если найденная страница размещена на сайте, зарегистрированном в каталоге Яндекса, будет отображена рубрика, которой он принадлежит. Переход по этой ссылке приведет вас в соответствующий раздел каталога.

Эпилог

Сказанное относится к описанию найденного документа. Осталось рассмотреть, что выводится на странице поиска после списка результатов.

На странице по умолчанию выводится до 10 ссылок на документы. Если их больше, под последней размещается строка с номерами следующих страниц, на которые вы можете перейти, если первых результатов оказалось недостаточно. Статистика говорит о том, просматривают обычно не более 3-х страниц, но Яндекс дает возможность просмотреть и остальные.

Результаты поиска сортируются по их релевантности запросу. Но вы можете изменить сортировку, заменив ее сортировкой по дате документа. В этом случае первыми будут документы с наиболее поздней датой создания или изменения.

В процессе формирования списка результатов Яндекс определяет, к каким регионам относится большинство найденных сайтов. Эти регионы представлены в виде их названий, и если перейти по любому из них, будут показаны только сайты, относящиеся к этому региону.

Одновременно с этим поисковая система определяет принадлежность найденных сайтов к тематическим разделам каталога Яндекса (если отобранные сайты в нем присутствуют). В строке в рубрике полужирным шрифтом выделены разделы верхнего уровня, а в скобках — подрубрики. Нажав на одну из ссылок, вы отберете только те сайты, которые относятся к заданной теме.

Пример

Если вы хотите найти информацию о том, как нужно гадать под Рождество, введите в строке поиска слово коляда, а затем перейдите по ссылке в рубрику Тосты и сценарии.

И остается последняя строка страницы результатов. Это — поиск вашего запроса в других поисковых системах. Если ответ Яндекса на ваш запрос оказался недостаточно точным, попробуйте сформулировать запрос иначе либо задайте его другим поисковым системам. Достаточно нажать на ссылку с именем поисковика, и в новом окне откроются его результаты поиска.

Хорошо это или плохо? Следует ли уводить своих посетителей на другие поисковые системы? Не приведет ли это к тому, что пользоваться станут ими, а не Яндексом? Этот вопрос не раз задавался разработчикам, да и они сами наверняка долго обсуждали эту проблему, прежде чем предоставить возможность перехода на другие поисковики. Решили сделать так потому, что никакой робот не в состоянии проиндексировать весь Рунет (я приводил выше количество проиндексированных документов, которое постоянно растет), тем более невозможно сделать это в режиме реального времени. А полнота данных — один из важнейших показателей при поиске. Поэтому были выбраны поисковые системы, которые могли бы помочь пользователям найти дополнительную информацию, отсутствующую в Яндексе.

Что немаловажно, статистика переходов на другие поисковые системы сделана общедоступной, и ее можно просмотреть в раздел Статистика на странице Переходы на поисковые системы. Оказалось — ничего страшного. Переходов много, но они составляют все же небольшой процент по отношению к использованию самого Яндекса. А вот понаблюдать за этой статистикой довольно интересно (табл. 1.5). Видно, какие поисковики пользуются популярностью, а какие нет, какие разделы Яндекса оказываются для посетителей менее привлекательными в плане поиска информации, а какие их вполне устраивают.

Если на ваш запрос было найдено большое количество документов, вы можете уточнить его. Даже без использования возможностей расширенного поиска вам доступно два варианта. При этом вам не потребуется вводить запрос заново. Под строкой ввода запроса есть два флажка: искать в найденном и в регионе, в качестве которого подставляется ваш регион, определенный либо по вашему IP, либо взятый из ваших настроек.

В случае, если целью уточнения запроса является поиск по региону, установите флажок и выполните запрос заново. В полученном списке будут ссылки на документы, имеющие отношение к указанному региону. Если вы хотите уточнить запрос, поставьте флажок в поле искать в найденном, а в строку поиска впишите уточняющие ключевые слова или выражение. Этот поиск будет вестись только по тем документам, которые были отобраны в предыдущем поиске.

1.5.2. Параллельный поиск

Точно не известно, являлся ли Яндекс первопроходцем в создании параллельного поиска или нет, но такой поиск появился на нем одним из первых. Суть его заключается в том, что, помимо основного поиска среди документов, ведется поиск среди специализированных источников, дополняющих ответ на запрос. В качестве главных дополнительных источников на Яндексе приняли данные по картинкам, товарам и услугам. И если в этих источниках находится хотя бы один ответ на запрос, он будет показан рядом со ссылками на документы. Ответы других источников выводятся только в том случае, если они будут признаны достаточно релевантными. В таком режиме выводятся результаты поиска среди новостей, энциклопедических и словарных статей, каталога. Результаты поиска среди карт и прогнозов погоды выводятся только в том случае, если в запросе в явном виде заключен соответствующий запрос (рис. 1.8).

Пример

На запрос карта Казани среди прочих результатов будет выведена и информация, полученная из специализированного поиска по картам.

Но это не все, что предоставляет пользователю параллельный поиск. Есть еще несколько интересных моментов, связанных с табами, расположенными под поисковой строкой:

□ табы являются ссылками на параллельные поиски, на которые можно переключиться после поиска документов;

□ цвет табов зависит от результатов поиска. Черный цвет означает наличие релевантных результатов, серый — их отсутствие (рис. 1.9). Щелкнув на одном из "черных" табов, вы переместитесь на страницу с результатами поиска по выбранному источнику. Если ссылка серая — щелкать тоже можно, просто вероятность, что параллельный поиск даст хороший ответ на запрос, существенно меньше;

□ ссылки на табах на главной странице Яндекса можно использовать в качестве кнопок переключения на службы. Достаточно ввести в поисковой строке запрос и щелкнуть на названии соответствующей службы, чтобы поиск шел в ней, а не по вебу. Таким образом, поиск в определенной службе можно задать на любой странице поиска и сделать в один щелчок;

□ если результаты поиска по источнику были сочтены релевантными и показаны рядом со ссылками из веба, рядом с названием источника (будь-то Новости или Энциклопедии) в скобках пишется количество найденных результатов. Это полезно, когда хочется примерно оценить, как много результатов будет на параллельном источнике и стоит ли туда переходить.

Поиск по параллельным источникам существенно повышает возможности поиска по вебу. Если в дополнительных источниках будут найдены результаты, релевантные запросу, Яндекс обязательно их покажет.

1.5.3. Расширенный поиск

Задание условий поиска выполняется на странице, куда вы можете перейти по ссылке Расширенный поиск, расположенной под строкой ввода запроса. Условия, заданные вами в расширенном поиске, получат свое отражение и в результатах. Дополнительные настройки выводятся в шапке страницы результатов. Если вы задали для поиска временной диапазон, его значения будут выведены под строкой запроса (рис. 1.10). После получения результата вы можете изменить этот диапазон, введя новые значения в поля дат. При ограничении поиска определенным языком, информация об этом будет представлена в блоке статистики запроса. Аналогичная информация будет выведена и при задании иных ограничений, наложенных вами на поиск информации.

1.5.4. Оптимисты, пессимисты и остальные

Кроме обычных вариантов поиска — простого или улучшенного, Яндекс предлагает несколько дополнительных вариантов, рассчитанных на различные группы пользователей.

Поиск для экономных

Не знаю, как вам, но мне нравится самый простой вариант поисковой страницы. Его называют аскетичным, но, на мой взгляд, это страница поиска для тех, кто экономит не только трафик, но и свое время. Адрес этой страницы — www.ya.ru. Страница, на которой нет ничего, кроме логотипа, ведущего на основную страницу Яндекса, строки для ввода запроса и кнопки Найти! а также ссылки на почтовый сервис.

Эту страницу не надо настраивать — меньше, чем есть, на ней уже и не будет, разве что убрать ссылку на почтовый сервис. Здесь нет перехода на расширенные возможности поиска, зато ничто не отвлекает от главной задачи, для решения которой, собственно, и пришел человек на поисковик. Если отвлечься от внешнего вида страницы, то все остальные возможности поиска Яндекса поддерживаются и здесь (к примеру, можно формировать сложные запросы, используя поисковый язык Яндекса).

Результаты поиска будут выведены на обычную страницу результатов, единую по формату со страницей результатов поиска, выполненного с главной страницы.

Поиск для слабовидящих

Идя навстречу пожеланиям людей с ослабленным зрением, Яндекс предоставил им отдельную поисковую страницу — http://large.yandex.ru/.

Она похожа на страницу для экономных, но здесь нет ссылки на почтовый сервис, а размер шрифта увеличен по отношению к обычному.

Отличие также есть и на странице результатов. Здесь отсутствуют все дополнительные блоки (результаты поиска товаров и услуг, новостей, блогов, картинок), оставлены только результаты поиска среди документов (рис. 1.11).

Убрана информация по регионам, разделам каталога, нет возможности сортировки по дате. В более простом варианте формируется и информация по найденным документам. Для каждого из них оставлен заголовок документа, ведущий на страницу с найденными ключевыми словами. А вот в следующей строке, в отличие от обычного поиска, дается адрес сайта, на котором размещена найденная страница.

Следом дается описание сайта, если оно существует. Фрагменты текста приводятся в более кратком варианте (буквально несколько слов). И отсутствуют ссылки на сохраненную страницу, дополнительные документы с этого же сайта и ссылка на раздел каталога, если сайт в нем зарегистрирован.

Дзен-поиск

Что делать, если вы зашли на поисковик, но еще не решили, что же вы хотели бы найти? Набирать произвольные слова, придумывать невероятные словосочетания? А не проще ли было бы выяснить, что же ищут на Яндексе другие посетители? Пройдите по адресу http://dzen.yandex.ru/, где находится страница медиативного поиска. Открываешь ее и видишь лишь одну кнопку — Найти!. Если не считать набранного серым шрифтом подзаголовка этого варианта поиска — медиативный поиск (на основе запросов пользователей к Яндексу) и ссылки на страницу Прямой эфир. Что предлагается здесь? А просто нажать кнопку Найти! и получить результат запроса, сделанный кем-то перед вами. Поиск будет использовать последние запросы, сделанные на Яндексе другими посетителями. Выборка случайная, но тем интереснее результат — никогда не знаешь, что же получишь в ответ.

Но можно узнать больше, если перейти по ссылке Прямой эфир. На странице показано 20 последних запросов, сделанных пользователями. В тот момент, когда я просматривал эту страницу, 150 тысяч пользователей интересовались перелетом из Москвы в Гоа, 710 тысяч — кошельком Webmoney, и 607 человек искало материалы для диплома по ковке металла (рис. 1.12).

Примечание

Прямой эфир я видел и в холле компании Яндекс. На двух мониторах отслеживались запросы пользователей. Большинство запросов было односложными, реже встречались запросы, состоящие из нескольких слов и совсем не встречалось сложных запросов, использующих расширенный язык запросов.

Каждая ссылка с поискового запроса приведет вас к результатам, полученным предыдущим пользователем. Например, пройдем по ссылке с запроса link: добавить сообщение ехида. Оказалось, что по этому запросу Яндекс не смог найти ничего, что бы полностью ему соответствовало. Поэтому перед выводом результатов появилось сообщение:

Ничего не найдено? Чтобы искать точнее, Яндекс ограничивается документами, в которых слова из запроса близки друг к другу — поищите с более мягкими условиями.

Но более мягкие условия далеко не всегда могут привести к желаемому результату. В таких случаях на странице результатов выводится новое предупреждение — В найденных документах слова запроса расположены сколь угодно далеко друг от друга, прочитав которое думаешь, использовать ли эти результаты, или поискать в другом месте, или иначе сформулировать запрос.

А вот какой запрос, выполненный кем-то передо мной, показал мне Дзен-поиск: заболивания органов из-за курения. И помимо предположения, что слово "заболивания" написано неверно, мне был предложен совершенно иной вариант запроса: заболивания органов из-за мыканья. Совершенно неожиданное предположение, что не курение интересует ищущего, а некое "мыканье"…

Все просто. Первого апреля 2004 года Яндекс запустил акцию тестирования "универсального преобразователя запросов". Для каждого запроса на русском языке длиной больше одного слова на странице результатов поиска предлагалась его перефразировка. В пресс-релизе по этому поводу говорилось:

До сих пор усилия создателей поисковых машин были направлены на то, чтобы как можно лучше понять вопрос пользователя и дать наиболее релевантный для него ответ. Однако, как известно, хороший вопрос уже содержит в себе большую часть ответа. Новая технология указывает пользователю правильное направление поиска.

Преобразователь запросов учитывает множество факторов, в том числе ассоциации, корреляции, релевантности и валентности, а кроме того, день недели и даже время суток — ведь известно, что у пользователей совершенно разные дневные, вечерние и ночные интересы. Обрабатываются тексты по любой теме, причем во многих случаях предложенные варианты позволяют по-новому взглянуть на содержание запроса. Например: "отставка правительства" — "промывка подсемейства", "налогообложение коммерческих банков" — "пригибание педагогических Панков", "дипломные работы" — "банальные ноты", "крутая эротика" — "холостая агротехника" и т. д. (данные преобразователя на момент написания пресс-релиза).

Первое апреля давно прошло, но "универсальный преобразователь" нашел свое место в результатах, выдаваемых через Дзен-поиск.

Поиск для оптимистов

Вы всегда уверены в себе, уверены в том, что чтобы вы ни делали — все у вас получится. Будете искать информацию — и она обязательно найдется, даже если ее нет, ведь не даром у Яндекса такой слоган — "Найдется все!"

В этом случае вам прямая дорога на страницу поиска для оптимистов — http://www.yandex.ru/white.html.

Открыли страницу? Ничего не видно? Сплошной белый экран? Так это ведь суть оптимизма, когда вокруг все ясно, понятно, светло. И ничего страшного — прямо там, где видится курсор, вводите свой запрос и жмите на <Enter>. Получилось? А по-другому и не могло быть. Вот я ввел запрос: вот такой Яндекс. Думал, ничего не найдется. А Яндекс нашел!

Поиск для пессимистов

Ну а если у вас плохое настроение, вы перестали чему-либо верить, вы неуверены в себе. Что ж, тогда вам надо открыть страницу поиска для пессимистов — http://www.yandex.ru/black.html.

Опять ничего не видно? Сплошная черная мгла перед глазами? Так у пессимиста настроение такое, сумрачное. Не уверены, что вы что-то сможете здесь найти? Но Яндекс может найти даже черную кошку в черной комнате! Не бойтесь, вводите свой пессимистический запрос. Кто как, а я спросил о пессимистичном Яндексе и получил в результате 70 страниц, где с Яндексом были связаны пессимистичные прогнозы (рис. 1.13).

1.6. Поиск картинок

Поиск картинок на Яндексе появился существенно позже поиска документов, хотя веб-страницы — это не только тексты, но и изображения, фотографии, рисунки, отсканированные копии тех же документов. Они интересуют пользователей в не меньшей степени, поэтому и появился поиск изображений. Аналогичный поиск предложили и другие поисковые системы — тот же Google, Yahoo! и пр. Но как искать то, что нельзя проиндексировать? Есть лишь одна возможность — использовать косвенные признаки, к которым могут быть отнесены названия изображения и текст в теге <alt>, в котором может быть размещено описание изображения.

При таком подходе поиск изображений ничем не отличается от поиска документов. Точно так же в обычном режиме поиска вводятся ключевые слова, а при использовании расширенного поиска документов, можно ограничить диапазон поиска. В том случае, когда мы ищем документы, найденные по ключевым словам, изображения, точнее, один из их представителей, будет показан среди результатов. Для просмотра остальных нужно перейти на вкладку Картинки, ссылка на которую находится под строкой ввода запроса.

Но можно искать изображения вне поиска документов. Для этого откройте страницу поиска изображений по адресу http://images.yandex.ru/. Этот поиск предоставляет только обычный режим, никаких возможностей расширенного поиска изображений здесь нет.

Результаты поиска представляют собой уменьшенные варианты найденных изображений размером до 100 х 100 пикселов, размещенных в виде таблицы. Как и для результатов поиска документов, количество страниц с найденными изображениями зависит от количества найденного.

Примечание

Вне зависимости от количества найденных на одном сайте изображений, соответствующих запросу, в результатах будет выведено лишь одно из них, которое Яндекс сочтен наиболее релевантным.

В верхней части страницы результатов дается информация о количестве найденных изображений и сайтов. Как правило, количество изображений больше количества сайтов, даже если встречаются одинаковые изображения.

Каждое изображение сопровождается дополнительной информацией:

□ название файла изображения или содержание тега <alt>;

□ полное название файла с расширением (типом файла), размер изображения в пикселах и его объем;

□ адрес сайта, выполненный в виде ссылки, ведущей на страницу с изображением;

□ расширенный вариант запроса изображений с сайта, если на нем найдено более одного изображения, и количество найденных изображений.

В левой колонке страницы результатов поиска находится блок ссылок, помогающих выполнить выборку изображений среди найденных по их размеру. По результатам поиска всегда выводятся все найденные изображения. Затем среди них можно выбирать огромные, большие, средние и маленькие изображения (рис. 1.14). Все, что не попадает под эти критерии, относится к мелочи.

Уменьшенная копия изображения также является ссылкой, только не на документ, а на новую страницу Яндекса, на которой это изображение, попадающее в категории маленькие и средние, отображается в полном размере, а большие и огромные представлены уменьшенными копиями.

Информация на этой странице представлена двумя блоками. В первом — то изображение, по ссылке с которого вы перешли на страницу. Для него приводится ссылка для перехода на документ, где изображение находится, тип изображения, размер, объем, название файла или содержимое тега <alt>. Дополнительно приводится абсолютная ссылка на само изображение. А само изображение также является ссылкой — щелкнув на нем, вы сможете загрузить исходное изображение на свой компьютер.

К сожалению, для изображений отсутствует сохраненная копия страницы. Почему "к сожалению", наверное, понятно — во время работы поискового робота страница и изображение были на своем месте, а потом могли быть удалены, перемещены на другую страницу, и переход по ссылке уже не сработает.

Во втором блоке представлены две уменьшенные копии изображений, одно из которых в списке результатов было до рассматриваемого, второе — после рассматриваемого изображения (рис. 1.15). Переход по этим изображениям откроет страницу, где в таком же порядке по ним будет выдана информация.

Зная, по каким критериям выполняется индексирование и последующий поиск изображений, делайте выводы — размещая картинки на сайте, давайте файлу если не уникальное, но хотя бы логически понятное название. И обязательно заполняйте тег, предназначенный для размещения описания изображения.

1.7. Яндекс. Каталог

Каталог вне зависимости от того, кто его создал и в каком виде, преследует всегда одну и ту же цель — систематизировать информацию, предоставив возможность пользователям быстро и легко находить необходимое.

Суть идеи каталогов проста — собрать на одном ресурсе ссылки на множество сайтов, отсортированные по рубрикам.

Разделы каталога имеют иерархическую структуру вида:

□ Категория 1

• Подкатегория 1

◊ Под-подкатегория 1

◊…

□ Категория 2

□… и т. д.

Прародителем интернет-каталогов считается Yahoo! и большинство современных каталогов как в России, так и в других странах, приняли за основу его принципы построения разделов. Каталоги представляют собой электронные справочники, имеющие привычную для информационных работников иерархическую систематическую или логико-тематическую структуру, несколько напоминающую структуру систематического каталога библиотеки. Работа со справочниками позволяет ориентироваться в ресурсах Интернета в пределах отдельных отраслей знания, углубляясь от общего к частному, менять иерархические ветви и т. д.

Примечание

Каталог Yahoo! родился из простейшей коллекции закладок, сделанных двумя людьми — Дэвидом Фило и Джерри Янгом. Сегодня это один из самых популярных каталогов на Западе. Впрочем, Yahoo! — это не только каталог, но и множество других сервисов. К достоинствам каталога относится простая структура, легкая навигация, наличие множества интересных проектов в базе. Попасть в Yahoo! можно как бесплатно, так и за деньги. Заплатить придется много — $299 для любых сайтов, кроме adult-темы (за нее цена $600). По наблюдению владельцев сайтов, в среднем модераторы Yahoo! удовлетворяют четверть поданных заявок.

В чем основное отличие каталогов от Индекса? В том, что они создаются людьми, формируются, редактируются, обновляются вручную. С каталогами работают специальные команды. Принципы добавления новых сайтов для каждого каталога вырабатываются свои, но одним из главных принципов считается необходимость добавления только качественных сайтов, обладающих действительно интересной и нужной информацией. Новые сайты каталогу могут предлагать как их владельцы, так и сотрудники каталога, просматривая содержимое новых серверов. Выявленные и предложенные данные анализируются и заносятся в разделы справочника в соответствии с принятой классификацией. При этом описание сервера в целом или его раздела, если он представляется вполне самостоятельным блоком, снабжается краткой аннотацией, содержащей самые общие сведения о характере имеющейся информации.

Таким путем дать описание всем ресурсам Интернета нереально, какая бы большая команда ни трудилась над каталогом. Поэтому каталоги отражают лишь незначительную, но наиболее значимую часть сетевых ресурсов.

Один из наиболее популярных каталогов — каталог DMOZ (Directory of Mozilla) — появился в 1998 году как проект двух инженеров компании Sun Microsystems. Каталог находится по адресу www.dmoz.org. В 2000 году количество сайтов в каталоге DMOZ превысило аналогичный показатель у Yahoo! В 2001 году число ресурсов в нем достигло 2 млн, в июле 2005 года — 4,6 млн. Каталог поддерживают модераторы-волонтеры. На данный момент их насчитывается 60 тыс. человек.

Каталог DMOZ имеет древовидную структуру категорий, поддерживает многоязычность. Добавляются сайты в DMOZ бесплатно, но каждый ресурс проходит жесткую проверку модератора. Последний может без проблем отклонить заявку, если не понравится сайт, его название или описание. В DMOZ есть собственный робот Robozilla, который проверяет доступность ресурсов, размещенных в каталоге, и подает сигнал модератору в случае, если сайт недоступен.

Основными критериями оценки каталогов являются:

□ объем;

□ оперативность отражения новых или изменившихся источников;

□ продуманность схемы классификации;

□ перекрестность структуры.

От объема каталога зависит достоверность информации, которой он располагает, степень доверия к нему пользователей. С другой стороны, существует множество специализированных каталогов, количество ресурсов в которых незначительно, но зато отобраны лучшие ресурсы по определенной тематике. И люди, интересующиеся данной темой, будут ими пользоваться. Оперативность — немаловажный критерий оценки, особенно в части информации, размещаемой в Сети. Тем не менее оперативность появления новых ресурсов в каталоге значительно меньше, чем появление ссылок на эти же ресурсы при выполнении поиска.

Классификация каталогу нужна в обязательном порядке. Каталог без продуманной классификации как книжная свалка, где никогда не поймешь, что и где искать. Поэтому чем продуманнее и понятнее выполнена классификация, тем легче будет найти ресурс. Потому в каталоге Mail.ru можно найти разделы, где глубина категоризации доходит от 5–6 уровней. Удобно, но для достижения конечного уровня пользователю потребуется сделать множество переходов. Меньшая глубина категоризации требует меньшего количества, зато в одном разделе будет собрано огромное количество сайтов. И как искать среди них? Оба варианта имеют свои плюсы и минусы.

Перекрестные ссылки позволяют находить информацию с использованием различных подходов. Это могут быть выборки по территориям или отраслям, типам сайтов или предлагаемым ими дополнительным возможностям. Система классификации при использовании перекрестных ссылок, должна приводить к конечному объекту вне зависимости от того, каким путем шел посетитель.

Поиск в каталоге значительно проще, нежели в поисковой системе. Здесь не требуется использования сложных запросов, поскольку поиск ведется только по той информации, которая включена в описание ресурса, его названию, в отдельных каталогах — по ключевым словам, составленным для каждого ресурса. Следует помнить, что обращаясь к каталогам, мы можем рассчитывать только на получение общих сведений по тематике, и никогда — детальных данных. Например, сайт такой крупной компании, как "Российские железные дороги", содержащий сотни страниц, в каталоге будет представлен только своим названием и кратким описанием (аннотацией).

1.7.1. Для чего нужны каталоги

Переходя из категории в категорию, пользователи находят нужную им информацию. Чтобы людям было проще выбрать, на какой сайт перейти, каждый ресурс сопровождается коротким или подробным описанием.

Работа каталогов с новыми ресурсами построена по следующему принципу: владелец сайта подает заявку на регистрацию в каталоге, заполняя специальную форму. Далее заявку рассматривает модератор, который и принимает решение о добавлении конкретного ресурса в каталог. Реже добавление сайта происходит автоматически сразу после подачи заявки. Модераторами каталогов могут быть либо добровольцы (как в DMOZ), либо штатные сотрудники (Яндекс. Каталог).

С появлением поисковых машин каталоги не утратили актуальности. По-прежнему многие из них работают, появляется множество новых. Хороший каталог привлекает посетителей наличием в нем большого количества интересных и качественных ресурсов, найти которые в поисковых машинах не всегда удается и требует времени. Кроме того, существует множество каталогов с очень узкой тематикой, например, по теме генеалогия. И посетители знают — в этом каталоге они найдут лучшие ресурсы по данной теме. Поэтому до сих пор регистрация в каталогах может принести значительный трафик на сайт. Также нельзя забывать, что многие каталоги ставят прямые ссылки на сайты, что повышает цитируемость ресурса в поисковых машинах.

Нередко каталоги выдвигают дополнительные условия для владельцев ресурсов, желающих добавить проект в базу. Например, обязательное наличие обратной ссылки на каталог с главной или второстепенной страницы сайта. Либо требуют плату за регистрацию — от условного $1 до внушительных $299 (экспресс-регистрация в каталоге Yahoo!). Для определенных типов сайтов стоимость регистрации может быть и значительно выше. За экспресс-регистрацию сайта adult-темы каталог Yahoo! требует, как уже указывалось ранее, $600, при этом нет никаких гарантий, что ресурс будет добавлен в каталог.

Есть также каталоги, которые принимают сайты и на платной, и бесплатной основе, например, Яндекс. Каталог или тот же каталог Yahoo! В первом случае заявка будет гарантированно рассмотрена модератором в течение определенного времени (обычно 1–2 дня). В случае бесплатной регистрации заявку могут рассмотреть через неделю, месяц, несколько месяцев или вообще никогда. Также существуют только платные и только бесплатные каталоги.

1.7.2. "Перпендикулярный" каталог

Первые пробы совмещения Яндекс. Поиска и каталога относятся к 1998 году, когда были начаты работы по интеграции поисковой системы в каталог российских ресурсов Интернета "Ау" (теперь — Апорт). Затем была совместная работа с каталогом List.ru, чья база ссылок использовалась для структурирования поиска. Но уже через два года компания объявила о запуске собственного каталога, выполненного на основе иных принципов распределения ссылок. Хотя в его основу и было положено тематическое распределение ссылок по категориям, но это деление имеет всего 4 уровня (вначале количество уровней было 2).

В пресс-релизе, посвященном запуску каталога, Елена Колмановская, главный редактор "Яндекса", так описывала новый проект:

По сути, мы придумали новую структуру каталога. Деревообразные каталоги — самые распространенные, однако когда глубина их разветвленности большая, на конечных этапах очень сложно однозначно классифицировать тот или иной ресурс. Мы разделяем и описываем ресурсы не по одному дереву, а по фасетам, это так называемая перпендикулярная рубрикация. На примере раздела СМИ это можно объяснить так: здесь привыкли видеть деление по носителям — "Радио", "Телевидение", "Газеты" и т. д. Кроме этого, СМИ можно делить по тематике. Наш каталог предлагает объединение этих возможностей — можно посмотреть только СМИ и только по выбранной теме, например, научные журналы или музыкальные радиопередачи. По сути, мы создали первый "не-Yahoo! — образный" каталог Рунета.

Ранее каталог на Яндексе носил вспомогательную функцию — основной задачей был поиск. Теперь же каталог — это отдельная сущность. Каталог и поиск — равноправно-дополнительные вещи. Существует два способа навигации в Интернете — задавать запрос или двигаться по ссылкам. Или, по-другому, два вида пользователей — тех, кто пользуется преимущественно клавиатурой (это поиск), и тех, кто пользуется преимущественно мышью (это каталог). Мы постарались дать пользователю обе возможности навигации и удобный переход от одной к другой.

На данный момент в каталоге Яндекса, по словам Елены Колмановской, более 20 тыс. российских интернет-ресурсов, что соответствует примерно 150 тыс. единиц описания в обычном каталоге. Отбирались они для первичного наполнения по рейтингу, основанному на индексе цитирования. Работа над каталогом велась более года, после чего каталог Яндекса покрыл больше половины российского сегмента Интернета.

1.7.3. Структура каталога

На сегодня в каталоге Яндекса 15 разделов первого уровня (рис. 1.16). Помимо привычных, встречающихся и в иных каталогах разделов — Отдых, Бизнес, Культура и иных, в этом каталоге есть уникальный раздел. Он предназначен для детей и называется "Интернет — детям". В нем всего 8 подразделов с отобранными лучшими ресурсами для детей — книги, познавательные ресурсы, игровая комната, фильмы и мультики. В отдельный раздел выделены ресурсы, связанные с популярным сегодня среди детей (да и некоторых взрослых) Гарри Поттером.

Просматривая сайты, вы можете использовать различные варианты их сортировки — по цитируемости (данный вид сортировки применяется по умолчанию), по дате и по алфавиту. Если раздел, в котором вы находитесь, имеет деление на подразделы, вывод сайтов может быть организован еще тремя способами. Вы можете выводить ссылки по сайтам, по темам (в разрезе подрубрик), общим списком. Если подрубрики отсутствуют, вывод сайтов может выполняться по сайтам или списком. При выборе формирования списка по темам общий список сайтов будет сформирован в разрезе подрубрик, в каждой из которых будет представлено несколько ссылок, соответствующих выбранному принципу сортировки (по цитируемости, дате или алфавиту). Таким образом, вы можете уже на этапе выбора способа формирования списка получить 9 различных вариантов.

Но на этом возможности формирования списка ссылок не заканчиваются. Обратите внимание на правую колонку любой страницы каталога (рис. 1.17). С помощью блока ссылок, расположенных в ней, вы можете выполнить более узкую выборку. Во-первых, отобрать сайты по территориальной принадлежности. Наиболее точная выборка может быть выполнена по России и ее городам. Уточнение до города реализовано также по Украине и Белоруссии, по остальным государствам СНГ — выборка по государству, без уточнения города. Определение принадлежности сайта с точностью до города осуществляется и по некоторым иным государствам (Германия, США), по остальным определяется лишь государство.

Фильтр для вывода ссылок может быть основан и на типах сайтов. В Яндексе сайты распределены по следующим типам:

Советы — советы и инструкции, как что-то сделать;

Ссылки — онлайновые каталоги, собрания ссылок, поисковики, общие и тематические;

Энциклопедии — фундаментальные справочные издания и языковые словари;

Справочники — телефонные и адресные справочники, базы данных вакансий, прикладные справочники и пр.;

Товары и услуги — сайты с предложениями товаров и услуг;

Объявления — предложения товаров и услуг от частных лиц: доски объявлений, сайты газет объявлений, сайты индивидуальных предпринимателей;

Персоны — личные сайты, домашние страницы, сайты, созданные группами единомышленников и пр.;

Публикации — публикации различных материалов в Сети. Нажав на эту ссылку, вы впоследствии сможете еще уточнить свой запрос, выбрав нужный вам жанр — научно-технический, художественный, научно-популярный и т. п.;

Форумы — чаты, форумы, конференции.

Но в любом случае, какие бы фильтры вы ни использовали, последовательность вывода списка сайтов определяется тематическим индексом цитирования, учитывающим количество ссылок, ведущих на сайт с других сайтов. При этом учитывается авторитетность ссылающегося сайта, что придает ссылкам различную значимость ("вес").

За счет использования фасетной структуры каталога один и тот же сайт может быть найден в различных разделах — в своей основной категории, в уточняющих подкатегориях (регион, сектор экономики, жанр и цель ресурса).

1.7.4. Поиск в каталоге

Поиск по ресурсам каталога выполняется по их заголовкам и описаниям, при этом значимость найденного в заголовке выше, чем в описании, поэтому при формировании результирующего списка эти ссылки будут находиться выше, чем ссылки, найденные по описанию.

Как и в случае поиска по документам, после выполнения поиска по каталогу вы можете перейти на результаты поиска по этому же запросу по товарам, словарям, новостям, картинкам, выбрав соответствующую ссылку под строкой запроса.

Внимание

Если ссылка под строкой запроса серая, значит в соответствующем разделе данных по вашему запросу не найдено.

Посмотрим, что есть в каталоге по теме "кулинария" и как будут представлены результаты. В строке поиска наберем слово кулинария и нажмем на <Enter>. Первое, что будет выведено в результатах — наше поисковое выражение и количество найденных сайтов. По слову "кулинария" в каталоге их нашлось 102 (рис. 1.18).

На первом месте в результатах поиска будет находиться раздел каталога, если в его название входит поисковое выражение. Нам повезло — один из разделов Яндекс. Каталога имеет название Кулинария, и по ссылке с него в результатах поиска можно перейти в этот раздел.

Подходящих разделов может быть несколько, а вот следом уже идут ссылки на сайты. Ссылки расположены по уменьшению тематического индекса цитирования (тИЦ). Описание каждого сайта состоит из:

□ названия сайта, как оно дано в каталоге (оно представлено в виде ссылки, с которой можно перейти на сайт);

□ его описания — также берется из каталога;

□ адреса (URL) сайта и значения индекса цитируемости;

□ рубрики, в которой расположена ссылка (также представлена в виде ссылки, с которой можно сразу перейти в рубрику).

Примечание

В списке найденных сайтов могут находиться и сайты из рубрик, не показанных среди найденных.

Если у сайта есть пиктограмма, она будет отображена в левой колонке (исключить отображение пиктограммы можно путем настройки результатов поиска). Аналогично можно настроить и количество ссылок, показываемых на одной странице. Если количество найденных ссылок больше, чем может быть выведено на странице, в конце страницы выводится строка для перехода на другие страницы результатов поиска.

В правой колонке страницы результатов вам покажут объявления, соответствующие вашему запросу (конечно, только в том случае, если такие объявления существуют). А вот под объявлениями — дополнительная информация о найденных сайтах. Эта информация основана на данных, введенных при обработке сайтов на этапе занесения их в каталог. Если указан регион, будут выведены регионы с указанием количества сайтов, относящихся к ним.

Примечание

Оказалось, что далеко не все сайты соотнесены с регионами. Из найденных 102 сайтов кулинарной тематики только 12 оказались связаны с Россией, один — с Америкой, для остальных регион определен не был.

Следом за перечнем регионов идет список типов сайтов с указанием количества найденных. Например, для любителей кулинарии почти половина сайтов относится к типу "Советы", а пятая часть — к публикациям. В зависимости от цели поиска можно перейти по названию интересующего вас типа и получить выборку из числа найденных.

Если среди показанных ссылок вы не сможете найти подходящую, посмотрите на ссылку внизу страницы — Поискать <поисковое выражение> в Интернете. По этой ссылке будет выполнен поиск по Индексу и представлены результаты с учетом вашего поискового выражения.

Совет

Аналогичный переход можно выполнить и с помощью ссылки под строкой запроса Везде. Результаты будут идентичными.

Поиск сайтов по запросу кулинария в каталоге List.Mail.Ru дал несколько больший результирующий список найденных сайтов, но этот каталог и создавался для регистрации максимального количества сайтов.

1.7.5. Регистрация в каталоге

Как и для чего регистрируются сайты в каталоге? Не достаточно ли уже того, что сайт проиндексирован поисковым роботом и включен в Индекс? Тем, кто не собирается продвигать свой сайт для попадания на первые страницы результатов запросов, регистрация в каталоге, действительно, не столь важна. А вот если вы хотите увеличить количество посетителей своего сайта, поднять его популярность, без регистрации в каталоге не обойтись.

Регистрация в каталоге дает следующие преимущества владельцу сайта:

□ увеличение количества посетителей из каталога, особенно в том случае, если тИЦ сайта значителен;

□ тИЦ не только оказывает влияние на увеличение трафика, но и сам постепенно растет после регистрации сайта в каталог. Как результат — появление новых предложений об обмене ссылками, что опять же будет приводить к увеличению тИЦ;

□ возможность поиска сайта по уточненному запросу к определенной рубрике каталога или по географическому признаку;

□ положение сайта в каталоге оказывает непосредственное влияние на ранжирование в поисковой системе Яндекс, что опять же будет приводить к увеличению количества посетителей сайта.

Влияние каталога на результаты поиска очень велико. Если сайт в каталоге отсутствует, практически невозможно по конкурентным запросам попасть на первые страницы поиска. На место выдачи влияет не только тематический индекс цитирования, но, что очень вероятно, и "вес" рубрики каталога, в которой находится ссылка. Еще один фактор, влияющий на место в выдаче результата, показывает то, где найдено поисковое выражение — в названии сайта или в его описании. Нахождение поисковых слов в описании имеет понижающий коэффициент по сравнению с названием сайта. С этим понижающим коэффициентом связан и вывод сайтов в результатах поиска по каталогу. Вначале идут сайты, у которых поисковое выражение найдено в заголовке, и они выстраиваются по мере снижения индекса цитируемости. А уже следом идут сайты, для которых поисковое выражение найдено в описании.

Теперь о самой регистрации. Существует два варианта — бесплатный и платный. Отличие, как можно сразу догадаться, заключается в том, что при платной регистрации обработка заявки и размещение ссылки в каталоге осуществляется в течение 3 дней (за исключениями, о которых чуть далее), а при бесплатной регистрации вероятность того, что сайт будет принят, весьма невелика. В этом случае ожидание регистрации может длиться недели, месяцы и годы. А может и вообще не состояться. Что интересно, в каталог по бесплатной регистрации могут попасть сайты, выполненные не на самом профессиональном уровне. Скорее всего, оценивается и уникальность сайтов в информационном или ином плане. Возможно, перед сотрудниками поставлена задача представить в каталоге информацию о как можно большем количестве тем. Помимо регистрации, инициированной владельцем ресурса, в каталог может попасть сайт, владелец которого и не думал об этом. Это сделали сотрудники по собственной инициативе, посчитав, что сайт заслуживает размещения на их ресурсе.

Статистика добавления сайтов в каталог

За апрель 2007 года в каталоге было зарегистрировано 2469 сайтов, из них:

• бесплатно 2026 сайтов,

• на платной основе — 443.

В каталог можно добавлять сайты на любом языке — главное, чтобы название и описание были на русском. Кроме этого требования, есть и иные. В каталоге не будут публиковаться сайты, являющиеся либо зеркалами уже зарегистрированного сайта, либо его частичными дубликатами. (В том случае, если кто-то преднамеренно создал дубликат интересного сайта и успел зарегистрировать его в каталоге первым, Яндекс не будет участвовать в спорах об авторских правах. В лучшем случае, оба сайта будут удалены из каталога.) Не предлагайте к регистрации незаконченные сайты — такие заявки к рассмотрению не принимаются, а подать заявку повторно будет крайне сложно.

Отказ в регистрации или удаление уже зарегистрированного сайта может быть осуществлено без какого-либо разъяснения со стороны администрации каталога. Известны случаи, когда для восстановления сайта в каталоге требовались месяцы переписки. С другой стороны, администрация Яндекса оставляет за собой право принимать или отклонять требования об исключении опубликованного сайта из каталога (за исключением официальных обращений правоохранительных органов). Кроме того, Яндекс оставляет за собой право изменять название сайта при его публикации в каталоге, так же как и предложенное владельцем описание.

Есть определенные требования и к заполнению формы регистрации сайта. Эти требования можно охарактеризовать следующими положениями:

□ описание сайта предназначено для посетителей каталога, а не для роботов поисковых систем, поэтому оно должно характеризовать содержание сайта, а не содержать набор ключевых слов;

□ если к регистрации предлагается сайт компании, описание должно характеризовать сайт, но не компанию, представленную на нем;

□ никакой рекламы в описании (здесь можно вспомнить закон о рекламе, который напрямую запрещает использование превосходных степеней сравнения).

И при всем этом сотрудники каталога имеют полное право переработать предложенное описание и название сайта, ориентируясь на определенные правила их составления.

Особые правила действуют в случае необходимости изменения описания опубликованного сайта, связанные с изменением его содержания либо обнаружением ошибок. Для изменения описания требуется выслать в службу поддержки каталога соответствующее письмо-просьбу, но будет ли принята такая просьба или нет, решает только администрация. Есть, впрочем, и другой способ — оплатить свою просьбу. Стоимость такой услуги для сайтов, содержание которых связано с деятельностью, направленной на получение дохода, и/или политической рекламой, — 4500 руб. без НДС, для остальных 1200 руб. без НДС. Но даже в этом случае необходимо убедить сотрудника, отвечающего за раздел, где размещена ваша ссылка, в ее целесообразности.

Бесплатная регистрация

Если вы хотите подать заявку на бесплатную регистрацию сайта, вам потребуется заполнить форму. В ней несколько полей:

□ адрес (URL) сайта;

□ название ресурса (не размахивайтесь на большое описание — в нем не должно быть более 50 символов);

□ описание сайта — по количеству знаков оно аналогично описанию в каталоге List.Mail.ru и составляет 200 символов;

□ категория каталога, в которой вы хотели бы опубликовать свой ресурс;

□ регион — выбирается по России до уровня федерального округа;

□ сектор экономики — возможны три варианта: государственный, коммерческий и некоммерческий;

□ адрес вашей электронной почты;

□ контрольная строка, в которую вы должны будете вписать символы, изображенные на рисунке. Поэтому, приступая к регистрации, включите загрузку изображений.

После заполнения всех полей остается нажать на кнопку Отправить заявку и ждать, когда с вами свяжутся и сообщат. Но сообщат только в том случае, если заявка будет рассмотрена и принята к публикации.

Платная регистрация

Для отправки заявки на платную регистрацию, вам необходимо быть зарегистрированным пользователем Яндекса.

Форма для заполнения заявки (рис. 1.19) несколько отличается от формы бесплатной регистрации. Кроме полей для адреса, названия и описания ресурса, категории, региона и сектора экономики, здесь присутствует несколько дополнительных полей. Вы должны будете указать ФИО контактного лица (на это имя будет выставлен счет). Выбрать назначение сайта — не бойтесь, выбор весьма скуден: либо вы говорите, что сайт создан для извлечения прибыли, либо нет. От этого зависит сумма, которую вам потребуется заплатить за регистрацию. За сайт, предназначенный для получения дохода, придется заплатить 7500 рублей, за остальные — 1500. Безусловно, что бы вы ни указали в поле назначения ресурса, перед выставлением счета сайт будет проверен администрацией, и стоимость будет определена в соответствии с их, а не вашим, решением.

Вот принцип, на котором основано отнесение ресурса к категории сайтов, предназначенных для получения дохода:

Для целей размещения в Каталоге ресурс квалифицируется как сайт, содержание которого связано с деятельностью, направленной на получение дохода, если сайт содержит информацию о товарах, работах (услугах), идеях и начинаниях, которая предназначена для неопределенного круга лиц и призвана формировать или поддерживать интерес к физическому и/или юридическому лицу, товарам, работам (услугам), идеям и начинаниям и способствовать их реализации, рекламированию, продвижению.

Срок рассмотрения заявки составляет сутки, после чего на имя заявителя будет отправлена информация о том, будет ли сайт опубликован в каталоге после оплаты регистрации. Если вы получили письмо с подтверждением, остается лишь оплатить регистрацию.

Юридические лица оплачивают банковским переводом, а для физических лиц возможны варианты оплаты:

□ переводом на счет Яндекса через Сбербанк;

□ кредитной картой Visa и EC/MC;

□ Яндекс. Деньгами.

Здесь необходимо обратить внимание еще на один важный момент. До того, как сайт будет опубликован в каталоге, он будет проверен специальной программой на доступность. Если в результате проверки будет трижды получен отрицательный результат, сайт к публикации не принимается. А недоступность может быть связана с тем, что хостинг-провайдер, где вы разместили свой ресурс, запретил доступ к сайту методом head. Решение этой проблемы остается за заказчиком, и лучше ее решить до того, как будет подана заявка.

1.8. Яндекс. Музыка

Вы любите музыку? Джаз, металл, классику? Вы собираете коллекцию музыкальных произведений? Вы их покупаете на дисках, скачиваете из Интернета? Размещение и распространение музыкальных произведений в сети Интернет стало всеохватывающим. И кто только не размещает их — авторы и исполнители на своих сайтах, компании, которые приобрели права на распространение, онлайновые магазины, любители тех или иных исполнителей. И далеко не всегда при размещении в Сети записи музыкального произведения человек задумывается о том, нарушает ли он или нет чьи-то права на интеллектуальную собственность. Тем более об этом не задумываются те, кто ищет музыку. А для поиска приходят на Яндекс.

Не удивительно, что и здесь сработал закон перехода количества в качество. Когда количество запросов музыкальных произведений перешло критическую отметку, Яндекс создал специальную службу Яндекс. Музыка http://music.yandex.ru/ (рис. 1.20).

Нет, здесь не размещаются записи музыкальных произведений — задача Яндекса иная, и заключается в том, чтобы предоставить возможность удобного поиска музыки. Сегодня поиск ведется по сотням тысяч музыкальных произведений, десяткам тысяч альбомов, тысячам исполнителей. Музыкальные направления представлены самые разнообразные — здесь есть рок и блюз, классика и авторская песня, народная музыка и танцевальная.

Вся информация для размещения в Яндексе предоставляется партнерами (в первую очередь — онлайновыми магазинами). Сами произведения показываются только в виде ссылок. Одно и то же произведение или альбом может быть представлено несколькими партнерами. В этом случае происходит автоматическая обработка представленной информации, и на ее основе формируется обобщенная страница, на которой будут предложены все имеющиеся о произведении или альбоме сведения.

Страница произведения содержит информацию о качестве записи, формате и стоимости каждого файла у различных партнеров и ссылки на сайты, где можно купить или скачать бесплатно файл с нужной музыкой (рис. 1.21). Кроме того, пользователю предлагается возможность прослушать фрагмент композиции — такие музыкальные цитаты также предоставляются партнерами службы.

К партнерству Яндекс приглашает все сайты — как онлайновые магазины, так и сайты, имеющие собственные музыкальные архивы, как платные, так и бесплатные. При этом требуется одно — у владельца такого сайта должны быть права на распространение записей. Предпочтение отдается тем, у кого есть лицензии на распространение, полученные у правообладателей. Политика сервиса Яндекс. Музыка предусматривает, что по заявлению участника, обладающего прямыми правами, из базы сервиса могут быть удалены соответствующие предложения партнеров, не обладающих такими правами.

С одной стороны, Яндекс. Музыка привлекает к себе новых посетителей. С другой — эти посетители становятся и посетителями музыкальных сайтов. Выгода взаимная. Но все же еще большая выгода — для посетителей. Ведь Яндекс. Музыка — это своеобразная витрина музыкального рынка, на которой представлены только легально распространяемые произведения, за качество которых отвечают конкретные правообладатели. Удобно искать — как и при поиске по Каталогу, где в результаты помещаются только ссылки на зарегистрированные сайты, здесь в результаты поиска помещается только та информация, которая предоставлена партнерами этому проекту.

Участие партнеров, продающих записи, основано на коммерческой основе с оплатой размещения за переходы на сайт (pay-per-click). Для сайтов с бесплатной музыкой предусмотрено бесплатное участие.

Служба Яндекс. Музыка предлагает несколько вариантов поиска по своей базе данных.

Внимание!

Раздел Яндекс. Музыка доступен только для российских пользователей, что определяется по его IP-адресу, и даже регистрация на портале в этом случае не помогает. Похоже, это связано с различными законами по защите авторских прав, действующими в России и в других странах.

Вас могут не пустить в раздел и в том случае, если ваш интернет-провайдер начал использовать новый пул IP-адресов, которые ранее были запрещены к использованию в Интернете. Единственное, что может помочь вам в этом случае, — обращение в службу техподдержки. И здесь я могу высказать лишь хорошее мнение об этой службе. На мое обращение отреагировали в течение суток, после чего мною была передана дополнительная информация, и еще через сутки проблема была решена. Долго? Возможно. Но учитывая объемы работ по сопровождению проектов, решение было принято во вполне достойные сроки.

Поиск через поисковую строку

Введите запрос в форму поиска, указав название композиции, группы или альбома. Вам не обязательно помнить точное название, ведь поиск Яндекса может найти нужную композицию и по одному слову. В результатах поиска будут выданы ссылки на информацию о музыкальных файлах, в названиях которых встречаются заданные слова.

Поиск по каталогу

Этот поиск еще проще, но он ограничен поиском по названию группы или исполнителя, по названиям композиций этот поиск не работает. В алфавитном каталоге нужно выбрать букву, с которой начинается имя исполнителя или группы. На странице, куда вы будете перенаправлены, будет выдан список популярных групп и исполнителей. Но обратите внимание на ссылку Показать всех (эта ссылка расположена под формой поиска) — если нужного исполнителя среди популярных нет, попробуйте перейти по этой ссылке, и тогда в список попадут уже все, чьи имена начинаются с выбранной буквы.

Результаты поиска

Выбрав исполнителя, перейдите по ссылке. Откроется страница, на которой будет информация об альбомах этого исполнителя и отдельных композициях. Такая же страница откроется и в результате поиска через поисковую строку. Здесь будет сказано, сколько найдено исполнителей, альбомов и композиций. Следом за этой информацией — часть найденного, наиболее популярные исполнители и диски, хотя чаще всего для вывода информации об исполнителях места хватает, а вот для дисков и композиций — нет. Поэтому выводятся наиболее популярные.

Примечание

Поиск через строку поиска ведется только по полному слову. Например, поиск по слову Rammstein дал сведения о группе, ее дисках и нескольких сотнях их композиций, а поиск по слову Ramm дал результат лишь по одному исполнителю и шести композициям.

Переход по ссылке с названия исполнителя открывает страницу со списком его альбомов и композиций (рис. 1.22). Под названием каждого альбома или композиции есть кнопка для прослушивания небольшого отрывка. Щелкните на ней — откроется окно, где будет список отрывков, представленных различными партнерами. Как правило, это отрывок длительностью до 1 минуты и невысокого качества — только для пробного прослушивания произведения.

Выбрав альбом, перейдите по ссылке с названия или изображения. На следующей странице вы получите информацию о размере альбома, о входящих в него треках, а также ссылки на сайты магазинов с указанием цен. Кроме информации о том, какова стоимость приобретения диска или трека, здесь есть сведения о формате файла, качестве звучания и времени звучания для этого качества. Чтобы скачать музыкальные файлы, перейдите на сайт магазина по ссылке Цена.

Если вас интересует не весь альбом, а только отдельные треки, перейдите по ссылке на страницу этого трека, а далее по ссылке Цена перейдите на сайт магазина, предлагающего лучшие условия приобретения.

1.9. Товары на Яндексе

В Интернете есть множество ресурсов, предлагающих самые разнообразные товары. Часть таких интернет-магазинов широко известна, например, онлайновые книжные магазины Ozon, "Книги почтой", магазины электронной техники (Fotik.com, Ultraline.ru) и др. Другая часть магазинов известна меньше, тем не менее товары, предлагаемые ими, также востребованы, но найти их сложнее. Используя возможности Интернета, люди ищут через поисковые системы не только информационные сайты, но и товары, которые их интересуют. Но при поиске товаров удобнее было бы пользоваться специализированным поиском, в котором не смешивается воедино информация о товаре и предложения магазинов.

Нет ничего удивительного в том, что Яндекс, число посетителей которого превышает 5 млн человек в день, открыл специальный проект Яндекс. Маркет (рис. 1.23), который стал информационно-справочной системой для тех, кто хочет приобрести товар или услугу, затратив на это минимальное время. И точно так же, как в случае с музыкальными произведениями, информацию для этой системы предоставляют поставщики товаров, т. е. те самые магазины, которые их продают. Сегодня магазинов здесь уже более тысячи, а это значит, что здесь можно найти очень многое.

Но Яндекс. Маркет — не только витрина, он также и хороший помощник. Помимо информирования о наличии товара, его ценах и магазинах, предлагающих выбранный товар, пользователь сервиса получает возможность сравнить модели и цены, получить по ряду товаров консультацию Гуру. А это особенно важно, поскольку в описаниях предлагаемых товаров можно просто заблудиться — их больше ста тысяч, и количество предложений постоянно увеличивается.

Прежде чем мы рассмотрим возможности сервиса, необходимо обратить внимание на два момента, связанных с гарантиями на приобретаемые товары:

□ компания "Яндекс" не предоставляет никаких гарантий, рекомендаций и поручительств в отношении услуг и/или товаров, продаваемых магазинами, информация о которых размещена на сайте Яндекс. Маркет, не принимает на себя никаких обязательств и не несет никакой ответственности в отношении цен, наличия, качества, характеристик товаров и услуг, проданных пользователю сайта Яндекс. Маркет магазином, информация о котором размещена на сайте Яндекс. Маркет;

□ сделка по покупке товара и/или услуги, информация о которых размещена на Яндекс. Маркет, осуществляется непосредственно между покупателем и соответствующим магазином. Любой вопрос, спор или претензия в отношении такой покупки должны быть адресованы этому магазину. ООО "Яндекс" не несет никакой ответственности за магазины, информация об услугах и/или товарах которых размещена на сайте Яндекс. Маркет, а также за какие-либо отношения покупателей с этими магазинами и какие-либо последствия таких отношений.

Как попасть на Яндекс. Маркет? Посмотрите внимательно на главную страницу Яндекса. В блоке, где размещены ссылки на разделы Каталога, есть ссылка и на раздел Маркет — подбор товаров, сравнение цен. Переход на сервис можно выполнить и с помощью ссылки Маркет, размещенной под строкой поиска. А можно набрать в браузере адрес http://market.yandex.ru/ и сразу перейти в нужный раздел.

Основная страница Яндекс. Маркет разделена на несколько блоков. Первый блок занимают наиболее популярные разделы — Компьютеры и Телефоны, Авто и Бытовая техника, Детский мир и Спортивные товары. Каждый из этих разделов сопровождается одной или несколькими ссылками на подразделы. К примеру, в разделе Спортивные товары наибольшей популярностью стали пользоваться GPS-навигаторы и подраздел, посвященный им, оказался выведенным на главную страницу Маркета.

Следующий блок включает ссылки на остальные разделы каталога товаров и услуг, не сопровождаемые ссылками на их подразделы. Каждый из основных разделов каталога сопровождается информацией о количестве товаров, представленных в нем (рис. 1.24). Это количество изменяется ежедневно, учитывая изменения предложений магазинов. Самое большое количество предложенных товаров в разделе Книги — их свыше четырехсот тысяч. Самое маленькое количество товаров в середине января 2007 года было предложено в разделе Животные и растения — одно. Количество разделов постоянно увеличивается. Связано это, как правило, с появлением новых видов товаров, спрос на которые увеличивается.

Третий блок основной страницы Яндекс. Маркета — алфавитный список производителей. На главной странице он представлен используемыми в качестве первых символов названий компаний букв или цифр. Он удобен в том случае, если вы ищете товар или услуги конкретной компании. Переход с буквы/цифры приведет на страницу, где будут размещен список компаний, чьи названия начинаются с выбранного символа.

В правой колонке — рекламные предложения товаров. Как правило, здесь группируется несколько предложений по одной из групп товаров. Это могут быть КПК и детские коляски, холодильники и обогреватели. Количество рекламных предложений по популярным моделям варьируется от одного до трех. Кроме рекламных предложений, в этой же колонке есть ссылка для общения с Гуру, а также информация о текущих настройках Маркета, в которых показан регион доставки и основная валюта.

1.9.1. Настройка Маркета

Перейти на страницу настройки Яндекс. Маркета можно двумя способами — по ссылке в верхней части окна, либо по ссылке Настроить в правой колонке. В любом случае вы попадете на одну и ту же страницу.

Настройка раздела заключается в определении параметров показа по трем категориям:

□ цены;

□ мой регион;

□ другие настройки.

В каталоге информация о товарах включает и сведения о стоимости товара. Но покупать его могут как за рубли, так и за другую валюту. Поэтому в настройках вы можете выбрать валюту, в которой вам будут показаны цены. Это может быть рубль, гривна, доллар или евро. Вы можете настроить и дополнительную валюту, выбрав ее из такого же перечня. Если дополнительная валюта отличается от основной, то цена товара в пересчете на эту валюту будет показана в скобках после основной цены.

Но двойная цена будет показана только в том случае, если в настройках показа цен для магазинов вы выберете пункт Показывать цену, пересчитанную в основную и дополнительную валюту. В других случаях: Показывать цену, пересчитанную в основную валюту, и Показывать цену, пересчитанную в рубли, и цену по курсу магазина — цена в дополнительной валюте не показывается. Для пересчета цен используется официальный курс ЦБ РФ.

Настройка региона, как и в случае аналогичной настройки Поиска, заключается в возможности самостоятельно определить свой регион в качестве региона доставки. Вполне вероятно, что часть предложений магазинов ограничивается доставкой только в пределах своего, а не вашего, города или района, и такие предложения вряд ли вас могут заинтересовать. Впрочем, вы можете определить, показывать ли вам предложения других регионов (такие предложения будут показаны после предложений по вашему региону), отказаться от их показа или игнорировать при показе предложений ваш регион.

К иным настройкам относятся количество предложений, выводимых на одной странице, и показ изображений товаров, которые вы можете отключить. В любой момент вы можете вернуть настройки к значениям по умолчанию, выбрав соответствующую ссылку на странице настроек.

1.9.2. Поиск товаров и услуг

Поиск можно выполнять различными способами:

□ по каталогу;

□ по наименованию товара;

□ по производителю.

Поиск по каталогу

Допустим, вам нужен обогреватель. Где вы будете его искать? Наверняка, в разделе Бытовая техника. Перейдем по ссылке с главной страницы в этот раздел и в подразделе Климатическое оборудование действительно увидим группу товаров Обогреватели. Откроем эту группу.

Внимание

Для различных групп товаров структура страницы может отличаться и не соответствовать тому, что описано далее.

Предложений, относящихся к данному типу товара, очень много, и определить, что же вам действительно требуется, с первого раза не получится. Если говорить об обогревателях, то предложений только по современным моделям свыше 1400, а всего количество предложений превышает 8700. Ну как тут сообразить, какая модель вам нужна. Поэтому Яндекс. Маркет предлагает воспользоваться своеобразным фильтром, в котором от вас потребуется указать параметры, по которым будет выполнен отбор предложений (рис. 1.25).

В минимальном приближении можно отметить три основных параметра — диапазон цен, тип обогревателя и его мощность. Если этих параметров для выбора мало, перейдите по ссылке По другим параметрам. Откроется новая страница, где параметров будет уже больше. При этом в зависимости от подбираемого оборудования список параметров может быть разделен еще на две части — обычный набор параметров и расширенный. Кроме технических параметров, здесь возможен выбор и по производителям.

Такие фильтры, с набором условий выбора, на Яндекс. Маркете назвали рецептами. А для некоторых наиболее популярных разделов, вы можете спросить совета у Гуру (рис. 1.26). Последовательно отвечая на ряд простых вопросов, вы сможете подобрать модель, соответствующую вашим требованиям, начиная от телефона для студентов (http://market.yandex.ru/ catalogmodels.xml?CAT_ID=160043&hid=91491&showlayer=rezqlayer) и заканчивая кондиционером для ценителей комфорта (http://market.yandex.ru/catalogmodels.xml?CAT_ID=141694&hid=90578 &showlayer=rezqlayer). Разделы, в которых можно воспользоваться рецептами, отмечены в каталоге специальным значком.

Но вернемся на страницу оборудования. Под блоком настроек выбора по параметрам располагается блок ссылок на производителей, пользующихся наибольшей популярностью либо предлагающих самые современные модели разыскиваемого товара. Для каждого производителя — количество предложений его оборудования (предложения идут, как правило, не от производителя, а от торгующих организаций, которые могут предлагать и одинаковые модели). По ссылке Показать всех производителей будет открыта страница со всеми компаниями, производящими разыскиваемое оборудование. Если предложений не очень много, можно открыть их списком, перейдя по ссылкам Современные модели или Все предложения.

Если перейти по ссылке с названия производителя, попадем на страницу с его моделями, предлагаемыми различными поставщиками. Список предложений можно отсортировать по цене, названию модели, числу магазинов и предложений, по новизне, наличию в продаже. Для каждой модели указан диапазон цен, краткие технические характеристики, ссылка на перечень предложений, а также ссылка с интересным названием — Добавить к сравнению.

Совет

Если вы уже сравнивали какие-либо товары между собой, перед тем как перейти к сравнению других товаров, очистите список. В противном случае вы начнете сравнивать несравниваемые товары, поскольку список для сравнения сам по себе не очищается, и его необходимо обнулять "вручную".

Перейдя по ссылке с названия модели, получим подробную информацию о технических характеристиках, средней цене модели и диапазоне цен, количестве предложений. На Яндекс. Маркете есть и обратная связь с посетителями — по любому товару можно оставить свой отзыв на форуме. Ссылка на тему по той или иной модели находится на странице ее описания под техническими характеристиками, а если кто-то уже оставил сообщение, оно будет показано здесь же.

В правой колонке размещена ссылка на предложения товара, а также на модели, похожие на рассматриваемую. В этом списке можно увидеть пять наиболее похожих моделей выбранного вами устройства. Алгоритм подсчета степени похожести моделей учитывает близость значений параметров и цены. При этом параметры имеют различный коэффициент влияния в зависимости от их важности для выбора. Кроме этого, есть блок ссылок для сравнения моделей. Вы можете расширить этот список, а затем их сравнить. Сравнение проводится по всем техническим характеристикам (рис. 1.27), но можно ограничить их список только различающимися параметрами.

В отдельных категориях, таких как Сотовые телефоны, Цифровые фотоаппараты, КПК, МРЗ-плееры реализована поддержка нескольких увеличенных картинок, что позволяет рассмотреть выбранные модели со всех сторон.

Кстати

Аналитики Яндекса могут довольно четко прослеживать связь погоды и посещения разделов Яндекс. Маркет. В зимние морозные дни в январе 2006 года, когда столбик термометра опускался ниже 30 °C, резко возросла посещаемость раздела Обогреватели. Если 10–15 января там было в среднем 150 посетителей, то 16 января (в день резкого понижения температуры) обогревателями заинтересовались уже 249 пользователей, 18 января (самый холодный день) — 616, 19 января поспешили обогреть дом перед выходными 818 человек, а в субботу сдались самые стойкие 1298 пользователей Яндекс. Маркета.

Поиск по наименованию товара

Поиск по наименованию товара удобнее вести через поисковую строку. Набрав в ней наименование товара (или часть наименования), выполним поиск. Например, нам надо найти манометр. При этом мы не уточняем, будет ли это медицинский манометр или элемент пневмоинструмента.

В результате поиска откроется страница с перечнем различных манометров, отсортированных по релевантности запроса. Список можно пересортировать по наличию и цене, либо только по цене. Кроме того, из этого списка можно сделать дополнительные выборки — товары, которые есть в наличии, и товары, поставляемые по заказу. Следующая выборка — регион доставки. Здесь вам будет предложено либо оставить все товары (доставка без учета региона), либо выбрать те товары, которые могут быть доставлены в ваш регион.

Поскольку мы при вводе запроса не уточняли, что за манометр нас интересует, в отдельном блоке будет выведено дерево категорий каталога товаров, в которых были найдены товары, соответствующие запросу. В нашем случае оказалось, что манометры можно найти среди аксессуаров для подводного плавания и аксессуаров для сада и огорода, среди пневмоинструментов и лекарственных препаратов. Вот здесь уже получится резко сузить диапазон товаров, выбрав нужную категорию, — в списке останутся лишь товары, относящиеся к ней.

Но и это еще не все возможности ограничения выбора. Следующий блок ссылок состоит из магазинов, которые предлагают отобранные товары. Зачем это нужно? Возможно, вы уже покупали товары в каком-либо магазине, и у вас сложилось о нем свое мнение, хорошее или плохое. Если мнение о магазине положительное, вы, вполне вероятно, захотите и новый товар приобрести в нем. Щелкните на названии этого магазина, и в вашем списке останутся лишь те товары, которые предлагаются им.

Наконец, еще один фильтр настроен на возможность использования для оплаты Яндекс. Денег. Не секрет, что не все магазины принимают оплату электронными деньгами Яндекса, но если у вас желание оплатить ими, отберите товары, за которые вы можете расплатиться таким образом.

Дальнейшие действия — просмотр технических или иных характеристик, сравнение с аналогами, получение совета у Гуру, выполняется точно так же, как и при просмотре товаров в рубриках каталога.

Поиск по производителю

Поиск по производителю не представляет никакой сложности для посетителя Яндекс. Маркет. На главной странице расположен алфавитный перечень производителей. Если вы знаете название компании, перейдите по букве, на которую оно начинается.

Совет

Но не ищите название компании через строку поиска, — вы получите список товаров, в которые входит искомое слово, но не компанию с этим названием.

На странице будет представлен список всех компаний, начинающихся на нужную букву. Найдите "свою" компанию и перейдите по ссылке с ее названия. На странице компании будут представлены разделы, в которых присутствуют товары, производимые ею. А также ссылка на форум, где можно записать свое мнение о компании, ее товарах, а если кто-то уже оставил запись на форуме — прочитать его.

Описание товара

Рассмотрим, как описывается товар на странице результатов поиска. Почти каждый товар сопровождается картинкой с изображением представленной модели. В текстовой части в первой строке показан путь до раздела каталога, в котором размещен товар, начиная от основного раздела. Каждый раздел представлен в виде ссылки, по которой можно в него перейти.

В следующей строке дается название товара, как оно записано в каталоге. Как с изображения, так и с названия можно перейти на страницу описания указанной модели (или услуги). Если товар предлагается только одним магазином, в следующей строке вы увидите его стоимость, отметку о том, есть ли этот товар в наличии, ссылку на магазин, предлагающий его, и ссылку Оценить магазин, следуя которой вы сможете дать магазину свою оценку. И обратите внимание на ссылку в верхней части страницы — Любимые магазины. Это ваши, вами оцененные магазины, как любимые, так и те, о которых у вас сложилось плохое мнение. Перейдя по этой ссылке, вы увидите весь список магазинов, которые вы успели оценить (рис. 1.28).

Зачем оценивать магазин?

Ваша оценка будет влиять на место показа их предложений в вашем поиске (только вашем!). Поэтому, если вы решили дать оценку магазину, — зарегистрируйтесь и залогиньтесь на Яндексе. А правила оценки очень простые. Щелкнув на ссылке Оценить магазин, вы откроете новое окно, в котором будут предложены оценки, как положительные, так и отрицательные. Положительные оценки поднимут предложения магазина в результатах выдачи, отрицательные — опустят вниз. Самая отрицательная оценка удалит предложения магазина из выдачи предложений. Окончательное решение, что делать с лучшими и худшими магазинами вы сможете установить на странице настроек, — http://market.yandex.ru/grade-settings.xml.

На этой же странице вы можете изменить данную вами оценку. Найдите магазин, мнение о котором у вас поменялось, и дайте ему новую оценку. Аналогичным способом можно вернуть в результаты выдачи предложения магазина, которому вы поставили худшую оценку. Просто измените данную ему оценку, и его предложения вновь появятся среди результатов. Еще один способ изменить оценку — снова перейти по ссылке Оценить магазин и поставить новую. Здесь же можно не только поставить оценку, но и оставить свой отзыв. (Будьте уверены — администраторы Яндекс. Маркета внимательно следят за вашими оценками и мнениями и учитывают их при работе со своими партнерами.) Эти отзывы и оценки, как следует из Правил пользования Яндекс. Маркетом, могут быть опубликованы Яндексом без дополнительного согласия с пользователем на данном проекте, или в других службах Яндекса. И обратите внимание, что отзывы будут публиковаться так, как вы их написали, без редактирования, с сохранением пунктуации и грамматики, под вашим псевдонимом.

Хотите пожаловаться? И это не проблема. После перехода по ссылке Оценить нажмите на кнопку Оценить и пожаловаться. В открывшейся форме уточните жалобу (например, в предложениях сказано, что товар есть в наличии, но после звонка в магазин выяснилось, что его нет и не ожидается). Выбрав тип жалобы, нажмите на кнопку Сообщить. Впрочем, можно обойтись и без столь длительной процедуры, если перейти по ссылке Пожаловаться Яндексу.

Яндекс сохраняет историю данных вами оценок. Зайдите на страницу Любимые магазины, найдите нужный и щелкните на названии. Будет показана последняя поставленная вами оценка. Но если щелкнуть на ссылке история, вы увидите последовательность изменения вашего мнения о магазине.

Вернемся к нашему выбору. Возможно, что для интересующего вас товара существуют особые условия поставки. Например, для тонометра по цене 166 руб. есть условие, что минимальная сумма заказа должна быть больше 3000 рублей. Такие дополнительные условия приводятся в следующей строке.

Наконец, в следующих строках описания приводится информация о регионе доставки и дополнительных характеристиках товара, если продавец считает, что они необходимы посетителю.

Несколько иначе выглядит описание найденных товаров, если количество предложений больше единицы. В этом случае вместо цены товара будет представлен диапазон цен, предложения по нескольким магазинам и ссылка на все имеющиеся предложения.

1.10. Яндекс и Адреса

Если службы Яндекса, о которых мы говорили раньше, были созданы или приобретены и доработаны компанией "Яндекс", то служба адресов создана и поддерживается Яндексом совместно с компанией "Эниро Рус-М" — "Желтые страницы Москва" (http://www.yellowpages.ru/). Начало совместному проекту было положено в конце 2005 года, а сегодня суммарная недельная аудитория сайтов Яндекс. Адреса и YellowPages.ru превышает 320 тыс. уникальных пользователей.

Яндекс. Адреса — это поиск по организациям и компаниям 58 регионов России (рис. 1.29). Компании разнесены по тематическому рубрикатору, включающему свыше 1600 рубрик. Для каждой организации в справочнике приведено ее полное название, почтовый адрес, телефон, веб-сайт, если он, конечно, имеется. Для крупных городов информация о расположении компании показывается и в виде отметки на карте. Но не надо думать, что в справочнике адресов есть все компании из включенных в него городов. Отнюдь. Не больше, чем включено в Желтые страницы этого города. Поэтому найти здесь можно много, но не все.

С этим связана и акция, которая проводится также совместно двумя компаниями по добавлению в справочник новых организаций, а также исправлению информации об уже существующих (у кого-то поменялся адрес, телефон, сайт). Заявку на публикацию или изменение данных может подать любой пользователь. Любая заявка обрабатывается в течение трех рабочих дней, проверяется службой поддержки и публикуется как на страницах Яндекс. Адресов, так и на страницах YellowPages.ru. Для организаций, внесенных в справочник, есть платные услуги — приоритетное размещение в каталоге.

Коммерческое размещение компаний на первых местах в своих рубриках, соответствующих роду их деятельности, — это привычный и эффективный рекламный продукт для участников и пользователей бизнес-каталогов, — говорит Александр Смолин, генеральный директор "Эниро Рус-М — Желтые страницы Москва". — Более десяти лет успешной работы наших продавцов и консультантов показывают, что это востребованный и эффективный тип рекламы, как в бумажных изданиях, так и в интернет-каталогах. Мы ожидаем, что его эффективность для рекламодателей на Яндекс. Адресах будет также весьма высокой.

1.10.1. Поиск среди адресов

Что можно искать на Яндекс. Адреса, как не организации или компании? Это специализированный поиск, и ничего более найти здесь нельзя. Но поиск довольно своеобразный. И сейчас попробуем разобраться в этом своеобразии.

Первый вариант поиска — поиск по каталогу организаций. Откроем главную страницу сервиса. И здесь следует обратить внимание на то, что даже если вы не логинились на Яндексе, вам будет предложен поиск среди организаций того региона, за которым числится ваш IP-адрес. Ну а если вы зарегистрировались и указали при регистрации свой регион? — нет, все равно выбор остается за принадлежностью IP.

Если вы хотите искать в другом регионе, в правой колонке под названием вашей области, края, города перейдите по ссылке все регионы. Вы попадете на страницу с перечнем всех подключенных к системе Адреса российских регионов. Выбирайте нужный.

Теперь вы на странице разделов справочника (рис. 1.30). Все организации и компании разбиты на 15 основных разделов, для каждого из которых выведено по несколько популярных подрубрик. При этом подрубрика далеко не всегда может быть второго уровня, чаще — это рубрика "из глубинки". Например, для раздела Красота одной из подрубрик выведен раздел Фитнес-клубы, на самом деле находящийся на третьем уровне справочника.

Теперь можно выбрать рубрику, к которой, по вашему мнению, относится организация, которую вы ищете. К примеру, вы едете в город, где еще не бывали и хотите узнать, какие в нем есть музеи, театры, иные места развлечения. Переходите в соответствующую рубрику, где на последнем уровне будет представлен список всех развлекательных заведений одной группы. В этом списке будут представлены, к примеру, все театры всех городов выбранного вами региона. Если список большой, то внизу списка будет размещена линейка цифр, с помощью которых можно перемещаться со страницы на страницу.

Как отобрать организации одного типа по принадлежности только к одному городу? В строке поиска, которая разделена на две части, введите в подстроке Что: тип организации, например, музей, а в подстроке Где: — город и выполните поиск. В итоге у вас останется список музеев одного города.

Для каждой организации приведена краткая, но достаточная для этого вида сервиса информация. Во-первых, полное название организации. Название выведено в виде ссылки, с которой выполняется переход на страницу этой организации. В следующей строке приведен адрес (настолько полный, насколько он занесен в Желтые страницы). К сожалению, для ряда организаций от адреса присутствует лишь название города, без улицы и дома. Если есть телефон, то в следующей строке он будет приведен вместе с кодом города. Если у организации есть свой сайт, и информация о нем внесена в справочник, адрес сайта также будет приведен в информационном блоке. Есть и еще одна дополнительная строка. Она будет выведена в том случае, если организация соотнесена с несколькими категориями справочника. К примеру, организация Tverlove.ru размещена в категории Интернет-порталы, но также соотнесена с рубрикой Службы знакомств. Щелкнув на ссылке с названия рубрики, вы можете перейти в нее без дополнительных переходов по разделам справочника.

На странице этой организации дополнительной информации нет и, собственно, не совсем понятен ее смысл. Непонятно до тех пор, пока не откроешь форму добавления новой организации или не найдешь организацию, для которой введены дополнительные сведения.

Что делать, если вы обнаружили ошибку в описании организации? Сделайте две вещи: войдите на Яндекс под своим зарегистрированным именем, сделайте скриншот страницы с ошибочным, по вашему мнению, описанием. Теперь на любой странице справочника найдите ссылку Сообщить об ошибке и перейдите по ней. Заполните форму, в которой по умолчанию уже подставлено ваше имя и приведены на выбор имеющиеся у вас почтовые адреса. Заполните поля Тема сообщения, Описание, если был сделан скриншот — присоедините и его. Если скриншотов несколько — соберите их в архив и отправьте одним файлом. На указанный вами почтовый адрес будет прислан ответ от службы Яндекс. Адреса.

1.10.2. Добавление организации

Рядом со ссылкой об ошибке, есть еще одна ссылка — Добавить организацию. Для того чтобы воспользоваться ею, регистрация на Яндексе уже не требуется. Для добавления информации необходимо заполнить стандартную форму, в которой есть три обязательных поля — Название, Телефоны, Специализация. В списке специализаций может быть выбрано до трех рубрик. Выбор большего количества рубрик возможен на правах рекламы. Названия дополнительных рубрик можно перечислить в поле Дополнительная информация и предложения. Без заполнения этих полей форма на рассмотрение не может быть отправлена. Остальные поля заполняются по желанию пользователя. К ним относятся:

􀂈 адрес;

􀂈 регион (выбирается из списка регионов);

􀂈 часы работы;

􀂈 типы оплаты;

􀂈 скидки (карточки каких бонусных систем принимаются);

􀂈 электронная почта;

􀂈 адрес сайта;

􀂈 ИНН;

􀂈 дополнительная информация и предложения;

􀂈 ваше имя.

1.10.3. Поиск по названию

Но вернемся к поиску. Есть и второй вариант с использованием строки поиска. Вам потребуется ввести в поле Что: название организации или хотя бы одно слово, которое может входить в ее название. Во второй части строки поиска надо ввести адрес этой организации. Это может быть город, город и улица, только улица. Давайте посмотрим, что получится при различных вариантах заполнения полей.

□ Мы находимся на главной странице Яндекс. Адреса, где перечислены все регионы. Введем в поле Что: поисковое слово. В результате получим список организаций вашего региона (определенного по IP-адресу или данным из вашей регистрации).

□ Исходные условия те же самые, но теперь в поле Где: введем название какого-либо города. И ничего не получим, поскольку поиск опять же будет проводиться по вашему региону.

□ Перейдем на страницу любого региона. При заполнении поля Что: и пустом поле Где: получим список всех организаций этого региона. Если введем название населенного пункта, поиск будет вестись с учетом нахождения требуемой организации в этом городе или поселке.

□ В дополнение к предыдущему варианту в поле Где: укажем название улицы. Получим список всех организаций с нужным названием, расположенных на указанной улице или рядом с ней.

□ Оставим пустым поле Что: и введем название города и/или улицы в поле Где:. Совершенно верно, в списке будут все организации выбранного региона, расположенные на улицах городов с нужным нам названием.

1.10.4. Адреса на картах

Как уже говорилось ранее, для ряда городов предусмотрен показ найденных организаций на карте. К сожалению, выяснить из оглавления справочника регионов, какие города представлены не только адресами, но и картами, не удается — такой информации нет. Приходится действовать методом проб и ошибок. Можно было сразу открыть Москву или Санкт-Петербург, у которых наверняка есть показ адреса на карте, но хотелось рассмотреть на примере другого города. Выбор пал на Самару и Нижний Новгород и оказался верным — для обоих городов есть карты с обозначением расположения на них организаций.

Например, интересно посмотреть, где в Нижнем Новгороде расположены организации, предоставляющие услуги доступа к Интернету. Перейдем в раздел Провайдеры. В левой колонке представлена уже известная нам информация — список провайдеров с их адресами, телефонами, адресами сайтов. А вот справа появился новый квадрат с участком карты города. На этом участке показаны все организации, относящиеся к выбранному разделу справочника. Поэтому масштаб карты может изменяться от раздела к разделу, в зависимости от того, насколько реально разбросаны по территории города присутствующие в них организации. Если организация есть в списке, но на карте не обозначена, в ее описании добавляется сообщение отсутствует на карте.

Список организаций пронумерован, а на карте есть кружки с номерами организаций из списка. Номер в списке соответствует номеру на карте. Кружки с номерами могут "наползать" друг на друга, но когда к нему подводишь указатель мыши, он "поднимается" кверху, а рядом с указателем показывается всплывающее окно с информацией о компании — название, город и адрес.

Перейдите на другую страницу списка организаций (если их несколько), и на карте появятся обозначение тех из них, кто есть в списке текущей страницы.

Что интересного обнаружилось при работе с картой. С правой стороны от нее есть бегунок, с помощью которого можно изменять масштаб карты. Так вот, если вы будете увеличивать масштаб, то у вас будет изменяться и количество организаций в списке раздела. В нем будут оставаться только те, что попадают в показанный фрагмент карты. Если щелкнуть на кружке, обозначающем расположение организации, то размер карты станет максимально возможным, когда видны не только улицы, но и отдельно стоящие дома, к одному из которых и будет привязана отметка организации.

Карту можно не только уменьшать или увеличивать, но и перемещать. Для этого подведите к ней курсор мыши, нажмите на левую кнопку и перетащите карту на новое место. И еще один штрих к взаимосвязи всех служб Яндекса. Чуть ниже карты расположена ссылка на проект Яндекс. Карты, перейдя по которой вы перейдете в специализированный раздел Яндекса.

Если просто переходить по разделам справочника, то никакой иной информации за исключением сведений об организациях и карты на странице Адресов больше не будет. Но если вы будете проводить поиск какой-либо организации, магазина, театра, то на странице результатов появятся и рекламные объявления службы Яндекс. Директ.

За время своего существования Яндекс. Адреса показали себя как эффективная рекламная площадка. Так, например, удельное количество переходов (CTR) по объявлениям системы Яндекс. Директ, расположенных на страницах Адресов, примерно втрое выше, чем в среднем по всей системе. Новая платная услуга — приоритетное размещение в каталоге — дает рекламодателям еще одну возможность для продвижения в Интернете, причем даже тем, у кого еще нет своего сайта.

1.11. Поиск по блогам

Пожалуй, сегодня блоги являются одним из самых популярных сервисов в Интернете. Пишут миллионы. Читающих в несколько раз больше. О размере этого явления можно судить по статистике, опубликованной на Яндексе.

Яндекс отслеживает все русскоязычные блоги и форумы, представленные в формате RSS. Они попадают в базу и ранжируются автоматически. На момент написания этих строк было проиндексировано почти 1 900 000 блогов, в которые лишь за одни сутки добавилось почти 150 000 записей. В связи с большой активностью пишущих, обновление базы происходит каждые 5 минут. Записи часто обновляемых блогов и форумов индексируются несколько раз в час, редко обновляемые блоги индексируются несколько раз в сутки.

1.11.1. Блогосфера

Считается, что первые блоги в их нынешней форме появились в конце 1997 или начале 1998 года (хотя можно отыскать аналоги блогам и среди более ранних форм электронных публикаций). Бум, связанный с блогами, начался чуть позже — около 2000 года.

Пожалуй, с самого начала появления блогов мнения о них разделились. В первую очередь эти споры касались тех авторов, которые писали репортажи с места событий. Кто они — журналисты, репортеры? Многие из дневников пользуются не меньшей популярностью, чем традиционные СМИ. Возрастает и социальное значение блогосферы — авторы блогов передают эксклюзивные новости из "горячих точек", публикуют фотографии с места событий, вокруг этих публикаций зачастую разворачиваются бурные обсуждения. Блоги становятся местом встреч единомышленников и организации общественных движений, сленг "блоггеров" перенимают газеты и журналы.

Примером тому может служить сообщение о том, что

…крупнейшее в мире информационное агентство Reuters объявило о своей сделке с владельцами сервиса BlogBurst, предоставляющего информацию и комментарии из интернет-дневников для крупнейших газет США и Великобритании. Reuters инвестировала 7 млн долл. в долю акций компании Pluck Corp., разработчика BlogBurst, и теперь будет предоставлять возможность для распространения информации из живых дневников. Эксперты отмечают, что блоги стали фактически новым средством массовой информации, и в перспективе предсказывают их смешение с традиционными СМИ. (РБК daily от 22.11.2006 г.)

Возможность быстро и просто поделиться информацией, опубликовать фотографию или картинку, попросить совета или поболтать с друзьями привлекает в блогосферу (блогосфера — совокупность всех блогов) все новых пользователей российской сети. К примеру, тема, о которой идет речь в этой книге — поиск по Яндексу — занимает умы многих. В блогах найдено 14 421 запись, в которых так или иначе задета тема поиска.

В блогах часто публикуются мнения о купленных товарах и отзывы о коммерческих услугах. Анализ поисковых запросов к службе показывает, что многие используют блогосферу для того, чтобы оценить общественное мнение по поводу того или иного товара или услуги. Четко выраженный коммерческий характер ряда запросов к службе позволяет говорить о ее эффективности в качестве рекламной площадки, поэтому клиенты системы контекстной рекламы Яндекс. Директ получили возможность разместить свои объявления на Поиске по блогам.

Впрочем, согласно прогнозу британской консалтинговой компании Gartner, в 2007 году в Интернете будет зафиксировано максимальное число сетевых дневников (блогов) — оно достигнет 100 млн. Но аналитики считают, что после этого блогосфера расти перестанет — практически все, кто хотел создать собственный онлайн-дневник, уже сделали это. Блоги на протяжении последних нескольких лет стали новым мощным инструментом вовлечения в Сеть таких несвойственных Интернету групп граждан, как домохозяйки, солидные бизнесмены и профессора. Впрочем, если количественные изменения блогосферы уже на исходе, то качественные только начались. Блоги все чаще заводят политики, деятели культуры и главы компаний.

Ежедневно в России регистрируют блоги около 100 новых участников. Казалось бы, все увеличивающаяся популярность онлайн-дневников позволяет возложить на это средство многие важные задачи, например образовательные, — недаром же заводят блоги главы крупных образовательных учреждений, к примеру декан журфака МГУ Ясен Засурский. (РБК daily от 31.01.2007 г.)

Однако найти что-либо в блогах так же сложно, как и в Интернете. Можно читать блоги своих любимых авторов, но при этом упустить множество еще более интересных. Серьезного поиска по блогам на тот момент, когда они стали расти как грибы после дождя, не существовало. Но крупным поисковым системам отказаться от этого огромнейшего куска информации было нельзя. Решение следовало принять лишь одно — создать поисковых роботов, которые могли бы индексировать блоги. Такой поиск создали и запустили на Яндексе в декабре 2004 года, а через два года он был заменен существенно улучшенной версией.

Самое важное отличие поиска по блогам от основного поиска в Яндексе состоит в необходимости обеспечения оперативности индексирования. В этом поиск по блогам сравним с поиском по новостям. Поиск по блогам, как и новостной, построен на работе с RSS-лентами. В поиск по блогам, кроме них, включен и поиск по форумам, которые поддерживают RSS-формат. На первоначальном этапе проводилось индексирование всех блогов и форумов, в том числе и тех, что не являются отдельными проектами. К примеру, это могли быть форумы на новостных или специализированных сайтах. Большое внимание уделялось и индексации уже закрытых блогов или форумов, ценность которых заключается в их архивах. Чем больше будет охвачено таких сервисов, тем полнее будут представлены существующие в Сети неофициальные мнения на самые разные темы.

Яндекс — поисковая машина по русскоязычному Интернету. Не удивительно, что и на обработку из блогов в первую очередь попали те, что были предназначены для русскоговорящих. Однако в "Яндексе" заявляют, что среди индексируемых проектов могут оказаться и популярные английские блоги. Как указано на сайте компании, это могут быть проекты, "представляющие интерес для русскоязычных пользователей Яндекса".

Но вернемся к главному — что же представляет собой поиск по блогам на Яндексе? Это страница, где можно ввести поисковую фразу, и Яндекс выполнит поиск в блогосфере. Но это еще и большое количество дополнительной информации, помогающей понять, что в настоящий момент интересует пользователей Интернета, из чего складывается общественное мнение виртуального сообщества.

1.11.2. Каталог блогов

Итак, на странице поиска (http://blogs.yandex.ru/) на первом месте, хотя и набранные мелким шрифтом, размещены ссылки на разделы специализированного каталога блогов. На момент, когда просматривался этот каталог, в него было внесено 1455 блогов, разнесенных по 8 категориям. Деловые блоги и блоги Юмор, Развлечения и Общество, Дом и Творчество (рис. 1.32). В каждом разделе выделено по три самых популярных на текущий момент блога. Если щелкнуть на ссылке с названия раздела, попадаешь на страницу, где так же, как в каталоге сайтов, размещены ссылки на блоги, включенные в этот раздел.

Каждая ссылка представлена названием блога, рядом с которой размещен значок RSS. Щелкнув на нем, можно добавить RSS-ленту в свою коллекцию. Следом идет информация о том, сколько у этого блога читателей, сколько раз на него размещали ссылки в других блогах и форумах, какова авторитетность блога.

Примечание

Рейтинг блогов формируется по нескольких критериям: количество постоянных читателей, количество комментариев в блоге. Основной критерий — количество и качество ссылок на дневник из других блогов. Качество определяется авторитетностью блоггера, который поставил ссылку на ваш дневник (или конкретный пост). Чем авторитетней блог ссылавшегося, тем эффективней для вас будет его ссылка. Например, ссылка из дневника Валеза или Черского сразу может поднять ваш дневник в рейтинге на 4–5 тысяч позиций вверх. Обновляется рейтинг раз в сутки. Рейтинг блогов и принцип его расчета вполне сравним с Индексом Цитируемости (тИЦ). Здесь также учитываются авторитетность блоггеров (как для сайтов — рейтинги ссылающихся сайтов), качество ссылок (так же как для тИЦ — ссылки с тематических сайтов).

Для блога попадание на первые страницы каталога означает одно — дальнейшее поднятие его рейтинга. Ведь здесь, как и в каталоге сайтов, смотрят обычно первые страницы и посещают блоги, ссылки на которые приведены именно на них.

1.11.3. Популярные записи

Обновление списка популярных записей происходит раз в сутки. Таких записей отбирается несколько десятков, но лишь несколько самых популярных выносится на титульную страницу раздела Поиска. Остальные можно посмотреть по ссылке Всего записей. Записи в этот список отбираются на основе количества ссылок на них среди других блоггеров, количества оставленных комментариев, авторитетности пишущего, некоторых других параметров. Список формируется автоматически.

1.11.4. Рейтинг блогов

Есть в Сети блоггеры, пользующиеся авторитетом у значительного количества читающих дневники. Их записи, размышления, репортажи стараются не пропускать, поэтому посетителей у них бывает большое количество. Прочитав интересную заметку, о ней рассказывают в своих дневниках, ставя на нее ссылку. Каждая такая ссылка повышает авторитетность написавшего исходный текст.

Рейтинг (рис. 1.33) учитывает не только число ссылающихся блогов, но и количество постоянных читателей. Может быть так, что по количеству ссылок блоггер занимает первое место, а по количеству постоянных читателей его "обходят" другие блоггеры. Так, на момент написания по авторитетности, учитывающей несколько параметров, на первом месте с рейтингом 104 332 находился блоггер с ником drugoi, а по количеству читателей первое место занимал блоггер с ником doctor_livsy, у которого постоянных читателей было 14 106.

На авторитетность блога оказывают влияние и такие параметры, как количество комментариев в блоге, авторитетность ссылающихся, положение блога в блогосфере и ряд других данных.

В рейтинге участвуют все блоги, известные Поиску по блогам Яндекса, за исключением сплогов (блогов, содержащих поисковый спам) и новостных блогов, а сам рейтинг обновляется раз в сутки.

Если перейти по ссылке с заголовка Рейтинг блогов, мы попадем на страницу со списком блоггеров. Это список можно отсортировать как по авторитетности, так и по количеству постоянных читателей. Кроме того, на этой же странице есть еще одна интересная колонка — распределение блоггеров по сервисам. Наибольшее количество блоггеров держат свои дневники на LiveJournal, таких было немного более 411 тыс. На втором месте — сервис LiveInternet, у которого было почти 365 тыс. дневников.

Но многие авторитетные блоггеры ведут собственный дневник вне этих популярных блог-хостинговых служб. Автономный блог — это блог, представляющий собой сайт на отдельном домене с установленной и настроенной на нем системой публикации записей. Таковы, к примеру, блоггеры Леонид Каганов, чья авторитетность оценивается числом 43 090, Алекс Экслер, Владимир Владимирович. "Независимых" блоггеров не так уж и мало, их количество приближается к десяти тысячам.

1.11.5. Рейтинг сервисов

Сервисов, предоставляющих услуги размещения и ведения блогов, достаточно много. Но среди русскоязычной части Всемирной паутины есть наиболее популярные. Служба Поиск по блогам ведет постоянно обновляющийся их рейтинг (рис. 1.34). Если вначале, когда эта служба только появилась, неоспоримое преимущество было за сервисом LiveJournal, то в последнее время с ним на равных конкурирует российский сервис для блоггеров — Livelnternet. Все остальные блог-сервисы значительно уступают в рейтинге. (Впрочем, это совершенно не означает, что там нет отличных блоггеров.)

Оценка блог-сервисов проводится по количеству сообщений, размещенных в течение суток. При этом не учитываются непубличные сообщения, то есть не предназначенные для широкого доступа. Поэтому внутренняя статистика сервисов может отличаться от предоставляемой Яндексом. Второе отличие внутренней статистики и статистики Яндекса заключается в том, что Яндекс учитывает только те сообщения, которые созданы русскоязычными пользователями. Всего в рейтинге сервисов на момент получения статистики участвовало 39 блог-хостингов.

1.11.6. Популярные категории

Если до этого шел разговор о рейтинге блоггеров, сервисов, наиболее популярных записей, то теперь речь пойдет о категориях. Категорию своему сообщению устанавливают их авторы. Как, почему, отчего — зависит от темы, от моды, от настроения. Тем не менее авторы сознают, что поиск блогов выполняется и по категориям, поэтому стараются, чтобы выбранная ими категория соответствовала теме сообщения.

Список популярных категорий строится на основе данных за последние сутки, при этом ежечасно обновляется. Выглядит список популярных категорий несколько необычно, особенно по сравнению с остальными индикаторами. Такому представлению популярных категорий есть специальное название — облако тегов.

Фолксономия

(англ. folksonomy, от folk — народный + taxonomy — таксономия) неологизм, обозначающий практику совместной категоризации посредством произвольно выбираемых ключевых слов. Другими словами, это понятие относится к спонтанному сотрудничеству группы людей с целью организации информации в категории, которая обращает на себя внимание благодаря тому, что она полностью отличается от традиционных формальных методов фасетной классификации. Как правило, это явление возникает только в неиерархических сообществах, таких как общедоступные веб-сайты, а не в многоуровневых коллективах. Так как организаторы информации обычно являются ее же основными пользователями, фолксономия производит результаты, более точно отражающие совокупную концептуальную модель информации всей группы.

Облако тегов

Примером фолксономической организации контента можно считать "облако тегов" — представленные в произвольном порядке ключевые слова записей или страниц, где размер шрифта ключевого слова тем выше, чем больше раз оно встречается. Одними из первых "облако тегов" стали применять зарубежные сайты, построенные по принципу Веб 2.0. Это служба закладок del.icio.us, фотоблог Flickr. Среди отечественных сайтов первыми, внедрившими "облако тегов" в качестве рубрикатора, можно назвать Мой Круг и Habrahabr.

Источник: Википедия (http://ru.wikipedia.org/wiki/).

Таким образом, получается, что "облако" блоггеры строят сами, выбирая для своих записей собственные слова-определения. Ну а поскольку каждый пишет определяющее сообщение слово по-разному, то в результате получается, что некоторые теги похожи, но не являются совершенно одинаковыми. Поэтому при определении "облака тегов" происходит "склеивание" похожих категорий для формирования окончательного результата.

Некоторые теги попадают в наиболее популярные категории часто, другие появляются в связи с какими-либо событиями. А вот теги Музыка, Фото, Видео находятся в облаке почти постоянно. И не всегда это связано с интересом к обсуждаемой теме. Например, тег Фото вероятнее всего находится среди лидеров из-за того, что среди блоггеров очень много любителей фотографии, размещающих в дневниках свои фото.

Переход по заголовку Популярные категории приводит на страницу с уже обычным перечнем первой сотни тегов, отсортированных по количеству сообщений, в которых они присутствуют. Если тег изменяет свое место в рейтинге, рядом с ним показывается направление его перемещения (вверх или вниз) и количество позиций, на которое он переместился по сравнению с предыдущей отметкой. А цифра рядом с тегом говорит о том, сколько записей за истекшие сутки отмечены им. Переход же с тега приводит на страницу, где показываются уже не только последние, а все записи, имеющие этот же тег.

1.11.7. Популярные новости

Отдельным блоком среди остальных индикаторов выделен рейтинг новостей сервиса Яндекс. Новости. Это те новости, которые в наибольшей степени обсуждаются в блогах. Список популярных новостей обновляется каждые 5-10 минут. Если перейти по ссылке из этого списка, увидим страницу со ссылками на блоги, в которых эта новость обсуждается. По сравнению с каталогом сайтов, для списка блогов введен еще один параметр — время с момента обнаружения и индексирования записи. И, как и для поиска по веб-сайтам, ссылка на сохраненную копию сообщения. Нужно отметить, что новости, вызывающие интерес, начинают обсуждаться буквально с первых минут после их публикации — произошло, например, воссоединение Русской православной церкви, и сразу новость попала в число самых популярных и обсуждаемых.

1.11.8. Самое-самое интересное

И еще один блок индикаторов. Здесь формируется рейтинг по нескольким направлениям — самые обсуждаемые фильмы, сериалы, выставки, театры, СМИ, спорт. И здесь же — рейтинг запросов того, что ищут в блогах.

Примечание

К сожалению, главную страницу поиска по блогам пользователи знают плохо. Например, новость о воссоединении Русской православной церкви находилась в списке наиболее обсуждаемых. Казалось бы, нет ничего проще, как перейти по ссылке, чтобы получить список всех блогов (и блоггеров), где ведется обсуждение по этой теме. Так нет, информацию об этом ищут через поиск и фраза "Русская православная церковь" попадает в число наиболее востребованных.

Для каждого индикатора показывается, сколько различных фильмов или сериалов обсуждается в блогах в течение последних суток. В рейтинге запросов — 50 наиболее популярных.

Наверняка, многим пользователям было бы интересно узнать, что же было популярным или наиболее востребованным день, неделю, месяц назад. Узнать это несложно. Перейдите с заголовка любого индикатора или по ссылке со строки, в которой приводится общее количество отслеживаемых тем. На новой странице приводится список тем текущего дня. А вот под ним есть ссылки по датам, месяцам и годам. Выбирайте любую дату и смотрите, что же в тот день интересовало блоггеров и читателей. Но имейте в виду, что архив таких данных начинается только с сентября 2006 года.

Для тематических индикаторов есть возможность посмотреть еще и обобщенные сведения за неделю, месяц, полгода. Такие списки строятся на основе данных за последние полгода (хотя можно посмотреть рейтинг и за другие периоды времени), обновляются ежечасно и содержат названия выставок (фильмов, сериалов и т. д.), количество блоггеров, упоминающих их, а также изменение позиции в списке за последнюю неделю.

1.11.9. Особенности поиска по блогам

Как по веб-сайтам, по картинкам или товарам, для поиска по блогам используются те же самые операторы языка запросов. Но есть дополнительные операторы, связанные с возможностями использования блогов. Таких операторов пять.

□ Оператор server — основной объем блогов размещается на сравнительно небольшом количестве блог-хостингов (LJ, LI и др.). Для ограничения области поиска был добавлен оператор server, который позволяет ограничить поиск определенным блог-хостингом.

Синтаксисзапроса: запрос << server="livejournal.com".

□ Оператор author — может использоваться только для блогов, расположенных на блог-хостинге LiveJournal. Ограничивает область поиска записями определенного автора.

Синтаксисзапроса: запрос << author="kubok".

□ Оператор music — существуют некоторые блоги, позволяющие хранить информацию о том, какую музыку слушал автор записи в момент ее написания. Оператор позволяет искать только ту информацию, которую авторы записывали под определенную музыку.

Синтаксис запроса: music=(Picnic).

□ Оператор mood — некоторые блоги разрешают своим пользователям делать пометку, какое настроение было у автора записи в то время, когда он ее писал. Используя оператор mood, вы сможете найти записи, сделанные в минуты хорошего настроения, или наоборот, плохого.

Синтаксис такого запроса: mood=(хорошее | отличное).

□ Оператор category — о том, что такое категории, мы говорили ранее. А теперь вы сможете не только пользоваться "облаком тегов", но и самостоятельно выполнять поиск по любым, даже не попавшим в "облако", тегам.

Синтаксис запроса: category=(sign) или category=(судьба | ананка).

В одном запросе можно использовать несколько операторов, объединяя их по правилам языка запросов.

1.11.10. Расширенный поиск по блогам

То, о чем говорилось ранее, не является поиском по блогам в полном смысле этого слова. Все индикаторы формирует и показывает вам сервис. Но среди ссылок в индикаторах лишь малая толика того, о чем пишут в дневниках и форумах. И найти то, что нужно именно вам, можно с помощью обычного поиска. Вписываете в строку поиска нужное выражение, нажимаете кнопку Найти или клавишу <Enter>. Дальше все выполняется так же, как и при поиске по веб-страницам.

Формировать запросы можно с использованием всех тех поисковых операторов, о которых уже говорилось в этой главе. Поиск устойчивого выражения и поиск слов, расположенных на определенном расстоянии друг от друга, исключение или наоборот, обязательное вхождение определенных слов или выражений. Вот пример. Ищем, что у нас может быть в результатах по слову Сочи. Если провести поиск по этому слову так, как оно сейчас написано, в результаты попадут заметки, содержащие и название города Сочи, и слова, в которых Сочи составляют только их часть, например — сочился, сочится. Но если использовать специальный оператор и в поле поиска записать выражение ! Сочи, то лишних заметок в результатах поиска уже не будет.

Найденные результаты сортируются по дате публикации. Но сортировку можно изменить на сортировку по релевантности. И в обоих случаях можно результаты сгруппировать по авторам.

Как и при поиске по веб-документам, для поиска по блогам предлагается кроме простого, еще и расширенный вариант. Найдите под строкой поиска ссылку Расширенный поиск и перейдите по ней. На новой странице (рис. 1.35) уже не будет никаких индикаторов. Здесь лишь поля для ввода дополнительных условий. Если вы внимательно к ним присмотритесь, то обнаружите, что многие поля реализуют описанные в предыдущем разделе дополнительные операторы поиска по блогам.

Таких полей пять — Сервер, Автор, Настроение, Музыка, Категория. Используя расширенный вариант поиска, вам не придется запоминать и руками вписывать эти дополнительные операторы. Обратите внимание, что для полей Сервер, Автор, Категория можно введенные значения использовать в качестве исключений — искать по всем остальным, за исключением вписанного в поле.

Кроме этих полей, для уточнения запроса используются и другие параметры (интервал дат, наличие в тексте определенной ссылки и др.).

Вы можете ограничить поиск записей в дневниках и форумах диапазоном дат. Этот диапазон можно вписать самому, а можно выбрать один из четырех предопределенных диапазонов — сегодня, последние три дня, последняя неделя, последний месяц.

Иногда бывает необходимо ограничить область поиска только блогами или форумами. Для этого предназначены три переключателя, позволяющие определить нужную область. Их можно выставлять в различной комбинации, как по одному, так и попарно.

Использование следующего поля позволяет выбирать записи, содержащие определенную ссылку. Подобный метод используется для определения одной из характеристик авторитетности блоггера, когда по записям отыскивают ссылки на его дневник. И еще один ограничитель поиска состоит в определении поиска по определенным RSS-потокам.

Поиск — поиском, но, как и при поиске по новостям, бывает интересно оформить подписку на поисковый запрос. Сделать это довольно просто. При поиске по любому запросу показывается ссылка RSS-поток по запросу…, которая ведет на RSS-документ с результатами поиска. Используя программы-аггрегаторы RSS, можно удобным способом получать уведомления о новых сообщениях по интересующему запросу. По умолчанию найденные сообщения не сгруппированы по авторам, однако вы можете получить RSS с любой необходимой сортировкой или группировкой, заменив в соответствующем URL search.xml на search.rss.

1.12. Никаких итогов

Вот мы и подошли к завершению обзора поисковых возможностей Яндекса. Вчерашних возможностей, потому что за то время, что писались эти строки возможности поиска уже расширились. Поэтому, если вы не найдете здесь ответов на ваши вопросы, — обращайтесь к Яндексу. Там найдется все.

Елена Колмановская — директор по маркетингу и главный редактор компании "Яндекс" с момента основания компании.

С 1996 года Елена работала в компании CompTek International, где занималась развитием и продвижением поисковых технологий, а до этого — программист в компании East Cost Sheet Metal Corp (Нью-Йорк), аналитик в концерне "Прагма" и инженер-программист во Всесоюзном научно-исследовательском геолого-разведочном нефтяном институте (ВНИГНИ).

Елена Колмановская — автор множества публикаций в популярных и специализированных изданиях, посвященных интернет-технологиям. Она также является соавтором книги "Интернетско-русский разговорник", изданной в 2001 году. В настоящее время Елена принимает участие в проведении выездных семинаров, посвященных интернет-маркетингу и рекламе в Интернете.

Елена Колмановская имеет высшее образование в области прикладной математики.

Глава 2

Яндекс. Почта

Яндекс — это не только поиск по веб-документам и изображениям, словарям и блогам, новостям и товарам. Яндекс — это еще и множество иных сервисов и услуг. Одним из широко известных и используемых сервисов считается и Яндекс. Почта (http://mail.yandex.ru/).

В июне 2000 года Яндекс проводил мероприятие, названное им "неделя Яндекса". Каждый день этой недели был посвящен одному из сервисов. Именно тогда был открыт и почтовый сервис.

Примечание

Разбирая свои почтовые архивы, я нашел письмо, полученное в связи с подпиской на поисковые запросы Яндекса. Датировано оно 30 июня 2000 года. И тогда же я зарегистрировал на почтовом сервисе адрес электронной почты. Он до сих пор жив и дееспособен.

Почтовый сервис Яндекса (рис. 2.1) приобрел широкую популярность — этой почтовой службой пользуется около 6 млн человек в месяц. Писем же за это время приходит во много раз больше.

Яндекс. Почта — почта с веб-интерфейсом, бесплатная, с возможностью работы через POP3/SMTP. Объем почтового ящика неограничен. Нет, вам не говорят, что вы сразу получаете в свое использование гигабайт или больше. Чтобы не тратить зря дисковое пространство Яндекс предложил иную схему — по мере заполнения первоначально выделенного объема почтового ящика пользователь сам может увеличивать этот размер порциями по 20 Мбайт. Впрочем, есть ограничение на частоту увеличения размера ящика. Так, для ящиков, объем которых превышает 100 Мбайт, действуют строгие правила — увеличивать объем можно не чаще одного раза в день. При этом требуется, чтобы в ящике было не более 30 Мбайт свободного места.

Но даже "нарастив" объем своего почтового ящика до нескольких сотен мегабайт, вы не сможете отправлять почтовым сообщением большие письма, поскольку существует ограничение и на размер одного исходящего письма — он не должен превышать 10 Мбайт. Аналогичное ограничение накладывается и на размер входящего письма.

У Яндекс. Почты есть одно существенное отличие от иных бесплатных почтовых сервисов Рунета. Как и на всех остальных сервисах Яндекса, на Яндекс. Почте (если вы используете веб-доступ) вам будет показываться реклама. Но если вы ее не любите или она вам мешает, вы можете отключить показ рекламы, и никто насильно вам ее не вернет. Сделать это можно в разделе Настройки | Персональные настройки. Здесь, отключив показ баннеров (это как раз та реклама, которая и показывается на сервисе), заодно можно отключить и подпись от Яндекса, которая автоматически вставляется в письма при отправке с веба.

Помимо свободы от рекламы, у почты Яндекса много и иных "вкусностей", о которых мы будем говорить в этой главе.

2.1. Адреса электронной почты

Рассказывать читающим эту книгу о том, что такое электронная почта, на мой взгляд, бессмысленно. Если вы читаете эти строки, то либо у вас уже есть почтовый адрес, либо вы уже решили его получить. Не ставя цели убедить вас зарегистрировать свой почтовый ящик на Яндексе, все же хочу поделиться соображениями о плюсах и минусах этого сервиса. Решение же вы будете, конечно, принимать сами.

Точнее, немного не так. Потому что стоит вам зарегистрироваться на каком-либо сервисе Яндекса, и вам сразу предоставляется почтовый ящик и три адреса электронной почты. Да, ящик будет один, но писать вы сможете с разных адресов и получать на них почту. Почтовый адрес будет вам предоставляться по тому логину, который вы выберете для себя при регистрации. Например, если вы возьмете себе логин dandelion, то получите вот такие почтовые адреса:

dandelion@yandex.ru;

dandelion@ya.ru;

dandelion@narod.ru.

А уж каким из них будете вы пользоваться, и будете ли вообще, вот это решать вам. Может, вы используете и все три, применяя их в разных ситуациях.

2.2. Настраиваем почту

Если вы зарегистрировались, то имеет смысл познакомиться с возможностями почтового сервиса, и начнем мы это знакомство с настроек. Не особо требовательных пользователей вполне могут удовлетворить и настройки по умолчанию, но все же рекомендуется настроить почту "под себя".

После входа в свой почтовый ящик (войти в него можно либо с главной страницы Яндекса, перейдя по ссылке Почта и введя свой логин и пароль, либо со страницы http://mail.yandex.ru), найдите в верхней строке ссылку Настройки и перейдите по ней. Откроется страница, на которой показаны разделы настроек. Это Персональные настройки, Управление папками, Фильтры и Сбор почты. Рассмотрим каждый из них, начав, конечно, с персональных настроек. Вот только с какой почты начать?

Вы думаете, я ошибся, и сам не понимаю, о чем пишу? Дело в том, что у почтового сервиса в настоящее время существует два внешних представления. Первое — стандартное, привычное многим и существующее с самого начала появления этого сервиса. Второе представление было представлено на суд пользователей весной 2006 года и размещено по адресу http://mail.ya.ru/. И дело не в коротком адресе, хотя это тоже играет свою роль, он легче запоминается и воспроизводится. Дело в интерфейсе.

Интерфейс выполнен с использованием технологии AJAX, а это означает, что для выполнения многих операций не требуется полная перезагрузка страницы. Следовательно, сокращается время и уменьшается трафик.

"Все больше пользователей предпочитают решать свои задачи с помощью универсальной программы-браузера, — говорят руководители почтовой службы Яндекса. — Мы старались сделать новую почту максимально удобной для работы именно в браузере. Борьба шла с каждым лишним движением мышью, с каждой линейкой прокрутки, и, кажется, мы победили".

И все же, как ни интересно перейти сразу к новому варианту, но начну я, пожалуй, со старого, испытанного. К тому же новый вариант почтового сервиса пока еще не начал широко рекламироваться и предлагаться пользователям для перехода на него. Но те, кто его увидел, уже оценили. О том, что в нем такого замечательного, рассмотрим далее в этой главе.

2.2.1. Персональные настройки

Таких настроек совсем немного (рис. 2.2), к тому же они вполне понятны для любого пользователя. Имя, на которое зарегистрирован почтовый ящик, определяется логином, под которым вы зарегистрированы на Яндексе. Не всегда этот логин удобен для использования в почтовой переписке. Поэтому в персональных настройках вы сможете изменить логин на свое имя или более привычный вам ник. Это имя будет подставляться в вашем адресе, как адресе отправителя, хотя сам почтовый адрес не изменится.

Если вы любитель длинной и красивой подписи, для вас предусмотрено специальное поле, где вы можете ее разместить. А вот подпись, которая по умолчанию добавляется от имени Яндекса, легко можно отключить, выбрав соответствующий переключатель.

При регистрации на Яндексе вам предоставляется три адреса на различных доменах. Чтобы не приходилось задумываться каждый раз, с какого адреса отправлять письмо, выберите основной для вас — письма по умолчанию будут отправляться с этого адреса. Но при том остается возможность выбора любого другого из списка ваших адресов. Если вам такой выбор не требуется — отключите его.

Для выбора нового или старого интерфейса предназначен специальный переключатель. Он позволит вам работать с почтой либо в старом, привычном интерфейсе, либо в новом, с новыми возможностями.

Следующая группа настроек относится к интерфейсу почтового ящика. Яндекс не обманывает — именно здесь размещены переключатели, позволяющие отключить выдачу рекламы (баннеров) и заголовков новостей. Их можно почитать, и не работая с почтой.

Если вы собираетесь хранить историю своей переписки, выберите переключатель всегда сохранять исходящие письма — по умолчанию отправленные письма не сохраняются.

Что делать с графическими изображениями, присылаемыми вам с письмами — показывать их или нет? Яндекс. Почта предлагает целых три варианта:

Отключать всегда;

Отключать только в папке "Спам";

Не отключать.

И очень важный вопрос — куда помещать приходящие на ваш адрес рассылки. Опять есть два варианта: либо в папку вместе со спамом, и тогда эта папка будет переименована в Рассылки+Спам, либо в папку Входящие. На что оказывает влияние это изменение? Помимо доступа через веб-интерфейс, вы можете получать почту из вашего почтового ящика с использованием почтовых клиентов. И одна из настроек требует ответа на вопрос — скачивать или нет письма, помещенные в папку Спам. В случае, если у вас в папку для спама будут помещаться и рассылки, придется подумать, что же с ними делать.

Рассылки и политика Яндекса

Здесь необходимо небольшое отступление. Яндекс проводит последовательную политику в отношении несанкционированных рассылок — это как раз то, что в обиходе называется "спамом". О программе, которая позволяет определить спам и выделить его из рассылок, мы поговорим позже, а сейчас речь пойдет лишь о том, на основе каких требований строит свою политику Яндекс.

Основой понимания, что может быть названо "честной" рассылкой, являются рекомендации ASTA (http://postmaster.aol.com/asta/), нормы пользования сетью (http://www.ofisp.org/documents/ofisp-008.html) и сложившаяся практика крупнейших провайдеров и почтовых служб.

В совокупности эти рекомендации сводятся к четырем базовым моментам.

• Рассылка должна осуществляться только по явному требованию или согласию пользователя. В каждом письме должны присутствовать четкие инструкции, как отписаться от рассылки, и адрес, на который подписка осуществляется. (Вы подписывались на рассылки? Приходилось ли вам от них отказываться? Содержали ли те рассылки требуемую информацию?)

• Тема рассылки должна соответствовать ее содержанию и не должна вводить подписчика в заблуждение. Ссылки в тексте должны присутствовать в виде полного доменного имени.

• В письме должны в обязательном порядке присутствовать стандартные заголовки, используемые при массовых или автоматических рассылках, формат сообщения должен соответствовать рекомендациям RFC 2822 и стандарту MIME, явно должна быть указана кодировка, недопустимо наличие скриптов, элементов activeX и иных потенциально опасных объектов.

• Рассылка должна осуществляться с реального IP-адреса, а его доменное имя должно быть содержательным, мнемонически понятным.

Если рассылка не удовлетворяет этим требованиям, она будет рассматриваться как спам и помещаться в соответствующую папку вашего почтового ящика. Поэтому не забывайте в него заглядывать — вдруг нужная для вас рассылка исполнена не в соответствии с требованиями, предъявляемыми к ним.

2.2.2. Адресная книга

Еще один интересный элемент настройки. Он связан с использованием адресной книги. Если включить опцию автоматический сбор адресов, то при написании письма все адреса ваших получателей будут автоматически добавляться в адресную книгу. Такие записи вы можете отредактировать, подставив имя пользователя. Если имя явно не задано, а корреспондент вам ответил, то система подставит в адресную запись имя, которое вы видите в поле From (От) полученного письма (то есть указанного вашим корреспондентом в настройках его почтовой программы).

Систему обработки адресов в определенной мере можно назвать интеллектуальной. Если похожесть имен респондентов дает основания полагать, что речь идет об одном и том же человеке (например, "Вася Петров" и "Василий И. Петров"), то адреса будут сгруппированы в одной записи адресной книги. Если группировка сработала неправильно (например, среди ваших знакомых есть два разных Васи Петрова), то вы можете разделить ошибочно сгруппированный контакт, воспользовавшись кнопкой перенести адрес в интерфейсе редактирования контакта. Или наоборот, если система оказалась недостаточно догадливой, вы можете сами объединить несколько адресов.

Еще одна возможность использования адресной книги заключается в том, что при вводе адреса она будет предлагать вам подходящие варианты. При этом для имени и фамилии можно использовать русские буквы вместо английских и наоборот. Адресная книга подгружает для выбора подходящие адреса, но если их много, а ваш канал доступа слабый, то список может грузиться долго. Поэтому вы можете сами ограничить максимальное количество адресов, которое будет вам предлагаться на выбор. Эти адреса будут выбираться из числа тех, которые вы использовали последними.

2.2.3. Управление папками

При небольшом объеме переписки вам может оказаться достаточным наличия лишь тех папок, которые создаются по умолчанию. Их, системных, всего пять:

□ Входящие;

□ Отправленные;

□ Удаленные;

□ Спам;

□ Черновики.

Но если объем вашей переписки велик, вы подписаны на различные рассылки и прочее, имеет смысл сформировать такую структуру папок для входящих и отправленных писем, с которой вам было бы удобно работать.

Нет ничего проще, чем управлять папками. В самом деле, что с ними можно делать? Добавлять, удалять, чистить, изменять названия. Полностью все эти действия можно выполнять лишь с папками, которые вы создали сами. Системные папки нельзя ни переименовать, ни удалить.

На странице управления папками (рис. 2.3) все они представлены в виде списка, в котором, кроме названия папки, имеется информация о количестве писем в каждой из них (в том числе количество непрочтенных) и размере, который эти письма занимают. Для того чтобы выполнить действие над папкой, отметьте ее и щелкните на соответствующей выбранному действию надписи.

Если вы создали личные папки, то надо определиться с тем, каким образом в них будут попадать приходящие письма. "Раскидывать" письма вручную — занятие неблагодарное. Сортировку необходимо поручать автомату, работающему на основе правил, которые в почтовой системе Яндекса называются

2.2.4. Настройка фильтров

Фильтры можно разделить на три типа:

□ "черные" списки;

□ "белые" списки;

□ морфологические фильтры.

Черные и белые списки содержат почтовые адреса, которые вы заносите в них сами. Работают они, как понятно из их названия, с противоположным эффектом. Письма, приходящие с адресов, включенных в черный список, не будут направляться в ваш почтовый ящик, а будут удаляться. Наоборот, письма, приходящие с адресов, включенных в белый список, никогда не попадут в папку Спам. Это те адреса, которым вы доверяете безоговорочно. Последовательность обработки входящей почты выполняется в указанной последовательности — вначале выполняется проверка на вхождение отправителя в черный список, затем в белый, и на последнем этапе вступают в действие морфологические фильтры. Поэтому будьте внимательны с тем, в какой список вы включили адрес своего респондента. Если он случайно попал и в черный, и в белый список, писем от него вы никогда не увидите.

Сложнее настроить морфологический фильтр (рис. 2.4). Во-первых, таких фильтров может быть несколько, и придется определить последовательность их использования. Во-вторых, сам фильтр состоит из множества настроек.

Первое, что вам потребуется сделать, это определиться, какие письма будут обрабатываться фильтром. Это могут быть все письма, или только те, что считаются спамом, или наоборот, спамом не считаются, а среди спама можно еще выделить отдельно "чистый" спам и рассылки. Не секрет, что время от времени в ваш почтовый ящик могут попадать письма с вирусами. От таких вирусов вас защищает антивирусная программа Dr Web (рис. 2.5), но письма, даже содержащие вирусы, без вашего решения не удаляются, а лишь помечаются специальным значком. Удаляются лишь те, которые ничего, кроме вируса, не содержат. Используя фильтр, настроенный на обработку писем, содержащих вирусы, вы можете выполнить над ними определенные вами действия — удалить, переместить в специальную папку, переправить на другой адрес.

Определив область писем, для которых будет действовать фильтр, определим условия фильтрации. Фильтрация возможна по любому из полей: От кого, Кому, Копия, Тема, по самому тексту сообщения (Тело письма), по имени приложения (attachment) или по свойствам письма (заголовкам). Возможно использование двух видов фильтрации:

□ с учетом морфологии русского языка (как в поиске Яндекса). Для этого нужно в условиях выбирать содержит (или не содержит).

Пример

Фильтр с условием содержит искать будет работать для слов "ищу", "ищем" и т. п.

□ со строгим соответствием — фильтр будет работать только при условии полного совпадения указанного вами слова (или выражения) со словом в нужном поле (или при отсутствии этого конкретного слова или выражения). Такая фильтрация работает при выборе совпадает или не совпадает в условиях.

Пример

Фильтр с условием совпадает с искать не отфильтрует слова "искал", "ищет" и т. п.

Условий фильтрации в одном правиле может быть несколько, а их вид — различным. Использование условий в составе фильтра возможно в двух вариантах: либо выполняется любое из условий (действует логическое "или"), либо выполняются все условия одновременно (логическое "и"). Вам необходимо выбрать один из этих вариантов.

Совет

Для добавления нового условия нажмите на кнопку + справа от условия, после которого вы собираетесь его добавить. Для удаления условия фильтрации щелкните на кнопке — (минус) справа от него.

Составив условия, необходимо определить действия, которые будут выполняться над письмами, отобранными фильтром. Вы можете выбрать только одно из возможных действий:

Переместить в папку;

Удалить;

Переслать по адресу;

Уведомить по адресу;

□ Использовать автоответчик.

Теперь остается последний шаг — определить, как будет действовать этот фильтр. Вы можете поставить его первым в списке фильтров (например, для обработки писем с вирусами), поместить в конце списка фильтров, прервать последующую обработку другими фильтрами при срабатывании текущего.

Для удобства дайте новому фильтру имя и сохраните его.

После создания фильтр появится в списке на странице настроек. Теперь, выбрав его, с ним можно выполнить некоторые действия: включить или отключить, удалить, изменить порядок действий.

2.2.5. Сбор почты

Если у вас несколько почтовых ящиков, зарегистрированных на различных серверах, то Яндекс. Почта поможет вам собрать письма в одно место, в ваш почтовый ящик на Яндексе. Когда это может пригодиться? Например, ваш почтовый сервер не поддерживает доступ через веб (таких серверов не так-то много, но они есть). Если вы уехали отдыхать, и у вас нет возможности использовать почтовый клиент, вы будете лишены возможности просматривать свою корреспонденцию. Настроив сбор почты на Яндексе (рис. 2.6), вы не пропустите важного для вас сообщения.

Выберите на странице Настройки ссылку Сбор почты. Здесь вы можете определить до 5 почтовых адресов, почта с которых будет попадать в ваш ящик на Яндексе. Исключение составляют лишь ваши адреса на @yandex.ru или @narod.ru, а также почтовые сервисы, не поддерживающие доступ по POP3-протоколу.

От вас потребуется заполнить три поля:

POP-сервер — POP3-адрес вашего почтового сервера (например, pop.mail.ru);

Логин;

Пароль доступа к своему почтовому ящику.

Для редактирования созданного правила нажмите на соответствующую ссылку в поле POP-сервер. Отметив требуемые сборщики, вы сможете включить, отключить их или удалить.

Создав правило сбора почты, не торопитесь — сбор начнет работать не сразу, а через некоторое время (вплоть до нескольких часов) после создания. Аналогично, с задержкой произойдет и его отключение. Время между последовательными обращениями к чужому почтовому серверу при сборе почты — от 10 минут до бесконечности (все зависит от работы сервера, с которого забирается почта). Установить или изменить время сбора почты нельзя. Если на тех серверах, с которых вы забираете почту, есть опция оставлять сообщения на этом сервере, то вы можете ей воспользоваться. В противном случае письма будут удалены, поскольку сборщик почты на Яндексе такой опции не имеет.

Примечание

Что не понравилось в фильтрах? Нет возможности задать не одно, а несколько действий над письмом, попадающим под правило фильтра. Можно переместить, удалить, информировать о получении письма. Но нельзя выполнить сразу два действия. Да, можно создать два фильтра, действующие последовательно для одних и тех же условий. В одном описать первое действие (например, перемещение в папку), во втором следующую обработку этих писем и отключить выполнение остальных фильтров, если они есть. Но это менее удобно, чем, к примеру, создание фильтра в The Bat!

Немного сложнее создать фильтр, который будет принимать почту с вашего внешнего ящика, фильтровать ее по определенным правилам и часть отправлять обратно. Все работает прекрасно до следующей процедуры сбора писем. Отфильтрованные и возвращенные письма вновь попадают в ящик на Яндексе. Эта задача решается отправкой писем, соответствующих вашему фильтру, на другой внешний почтовый ящик.

Решить проблему "заспамленного" ящика можно и другим способом, о котором я расскажу в разделе, посвященном "Спамообороне".

2.3. Работа с почтой

Я догадываюсь, что вам не терпится поскорее познакомиться с новым интерфейсом почты, но давайте не будем торопиться и познакомимся с тем, как все же работать в старом (рис. 2.7).

2.3.1. Пишем

Над списком писем расположено несколько ссылок. Первая из них переведет вас в режим редактирования нового письма. Обязательное поле только одно — Кому. Не заполните — некуда будет отправлять письмо. Поле Тема желательно, но, в крайнем случае, можно обойтись и без него. Все остальные поля, в том числе и поле для ввода текста, можно оставить пустыми.

Письмо можно отправить нескольким адресатам. Для этого используются различные варианты, например — включите адреса нескольких получателей в поле Кому, разделив их запятыми и пробелами:

Кому: vasya@yandex.ru, anka@yandex.ru, oleg@yandex.ru

Если у письма один получатель основной, а других вы хотите поставить в известность о переписке, можете включить их адреса в другое поле — Копия. Ну а если вы хотите отправить кому-то копию письма, но не хотите, чтобы об этом знали другие, добавьте его адрес в поле Скрытая копия.

Совершенно не обязательно адреса вводить вручную — пользуйтесь адресной книгой. Это позволит вам к тому же избежать ошибок при написании адресов. Ссылка Адреса есть у каждого поля, в которое можно добавить адрес. При нажатии на нее откроется окно со списком адресов ваших респондентов (рис. 2.8).

У адресной книги два режима отображения адресов — могут отображаться только адреса, введенные вручную, либо все адреса (добавленные автоматически либо импортированные из почтовых клиентов). В строке для каждого адреса три поля выбора, с помощью которых, не выходя из адресной книги, можно указать, в какое поле будет добавлен тот или иной адрес.

С книгой работать удобно, когда количество адресов невелико, либо когда вы забыли, как пишется нужный вам адрес. При большом количестве искать адрес респондента не очень удобно даже при том, что адреса можно сортировать по имени или электронному адресу. Поэтому очень востребованной оказалась имеющаяся возможность подстановки адреса при его вводе в адресной строке. Яндекс будет по набранным символам выбирать подходящие адреса из адресной книги и выдавать их в виде списка. Найдя в нем нужный адрес, щелкните на нем, и он подставится в адресную строку. Если вы набираете чье-либо имя, то Яндекс будет делать выборку по русскому звучанию имен, например, при наборе буквы v могут быть предложены имена ваших респондентов как на английском (например, Viola), так и на русском языке (например, Владимир).

Основное поле предназначено, безусловно, для ввода текста. Набор текста вы можете осуществлять как в обычном, так и в графическом (WYSIWYG) редакторе. Смена редактора выполняется переключением по ссылкам, расположенным над полем ввода. Здесь нужно помнить только одно — переход из WYSIWYG-редактора в обычный удалит все форматирование текста, которое могло быть уже вами сделано. Этот редактор работает только с браузером MS IE, и только если вы работаете в нем, над полем ввода будет появляться ссылка С оформлением. Перейдя в этот режим, вы увидите несколько дополнительных кнопок, предназначенных для красивого оформления текста. Назначение кнопок идентично тому, что они означают в стандартных текстовых редакторах, например, в Microsoft Word. С помощью этих кнопок вы можете изменять шрифт, выбрав полужирный или курсив, копировать стиль шрифта или абзаца на вновь набираемые слова, создавать нумерованные или маркированные списки, отменять или возвращать отмененное действие (рис. 2.9).

Редактором, впрочем, никого не удивить. Но, кроме него, при редактировании предлагается воспользоваться и дополнительными возможностями. Для тех, кто не имеет русской клавиатуры, Яндекс предлагает виртуальную. Набрали текст, скопировали и перенесли в нужное поле. Если вы хотите в тексте использовать слова на иностранном языке, но не знаете, как они пишутся, воспользуйтесь сервисом Словарь Лингво. А если вы не уверены в правильности написания слов, выполните орфографическую проверку. Проверяться могут тексты на русском или английском языках. Для выполнения проверки найдите под полем ввода письма переключатель языка и кнопку Проверить.

В некоторых случаях может быть востребована и еще одна услуга — преобразование набранного текста в транслит. Кнопка для выполнения такого преобразования также находится под полем ввода. Но имейте в виду, преобразовав русский текст в транслит, обратно вы его уже не восстановите.

Чтобы добавить к письму файл, надо при написании письма нажать на кнопку Обзор в разделе Присоединить файлы: (под окном для текста письма) и выбрать файл, находящийся на вашем жестком диске. Вы подтверждаете свой выбор кнопкой Открыть, после чего в окне для вложенного файла должен появиться полный путь к этому файлу. К одному письму можно приложить несколько файлов.

Последние штрихи. Если вы хотите сохранить письмо, поставьте флажок Сохранить копию письма при отправке. Эта опция востребована в том случае, если в настройках своего почтового ящика вы не выбрали опцию сохранения переписки. Если такая опция была выбрана, на флажок сохранения копии можно не обращать внимания.

После того как все подготовлено, письмо можно отправить, сохранить как черновик или выйти из режима редактирования письма без его сохранения.

2.3.2. Читаем

Входящая почта делится на несколько категорий — та, которую читают сразу, та, которую оставляют, но читают при наличии времени, и та, которую удаляют не глядя. Нас сейчас интересуют две первые категории. Вроде бы, ничего сложного в прочтении писем нет — щелкнул на заголовке письма, оно и откроется. Совершенно верно. Поэтому обратим внимание на дополнительные возможности.

После открытия письма посмотрите на правую колонку. В ней вы увидите строку со ссылками на выбор кодировки. Если полученное письмо состоит из нечитаемых символов, попробуйте выбрать одну из доступных — koi8, win, dos или другую. Над строкой кодировок расположены пиктограммы, с помощью которых вы можете распечатать письмо, показать его в виде HTML-документа, посмотреть свойства (в почтовых клиентах эта опция называется иначе — Показывать заголовки (RFC-822)).

Теперь — строка управления, расположенная над письмом. С помощью элементов, расположенных в ней, вы можете ответить на письмо, отправить ответ всем респондентам, чьи адреса включены в вашу адресную книгу, переслать на другой адрес. Письмо можно удалить или отметить как спам (и оно переместится в соответствующую папку — в дальнейшем подобные письма будут проанализированы и, если действительно окажутся спамом, подвергнутся обработке по стандартным для спама правилам). Если у вас есть подозрение, что письмо содержит вирус, можете выполнить его проверку. (Яндекс. Почта проверяет на вирусы всю входящую корреспонденцию, но могло получиться так, что в письме находится новый вирус, для обнаружения которого обновление антивирусной базы пришло позже.)

Хотя сортировка писем по вашим папкам проводится на основе правил, у вас есть возможность вручную переместить письмо в другую папку. Для этого используйте элемент управления Переместить в папку.

Теперь посмотрите на строку, содержащую адрес отправителя. В ней две ссылки. По первой из них вы можете добавить отправителя в адресную книгу (автоматически заносятся только адреса, на которые отправляете письма вы). Щелкнув на этой ссылке, вы откроете окно для ввода дополнительной информации. Поле адреса будет заполнено данными из письма. Можете добавить имя и фамилию отправителя, его телефон, дату рождения, комментарий.

У одного респондента может быть несколько электронных адресов. Если вы их знаете, то сможете добавить, присоединив к одной записи. Для этого рядом с полем для ввода адреса нажмите на кнопку +, после чего появится еще одна строка ввода. Ну а если добавляемый адрес принадлежит человеку, который уже внесен в адресную книгу с другим адресом, вы можете добавить к его записи еще и дополнительный адрес.

Вторая ссылка у адресной строки позволяет занести адрес отправителя в " черный" список. Последующие письма от этого адресата вы уже не получите. К сожалению, те, кто рассылает спам, адреса для своих рассылок постоянно меняют, поэтому нахождение адреса в "черном" списке не будет гарантировать уменьшение спама. Пожалуй, в "черный" список следует заносить адреса тех, чьи письма спамом не являются, но читать которые вы никогда не будете.

Ниже текста письма располагаются еще два или три блока. Первый — для ответа на полученное письмо — присутствует для всех входящих писем. С его помощью можно послать ответ отправителю — и если раскрыть дополнительные поля заголовка (ссылка Добавить все поля), можно будет добавить и других получателей в поля Копия и Скрытая копия. Если вы хотите в ответе использовать цитаты из полученного письма, нажмите на ссылку Цитировать сообщение.

Второй блок открывается в том случае, если полученное письмо относится к рассылкам. В этом блоке вам предлагается несколько дополнительных ссылок:

Управление подпиской;

Приостановить подписку;

Удалить подписку.

Это удобно — достаточно лишь воспользоваться предлагаемыми ссылками, а не искать в тексте рассылки, соответствующие указанным действиям описания. Данные для управления берутся из письма, если оно выполнено в соответствии с рекомендациями ASTA.

Наконец, последний блок. Он представляет собой усеченный список писем текущей папки. Обычно показывается одно письмо, полученное до текущего, и письмо, пришедшее следующим. Переключаясь между ними, вы сможете просмотреть все свои письма, не выходя в главное окно папки.

2.3.3. Обрабатываем

Управлять письмами удобно через список писем какой-либо папки. Поскольку здесь мы имеем не одно письмо, то и управление предполагается групповое. Для начала отметим письма, над которыми хотим выполнить какое-либо действие. Действий несколько — группу писем можно переслать на другой ящик, отметить как спам, удалить, перенести в другую папку. И можно проверить на наличие вирусов.

Небольшое примечание по поводу удаления писем. Удаляются они в два этапа — вначале отмеченные для удаления письма переносятся в папку Удаленные, и только очисткой этой папки либо удалением письма из нее удаляются окончательно. Для этой папки установлена автоматическая операция очистки через двое суток после поступления в нее удаленного сообщения. Для писем, автоматически отфильтрованных в папку Рассылки, действует правило, согласно которому эти письма удаляются через две недели после поступления. Поэтому хотя бы раз в две недели проверяйте папку с рассылками — вдруг туда поступило что-то интересное.

Из дополнительных возможностей — письма можно сортировать по любой колонке, выполнять поиск по заголовкам. Такой вид поиска выполняется по письмам текущей папки. Если хотите искать письма не только по заголовку, но и по их содержанию, щелкните на ссылке Поиск в верхней части страницы. В этом режиме поиск может выполняться как по заголовку, так и по телу письма. Дополнительно можно ограничить поиск определенными папками, а также направлением писем — пришедших на ваш адрес либо отправленных вами.

В левой колонке расположен список ваших папок, для каждой из которых выводится информация об общем количестве писем, помещенных в нее, количестве непрочитанных, занимаемому письмами дисковому пространству. А для папок с удаленными письмами и спамом есть возможность выполнения их очистки без входа в папки (рис. 2.10).

2.3.4. Безопасный доступ к почте

При работе с почтой через браузер мы подключаемся по обычному HTTP-протоколу, когда данные от вас к серверу, а также от сервера к вам передаются в открытом виде. При таком способе доступа имеется возможность с помощью специальных программ перехватить и ваш логин, и ваш пароль, и ваши данные. Если вы считаете, что ваша переписка не должна попасть в чужие руки, вам надо ее защитить. Хотя бы на уровне доступа к почтовому серверу.

Для этой цели Яндекс. Почта предлагает защищенный режим доступа, доступный по ссылке https://mail.yandex.ru. Этот режим обеспечивает обмен данными между вами и почтовым сервером по защищенному каналу, но не предохраняет вашу почту от возможного перехвата при передаче между почтовыми серверами. Для более надежной защиты имеет смысл использовать криптографические системы, такие как PGP или S/MIME.

Когда следует пользоваться возможностями защищенного доступа? При подключении к почтовому серверу из интернет-кафе, на работе, если вся входящая корреспонденция "перлюстрируется". Но доступ по защищенному протоколу происходит через иной порт, нежели при обычном HTTP-соединении, и этот порт может быть в организации закрыт — тогда подключиться по защищенному каналу вы не сможете.

При работе в защищенном режиме на страницах Яндекс. Почты вам будет выдаваться предупреждение: This page contains both secure and nonsecure items. Do you want to display the nonsecure items? (Данная страница содержит как конфиденциальную, так и открытую информацию. Требуется ли выводить на монитор открытую информацию?) Это сообщение связано с тем, что пиктограммы на этих страницах передаются в ваш браузер по незащищенному каналу, шифруются лишь данные о паролях и логинах, а также тексты писем.

С работой в защищенном режиме связано и возможное появление еще одного предупреждения, когда вы переходите на другие службы Яндекса: You are about to leave a secure Internet connection. It will be possible for others to view information you send. (Вы отключаетесь от защищенного интернет-соединения. Это может привести к возможности просмотра вашей информации другими.) Такого предупреждения бояться не надо. Оно означает лишь то, что вы переходите на сервер, не защищенный зашифрованным соединением, и вся дальнейшая информация будет передаваться по обычному, незащищенному протоколу. В ответ на это сообщение нажмите кнопку Продолжить.

А у браузера Netscape есть свои особенности при работе по защищенным каналам. Если вы используете его для работы с Яндекс. Почтой по защищенному каналу, вместо картинок будут показываться квадраты с ключиками. Это свойство браузера, и вам придется либо смириться с этим, либо использовать другой. Впрочем, на работу с почтой это никакого влияния не оказывает.

2.3.5. Заполняем адресную книгу

Каждый раз, приступая к новому письму, приходится вводить адрес получателя. Удобно, когда эти адреса занесены в адресную книгу, и вы можете выбирать их из нее. Но совершенно не хочется, раз заполнив адресную книгу в своем почтовом клиенте, заново заполнять ее еще и на Яндекс. Почте. Выход есть — вы можете добавить в адресную книгу Яндекс. Почты адреса из вашего почтового клиента, и вам не придется их заносить повторно.

Добавление выполняется в два этапа. На первом этапе необходимо экспортировать адреса из почтового клиента в формате CSV. Затем на странице Адресной книги выбрать ссылку Импорт, указав путь к файлу адресов. Кстати, возможен и обратный вариант — пополнение адресной книги почтового клиента адресами, занесенными в адресную книгу Яндекс. Почты. Этот процесс также является двухэтапным, на первом этапе которого вы должны отметить экспортируемые адреса и перейти по ссылке Экспорт. Перед экспортом вам потребуется выбрать почтовый клиент, для которого вы создаете список, и язык его интерфейса. Созданный и сохраненный на вашем компьютере файл далее необходимо импортировать в ваш почтовый клиент.

Рассмотрим экспорт адресных книг из различных почтовых клиентов.

Outlook Express

1. Запустите программу, выберите в меню Файл (File) подменю Экспорт (Export), в нем пункт Адресная книга (Address book).

2. Выберите формат Текстовый файл с разделителями-запятыми (Text file comma separated values) и нажмите кнопку Экспорт.

3. Укажите, где сохранить создаваемый файл (можно на рабочем столе (Desktop), поскольку после импорта в веб-почту его можно сразу удалить) и нажмите кнопку Далее (Next).

MS Outlook

1. Запустите программу, выберите в меню Файл пункт Импорт и Экспорт (Import and Export).

2. В открывшемся окне выберите Экспорт в файл (Export to a file) и нажмите кнопку Далее.

3. Выберите формат Значения, разделенные запятыми (Windows) (Comma Separated Values (Windows)) и нажмите кнопку Далее.

Внимание!

В этом месте вы можете получить сообщение о необходимости загрузки программы-импортера. Разрешите загрузку. Если программа не была установлена на вашем компьютере при установке операционной системы, может потребоваться обращение к инсталляционному диску.

4. Выберите раздел Контакты (Contacts) и нажмите кнопку Далее (Next).

5. Укажите, где сохранить создаваемый файл (можно на рабочем столе (Desktop), поскольку после импорта в веб-почту его можно сразу удалить) и нажмите кнопку Завершить (Finish).

The Bat!

1. Запустите программу, откройте адресную книгу с помощью пункта меню Инструменты | Адресная книга (Tools | Address Book, можно воспользоваться клавишей <F8>).

2. В меню Файл выберите Экспорт (Export to) и отметьте опцию Разделенный запятыми (текст) (Comma-separated (Plain text)).

3. Укажите, где сохранить создаваемый файл (можно на рабочем столе (Desktop), поскольку после импорта в веб-почту его можно сразу удалить) и нажмите кнопку Далее.

4. Поставьте флажки ФИО | Имя и E-mail (Name | First Name и E-mail) и нажмите кнопку OK.

2.4. Яндекс. Почта-2

Вот теперь, после того как мы рассмотрели возможности работы со стандартным вариантом почтового сервиса, можно перейти и к его новому варианту (рис. 2.11). Как уже говорилось, доступ к новому почтовому сервису осуществляется по ссылке http://mail.ya.ru. Эта ссылка рабочая, но, похоже, сейчас она является лишь редиректом на другой адрес сервиса — http://webmail.yandex.ru.

Но даже и этот адрес вам набирать не придется, если вы входите на почтовый сервис через главную страницу Яндекса. Если в ваших почтовых настройках выбран новый вариант сервиса, при переходе по ссылке Почта вы будете перенаправлены на новый почтовый сервер.

Примечание

Новый почтовый сервер — это только лишь его интерфейс. Работает он с теми же почтовыми ящиками, что и старая версия. Поэтому все письма, находящиеся в вашем почтовом ящике, будут доступны через любой из выбранных вами интерфейсов.

2.4.1. Отличия новой почты

Новые технологии и новый интерфейс привнесли в почту на Яндексе и новые возможности, а работать с почтой через новый веб-интерфейс теперь стало и удобнее, и проще.

Метки

Улучшена визуализация полученных сообщений. Теперь Яндекс. Почта поддерживает метки — текстовые строки различного цвета, которыми можно помечать письма. Список доступных меток (которые вы создаете сами) размещается под строкой поиска вверху страницы и для каждой метки показывает также и количество отмеченных этой меткой сообщений.

Создать метку (или — метки) можно через настройки почты (в них появился новый пункт — Метки) либо непосредственно при отметке письма (рис. 2.12). Для этого выделите письмо в списке и нажмите на кнопку Пометить. В открывшемся окне впишите имя метки, выберите цвет и нажмите Ok. Еще проще отметить письмо перетаскиванием нужной метки из строки меток на письмо. Это можно делать как при работе со списком, так и при просмотре письма. Снять метку можно простым перетаскиванием ее с письма за его пределы.

Но просто так ставить метки, чтобы у вас письма стали раскрашенными во все цвета радуги, бессмысленно. Смысл меток все же в другом. Если щелкнуть на названии метки, то в списке останутся лишь письма, отмеченные ею. Это действие сработает как фильтр по метке.

Устанавливать метки можно (и нужно!) не только вручную. Теперь в работу фильтров (в новой версии почтового сервиса они называются роботами) включена возможность автоматической привязки метки по срабатывании определенных правил.

Фильтры списка писем

Для удобства работы со списками писем в Яндекс. Почте можно "фильтровать" содержимое папок — то есть оставлять для просмотра только те письма, которые удовлетворяют выбранному условию.

На сегодня Яндекс. Почта поддерживает четыре фильтра. Можно показывать все письма (фильтр Любые), только непрочтенные (Непрочтенные), только те, к которым есть прикрепленные файлы-аттачи (С файлами), а также содержащие в качестве адресата только вас (Только мне) — последнее полезно, например, если вы ведете переписку в списках рассылки, поскольку позволяет оставить только "личные" письма. Список фильтров располагается под списком папок в правой колонке.

Перетаскивание (drag-n-drop)

Пользователю компьютера всегда хочется делать как можно меньше движений для выполнения каких-либо действий. И очень не хочется комбинировать движения мыши и работу с клавиатурой. Поэтому новые возможности работы только мышью многими будут восприняты положительно.

В новом интерфейсе многие действия можно выполнять при помощи перетаскивания (drag-n-drop). Основные объекты для перетаскивания — письма и метки. Для того чтобы перетаскивать письма, их нужно начинать "тащить" на имени отправителя.

Письма (как одно, так и несколько — если они предварительно были выделены) можно таскать и бросать:

□ в папки — письма будут перемещены в эту папку;

□ на метки — письма будут помечены этой меткой;

□ на кнопку Удалить — письма будут удалены;

□ на кнопку Это спам — система запросит подтверждения, после чего письма будут удалены как спам;

□ на кнопки Переслать и Ответить — вы попадете в интерфейс создания письма, пересылающего выбранное письмо или отвечающего на него;

□ на кнопку Пометить — вы сможете выбрать существующую или задать новую метку, которой будут помечены выбранные письма.

Метки можно таскать и бросать на письма, чтобы их пометить, за пределы писем, чтобы снять пометку, а также на кнопку Удалить для удаления.

Быстрый поиск

В почте на Яндексе можно искать при помощи полнотекстового поиска. А можно фильтровать список писем по набираемой строке без перезагрузки страницы (и здесь опять — технология AJAX). Этот фильтр срабатывает во время набора.

Для того чтобы отфильтровать письма, введите в строке поиска требуемое слово или выражение (можно даже просто несколько букв) и подождите несколько секунд, не нажимая кнопки поиска. В списке останутся только те письма, в строке адресата или теме которых содержится искомое выражение. При этом под строкой поиска (либо, при использовании меток, под строкой меток) появится информационная строка о количестве писем, соответствующих вашему условию.

Информационная строка

Как правило, она информирует вас о недавнем действии, совершенном вами, либо о свойствах данной папки, либо о приходе новой почты.

□ Информация о действиях выводится после удаления или перемещения писем, а также отправки письма.

□ Информация о свойствах папки выводится в папках Удаленные и Спам, предупреждая вас о сроке хранения писем в этих папках.

□ Информация о приходе новой почты появляется без перезагрузки страницы с использованием технологии AJAX.

Полнотекстовый поиск

Полнотекстовый поиск (рис. 2.13) выполняется так же, как и при любом поиске на Яндексе. Для этого введите текст запроса в поисковую строку и нажмите кнопку Найти или клавишу <Enter>. По умолчанию поиск производится по всем папкам, включая Отправленные, Удаленные и Спам. Чтобы ограничить поиск конкретной папкой, достаточно щелкнуть на имени этой папки в колонке правее списка писем.

Кроме ограничения поиска определенной папкой, возможно ограничить поиск конкретным адресатом. Чтобы отобрать письма, написанные или полученные некоторым адресатом, достаточно щелкнуть на его адресе в списке Адресаты (если этот адрес есть в вашей адресной книге) или Писатели (в этот список попадают те адреса, которых пока нет в вашей адресной книге).

Новые письма попадают в поисковый индекс в течении 10–20 минут после их поступления.

Обсуждения

В почтовых клиентах существует возможность объединять письма по обсуждаемой теме. В первой версии Яндекс. Почты такой возможности не было, а вот вторая версия уже позволяет просматривать письма не только в виде списка, но и в виде Обсуждений (Threads). Обсуждение — это группа писем, как правило, являющихся ответами друг на друга либо имеющих общего отправителя и заголовок. В состав обсуждений входят как письма, полученные вами, так и ваши собственные письма. В этом возможности Яндекс. Почты более совершенны, чем возможности почтового клиента, где обсуждения можно формировать внутри одной папки, вследствие чего отправленные вами письма в обсуждения не попадают.

Для того чтобы просмотреть выбранную в данный момент папку в режиме обсуждений, щелкните на вкладке Обсуждения (над списком писем). В списке, кроме обсуждений, будут и одиночные письма (то есть такие, которые не являются частью ни одного обсуждения). Обсуждения легко отличить от одиночных писем по более темному цвету фона и числу в последнем столбце. Это число — количество писем в данном обсуждении.

Также обсуждения доступны и со страницы чтения письма. Если вы откроете письмо, являющееся частью обсуждения, то справа от текста письма будет доступен список других писем, входящих в это обсуждение (выводятся не все письма обсуждения, а столько, сколько указано на странице Настройки, опция Показывать писем на странице).

Письма группируются в обсуждения автоматически. В данный момент способа отделить одно письмо от обсуждения не предусмотрено.

Сворачивание цитат

Яндекс. Почта автоматически распознает в получаемых вами письмах цитаты и подписи. Цитаты длиннее двух строк автоматически сворачиваются. Чтобы развернуть конкретную цитату, достаточно щелкнуть на плюсике слева от нее. Развернуть все цитаты в письме можно, нажав на кнопку <X> ("Икс") на клавиатуре либо совершив двойной щелчок на плюсике.

Отключить режим сворачивания цитат можно на странице Настройки, опция не сворачивать цитаты.

Работа с клавиатуры

Пользователи бывают разные, и их предпочтения также могут быть противоположными. Одним хочется выполнять минимум движений для выполнения различных действий с помощью мыши, другие привыкли работать с клавиатурой и считают такой способ наиболее удобным. Для таких пользователей во многих программах используются так называемые быстрые клавиши. В новой версии Яндекс. Почты также реализована эта возможность. Далее перечислены сочетания клавиш и действия, которые они вызывают. Все указанные клавиши — английские.

□ <M> — перейти к списку писем;

□ <C> — написать письмо;

□ <R> — ответить на письмо (действует на странице чтения письма);

□ <F> — переслать письмо (действует на странице чтения письма);

□ <L> — редактировать метки письма (действует на странице чтения письма);

□ <X> — развернуть все цитаты в письме (действует на странице чтения письма);

□ <I> — показать все картинки в письме (если скрыты, исходя из настроек);

□ <A> — выделить все элементы списка (действует на любых списках — писем, адресатов и т. п.);

□ <P>, <N> — перейти к предыдущему/следующему письму (действует на странице чтения письма);

□ <Ctrl>+<<—>, <Ctrl>+<—>> — тоже перейти к предыдущему/следующему письму (действует на странице чтения письма);

□ <Alt >+<S>, <Ctrl>+<t>, </> — перейти в строку поиска;

□ <Q> — открыть форму быстрого ответа (quickreply) и перейти в нее (действует на странице чтения письма);

□ <Ctrl>+<Enter> — отправить письмо (действует в форме быстрого ответа и на странице создания письма).

Автосохранение писем

Всегда существует вероятность, что во время работы над письмом у вас вдруг прервется связь с сервером, и вся ваша работа будет утрачена. Теперь при работе над письмом на Яндекс. Почте ваши труды утрачены не будут, по крайней мере за исключением нескольких последних минут.

При написании письма раз в три минуты происходит автосохранение на сервер. Время последнего автосохранения написано под полем для ввода текста, рядом с кнопкой Сохранить черновик. Если что-то случится с компьютером, вы всегда сможете найти недописанное письмо в папке Черновики.

Автосохранение также вызывается при закрытии окна, в котором вы пишете письмо. Вы можете сохранить черновик и вручную, нажав на кнопку Сохранить черновик.

Новые возможности в списке писем

Кроме перетаскивания и меток, в списке писем появились также следующие новые возможности:

групповое выделение писем — теперь можно выделять несколько идущих подряд писем, щелкнув мышью на флажке первого из них, а затем, удерживая клавишу <Shift>, — на флажке последнего;

всегда доступное меню действий (toolbar) — при прокрутке списка писем, меню действий (слева) всегда остается доступным, не уходя из поля доступа пользователя;

первая строка — кроме заголовка, в списке писем также отображается первая строка письма, причем первая содержательно, то есть при формировании первой строки все приветствия и цитаты не учитываются.

2.4.2. Работы продолжаются

Сегодня новый дизайн Яндекс. Почты еще не принял своего окончательного варианта. Над его внешним видом, функционалом, удобством использования продолжают работать. О том, что эти работы завершены, пользователи Яндекс. Почты узнают из писем, которые придут на их адрес. Если сейчас новым дизайном пользуются лишь те, кто прочитал короткую новость об открытии этого сервиса, то после завершения работ все его клиенты получат приглашения перейти на новый интерфейс. О том, какие могут в нем появиться изменения по сравнению с первым вариантом, что в него будет добавлено, а что — убрано, в Яндексе, как всегда, не говорят, предлагая дождаться официального открытия новой почты.

2.5. Яндекс. Почта и почтовые клиенты

Доступ к почтовому ящику через веб-интерфейс имеет свои преимущества. Тем не менее большинство пользователей предпочитает сохранять свою корреспонденцию на собственном компьютере, а не в Сети. И в этом случае без почтового клиента не обойтись. Можно ли работать с Яндекс. Почтой через почтового клиента? Да, можно. Далее приводится минимально необходимая информация о том, как можно настроить наиболее распространенные почтовых клиентов для такой работы.

2.5.1. MS Outlook и MS Outlook Express

Для работы с почтовым сервером вам надо настроить учетную запись (account). Запустите программу, выберите в меню Сервис (Tools) пункт Учетные записи (Accounts). Далее следует заполнить следующие поля (табл. 2.1).

Кроме того, в свойствах учетной записи (Internet Accounts) на вкладке Серверы (Servers) надо включить параметр Проверка подлинности пользователя (My server requires a authentication). Настраивать его не требуется, достаточно всего лишь поставить флажок Как на сервер входящей почты (Use same settings as my incoming mail server) в настройках (Settings) исходящего почтового сервера (Outgoing mail server).

2.5.2. The Bat!

Для работы с почтой на Яндексе вам, как и для работы с другими почтовыми серверами, необходимо создать новый почтовый ящик. Обязательно заполните поля, приведенные в табл. 2.2.

Аналогично настройкам MS Outlook, в настройках почтового ящика The Bat! необходимо определить тип аутентификации: Ящик (Account) | Свойства почтового ящика (Properties) | Транспорт (Transport) | Отправка почты (Send mail) | Аутентификация (Autentication) | Аутентификация SMTP RFC2554 (Perform SMTP Autentication RFC2554).

Аналогичные настройки необходимо будет выполнить и при работе с другими почтовыми клиентами.

2.5.3. Возможные ошибки

Но вот ваш почтовый клиент готов к работе. С чем вы при этом можете столкнуться?

□ Первое — не все приходящие письма будут скачиваться. Это может быть связано с вашими настройками для работы с папкой Спам. Если вы не меняли настройки по умолчанию, все письма из этой папки будут скачиваться на локальный компьютер, только к их теме будет добавлена фраза [OBORONA-SPAM], а к письму будет добавлен дополнительный почтовый заголовок X-Oborona-Spam-Flag: YES. Используя эту информацию, вы сможете настроить правила сортировки писем на почтовом клиенте.

Но если в настройках вы запретили скачивание содержимого папки Спам (или Рассылки + Спам), то в этом случае все, что попадает в эту папку, на локальный компьютер скачиваться не будет. Для просмотра папки вам придется пользоваться веб-интерфейсом.

□ Второе — вы можете получить ответ, что в вашем почтовом ящике нет новых писем, хотя на самом деле почта уже пришла. Это может быть связано с тем, что при большой загрузке POP3-сервер может не успеть опросить ящики и сообщит вам неверную информацию.

□ Третье — вы можете получить от почтового сервера отказ от обработки вашего обращения. Наиболее часто встречающиеся варианты:

• ERR login failure, try later:

◊ вы неправильно ввели логин или пароль в настройках почтовой программы (или, возможно, указали не то имя почтового сервера. Правильное имя почтового сервера pop.yandex.ru);

◊ возможно, сервер временно недоступен и не может авторизовать вас в данный момент. Попробуйте проверить почту через некоторое время.

• 550 5.4.3 Policy analysis found DNS error on the target domain: <….@…> — невозможно определить адрес домена, указанного в адресе: либо вы неправильно написали адрес (то, что следует после @), либо недоступен или неправильно сконфигурирован DNS-сервер домена получателя;

• 5.7.1 Policy analysis reported: Yandex users — please turn on SMTP auth, others — please use SMTP server of your provider или 5.7.1 Policy rejection on the target address: < >:

◊ Для программ MS Outlook или Outlook Express в свойствах учетной записи на вкладке Серверы надо включить параметр Проверка подлинности пользователя. Настраивать его не требуется, достаточно всего лишь поставить флажок Как на сервер входящей почты в настройках исходящего почтового сервера;

◊ Для программы The Bat! нужно установить в настройках: Ящик | Свойства почтового ящика | Транспорт | Отправка почты | Аутентификация | Аутентификация SMTP RFC2554.

• 552 5.3.4 Size of this message exceeds the fixed maximum size of 10000000 chars for received email — размер отправляемого письма превышает допустимый объем. Максимальный размер одного входящего/исходящего письма на Яндекс. Почте — 10 Мбайт. Учтите, что при присоединении к письму некоторые файлы могут увеличиваться в объеме в полтора-два раза.

□ Четвертое — вы не можете отправить письмо сразу в несколько адресов. Причина может быть в том, что вы в строке адресов не отделили запятой адреса друг от друга. Вторая причина — почта Яндекса ограничивает десятью количество адресов, на которые отправляется одно письмо. Если адресов больше — письмо не будет отправлено, заблокированное как возможный спам. Но это уже больше подходит к тому, чтобы теперь поговорить о спамообороне.

2.6. Спамооборона

В ходе подготовки к выделению рассылок в отдельную группу сообщений Яндекс сформулировал и опубликовал документ "Что такое «честная» рассылка" (http://help.yandex.ru/mail/?id=617625), озвучив в нем свое представление о корректной работе служб, осуществляющих массовую рассылку почтовых сообщений.

Напомним, что Яндекс начал борьбу за чистоту почты в апреле 2003 года. Первый антиспамовый фильтр был основан на массовости — в папку Рассылки помещались подозрительно похожие письма, разосланные по слишком большому списку адресов. В январе 2004 года появилась названная Спамообороной технология, использующая около двух тысяч правил фильтрации.

Есть несколько российских программных решений для корпоративных пользователей, предназначенных для борьбы со спамом. Среди них наиболее популярными и востребованными являются два — Спамтест компании "Ашманов и партнеры" и Спамооборона. Яндекс использует для проверки почты собственное решение, Спамооборону, почтовый сервис Mail.ru — Спамтест. У каждого из этих продуктов есть свои поклонники и противники. Кто-то считает, что лучше Спамтест, другие — что "Спамоборона" надежнее. Пользователю важно одно — "настоящий" спам не должен проходить сквозь программные заслоны, а нужные письма не должны пропадать среди неразобранного спама. Если эти два условия выполняются — большего и не надо (рис. 2.14).

Примечание

Всего несколько цифр, которые вряд ли скажут многое, но тем не менее. Данные взяты за 7 апреля из открытой информации на Яндекс. Почте и Mail.ru. По данным Спамообороны, за сутки было отклонено 90,45 % писем, а из оставшихся писем 51,9 % были помечены как возможный спам. На Mail.ru по результатам работы фильтра было отсеяно как спам 72,59 % от общего числа писем.

Как работает Спамооборона

Корпоративный продукт Спамооборона — это серверное решение для фильтрации спама. Устойчивость Спамообороны к новым видам спама обеспечивается автоматическим обновлением базы признаков на основе данных, полученных от Яндекс. Почты. Спамооборона относительно недорогой продукт — около $1 за каждый почтовый ящик в месяц. Она работает на операционных системах FreeBSD и Linux и поддерживает такие почтовые серверы, как SendMail, CommunigatePro и QMail. А совсем недавно Яндекс пригласил компании, чьи почтовые серверы используют MTA CommuniGate Pro под управлением операционной системы Windows, принять участие в бета-тестировании Спамообороны на новой для нее платформе.

Вот три принципа, на которых строилась разработка программы.

□ С роботами должны бороться роботы — спамерские письма рассылаются роботами в миллионах экземпляров. Отсюда следует, что быстро реагировать и эффективно обрабатывать их могут только роботы. Поэтому развитие Спамообороны — это создание все более умных алгоритмов, которые могут распознавать спам. Несмотря на все разнообразие спамерских технологий, в подобных письмах есть много характерных признаков, которые могут быть выделены статистическим анализом.

□ Письма не должны проваливаться в "черную дыру" — на Яндексе письмо либо не принимается почтовым сервером (о чем сервер-отправитель получает соответствующее уведомление), либо доходит до ящика пользователя.

□ Судьбу писем решает владелец почтового ящика — почта Яндекса по умолчанию предлагает фильтр, который складывает в папку Рассылки письма, похожие на спам. Владелец ящика может полностью отключить этот фильтр (и получать все письма в папку Входящие) либо реабилитировать адреса конкретных рассылок.

Таким образом Спамооборона не является "жестким", с раз и навсегда заданными правилами, продуктом, защищающим почту от спама. Алгоритм работы этой системы настраивается на предпочтения пользователя. В то же время система является обучаемой, а в качестве "учебного материала" для нее служит постоянно обновляемая база знаний, пополняемая за счет непрерывного анализа приходящих на Яндекс. Почту сообщений. Спамооборона учится и за счет нас, пользователей. Это происходит в силу наличия обратной связи — вспомните, в интерфейсе почтового ящика есть кнопки Это спам! и Это не спам. Безусловно, для одних сообщение может считаться спамом, для других — нет, поэтому в системе для принятия общего решения ведется анализ количества сигналов и того, и другого рода.

Помимо обучения всей системы, Спамооборона умеет подстраиваться и под конкретного пользователя Яндекс. Почты — она корректирует "белые" списки по данным обратной связи и по списку корреспондентов, которым пользователь отправляет письма.

Основные элементы Спамообороны

Спамооборона состоит из нескольких частей:

□ парсера, который разбирает письмо на элементы и собирает статистику;

□ анализирующего модуля, применяющего правила и вычисляющего "спамовый вес" каждого сообщения;

□ базы знаний, на основе которой работают правила.

Исходной информацией, с которой работает Спамооборона, является совокупность всех данных, относящихся к каждому сообщению. Это и данные почтовых серверов (IP-адреса, служебная информация), и заголовки писем, и тексты, включающие как "чистые", так и "грязные" элементы, вложения, подписи, адреса отправителей и т. п. Анализируется и сам текст письма — количество несловарных слов, скрытой информации. Системе пришлось обучаться и на письмах спамеров, которые сознательно коверкали русский язык, надеясь таким образом пробить оборону и донести свои письма до ящиков адресатов.

На первом этапе обработки письма в дело вступает парсер, который разделяет письмо на "чистую", воспринимаемую человеком, составляющую, и "грязную", "шумовую", составляющую, которая может содержать и невидимый для пользователя текст, и бессмысленные данные.

Одновременно с этим происходит анализ технической информации о письме — проверяется достоверность информации об отправителе, анализируется подлинность заголовков письма, учитываются особенности настройки сетей и почтовых систем отправителей. Поставщиком данных для системы правил является обновляемая база знаний, которая включает данные RBL, шинглы и наборы эвристик.

Пояснения

Шингл — это специальным образом рассчитываемая метрика письма, позволяющая выявлять массовые рассылки. Алгоритм расчета шинглов основан на определении уникальных характеристик схожих сообщений.

RBL (Realtime Blackhole List) — это список IP-адресов открытых почтовых релеев, прокси-серверов и неадминистрируемых сетей, с которых рассылается спам. Яндекс поддерживает собственный RBL.

Анализирующий модуль отслеживает в письме признаки, которые описаны в правилах. Правила пишутся на некотором внутреннем языке, который позволяет учесть любое свойство и признак письма. Правила описывают известные признаки и спама, и, наоборот, "хороших" писем, при этом каждому правилу приписан определенный вес. Если суммарный вес сработавших правил выше некоторого порога, письмо считается спамом. Правила можно модифицировать и добавлять без изменения самой программы, что позволяет их оперативно корректировать, а база знаний (статистики массовости писем и вложений, "черные" списки) обновляется постоянно.

Каждое правило при срабатывании добавляет к "весу" письма определенное количество баллов (весовой коэффициент), как положительный, так и отрицательный. Любое из этих правил само по себе не является достаточным для принятия определенного решения — только совокупность их может с достаточной степенью уверенности сказать, относится ли письмо к спаму или нет. И если суммарный положительный вес сработавших правил превышает порог, определенный параметрами настройки системы, письмо маркируется как спам.

Примечание

По данным Яндекс. Почты, отношение писем, неправильно помеченных как спам, к общему количеству "хороших" писем для массовой почты исчисляется десятыми долями процента. Для корпоративных сетей настройка может быть выполнена более целенаправленно, и в этом случае процент ложных срабатываний на порядок меньше.

База знаний, которая является третьим ключевым элементом системы, включает данные RBL, шинглы и наборы эвристик.

Обработка писем

Обработка письма — это основной, но не окончательный этап. Определив полученное сообщение как спам, рассылку или "чистое" письмо, Спамооборона ставит на него свою "печать", добавляя в каждое письмо следующие служебные строки заголовка:

□ X-Spam-Flag — может принимать следующие значения:

• yes — письмо определено как спам;

• NO — "чистая" корреспонденция;

• DLVR — легальная рассылка (экспериментальный режим);

• SKIP — письмо на необслуживаемый адрес, истек срок действия лицензии или произошла ошибка.

□ X-Spam-Yversion — показывает номер установленной версии Спамообороны.

□ X-Spam-Ystatus — необязательный заголовок, может быть включен для добавления строки статуса, в которой отображается количество набранных баллов и перечень сработавших правил фильтрации. Заголовок статуса может понадобиться для отладочных целей перед обращением в Службу технической поддержки.

Эта информация используется для размещения сообщений по папкам в ящиках пользователей, но не только для этого. Многие пользователи Яндекс. Почты получают свою корреспонденцию с помощью почтовых клиентов. В этом случае данные из служебных строчек заголовка могут использоваться и в клиентских программах при настройке фильтров на значение заголовка X-Spam-Flag, а также на сервере правилами sieve (сервер IMAP производства Cyrus), procmail или другими средствами предварительной обработки почты.

Спамооборона может отображать результат проверки письма не только в виде служебного поля заголовка X-Spam-Flag, обычно не просматриваемого получателем почты, но и произвольной меткой в начале поля темы письма (Subject), которую можно задать настройкой системы. Помимо заданной метки в поле темы может быть также добавлен суммарный вес письма. Наличие метки также может обрабатываться фильтрами почтовых клиентов, но, кроме того, дает пользователю визуальное представление о том, что за корреспонденция попала в его почтовый ящик.

"Белые" списки

Для фильтрации писем Спамооборона использует также понятия "белого" списка. Он формируется на основе отправленных пользователями писем. В белом списке Спамообороны сохраняются пары адресов: корреспондент (внешний адрес) — получатель (локальный адрес). При получении письма извне проверяется наличие адреса внешнего корреспондента в "белом" списке. Возможны три режима проверки:

□ 0 — "белый" список не применяется;

□ 1 — используется общий список;

□ 2 — используются персональные списки.

Если адрес внешнего корреспондента найден в "белом" списке и включен режим 1, сработает правило отправитель в "белом" списке, компенсирующий вес которого администратор системы может назначить самостоятельно. Если рассуждать логически, то это значение должно перекрывать возможные отрицательные веса. Если в "белом" списке найдена доменная часть адреса электронной почты внешнего корреспондента, сработает правило обработки доменов.

Если включен режим 2, и адрес внешнего корреспондента найден в "белом" списке получателя, сработает правило отправитель в персональном "белом" списке, а если в "белом" списке получателя присутствует доменная часть адреса электронной почты отправителя, — соответственно, правило обработки доменов в персональном списке.

2.6.1. Спамооборона для компаний

Рассказывая о некоторых принципах обработки входящей корреспонденции, пришлось привести отдельные технические детали. Для тех, кто пользуется почтовым ящиком на Яндексе, эти сведения не требуются — все основные настройки уже сделаны и могут корректироваться пользователем лишь за счет собственного "белого" списка и выставлением оценки входящей корреспонденции по типу "спам — не спам".

В определенной степени эта информация может быть интересной и полезной для системных администраторов компаний, у которых есть собственный почтовый сервер и которые предполагают использовать Спамооборону для защиты от спама. Чем может быть удобно это решение? В большинстве случаев Спамооборона не требует выделенного сервера. Рекомендованной конфигурацией является компьютер с процессором Intel Pentium 4, частотой 1,5 ГГц и 1 Гбайт ОЗУ. Такой сервер способен обрабатывать до 15 писем в секунду, что может оказаться вполне достаточным для средней компании.

Компании, использующие Спамооборону, могут подключаться к постоянно обновляемой базе знаний, на основе которой выполняется проверка сообщений. В зависимости от возможностей компании могут быть предложены два варианта подключения к этой базе. По первому варианту можно автоматически загружать обновления на свой сервер и работать с локальной копией базы знаний. При использовании второго варианта необходимо при проверке письма обращаться с запросом к базе знаний, расположенной на сервере Яндекса. Первый способ удобен при большом потоке писем, поскольку увеличивает скорость их обработки. Второй способ снижает расходы на трафик, необходимый для получения обновлений.

Спамооборону могут использовать не только компании, имеющие свои почтовые серверы, но и провайдеры. Для них даже существуют скидки от стоимости этого продукта. Зато и несанкционированного почтового трафика будет ходить по Сети меньше. Этот продукт используют такие крупные провайдеры, как PeterHost.Ru, "Комстар-ОТС", "Корбина Телеком" и др.

2.6.2. Спамооборона для всех

Сейчас мы опять обратимся к вопросу о том, как избавиться от спама на "замусоренном" почтовом ящике. Если у вашего провайдера до сих пор отсутствует проверка на спам, и ваш ящик всегда полон ненужными письмами, можете настроить проверку всей вашей почты через бесплатный публичный сервис Спамообороны.

Для того чтобы воспользоваться этим сервисом, достаточно лишь зарегистрироваться на Яндексе. При этом, помимо всех возможностей, о которых уже говорилось, каждый пользователь получает еще один дополнительный почтовый адрес: ваш_логин@so.yandex.ru. Он используется для приема на проверку всей вашей корреспонденции с внешнего адреса — внешнего по отношению к Яндекс. Почте, поскольку ваш почтовый ящик на этом сервере уже защищен Спамообороной.

Если вы решите использовать публичный сервис Спамообороны, имейте в виду, что у него есть некоторые ограничения:

□ количество сообщений, принимаемых от одного пользователя, ограничено тысячей писем в сутки. Тысяча первое сообщение не будет доставлено вне зависимости от того, является оно спамом или нет;

□ публичный сервис Спамообороны работает в тестовом режиме и не предназначен для коммерческого использования. Яндекс не несет ответственности за последствия, связанные с использованием сервиса.

Следовательно — только на свой страх и риск. Но если ваш ящик "засвечен" и подвержен спаму, остается лишь два варианта — сменить ящик или использовать внешний фильтр на спам.

Но если вы решили воспользоваться услугами сервиса, вам надо его настроить (рис. 2.15). Во-первых, перейдите на страницу http://so.yandex.ru/all/ tune.xml. Здесь необходимо ввести адрес, на который будет отправляться отфильтрованная почта. Если вы ранее этот адрес еще не включали в число ваших доверенных адресов, на него будет выслано письмо с предложением подтвердить введенный адрес. Также вам потребуется принять решение, что делать со спамом и письмами, содержащими вирусы, — как и на почте Яндекса, вся проходящая через сервис почта также проверяется и на вирусы. Выбор действий невелик — либо вы будете отмечать письма добавлением соответствующей информации в строки заголовка или в тему, либо будете такие письма удалять.

После проверки на сервисе в заголовках (headers) всех сообщений, опознанных как спам, будет содержаться служебный заголовок X-oborona-spam-flag=YES, а в тему письма (если выбрана эта опция) будет добавляться выражение [OBORONA-SPAM]. Зная это, легко настроить фильтры на почтовом ящике, куда будет перенаправляться проверенная почта.

Выполнив эти настройки, вам остается лишь настроить внешний почтовый ящик на пересылку входящей корреспонденции на ваш адрес публичного сервиса и ждать результатов. На первое время рекомендуется настроить внешний почтовый ящик таким образом, чтобы полученные с него письма сохранялись и на нем. Это может потребоваться для первоначального контроля обработки почтовых сообщений. Убедившись, что фильтрация работает качественно, можно отменить требование оставлять почту на сервере.

2.6.3. Спамооборона на Яндексе

Тем, кто пользуется для переписки почтовым ящиком на Яндексе, о спаме беспокоиться ни к чему. Все сообщения, приходящие пользователям, проверяются на спам и вирусы автоматически.

Весь процесс проверки происходит в три этапа.

1. Вначале отбрасывается явный спам, то есть те сообщения, которые приходят от надминистрируемых почтовых серверов (взломанных, открытых). Эти письма в почтовые ящики получателей не попадают. Но на почтовый сервер отправителя приходит уведомление об отказе принятия сообщения и его причине.

2. На следующем этапе выполняется проверка на наличие вирусов. Если письма не содержат никакой информации помимо самого вируса, они безжалостно уничтожается. Письма, имеющие какой-либо текст, поступают в ящик получателя с пометкой "Проверить на вирусы".

3. Все остальные письма поступают на завершающий этап проверки, когда начинает работать фильтр, помещающий в папку Спам письма, в которых программа Спамообороны обнаружила признаки спама.

Вполне вероятны и ошибки при определении спама. Спамооборона может посчитать нормальным письмо, которое вы оцените как спам. Сообщите об этом, выбрав его и нажав кнопку Это спам!. И наоборот, если вы считаете, что письмо было отнесено к спаму несправедливо, сообщите об этом, нажав кнопку Это не спам.

И не забывайте, что Яндекс. Почта не позволит вам использовать свой почтовый ящик для рассылки спама. Фильтруется не только входящая, но и исходящая корреспонденция, при которой блокируются массовые рассылки и письма с вирусами.

Вместо небольшого заключения

Яндекс. Почта — сервис, безусловно, нужный и удобный. Было бы не так — не пользовались бы им сотни и сотни тысяч. Но "плюс" этой почты в некоторых случаях оборачивается "минусом". Некоторые компании, предлагающие, к примеру, программное обеспечение, не склонны предоставлять временные лицензионные ключи пользователям, чьи почтовые ящики находятся на публичных бесплатных сервисах. Поскольку мне это приходится делать часто, могу вполне ответственно заявить, что далеко не каждая компания вышлет реквизиты для скачивания программы или временный лицензионный ключ на почтовый адрес, расположенный на Яндекс. Почте.

Дмитрий Иванов — директор по проектам компании "Яндекс" с 2005 года.

Работу в "Яндексе" начал в 2003 году в качестве руководителя службы Яндекс. Новости. Ранее Дмитрий возглавлял интернет-департамент Фонда эффективной политики, где руководил разработкой и продвижением медиапроектов в Интернете.

Дмитрий окончил исторический факультет МГУ, имеет степень кандидата политических наук.

Глава 3

Читаем новости

3.1. Что такое Яндекс. Новости

В Интернете ищут не только статичную информацию, раз опубликованную и редко изменяющуюся, но и текущую, быстроменяющуюся. И это несмотря на наличие огромного числа привычных информационных источников — радио и телевидения, газет и журналов. С каждый годом все большее количество людей читает текущие новости в онлайне. Для одних такой способ получения информации является наиболее быстрым (например, для игроков на бирже), для других — наиболее удобным (не надо приобретать десятки газет, которые через день будут выброшены). Особенно удобен способ получения новостной информации через Интернет тогда, когда хочется узнать различные точки зрения на одно и то же событие. А в этом случае одного, пусть даже и любимого, сайта бывает недостаточно. Приходится посещать сайты разных информационных агентств или изданий, при этом существует большая вероятность, что наиболее интересные мнения найдены не будут.

Значительно проще следить за новостями с помощью сервиса, который собирает их с различных сайтов, агрегирует по темам, релевантности, времени публикации. Такие сервисы существуют, и их немало. Как правило, это сервисы, которые сами не являются производителями контента. Какому из подобных сервисов отдаст предпочтение тот или иной человек, зависит от возможностей, им предоставляемых, удобства использования, качественности и своевременности подаваемой информации. В число наиболее посещаемых и, следовательно, наиболее удобных и качественных сервисов такого рода, входят и Яндекс. Новости.

3.1.1. С чего начинались Яндекс. Новости

Начало работы с новостными сайтами у поисковика складывалось примерно так же, как и работа с веб-ресурсами. Поисковые роботы обходили новостные сайты, собирали контент, добавляли его в Индекс, после чего посетители поисковой системы могли найти в ней не только информацию из документов, но и из новостей. Отличие было в том, что новостные сайты обновляют свою информацию на порядки чаще, чем иные сетевые ресурсы. Поэтому частота обхода роботами новостных сайтов была значительно выше, доходя для наиболее значимых ресурсов до 5-10 минут. Какое-то время уходило на индексирование, после чего информация становилась доступной для поиска.

Яндекс. Новости открылись в июне 2000 года и включали в поисковую базу информацию из пятнадцати источников. Этот сервис был первой полностью автоматической службой сбора и обработки новостей. Новости не только индексировались и помещались в Индекс, но также раскладывались по тематическим рубрикам. Новостная база стала одной из первых в перечне дополнительных параллельных поисков Яндекса — заголовки новостей можно было получить по результатам поискового запроса на отдельной вкладке результатов поиска.

Но новостных источников становилось все больше. И уже к 2003 году их количество перевалило за сотню (сегодня партнерами Яндекс. Новостей являются почти 2000 интернет-СМИ, и в их числе — информационные агентства широкого профиля, электронные версии печатных СМИ, сетевые издания, сайты телеканалов и радиостанций, тематические, специализированные и региональные ресурсы). Стало ясно, что первоначальный способ сбора и индексирования новостей уже перестал себя оправдывать, появилось множество дублирующих новостей, выполненных по типу copy+paste. Пришло время менять принцип сбора и обработки новостей.

В том море новостей, которое обрушилось на поисковую систему, нужно было выбрать наиболее важные, значимые новости. Это стало одной из первоочередных задач развития сервиса. А для этого необходимо было научиться, во-первых, находить и соединять сообщения на одну тему, а, во-вторых, упорядочивать сообщения по важности — для того чтобы общественно значимые события последних нескольких часов или всего дня оказывались бы максимально экспонированы.

Как собирают сюжеты

Как собрать в едином сюжете новости, опубликованные в различных источниках? В почтовой службе это легче — есть исходное письмо, и если есть ответы на него, то они "сцепляются" друг с другом и попадают в одно обсуждение. В новостях все намного сложнее — нет единого названия, тексты сообщений могут отличаться друг от друга весьма значительно. В то же время новости относятся к одному и тому же событию, следовательно, должны попасть в один сюжет. И вот что по этому поводу говорят разработчики системы поиска по новостям:

Центральная задача, которая стояла перед нами, — научиться отождествлять сообщения, относящиеся к одному и тому же сюжету. Очевидно, что эта задача лучше всего решается анализом текста и поиском максимально похожих документов.

Для определения попарной текстуальной близости сообщений мы использовали модифицированный для небольших однородных текстов алгоритм поиска похожих документов и алгоритм нечеткого поиска по кворуму. Как и любой поиск Яндекса, этот алгоритм работает с учетом морфологических вариантов русских и английских слов, причем для агнонимов (то есть "неизвестных системе слов"), составляющих в Яндекс. Новостях значительную часть словника, используется методика нахождения ближайших морфологических эквивалентов. Для частичного снятия морфологической омонимии в Яндекс. Новостях используются статистические эвристики.

Затем матрица попарной близости обрабатывается алгоритмом кластеризации с тщательно подобранным радиусом. Для того чтобы увеличить связность крупных сюжетов, мы дополнительно использовали кластеризацию второго уровня, собирая атомарные кластеры в более крупные. Такой алгоритм дает полноту около 85–90 % (то есть не более 15 % сообщений ошибочно не попадают в сюжеты) и обеспечивает точность около 95 % — в сюжетах редко встречаются сообщения на другие темы.

Отдельной задачей стало оптимальное представление и аннотирование сюжета: выбор наилучшего заголовка (зависит от его длины, свежести и максимального соответствия теме) и "цитатной" аннотации, необходимой для короткого и точного описания сюжета. Кроме того, появилась группировка по сюжетам не только текстовых сообщений, но и фото-, аудио- и видеофайлов.

Немного сложно, особенно в плане используемых терминов, но суть все же понятна.

Ранжирование сюжетов

Собрать новости, опубликованные в различных изданиях, в один сюжет — только часть того, что должен предоставить пользователю сервис. И по тематикам распределить — тоже только часть. А что из этих новостей вывести на первый план, что можно оставить в общем списке? Очередная задача — какие принципы положить в основу ранжирования.

Безусловно, основными факторами, влияющими на ранжирование, являются свежесть и размер сюжета (не новости как таковой!). Свежесть — это время публикации новостей в сюжете, размер сюжета отражает общий интерес СМИ к конкретной теме. Чем интереснее для читателей тема, тем большее количество СМИ опубликует новость и даст свои комментарии. Кроме того, учитываются количество и схожесть сообщений от конкретных изданий. Не секрет, что издания, как и веб-сайты, имеют разный рейтинг, складывающийся из многих показателей. Такие издания, как РБК, Inopressa.ru, Лента. ru будут иметь более высокий рейтинг по многим новостным тематикам, нежели региональные издания, чей рейтинг может быть выше в части новостей, касающихся лишь их региона.

Дополнительно для ранжирования сюжетов используется глобальный анализ сходства, позволяющий, в частности, находить интернет-издания с высокой степенью текстуального пересечения и учитывать этот фактор в ранжировании сюжетов.

Еще один показатель, оказывающий влияние на ранжирование сюжетов, — это наша с вами, посетителями Яндекса, работа с поиском. Количество запросов в минуту составляет при обычной дневной загрузке около 2 тыс. Этих данных вполне достаточно для того, чтобы учитывать аномалии запросов для ранжирования сюжетов в Новостях. (Ведь что такое аномалия в запросах — это наш с вами интерес к событиям.)

3.1.2. Формирование новостного блока

У Яндекс. Новостей свыше полутора тысяч информационных партнеров. Казалось бы, зачем информационным изданиям отдавать свои новости для публикации на другом ресурсе? Это должно было бы понижать посещаемость основного поставщика новостей. На самом деле все получается наоборот.

Яндекс. Новости не занимаются републикацией новостей. На новостных страницах размещается лишь заголовок и краткая аннотация. Для того чтобы прочитать новость полностью, посетитель должен будет перейти на сайт-первоисточник. Следовательно, количество посетителей у информационного сайта не только не уменьшается, а наоборот, возрастает.

Для информационных партнеров Яндекс разработал специальную партнерскую программу, где каждый участник принимает на себя определенные обязательства. К партнерству приглашаются не только центральные издания, но и региональные, что позволяет Яндекс. Новостям формировать региональные новостные ленты. Но не все издания могут стать партнерами. Обязательным условием является соблюдение партнерами действующего российского законодательства. Партнеры службы — профессиональные издания, предоставляющие качественную информацию. Еще одно условие партнерства в том, что транслируемые данные должны находиться в свободном бесплатном доступе в Интернете (необходимость регистрации считается ограничением свободного доступа).

Не будут информационными партнерами издания, занимающиеся плагиатом, не имеющие собственных источников информации и публикующие только перепечатки уже опубликованных новостей. Не смогут стать информационными партнерами издания, относящие себя к "желтой" прессе. Повышать посещаемость за счет такого рода новостей не является целью Яндекса.

Если в начале существования службы Новостей специальный поисковый робот Яндекса обходил новостные ресурсы, собирая и индексируя информацию, то теперь ситуация изменилась. Информационные партнеры Яндекса сами (с использованием структуры экспортных файлов, предлагаемой Яндексом) предоставляют Новостям свою информацию. Как правило, входящая информация обрабатывается и индексируется каждые 10 минут. При этом издания не обязаны выдавать свои новости с такой же частотой, но частота обновления должна быть заявлена изданием при заключении партнерского соглашения. По словам Елены Колмановской, соглашения о партнерстве заключены у Яндекса со всеми средствами информации, которые предоставляют свои публикации для службы Новостей. В противном случае может возникнуть ситуация, аналогичная тому, что случилось с Google.

Суд Бельгии оштрафовал Google за нарушение авторских прав

Поисковая интернет-служба Google оштрафована бельгийским судом на 3 млн евро за нарушение авторских прав на публикации бельгийских СМИ.

Ряд ведущих бельгийских франкоязычных СМИ в начале осени прошлого года выдвинули судебный иск против Google. Издатели обвинили американскую компанию в том, что она открывает доступ к их публикациям, размещенным на интернет-сайтах бельгийских СМИ, без предварительной подписки или оплаты.

Источник: Русская служба новостей, http://www.rusnovosti.ru.

Многие новостные издания часть своей информации распространяют по подписке. Как и когда эта информация может быть предоставлена Яндекс. Новостями в своих лентах, специально оговаривается при заключении соглашения между партнерами. Такой подход минимизирует вероятность возникновения конфликтных ситуаций, а посетители Новостей могут получить максимально доступную информацию.

О том, в каком виде информация попадает на индексацию в Яндекс, можно узнать в опубликованном на Яндексе материале для СМИ. В частности, там сказано, что на Яндекс отправляется полный текст сообщения, который используется только для индексации поисковым роботом и на страницах Яндекса не размещается. Но на основе полного текста автоматически формируется краткая аннотация, которая и будет опубликована вместе с заголовком и адресом, по которому размещена новость на сайте партнера.

Интересно отношение Яндекса к заголовкам новостей — ограничений на количество символов в заголовке, аннотации и полном тексте нет, однако при ранжировании заголовков новостей на страницах Яндекса их размер может учитываться (в таком случае приоритет отдается "средним" заголовкам, то есть не очень коротким и не очень длинным).

На странице базы данных СМИ (http://news.yandex.ru/smi/) можно познакомиться с полным списком информационных партнеров. Они разбиты на 4 группы:

□ центральные;

□ зарубежные;

□ региональные;

□ специализированные.

В каждой из групп СМИ в свою очередь могут быть сгруппированы по видам — информационные агентства, пресса, радио и др. Среди партнеров наибольшее количество составляют специализированные СМИ, на втором месте идут региональные.

Сайт формируется полностью автоматически, что гарантирует беспристрастное отражение информационной картины дня. Отсутствие человеческого вмешательства позволяет объективно формировать сюжеты, помещая рядом сообщения, которые могут содержать совершенно разные точки зрения. Таким образом, пользователь получает возможность сравнить, как одно и то же событие отражено в различных СМИ.

Яндекс. Новости обновляются в режиме реального времени 24 часа в сутки. Каждое поступившее сообщение об актуальном событии сразу же включается в посвященный этому событию сюжет. Аннотирование сюжетов также происходит автоматически. Актуальные заголовки и аннотации формируются компьютерной программой. При этом тексты аннотаций выбираются так, чтобы дополнять информацию из заголовка.

В связи с тем, что среди партнеров Яндекс. Новостей есть телеканалы и радиостанции, новости могут быть представлены и в виде аудио- и видеофайлов, которые также представлены заголовком и краткой аннотацией, а ссылка с таких новостей приведет вас на соответствующий файл.

Такой подход снимает ответственность с Яндекс. Новостей за подачу материала, возможные опечатки или текстуальные ошибки, допущенные источником информации. Попавшее в базу Яндекса новостное сообщение может быть удалено лишь в том исключительном случае, если оно содержит ошибку в оформлении (например, транслируется лишь часть заголовка и т. п.) и приводит к техническим сбоям в работе Яндекс. Новостей.

3.1.3. Как выглядят Яндекс. Новости

Набрав в браузере адрес главной страницы Яндекса — yandex.ru — вы увидите не только строку для ввода поискового запроса, разделы каталога и информеры. Над строкой ввода будут представлены пять главных на этот час новостей дня — только их заголовки. Эти же новости, но уже с аннотациями, будут представлены и на основной странице новостного раздела — news.yandex.ru. Следом за ними только заголовками будет представлена десятка новостей, следующая за первыми по важности (рис. 3.1).

Обратите внимание, что главная новостная страница максимально облегчена для загрузки — здесь отсутствует какая-либо графика, реклама. Загрузка страницы осуществляется быстро даже на плохих каналах связи. Тем не менее информации на странице вполне достаточно, чтобы составить представление об актуальных событиях дня.

Новостные разделы

Аналогично оформлены и тематические новостные разделы. Чтобы попасть в них, выберите нужный в левой колонке. Для некоторых разделов введены дополнительные подрубрики (например, для раздела Политика добавлена подрубрика Выборы). Подрубрики могут меняться в зависимости от конъюнктуры, от того, что может привлекать наибольшее внимание. Щелчок на названии рубрики переводит вас на тематическую страницу, где точно так же будет представлена пятерка новостей с аннотациями (но только по тематике данной рубрики), и далее десятка новостей, представленных своими заголовками.

Теперь обратите внимание на строку, размещенную над списком новостей (рис. 3.2), — сколько источников обработано, на какой момент времени. Это статистика. А вот в следующей строке, где представлено название раздела, можно увидеть, что существуют две раздельные новостные подборки по каждой тематике, одна для России, другая — для Украины. Какие-то новости окажутся общими, но многие новости и сюжеты будут основываться на региональных материалах.

Представленные на страницах разделов новости (сюжеты) не ограничиваются только своим названием и аннотацией для ведущих новостей. Помимо этого, для каждого из них присутствует дополнительная информация. Возьмем любую новость (рис. 3.3). Сразу за заголовком в скобках приведено количество публикаций в различных СМИ, связанных с этим событием и попавших в сюжет. Для некоторых новостей дополнительная информация на этом исчерпывается, но для большинства дополнена и другими данными.

Новости не только читают, о них высказывают и свои мнения. Обсуждают в блогах и на форумах. И следующая цифра в строке заголовка показывает, сколько записей (мнений) было сделано в блогах при обсуждении этой новости. Цифра, показывающая количество записей, является ссылкой на страницу поиска по блогам, перейдя по которой вы получите полный список этих записей.

Наконец, для ряда новостей может присутствовать еще одна ссылка — карта (рис. 3.4). Эта ссылка означает, что на карте отмечено место, где произошло данное событие. К примеру, когда в московском метро был открыт памятник бездомной собаке, место, где это произошло, было отмечено на карте Москвы, и его можно было посмотреть, перейдя по ссылке.

Страницы сюжетов

Если вас заинтересовала какая-либо новость, опубликованная на странице главного или тематического раздела, вы можете перейти на страницу сюжета, щелкнув на его названии.

На странице сюжета (рис. 3.5) представлены отобранные по содержательной близости новости различных источников, отсортированные в хронологическом порядке. Причем здесь подбираются не только текстовые сообщения, но также фотографии, аудио- и видеофайлы, входящие в сюжет. По умолчанию на странице сюжета показывается 30 заголовков, но под этим списком есть ссылка, по которой можно просмотреть все новости, включенные в сюжет, с их аннотациями.

Страница сюжета открывается, как правило, фотографией с места событий, а также более развернутой, чем на тематической странице, аннотацией. При этом аннотация может быть сборная, полученная из различных публикаций.

Следом приводится статистическая информация — сколько входит в этот сюжет сообщений, фотографий и других файлов, сколько высказано по этому поводу мнений в блогах. И не менее важная информация — какое информационное издание первым опубликовало эту новость (приводится название издания, дата и точное время публикации).

В конце списка новостей может присутствовать ссылка на другие сюжеты, связанные с данным. К примеру, с обсуждением установки памятника бездомной собаке Яндекс. Новости связали сюжет под названием "Суд рассмотрит дело охранника метро, убившего пса Рыжика". Поскольку все формирование раздела новостей происходит автоматически, остается лишь порадоваться такому точному определению тематически связанных сюжетов.

Если в новости упоминается географический адрес, связанный с событием, то в дополнение сюжет будет проиллюстрирован фрагментом карты города (пока поддерживается 10 городов, среди которых Москва, Киев, Екатеринбург, Самара). Как уже говорилось, в новости про памятник собаке упоминается станция метро, поэтому на странице сюжета приводится фрагмент карты Москвы (см. рис. 3.4) в районе упомянутой станции. Если вы захотите рассмотреть карту подробнее, то сможете сделать это с помощью одного щелчка, перейдя на большую карту в Яндекс. Картах.

Выделение адресов из контента проводится с помощью технологии извлечения данных, которая применяется и для выделения других важных компонентов сообщений (например, действующих лиц).

С технологической точки зрения интересной задачей оказалось определение города, к которому относится упомянутый в новости адрес. Дело в том, что авторы новостных сообщений достаточно редко пишут город непосредственно рядом с улицей, — говорит Лев Гершензон, ведущий разработчик компании "Яндекс". — Для решения этой задачи пришлось из каждого новостного сообщения выделять все названия населенных пунктов, а потом выбирать самое "релевантное" — в зависимости от количества вхождений в документ, от расположения в документе и т. п.

Очень часто в связи с тем или иным событием в онлайновых изданиях публикуются высказывания известных личностей. Наиболее интересные высказывания могут быть подобраны в специальный блок, который называется Сюжет в лицах. На странице сюжета в этом блоке представлены фамилии людей, выразивших свое отношение к обсуждаемому событию, либо тем или иным образом с ним связанные. Например, в сюжете, посвященном эмбарго на поставку мяса из Польши, в блоке Сюжет в лицах приведена фамилия Маркоса Киприану (рис. 3.6), специального уполномоченного по здравоохранению ЕС. Перейдя по ссылке с фамилии, попадаешь на страницу, посвященную этому человеку, где информация о нем представлена в виде четырех блоков:

□ кто такой Маркос Киприану (в данном случае ЕС Маркос);

Работа;

Что он говорит по поводу события;

Что о нем говорят по поводу события.

Примечание

Кстати, обратите внимание на то, что в данном случае обработка информации о человеке была выполнена некорректно. Вместо его имени была подставлена аббревиатура "ЕС", присутствующая в тексте рядом с фамилией человека, что и привело к возникновению ошибки. А вот его имя было, похоже, принято за что-то, имеющее отношение к Кипру.

3.1.4. Поиск по Новостям

Для пользователя поиск по новостям выглядит совершенно так же, как и обычный поиск по веб-страницам. То же самое поисковое выражение, которое надо ввести в строку поиска, те же дополнительные параметры, позволяющие составлять сложные поисковые выражения. Поиск по новостям можно выполнять с главной страницы Яндекса, выполнив вначале общий поиск, а затем перейдя на вкладку Новости (параллельный поиск), либо перейти в раздел Яндекс. Новости и поиск выполнить с его главной страницы.

Отличие результатов поиска по новостям от поиска по веб-страницам заключается в том, что при поиске новостей включаются дополнительные алгоритмы, формирующие сюжеты, их аннотирование и ранжирование. В результате, задавая вопрос в Яндекс. Новостях, вы получите не просто список сообщений, соответствующих вашему запросу и отсортированный по времени и релевантности. Результаты поиска будут сгруппированы по сюжетам, а ранжирование по релевантности будет выполнено согласно стандартным принципам ранжирования, принятым на Яндексе. Ранжирование основано на числе и ранге всех найденных новостей внутри новостных сюжетов, при этом ранг одной новости определяется как ее свежесть с учетом приоритетов строгого текстуального совпадения. В то же время оставлена возможность изменить сортировку по сюжетам на сортировку результатов поиска по времени.

Вы можете спросить, будут ли найдены и представлены новости, соответствующие запросу, но не попавшие в какой-либо сюжет? Будут. Такие новости считаются сюжетом из одного сообщения, к которому применяются все правила выдачи и ранжирования, как к любому иному сюжету.

Для каждого найденного сюжета приводится статистика включенных в него сообщений и ссылка для просмотра сюжета полностью. В отличие от представления сюжета на страницах новостных разделов, к найденному сюжету не добавляется информация о его обсуждении в форумах. Вместо этого предлагается ссылка для поиска по блогам по вашему поисковому выражению.

Расширенный поиск

Для поиска по новостям можно использовать дополнительные параметры, ужесточающие рамки поиска. Для этого надо со страницы Яндекс. Новости перейти на страницу расширенного поиска (не путайте его с расширенным поиском для поиска по веб-страницам).

Дополнительные ограничения для поиска распределены по четырем группам. В первой предлагается выбрать рубрику (или несколько рубрик), чьи новости вас интересуют. Вторая группа ограничений позволяет отобрать определенные СМИ, среди публикаций которых и будет выполняться поиск. Выборка производится из списка всех официальных партнеров Яндекса. Хотя список для удобства пользования рассортирован по алфавиту, непонятна система, по которой в этот список включаются издания, чьи названия начинаются с цифры (например, 3DNews). Хотя, если этим списком пользоваться постоянно, постепенно привыкаешь к тому, где искать те или иные издания.

Третье ограничение связано с выбором региона — поиск будет учитывать не только поисковое выражение, но и связь найденных новостей с выбранным регионом. Еще одно ограничение, которое вы можете наложить на поиск, позволяет определить период, за который вам нужно найти нужные новости. В качестве дополнительного параметра вы можете установить, сколько новостей будет показано на одной странице результатов поиска.

Результаты поиска

Если заданное поисковое выражение есть в новостях, будет сформирована страница результатов (рис. 3.7). Результаты по умолчанию отсортированы по релевантности, но есть возможность отсортировать и по дате публикации.

Перед выводом результатов выводится информация о найденном количестве новостей и ссылка на поиск в блогах. Далее располагаются результаты поиска, причем на первом месте выведены новости, сформированные в сюжеты. Далее — новости-"одиночки". Для сюжетов имеются ссылки на просмотр сюжетов в целом и показывается количество новостей, составляющих сюжет. В отличие от новостной ленты, для найденных новостей не даются ссылки на их обсуждение в блогах.

Если найденных новостей больше, чем может быть выведено на странице, внизу страницы будет размещена строка для перехода на другие страницы результатов поиска.

3.1.5. Немного истории, или Новости в лицах

Прежде чем перейти к следующей возможности, предоставляемой Новостями, немного истории. Предвестником пресс-портретов на Яндексе были Новости в лицах. Это одна из немногих разработок, выполненная сотрудниками Яндекса совместно со сторонней компанией. Соисполнителем разработки была компания "Интегрум" (http://www.integrum.ru/), крупнейший в мире электронный архив русскоязычных документов.

О том, как проводилась работа и с какими сложностями пришлось столкнуться разработчикам, рассказал один из создателей сервиса Лев Гершензон (http://company.yandex.ru/blog/?msg=100050&month=8&year=2005).

Идея делать автоматические именные указатели была навеяна журналом "Власть" и его "Лицами, упомянутыми в номере". Поскольку журналов, газет и прочих поставщиков текстовых документов в "Интегруме" больше трех тысяч, мы решили не мелочиться и сделать подобный именной указатель, но один для всех источников и полностью автоматический.

В большинстве случаев (малочисленные путины, фрадковы, грефы — не в счет), один человек за короткий промежуток времени (1–3 дня) упоминается как участник одного события. Мне показалось, что рубрики и сюжеты Яндекс. Новостей станут интереснее, а главное, читатель сможет быстрее и лучше понять, что к чему, если применить к ним ту же технологию.

Главной особенностью программы является отсутствие какого бы то ни было заранее заданного списка людей — новые несловарные фамилии автоматически определяются и приводятся к словарной форме по специфическому контексту (имя, инициалы и др.). Кроме того, с высокой точностью разграничиваются однофамильцы и разрешается родовая омонимия (ср. Валентина Матвиенко, Александра Лебедева — мужчина или женщина?).

А вот, например, с какими проблемами и ошибками пришлось столкнуться.

• Имена омонимичны обычным словам. В самом начале в "Сегодня в лицах" фигурировали такие персонажи: Гера Советского, Вячеслав Богу, Надежда Доброй.

• Фамилии могут совпадать с отчествами. Бывшие бизнес-партнеры Борис Абрамович Березовский и Роман Аркадьевич Абрамович и в придачу президент компании "КрасЭйр" Борис Михайлович Абрамович доставили нам немало хлопот.

• Некоторые фамилии склоняются, некоторые нет. И если их нет в словаре, по их внешнему виду (по буквам) понять, к какому типу относится фамилия (и если склоняется, то как) далеко не всегда удается. Ардзинба и Анкваба. Поняли, что первая фамилия в именительном падеже, а вторая — в родительном? А так похожи.

• Мужские и женские имена тоже очень часто имеют общие формы (см. ранее).

• Есть такие народы, в которых одного имени человеку недостаточно. Мы этого не понимаем и ошибаемся. Без энциклопедического багажа совершенно не понятно, сколько человек тут упомянуто: Джон Рональд Руэл Толкиен.

Как бы то ни было, но сервис Новости в лицах был создан, и через год после начала разработки был предъявлен посетителям. Сейчас этот сервис не выделяется отдельной страницей, как было при его создании, но превратился в поставщика информации для блоков Сюжеты в лицах.

Главной особенностью программы, анализирующей тексты новостей, является отсутствие заранее заданного списка персон — при обработке сообщения программа самостоятельно находит в тексте имена и фамилии и добавляет их в рейтинг.

Списки имен создаются отдельно для каждой рубрики, региона, сюжета и результатов поиска. Таким образом, пользователь может наблюдать, как меняется состав лиц, о которых пишут журналисты, от Нижнего Новгорода к Иркутску, кто сегодня является наиболее заметной фигурой спортивной сферы, а кто — культурной.

Рейтинги обновляются каждые 10 минут — одновременно с появлением новых сообщений на Яндекс. Новостях, — что позволяет быстро находить упоминания ньюсмейкеров в актуальных сюжетах. Списки имен представлены на всех страницах службы, когда данные позволяют набрать достаточную статистику.

Отзывы об этом сервисе превзошли все ожидания, захотелось двигаться дальше, и тогда появились пресс-портреты.

3.1.6. Пресс-портреты в Новостях

Читая новость о каком-либо событии, зачастую, если в тексте упоминается какой-либо человек, хочется узнать о нем побольше. Кто он такой, чем и когда занимался, какого его отношение к различным событиям. Самостоятельно собрать подобные сведения об интересующем вас человеке довольно сложно, для этого придется проводить обширный поиск нужной информации.

Яндекс. Новости решил выполнить эту работу за нас. Теперь в составе Новостей появился дополнительный сервис — пресс-портреты. Вот как было написано в пресс-релизе по поводу открытия этого сервиса:

В пресс-портрете на сегодняшний день представлено три типа сведений о человеке: свободные определения человека, послужной список и цитаты. Свободные определения — это звания (полковник, доцент), ученые степени (доктор экономических наук), профессии (литературный критик, известный адвокат) и любые другие описания (хороший семьянин, старый знакомый Маши Ивановой, самый богатый человек в мире). В послужной список входят факты, состоящие из названия организации (Юкос, Министерство экономического развития) и должности (президент, генеральный директор, секретарь), которую человек в ней занимал, занимает (или займет в будущем). В третьем блоке содержатся цитаты человека и цитаты о нем других людей. Каждый факт снабжен текстовой иллюстрацией фрагментом новостного сообщения, из которого была извлечена информация. Кроме того, для каждого факта можно получить все его упоминания в Яндекс. Новостях.

Справочная часть службы Яндекс. Новости состоит более чем из 1 млн пресс-портретов, 30 тыс. из которых обновляется ежедневно. Новостная служба Яндекса была открыта семь лет назад, поэтому большая часть пресс-портретов создана на основе анализа сообщений СМИ с 2000 года, в настоящее время к службе подключаются архивы новостных источников за предыдущие годы, что повышает полноту и точность сервиса.

Как и все остальные работы в Новостях, формирование пресс-портретов выполняется полностью автоматически. Поэтому одной из проблем является создание пресс-портретов для однофамильцев, когда совпадают еще и их имена и фамилии. Поэтому идеальный результат, когда одному человеку соответствует один пресс-портрет, получается не во всех случаях.

Примером может служить поиск человека Иван Иванов. На странице результатов поиска, помимо сюжетов и новостей, приведены ссылки на упоминающихся в этих новостях лиц. Но в списке наиболее известных лиц Ивана Иванова нет. Впрочем, под списком ведущей пятерки есть ссылка на все пресс-портреты, относящиеся к этому поиску, а их 93. Перейдя по этой ссылке, увидим список, в котором "Иван Иванов" встречается на первой странице, затем еще несколько раз в продолжении этого списка.

Искать людей можно не только по фамилии (например, Черномырдин или Михаил Булгаков), но и по названию организации (например, Антей, ibm или Палата лордов) — в этом случае будут найдены все, кто, по сведениям СМИ, имеет или имел к ней отношение.

Миллион пресс-портретов — величина весьма впечатляющая. Но вместе с тем нельзя ожидать, что каждый пресс-портрет содержит все информационные блоки, о которых говорилось выше. Встречаются люди, о которых известно лишь место работы либо упоминание в прессе, без привязки к месту работы, поэтому такая информация входит в блок общих сведений.

Жаль, что отсутствует возможность поиска среди этих подборок, поэтому приходится для поиска пресс-портретов выполнять поиск по фамилии человека, а затем через блок Упомянутые лица находить нужную информацию.

Возвращаюсь заново к тексту этого раздела через месяц с тем, чтобы дополнить уже написанное. Опять подтверждается, что о Яндексе писать очень сложно, здесь постоянно появляется что-то новое и написанное вчера сегодня становится уже неточным. Так произошло и с разделом пресс-портретов.

Найдите на новостной странице ссылку Пресс-портреты. Она расположена под строкой поиска. Перейдя по ссылке, вы откроете страницу (рис. 3.8), на которой представлена информация о назначениях и отставках, состоявшихся на текущую дату, список наиболее упоминаемых в новостях личностей и список людей, отмечающих сегодня свой день рождения. И уже дальше, перейдя по ссылке с фамилии упомянутого человека, вы попадете на страницу его пресс-портрета.

3.1.7. Цитаты в Новостях

Как отделить слухи от фактов? Если новость, о которой вы хотите узнать, является ли она официальной или это действительно слух, подтверждается высказыванием чиновника или лица, заслуживающего доверия, вы будете считать ее фактом. А как можно быстро найти официальное подтверждение той или иной новости? Только поиском, который поможет отыскать официальные высказывания, если они существуют.

Служба Яндекса Цитаты в новостях (http://opinion.news.yandex.ru/) выполняет это за вас. Эта служба позволяет искать высказывания людей в сообщениях СМИ. Самые популярные и наиболее цитируемые высказывания за последние сутки представлены на главной странице сервиса. Фактически, цитаты отражают картину наиболее значимых событий дня, дают ее с точки зрения главных действующих лиц.

В основе технологии выделения цитат лежит синтаксический анализатор и модуль обработки предикативных конструкций с коммуникативными глаголами и оборотами. Выделяется как прямая речь в кавычках, так и косвенная речь, выраженная придаточными предложениями ("Иванов отметил, что…") и вводными оборотами ("по словам Иванова…"). Использование результатов извлечения всех фактов о человеке и полный анализ всего новостного сообщения позволяют с высокой точностью различать однофамильцев при определении автора высказывания, даже если в предложении с цитатой никакой дополнительной информации, кроме имени и фамилии, указано не было.

Поиск (рис. 3.9) можно вести по нескольким направлениям. Для этого строка поиска разделена на две части. В первую вписывается фамилия человека, чьи высказывания вы хотите найти, во вторую то, на какую тему вы ищете высказывания. Если заполнить только первое поле, будут показаны все выбранные из СМИ цитаты конкретного человека. Если только второе — будут подобраны высказывания всех людей по данной теме. Впрочем, просматривать цитаты отдельного человека можно и со страницы его пресс-портрета, где на первой странице публикуются его последние высказывания, а по ссылке можно перейти ко всем цитатам, имеющимся в распоряжении Яндекса.

Поиск цитат (рис. 3.10) может послужить основой для сбора всевозможных несуразиц, которые допускали в своих выступлениях или интервью известные личности. База для этого обширная — если пресс-портретов насчитывается свыше миллиона, то количество цитат достигает уже четырех миллионов от более чем 630 тыс. авторов.

Обратите внимание еще на один блок, расположенный на главной странице сервиса. В правой колонке приводятся фамилии наиболее цитируемых за текущий день людей. В этой колонке их только 10, но можно увидеть и весь список людей, привлекших внимание к своим выступлениям.

3.1.8. Новости регионов

Новости, публикуемые в различных изданиях, имеют свою территориальную привязку. Это могут быть новости, связанные с местом их возникновения, хотя касаются общемировых вопросов, это могут быть новости, связанные с событиями отдельного города или поселка. Для жителей региона местные новости не менее интересны и востребованы, чем новости общероссийские или мировые.

Продвижение Яндекса в регионы, не единичное, а массовое, началось в 2004 году. В этом время появились товарные предложения региональных магазинов на Маркете, возможность ограничить поиск по своему региону, прогноз погоды по 700 городам России и мира, телевизионная программа в местном времени. Появились и региональные новости.

На момент написания этих строк количество регионов, по которым в автоматическом режиме формируются сюжеты, достигло 59 (рис. 3.11). Среди них 46 регионов России, 9 регионов Украины, а также Беларусь, Израиль, Казахстан и страны Балтии. По мере привлечения новых информационных партнеров из регионов (а это является обязательным условием выделения в общем потоке региональных новостей), будут появляться и новые региональные подборки.

Яндекс периодически публикует карту охвата регионов. На ней видны как регионы, имеющие свое представительство в Яндекс. Новостях, так и пока еще не имеющие их. На карте видно, что чем ближе к Москве, тем беднее информационное поле. Центральный и Приволжский федеральные округа заполнены на 40 %, причем отдельно Центральный — всего на 23 %, в то время как регионы остальных пяти округов охвачены на 60–70 % каждый. И только в СЗФО каждый регион имеет свою страницу на Яндекс. Новостях.

Страницы регионов автоматически строятся по принципу, общему для всех категорий Яндекс. Новостей. Региональные подборки новостных сообщений (сюжеты) формируются компьютерной программой из материалов центральных и региональных СМИ. Важность сюжета определяется с учетом актуальности и количества сообщений по теме, а также интереса пользователей.

Как выбрать новости региона? Это можно сделать двумя способами. Во-первых, используя расширенный поиск, в котором можно выбрать один или несколько регионов, новости которых вы хотели бы увидеть. Во-вторых, перейдя со ссылки Новости регионов на главной или тематической странице новостей. Этот переход откроет страницу, где перечислены все доступные регионы. Выбор любого из них (здесь можно выбрать только один из доступных регионов, в отличие от расширенного поиска) позволит выделить из общего потока новостей лишь те, которые имеют отношение к выбранному региону.

3.1.9. Новости в блогах

Давно известно, что новости не только публикуются, но и обсуждаются. Обсуждаются на форумах, обсуждаются в блогах. И мнения, которые там высказываются, зачастую бывают много интереснее опубликованных в официальных СМИ или иных изданиях. Недаром многих людей, ведущих свои блоги, приравнивают к журналистам, а их журналы не менее известны и не менее посещаемы, чем многие онлайновые новостные издания.

Поиск по блогам, реализованный в Яндексе, привел и к решению следующей задачи — связал публикуемые новости с их обсуждением в блогах. Если сюжет Яндекс. Новостей широко обсуждается в Интернете, рядом со статистикой сюжета (всего сообщений, видео, аудио) появляется ссылка В блогах: <количество мнений>. Сбор мнений и их связывание с новостями осуществляется автоматически, а наиболее обсуждаемые сюжеты приводятся на странице Новости в блогах (http://news.yandex.ru/Russia/blogs.html).

Страница "Новости в блогах" является своего рода народным рейтингом официальных новостей, — говорит Антон Волнухин, менеджер службы "Поиск по блогам". — Попробуйте взглянуть на новости со стороны читателей, их мнения могут оказаться не менее интересными. А пишут российские пользователи много — хотя доля "блоггеров" Рунета в мире пока всего 3 %, количество ежедневных "постингов" — целых 10 %.

На странице Новости в блогах (рис. 3.12) могут оказаться совсем не те новости, которые выводятся на первую страницу новостного раздела. Обсуждение происходит с некоторой задержкой по сравнению с публикацией новостей и обычно носит более "затяжной" характер, что позволяет наиболее обсуждаемым новостям дольше продержаться в числе лидеров обсуждения в блогах. Едино лишь то, что общее количество новостей на этой странице такое же, как и на странице новостного раздела, то есть пятерка наиболее популярных с краткими аннотациями и десятка следующих по популярности новостей.

3.2. Подписка на новости

Есть темы, которые интересуют человека постоянно. Кому-то интересно узнавать о последних достижениях в области космической техники, другого интересуют новости определенного вида спорта, третьему необходимо быть в курсе новостей компаний-конкурентов. Заходить на Яндекс. Новости и каждый раз задавать один и тот же запрос неинтересно, да и неправильное это решение. Потому что вы можете подписаться на получение новостей по электронной почте.

Сделать это очень просто. И, как всегда, необходимо выполнение всего лишь одного условия — вы должны быть зарегистрированы на Яндексе, поскольку управление подписками на новости осуществляется через ваши личные настройки.

Подписаться на регулярное получение новостей можно путем выполнения запроса. Сформируйте поисковое выражение и выполните поиск. На странице результатов в правой колонке вы увидите ссылку Подписка на новости по запросу <ВАШ ЗАПРОС>. Если результаты выполнения запроса вас удовлетворяют, щелкните на ней. Откроется страница Подписка на новости (рис. 3.13).

Дайте вашему запросу название (по умолчанию название будет повторять текст вашего запроса). Выберите периодичность, с какой будет формироваться обновление запроса. Это может быть ежедневное обновление, обновление утром, днем и вечером либо обновление может выполняться ежечасно. Далее, можете выбрать способ получения обновлений — либо получать по почте, тогда результаты запроса будут приходить на указанный вами адрес электронной почты, либо эти результаты можно будет подключить к Яндекс. Ленте. Допускается использование обоих вариантов.

После подтверждения вы перейдете на страницу управления подписками. Здесь находится список всех запросов, по которым вы собираетесь получать регулярную информацию. Отметив любой из них (или сразу несколько), вы можете приостановить рассылку, удалить или возобновить ее. Здесь же вы можете изменить адрес электронной почты, на который она будет отсылаться. В строке статуса рассылки также показано, какой вариант получения ее вы выбрали.

В связи с тем, что есть альтернативный вариант чтения новостей с помощью Яндекс. Ленты, вы можете одним щелчком добавить все подписки в свою ленту.

Для предотвращения получения несанкционированных рассылок, каждая новая рассылка требует подтверждения. Для этого на ваш почтовый адрес отправляется письмо, в котором говорится о способе активизации рассылки. Если это не вы внесли в ваш список новую рассылку, можете ее не подтверждать и она приходить вам не будет.

3.3. Яндекс. Лента

Яндекс. Лента — это служба Яндекса для тех, кто хочет читать все интересные новости и блоги на одном сайте. Посмотрите внимательно на основные ссылки, размещенные на страницах новостей. Они несколько отличаются от тех, что присутствуют на основной странице Яндекса. Главное отличие заключается в том, что в верхней строке ссылок появилась новая — Лента (http://lenta.yandex.ru). А в конце списка новостей присутствует несколько непривычный адрес (свой для каждой новостной страницы), тип которого отнюдь не html, а имеет совсем другой формат — rss. Что это такое, мы сейчас с вами и разберем.

3.3.1. Формат RSS

Читать новости сайтов можно по-разному. Самый простой способ — заходить время от времени на сайт и просматривать новые сообщения. Можно поставить программу, которая подключается к новостному каналу и сама получает заголовки или аннотации новостей, по которым можно перейти на сами новости. В последнее время все более популярным становится формирование новостей в формате RSS.

RSS (Really Simple Syndication) — это формат представления данных. Технология RSS дает возможность в реальном времени отслеживать изменения любой информации на любом сайте, где эта технология поддерживается. Обычно эту технологию используют на сайтах, публикующих обновляемую информацию, новости, в блогах.

Примечание

RSS — это разновидность XML, формат, специально придуманный для того, чтобы легко и быстро делиться контентом. Изначально придуманный Netscape для своего портала Netcenter, он быстро завоевал популярность и стал широко использоваться.

Практически любой материал, который можно разделить на отдельные части, можно публиковать с помощью RSS: например, объявления о последних публикациях в wiki, информацию об обновлениях в CVS, историю изменений, внесенных в книгу. После того как информация преобразована в формат RSS, программа, понимающая этот формат, может вытягивать сведения о внесенных изменениях и в зависимости от результата предпринимать какие-либо действия. Более подробно о формате RSS можно прочитать на сайте http://www.kanban.ru/.

Сегодня существует семь подвидов стандарта — от RSS 0.90 до RSS 2.0. Прочитав значительное количество статей, посвященных этим разновидностям, могу сказать, что многие разработчики в большей степени склоняются к использованию стандарта RSS 2.0 как наиболее развитого. Этот стандарт позволяет прикреплять к сообщениям дополнительную информацию, в том числе и мультимедийную. Наиболее полный сравнительный анализ версий можно прочитать в статье "Что такое RSS" (автор Mark Pilgrim, http://www.webmascon.com/topics/technologies/9a.asp), а стандарт RSS 2.0 опубликован на сайте Technology at Harvard Law (http://blogs.law.harvard.edu/tech/rss).

3.3.2. Что такое RSS-рассылки

RSS-рассылка — это файл, созданный в формате RSS, еще он называется фид (feed). Именно этот файл "вбирают" в себя программы-агрегаторы, когда вы, подписавшись на рассылку, подключаетесь к новостному каналу. Тем, кто знаком с XML, понять формат рассылки будет не сложно. Фид "строится" из предопределенных строительных элементов — тегов, располагаемых опять же в предопределенной последовательности.

Когда RSS-файл создается компанией, в него обычно заносится следующая информация:

□ название компании, создавшей RSS-файл;

□ дата и время генерации файла;

□ темы новостей;

□ адрес баннера сайта;

□ заголовки (анонсы) новостей;

□ дата и время новостей;

□ краткое изложение новостей;

□ HTML-адреса до полных текстов новостей (обычно адреса ведут на страницы сайта, создавшего RSS-файл);

□ HTML-адреса до рисунков, используемых в анонсах новостей.

Разберем вкратце, какие теги используются для создания фидов, а в качестве примера возьмем любую из рассылок Яндекс. Новостей.

Листинг 3.1. Начало RSS-рассылки

<?xml version="1.0" encoding="windows-1251"?>

<rss xmlns: yandex="http://news.yandex.ru" version="2.0">

Первые две строки (листинг 3.1) — служебные. В одной описывается стандарт XML, во второй — стандарт RSS, используемые для создания фида. Кроме того, в описании версии RSS указаны источники пространства имен, применяемые в данном стандарте. Больше в фиде никакой служебной информации нет, все остальное относится непосредственно к рассылке.

В стандарте 2.0 (именно этот формат используется на Яндексе) вся рассылка обрамляется тегом <channel>, а сами новости вложены внутрь этого тега. (В версии 1.0 новости не входят в состав тега <channel>.)

Листинг 3.2. Основная часть фида по версии 2.0:_|

<channel>

<title>Яндекс. Новости: MHTepHeT</title>

<link>http://news.yandex.ru/Russia/internet.html</link>

<description>Первая в России служба автоматической обработки и систематизации новостей. Сообщения ведущих российских и мировых СМИ. Обновление в режиме реального времени 24 часа в сутки.</description>

В описании фида (рассылки) — три обязательных параметра (листинг 3.2):

□ title — название канала либо название ресурса. По нему будут ссылаться на ресурс;

□ link — ссылка на источник, соответствующий данному каналу;

□ description — краткое описание канала.

Кроме обязательных, в состав описания могут входить и необязательные элементы. К ним относятся:

□ Language — язык, на котором вы пишете свои новости;

□ copyright — авторские права, ваши, но — на английском;

□ managingEditor — электронный адрес издателя;

□ webMaster — электронный адрес веб-мас