Компьютерра PDA 10.07.2010-16.07.2010 - страница 15

Шрифт
Интервал

стр.

При этом Orange и "большой робот" работают вместе: новый робот подготавливает "быструю" часть поисковой базы, которая должна использоваться совместно с основной базой.

Другая новая технология Яндекса - "Real-Time поиск" - на ходу добавляет документы в поисковую часть по одному за секунды (обычный поиск работает на индексе, который обновляется целиком с некоторой периодичностью).

- Чтобы показывать наиболее актуальные результаты, найденные быстрым поиском, их нужно ставить выше в выдаче поисковика. Значит ли это, что сайт, обновляющийся чаще, получит преимущество при ранжировании?

Задача поисковика - выдавать релевантную информацию по любому запросу. Необходимо понять, обязательно ли релевантный ответ на конкретный запрос должен быть свежим. Если должен, и на некотором сайте есть релевантные свежие страницы, то они могут быть показаны в результатах поиска. Но сам факт свежести страницы не является достаточным, релевантность определяется с помощью сотен факторов ранжирования с применением технологии Матрикснет.

- Входят ли блоги и социальные сети в круг индексируемых быстрым поиском сайтов или ими отдельно занимается движок "Яндекс.Блогов"?

Да, Orange работает в связке с поиском по блогам "Яндекса" и получает от него информацию о новых постах. Но он индексирует её не на 100%, отбирая более ценные сообщения по разным критериям - в их числе, например, авторитетность блога. Это связано, в частности, с тем, что блогохостинги - очень крупные сайты, имеющие ограничения на количество скачиваний url в сутки.

- В пресс-релизе сказано, что быстрый поиск стремится находить в первую очередь новости. Используется ли для этого каким-нибудь образом алгоритм "Яндекс.Новостей"? Использует ли быстрый поиск каналы RSS, отдаваемые сайтами?

Мы используем много разных способов получения сигналов о появлении новой информации в интернете. Один из механизмов - из RSS-потоков партнеров "Яндекс.Новостей"; в то же время, Orange умеет и самостоятельно обнаруживать и прокачивать RSS-потоки в интернете, частота переохода которых зависит от авторитетности сайта. Общая рекомендация для вебмастеров - помимо создания RSS-потоков не забывать ставить на них ссылки из заголовков html страниц вида , это увеличивает шанс обнаружения RSS-потока и получения им большего веса

- Требует ли быстрый поиск какого-то особенно быстрого канала? Или те секунды, за которые он срабатывает - это и есть скорость скачивания страниц?

Средняя скорость скачивания страницы из интернета находится в пределах одной секунды. Orange не нужно скачивать больше страниц, чем "большому роботу", который вынужден регулярно освежать все когда-то скачанные страницы. Таким образом, никаких специальных требований к скорости канала для Orange нет.

- Быстрый поиск устроен как распределённая система - есть ли у "Яндекса" другие сервисы, построенные тем же образом?

Практически все сервисы "Яндекса" работают на кластерах, однако у каждого сервиса своя специфика, поэтому в "Яндексе" применяются разные ПО и библиотеки для распределенной обработки запросов.

Большинство наших крупных сервисов, кроме, например, "Яндекс.Почты" или "Яндекс.Директа", требуют моментального ответа на запрос, но не требуют моментальной обработки данных. Поэтому задача, которую нам пришлось решать для создания архитектуры "свежего" поиска, нетипична - в её рамках мы должны одновременно обрабатывать огромное количество страниц, но таким образом, чтобы задержка для каждой измерялась секундами. Робот Orange и "Real-Time поиск" - первые проекты на этой технологи; возможно, в будущем она будет применяться и для других сервисов "Яндекса".

Василий Щепетнёв: Код Чехова

Автор: Василий Щепетнев

Опубликовано 14 июля 2010 года

Вересаев в воспоминаниях пишет о том, как критиковал рассказ Чехова "Невеста" - глядя автору в глаза, смело и принципиально. Главное, на что указывал Антону Павловичу Викентий Викентьевич, - "не так уходят девушки в революцию". Чехов настороженно ответил: "Туда разные бывают пути".

Сам рассказ вряд ли что-нибудь об этих путях скажет. Конспирация. Несведущий обыватель прочтет о том, что девица собиралась замуж, а вместо этого пошла учиться. Вот, собственно, и всё. И если кто-либо, не зная кода Чехова, отправится по стопам девицы, то окажется в обыкновенном учебном заведении, пусть и считающим себя "высшим", а на деле мало чем отличающимся от пельменной фабрики. Только заведение выпускает дешёвых бюджетников, а пельменная фабрика выпускает дешёвые пельмени. И то, и другое ориентируется преимущественно на внутренний рынок.


стр.

Похожие книги