- С Российским авторским общество какие-либо контакты налаживаете?
— Да, мы налаживаем контакты с организациями, занимающимися коллективной защитой прав. Пока у нас идёт такая масштабная работа, взаимодействуем со всеми структурами подобного рода. Достаточно активно сотрудничаем с Российской ассоциацией DVD-издателей. РАО пока не трогали...
- РАО себе наработало достаточно одиозную репутацию...
— Вот именно, что одиозную, потому что, по большому счету, то, что они делают — это мягко говоря, неправильно.
- По факту закон сейчас позволяет брать деньги с исполнителей собственных произведений, потому что они, дескать, не пошли на поклон в местное отделение РАО и не купили там лицензию на собственный концерт.
— Это один из примеров того, как чиновники пишут под себя законы — и лоббирование осуществляется только для этого. Да, мы тоже ждем поддержки от государства, но только для того, чтобы централизованно реализовать механизм эффективной борьбы с контрафактом в Сети. И более того мы предлагаем прозрачную схему для всех участников процесса, в котором, все-таки, главную роль играет автор (или правообладатель). В других моделях решения проблемы это вряд-ли получится.
К оглавлению
"Яндекс" научили искать в режиме реального времени
Андрей Письменный
Опубликовано 14 июля 2010 года
Поисковик «Яндекс» начал использование системы поиска, которая позволяет искать по только что созданным документам — буквально через минуты после их появления. В пресс-релизе компании сообщается, что количество запросов, в ответ на которые нужна самая свежая информация, в дни важных событий достигает восьми процентов, а в обычные — около двух. Новые алгоритмы позволяют поисковику удовлетворять этот спрос.
В основе этой системы — новый поисковый робот под названием Orange. Он отслеживает появление в интернете новых страниц и буквально за секунды включает их поисковую базу. Когда происходит поиск, их оттуда извлекает так называемый «Real-Time поиск». В блоге компании сообщаются некоторые подробности устройства нового поискового механизма. В частности, говорится о том, что в первую очередь он старается обращать внимание на новостные и прочие часто обновляемые сайты.
Сообщается также, что обе технологии были созданы в калифорнийской офисе компании в рамках инициативы Yandex.Labs. Федор Романенко, менеджер качества поиска, раскрыл для «Компьютерры» некоторые детали.
- Есть ли у быстрого робота какие-то особенности индексации? Или же это просто отдельная версия обычного поиска, ориентированная на часто обновляющиеся сайты?
Задача двух новых технологий Яндекса — робота «Orange Crawler» и «Real-Time поиска» — уменьшить до считанных секунд время появления новых важных страниц в поиске, которое раньше можно было сократить для части документов до 20 минут (но не устранить полностью), а также рассчитывать ссылочные факторы, которые используются для отбора самых интересных страниц и их ранжирования на поиске.
Для этого робот Orange должен уметь обрабатывать и индексировать документы (в частности, рассчитывать ссылочные факторы ранжирования) по одному, в отличие от большого робота, который сортирует страницы «пакетами» — какое-то время готовит версию индекса с новыми документами, обрабатывая сразу много страниц, потом выкладывает её на поиск. Обработка документов по одному позволяет сократить до секунд время выкладки конкретного документа, но более затратна с точки зрения нагрузки на сервера; к тому же она не позволяет вычислять факторы ранжирования, основанные на глобальной статистике по всем страницам, и факторы класса PageRank.
При этом Orange и «большой робот» работают вместе: новый робот подготавливает «быструю» часть поисковой базы, которая должна использоваться совместно с основной базой.
Другая новая технология Яндекса — «Real-Time поиск» — на ходу добавляет документы в поисковую часть по одному за секунды (обычный поиск работает на индексе, который обновляется целиком с некоторой периодичностью).
- Чтобы показывать наиболее актуальные результаты, найденные быстрым поиском, их нужно ставить выше в выдаче поисковика. Значит ли это, что сайт, обновляющийся чаще, получит преимущество при ранжировании?