Компьютерра PDA 10.07.2010-16.07.2010 - [12]
В основе этой системы - новый поисковый робот под названием Orange. Он отслеживает появление в интернете новых страниц и буквально за секунды включает их поисковую базу. Когда происходит поиск, их оттуда извлекает так называемый "Real-Time поиск". В блоге компании сообщаются некоторые подробности устройства нового поискового механизма. В частности, говорится о том, что в первую очередь он старается обращать внимание на новостные и прочие часто обновляемые сайты.
Сообщается также, что обе технологии были созданы в калифорнийской офисе компании в рамках инициативы Yandex.Labs. Федор Романенко, менеджер качества поиска, раскрыл для "Компьютерры" некоторые детали.
- Есть ли у быстрого робота какие-то особенности индексации? Или же это просто отдельная версия обычного поиска, ориентированная на часто обновляющиеся сайты?
Задача двух новых технологий Яндекса - робота "Orange Crawler" и "Real-Time поиска" - уменьшить до считанных секунд время появления новых важных страниц в поиске, которое раньше можно было сократить для части документов до 20 минут (но не устранить полностью), а также рассчитывать ссылочные факторы, которые используются для отбора самых интересных страниц и их ранжирования на поиске.
Для этого робот Orange должен уметь обрабатывать и индексировать документы (в частности, рассчитывать ссылочные факторы ранжирования) по одному, в отличие от большого робота, который сортирует страницы "пакетами" - какое-то время готовит версию индекса с новыми документами, обрабатывая сразу много страниц, потом выкладывает её на поиск. Обработка документов по одному позволяет сократить до секунд время выкладки конкретного документа, но более затратна с точки зрения нагрузки на сервера; к тому же она не позволяет вычислять факторы ранжирования, основанные на глобальной статистике по всем страницам, и факторы класса PageRank.
При этом Orange и "большой робот" работают вместе: новый робот подготавливает "быструю" часть поисковой базы, которая должна использоваться совместно с основной базой.
Другая новая технология Яндекса - "Real-Time поиск" - на ходу добавляет документы в поисковую часть по одному за секунды (обычный поиск работает на индексе, который обновляется целиком с некоторой периодичностью).
- Чтобы показывать наиболее актуальные результаты, найденные быстрым поиском, их нужно ставить выше в выдаче поисковика. Значит ли это, что сайт, обновляющийся чаще, получит преимущество при ранжировании?
Задача поисковика - выдавать релевантную информацию по любому запросу. Необходимо понять, обязательно ли релевантный ответ на конкретный запрос должен быть свежим. Если должен, и на некотором сайте есть релевантные свежие страницы, то они могут быть показаны в результатах поиска. Но сам факт свежести страницы не является достаточным, релевантность определяется с помощью сотен факторов ранжирования с применением технологии Матрикснет.
- Входят ли блоги и социальные сети в круг индексируемых быстрым поиском сайтов или ими отдельно занимается движок "Яндекс.Блогов"?
Да, Orange работает в связке с поиском по блогам "Яндекса" и получает от него информацию о новых постах. Но он индексирует её не на 100%, отбирая более ценные сообщения по разным критериям - в их числе, например, авторитетность блога. Это связано, в частности, с тем, что блогохостинги - очень крупные сайты, имеющие ограничения на количество скачиваний url в сутки.
- В пресс-релизе сказано, что быстрый поиск стремится находить в первую очередь новости. Используется ли для этого каким-нибудь образом алгоритм "Яндекс.Новостей"? Использует ли быстрый поиск каналы RSS, отдаваемые сайтами?
Мы используем много разных способов получения сигналов о появлении новой информации в интернете. Один из механизмов - из RSS-потоков партнеров "Яндекс.Новостей"; в то же время, Orange умеет и самостоятельно обнаруживать и прокачивать RSS-потоки в интернете, частота переохода которых зависит от авторитетности сайта. Общая рекомендация для вебмастеров - помимо создания RSS-потоков не забывать ставить на них ссылки из заголовков html страниц вида , это увеличивает шанс обнаружения RSS-потока и получения им большего веса
- Требует ли быстрый поиск какого-то особенно быстрого канала? Или те секунды, за которые он срабатывает - это и есть скорость скачивания страниц?
Средняя скорость скачивания страницы из интернета находится в пределах одной секунды. Orange не нужно скачивать больше страниц, чем "большому роботу", который вынужден регулярно освежать все когда-то скачанные страницы. Таким образом, никаких специальных требований к скорости канала для Orange нет.
- Быстрый поиск устроен как распределённая система - есть ли у "Яндекса" другие сервисы, построенные тем же образом?
Практически все сервисы "Яндекса" работают на кластерах, однако у каждого сервиса своя специфика, поэтому в "Яндексе" применяются разные ПО и библиотеки для распределенной обработки запросов.
Большинство наших крупных сервисов, кроме, например, "Яндекс.Почты" или "Яндекс.Директа", требуют моментального ответа на запрос, но не требуют моментальной обработки данных. Поэтому задача, которую нам пришлось решать для создания архитектуры "свежего" поиска, нетипична - в её рамках мы должны одновременно обрабатывать огромное количество страниц, но таким образом, чтобы задержка для каждой измерялась секундами. Робот Orange и "Real-Time поиск" - первые проекты на этой технологи; возможно, в будущем она будет применяться и для других сервисов "Яндекса".
В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.
ОглавлениеКолонкаПочему мы позволяем нас обманывать, или Грустные размышления об иррациональности политической жизни Автор: Дмитрий ШабановГолубятня: Samsung Galaxy S4 — цидули перебежчика (часть 1) Автор: Сергей ГолубицкийУроки любви к Родине: McAfee патентует технологию обнаружения и блокировки пиратского содержания Автор: Сергей ГолубицкийПодпадает ли астрономия под закон о митингах Автор: Дмитрий ВибеIT-рынокНасколько глупа шумиха вокруг «умных» часов? Автор: Андрей ПисьменныйПромзонаПосмотрите на свалку, которую китайцы превратили в парк Автор: Николай МаслухинЭтот сайт позволяет создать собственное световое шоу на точном макете Токио Автор: Николай МаслухинТехнологииДжипег, подвинься! Веппи как единственный необходимый графический формат Автор: Евгений ЗолотовИнновацииПочему менеджерам российских корпораций не нужны стартапы Автор: Елена КраузоваИнга Нахмансон (Fitting Reality): «Российскому e-commerce не до виртуальности» Автор: Елена КраузоваГидGoogle Now для iOS появился без лишнего шума и уже собирает сведения Автор: Андрей Васильков.
В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.
Документ создан на основе открытого контента, расположенного по адресуhttp://offline.computerra.ru/2005/599/Размер изображений не менялся, поэтому некоторые могут быть некорректно отображены на неVGA-моделях КПК (особенно скриншоты и таблицы).
ОглавлениеТерралабOpera 10.50: оперативный релиз Автор: Андрей КрупинАнтивирус со вкусом "Яндекса" Автор: Андрей КрупинБлоки питания на любой случай, часть 2. 600–700 Вт Автор: Константин ИвановОбзор Samsung i5700 Galaxy Spica Автор: Алексей СтародымовСвоя играМодель чугунного дирижабля, или Учитель Добреску — 2 Автор: Василий ЩепетневКафедра Ваннаха: Нано-блюз Автор: Ваннах МихаилВасилий Щепетнёв: Разбор полётов перед стартом Автор: Василий ЩепетневКивино гнездо: За что боролись Автор: БЕРД КИВИОткрытые системы Королевского Флота Автор: Ваннах МихаилИнтерактивCeBIT 2010: первые новинки Автор: Алексей СтародымовReaDitorialMovavi: история развития Автор: Наталья ХудяковаГолубятня-ОнлайнГолубятня: Хули Холи Автор: Сергей ГолубицкийГолубятня: Бабу Автор: Сергей ГолубицкийГолубятня: Агора № 20 Автор: Сергей ГолубицкийНаука и жизньМарсианский экспресс Автор: Олег Волошин.
В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.
"Литературная газета" общественно-политический еженедельник Главный редактор "Литературной газеты" Поляков Юрий Михайлович http://www.lgz.ru/.
ОглавлениеИнтервьюВиктор Достов (АЭД) о регулировании электронных денег Автор: Евгений КрестниковКолумнистыАлександр Амзин: Это у нас свободно Автор: Александр АмзинВасилий Щепетнёв: Памятник из разбавленного полония Автор: Василий ЩепетневКафедра Ваннаха: Два лика Аретино Автор: Михаил ВаннахДмитрий Шабанов: Невидимая Нога и национальный вопрос Автор: Дмитрий ШабановГолубятня-ОнлайнГолубятня: Умная иллюминация в моем безумном доме Автор: Сергей Голубицкий.
СодержаниеКОЛОНКА ДЕЖУРНОГО ПО НОМЕРУНиколай РоманецкийИСТОРИИ, ОБРАЗЫ, ФАНТАЗИИВадим Вознесенский «БАБОЧЕК СПЯЩИХ КРЫЛЬЯ». РассказВиктор Инкин «РАБОЧИЙ ДЕНЬ». РассказМария Гинзбург «БИЛЕТИК НА ЛАПУТУ». РассказНаталья Колесова «Я УМЕРЛА». РассказАлексей Смирнов «ПОСЛЕДНИЙ ПУТЬ». ПовестьОльга Дмитриева «ДИАЛОГ С СОКРАТОМ». РассказВладимир Голубев «КЛАДБИЩЕ». РассказМарина Ясинская, Майк Гелприн «УБИЙ». РассказСергей Тараканов «ЦЕНА ДУШИ, ИЛИ САМОИСКУШЕНИЕ ГРАЖДАНИНА АНТОНОВА». РассказАндрей Малышев «ЧЕРТ». РассказЛИЧНОСТИ, ИДЕИ, МЫСЛИВасилий Владимирский «ВЫЛЕЗАЙ, ПРИЕХАЛИ!»Константин Фрумкин ««НОВЫЙ АНАРХИЗМ» — ИДЕОЛОГИЯ БУДУЩЕГО»ИНФОРМАТОРИЙ«АБС-премия» — 2009Наши авторы.
В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.
В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.
ОГЛАВЛЕНИЕМихаил Ваннах: Кафедра Ваннаха: Хард в наследствоДмитрий Шабанов: Трудности профориентацииЕвгений Крестников: Обзор Buffalo TeraStation Pro Rackmount TS-RVHL/R6Василий Щепетнев: Василий Щепетнёв: Шестнадцатое царствоДмитрий Вибе: Местный пух.
ОГЛАВЛЕНИЕСергей Голубицкий: Голубятня: Ваймучени из Пятого МираВаннах Михаил: Кафедра Ваннаха: Машины культурЕгор Емельянов: Всё, что нужно знать о четвёртом поколении Eee PCЕвгений Крестников: Российские IT-компании за рубежом: ISDEFВасилий Щепетнев: Василий Щепетнёв: Ответ векаАлександр Деревянко: Как Nvidia Optimus помогает экономить энергиюЕвгений Крестников: Российские IT-компании за рубежом: SpiritОлег Нечай: Платформа ПК: чего ждать в 2011 годуЕгор Емельянов: Софт: SIPPOINT - клиент для сети SIPNETОлег Нечай: Интегрированная графика в ноутбукахАлла Аршинова: Вадим Яковлев (ИК СО РАН) о перспективах биотопливаВасилий Щепетнев: Василий Щепетнёв: Двадцать восьмое желаниеЮрий Ильин: Кирилл Фаенов о суперкомпьютерах и MicrosoftСергей Голубицкий: Голубятня: Подстава (окончание)Олег Нечай: Оптические приводы DVD и Blu-ray в современных ноутбукахВаннах Михаил: Кафедра Ваннаха: Ирландия – виски и прочееПавел Скоков, Mobi.ru: Highscreen Hippo - коммуникатор в планшетеЕвгений Крестников: Российские IT-компании за рубежом: ЦРТАнатолий Вассерман: Твердотельные накопители.
ОГЛАВЛЕНИЕСергей Голубицкий: Голубятня: Интерактив №1Василий Щепетнев: Василий Щепетнёв: Сравнительная ментоскопияНиколай Маслухин: Промзона: Зубная щётка-неваляшкаОлег Нечай: Наборы системной логики для процессоров AMDЮрий Ильин: Вещь дня: Электронная книга Qumo ColibriАндрей Письменный: Internet Explorer 9 будет конкурировать с SilverlightЮрий Ильин: Константин Харитонов (CineSoft) о Cerebro и iPhoneСергей Голубицкий: Голубятня: Интерактив №2Николай Маслухин: Промзона: Солнечный фотоременьВаннах Михаил: Кафедра Ваннаха: Сингулярность и джонкаОлег Нечай: QuantumFilm: фотографии на "квантовой плёнке"Ирина Матюшонок: Михаил Плискин ("Ланит-Терком") об управлении компьютером с помощью жестовМихаил Карпов: YouTube не виноват в пиратствеСергей Голубицкий: Голубятня: ФутболМихаил Карпов: Элон Маск, мафия, ракеты и электромобилиНиколай Маслухин: Промзона: Подсветка для сумкиБерд Киви: Кивино гнездо: Межвидовое общениеМихаил Карпов: Появились первые подробности о Windows 8Андрей Письменный: Экскурсия в дата-центр "Оверсан Меркурий"Михаил Карпов: Софт: Simplenote - заметки на iPhone и на десктопеНика Парамонова: Тонкие клиенты ТОНКВасилий Щепетнев: Василий Щепетнёв: Хочу вспышку! Николай Маслухин: Промзона: Сушильный шкаф из 2050 годаСергей Голубицкий: Голубятня: Интерактив №3Крестников Евгений: Firefox 4: прогулка по минному полюМихаил Карпов: Софт: Читалка комиксов Comic RackМихаил Карпов: Microsoft не удалось стать производителем телефоновНиколай Маслухин: Промзона: Надувной галстукВаннах Михаил: Кафедра Ваннаха: Взгляд россиян на сингулярностьЮрий Ильин: Вузы и ИТ-компании: крупный разговорКрестников Евгений: Novell разрабатывает конкурента Google WaveЮрий Ильин: Игорь Снытко (Toshiba) о Cloud CompanionОлег Нечай: Системные платы для платформы AMD.
ОГЛАВЛЕНИЕВасилий Щепетнев: Василий Щепетнёв: ЭлектрозависимостьСергей Голубицкий: Голубятня: Вымывание традицииЮрий Ильин: Крис Каспрзак (Siemens PLM Software) о PLMМихаил Ваннах: Кафедра Ваннаха: Забыть Макнамару?Сергей Голубицкий: Голубятня: Дело русских "медведей": fiat lux!Олег Нечай: Отзывчивые экраны: гаптические технологии в дисплеяхДмитрий Вибе: Уси-пуси, Вселенная.
ОГЛАВЛЕНИЕСергей Голубицкий: Голубятня: Оттачиваем дефиницииМихаил Карпов: Глава Twitter рассказал об информационной перегрузкеНиколай Маслухин: Промзона: Кроссовки из "Назад в будущее"Василий Щепетнев: Василий Щепетнёв: На пальмы!Юрий Ильин: Вокруг Apple сгущаются "облака"Михаил Карпов: Конкурс для любителей электронных книгИгорь Осколков: Клавиатура Thermaltake Challenger Pro для геймеровАндрей Письменный: IFA 2010: Раз планшет, два планшетВаннах Михаил: Кафедра Ваннаха: Мемристоры и приемные детиСергей Голубицкий: Голубятня: Почему умрёт AndroidНиколай Маслухин: Промзона: Стерилизатор кухонных досокМихаил Карпов: NASA разрабатывает "рой" спутников-"камикадзе"Олег Нечай: Память из оксида кремния: дефект не всегда дефектМихаил Карпов: Полиция совершила рейды на серверы "варезных" группЕвгений Крестников: Google Wave закроется не совсемМихаил Карпов: Семь самолётов помогут лучше понять ураганыНиколай Маслухин: Промзона: Браслет-смартфонМихаил Карпов: Google будет искать без запросовВасилий Щепетнев: Василий Щепетнёв: МетаинфляцияOtto Diggman: Readitorial: Сумма будущего.