Яндекс Воложа. История создания компании мечты - [110]

Шрифт
Интервал

Архитектура продукта — структура программы или вычислительной системы, которая включает программные компоненты, видимые снаружи свойства этих компонентов, а также отношения между ними.

Асессоры — специалисты, оценивающие релевантность страницы тому запросу, по которому она была представлена в результатах поиска; основная задача асессора — улучшение качества выдачи; асессоры, оценивая сайт, смотрят и на его содержание, и на раскрытие тематики, и на удобство использования ресурса; асессоры не только оценивают релевантность документа запросу, но и помогают настраивать алгоритмы поисковой системы.

Бета-тестирование — распространение новой версии (бета-версии) продукта или сервиса, платформы среди ограниченного числа пользователей.

Браузер — программное обеспечение для просмотра сайтов, то есть для запроса веб-страниц (преимущественно из Сети), их обработки, вывода и перехода от одной страницы к другой.

Движок — выделенная часть программного кода для реализации конкретной прикладной задачи — программа, часть программы, комплекс программ или библиотека, в зависимости от задачи и реализации. Использование готового движка при разработке программы, сайта или другого продукта сокращает время разработки, позволяет уделить больше времени разработке других подсистем.

Дистрибутив (дистрибутивная копия) — копия программного продукта, предназначенная для распространения (бесплатного или платного) и установки пользователем. В большинстве случаев — установочная архивированная версия программного продукта.

Детектировать (от англ. detect) — замечать, открывать, обнаруживать, раскрывать.

Интерфейс — часть программы, взаимодействующая с пользователем, посредством него приложение получает доступ к операционной системе и другим сервисам.

Код — написанный человеком текст компьютерной программы на каком-либо языке программирования.

Колдунщики — информационные блоки в результатах поиска с ответами от сервисов «Яндекса».

«Матрикснет» (MatrixNet) — метод машинного обучения, с помощью которого строится формула ранжирования поиска «Яндекса», которую теперь можно настраивать отдельно для достаточно узких классов запросов. Например, локализовать поиск для региональных пользователей.

Машинное обучение — попытка научить компьютер решать задачи, которые легко даются человеку, но формализовать путь их решения сложно. В результате машинного обучения компьютер может демонстрировать поведение, которое в него не было явно заложено.

Морфология (от греч. morhpe — форма, logos — учение) — изучает слова как части речи с точки зрения их грамматических свойств, это наука о правилах словоизменения и словообразования. Основа морфологии: корень, суффикс, приставка, окончание (или флексия — самая большая головная боль разработчиков русскоязычных поисковиков), которое способно меняться в зависимости от рода, числа и падежа. Морфология русского языка еще в 1970-х гг. была исчерпывающе описана Андреем Анатольевичем Зализняком, будущим академиком Российской академии наук. Результатом этого научного прорыва стали базовые труды для русской морфологии — «Русское именное словоизменение» (1967) и особенно «Грамматический словарь русского языка» (1977), в котором для 100 000 слов русского языка указана точная модель словоизменения и предложена классификация самих этих моделей. Этот словарь стал основой для разработки компьютерных программ автоматического морфологического анализа, в том числе в информационном поиске, в машинном переводе. Именно этот труд лег в основу алгоритма поиска «Яндекса» и других поисковиков, основанного на морфологическом принципе опознавания слов.

Омонимия — совпадение слов (словоформ) с разным лексическим значением.

Паук (робот-паук) — регулярно обходит документы по заданному маршруту; если сайт на месте, то есть работает и доступен, паук выкачивает запланированные в маршруте документы. Он определяет тип скачанного документа (.html, pdf, swf и т. п.), кодировку и язык, а затем отправляет данные в хранилище.

Псевдооптимизация — попытка обмана поисковой системы и манипулирования ее результатами с целью завышения позиции сайтов (страниц) в результатах поиска; использование SEO-ссылок, которые на коммерческой основе размещаются на сторонних ресурсах (количество ссылок на страницу и их текст учитываются при ранжировании). Спрос на SEO-ссылки стимулирует наводнение Интернета сотнями тысяч бесполезных сайтов, забитых заимствованным или бессмысленным контентом.

Поиск — состоит из двух больших частей: первая — когда поисковик ищет различные документы в Интернете и составляет поисковый индекс; вторая — когда ищется ответ на конкретный запрос пользователя в уже подготовленной поисковой базе. Пользовательские запросы сначала попадают в компьютерную систему «метапоиск», который обрабатывает каждый запрос в реальном времени — выясняет все необходимые данные про запрос (из какого региона он был задан, к какому классу относится и т. п.), проводит лингвистическую обработку; затем метапоиск проверяет, формировались ли в последнее время результаты поиска для этого запроса, потому что результаты поиска по часто задаваемым запросам некоторое время хранятся в памяти метапоиска, а не формируются каждый раз заново; если вновь пришедший запрос оказался популярным, метапоиск покажет пользователю заранее сохраненные результаты. Если же ответа в памяти нет, то метапоиск передает запрос на сервера другой компьютерной системы — «базового поиска». На базовом поиске хранится слепок Интернета, по которому ищет «Яндекс», — поисковая база. Она разбита на части, которые хранятся на разных серверах — искать ответ одновременно по нескольким частям базы данных быстрее, чем по всей базе целиком. Кроме того, у каждого сервера есть несколько копий. Это позволяет распределять нагрузку и не терять данные — если один из серверов не сможет своевременно ответить, информация все равно найдется на дублирующих серверах. Из тысяч серверов базового поиска метапоиск выбирает наименее загруженные — таким образом, чтобы вместе они содержали целую поисковую базу. Каждый из серверов отдает список документов, в которых есть слова из запроса, обратно в метапоиск. Там они объединяются, ранжируются с помощью технологии «Матрикснет» и попадают на страницу результатов поиска. Благодаря такой организации поиска «Яндекс» может отвечать пользователю за доли секунды.


Еще от автора Владислав Юрьевич Дорофеев
Отшельник

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Мой батюшка Серафим

«Мой батюшка Серафим» – это духовный опыт постижения православия. Несколько лет герой посещает Серафимо-дивеевский монастырь в Нижегородской области, место, где когда-то отшельничал и трудился на благо людей святой Серафим Саровский, один из самых почитаемых православных святых в мире. При этом, герой продолжает быть вписанным в своей профессиональный мир, но что-то, или даже очень многое переосмысляется и меняется.


Гранатовый браслет

Зарисовка «Гранатовый браслет» дает нам возможность проследить судьбу того самого мистического гранатового браслета из известного рассказа А. Куприна.


Баранья нога

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Птицы

Зарисовка про музей, как маятник времени, и птице, спорящей с Бабой-ягой за первенство в небе.


Рука Бродского

«Рука Бродского» – это, по сути, личные впечатления и оценка творчества Бродского, какие-то возникающие аллюзии, в связи с судьбой Бродского и судьбой страны, и героя.


Рекомендуем почитать
Адмирал Конон Зотов – ученик Петра Великого

Перед Вами история жизни первого добровольца Русского Флота. Конон Никитич Зотов по призыву Петра Великого, с первыми недорослями из России, был отправлен за границу, для изучения иностранных языков и первый, кто просил Петра практиковаться в голландском и английском флоте. Один из разработчиков Военно-Морского законодательства России, талантливый судоводитель и стратег. Вся жизнь на благо России. Нам есть кем гордиться! Нам есть с кого брать пример! У Вас будет уникальная возможность ознакомиться в приложении с репринтом оригинального издания «Жизнеописания первых российских адмиралов» 1831 года Морской типографии Санкт Петербурга, созданый на основе электронной копии высокого разрешения, которую очистили и обработали вручную, сохранив структуру и орфографию оригинального издания.


Санньяса или Зов пустыни

«Санньяса» — сборник эссе Свами Абхишиктананды, представляющий первую часть труда «Другой берег». В нём представлен уникальный анализ индусской традиции отшельничества, основанный на глубоком изучении Санньяса Упанишад и многолетнем личном опыте автора, который провёл 25 лет в духовных странствиях по Индии и изнутри изучил мироощущение и быт садху. Он также приводит параллели между санньясой и христианским монашеством, особенно времён отцов‑пустынников.


Повесть моей жизни. Воспоминания. 1880 - 1909

Татьяна Александровна Богданович (1872–1942), рано лишившись матери, выросла в семье Анненских, под опекой беззаветно любящей тети — Александры Никитичны, детской писательницы, переводчицы, и дяди — Николая Федоровича, крупнейшего статистика, публициста и выдающегося общественного деятеля. Вторым ее дядей был Иннокентий Федорович Анненский, один из самых замечательных поэтов «Серебряного века». Еще был «содядюшка» — так называл себя Владимир Галактионович Короленко, близкий друг семьи. Татьяна Александровна училась на историческом отделении Высших женских Бестужевских курсов в Петербурге.


Неизвестный М.Е. Салтыков (Н. Щедрин). Воспоминания, письма, стихи

Михаил Евграфович Салтыков (Н. Щедрин) известен сегодняшним читателям главным образом как автор нескольких хрестоматийных сказок, но это далеко не лучшее из того, что он написал. Писатель колоссального масштаба, наделенный «сумасшедше-юмористической фантазией», Салтыков обнажал суть явлений и показывал жизнь с неожиданной стороны. Не случайно для своих современников он стал «властителем дум», одним из тех, кому верили, чье слово будоражило умы, чей горький смех вызывал отклик и сочувствие. Опубликованные в этой книге тексты – эпистолярные фрагменты из «мушкетерских» посланий самого писателя, малоизвестные воспоминания современников о нем, прозаические и стихотворные отклики на его смерть – дают представление о Салтыкове не только как о гениальном художнике, общественно значимой личности, но и как о частном человеке.


Морской космический флот. Его люди, работа, океанские походы

В книге автор рассказывает о непростой службе на судах Морского космического флота, океанских походах, о встречах с интересными людьми. Большой любовью рассказывает о своих родителях-тружениках села – честных и трудолюбивых людях; с грустью вспоминает о своём полуголодном военном детстве; о годах учёбы в военном училище, о начале самостоятельной жизни – службе на судах МКФ, с гордостью пронесших флаг нашей страны через моря и океаны. Автор размышляет о судьбе товарищей-сослуживцев и судьбе нашей Родины.


Расшифрованный Достоевский. «Преступление и наказание», «Идиот», «Бесы», «Братья Карамазовы»

Книга известного литературоведа, доктора филологических наук Бориса Соколова раскрывает тайны четырех самых великих романов Федора Достоевского – «Преступление и наказание», «Идиот», «Бесы» и «Братья Карамазовы». По всем этим книгам не раз снимались художественные фильмы и сериалы, многие из которых вошли в сокровищницу мирового киноискусства, они с успехом инсценировались во многих театрах мира. Каково было истинное происхождение рода Достоевских? Каким был путь Достоевского к Богу и как это отразилось в его романах? Как личные душевные переживания писателя отразились в его произведениях? Кто был прототипами революционных «бесов»? Что роднит Николая Ставрогина с былинным богатырем? Каким образом повлиял на Достоевского скандально известный маркиз де Сад? Какая поэма послужила источником знаменитой легенды о «Великом инквизиторе»? Какой должна была быть судьба героев «Братьев Карамазовых» в так и ненаписанном Федором Михайловичем втором томе романа? На эти и другие вопросы о жизни и творчестве Достоевского читатель найдет ответы в этой книге.