Яндекс для всех - [6]
Какова психология того, кто ищет информацию? Считается, что наиболее подходящие (релевантные) документы должны быть на первой-второй страницах результатов поиска. Если количество полученных результатов больше, человек вряд ли будет просматривать остальные страницы. И даже если в числе найденных есть документ, полностью отвечающий заданным условиям, но находится он на странице из второго десятка, ищущий этот документ не увидит — он просто не дойдет до этой страницы. Поэтому громадное значение приобретает и ранжирование документов в результатах поиска по их релевантности запросу.
По поводу релевантности Яндекс говорит, что это "соответствие ответа вопросу", но при этом важны две составляющие — полнота (ничто не забыто) и точность (отсутствие лишнего).
Релевантность различают как содержательную и формальную. Воспользовавшись словарями, представленными в Яндексе, предложу определения этих понятий:
□ содержательная релевантность — соответствие документа информационному запросу, определяемое неформальным путем;
□ формальная релевантность — соответствие, определяемое алгоритмически путем сравнения поискового предписания и поискового образа документа на основании применяемого в информационно-поисковой системе критерия выдачи.
В простейшем случае, релевантность текста определенному запросу — это процент вхождения запроса к общему объему текста. Для поисковых систем высокорелевантным текстом считается такой, где вхождение запроса в текст примерно равно 4–7 % — меньшего может не хватить, большее чревато тем, что система сочтет текст за поисковый спам и наложит на страницу некий понижающий фильтр или может вообще убрать страницу из результатов выдачи по искомому запросу.
Конечно, каждая поисковая система использует гораздо более сложные способы вычисления релевантности документов запросу пользователя. Тем не менее, несмотря на то что алгоритмы у всех поисковых машин разные, они построены на общих принципах — основные отличия результатов выдачи заключаются не в алгоритмах определения релевантности, а в конкретных способах реализации этих алгоритмов.
Какие же факторы, помимо вхождения слов запроса в текст документа, оказывают дополнительное влияние на его место среди других документов? Каждая поисковая машина, стремясь привлечь качеством выдачи запрашиваемой информации, разрабатывает собственные критерии подсчета релевантности. Это и плотность ключевых слов на странице, и разделы страниц, где находятся эти слова, объем содержания, тексты заголовков и ссылок и многое другое. Учитываются и такие рассчитываемые показатели сайтов, как индекс цитирования, тематический индекс цитирования, Page Rank. И при этом происходит постоянное изменение степени влияния на результаты тех или иных параметров, их состав и принцип расчета.
1.2. Как устроена поисковая машина Яndex
Поисковая машина Яndex относится ко второму рассмотренному ранее типу поисковых машин. У Яndexа есть свои пауки-агенты, есть свой Индекс и поисковый механизм. Эта поисковая машина ориентирована в первую очередь на российскую часть всемирного Интернета, т. е. индексируются в ней русскоязычные сайты, расположенные в доменах ru и su. Сделаны небольшие исключения для наиболее авторитетных зарубежных сайтов. Сложнее с русскоязычными сайтами, которые зарегистрированы в международных или региональных (государственных) доменах других стран — com, org, de, us и других, но они все же попадают в Индекс и учитываются при поиске.
Большинство значимых зарубежных нерусскоязычных сайтов может быть найдено по ссылке, при этом, в отличие от русскоязычных сайтов, в Индекс они не попадают. Упрощается ситуация в том случае, когда у компаний, таких как BMW, IBM и многих других, появляются русскоязычные версии сайтов, без проблем индексируемые Яндексом.
Поисковая машина — самый востребованный ресурс Яндекса. Ежедневно его посещают около четырех с половиной миллионов посетителей, при этом количество просмотренных поисковых страниц приближается к сорока миллионам. При этом пользователи, выполняющие на нем поиск, этого не замечают — складывается впечатление, что Яндекс работает индивидуально для каждого из них.
![Римское владычество на Востоке: Рим и Киликия (II в. до н. э. — 74 г. н. э.)](/storage/book-covers/c4/c4c63f4e4512c35425bdba063954f513961f5915.jpg)
Книга отечественного ученого-антиковеда, доктора исторических наук, профессора М. Г. Абрамзона является первым в современной историографиии обстоятельным исследованием, посвященным более чем двухсотлетней истории организации римской провинции в одной из областей Малой Азии — Киликии. В период со II в. до н. э. по I в. н. э. эта область играла чрезвычайно важную роль в международных отношениях на Ближнем Востоке и занимала особое место в системе владений Рима. Опираясь на богатый фактологический материал — сведения античной традиции, данные эпиграфики, археологии и особенно нумизматики, — автор подробно реконструирует все перипетии исторических событий, происходивших в Киликии в эпоху «мирового владычества» римлян.
![«Запрещённый» Телеграм: путеводитель по самому скандальному интернет-мессенджеру](/storage/book-covers/71/718f9f8845a0997117ef115ee1c68de966a622c6.jpg)
Как стать лидером мнений среди премиальной аудитории Телеграма? Сколько зарабатывают авторы политических каналов? Какие политтехнологии реализуются на платформе мессенджера и как отличить правду от заказа? Об этом и многом другом рассказывает первый в России гид по Телеграму для специалистов по работе с общественным мнением – политиков, пиарщиков и журналистов.
![Инстаграм: хочу likes и followers](/storage/book-covers/29/290db653ce5b7a8db3bd22e1dd43e5ebe3eefc9e.jpg)
Instagram на сегодняшний момент самая динамично развивающаяся социальная сеть, имеющая самый дешевый трафик. Множество людей проводят, в среднем, от 2 до 5 часов в день за просмотром Instagram. Поэтому здесь очень легко добиваться результатов. Не важно, хотите вы быть популярным блогером, вывести бизнес в Instagram, или освоить новую востребованную профессию SMM-специалиста – эта книга будет одинаково полезна всем. Эта издание – не набор теоретических данных. Это практика. По этим технологиям прошли обучение 250 государственных организаций; около 3000 специалистов стали экспертами в области SMM.
![Главный рубильник. Расцвет и гибель информационных империй от радио до интернета](/storage/book-covers/95/954ce3e6481d8c6a394422e3b1c15cbdfd92839c.jpg)
Превратится ли всемирная паутина в «традиционное СМИ», содержание которого строго контролируется в интересах максимизации прибыли? В чьих руках сейчас находится Рубильник интернет-истории и, по сути, — развития общества? Исследуя развитие телефонии, радио, кино и телевидения, автор показывает, как эти индустрии прошли путь от хобби — к крупному бизнесу, от открытости и гибкости — к закрытой и жесткой системе. Какое будущее ожидает всемирную Сеть?Пролить свет на прошлое, чтобы предвидеть будущее — главная задача этой книги.Эта книга для тех, кто считает интернет не просто средством общения, но и инструментом познания мира, способом самовыражения.
![Интернет-магазин без правил](/storage/book-covers/ee/eef80ce18b3ef23f98e8eb6d820a913cb0420077.jpg)
В этой книге авторы специально для вас, уважаемые читатели, изложили собственный опыт и опыт нескольких сотен своих учеников, с которыми они уже создали больше 500 интернет-магазинов в России.Описание технологии разбито на простые и понятные этапы, которые проходит абсолютно любой успешный магазин. Вы познакомитесь с основными принципами, позволяющими построить свой бизнес наиболее быстро и с вложениями, которые может позволить себе даже студент.Количество открывающихся интернет-магазинов постоянно растет, в то время как на рынке отсутствует комплексное, разработанное практиками бизнеса и профессионалами пособие, доступное широкой аудитории.Данная книга — это своеобразный бумажный вирус, который овладевает умами.
![Дизайн-мышление: от разработки новых продуктов до проектирования бизнес-моделей](/storage/book-covers/34/347c5048e1e95165b6e99837a08747d6b6ddbefd.jpg)
Методы и технологии, которые использует профессиональный дизайнер для создания предметов, могут быть очень успешно использованы для решения бизнес-задач, стоящих перед руководителями компаний. И это не только разработка нового продукта. Дизайн-мышление эффективно помогает переосмыслить суть бизнеса, лучше понять потребности клиентов, найти уникальную и прибыльную нишу для стартапа и даже реализовать благотворительный проект.Тим Браун, глава одной из самых успешных дизайн-компаний мира, делится своей концепцией дизайн-мышления и на многочисленных примерах доказывает ее эффективность.Все права защищены.Никакая часть данной книги не может быть воспроизведена в какой бы то ни было форме без письменного разрешения владельцев авторских прав.Правовую поддержку издательства обеспечивает юридическая фирма «Вегас-Лекс»VEGAS LEX.
![Рунетология. Кто управляет русским Интернетом?](/storage/book-covers/76/76653a55488ea44828aeba6adef385066d51d6bd.jpg)
Самые сильные российские интернет-бренды. Самые известные люди Рунета. Самые первые его «поселенцы». Им посвящена программа Максима Спиридонова «Рунетология», выходящая еженедельно в рамках аудиожурнала PodFM.ru. Накопленный материал представляет большой интерес для тех, кто развивает свой бизнес в интернете.В эту книгу вошли двадцать лучших интервью последнего года. Читайте, если вам интересны биографии ярких людей. Читайте, если вам хочется больше узнать об истории построенных ими мощных компаний. Читайте, если вы ищете пути к успеху в Сети.