Справка о работе раздела «Новости» поисковика Yandex.ru Из информации, полученной частным образом, известно, что в «Яндексе» есть редактор, который следит за новостями, но перед ним стоит задача исключительно по недопущению выхода в топ оскорбительных или нарушающих законодательство заголовков. Заголовки для сюжетов берутся из надежных проверенных изданий, чтобы снизить подобные риски. Вмешательство же в алгоритм крайне затруднительно, так как его разработка и доработка происходила в течение длительного времени, и ее изменение может нарушить функционирование сервиса. Таким образом, «Яндекс», исходя из технической сложности и нецелесообразности реализации редакторской политики, отбирает новости исключительно автоматически, ограничивая только появление оскорбительных или нарушающих закон названий тем. Более масштабно влиять на результаты выдачи «Яндекс» не может из-за технических рисков и экономической бесполезности для себя. О работе алгоритма отбора новостей news.yandex.ru: «Яндекс» анализирует новостные сайты и порталы в режиме реального времени, категоризируя новости по сюжетам. Содержание сюжета анализируется как по количеству новостей с его упоминанием, так и по времени их появления. Вслед за этим строится рейтинг сюжетов на основе их частотной характеристики. Иными словами, чем больше СМИ написало о том или ином событии и чем больше новостей о нем вышло в течение определенного промежутка времени, тем выше позиция сюжета в рейтинге новостей. Так, к примеру, решение крымского парламента войти в состав РФ стало сенсацией. Об этом практически одновременно написало большое количество СМИ, что позволило сюжету “Крымский парламент проголосовал за присоединение к России” сходу занять первое место. В целом, положение сюжета в рейтинге напрямую зависит от показателей самого сюжета относительно других тем. Другими словами, на позиции рейтинга сильное влияние оказывает сложившаяся к анализируемому моменту времени конъюнктура новостного поля. Подбор новостей сюжет происходит посредством алгоритмов латентно-семантического анализа, который на основании используемых в статье слов объединяет их в сюжет, так же анализируя оригинальные тексты, перепечатки и неглубокие рерайты, отдавая предпочтения уникальным текстам, а остальные скрывая как похожие. Вмешаться в подборку сюжета «Яндекс» теоретически может, но на практике это не имеет смысла и потребует больших людских ресурсов, делающих ручную модерацию нерентабельной.