Начало > Архив ЖЖ > 2017 Яндекс - найдется не все!
2017-08-25 01:35:00
Яндекс пишет, что выкатил новый алгоритм поиска, основанный на нейронных сетях. На Хабре развернулось довольно бурное обсуждение качества поиска Яндекса и его реальной (не декларируемой) политики относительно копипасты: https://habrahabr.ru/company/yandex/blog/336094/
Особенно интересно почитать комментарии пользователя с ником asdoc.
Претензии простые - Яндекс не выдает оригиналы или выдает их далеко ниже многочисленных копий. И чем качественней контент, тем больше копий, тем сложнее найти оригинал. Хотя декларирует понижение в рейтинге сайтов, дублирующих контент, и все такое.
Я сам сталкивался с копированием информации один в один и выдачей сайта-двойника выше моего. При том, что мой сайт работает с 2008 года, двойники появились много позже. Информация хоть и не уникальная по сути, но форма представления - достаточно уникальная, чтобы я мог ее идентифицировать. Скопировано все было практически один в один, т.е. контентная часть одинаковая, даже структура страниц, ссылки... то есть, как мне кажется, Яндекс должен распознать копию и оригинал. Но нет.
Второй пример - при поиске по картинкам по запросу, например, "пробка на МКАД" Яндекс выдает первой вот эту мою фотографию: http://veefore.ru/picture.php?id=1742 (хотя у вас, может, другую?) Фотография сделана в 2010 году и с тех пор висит у меня на сайте. Проблема в том, что хоть она и выдается первой в Яндексе, но это не оригинал, а копия, и моего сайта в выдаче нет вообще. Ну то есть если поискать "другие размеры", то выдается несколько десятков сайтов, куда была скопирована фотография, а моего - нет.
Ну и сам поиск Яндекса по картинкам явным образом не способствует тому, чтобы люди переходили на сайт. В логах множество запросов к картинкам, но переходов на страницы сайта - практически ноль. Яндекс на халяву получает контент, пользователи получают контент, а производители контента ничего не получают.
Все это приводит к тому, что оригинальный авторский контент исчезает, на смену ему появляется копипаста и генерация бессмысленного контента, потому что это в итоге намного более эффективно. Исчезает не в том смысле, что люди меньше пишут, а в том, что его становится сложнее найти. По поводу контента напишу еще в одном из следующих постов.
Третий момент - Яндекс заявляет, что при поиски обращает внимание на поведние пользователей. То есть, грубо говоря, человек перешел по ссылке, задержался на странице - хорошая страница. Быстро ушел со страницы - плохая страница. Все бы ничего, но при такой схеме выше будут выдаваться популярные страницы, что еще больше добавляет им популярности. А менее популярные будут уходить вниз. Все бы ничего, но это означает, что страницы, куда не переходили люди - они никогда не вылезут в поиске. Потому что Яндекс не будет их показывать. Замкнутый круг. Вот такие у меня мысли возникают, хотя заметка вообще не про то.
This entry was originally posted at http://veefore.dreamwidth.org/16885.html
Эта запись в ЖЖ: http://veefore.livejournal.com/232915.html
|