Здравствуйте, уважаемые читатели! Закон Ципфа поможет проверить текст на естественность. Так, по крайней мере, считается. Что за «естественность» на нашу голову? Нужно ли контролировать еще и этот показатель, насколько важен он для продвижения сайта? Корректно ли происходит его определение онлайн сервисами? Со всеми этими вопросами хорошо бы разобраться. В сети гуляют различные, порой самые противоположные мнения по этому поводу. Вставлю ка, и я свои «пять копеек» и попробую изложить собственные подходы к этой Ципфе.
Почему вдруг про закон — в женском роде? Да потому что мне так и хочется сравнить детище лингвиста и филолога Джорджа Кингсли Зипфа с хитромудрой лисой, которая правдами и неправдами проникает в нашу «лубяную избушку» — копирайтинг и начинает там качать права. Но сначала немного предыстории с математикой и статистикой. Но, не пугайтесь, друзья, я и сама не из сильных вычислителей, так что не буду мучить ни вас, ни себя.
Закон Ципфа и глобальные закономерности
Дж. К. Зипф сам себя называл специалистом по статистической социальной … экологии. Интересное сочетание, не правда ли? Он пытался исследовать закономерности социальных явлений с точки зрения статистики и математики больших чисел. И ему это в какой-то степени удалось. Так на примере сопоставления частотности употребления слов английского языка с их номером в «табеле о рангах» ученый выявил, что соблюдается обратно пропорциональная зависимость. Грубо говоря, слово, которое занимает вторую строчку в списке по частоте употребления, используется в два раза реже, чем первое; третье — в три раза и так далее. С точки зрения математики эта функциональная зависимость описывается распределением Парето. Для каждого языка, разумеется, вводятся свои константы и коэффициенты.
Эта же закономерность прослеживается и в некоторых экономических категориях, например, распределении доходов богатейших людей мира. Кроме того, численность населения опять-таки крупнейших городов большинства стран мира тоже выстраивается в шеренгу, обозначенную тем же Зипфом. С некоторыми отклонениями, с учетом всевозможных возмущающих факторов, но закон каким-то непостижимым образом работает. Не хочу останавливаться долго на обсуждении этого феномена. Нас загадочный зверь Ципфа интересует все-таки даже не с точки зрения лингвистики, а со стороны применимости его к небольшим выборкам слов, каковыми являются наши статьи.
Стоит ли проверять тексты по закону Ципфа
Заметьте друзья, в предыдущем разделе мы говорили о растущих мегаполисах или капиталах богачей, употребляя превосходную степень. На одном из сайтов я даже нашла сведения, что уже для городов со средней численностью населения выкладки Зипфа не работают. То же и с экономикой: для фирм, имеющих доходы менее 10 млн $/год, закон «ранг/частотность» тоже не срабатывает. Что касается лингвистических изысканий, то целая языковая группа — подборка нехилая. Английский насчитывает, например, около миллиона слов. И там, да, соотношение частотности и употребляемости этих слов идеально выстраивает гиперболу. Но вот что-то я нигде не нашла ограничений для применения Ципфы к выборкам слов небольшого объема.
Однако, простое чувство логики подсказывает, что если уж средние (с населением в сотни тысяч) города или фирмы с доходами менее 10 млн (бедненькие!) не могут выступать апологетами зипофских расчетов, то для чего мучить наши тексты. Ведь и тысяча слов наберется в них нечасто. Так средняя статья на 3 тыс. знаков б/п содержит примерно 400—500 слов. И какую же закономерность пытаемся мы отыскать среди подобной группы?
Нет, возможно, что разработчики онлайн-сервисов для проверки текстов по закону Ципфа попытались как-то учесть тот факт, что наши статьи трудно назвать семантическими мегавыборками. Но если бы это им удалось, то тогда тут дело пахло бы Нобелевской премией! Такая поправка к открытию знаменитого ученого уж точно требовала бы по крайней мере добавки фамилии вундеркинда, типа — закон Ципфа-Пупкина. Звучит? Но звуков фанфар мы не слышали.
И опять логика вкупе с некоторым жизненным опытом подсказывает: разработчики поисковых алгоритмов ранжирования немного заигрались. Понимаю их нелегкую задачу: каждый член команды должен постоянно доказывать свою эффективность, креативность, фонтанировать идеями. Вот и дофонтанировались они на нашу голову.
Эксперименты ретивых оптимизаторов
Ну, не нужно стрелять из пушки по нашим статьям-воробышкам: не годятся наши опусы для ваших с Зипфом экспериментов, уважаемые разработчики. На малых выборках эти закономерности притянуты за уши. Это, конечно, сугубо мое мнение. В сети мне попадались и противоположные: закон Ципфа, мол, улучшил позиции сайта в выдаче, тексты стали заметно интереснее и так далее, в том же духе. Многие пытаются анализировать ТОП на соответствие распределению Ципфа и делать на этой основе какие-то выводы. Стоп, господа! На фоне около восьмиста факторов, которые поисковики учитывают при ранжировании, вы пытаетесь отследить влияние одного? Ну, это никуда не годится! Исследования так не проводят, их результаты нельзя признать корректными.
При всем моем негативном отношении не к Ципфе (науку я уважаю), а к неоправданным попыткам поверить в очередной раз гармонию алгеброй, я не раз анализировала свои работы на естественность в онлайн сервисах. По просьбе заказчиков, разумеется. Могу сказать, что живой человеческий язык без канцеляризмов, штампов и тавтологии очень легко помогает преодолеть зипофские барьеры. Достичь 70—80 % естественности текста — это совсем нетрудно. Желающие могут проверить свои тексты здесь, например. Заниматься этим постоянно, думаю, не нужно. Тем более, не стоит делать ставку на лису-Ципфу для продвижения. Честное слово, друзья, не тратьте время и энергию на антинаучные эксперименты.
Настоящий текст имеет 87% естественности. Достаточно. Думаю, что даже если я догоню показатели до 98%, то это нисколько не повлияет на позиции в выдаче. По моим прогнозам, этой статье ТОП не светит. Ну, и ладно, зато сказала, о чем хотела.
До свидания, друзья.
Ваш гид по стране Копирайтинг GALANT.
А эти статьи вы еще не читали? Рекомендую:
Поддерживаю первого комментатора :)))
Главное, чтобы твою статью не прочитали потенциальные заказчики, а то мало им 100% оригинальности, начнут требовать столько же естественности)))
:)))))