2009 Ноябрь » Не-SEO блог Стальной Груши.
  • Архивы

  • Archive for ноября, 2009

    Синонимайзер капут !

    То, что разномастные синонимайзеры не оправдывают оказанного им высокого доверия давно стало для меня очевидным. Я пришёл к этому эмпирическим путём, когда мои говносплоги с треском вылетели из Яндоиндекса невзирая на хитроумные синонимайзеры.

    Я тогда не стал заморачиваться вопросом, как бездушная машина смогла определить синонимизированный текст и просто принял этот факт к сведению, поставив зарубку на память на корпусе ноутбука и подивившись изобретательности лысых, очкастых и тонкоруких (именно так я себе их представляю) программистов Яндекса.

    Совершенно очевидно, что предлагаемые в сети синонимайзеры (некоторые впиндюриваются за деньги наивным жадным "нубам" :) ) совершенно не справляются с той задачей, которая была написана в их техзадании - грести бабло лопатой, являясь "контентмейкером" для сотен сплогов.

    Предвижу возражение, что, мол, всё  зависит от базы. О - это священное понятие "База" ! За базами охотятся, базы умоляют продать, сдать в аренду или подарить. "Хорошая" база является синонимом быстрого успеха и сказочного богатства в ближайшей перспективе.

    Не берусь спорить. Применительно к синонимайзерам это не имеет, по большому счёту, никакого смысла. И не виноваты в этом ни лысые и тонкорукие, пишущие каверзные алгоритмы для поисковых машин, ни даже Джордж Кингсли Зипф - американский лингвист и филолог, впервые изучивший статистические закономерности распределения частоты слов в языке. Позже эти закономерности стали называть "законами Зипфа".

    Никто не виноват - жизнь такая ! Итак, перейдём  от эмпирической части к теоретической. Чтобы не усугублять, рассмотрим основные положения этих законов в упрощённой и практической форме (мне самому так легче :) ).

    Суть законов Зипфа  можно выразить двумя фразами :"В каждом языке есть слова, которые встречаются чаще, чем остальные, но не имеют значения. Есть слова, которые встречаются реже, но имеют намного большее смысловое значение." Аллес капут ! (это я уже от себя).

    Лабораторная работа. Подберите синонимы к какому-нибудь слову. С очень большой долей вероятности, сначала Вам на ум будут приходить наиболее часто употребляемые слова. Синоним, который Вы подберёте последним, будет наименее часто употребляем в нормальной речи.

    То есть, в грубом приближении, базы данных синонимайзеров содержат редко или относительно редко употребляемые слова. Поехали дальше.

    "Произведение ранга слова на его частоту есть константа." Что такое "ранг" слова ? Если все слова в языке (или в достаточно большом тексте) упорядочить по мере убывания частоты их использования, то наиболее часто употребляемое слово будет иметь ранг под номером 1.

    Частота слова измеряется в ipm/чмс (instances per million words/частота на миллион словоформ). Слово "человек", к примеру, имеет частоту приблизительно 2500 (в разных источниках несколько разные значения) - то есть встречается в среднем 2500 раз на один миллион слов.

    ZipfТо есть, слово с рангом 2 встречается приблизительно в два раза реже, чем слово с рангом 1. Слово с рангом 3 - в три раза реже первого и т.д. ...

    Из этого следует, что любой естественный текст может быть охарактеризован данной кривой (слева). Я думаю, математикам и программистам не составило никакого труда запихнуть закономерности Зипфа в алгоритмы поисковых машин.

    Теперь совершенно ясно, что присутствие в тексте большого количества слов с низкой частотой/высоким рангом (из базы синонимайзера, например) явно указывает на искусственное происхождение данного текста.

    Понятно, что существую частотные словари для отдельных тематик, но принцип один - если кривая не кривая - текст не естественный, со всеми вытекающими из этого последствиями. Так же  понятно, что чем больше текст - тем точнее его анализ. Как анализируются короткие тексты (те же твиты) - понятия не имею. Пусть голова у бледнолицых и тонкоруких болит.

    Правда недавно появились синонимайзеры, работающие несколько по другому принципу. Они не заменяют тупо слова синонимами из базы, а разбавляют текст различными междометьями, фразеологическими оборотами, предлогами, наречиями, шутками и прибаутками в контексте.

    Продвигаются эти недешёвые синонимайзеры, как стопудовая панацея, в чём я сильно сомневаюсь (см. суть законов Зипфа). Скорее всего, все эти шутки-прибаутки воспринимаются поисковиками, как лингвистический шум и не имеют в их глазах веса. Что-то мне подсказывает, что и перемешивание предложений/абзацев тоже неэффективно :)

    Из всего вышенаписанного  у меня следует один банальный вывод и одна обеспокоенность.
    Банальный вывод : Интересные сайты для людей рулят ! С уникальным контентом. Я имею в виду именно первопонятие "уникальный контент", а не набившее оскомину и полностью дискредитировавшее себя обозначение, находящееся в обиходе в настоящее время.

    Хотя, если вы нарыли заброшенную библиотеку с редкими книгами и выкладываете сканы в своих сплогах - для поисковиков этот контент будет естественным и уникальным... Неплохой вариант. По крайней мере, для живых людей более полезный, чем синонимизированная каша.

    Или нанять штат копирайтеров/журналистов для создания контента. Впрочем, сам факт наличия такого штата вплотную приближает Ваши сплоги к СДЛ.

    Обеспокоенность : С другой стороны - косвенно навязывается некое усреднение и стандартизация текстов в сети. Если Вы воздержитесь от применения длинных и редко употребляемых слов в текстовой составляющей контента (от чего я никак не могу воздержаться) - он с большей долей вероятности будет считаться естественным.

    Надеюсь, алгоритмы поисковых систем умеют отличать оригинальный авторский стиль от продукции синонимайзеров. А то как бы не получилось, как в той пословице :"Войны не  будет, но будет такая борьба за мир, что камня на камне не останется !" :)
    --------------------------------------------------------------------------
    Уведомление для читателей. В ближайшее время собираюсь переехать на новый хостинг, так что несколько дней блог может быть недоступен или глючить. Это мера вынужденная, до скорой встречи !
    --------------------------------------------------------------------------
    Скоро зима. Так что наружное утепление фасадов очень актуально сейчас...
    А можно не утеплять, а свалить на зиму в Эмираты - цены на туры в оаэ.
    А можно наняться морячком в тёплые моря - крюинговое агентство.

    Пресс-релиз с размышлениями

    dirkinoЧестно говоря, о существовании этой партнёрки до недавнего времени я не знал. Пока недавно мне не предложили немножечко заляпать её грязью. Да и на "Сёрче" её покусали неслабо. У некоторых оппонентов очень сильно болело сердце за авторские права. Шибко переживают эти честнейшие и кристалльнейшие люди за братьев Вачовски и других малоимущих голливудских режиссёров.

    Я не юродствую. И прекрасно осознаю всё серьёзность и сложность этого вопроса, но в настоящее время защита авторских прав, на Западе в частности, напоминает какой-то абсурдный балаган. Поэтому (О ужас !) меня абсолютно не мучает совесть, когда я покупаю нелицензионный голливудский фильм. И замечательно после этого сплю.

    Несколько хуже я сплю, когда покупаю нелицензионный диск с российскими/советскими  фильмами, но это уже тема для отдельного психологического исследования. А за "шедевры" типа "Обитаемый остров" не то, что платить стыдно, а и зрителям ещё доплачивать должно за нанесённый моральный ущерб.

    К тому же несколько странно слышать из уст манимейкеров такие "сантименты". Никого же не волнует, что в "фарме", к примеру, подавляющее большинство препаратов по американскому законодательству вообще запрещено продавать через интернет.

    Что касается организации работы партнёрки, я так скажу - идеального ничего нет и сначала желательно свою партнёрку сделать, чтобы критика была более конструктивной. Я на Dirkino.su зарегистрировался для чистоты эксперимента и приспособлю под неё завалявшийся неплохой домен. Там и посмотрим "ху из ху" :)

    Собственно, сам пресс-релиз, который я публикую по просьбе совладельца партнёрки :

    Dirkino.su - достаточно новая партнерка, но несмотря на столь короткое время работы, Dirkino.su зарекомендовала себя только с положительной стороны. И в настоящий момент занимает второе место среди партнерских программ, уступив ступень лидерства loadpartners по своим масштабам, но не по качеству работы.

    При создании партнерской программы Dirkino.su мы тщательно изучили уже существующие партнерки и постарались сделать нашу партнерку максимально выгодной для вас! Что же делает сотрудничество с сайтом dircash.ru таким выгодным?

    Высокие тарифы по выплатам.
    Партнерская программа Dirkino.su предлагает партнерам самые высокие тарифы по выплатам - 85%, такие цифры вы не найдете больше нигде! Платежи к нам поступают из 54-х стран!

    Детальная статистика в режиме реального времени.
    Честность и открытость - вот два основных принципа нашей работы. Все партнеры могут контролировать баланс партнерского счета, видеть количество отправленных SMS и переходов, сделаных посетителями его сайта.

    Разнообразие промо материалов.
    Большой выбор промо-материалов, неограниченные возможности по подбору и размещению партнерских ссылок.

    Выплаты не только за SMS.
    Мы платим не только за смс. У нас существует отдельный тариф, по покупке Вашего трафика: 300руб за 1k кликов из России и 69руб за 1k кликов из других стран.

    Реферальная система.
    Выплаты по реферальной системе составляют 10 %.

    Выплаты.
    Выплаты проходят через платежную систему Webmoney каждую среду!
    -------------------------------------------------------------------------------------
    Художественное оформление витрин
    Не просто кирпич, а основа всего !
    Если лень передвигаться - выездное обслуживание

    Кокоро-кара оиваи-о мо-сиагэмасу !

    Как выпадает снег на склоны Яри
    Так выпала мне честь
    Вручить пятьдесят баксов

    Сразу скажу - задача непростая. Есть три фаворита с равным количеством голосов - Виктория, Александр Некрот и Тёмыч. Честное слово - я всем конкурсантам благодарен за то, что приняли участие в моём полупридурошном мероприятии (:)) - старались ведь, время тратили... Спасибо вам !

    Я прекрасно понимаю, что написать "по-правилам" настоящее хайку очень сложно. Для этого просто необходимо неплохо (хотя бы) знать историю Японии, правила написания хокку (круче алгоритмов Яндекса в сто раз), изучить труды не одного десятка средневековых японских поэтов и лет 200-300 прожить в Японии. У европейца запросто может взорваться мозг...

    Так что не переживайте - хокку из вас (и из меня) никто не написал :)   Но наиболее близкими к хокку из представленных работ и по духу и по форме были, как мне кажется,  трёхстишья Виктории. Ей я и отдаю свой голос и призовой фонд имени Басё равный 50WMZ. У остальных, по японскому обычаю, прошу прощения за доставленное беспокойство :)

    Прошу Викторию связаться со мной при помощи электронной почты, ICQ или телепатии и сообщить номер своего кошелька WMZ. Ещё раз искренне поздравляю победительницу и благодарю всех участников !
    ----------------------------------------------------------------------------------------
    Целая наука - настройка ноутбука
    Достоин интереса - фотограф одесса
    Нет ни "Винды" ни звуков ? Вам в срочный ремонт ноутбуков

    Удаляем скрытого админа в WP

    Многие знают о том, что в начале осени многие WordPress блоги подверглись MySQL-хаку, который портил пермалинки и делал невозможным доступ к постам. Данный хак поражал блоги старых версий WP, защита которых не выдерживает серьёзной критики.

    Это, конечно, является ещё одним доводом в пользу своевременных обновлений, но множество блоггеров не спешит обновляться по целому ряду причин. В частности из-за того, что придётся  обновлять и целую кучу плагинов, некоторые из которых обновляются не так часто и могут быть несовместимы с новыми версиями WordPress.

    К тому же поле деятельности программиста  безбрежно и работа его может быть сведена к одной упрощённой формуле :"Пофиксил один баг - породил другой". Многие просто ждут "обкатки" новых версий и выявления в них новеньких багов. Так что поголовного перехода на новые версии не происходит.

    Я тоже долгое время не дёргался - моя старенькая  версия WP меня вполне устраивала, пермалинки, давление и температура у меня были нормальные. В ближайшее время мне всё равно надо менять хостинг - вот я и решил сделать всё сразу - и хостинг поменять и WordPress до последней стабильной версии обновить.

    userlistОднако вчера я совершенно случайно обнаружил, что у моего блога появился новый админ, который явно пытался скрыть своё присутствие. Проверить наличие скрытого пользователя с правами администратора можно и таким способом - зайти на страницу создания записи и посмотреть, сколько авторов претендуют на Ваши проникновенные посты.

    Если Вы увидите такую, к примеру, картину authors(справа) - у Вас появился конкурент. Понятно, что это безобразие надо немедленно пресечь.

    Пресечь можно разными способами, но проще всего, по-моему, воспользоваться  мощным скриптом phpMyAdmin, установленным по-умолчанию у каждого более-менее серьёзного хостера. Скрипт навороченный, но нам хватит и 1% его возможностей.

    Получить доступ к скрипту можно через панель управления Вашим аккаунтом, а можно ещё проще - наберите в адресной строке браузера http://Ваш сайт/phpmyаdmin, введите в появившемся окне авторизации логин и пароль доступа к Вашей базе данных (если забыли или отродясь не знали - можно посмотреть в файле wp-config.php) и Вы попадёте на страницу скрипта.

    Выбираете нужную базу данных и жмёте на вкладку SQL.
    menu
    Далее, в появившемся поле ввода нужно разместить следующий запрос :
    SELECT u.ID, u.user_login
    FROM wp_users u, wp_usermeta um
    WHERE u.ID = um.user_id
    AND um.meta_key = 'wp_capabilities'
    AND um.meta_value LIKE '%administrator%';

    В результате мы получим список всех пользователей с правами администратора. adminlist
    Осталось дело за малым - удалить самозванца. Жмите крестик и подтвердите удаление.

    Однако, у меня так просто удалить нежелательного администратора не получилось. При попытке удаления error#1054выскакивало следующее Error-окно (слева). #1054 - Unknown column 'u.ID' in ' where clause'.

    У меня совершенно не было желания разбираться в различиях версий mySQL и тонкостях SQL-запросов, поэтому я пошёл простым, брутальным путём.

    Выбираем в базе таблицу wp_users, далее вкладка "Экспорт" и сохраняем таблицу на диск. Открываем любым текстовым редактором (тем же блокнотом) и удаляем запись, относящуюся к нежелательному пользователю. Структура файла простая, разобраться, что удалять труда не составит.

    В phpMyAdmin жмём вкладку "Удалить" и полностью удаляем таблицу wp_users.  Далее вкладка "Импорт", adminвыбираем отредактированную таблицу wp_users и импортируем в базу. Делаем SQL-запрос, проверяем - скрытый админ удалён.

    Естественно, перед всеми манипуляциями крайне желательно сделать бэкап всей базы. Наверняка есть и более изящные способы решения этой проблемы (я не являюсь специалистом в области баз данных и систем управления контентом) но и этот способ достаточно простой, по-моему...

    Чтобы избежать повторного взлома можно обновиться до последней версии WordPress, а можно погодить и прибегнуть к способу, нагугленному в сети на многих источниках - заменить в папке /wp-includes/  файл vars.php на аналогичный от последней версии WordPress, либо отредактировать его вручную.

    Для этого находим в данном файле строку $pagenow = $self_matches[1]; и добавляем сразу после неё строку $pagenow = trim($pagenow, '/');. Говорят помогает. Я себе добавил. Осталось только прошерстить архивы на предмет левых спам-ссылок :)
    -------------------------------------------------------------------------------
    Довольно ново и неожиданно для меня - партнерская программа игры Travian. Деньги платятся за бесплатные регистрации в этой онлайн игре. С 1000 переходов можно заработать до $100 и более ! Если учесть, какой популярностью пользуются on-line игры - эта партнёрка может служить источником серьёзного дохода для вебмастера.
    Всегда востребованная услуга - оценка стоимости авто
    Всегда в моде - серебрянные украшения

    Партнёрку “валят” ?

    Недавно мне в"Аську" постучались. "Войдите" - сказал я. Вошли. Разговор получился интересным. До меня только потом дошло, насколько интересным. Номер "Аськи" своего корреспондента светить не буду - назову его просто - Mister X (Мистер "Хэ"). Привожу распечатку из "серого ящика" (у меня ноутбук стального цвета).

    Мистер "Хэ" (15:59:29 30/10/2009)
    здравствуйте есть предложение по размещению статьи в вашем блоге, дайте знать когда будете в сети

    Я (15:59:55 30/10/2009)
    Здравствуйте. В сети

    Мистер "Хэ" (16:00:39 30/10/2009)
    я хочу предложить вам разместить обзорную статью в стиле черного PR(пиара), статья качетсвенная и с реальными фактами.., как вы на это смотрите?

    Мистер "Хэ" (16:00:58 30/10/2009)
    статья уникальная, с хорошим текстом

    Я (16:01:21 30/10/2009)
    Какая тема ?

    Мистер "Хэ" (16:01:42 30/10/2009)
    про партнерку dirkino.ru

    Мистер "Хэ" (16:02:00 30/10/2009)
    может сюда скинуть, просмотрите

    Я (16:02:54 30/10/2009)
    Тема подойдёт. Статью нужно почитать. Скидывайте или сюда или на mail steelpear(гав)gmail.com

    Мистер "Хэ" (16:04:35 30/10/2009)
    отправила на ящик

    Мистер "Хэ" (16:05:10 30/10/2009)
    пришло?

    Я (16:06:48 30/10/2009)
    Ok. Пришло. Нужно время почитать, не хотелось бы подставляться с непроверенными фактами.

    Мистер "Хэ" (16:07:21 30/10/2009)
    часа вам хватит?

    Я (16:11:13 30/10/2009)
    Такая срочность ? Если я решу разместить, оставляю за собой право исправить грамматические ошибки. Несколько уже обнаружил. Извините, в спешке я не буду принимать решение. Если Вы в этом действительно заинтересованы - подождите до завтрашнего утра. Я работаю ночью. Если Вам очень срочно - лучше не надо.

    Мистер "Хэ" (16:13:08 30/10/2009)
    а какая оплата за размещение вас устроит

    Я (16:15:12 30/10/2009)
    Минутку...

    Я (16:32:12 30/10/2009)
    Прежде всего, я не буду размещать статью от своего имени. Я с этой партнёркой не работал. Могу разместить в рамках гостевого поста, вполне возможно со своими комментариями. Для этого Вы должны предоставить хотя бы свой ник (статья будет от Вашего имени). Плата за размещение - $15. Чисто символически  Подумайте. Если условия Вас устраивают - Сегодня вечером/завтра утром будет размещена.

    Мистер "Хэ" (16:33:04 30/10/2009)
    да конечно, номер кошелька пришлите

    Я (16:35:01 30/10/2009)
    Zxxxxxxxxxxxx

    Мистер "Хэ" (16:38:44 30/10/2009)
    блин, извините, но начальство сказало нет по вашему блогу

    Мистер "Хэ" (16:39:00 30/10/2009)
    извините за беспокойство

    Я (16:39:17 30/10/2009)
    Не за что...

    Интересно то, что присланная статья была написана от первого мужского не шибко грамотного лица. В этой статье описывалась тяжкая доля вебмастера, работающего с партнёркой dirkino.ru. По "аське" же со мной общалась девушка у которой к тому же было начальство. Это что - какая-то контора "валит" конкурентов ?

    Вот уж действительно :"Многия вопросы - многия печали". Был бы более покладистым - денег бы заработал :)
    ------------------------------------------------------------------------------------------
    Дмитрий Наумов передал мне эстафету в рамках которой нужно рассказать о происхождении своего ника. Честно говоря, обычно я не очень охотно разговариваю на личные темы, но признаю, что различного рода эстафеты в общем полезны для блоггера. В конце-концов, блоггер - явление социальное.

    В моём случае всё довольно просто. Steelpear - Стальная Груша.  "Груша" ассоциируется с моей фамилией. Как "Стальная"- то объяснить ?... Ну, у меня характер такой обманчивый. С людьми я стараюсь быть вежливым, не размениваться на мелочи и всегда готов искать компромиссы. Но заставить меня сделать что-либо против моей воли, особенно если это касается моей семьи, моих принципов и моего мировоззрения, невозможно. Немного пафосно, но по другому я объяснить не смогу...

    По традиции хочу передать эстафету всем желающим, а так же  доктору Джекилу и Искариоту. Вот они-то намудрили с никами ! :)
    -------------------------------------------------------------------------------------------
    Новая супер-акция от DRUGREVENUE "ФЛУД тоже ТРУД"! Помогите мне заработать пойнты и я поделюсь с вами "Виагрой" !
    -------------------------------------------------------------------------------------------
    Хорошие шторы - спокойная жена...
    Потуши горящие туры тайланд
    Именно лечение в санатории поможет Вам пересидеть эпидемию.

    Страница 1 из 212»