И еще о кодировках

Лучшее вступление к заметке о кодировках, которое можно придумать: “Пиздец, какой был день!”

Дима Честных опубликовал эпическую сагу о том, как он сломал и починил свой блог, начинающуюся словами:

Я решил перед обедом обновить WordPress…

И когда он добрался до базы, то:

…вместо положеной UTF-8 буквы оказались… в той самой UTF-8, если её смотреть в CP1251.

Классический случай. Как правило это связано с тем, что MySQL на котором работает (или когда-то работал) блог был версии более ранней чем 4.1. Тогда он ничего не знает об utf8, хотя все буквы в него WordPress исправно складывает именно в utf.

Я содрогнулся от ужаса прочитав то, как Дима самоотверженно боролся с напастью, вручную меняя буковки в таблицах. (А разве нельзя попросить саппорт хостера, чтобы они лихо сконвертировали все разом? Им-то легче! Разве это не входит в обязанности техподдержки?)

Как только количество инженеров, обслуживающих русскоязычные версии WP, станет достаточно большим, надо будет организовать такой вид БлогСервисного спорта - задается какая-либо немыслимая исходная комбинация из кодировки базы, текста, версии WordPress и версии MySQL, и в такой же форме результат. И проводить такой “Чемпионат по скоростной конвертации блогов” :)

Comments

4 Responses to “И еще о кодировках”

  1. EvilBot on October 2nd, 2006 9:08 am

    Диме просто стоило бы написать простейший скриптик, как это всегда делаю я.

  2. Алексей on October 2nd, 2006 2:55 pm

    У нас эта эпопея происходила так

  3. peanut on October 2nd, 2006 4:29 pm

    Я столкнулся с аналогичной проблемой, когда переносил базу сайта http://avtogarant.ru со старого MySQL 3.23 на новенький 5.1.

    Как мне кажется это недоработка/недосмотр разработчиков MySQL.

  4. Alex Dybenko on October 2nd, 2006 4:48 pm

    Да уж, похоже разработчики MySQL явно лоханулись, уже сколько раз похожую историю слышал.

Leave a Reply