И еще о кодировках
Лучшее вступление к заметке о кодировках, которое можно придумать: “Пиздец, какой был день!”
Дима Честных опубликовал эпическую сагу о том, как он сломал и починил свой блог, начинающуюся словами:
Я решил перед обедом обновить WordPress…
И когда он добрался до базы, то:
…вместо положеной UTF-8 буквы оказались… в той самой UTF-8, если её смотреть в CP1251.
Классический случай. Как правило это связано с тем, что MySQL на котором работает (или когда-то работал) блог был версии более ранней чем 4.1. Тогда он ничего не знает об utf8, хотя все буквы в него WordPress исправно складывает именно в utf.
Я содрогнулся от ужаса прочитав то, как Дима самоотверженно боролся с напастью, вручную меняя буковки в таблицах. (А разве нельзя попросить саппорт хостера, чтобы они лихо сконвертировали все разом? Им-то легче! Разве это не входит в обязанности техподдержки?)
Как только количество инженеров, обслуживающих русскоязычные версии WP, станет достаточно большим, надо будет организовать такой вид БлогСервисного спорта - задается какая-либо немыслимая исходная комбинация из кодировки базы, текста, версии WordPress и версии MySQL, и в такой же форме результат. И проводить такой “Чемпионат по скоростной конвертации блогов” :)
Comments
4 Responses to “И еще о кодировках”
Leave a Reply


Диме просто стоило бы написать простейший скриптик, как это всегда делаю я.
У нас эта эпопея происходила так
Я столкнулся с аналогичной проблемой, когда переносил базу сайта http://avtogarant.ru со старого MySQL 3.23 на новенький 5.1.
Как мне кажется это недоработка/недосмотр разработчиков MySQL.
Да уж, похоже разработчики MySQL явно лоханулись, уже сколько раз похожую историю слышал.