MySQLのutf8mb4とutf8文字セットの違いは何ですか?

370
Mojtaba Rezaeian 2015-05-07 00:45.

違いは何であるutf8mb4utf8で文字セットMySQLは

ASCIIUTF-8UTF-16、およびUTF-32エンコーディングについてはすでに知っています。私はの違いをいただきました!知って興味がありutf8mb4、他の符号化タイプとエンコーディングのグループがで定義されたMySQLサーバ

utf8mb4ではなく使用することの特別な利点/提案はありutf8ますか?

4 answers

417
CodeCaster 2015-05-07 00:47.

UTF-8は可変長エンコーディングです。UTF-8の場合、これは1つのコードポイントを格納するために1〜4バイトが必要であることを意味します。ただし、「utf8」(「utf8mb3」の別名)と呼ばれるMySQLのエンコーディングは、コードポイントごとに最大3バイトしか格納しません。

したがって、文字セット「utf8」/「utf8mb3」はすべてのUnicodeコードポイントを格納できるわけではありません。「基本多言語プレーン」と呼ばれる0x000〜0xFFFFの範囲のみをサポートします。Unicodeエンコーディングの比較も参照してください。

これは、MySQLドキュメントがそれについて述べていることです(同じページの以前のバージョン):

utf8 [/ utf8mb3]という名前の文字セットは、文字ごとに最大3バイトを使用し、BMP文字のみを含みます。MySQL 5.5.3以降、utf8mb4文字セットは1文字あたり最大4バイトを使用し、補足文字をサポートします。

  • BMP文字の場合、utf8 [/ utf8mb3]とutf8mb4のストレージ特性は同じです。つまり、同じコード値、同じエンコーディング、同じ長さです。

  • 補助文字の場合、utf8 [/ utf8mb3]は文字をまったく格納できませんが、utf8mb4はそれを格納するために4バイトを必要とします。utf8 [/ utf8mb3]は文字をまったく格納できないため、utf8 [/ utf8mb3]列に補助文字はなく、utf8 [/ utf8mb3]データを古いバージョンからアップグレードするときに文字の変換やデータの損失を心配する必要はありません。 MySQL。

したがって、絵文字など、BMPの外部にある文字の格納を列でサポートする場合は(通常は必要です)、「utf8mb4」を使用します。「実際に使用されている最も一般的な非BMPUnicode文字は何ですか?[閉まっている]」も参照してください実際に使用されている最も一般的な非BMPUnicode文字は何ですか?[閉まっている]

66
Jimmy Kane 2016-11-01 02:28.

utf8mb4最近は、我々は言語の文字だけでなく、記号、新たに導入された絵文字などだけでなく、を格納するために支える必要があるため、文字セットが便利です。

Mathias BynensによるMySQLデータベースで完全なUnicodeをサポートする方法についての良い読み物も、これにいくらかの光を当てることができます

53
simhumileco 2018-09-15 08:25.

MySQL 8.0リファレンスマニュアルからの抜粋

  • utf8mb4:1文字あたり1〜4バイトを使用するUnicode文字セットのUTF-8エンコーディング。

  • utf8mb3:1文字あたり1〜3バイトを使用するUnicode文字セットのUTF-8エンコーディング。

MySQLの utf8現在のエイリアスでutf8mb3いる推奨されていませんし、将来のでは削除されますMySQLのリリース。その時点でutf8 、への参照になり utf8mb4ます。

したがって、このエイリアスに関係なく、意識的にutf8mb4エンコーディングを設定できます。

答えを完成させるために、以下に@WilliamEntrikenのコメントを追加したいと思います(これもマニュアルから引用)。

の意味のあいまいさを避けるためにutf8、のutf8mb4代わりに文字セット参照を明示的に指定することを検討してくださいutf8

1
thomasrutter 2020-10-06 03:39.

MySQLでは、utf8すべての文字範囲がサポートされているわけではないUTF-8標準の欠陥のある実装を指します。

具体的には、基本的な多言語プレーンの文字のみが機能し、他の文字は無効と見なされます。これは、そのプレーン内の値-0〜65535(一部は特別な理由で予約されています)を最大3バイトのUTF-8のマルチバイトエンコーディングで表すことができ、MySQLがUTF-8を採用することを任意に決定したためです。それを制限として設定します。

MySQLがこれをリリースしたとき、それはそれほど問題ではありませんでした。それ以来、ますます多くの新しく定義された文字範囲が、基本的な多言語平面の外側の値でUnicodeに追加されています。

特定の仮定を行って古いコードを壊さないようにするために、MySQLは壊れた実装を保持し、新しい修正バージョンを呼び出しましたutf8mb4。これにより、MySQLのUTF-8の公式の真の実装ではなく、UTF-8のある種の拡張であるかのように名前が誤って解釈されるという混乱が生じています。

MySQLの将来のバージョンは、最終的に古いバージョンを段階的に廃止する可能性がありますが、近い将来、utf8mb4正しいUTF-8エンコーディングを保証するために代わりに使用される予定です。

古い、非準拠の実装を欠陥があるか壊れていると説明することに問題を起こす人もいるかもしれません。ただし、最大3バイトのマルチバイトエンコーディングのみを許可することにより、UTF-8標準がいつでも存在していたため、正しく従わなかったことは事実であり、それが欠陥の理由です。UTF-8が最大3バイトをサポートするように定義された時点はありませんでした。最大4バイトとして定義されなかったのは、最初に最大6バイトとして定義されたときだけでした(!!)-後続のUnicode仕様にはやり過ぎだと決めた。

Related questions

MORE COOL STUFF

「水曜日」シーズン1の中心には大きなミステリーがあります

「水曜日」シーズン1の中心には大きなミステリーがあります

Netflixの「水曜日」は、典型的な10代のドラマ以上のものであり、実際、シーズン1にはその中心に大きなミステリーがあります.

ボディーランゲージの専門家は、州訪問中にカミラ・パーカー・ボウルズが輝くことを可能にした微妙なケイト・ミドルトンの動きを指摘しています

ボディーランゲージの専門家は、州訪問中にカミラ・パーカー・ボウルズが輝くことを可能にした微妙なケイト・ミドルトンの動きを指摘しています

ケイト・ミドルトンは、州の夕食会と州の訪問中にカミラ・パーカー・ボウルズからスポットライトを奪いたくなかった、と専門家は言う.

一部のファンがハリー・スタイルズとオリビア・ワイルドの「非常に友好的な」休憩が永続的であることを望んでいる理由

一部のファンがハリー・スタイルズとオリビア・ワイルドの「非常に友好的な」休憩が永続的であることを望んでいる理由

一部のファンが、オリビア・ワイルドが彼女とハリー・スタイルズとの間の「難しい」が「非常に友好的」な分割を恒久的にすることを望んでいる理由を見つけてください.

エリザベス女王の死後、ケイト・ミドルトンはまだ「非常に困難な時期」を過ごしている、と王室の専門家が明らかにする 

エリザベス女王の死後、ケイト・ミドルトンはまだ「非常に困難な時期」を過ごしている、と王室の専門家が明らかにする 

エリザベス女王の死後、ケイト・ミドルトンが舞台裏で「非常に困難な時期」を過ごしていたと伝えられている理由を調べてください.

セントヘレナのジェイコブのはしごを登るのは、気弱な人向けではありません

セントヘレナのジェイコブのはしごを登るのは、気弱な人向けではありません

セント ヘレナ島のジェイコブズ ラダーは 699 段の真っ直ぐ上る階段で、頂上に到達すると証明書が発行されるほどの難易度です。

The Secrets of Airline Travel Quiz

The Secrets of Airline Travel Quiz

Air travel is far more than getting from point A to point B safely. How much do you know about the million little details that go into flying on airplanes?

Where in the World Are You? Take our GeoGuesser Quiz

Where in the World Are You? Take our GeoGuesser Quiz

The world is a huge place, yet some GeoGuessr players know locations in mere seconds. Are you one of GeoGuessr's gifted elite? Take our quiz to find out!

バイオニック読書はあなたをより速く読むことができますか?

バイオニック読書はあなたをより速く読むことができますか?

BionicReadingアプリの人気が爆発的に高まっています。しかし、それは本当にあなたを速読術にすることができますか?

Westworldの遊び方:Amazonエコーのない迷路

Westworldの遊び方:Amazonエコーのない迷路

Westworldの第2シーズンが終わり、次の1、2年は楽しいがやや混乱するシリーズでモーター機能が凍結するので、次に何をすべきかについて少し迷うかもしれません。ビンジウォッチングする別の番組を見つけますか?さらに多くのファン理論を読み直しますか?お気に入りの1990年代のオルタナティブロックソングの楽しいオールドタイムの​​ピアノカバーを書き始めますか?心配しないでください。長い待ち時間が始まる前に、Westworldのヒットをもう1つ得ることができます。

ジャネールモネイは彼女のプライドで周りをファックしませんでしたBETアワードを見てください

ジャネールモネイは彼女のプライドで周りをファックしませんでしたBETアワードを見てください

2018 BETアワードは、日曜日の夜にロサンゼルスで開催されました。プライド月の真ん中に軽くたたきます。見た目はいたるところに強かったが、ジャネール・モネイのように誰もそれをしなかった。

リットウッドで2000年代と2010年代の車を祝うために2038年に会いましょう

リットウッドで2000年代と2010年代の車を祝うために2038年に会いましょう

他の期間をテーマにした自動車展示会、特に1980年代と90年代の自動車ショーRadwoodの最近の成功に続いて、私は2000年代と2010年代の自動車文化を祝う自動車ショーであるLitwoodを立ち上げることにしました。私は今これについてディブを呼んでいます。

リチャードは堅実なシリコンバレーで彼の会社の将来のためにビットコインを裏返します

リチャードは堅実なシリコンバレーで彼の会社の将来のためにビットコインを裏返します

数週間前のシリコンバレーの第5シーズンのプレミアのレビューで、ショーはその高齢で問題を抱え続けていますが、才能のあるキャストとそのひねくれたユーモアのセンスを備えた頑丈な基盤からまだ機能していると主張しました。そして、シーズンの終わりに近づくにつれて、その点は持ちこたえてきました。

ケイト・ミドルトンとウィリアム王子は、彼らが子供たちと行っているスパイをテーマにした活動を共有しています

ケイト・ミドルトンとウィリアム王子は、彼らが子供たちと行っているスパイをテーマにした活動を共有しています

ケイト・ミドルトンとウィリアム王子は、子供向けのパズルの本の序文を書き、ジョージ王子、シャーロット王女、ルイ王子と一緒にテキストを読むと述べた.

事故で押しつぶされたスイカは、動物を喜ばせ水分補給するために野生生物保護団体に寄付されました

事故で押しつぶされたスイカは、動物を喜ばせ水分補給するために野生生物保護団体に寄付されました

Yak's Produce は、数十個のつぶれたメロンを野生動物のリハビリ専門家であるレスリー グリーンと彼女のルイジアナ州の救助施設で暮らす 42 匹の動物に寄付しました。

デミ・ロヴァートは、新しいミュージシャンのボーイフレンドと「幸せで健康的な関係」にあります: ソース

デミ・ロヴァートは、新しいミュージシャンのボーイフレンドと「幸せで健康的な関係」にあります: ソース

8 枚目のスタジオ アルバムのリリースに向けて準備を進めているデミ ロヴァートは、「スーパー グレート ガイ」と付き合っている、と情報筋は PEOPLE に確認しています。

Plathville の Kim と Olivia Plath が数年ぶりに言葉を交わすことへようこそ

Plathville の Kim と Olivia Plath が数年ぶりに言葉を交わすことへようこそ

イーサン プラスの誕生日のお祝いは、TLC のウェルカム トゥ プラスビルのシーズン 4 のフィナーレで、戦争中の母親のキム プラスと妻のオリビア プラスを結びつけました。

仕事の生産性を高める 8 つのシンプルなホーム オフィスのセットアップのアイデア

仕事の生産性を高める 8 つのシンプルなホーム オフィスのセットアップのアイデア

ホームオフィスのセットアップ術を極めよう!AppExert の開発者は、家族全員が一緒にいる場合でも、在宅勤務の技術を習得しています。祖父や曽祖父が共同家族で暮らしていた頃の記憶がよみがえりました。

2022 年、私たちのデジタル ライフはどこで終わり、「リアル ライフ」はどこから始まるのでしょうか?

20 年前のタイムトラベラーでさえ、日常生活におけるデジタルおよびインターネットベースのサービスの重要性に驚くことでしょう。MySpace、eBay、Napster などのプラットフォームは、高速化に焦点を合わせた世界がどのようなものになるかを示してくれました。

ニューロマーケティングの秘密科学

ニューロマーケティングの秘密科学

マーケティング担当者が人間の欲望を操作するために使用する、最先端の (気味が悪いと言う人もいます) メソッドを探ります。カートをいっぱいにして 3 桁の領収書を持って店を出る前に、ほんの数点の商品を買いに行ったことはありませんか? あなたは一人じゃない。

地理情報システムの日: GIS 開発者として学ぶべき最高の技術スタック

地理情報システムの日: GIS 開発者として学ぶべき最高の技術スタック

私たちが住んでいる世界を確実に理解するには、データが必要です。ただし、空間参照がない場合、このデータは地理的コンテキストがないと役に立たなくなる可能性があります。

Language