C ++のstd :: stringはエンコード形式ですか?

3
xuwang 2019-10-29 11:53.

std :: stringに関するデフォルトのエンコード形式を見つけたい。
エンコード形式を調べようとしていますが、わかりません。c ++のstd ::文字列はエンコード形式ですか?

2 answers

5
Amir Kirsh 2019-10-31 01:12.

簡単な答え

std::stringこれは、charのコレクションであることstd::basic_string<char>を意味するものとして定義されています。charのコレクションとして、utf8文字列のエンコードされた結果であるcharを保持できる可能性があります。

次のコードはC ++ 20まで有効です。

std::string s = u8"1 שלום Hello";
std::cout << s << std::endl;

そして、それをサポートするコンソールで、を印刷します。

1שלוםこんにちは

u8括弧で囲まれた文字列の前は、次の括弧で囲まれた文字列にutf8エンコーディングがあることをコンパイラに通知するための文字列リテラルですutf8

u8プレフィックス表記がないと、コンパイラはコンパイラのソースエンコーディングに基づいて文字列を取得するため、デフォルトのエンコーディングまたはコンパイラに明示的に設定されたエンコーディングが文字列の文字をサポートしている場合は、次のように取得できます。

std::string s = "1 שלום Hello";
std::cout << s << std::endl;

同じ出力上記のように。ただし、これはプラットフォームとコンパイラに依存します。

コンパイラのソースエンコーディングがこれらの文字をサポートしていない場合、たとえばgccでソースエンコーディングをフラグ付きのLATINに設定している場合、プレフィックスの-fexec-charset=ISO-8859-1ない文字列は次のコンパイルエラーを返します。u8

converting to execution character set:
Invalid or incomplete multibyte or wide character 
    std::string s = "1 שלום Hello";
                     ^~~~~~~~~~~~~~

C ++ 20の u8括弧で囲まれた文字列は、次のように変換できないためstd::string

std::string s = u8"1 שלום Hello";
std::cout << s << std::endl;

C ++ 20で次のコンパイルエラーが発生します。

conversion from 'const char8_t [17]' to non-scalar type 'std::string'
{aka 'std::__cxx11::basic_string<char>'} requested
    std::string s = u8"1 שלום Hello";
                    ^~~~~~~~~~~~~~~~~

これはu8、C ++ 20の括弧で囲まれた文字列のタイプconst char[SIZE]がそうではなく、むしろconst char8_t[SIZE](タイプchar8_tがC ++ 20で導入された)ためです。

あなたは使用することができますC ++ 20の新しいタイプでしかしstd::u8string

std::u8string s = u8"1 שלום Hello"; // good - std::u8string added in C++20
// std::cout << s << std::endl; // oops, std::ostream doesn't support u8string

いくつかの興味深いメモ:

  1. C ++ 20までu8括弧で囲まれた文字列はconst char[SIZE]
  2. C ++ 20以降u8括弧で囲まれた文字列はconst char8_t[SIZE]
  3. サイズのはchar8_t同じであるcharそれは異なるタイプであります

長い話

エンコーディングはC ++では悲しい話です。これがおそらくあなたの質問に対する「簡単な答え」がない理由です。文字エンコードを処理するための本格的なエンドツーエンドの標準ソリューションはまだありません。stdコンバーター、サードパーティライブラリなどがあります。しかし、実際のタイトでシンプルなソリューションではありません。うまくいけば、C ++ 23がこれを解決するでしょう。

JeanHeydMeneideによるこのテーマに関するCppCon2019セッションを参照してください

また、関連する質問:std :: u8stringはstd :: stringとどのように異なりますか?

0
Tom Honermann 2019-11-02 23:05.

std::stringはのコンテナでcharあり、特定のエンコーディングを強制するものはありません。ロケールに依存する文字セットに従ってエンコードされたテキストを保持するために使用するプログラマーもいれば、UTF-8またはその他のエンコードとしてエンコードされたテキストを保持するために使用するプログラマーもいます。ロケールに依存する文字セットは、"C"デフォルトでロケールに関連付けられている文字セットですが、を呼び出すことで変更できますstd::setlocale。呼び出しは、std::setlocale(LC_CTYPE, "")システム定義されているロケール(で示されているように応じて、ロケール文字セットを設定しますLANGLC_ALLまたはLC_CTYPEPOSIXシステム上、またはActiveコードページ(ACP)により、Windows上の環境変数)。これらのロケール設定は、主に文字分類関数など、いくつかのCおよびC ++インターフェイスの動作に影響を与えます。

POSIXシステムでは、のような呼び出しを使用して、ロケールに依存する文字エンコードの名前を照会できますnl_langinfo(CODESET)。Windowsでは、を呼び出すことでACPを照会できますgetACP()

追加情報(ドキュメントまたはその他の帯域外データ)が異なるエンコードを示していない限り、std::stringコンテンツがロケール設定に従ってエンコードされていると想定することをお勧めします。

Related questions

MORE COOL STUFF

ケイト・ブランシェットは3日間一緒に夫と一緒に寝て、25年経ってもまだ夫と結婚しています

ケイト・ブランシェットは3日間一緒に夫と一緒に寝て、25年経ってもまだ夫と結婚しています

ケイト・ブランシェットは、夫に会ったとき、典型的な交際のアドバイスに逆らいました。

マイケルシーンが非営利の俳優である理由

マイケルシーンが非営利の俳優である理由

マイケルシーンは非営利の俳優ですが、それは正確にはどういう意味ですか?

ホールマークスターのコリンエッグレスフィールドがRomaDramaLiveでスリル満点のファンと出会う![エクスクルーシブ]

ホールマークスターのコリンエッグレスフィールドがRomaDramaLiveでスリル満点のファンと出会う![エクスクルーシブ]

特徴的なスターのコリン・エッグレスフィールドは、RomaDrama Liveでのスリル満点のファンとの出会いについて料理しました!加えて、大会での彼のINSPIREプログラム。

「たどりつけば」をオンラインでストリーミングできない理由

「たどりつけば」をオンラインでストリーミングできない理由

ノーザンエクスポージャーが90年代の最も人気のある番組の1つになった理由を確認するには、Blu-rayまたはDVDプレーヤーをほこりで払う必要があります。

バイオニック読書はあなたをより速く読むことができますか?

バイオニック読書はあなたをより速く読むことができますか?

BionicReadingアプリの人気が爆発的に高まっています。しかし、それは本当にあなたを速読術にすることができますか?

ドミニカのボイリング湖:アクセスは簡単ではありませんが、ハイキングする価値があります

ドミニカのボイリング湖:アクセスは簡単ではありませんが、ハイキングする価値があります

ドミニカのボイリング湖は、世界で2番目に大きいボイリング湖です。そこにたどり着くまでのトレッキングは大変で長いですが、努力する価値は十分にあります。

私たちの水をきれいに保つのを助けるためにあなたの髪を寄付してください

私たちの水をきれいに保つのを助けるためにあなたの髪を寄付してください

サロンからのヘアトリミングや個人的な寄付は、油流出を吸収して環境を保護するのに役立つマットとして再利用できます。

ホワイトハウスの最も記憶に残る結婚式を見てください

ホワイトハウスの最も記憶に残る結婚式を見てください

過去200年以上の間にホワイトハウスで結婚したのはほんの数人です。彼らは誰でしたか、そしてそこで結婚式を獲得するために何が必要ですか?

グッドジョブ、ESPN

グッドジョブ、ESPN

今日のホワイトハウスの記者会見で、報道官のサラ・ハッカビー・サンダースは、スポーツセンターのホストであるイェメル・ヒルのドナルド・トランプに関する最近のツイートについてコメントするよう求められ、大統領と彼の政策を白人至上主義者として説明した。ヒルは彼女のつぶやきのためにESPNによって公に叱責されました。

アマゾンからのこのレミントンツールセールで髪を整える、スタイルを整える、乾かす、または取り除く

アマゾンからのこのレミントンツールセールで髪を整える、スタイルを整える、乾かす、または取り除く

基本的に頭のあらゆる部分から髪の毛を整えたり、ブロードライしたり、まっすぐにしたり、脱毛したりする必要がある場合は、このレミントンゴールドボックスが最適です。今日だけ、Amazonは、すでに人気のあるShortcut Pro Self-HaircutKitやPearlPro Ceramic Flat Ironのように、グルーミングをはるかに簡単にするヘアツールをマークダウンしています。

カナダの元桂冠詩人が、史上最高の文化の盗用でトゥパックとマヤアンジェロウから盗んだ

カナダの元桂冠詩人が、史上最高の文化の盗用でトゥパックとマヤアンジェロウから盗んだ

トゥパックシャクール(ティムモーゼンフェルダー/ゲッティイメージズ); マヤアンジェロウ(マーティンゴッドウィン/ゲッティイメージズ)移動、テイラースウィフト。ケンドールとカイリーは、必要な数の座席を持っています。

テスラは、ハリケーンイルマによる避難を容易にするために、フロリダでの車両の範囲を拡大しています

テスラは、ハリケーンイルマによる避難を容易にするために、フロリダでの車両の範囲を拡大しています

写真:Tesla Motorsフロリダに住んでいて、Tesla Model S、Model X 60、またはModel 60Dを使用している場合、車の自律性は50 km(約30マイル)高くなります。これは失敗ではなく、ハリケーンイルマによる避難作業を容易にするために会社自身が命じた自治権の一時的な延長です。

Zendaya Wishes Boyfriend Tom Holland Happy Birthday with Cuddly Photo: He 'Makes Me the Happiest'

Zendaya Wishes Boyfriend Tom Holland Happy Birthday with Cuddly Photo: He 'Makes Me the Happiest'

Zendaya shared a sweet photo in honor of boyfriend Tom Holland's 26th birthday Wednesday

小さな女性:脳卒中を患った後に病院から解放されたアトランタのジューシーな赤ちゃん:「まだ癒し」

小さな女性:脳卒中を患った後に病院から解放されたアトランタのジューシーな赤ちゃん:「まだ癒し」

シーレン「Ms.JuicyBaby」ピアソンは、先月脳卒中で入院した後、「もう一度たくさんのことをする方法を学ばなければならない」ため、言語療法を受けていることを明らかにしました。

エマストーンは彼女のクリフサイドマリブビーチハウスを420万ドルでリストアップしています—中を見てください!

エマストーンは彼女のクリフサイドマリブビーチハウスを420万ドルでリストアップしています—中を見てください!

オスカー受賞者の世紀半ばの家には、3つのベッドルーム、2つのバス、オーシャンフロントの景色があります。

ジーニー・メイ・ジェンキンスは、母乳育児の経験の中で、彼女は「本当に、本当に落ち込んでいる」と言います

ジーニー・メイ・ジェンキンスは、母乳育児の経験の中で、彼女は「本当に、本当に落ち込んでいる」と言います

ジーニー・メイ・ジェンキンスは、生後4か月の娘、モナコに母乳育児をしていると語った。

投資ノート:Bioscout AU$300万シード

投資ノート:Bioscout AU$300万シード

Bioscoutは、農家を運転席に置くという使命を負っています。Artesian(GrainInnovate)やUniseedと並んで、最新のシードラウンドでチームを支援できることをうれしく思います。問題真菌症による重大な作物の損失は、農民にとって試練であることが証明されています。

リトルマーケットリサーチ1| 2022年のクイックグリンプス遠隔医療市場

リトルマーケットリサーチ1| 2022年のクイックグリンプス遠隔医療市場

遠隔医療は、パンデミック後の時代では新しいものではなく、時代遅れの分野でもありません。しかし、業界を詳しく見ると、需要と供給の強力な持続可能性と、米国で絶え間ない革命となる強力な潜在的成長曲線を示しています。

スタートアップ資金調達環境:タイのスタートアップエコシステムの次は何ですか?

スタートアップ資金調達環境:タイのスタートアップエコシステムの次は何ですか?

2021年は、世界的なベンチャーキャピタル(VC)の資金調達にとって記録的な年でした。DealStreetAsiaによると、東南アジアも例外ではなく、この地域では年間で記録的な25の新しいユニコーンが採掘されました。

ムーアの法則を超えて

ムーアの法則を超えて

計算に対する私たちの欲求とムーアの法則が提供できるものとの間には、指数関数的に増大するギャップがあります。私たちの文明は計算に基づいています—建築と想像力の現在の限界を超える技術を見つけなければなりません。

Language