Pythonを使用して非常に長いバイナリ文字列を元に戻せる単純なフォームにエンコードする最良の方法は?

1
leveygao 2021-01-14 01:00.

- - - - - - - - - - - - - 新しく追加する - - - - - - - - - - - -------

ここに詳細を記入させてください:

実際の状況では、環境Aにこの長い文字列があり、それをコピーして環境Bに貼り付ける必要があります。

残念ながら、envir-Aとenvir-Bは接続されていない(相互アクセスがない)ので、それを表すためにエンコード/デコードする方法を考えています。そうしないと、より多くのファイルを手動で入力する必要があります--- -これは遅く、再現性がありません。

何か提案やガジェットがお勧めしますか?どうもありがとう!


SUPERLONGバイナリを数桁のような単純な形式にエンコードするという奇妙な問題に直面しています。

たとえば、長さが1,000〜100,000桁以上の「110 ... 011」のように、1と0だけで構成される長い文字列があり、このSTRINGを桁/文字の少ないものにエンコードしたいとします。次に、元の文字列に戻す必要があります。

現在、Pythonでhex / intメソッドを使用して、この文字列を「圧縮」し、「解凍」して元の形式に戻そうとしています。

例は次のとおりです。

1.入力文字列: '110011110110011'

'' '

def Bi_to_Hex_Int(input_str, method ):

#2to16 
if method=='hex':
    string= str(input_str)
    input_two= string
    result=    hex(int(input_two,2))
    
#2to10 
if method=='int':
    string= str(input_str)
    input_two= string
    result=     int(input_two,2) 


print("input_bi length",len(str(input_two)), "\n output hex length",len(str(result)),'\n method: {}'.format(method) )
return result


res_16 =Bi_to_Hex_Int(gene , 'hex')
=='0x67b3'

res_10 =Bi_to_Hex_Int(gene , 'int')
== 26547

'' '

それから私はそれを元に戻すことができます:

'' '

def HexInt_to_bi(input_str , method):


if method =='hex':

    back_two =  bin(int(input_str,16))

    back_two =  back_two[2:]
    
     
if method =='int':

    back_two =  bin( int(input_str ))

    back_two =  back_two[2:]
    
    
print("input_hex length",len(str(input_str)), "\n output bi length",len(str(back_two)) )
return back_two


hexback_two = HexInt_to_bi(res_16, 'hex')
intback_two = HexInt_to_bi(res_10 , 'int')

'' '

しかし、これには問題があります。約500桁のString:101010 ... 0001(500d)を試しました。最良の「圧縮」結果は、16進数で約127桁です。

それで、文字列をさらに少ない桁数に「圧縮」するためのより良い方法はありますか?

** 5,000桁の文字列が1と0で構成されているとすると、50/100桁/文字(さらに低い)に圧縮します** ??

4 answers

1
Som-1 2021-01-14 02:19.

単純にしたい場合は、1つの16進文字で4つの2進文字(2 ^ 4 = 16)を圧縮するとします。必要な圧縮率は約100/50倍です。50回の場合、50個のバイナリ文字を1文字に圧縮する必要があります。つまり、任意の組み合わせをエンコードするには2 ^ 50個の異なる文字が必要です。かなりたくさんあります。

より低い比率を受け入れる場合は、ここで説明するようにbase64を試すことができます。その圧縮率は6対1です。

それ以外の場合は、文字列をブロックに分割する、ブロック間で類似するものを探す、異なるシンボルでエンコードする、それらのシンボルのマップを作成するなど、複雑なアルゴリズムを考え出す必要があります。

おそらく、アーカイバを使用して文字列を圧縮してから、結果のbase64表現を返す方が簡単です。

タスクで許可されている場合は、文字列全体をどこかに保存して短い一意の名前を付けることができるため、圧縮と解凍の代わりに、文字列を名前で保存および取得する必要があります。

1
Mark Ransom 2021-01-14 08:52.

これはおそらくあなたが得ることができる絶対に最短の文字列を生成しませんが、Pythonに組み込まれた機能を使用することは簡単です。文字をバイナリ形式に変換する必要はありません。zlib圧縮により、2つの異なる文字のみを含む入力が最適なものに変換されます。

エンコーディング:

import zlib
import base64
result = base64.b64encode(zlib.compress(input_str.encode()))
1
TTho Einthausend 2021-01-14 11:08.

カウントした場合0とは、1あなたが使用できるよりも有意差がある数え上げ最短表現を取得するためにコーディング

0
Mark Adler 2021-01-14 08:32.

文字列がと数字のみで構成されている場合は、8桁を1バイトにパックできます。また、最後のバイトは8桁未満を表す場合があるため、最後の8の倍数を超えた桁数を追跡する必要があります。01

Related questions

MORE COOL STUFF

Reba McEntire は、彼女が息子の Shelby Blackstock と共有する「楽しい」クリスマスの伝統を明らかにしました:「私たちはたくさん笑います」

Reba McEntire は、彼女が息子の Shelby Blackstock と共有する「楽しい」クリスマスの伝統を明らかにしました:「私たちはたくさん笑います」

Reba McEntire が息子の Shelby Blackstock と共有しているクリスマスの伝統について学びましょう。

メーガン・マークルは、自然な髪のスタイリングをめぐってマライア・キャリーと結ばれました

メーガン・マークルは、自然な髪のスタイリングをめぐってマライア・キャリーと結ばれました

メーガン・マークルとマライア・キャリーが自然な髪の上でどのように結合したかについて、メーガンの「アーキタイプ」ポッドキャストのエピソードで学びましょう.

ハリー王子は家族との関係を修復できるという「希望を持っている」:「彼は父親と兄弟を愛している」

ハリー王子は家族との関係を修復できるという「希望を持っている」:「彼は父親と兄弟を愛している」

ハリー王子が家族、特にチャールズ王とウィリアム王子との関係について望んでいると主張したある情報源を発見してください。

ワイノナ・ジャッドは、パニックに陥った休暇の瞬間に、彼女がジャッド家の家長であることを認識しました

ワイノナ・ジャッドは、パニックに陥った休暇の瞬間に、彼女がジャッド家の家長であることを認識しました

ワイノナ・ジャッドが、母親のナオミ・ジャッドが亡くなってから初めての感謝祭のお祝いを主催しているときに、彼女が今では家長であることをどのように認識したかを学びましょう.

セントヘレナのジェイコブのはしごを登るのは、気弱な人向けではありません

セントヘレナのジェイコブのはしごを登るのは、気弱な人向けではありません

セント ヘレナ島のジェイコブズ ラダーは 699 段の真っ直ぐ上る階段で、頂上に到達すると証明書が発行されるほどの難易度です。

The Secrets of Airline Travel Quiz

The Secrets of Airline Travel Quiz

Air travel is far more than getting from point A to point B safely. How much do you know about the million little details that go into flying on airplanes?

Where in the World Are You? Take our GeoGuesser Quiz

Where in the World Are You? Take our GeoGuesser Quiz

The world is a huge place, yet some GeoGuessr players know locations in mere seconds. Are you one of GeoGuessr's gifted elite? Take our quiz to find out!

バイオニック読書はあなたをより速く読むことができますか?

バイオニック読書はあなたをより速く読むことができますか?

BionicReadingアプリの人気が爆発的に高まっています。しかし、それは本当にあなたを速読術にすることができますか?

オーケーグッド770HPランボルギーニセンテナリオは十分に正気ではない

オーケーグッド770HPランボルギーニセンテナリオは十分に正気ではない

ランボルギーニの創設者であるフェルッチオランボルギーニが100歳になるのは毎日ではありません(そうです、彼は死んでいて、まだ死んでいると思います。

彼らが買った1台の車からAppleの車の計画について私たちが推測できること

彼らが買った1台の車からAppleの車の計画について私たちが推測できること

Appleが自動車分野に参入するという噂はかなり前から渦巻いており、AppleウォッチャーがSixtyEight Researchという会社がAppleの自動車研究開発のシェル会社である可能性が高いと判断したとき、その渦巻きは本当に渦巻いた。また、会社が購入した車は1台だけであることが知られており、その車はAppleが何を考えているかについての手がかりでいっぱいになる可能性があることも伝えています。

天文学者は太陽系の9番目の惑星の新しい証拠を見つけます

天文学者は太陽系の9番目の惑星の新しい証拠を見つけます

太陽系の外側にある架空の大きな物体である惑星Xの探索は、何十年にもわたって人間を魅了してきました。その検索の最新の章は、地球の10倍の大きさで、公転周期が15であるほど遠くにある惑星を指しています。

キャムニュートン、ゴッドダム

キャムニュートン、ゴッドダム

カムニュートンは昨日、簡単な265ヤードと3回のタッチダウンでファルコンズを引き裂き、別の素晴らしいゲームをしました。その日のハイライトは、上のタッチダウンスローでした。これは、視聴するたびにばかげているだけです。

米国のフィギュア スケートは、チーム イベントでの最終決定の欠如に「苛立ち」、公正な裁定を求める

米国のフィギュア スケートは、チーム イベントでの最終決定の欠如に「苛立ち」、公正な裁定を求める

ロシアのフィギュアスケーター、カミラ・バリエバが関与したドーピング事件が整理されているため、チームは2022年北京冬季オリンピックで獲得したメダルを待っています。

Amazonの買い物客は、わずか10ドルのシルクの枕カバーのおかげで、「甘やかされた赤ちゃんのように」眠れると言っています

Amazonの買い物客は、わずか10ドルのシルクの枕カバーのおかげで、「甘やかされた赤ちゃんのように」眠れると言っています

何千人ものAmazonの買い物客がMulberry Silk Pillowcaseを推奨しており、現在販売中. シルクの枕カバーにはいくつかの色があり、髪を柔らかく肌を透明に保ちます。Amazonで最大46%オフになっている間にシルクの枕カバーを購入してください

パデュー大学の教授が覚醒剤を扱った疑いで逮捕され、女性に性的好意を抱かせる

パデュー大学の教授が覚醒剤を扱った疑いで逮捕され、女性に性的好意を抱かせる

ラファイエット警察署は、「不審な男性が女性に近づいた」という複数の苦情を受けて、12 月にパデュー大学の教授の捜査を開始しました。

コンセプト ドリフト: AI にとって世界の変化は速すぎる

コンセプト ドリフト: AI にとって世界の変化は速すぎる

私たちの周りの世界と同じように、言語は常に変化しています。以前の時代では、言語の変化は数年または数十年にわたって発生していましたが、現在では数日または数時間で変化する可能性があります。

SF攻撃で91歳のアジア人女性が殴られ、コンクリートに叩きつけられた

犯罪擁護派のオークランドが暴力犯罪者のロミオ・ロレンゾ・パーハムを釈放

SF攻撃で91歳のアジア人女性が殴られ、コンクリートに叩きつけられた

認知症を患っている 91 歳のアジア人女性が最近、47 番街のアウター サンセット地区でロメオ ロレンゾ パーハムに襲われました。伝えられるところによると、被害者はサンフランシスコの通りを歩いていたところ、容疑者に近づき、攻撃を受け、暴行を受けました。

ℝ

“And a river went out of Eden to water the garden, and from thence it was parted and became into four heads” Genesis 2:10. ? The heart is located in the middle of the thoracic cavity, pointing eastward.

メリック・ガーランドはアメリカに失敗しましたか?

バイデン大統領の任期の半分以上です。メリック・ガーランドは何を待っていますか?

メリック・ガーランドはアメリカに失敗しましたか?

人々にチャンスを与えることは、人生で少し遅すぎると私は信じています。寛大に。

Language