世の中を変えたjpegとMP3の圧縮について浅く解説(読み物)

jpegの中身

jpegは色の付いた8x8ドットの並びを
  1. RGB変化分を明るさと色にベクトル化。
  2. 同じ動きを持つ画像を人間の視覚特性に沿ってBPFで分解。
  3. 複数の周波数帯を保存。
大雑把に3つやって画像圧縮しています。
 
「赤の暗闇、青の暗闇、緑の暗闇、フィルターでまとめると見た目一緒だから真っ黒でいいよね。
もっと圧縮したい?じゃぁ八方見回して8x8を大きくしようか?境目の差が目立つからちょっとぼかすけど。」
 
と多くのドットが省略され輪郭も失われます。
表示は3のデータを単純に並べていませんが工夫して表示します。これは保存時の圧縮技術です。

MP3との中身

  1. 音の変化量をベクトル化、
  2. 同じ動きを持つ音を人間の視覚特性に沿ってBPFで分解。
  3. 複数の周波数帯を保存。
かなりjpegに似てます。
「超音波は聞こえないから要らないよね、圧縮レベルを上げたい?じゃあ12kHz以上も検出いらないよね。
もっと?じゃぁ8kHz以上のバンドは検出もしないね。」
となりこもった音に記録されます。 
再生は3で作ったデーターの加算合成で再現出来ます。モガモガとカサカサを足すと原音が再現出来るのです。

非可逆圧縮と可逆圧縮は違いはあれど。

  • 非可逆圧縮
 
非可逆圧縮は計算による複製品です。色周波数、サンプリング周波数を忠実に再現するわけでなく
人間の感じる範囲のBPFをかけてスペアナ表示状態を保存、圧縮したもの。と言えます。
伝達目的なら効率が良い方法。
 
  • 可逆圧縮

先読みし、辞書による圧縮。いくら無圧縮でもアナログからデジタルにした時点で本物ではない物に置換えています。 本物に近いか遠いかだけの話です。保存目的なら最善の方法。
 
話はそれますが携帯電話の圧縮技術はもっとフェイク度が高く、テキストをコンピューターが読み上げてるレベルの圧縮技術です。 多分地球外生命体がデーター見たら圧縮し過ぎてアカンやろ!と突っ込みくらうと思います。

  • 情報通信

古くはパピルスや石板やのろしから始まる情報通信ですが複製して、伝達するのが基本です。なんでもアリです。電話・ラジオ・テレビ・携帯電話・衛星通信・インターネットが出来て物理メディアならレコード・カセットテープ・ビデオ・CD・LD・DAT・DVD・BDと、より本物に近付いています。ここ100年の出来事ですごい発展です。

コメント