- 更新日: 2013年12月8日
- 英語学習
英語と比較すると日本語の情報密度は半端ない
この2年間英語を学習とTwitterでの英語ツイートを継続して、意識するようになったことですけど、日本語と英語じゃ同じ文字数あたりの情報量が全く違うという事実。Twitter で日本語で140文字一杯書こうとすると、結構多くの情報を含ませることができてしんどい一方、英語だと140文字はすぐに埋まってしまいます。
駄文日記でただの垂れ流しなので、暇な人だけどうぞ。
日本語の情報密度は極めて高い(14文字、20音)
日本が敗戦国からこれだけ巻き返せた理由の一つとして、実は日本語のコミュニケーションコストが低いからなのでは?という仮説を考える時がある。普段日本語ばかり使ってると気付かないですけど、日本語という言語は、本当に短い文字数に多くの情報を詰め込むことができます。その分おそらく世界有数の学習コストの高い自然言語だとも思いますけど。
ひらがな、カタカナは良いとして、漢字がえぐい。まあ漢字のおかげで情報密度を大幅に高くできるのだけど、外国人の日本語学習者の方たちは、皆さん漢字で四苦八苦されているご様子です。我々日本人が思いも付かないような漢字暗記メソッドなんかも考案されていて興味深い。
日本人が日本語以外が不得意なのは、日本語を覚えるのに精一杯だからではないかと感じることすらあります。日常でたいして必要のない難しい日本語教育の部分を、小さいうちから他言語の教育に回せば、おそらくバイリンガルな人も出てくるんじゃないかなぁと思う。
The information density of Japanese is pretty high!(43 letters, about 28 phones)
Twitterで英語をつぶやきはじめた2年ちょい前の最初のころ、なぜこんなに少ない情報を伝えるのに、英語だと140文字以内に入らんのだ!と不思議、かつ不満に思っていた時期がありました。それで気付いたのが、この1文字あたりの情報密度の差。1文字が持つ情報量の差と言ったほうが分かりやすいかな。
音の数で比べるとそれほどの差ではないけど、文字数で考えてみるとすごい差になります。見出しを例とした同じ内容の日本語文と英文ですと、日本語文が14文字に対し英文が43文字(空白を入れると50文字)の差ですので、3倍以上の差です。
つまり、日本語と同じ内容を英語で書こうとすると、3倍以上の文字数が必要になる場合もあるということ。英語で140文字つぶやく場合は、日本語で考える場合の45文字程度の情報量しか含まれない場合があるわけです。3倍以上にならない場合でも、ほとんどの表現は英語のほうが文字数が多くなります。どうりで英語だと140文字で一杯一杯になるわけだ。
ということで、いきなりまとめに入りますけど、こんなに情報圧縮能力に優れる超難しい日本語を我々日本人は流暢に操れるのだから、英語だって本気を出せばチョチョイのチョイと習得できるはずです。いや、チョチョイのチョイは言い過ぎかもだけど、とにかく英語を学習してる日本人の皆さん、受験や資格のために英語を勉強してる皆さん、めげずに頑張ろうぜ!と呼びかけたかっただけの日記。
- 英語学習 の関連記事
- peeve ほか今週の英語フレーズと英単語
- be deficient in A ほか今週の英語フレーズと英単語
- Federal Aviation Agency ほか今週の英語フレーズと英単語
- catch up with A ほか今週の英語フレーズと英単語
- be poised for A ほか今週の英語フレーズと英単語
- come down with a cold ほか今週の英語フレーズと英単語
- take up the slack ほか今週の英語フレーズと英単語
- stand by A ほか今週の英語フレーズと英単語
- Apartments to let ほか今週の英語フレーズと英単語
- come down with 〜 ほか今週の英語フレーズと英単語
- 4件のコメント
同じような事を考えたことあります。が、冷静に考え直してみると、そうでもないかも。というのも、英字1文字を表現するのに必要な情報量は5ビット程度(26文字+記号)。これが日本語だと、漢字も含めて最低限1000文字程度必要として10ビットは必要です。よって、英字140字で表現可能な情報は、情報量で正規化してみると、日本語70文字程度に相当することが分かります。この前提で考えると、大差ないような気がしてきませんか??(ただし、日本語は語尾の変化に含まれる情報が多いので、その辺、英語より面倒くさい。裏を返せば、そこに詰め込まれた情報分だけ、英語より密ということはありそうです)
通りすがりさん、こんにちは。
なるほど… ビットで換算は思いつきませんでした。
確かにビット換算だと、差が少なくなりそうですね。
コメントありがとうございました!
英語と日本語で同じ意味とされる単語でもニュアンスが違う場合があり(含まれているイメージのグループが違う)、翻訳などして英語の文章の意味を全て伝えようとすれば枝葉を相当切り落として伝えなければならないのが殆どと思います。
時制やら数やら、文化背景から説明しなければならない単語やらも。
翻訳で情報が膨らんでしまうのなら何を言いたいか、や何語で考えたかなどでも違いますし、どうなんでしょうね。
最初から英語で考えられるなら翻訳するよりは情報量を少なくまとめられるでしょうけど、かなりハードルが高いですね。まあそれは日本語でも同じ事ですが。
また、ネイティブ以外には圧縮された情報を正確に解凍できないでしょう。極めて表層的な理解に留まってしまうと思います。
日本人が日本語を使って少ない言葉で受け答え出来るのは相手が日本人だからでは?
個人的な感想としては、英語に含まれるイメージを全てデコードするなら日本語以上なんじゃないかなあ、と私は感じます。
もちろん翻訳するからですが。
まあともかく、文字数ではなく単語数で考えた方がいいでしょうね。
それならほぼ五分でしょうし。
ああ、ラスト三行だけで十分でした。
とりあえずこのまま送信。
抽象的なことはいいません。次の例でわかるでしょう。
「メリーさんの羊」の英語歌詞。Mary had a little lamb with fleece as white as snow, and everywhere that Mary went the lamb was sure to go これを訳した「メアリは一匹の子羊を持っていた,雪のように白い毛の,そしてメアリがどこへ行ってもその子羊は必ずついてきた」を歌ってみてください。英語の情報密度の高さを実感できます。