昔の機械翻訳
現代の生成AIモデルの発達は凄まじく, 話者数の多い言語であるならば, その翻訳精度は並の人間よりももはや高くなっていると言っても過言ではないであろう. しかし当然であるが, 最初からこれだけの完成度を持っていたわけではない.
一昔前のGoogle翻訳などを思い返してみると, 物理的に単語を置き換えただけのような翻訳も多々見受けられた. Baker (2008)では別の例を用いて, いかに当時の翻訳がうまくできていなかったかを表現している.
Harvey Newquist reports an apocryphal story about an early English-Russian system that translated the biblical quotation “The spirit is willing, but the flesh is weak” into Russian as “The vodka is strong, but the meat is spoiled.
(Baker, 2008, p. 9)
これは「spirit(精神/蒸留酒)」と「flesh(肉体/食肉)」という多義語の解釈をコンピューターが誤ったことによると言えるだろう.
このように, 人間の言語は単語を一対一で置き換えるだけでは, とても自然な文脈にはならない. これが当時の限界であったが, それを超越した近年の技術は, 大きなブレイクスルーであった.
参考文献
- Baker, M. C. (2008). The atoms of language: The mind’s hidden rules of grammar. Basic Books.