情報管理 vol.23 No.3 Jun 1980 コンピュータと日本語     神田泰典 富士通株 開発事業部 コンピュータはアメリカで開発されて日本に導入されてきたので、コンピュータの世界 では英語を使うことが常識になっている。現在日本では、コンピュータのプログラムを作 ったり、コンピュータを操作するためには理屈ぬきで英語を使わなければならない。これ が日本においてだれでもがコンピュータに親しめない大きな原因になっている。こんなに 平気で英語を使っているのはコンピュータの分野くらいではないだろうか?近頃半導体技 術の進歩で「パーソナル・コンピュータ」という小型のコンピュータが市場に出ている。 価格も100万円以下で、アメリカでは大人から小学生まで趣味と実益を兼ねて大いに流 行している。日本でも盛んではあるが、アメリカの比ではないようだ。これはやはり英語 なので、なかなかだれでも親しめないというのが実態であろう。  コンピュータの利用分野に科学用と事務用とがある。科学用は数式の数値計算をするの が目的であるが、数式はもともと人間の考えを抽象化したものであり、数字と記号とアル ファベットを用いて表されている。数式の中のアルファベットは特に英語を記述するため に使っているのではなく、記号として使っているにすぎない。また数値計算をしようとい う人はある程度専門職の人でそれなりの知識を持っているので、FORTRANという英 語のプログラム言語でプログラムを作りコンピュータを使うことにそれほど大きな困難は ない。実際、アメリカで開発されたプログラムをそのまま日本で利用するようなことも行 われている。しかし事務用の分野になると様子は全然違う。まず処理の対象とする情報が 科学用のように抽象化されたものではなく、実社会の中の具体的なものである。人の名前 でも住所でも、品物の名前でもこれはすべて日本では日本語であり、アルファベットでは 正しく表せない。また、事務用の分野でコンピュータを利用する人は、専門家ではなく道 具としてコンピュータを利用するだけである。特に最近のようにコンピュータの価格が下 り、いわゆるオフコンと呼ばれる小型のものは普通の商店等にもどんどん使われるように なってきた。このような事務用の分野では、「日本語」が扱えることがコンピュータを利 用するためには必須である。  日本にコンピュータが導入された時はカタカナだけは取扱えるように改良されていた。 したがって割り切って使えば何とかなるということで長い間カタカナで日本語を表記する ことが行われてきた。しかし姓名のようなものはカタカナでは正しく書くことができない し、文章のようなものになるとカタカナで書いたものは読みにくくてあまり実用的とは言 えなかった。こんなわけで、事務用の分野でコンピュータを使うといっても、伝票などの 数値の扱いが中心で用途が限られていた。もちろん、新聞社とか出版会社とか日本語の文 章を主として扱っているところでは、漢字をコンピュータで扱うことは10年も昔から行わ れてきた。しかしこれは専用のシステムで、価格も高く一般のユーザには使えなかった。  日本語を表記するのには「漢字かな混じり文」を使っている。目で見る漢字と耳で聞く 声を表すかなを混ぜたこの方法は、日本人の発明したすばらしい文化遺産で、人間が読ん ですぐ分かるという点では優れたものである。  漢字の種類は数千種類もあり、字形も複雑でこれが日本語をコンピュータで取扱う上で の大きな問題点であった。しかし近頃の技術の進歩によってだんだん問題点が克服されて きている。漢字を印刷したり、ディスプレーに表示することは、ずいぶん楽にできるよう になった。遠からずアルファベットやカタカナしか扱えない装置よりもすこし高いくらい で漢字も扱えるようになるだろう。こうなれば、日本で使われる事務用のコンピュータに は漢字を扱えるプリンターやディスプレイが標準として付くようになるだろう。コンピュ ータの内部では、漢字は16ビットの情報としてコード化されているので、特に漢字を扱う からといって大きな問題点はない。 昨年あたりから、コンピュータのメーカーが普通のシステムでも日本語が扱える機種を 続々と発表してきており、コンピュータで日本語を扱うことが常識になりつつある。しか し実際にはコンピュータからの日本語の出力が中心で、日本語を入力したり、日本語とし て処理するためには幾多の問題点が残っている。日本語の入力は、まだ未解決のテーマで ある。邦文タイプライタのような装置で漢字を入力することはできるし、現に新聞社や出 版社ではこのような入力装置を利用している。原稿がすでにできており、しかも訓練を受 けた専門のオペレータならば1分間に50文字くらいの速度で漢字かな混じりの文章が入力 できるという。しかしこの方法はだれでも使えるという方法ではない。 一方、アメリカでは英文タイプライタが用いられている。英文タイプライタはもちろん 原稿を見て入力するのにも適しているけれども、原稿を作ったり、ディクテーションをし たりすることもできる。これは、ちょうど日本で手書きで文章を作るのと同じ過程がタイ プライタで行え、その結果としてコンピュータに入力できるということである。  もし手書きの漢字が機械で認識されれば、この問題が解決される。漢字のOCR(光学 的文字認識装置)が研究されているが、その実現はまだかなり困難であり、近い将来に解 決する見通しはまずないと考えられる。  原稿なしで自分の考えた文章をちょうど紙に書くのと同じように、コンピュータに入力 できるような装置が必要である。今のところ可能性が一番大きいのが、ひらがなのキーボ ードで日本語を入力して、かなから漢字に変換することによって望む日本語の文章を入力 する方法である。日本人は鍵盤には慣れていないし、だれしも本当に使えるものができる か疑問に感ずるところであろう。しかし、何かそんなものが出現しないと日本語をコンピ ュータで一貫して扱うことにならない。アメリカ人は英語でプログラムを作り、英語でコ ンピュータと対話しているのだから、日本人は日本語でプログラムを作り、日本語で対話 しなければ少なくとも事務用の分野でコンピュータを使いこなせない。この鍵を握るもの が、日本人のだれでもが使える英文タイプライタのような日本語の入力装置である。  私はコンピュータをもっと広い範囲で使えるようにと、日本語情報処理システムの開発 に力を注いできた。今年あたりから大型のコンピュータの分野でも今までのいわゆるED P処理の延長として日本語が扱えるようなシステムが実際に稼働するようになる。しかし 今後の発展を考えた場合、だれでも使えるような日本語の入力装置の出現が切に望まれる わけであり、現在その開発に力を注いでいる。                              以上