言語は、人間という動物を特徴づける代表的な認知機能のひとつである。脳内で実行されているその処理のメカニズムは未知であり、そのメカニズムをニューラルネットワークの枠組みの下でモデル化してみようとすることは、近年の認知心理学・認知科学において重要な試みとなっている。人間の言語機能は様々な側面からなっており、音韻、統語、意味と呼ばれる諸機能や、音声言語の機能と文字言語の機能が、それぞれ自律的な処理モジュールによって担われていると推定されている。また、音素・音節あるいは文字、形態素・単語、句・節・文などの心理的単位ごとにそれぞれ独自な処理がなされていると推定されている。本研究では、言語のそうした様々な機能のうちで文字認知機能に注目し、特に、未知の文字の音韻情報を推測できる人間の認知メカニズムを追究しようとするものである。
漢字に習熟している人は、未知の漢字であってもその文字の音韻情報(以下「読み」と記述)を推定できる場合がある。これはどのようなメカニズムによっているのであろうか。一般的には、その漢字を構成する特定の部分、特に旁が特定の読みを持っていて、それが未知の漢字全体の読みとして適用されると考えられている。しかし、未知の漢字の旁部分の読みが漢字全体の読みに“直接”適用されると考えてよいのであろうか。また、未知の漢字の読みが推測されるとき、“旁以外の部分”は全体の読みに対し何の影響も与えないのであろうか。本研究では、未知の漢字の読みを推測する、新しい「漢字の読みのモデル」を提案する。本モデルは、未知の漢字と同じ部分を持つ既知の漢字の読みから間接的に読みを推測するもので、かつ、旁も含め、漢字を構成する全ての部分を推測の際に同時に用いるものである。これをコンピュータ上に構築してシミュレーションを行う。
本モデルは、並列分散処理の構造を持ち、3層のレベルによって構成される。第1層は「漢字部分」(以下「部分」)レベルで、漢字の扁や旁に代表される、漢字の構成部分をユニットとして持ち、第2層へその情報(興奮および抑制)を伝達する。第2層は「漢字」レベルで、第3層へ情報を伝達する。第3層は「読み」レベルで、各ユニットの活性値を読みとして出力し、第2層へ情報をフィードバックもする。
本モデルは、小学校で学習する学習漢字996字中617字を知識として持つ。「漢字」レベルにはこれら計617
字分のユニットを置いた。「部分」レベルには、「漢字」レベルに属する全ての漢字を構成する389種類の「部分」を、左にある場合と右にある場合でそれぞれ別のユニットとして計778ユニットを置いた。「読み」レベルには、「漢字」レベルのユニットの持つ読みのうち、音読と訓読で最も連想されやすいものを1つずつ選択し、全ての「読み」ユニットとして559ユニットを置いた。
シミュレーションでは、「漢字」ユニットと「部分」ユニットと「読み」ユニットとの関係をあらかじめプログラム内部に置き、完全に学習させた状態にしてから、学習させていない20字の未知の漢字を入力し、20サイクル後に、それらの漢字に対して出力された読みを収集した。
未知の漢字を入力した結果、入力した20漢字のうち19漢字で最大2つの「読み」ユニットが正の活性値を持った。この正の活性値を持った「読み」ユニットを、未知の漢字の入力に対する出力と考える。読みが出力された19漢字のうち17漢字で、人間と同じ読みが出力された。
出力された読みのうち、人間と同じものの中には、未知の漢字の左側部分から得た情報によって導かれた読みもあった。これは、未知の漢字の読みを推測するとき、“旁以外の部分”が全体の読みに対して影響をもたらす場合があることを示唆する。また、未知の漢字の中には、独立した読みを持たない部分が、同じ部分を含む漢字ユニットを活性化させ、間接的に読みを出力させた場合もあった。これらの結果は、旁の部分が特定の「読み」を持ち、その読みが全体の読みに“直接”用いられているわけではなく、旁を含めた全ての部分が単独で読みを持たない場合でも、同じ部分を同じ位置に含む既知の漢字を活性化することで特定の読みを推定させ得るということを示唆している。
本モデルは、現段階で、「部分」が漢字の中で置かれる位置を右と左のみに限定したため、漢字の中央から左右2つに部分を分離することのできる左右分離漢字455字と、それらの左右分離漢字を構成する「部分」のみで一文字となる漢字162字の計617字しか扱うことができていない。今後は、扱える「部分」の位置を増やすことで、より多くの漢字を扱うことができるように拡張する予定である。また、本モデルの心理学的妥当性を検証するための実験を実施する予定である。
|