CASK とは Computer-aided Acquisition of Semantic Knowledge =『コンピュータを活用した意味知識獲得』のことです。このプロジェクトでは、KDD (Knowledge Discovery in Databases = データベースにおける知識発見)の手法を用いて、特定の意味分野を記述することを目指します。言語学者・論理学者・コンピュータ科学者が参加する異分野協力プロジェクトです。『意味情報体系』として利用可能な(メタ)オントロジカルな素性構造の階層的定義を確立すれば、ヨーロッパ諸言語の意味分野の記述に共通に利用可能な基盤を提供できます。
ヨーロッパ諸言語の意味論のメタ・オントロジーを将来的に構築するに足るだけの一般性を備えた意味素性を見出す可能性を高めるために、二つの相互に相補的な単言語的・複言語的アプローチを採用します。CASK 二言語プロジェクトの各研究チームは両方のアプローチを採用します。こうした二言語プロジェクトのはじめの一つであるフランス語・ポーランド語研究の CASK-FP プロジェクトが現在進行しています。二つ目のフランス語・日本語研究の CASK-FJ プロジェクトが現在採択審査中です。このほか三件のプロジェクトが準備中です。(フランス語・ドイツ語研究の CASK-FG、フランス語・スペイン語研究の CASK-FS、フランス語・ロシア語研究の CASK-FR)
このように同時に複数の 二言語 CASK プロジェクトを立ち上げているのは、ヨーロッパ諸言語の最も顕在的な言語的意味分野に関するオントロジーを基礎とする意味素性構造のデータベースを構築するためです。このため、言語学者は言語表現の代表例として十分なサンプルを集め、これら言語表現を記述する意味構造をインタラクティブに構築します。記述手法が高度に精緻であるため、アスペクト・モダリティ・テンスなどの『文法範疇』の意味分野を語彙に先立って選定しています。とはいえ、『動作』に関する語彙領域の基礎的な研究、つまり変移を示す動詞の意味論、はすでに開始しています。
現在採用しているKDD (データベースにおける知識発見)の手法はシンボルデータ処理に決定論理・ラフ集合・形式概念分析のアルゴリズム、統計データ処理にクラスタ分析・要素分析など高度な手法を用いています。こうしたアルゴリズムとデータベース構築ツールを統合して SEMENA プラットフォームを実装しています。
研究成果の将来的活用の一つに多言語電子辞書と機械翻訳システムがあります。研究対象とするヨーロッパ言語一つ一つについて最も大規模かつ深い意味知識を得るために、日本語を対照の軸(ピボット)とする研究の成果を広く活用する予定です。
This project description is translated from:
http://www.celta.paris-sorbonne.fr/anasem/CASK-ProjectDescription.html
© 2006 André WŁODARCZYK and Hélène WŁODARCZYK.
Translation by Yasunari HARADA and André WŁODARCZYK.
All rights reserved.