開学40周年記念事業

文字サイズ
検索

学部・大学院

ホーム > 学部・大学院 > 教員紹介 > 情報メディア基盤センター > 土屋 雅稔(つちや まさとし)

土屋 雅稔(つちや まさとし)

所属 情報メディア基盤センター
兼務 情報・知能工学系
職名 准教授
専門分野 自然言語処理
学位 情報学博士(京都大学)
所属学会 情報処理学会 / 言語処理学会
E-mail tsuchiya@imc
※アドレスの末尾に「.tut.ac.jp」を補完してください
研究室web http://imc.tut.ac.jp/~tsuchiya/

研究紹介

日本語には,複数の語が定形的・複合的に使われるようになって,ひとかたまりの表現として非構成的な意味を持ち,機能的関係を表すようになった表現が多数存在します.このような表現は機能表現と呼ばれ,日本語文の構造を理解するために非常に重要です.そこで,機能表現を明示的・網羅的に取り扱うための研究を行っています.

テーマ1:日本語複合辞の処理に関する研究

概要

日本語には,複数の形態素がひとかたまりとなって,ひとつの機能語相当語として働く表現が多数存在する.このような表現は機能表現と呼ばれ,日本語文の構造を理解するために非常に重要である.
例として,以下の2つの文を翻訳する場合を考える.
(1) 私は彼について話した.→ I talked about him.
(2) 私は彼について走った.→ I run following him.
この2つの文には「について」という表現が共通して現れているが,文(1)の「について」は前置詞 about と翻訳するべきであるのに対して,文(2)の「について」は動詞 follow の現在分詞に翻訳するのが適当である.このように区別して翻訳するには,文(1)中の「について」をひとかたまりの機能表現として検出すると同時に,文(2)中の「ついて」は本来の動詞の意味で用いられていると区別して,文の構造を正しく把握しておく必要がある.
このような処理を実現するため,まず筆者らは,計算機から利用することを前提とした複合辞用例データベースの作成方法を提案し,実際に作成して問題点を明らかにした.さらに,作成したデータベースを訓練データとして,機能表現検出器を Support Vector Machine を用いて作成したところ,F値で約92という高精度の結果を得た.

キーワード

自然言語処理,機能表現,形態素解析

ページトップへ