梅村 恭司(うめむら きょうじ)
所属 | 情報・知能工学系 |
---|---|
職名 | 教授 |
専門分野 | 情報工学 |
学位 | 博士(工学) 東京大学 |
所属学会 | 情報処理学会 / 情報電子通信学会 / ソフトウェア科学会 / 計量国語学会 / ACM / ACL |
umemura@ ※アドレスの末尾に「tut.jp」を補完してください |
|
研究室web | http://www.ss.cs.tut.ac.jp/ |
研究者情報(researchmap) | 研究者情報 |
研究テーマ(シーズ1)
統計的な文字列の計数アルゴリズム
研究の技術分野 | 情報工学 |
---|---|
研究の段階・状況 | 実用化レベル |
キーワード | アルゴリズム,検索 |
提案者 | 梅村 恭司 |
連絡先 | 梅村恭司 〒441-8580 愛知県豊橋市天伯町字雲雀ヶ丘1-1 豊橋技術科学大学 情報工学系 電話:0532-44-6762 FAX :0532-44-6757 (学科事務室) Email: umemura@tutics.tut.ac.jp |
Suffix Arrayのデータ構造を利用して,データ中の全ての文字列の統計量の表を計数する技術がある。既存のSuffix Treeを利用した方法に比べ,メモリ効率が良い。また,そこで,出現集中の程度を示す統計値も計数できる。この統計値は,ある区間で繰り返して出現する傾向があるかどうかを示す統計値であるが,経験上,意味の上で重要な役割をはたす文字列であるかどうかを,この統計値で判定できる。
基本となる特許・解説記事・研究論文等
Kyoji Umemura, Kenneth Church: Substring Statistics, Computer Lingustics and Intelligent Text Processing 2009, LNCS5449, pp.53-98
実施可能な共同研究の形態
アルゴリズムを応用したシステムのプロトタイプの作成と評価