研究シーズの泉

豊橋技術科学大学、長岡技術科学大学、国立高等専門学校の研究シーズが結集した横断的に検索可能なサイトです。

お問合せ メニュー

機械学習法の原理・限界を探ります

情報理論に基づく学習システム設計の基礎研究

ステータス 基礎 実証 実用化準備

概要

多数のデータを例題として用い、その振る舞いを適応的に変化させる学習システムは、パターン認識、ロボット制御などに広く応用されています。学習システムの性能を統計学、情報理論の方法などにより解析する統計的学習理論と、その知見に基づいた学習システムの応用に関する研究を行っています。

従来技術

データ解析や予測において活躍している機械学習法の多くは、その原理や限界が明らかではなく、設計者の試行錯誤が必要とされます。

優位性

原理や限界を明らかにすることで、機械学習法の背景理論に基づいた設計が期待できます。実データ解析・予測に応じて、機械学習法を改良するための指針を与えます。

特徴

機械学習法によるデータ解析をデータ圧縮の観点から捉え、その限界を探ります。
歪み有りデータ圧縮は、データを圧縮する際、ある程度の歪みを許す状況を扱い、画像や音声データなどの圧縮に用いられています。
歪みの度合いが大きくても良ければ、その分圧縮することができるため、歪みの量の増加とともに、符号長が減少する曲線を描くことができます。

実際の符号化法で実現できる符号長には限界があることが知られており、歪み量の関数としてレート歪み関数(曲線)と呼ばれます。これはデータの生成過程(情報源)と歪みを測る尺度について固有な関数ですが、わずかな例でしか明らかにされておらず、圧縮限界にせまる方法も明らかにされていません。

本研究では、クラスタリング(データを自動的にグループ分けする)手法やベイズ推論における事前分布の最適化法に対し、レートと歪みのトレードオフを求める問題としての解釈を与え、複雑な歪み尺度を用いた学習法に対して、その性能の限界を示すレート歪み関数の評価を行っています。

092_1 渡辺先生 図1.png
レート歪み関数

実用化イメージ、想定される用途

・実データ解析に応じた機械学習法の開発
・機械学習法による予測性能の向上
・本質部分を保持した大規模データの圧縮・視覚化

実用化に向けた課題

理論解析における仮定と、実用上の状況との乖離を考慮するため、実データの生成過程に近い複雑な情報源や、問題に応じた歪み尺度の検討が必要となります。

研究者紹介

渡辺 一帆 (わたなべ かずほ)
豊橋技術科学大学 情報・知能工学系 准教授
researchmap

研究者からのメッセージ(企業等への提案)

実応用における機械学習法の設計に理論的な知見を取り入れることができるかもしれません。ご興味をお持ちの企業の技術相談をお受けします

知的財産等

掲載日:2020年06月26日
最終更新日:2020年06月26日