NEWS

2024.01.11

【プレスリリース】量子インスパイアード技術を用いた大量データのクラスタリング手法の開発 多様な分野における画像を含む時系列データの分析に利用 (2024.1.11)

【発表のポイント】
・科学、工学、環境、農業、生命科学、経済学をはじめ多くの分野で、時間とともに変化するデータ(時系列データ)を大量に収集し、類似度に応じて適切にグループ分け(クラスタリング)し、特徴的な挙動を解析することが重要となっています。
・本研究では、時系列データのクラスタリングを組合せ最適化問題として捉え、この問題に特化した量子インスパイアード技術を適用することで、大量なデータのクラスタリングを高速に行うことに成功しました。

【概要】
 早稲田大学理工学術院教授 松田佑(まつだゆう)、同大学院生 井上智輝(いのうえともき)、窪田航陽(くぼたこうよう)、東北大学流体科学研究所教授 永井大樹(ながいひろき)、同助教 伊神翼(いかみつばさ)、愛知工業大学工学部教授 江上泰広(えがみやすひろ)らの研究グループ(以下、「本研究グループ」とする)は、大きなサイズで大量の時系列データ*1のクラスタリング*2を組合せ最適化問題*3として捉え、これに特化した計算技術を応用して高速な計算を可能としました。また、どのクラスタにも相応しくない外れ値を、クラスタに含まないようなアルゴリズム構築を行いました。これにより、多分野での画像を含む時系列データの解析に本手法が貢献できると期待されます。

 このたびの成果は、英国の科学雑誌Natureが運営するオープンアクセスジャーナル『Communications Engineering』に、“Clustering Method for Time-Series Images Using Quantum-Inspired Digital Annealer Technology”として、2024年1月10日(現地時間)に掲載されました。



図1 本研究による高精度クラスタリング結果


【用語解説】
※1 時系列データ
時間と共に変化する量についてのデータ。例えば、気温の時間変化、株価や為替相場など。

※2 クラスタリング
データを類似度に応じてグループ分けすること。教師なしの機械学習のひとつ。教師あり学習である「分類」とは異なる。作られたグループはクラスタと呼ばれる。また類似度とは2つのデータがお互いにどれだけ似ているのかを示す指標。

※3 組合せ最適化問題
考えられる組合せの中から、与えられた条件を満たす最適な組合せを選ぶ問題。巡回セールスマン問題やナップサック問題などがよく知られている。

<関連リンク>
東北大学プレスリリース
永井研究室ウェブサイト

<問い合わせ先>
(研究に関すること)
東北大学流体科学研究所 
教授 永井 大樹
TEL: 022-217-5227
E-mail: nagai.hiroki*tohoku.ac.jp
(*を@に置き換えてください)

(報道に関すること)
東北大学流体科学研究所 
広報戦略室
Tel: 022-217-5873
E-mail: ifs-koho*grp.tohoku.ac.jp
(*を@に置き換えてください)