本研究室が明らかにしようとしている問いは,「言語を理解するとはどういうことか」です. この問いに答えるためのアプローチとして,機械学習を用います. また,この問いに答えようとする取り組みを通して得られた知見が,どのように言語を扱う人工知能(AI)技術の発展に貢献できるかを考えます.

Figure of research topic overview

計算進化言語学に関する研究

言語の起源は謎に包まれています. なぜヒトの言語は特別なのか. ヒトのどのような認知機能が言語の使用を可能にしたのか. このような問いに答えるために,ヒトの脳や行動を調べる研究や,ヒト以外の動物が取るコミュニケーションの研究が進められています. これに対して,コンピュータシミュレーションによってこの問いの答えに近づくことを試みる計算進化言語学というアプローチがあります. 本研究室では,深層強化学習を搭載したAIエージェント群を仮想環境下で学習させることで,どのような条件でどのようなタイプのコミュニケーションが創発するのかを明らかにする研究を行っています.

主要な関連論文

  • 小田倉 史麿, 若林 啓 : 動作を表す言語を生成する深層学習における共同注意の有効性. 第37回人工知能学会全国大会論文集 (JSAI), 4 pages, 2023.6

対話システム構築技術に関する研究

近年,スマートフォンやロボットの技術の発達により,音声対話エージェントが身近な存在になってきました. この技術が発展すれば,人々と情報をつなぐ多くのインターフェースが,人間にとってより自然な形に変化すると考えられます. このためには,情報提供者にとってWebサイトを構築するのと同じくらい,対話システムを簡単に構築できるような環境を作る必要があるでしょう. 本研究室では,ユーザの発話の理解モデルを効率よく訓練する手法や,ユーザの雑談に対して自然に応答する手法の提案を通して,対話システムの構築を容易にするための基礎技術に貢献することを目指しています.

主要な関連論文

  • Kei Wakabayashi, Johane Takeuchi, Mikio Nakano : Robust Slot Filling Modeling for Incomplete Annotations using Segmentation-Based Formulation. 人工知能学会論文誌, Vol.37, No.3, pp.IDS-E_1-12, 2022.5
  • 福田 拓也, 若林 啓 : 雑談システムにおけるTwitterデータからの統計的バックチャネル応答抽出手法. 人工知能学会論文誌, Vol.33, No.1, pp.DSH-H_1-10, 2018.1
  • Kei Wakabayashi, Johane Takeuchi, Kotaro Funakoshi, Mikio Nakano : Nonparametric Bayesian Models for Spoken Language Understanding. Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing, pp.2144-2152, 2016.11

Figure of backchannel extraction

テキストアナリティクスの基盤技術に関する研究

自然言語テキストデータは,コンピュータにとっては記号の系列に過ぎませんが,これらはもちろんデタラメな記号の並びではありません. 統計的機械学習手法を用いて分析すると,記号の並びに様々な特徴的なパターンが隠れていることが分かります. 本研究室では,統計的分析の観点からテキストを分析し,対象のテキストの集合がもつ様々な性質を明らかにするテキストアナリティクスの基盤技術を提案しています. この技術を応用して,トピックの分析,ソーシャルメディアの分析,連歌を詠むAIなどの研究にも携わっています.

主要な関連論文

  • 西村 純, 若林 啓, 綿抜 豊昭 : 対話型連歌システムにおける文脈を考慮した句の返答手法の検討. 第36回人工知能学会全国大会論文集 (JSAI), 2022.6
  • 叶 少瑜, 若林 啓, 周 子楷 : 大学生のTwitter使用における感情表現,トピックと幸福感の関係. 電子情報通信学会誌研究報告(信学技報), Vol.121, pp.37-42, 2022.3
  • Kei Wakabayashi, Genkou Ou, Tetsuji Satoh : Analyzing Searching Behavior in Online Shopping Sites based on Product-Specificity of Query Words. International Journal of Service and Knowledge Management International Institute of Applied Informatics, Vol.4, No.2, pp.1-18, 2020.12
  • 福山 怜史, 若林 啓 : マイクロブログにおけるトピック出現量推移の高速な抽出. 情報処理学会論文誌データベース(TOD), Vol.12, No.4, pp.15-26, 2019.10
  • Makoto Hiramatsu, Kei Wakabayashi, Jun Harashima : Named Entity Recognition by Character-based Word Classification using a Domain Specific Dictionary. Proceedings of the 20th International Conference on Computational Linguistics and Intelligent Text Processing, 13 pages, 2019.4
  • Kei Wakabayashi : Segmentation-based Unsupervised Phrase Detection. Proceedings of the 20th International Conference on Information Integration and Web-based Applications & Services, pp.138-142, 2018.11
  • 福山 怜史, 若林 啓 : バースト現象を考慮したハッシュタグクラスタリング. 情報処理学会論文誌データベース(TOD), Vol.11, No.3, pp.35-46, 2018.10
  • Makoto Hiramatsu, Kei Wakabayashi : Encoder-Decoder Neural Networks for Taxonomy Classification. Proceedings of the 2018 SIGIR Workshop on eCommerce, 4 pages, 2018.7
  • 野沢 健人, 若林 啓 : トピックモデルに基づく大規模ネットワークの重複コミュニティ発見. 情報処理学会論文誌データベース(TOD), Vol.9, No.2, pp.1-10, 2016.6
  • 若林 啓 : HHMM変換を用いた左非循環PCFGの高速推論. 情報処理学会論文誌データベース(TOD), Vol.8, No.1, pp.45-54, 2015.3
  • 若林 啓 : 部分統語構造を考慮した階層的確率オートマトンに基づく教師なしチャンキング. 情報処理学会論文誌データベース(TOD), Vol.7, No.2, pp.61-69, 2014.6
  • Kei Wakabayashi, Takao Miura : Forward-Backward Activation Algorithm for Hierarchical Hidden Markov Models. Advances in Neural Information Processing Systems, Vol.25, pp.1493-1501, 2012.12

Figure of topic extraction

Human-in-the-loop機械学習に関する研究

現在は,人がAIに何かを教える(訓練する)には,大量のラベル付き訓練データを作成することが一般的ですが,この負担を限りなく小さくすることで,より多様な仕事をAIに任せられるようになると考えています. 本研究室では,Human-in-the-loopシステムによる機械学習モデルの効率的な構築手法や,教師なし学習・転移学習に基づく外部知識を活用した機械学習モデル構築手法,言葉で説明したりフィードバックを与えることで対話的に機械学習モデルを教える自然言語教示手法など,様々なアプローチでこの問題の解決を目指しています.

主要な関連論文

  • 清水 綾女, 若林 啓, 松原 正樹, 伊藤 寛祥, 森嶋 厚行 : システム1に駆動された質問生成に基づくヒューマンインザループによるシステム2の構築. 第36回人工知能学会全国大会論文集 (JSAI), 2022.6
  • Ayame Shimizu, Kei Wakabayashi : Effect of Label Redundancy in Crowdsourcing for Training Machine Learning Models. Journal of Data Intelligence, Vol.3, No.2, 2022.6
  • 小林 正樹, 若林 啓, 森嶋 厚行 : 人間+AI Crowdの相互作用によるタスク結果品質の管理手法. 日本データベース学会和文論文誌, Vol.20-J, No.2, 2022.3
  • Ryosuke Saito, Koga Kobayashi, Kei Wakabayashi : Efficient Training Method for Phrase Extraction Models using Natural Language Explanations. Proceedings of the 23rd International Conference on Information Integration and Web Intelligence, 2021.11
  • Fumimaro Odakura, Koga Kobayashi, Kei Wakabayashi : Active Learning for Extracting Technical Terms Covering Multiword Phrases. Proceedings of the 23rd International Conference on Information Integration and Web Intelligence, 2021.11
  • Koga Kobayashi, Kei Wakabayashi : Mitigating Effect of Dictionary Matching Errors in Distantly Supervised Named Entity Recognition. Proceedings of the 22nd International Conference on Information Integration and Web-based Applications & Services, pp.111-114, 2020.11
  • Masanori Kimura, Kei Wakabayashi, Atsuyuki Morishima : Batch Prioritization of Data Labeling Tasks for Training Classifiers. Proceedings of the 8th AAAI Conference on Human Computation and Crowdsourcing, pp.163-167, 2020.10
  • Koga Kobayashi, Kei Wakabayashi : Partial Annotation Scheme for Active Learning on Named Entity Recognition Tasks. Journal of Data Intelligence, Vol.1, No.3, pp.319-332, 2020.9

Figure of natural language supervision