人が様々な感覚器官で感じたことを言語化する際、同じ言葉を用いても人により意味するところが異なることがあります。個人による言葉の意味の違いは、対人関係における円滑なコミュニケーションを妨げるだけでなく、自然言語処理(NLP)にも支障をきたします。本研究では、語義の個人による差異を捉えるために、個人による単語意味表現のモデル化手法であるpersonalized word embeddingを提案します。本手法は、特定の自然言語処理タスクを用いて個人別に単語埋め込みを学習します。ここでは、意味と無関係なバイアスが単語埋め込みに混入することを防ぐため、レビュー対象の識別をタスクとして採用しています。RateBeerとYelpから取得した大規模レビューデータセットを用いた実験の結果、提案手法が対象項目の推定に有効であることが確認でき、獲得した personalized
word embedding からどのような単語に意味の差が大きく現れているかを分析しました。さらに提案手法により生成された単語埋め込みは、感情分析や文体変換のタスクにおいて有効であることを示しました。
研究成果
- Daisuke Oba, Shoetsu Sato, Satoshi Akasaki, Naoki Yoshinaga, Masashi Toyoda, Personal Semantic Variations in Word Meanings: Induction, Application, and Analysis, Journal of Natural Language Processing, 2020, Volume 27, Issue 2, Pages 467-490, Released on J-STAGE September 15, 2020, Online ISSN 2185-8314, Print ISSN