メンタルヘルス

SNSからの自殺リスクの高い文章の抽出とサマリ生成 

本研究では、自殺リスクの裏付けとなる証拠を提供するために、教師あり抽出言語モデルと生成言語モデルを統合する手法を提案する。我々のアプローチは3つのステップから構成される。まず、文レベルの自殺リスクと否定的感情を推定するためのBERTベースのモデルを構築する。次に、自殺リスクと否定的感情の両方の高い確率を強調することで、自殺リスクの高い文章を正確に特定する。最後に、MentaLLaMaフレームワークを用いた生成的要約と、特定された自殺リスクの高い文章からの抽出的要約、および自殺リスクの高い単語の専門辞書を統合する。私たちのチームSophiaADSは、CLPsychのSharedTaskにおいて、ハイライト抽出で1位、要約生成で10位を獲得した。

病みツイートからのオノマトペの抽出とメンタルヘルスとの関係性の解明

本研究では、メンタルヘルスの不調に関するSNS投稿いわゆる「病みツイート」に特有のオノマトペを抽出し、メンタルヘルス文脈で使われる単語との関係性を解明する。まず、既知のオノマトペ(「イライラ」「ドキドキ」など)に加え、メンタルヘルスの文脈で新たに登場したオノマトペ(「ヘラヘラ」「ガタガタ」など)も抽出した。次に、メンタルヘルス関連の単語を複数手法により抽出し、その単語と共起するオノマトペをLDAによりトピック分類した。トピック分類結果からオノマトペはメンタルヘルス不調に伴う身体感覚や心的経験に関する単語と共起しており、オノマトペからメンタルヘルスの不調を推定できる可能性があることを示した。

LLMを用いた日本語投稿からのメンタルヘルス不調判定

本研究では、大規模自然言語モデルを用いてSNS投稿からメンタルヘルスの状態を推定する手法を提案する。短文投稿SNSサービスXからメンタルヘルス関連の単語を含む日本語の投稿を収集した。投稿者のメンタルヘルスの不調の有無のアノテーションを3名で行いその多数決によりラベルを決定した。ラベル付きの投稿データを教師データとして日本語BERTのファインチューニングを行った。機械学習による分類結果に比べ、BERTは正解率が10%程度向上した。この結果から、大規模テキストデータによって事前学習したモデルがメンタルヘルスの不調の推定タスクの精度向上に寄与する可能性を示した。



スマートフォンからのメンタルヘルスの不調推定 

本研究では、スマートフォンのログ情報から抽出した実世界とオンラインの行動特徴を用いて、ストレスレベルの変化を予測する。スマートフォンのデータを用いたストレス検知に関する先行研究では、単一の特徴量に着目し、全ての特徴量を同時に考慮していなかった。我々は、生のセンサーデータをカテゴリー特徴に変換することで、ユーザーの実世界とオンラインの行動特徴の共起組み合わせを抽出する手法を提案する。我々は、State Trait Anxiety Inventory (STAI)を用いて、20人の健康な参加者の不安関連ストレスレベルを評価する実験を行った。参加者はスマートフォンにログ収集アプリケーションをインストールし、1ヶ月間、1日1回STAIの質問に回答した。提案手法のFスコアは74.2%であり、単一の非結合特徴量を用いた先行研究のFスコア(70.2%)より4.0%高かった。この結果は、スマートフォンのログデータから抽出した複合特徴量を用いて、不安に関連するストレスレベルを予測できることを示しした。