機械学習を用いた会話コーディング

【医療×ICT. Apr. 2019】

Idalski Carcone, April, et al. "Developing machine learning models for behavioral coding."Journal of pediatric psychology44.3 (2019):289-299.

P: study1:37名の思春期のアフリカ系アメリカ人の肥満児 (12-17歳)とその保護者に対して行なった肥満に関する「動機づけ面接法」を用いた面接
study2:80件の25歳以下のHIV患者の外来
E: 機械学習モデルを用いて、面接内容のコーディングを行う
C: 人による面接内容のコーディング
O: 正解率、適合率、再現率、F値、カッパ係数

※動機づけ面接法:支援者の価値観を押し付けるのではなく、来談者と協働し、来談者自身が自ら変わりたいという理由を引き出し、特定の目標に向かってその動機を強化するように設計された面接法
※F値=2再現率*適合率/(再現率+適合率)

結果のまとめ

・Naive Bayes, Naive Bayes-Multinomial, J48, AdaBoost, Random Forest, DiscLDA, Convolutional Neural Network, support vector machine (SVM)の8つの機械学習モデルが用いられた。
・study1において機械学習モデルをトレーニングし、study2へ適用できるかを評価した。
・study1において、SVMが最も優れた結果を出し、思春期の子どもとカウンセラーとの間の会話で、F値は、.680, 保護者とカウンセラーとの間の会話で、.639であった。
・study1において、SVMを用い、発話が持つ意味や文脈を考慮する作業を追加で行うことで、思春期の子どもとカウンセラーとの間の会話で正解率は75.1%、保護者とカウンセラーとの間の会話で73.8%と改善が見られた。
・study2において、発話が持つ意味や文脈を考慮する作業を追加したSVMを用いた結果、正解率は72.0%, 人によるコーディングとのカッパ係数は.663であった。
・筆者らは今回の結果は、人の手間が多くかかるコーディングの作業において、機械学習を用いることで作業をより効率化できる可能性を示唆した、と述べている。

原文へのリンク

Naoya Hashimoto Written by:

小児科医、公衆衛生修士、株式会社Kids Public 代表取締役。2009年 日本大学医学部卒。聖路加国際病院にて初期研修。国立成育医療研究センターにて小児科研修。東京大学大学院医学系研究科公共健康医学専攻 修士課程修了。