【医療×ICT. Apr. 2019】
Idalski Carcone, April, et al. "Developing machine learning models for behavioral coding."Journal of pediatric psychology44.3 (2019):289-299.
study2:80件の25歳以下のHIV患者の外来
E: 機械学習モデルを用いて、面接内容のコーディングを行う
C: 人による面接内容のコーディング
O: 正解率、適合率、再現率、F値、カッパ係数
※動機づけ面接法:支援者の価値観を押し付けるのではなく、来談者と協働し、来談者自身が自ら変わりたいという理由を引き出し、特定の目標に向かってその動機を強化するように設計された面接法
※F値=2再現率*適合率/(再現率+適合率)
結果のまとめ
・Naive Bayes, Naive Bayes-Multinomial, J48, AdaBoost, Random Forest, DiscLDA, Convolutional Neural Network, support vector machine (SVM)の8つの機械学習モデルが用いられた。
・study1において機械学習モデルをトレーニングし、study2へ適用できるかを評価した。
・study1において、SVMが最も優れた結果を出し、思春期の子どもとカウンセラーとの間の会話で、F値は、.680, 保護者とカウンセラーとの間の会話で、.639であった。
・study1において、SVMを用い、発話が持つ意味や文脈を考慮する作業を追加で行うことで、思春期の子どもとカウンセラーとの間の会話で正解率は75.1%、保護者とカウンセラーとの間の会話で73.8%と改善が見られた。
・study2において、発話が持つ意味や文脈を考慮する作業を追加したSVMを用いた結果、正解率は72.0%, 人によるコーディングとのカッパ係数は.663であった。
・筆者らは今回の結果は、人の手間が多くかかるコーディングの作業において、機械学習を用いることで作業をより効率化できる可能性を示唆した、と述べている。
原文へのリンク