この記事が含む Q&A
- AIを使って自閉症の人の言語力を評価することが可能ですか?
- 大規模言語モデルを用い自然な会話からコミュニケーション能力を推定する方法が研究で示されています。
- AIの評価は専門家の評価とどのくらい一致しますか?
- GPT-4は安定性が高くICC0.97で専門家の評価と高い一致を示しました。
- この技術にはどんな限界がありますか?
- 会話量が少ない日や話すことが困難な人の推定には限界があり、判断基準の説明が難しい点もあります。
人がことばを使って気持ちや考えを伝える力は、毎日の生活の中で自然に見えるかもしれません。
しかし、自閉症のある子どもや大人にとって、表現することばの使い方はとても個性的で、その人の思わぬ強みや難しさが隠れていることがあります。
これまで、この「ことばの使い方」を丁寧に理解するためには、専門家が面接をし、保護者や支援者に話を聞き、その結果を評価表にまとめるという、時間と手間のかかる作業が必要でした。
ところが今回、スイスのロシュ・イノベーションセンター・バーゼルとアメリカのジェネンテックが共同で行った研究は、この長年の課題に対してまったく新しい可能性を示しています。
それは、「大規模言語モデル」と呼ばれるAI、つまりOpenAIのGPT-4を使って、自然な会話からその人のことばの力を客観的に評価するという方法です。
研究チームが目指したのは、従来のように“専門家が時間をかけて採点する方法”ではなく、“自然に話している会話だけから、その人の表現の力を正確に読み取る方法”をつくることでした。
AIが自動的に会話を読み取り、そこから日常生活でどの程度ことばを使いこなしているかを推定できれば、診断や支援の現場での負担が大幅に軽くなるだけでなく、本人の変化をより細かく、より自然な形で捉えられる可能性が広がります。
今回は、AIがつけた評価が、専門家の評価とどれくらい一致するのかを確かめるために、国際的な研究チームが大規模な調査を行いました。
対象になったのは、5歳から45歳までの自閉症のある人53名と、定型発達の人18名です。参加者は、自宅で家族やパートナーと普通に会話し、その会話を録音します。録音された会話はプロが丁寧に文字に起こし、GPT-4に読み取らせて分析しました。

AIにお願いしたのは、「この会話から、その人がどれくらい自分の気持ちや考えをことばで伝えられているか」を推定することです。
これは、人の生活スキルを調べるための検査(VABS)の中でも、日常生活で“自分の言いたいことをどれくらい伝えられているか”を測る重要な指標です。
研究で特に大切にしたのは、「誰を評価しても同じ基準で採点できるか」という点です。
つまり、AIの出す結果がブレず、安定しているかどうかです。
GPT-4は本来、状況によって答えが少し変わりやすい特徴があります。
そこで研究チームは、AIができるだけ同じ答えを返すように設定を少しずつ変えながら、同じ会話を何度も読み取らせました。
その結果、「AIがランダムに揺れ動かないようにした設定」にすると、何度試してもほとんど同じ点数が返ってくることがわかりました。
専門家どうしでも採点が完全に一致するわけではなく、一般に一致率はICC 0.82ほどですが、GPT-4はICC 0.97という非常に高い安定性を示しました。
さらにすごいことに、GPT-4が“ふつうに話している会話”だけを読み取ってつけた点数は、専門家が行う正式な検査(VABS)で出た点数と、とてもよく一致していました。
その一致の強さを示す数値は0.65以上で、これはかなり高いレベルです。
つまりGPT-4は、単に会話の“量”を見るのではなく、
・会話の流れ方
・文のまとまり
・話題への反応のしかた
・説明の組み立て方
といった、ことばの使い方の“質”まで総合的に読み取っていると考えられます。
さらに今回の研究では、AIに「この人は自閉症です」という情報をあえて知らせない条件も試されました。
しかし、その場合でもAIの予測はほとんど変わりませんでした。
これは、AIが「自閉症かどうか」ではなく、あくまで「会話の内容に表れているコミュニケーションの力そのもの」を評価していることを示しています。
この点は、先入観による偏りが入りにくいという意味で、とても重要な特徴です。
評価がより公平になり、倫理的にも望ましいアプローチといえます。

一方で、研究には課題も見えています。
たとえば、参加者の中には、会話に意欲的でない日があり、その結果だけを見ると実際のVABSスコアを大きく下回るケースもありました。
つまり、短い会話だけでその人全体の力を完全に推定することには限界があります。
しかし、この「日によって変わる」という特徴は、人が生活の中で見せる自然なゆらぎでもあり、その変化を連続的に捉えられるのはAIによる日常データ分析の強みともいえます。
また、今回のAI解析はすべて文字起こしされたテキストを使って行われています。
研究チームは現在、最新の音声認識技術を取り入れれば、会話の録音から自動で文字に起こし、ほぼリアルタイムで解析できると考えています。
そうなれば、本人や家族、支援者の負担をほとんど増やさず、継続的にコミュニケーションの変化を追いかけることが可能になります。
研究の結果、GPT-4は以下の点で大きな可能性を示しました。
・自然な会話から、専門家の評価に近い精度でコミュニケーション能力を推定できる
・評価のゆらぎが少なく、条件が同じであれば何度でも安定した結果が出る
・単純な言語指標ではなく、会話の質や文脈のつながりなど、高度な特徴を総合的に判断している
・特別な訓練がなくても、日常の会話だけで評価が可能
・自閉症かどうかを前提とせず、その人が自然に話している内容から能力を読み取る
こうした結果は、コミュニケーションの評価方法を大きく変える可能性があります。
従来の評価は時間も労力もかかり、保護者や本人の記憶に依存する部分もありました。
それに対してAIの良さは、「日常そのものをデータとして扱える」点です。
会話は生活の中で自然に生まれ、本人にとっても負担が少なく、むしろ気楽に取り組めるものです。
そこから得られたデータが、支援の方向性を見つけたり、小さな成長を見逃さずに捉えたりするための大きな助けになるかもしれません。
研究チームは、この手法が自閉症だけでなく、さまざまな発達・神経の特徴に関わるコミュニケーションの評価に応用できると考えています。
さらに、AIは「単に点数を出す」だけではなく、会話中にどのような特徴が見られたのかを言語化する力も持っています。
実際、GPT-4は会話の中から「話題の持続」「説明の工夫」「会話のキャッチボールのリズム」「興味の広がり方」などを読み取り、特徴をまとめることもできました。
これは、支援の現場で「その人の強み」を可視化するうえで非常に有用な可能性があります。

もちろん、この研究にも限界があります。
たとえば、話すことが難しい人や、会話の量が極端に少ない人の評価には、まだ別の工夫が必要です。
また、AIがどの特徴をどこまで重視しているかは“ブラックボックス”であり、その判断基準を完全に説明することはできません。
しかし、専門家が見落とすかもしれない微細な特徴を捉える力をもつ点は、大きな価値といえます。
今回示されたのは、“AIが専門家の代わりをする”という話ではありません。むしろ、“AIが日常の会話という豊かなデータを拾い上げ、専門家の見立てを補い、より客観的で継続的な視点を提供する”という新しい評価スタイルの可能性です。
とくに自閉症のある人のコミュニケーションは、環境や関係性、安心感によって大きく変わることがあります。
その変化を自然に、多面的に、日常のまま捉えられる技術は、本人にとって負担の少ない支援につながっていきます。
コミュニケーションは、単なる能力ではなく、その人らしさの中心にあるものです。
AIはその“らしさ”を消すのではなく、むしろ見えにくかった魅力や得意をそっと照らし出す補助線になってくれるかもしれません。
研究チームは、このAI技術が将来「デジタル臨床家」として、より迅速で公平な評価を提供する存在になる未来を想定しています。
今回の研究は、その未来へ向けた大きな一歩でした。
自閉症のある人々のコミュニケーションをより深く理解し、日常の中にある小さな成長や努力を見逃さずにすくい上げるために、AIは強力なパートナーになり得るという希望を示しています。
そしてそれは、本人、家族、支援者にとって、より安心して暮らせる社会をつくる手がかりになるはずです。
(出典:Nature Scientific Reports DOI: 10.1038/s41598-025-26944-8)(画像:たーとるうぃず)
AIが、ますます困難をかかえる人を助けることに活躍することを願っています。
自閉症の人の心の理解力を育む。ChatGPTは心理士と同精度
(チャーリー)




























