深層学習による斜視眼の自動判定アルゴリズムの提案！

medical 2022年06月23日

3つの要点
✔️ スマートフォンの普及により、後天的な発症が増加している斜視眼—斜視—は、白内障といった重篤な目の疾患や脳神経障害との関連があると指摘されている。特に幼少期における発症率が高いことから、予後改善などの実現のために早期発見が重要である。
✔️ 本研究では，視線の写真・深層学習アルゴリズムに基づき、斜視眼をスクリーニングする深層学習—DL—モデルの構築・検証をおこなう。
✔️ 評価結果として、area under ROC curve— AUC—は約0.99であった：94.0%の感度と99.3%の特異性を達成していることが確認された。

Detection of Referable Horizontal Strabismus in Children's Primary Gaze Photographs Using Deep Learning
written by Ce Zheng; Qian Yao; Jiewei Lu; Xiaolin Xie; Shibin Lin; Zilei Wang; Siyin Wang; Zhun Fan; Tong Qiao
(Submitted on January 2021)
Comments: Translational Vision Science & Technology

本記事で使用している画像は論文中のもの、紹介スライドのもの、またはそれを参考に作成したものを使用しております。

背景

深層学習によって、専門医以上の経験を埋めることができるのか？

本研究では、スマートフォンの普及により急増している、斜視眼の自動分類アルゴリズムの開発、を目指す。

斜視—斜視眼—は、両眼におけるズレ—右目と左目が異なる方向を向いている状態—であり、特に小児に影響を及ぼす眼科疾患と考えられている：小児では、内斜視・外斜視を含む水平斜視が最も多く、小児弱視の最も一般的な原因であるとされている。また、明らかな斜視を持つ子どもは、見た目上の問題などから、心理社会的な後遺症—i.g. 自信の低下や自尊心の不安—を持つ可能性が高いとされる；一方、こうした斜視の診断では一定以上の技量・専門性が必要となることから、これら疾患を診断できる専門医—特に小児眼科医—が限られている。

本研究では、臨床評価時に撮影された一次視線写真から、主に小児と対象とし、水平方向の斜視をスクリーニングする深層学習モデルの構築・検証をおこなう。モデル構築においては、画像解析にて頻繁に活用される畳み込みニューラルネットワーク—convolutional neural network: CNN—に基づき、外部データセットによる検証もおこなっている。

斜視眼とは？

初めに、本研究の解析対象である、斜視眼—斜視—について解説する。

斜視眼—斜視—とは、右目と左目が違う方向を向いている—両眼の視線が正しく見る目標に向かわない—状態をさす：外見上は、片方の目が正しい方向を向きつつ、もう一方が内側・外側、上下に向いた状態である。こうした状態—眼の位置がずれる状態—により、両眼で正しくものを見ることが困難になる：具体的には、立体感をつかむことが困難になる—両眼視機能異常—、片側の視力発達が妨げられる—斜視弱視—といったことが生じる。また、これら症状から、幼児期での視力の発達における弱体化—弱視—、物が二つに見える—複視—、美容的な問題、疲れやすいなどの問題が発生する。

近年では、スマートフォンの普及から、デジタル機器使用による後天性内斜視—スマホ内斜視—が問題視されている。通常、ヒトの目は、近くを見るときに、視線を内方に向け、ピントを合わせる一方、近くから遠くに視線を移すときには内よせが緩む。この疾患は、過剰なスマフォの使用により、こうした内よせのコントロールが困難になっている状態である。こうした、デジタル機器利用による斜視の悪化は若年層—とくに12歳以下の低年齢層—で多いとされ、2018年以降、患者数の増大が指摘されている。

手法

データセット

本研究では、2013年から2019年における、合計7530枚の一次視線写真—斜視3330件と正視4200件—で構成されるデータセット—SCHデータセット—を対象とした。各画像は、3人の専門医によって検査され、いずれかの眼科医が画像を非勾配性—視覚的に斜視を検出できない—と判断した場合、データセットから削除された。その結果， 7026 枚の画像—正視 3021 名の正視画像 3829 枚，斜視2772 名の斜視画像 3197 枚—を獲得した。また、対象となる患者は、手術を受けた原発性水平斜視児と，SCHで定期的に屈折検査を受けた正視児であった。また、斜視は下記のように定義した：定常的な乳児内斜視（≥ 40 PD—瞳孔間距離—）、完全な遠視矯正を行った場合の収容性遠視の残存（> 10 PD）、完全な遠視矯正後に起きている時間の50％以上に発現する間欠的または乳児外斜視（> 15 PD）。また、制限性斜視、感覚性斜視、麻痺性斜視、重症筋無力症、眼振、Duane症候群、を持つ対象者を除外した。写真はすべて，市販のカメラ（D800；株式会社ニコン，東京）にペントーチを取り付け，被験者から1mの距離で撮影し、主注視写真のみを収集した。

評価環境

評価では、トレーニング—80%—とバリデーション—20%—に分割した：全体を5グループに分割し，4グループを訓練，1グループを検証用に用いた。また、学習プロセスを1000回繰り返した。また、モデル性能は，精度，感度，特異度，受診者動作曲線下面積—are under ROC curve: AUC—を用いた。また、外部データセットとして、斜視133例、正常144例の277例の一次視線写真—JSIECデータセット—に基づき評価をおこなった。

提案モデル

提案モデル—下図参照—として、2段階の深層学習を活用した：まず、一次視線を検出・識別し、次に斜視と正視に分類した。前者では、関心領域—region of interests: ROI—を検出するためFaster R-CNNを用いて抽出をおこなった。Faster R-CNNは、位置・サイズ情報から構成されるバウンディングボックスを定める物体検出アルゴリズムの一種である。こうして抽出された画像は専門医によってマニュアルで確認され、必要に応じて補正—両眼を水平位置に調整—をおこなった；第二段階では、ImageNet26—100万枚以上の画像—で事前学習した3アーキテクチャ—VGG16, Inception-V3, Xception—に基づき、転移学習をおこなう。また、画像画素を 0 から 1 の範囲の値に再スケーリングし、299 × 299 の行列を埋めるように補間している。学習には、Adam optimizer—学習率0.0001—と、ミニバッチ勾配降下法—サイズ32—を使用し、10エポックのEarly-stoppingを使用した。DLアルゴリズムの学習手順をより可視化するため、クラス活性化マップ—class activation map: CAM—を用い、DLアルゴリズムの識別水準に関連する画像領域の明確化を目指した。

また、人の専門家による判定には外部検証データセットを使用し、小児科と斜視の臨床経験が3年以上ある3人の研修眼科医を対象として、各テスト画像を独立して決定するように指示した—斜視眼の識別では、瞳孔の中心から最初のプルキンエ像—角膜光反射による反射パターン—のズレを活用している。

結果

このセクションでは、本研究での評価について解説する。

評価において、本研究では、Faster R-CNNによる処理をおこない、画像上のROIのみを抽出した。また評価にあたり、トレーニング・検証データセットを活用してFive-fold cross validationによる学習—下図参照—をおこない、外部データセットを活用してモデル性能を検証した—下表参照。

その結果、深層学習を活用したモデルについて、5-fold cross validation による平均AUCは、下記のようになった：InceptionV3：0.993；VGG16：0.993；Xception：0.991。また、外部検証データセット—JSIEC—に基づいた、分類性能は、感度0.94、特異度0.99であった—下表・下図。深層学習モデルでは、感度・特異度の両方において、眼科医の診断精度よりも高い数値であることが確認された。

また誤分類された画像—下図参照—から、Off center—頭の傾きにより子供の眼を中心に表示できない状態—や、画質不良—角膜の光の反射が弱い画像—の理由により、分類が失敗していることが確認された。

考察

本研究では、視線の写真に基づき、斜視のスクリーニングを高い精度で自動診断可能な深層学習モデルを構築・検証した。スマートフォンなどの普及により、急激に患者数が増大しているスマフォ内斜視などをはじめとする斜視眼では、臨床評価におけるコスト、また、専門性が課題とされていた。そこで、本研究では、一次写真—i.g. スマートフォンなどによる写真—を想定し、深層学習を活用した自動スクリーニングモデルの構築・検証をおこなった。モデル評価では、外部データセットに基づいた検証をおこない、専門医による診断制度よりも高い精度—AUC：0.997、感度：94％、特異度：99.3％—の達成を確認した。こうした背景から、本研究は、将来、斜視検出をおこなうDLのベースラインとなることが期待される。

また、誤判定症例において、半数近く—49.1％—がoff-center—頭の傾きにより眼が中心に表示されない—が要因であり、次に、画質の悪さ—i.g. 角膜の光反射が弱い—であった；そのため、今回の評価における誤判定の要因は、提案モデルによる性能でなく、写真撮影における手法の課題であった；こうした課題に対する解決策として、画像の事前処理—i.g. 平滑化フィルタリング—を活用し、提案モデルの入力とすることが想定される。

一方、課題として下記のようなものが挙げられる：第一に、対象データセットの大部分は手術を受けており、選択バイアスの可能性が推察される—そのため，間欠性外斜視や眼振などの角度偏差の変動範囲に関する性能は正確ではない可能性が高い；第二に，活用したデータの大部分は、中国系民族を対象としているため，異なる他民族に一般化できるか、を検討する必要がある；第三に、患者は撮影時に眼鏡を着用していない—メガネをかけると斜視の角度が変化する可能性があった—ため、メガネのある画像における性能を追加検証する必要がある。