不眠症が脈拍からわかる!?リストバンド型ウェアラブルデバイスを活用した睡眠障害の予測モデルの提案!!
3つの要点
✔️ 睡眠障害のスクリーニングと健康モニタリングを目的とした、在宅睡眠モニタリング、特に手首に装着するウェアラブルデバイスデバイスによる光電式容積脈波—photoplethysmography: PPG—を用いた手法に注目が集まっている
✔️ 本研究では、睡眠に関連した大規模なデータセットから睡眠のステージ分類をおこなう学習モデルの構築を目指す
✔️ 評価の結果、PPGとECGのベースラインモデル—ECGデータのみ、またはPPGデータのみを活用した推定モデル—と比較し、学習モデルがより高い性能を持つ結果となった
A deep transfer learning approach for wearable sleep stage classification with photoplethysmography
written by Mustafa Radha, Pedro Fonseca, Arnaud Moreau, Marco Ross, Andreas Cerny, Peter Anderer, Xi Long Ronald M. Aarts
(Submitted on 15 Sep 2021)
Comments: npj Digital Medicine
本記事で使用している画像は論文中のもの、紹介スライドのもの、またはそれを参考に作成したものを使用しております。
背景
ウェアラブルデバイスにより、睡眠状態を予測できるのか?
本研究では、睡眠障害の改善を目的として、ウェアラブルデバイスに基づく、睡眠状態を分類する学習モデルの構築、を目指す。
睡眠不足は、健康障害—i.g. 体重増加、全身性炎症—と関連があることが指摘され、これら疾患の予防のため、家庭での睡眠評価・検証の重要性が増加している:こうした睡眠評価には、長期的なモニタリングが有効とされ、これらの評価指標により、睡眠評価のゴールドスタンダードである、睡眠ポリグラフ—polysomnography: PSG—での検証をより正確におこなうことができる;一方、これらデータセットから異なる睡眠段階—急速眼球運動:REM睡眠、N1、N2、N3—を識別することは困難であるとされ、家庭での睡眠評価を向上させるため、これらの睡眠状態を自動的に検出する方法の確立・構築が求められている。こうした中、先行研究から、心拍変動—Heart rate variability : HRV—が、PSG の代用として機能しうることが示されている—自律神経系は、睡眠段階の進行と相関があるため、自律神経活動におけるHRVの測定により、睡眠段階の推定が可能となることが考えられる。そのため、HRV の特徴を睡眠段階に変換することを目的として、ECGデータおよび特徴を把握する学習モデルに注目が集まっている。
本研究では、ECGデータに基づき、時系列解析モデルを用いて学習し、睡眠スコアリング指標に基づき、転送学習を導入した睡眠状態の分類モデルの構築、を目指す:時系列解析モデルとして、LSTMを用い、また、大規模なECGデータセットでの学習、および、小規模なPPGデータセットでの転送学習、また、これらデータに基づく、ベースモデルとの比較・検証をおこなう。
ウェアラブルデバイスとは?
初めに、本研究の解析対象である、ウェアラブルデバイスについて簡単に解説する。
ウェアラブルデバイスは、被験者が実際に身に着けて使う情報機器の総称を指す。ウェアラブルは、着用できる・身に着けられる、という意味で、リストバンド・腕時計型、眼鏡型などが存在する。これらの機器は、実際に着用することができるため、運動中から入浴中、睡眠中など日常生活の多くの場面で利用できる—ジョギングやスイミングなどといった運動記録や、心拍や脈拍、睡眠時間などを捕捉して健康情報を取得することに有効である、と考えられる。
手法
ここでは、本研究における提案手法の概要について述べる。
データセット・提案モデル
評価では、2つのデータセットを使用している:1つ目は、292人の参加者から、ECG・PSG信号から、睡眠スコアリングをおこなった大規模なデータセット;2つ目は、60人の参加者を対象とした、PSG・PPG・AASMに基づくアノテーションをおこなったデータセットである—このデータをもとに転移学習を実行している。また、提案モデルでは、時系列解析における深層学習モデルとして、LSTM—Long short-term memory—に基づいた時系列解析をおこなっている—下図参照。
このモデルの構成要素は以下の通りである:ドメイン層;Temporal層;決定層。ドメイン層は、パーセプトロンで構成され、入力への重み付け・選択、表現におけるコンパクトな結合に使用される。この層では、時間ステップごとに32個のベクトルを保持する。このベクトルは、時間ステップごとに生成される—ドメイン層では、|𝑋’|=32のベクトル{𝑋’1, ..., 𝑋’𝑛}のシーケンスを生成する;Temporal層は、LSTMスタックで構成される—このスタックでは、シーケンス{𝑋’1,...,𝑋’𝑛}を取り込み、各タイムステップで128の特徴量を生成する。ここでは、過去・未来の両方から、短・長期のフィードバックをおこない、時間情報が考慮される;決定層は、2つのレベルのパーセプトロンで構成される:最初のレベルでは、Tempral層の出力に対する次元削減—サイズ128のベクトルをサイズ32に削減—をおこない、最終層では、4つのsoftmax による出力を生成する:出力は、各タイムステップで合計が1になるように設定される—これらは時間ステップごとに生成され、その結果、すべてのエポックに対応する睡眠段階確率が出力されることになる。また、過学習の抑制をおこなうため、各訓練において、ドロップアウトを適用した。提案モデルでの損失関数には、カテゴリカルクロスエントロピーを用いた。
また、転移学習において、提案モデルにおけるTemporal層を芋な対象として導入を実施する:この層は、モデル重みの大半—96.6%—を占めるため、小規模なデータセットでの学習が困難である可能性が高い。そのため、転移学習を対象として扱うことで、より少ないデータセットにおいても学習を的確におこなうことができる;一方、ドメイン・決定層は、転移学習後、再度訓練をおこなっている:ドメイン層は、入力をECGモデル適応するように調整、また、決定層での学習により、入力とラベルにおけるマッピングをおこなう。これらプロセスでは、ソースモデルの層を凍結し、Four-fold クロスバリデーションにより、訓練・検証が実施される。これらの3つの転移学習モデル—ドメインモデル、決定モデル、複合モデル—では、訓練対象となる層によって名称が定義される。
結果
このセクションでは、提案モデルに対する評価について解説する。
提案手法の比較対象である、二つのベースモデル—ECG・PPGのベースモデル—における性能を下記に記す:ECGのカッパ係数—同じ対象に対して複数の評価モデル間における一致度—は0.62、推定精度は74.83%;PPGでは,カッパは0.57,精度は71.88 —下表参照。
また、転移学習として3つの学習モデル—ドメイン層に対する学習、決定層に対する学習、ドメイン+決定層の両方に対する組み合わせ学習—について、評価をおこなった:その結果、ドメイン・決定層の両方を対象として学習をおこなったモデルにおいて最も高い性能を獲得した—下表参照。
3つの伝達学習条件と2つのベースラインにおける性能分布—下図参照—から、転移学習を用いた結合学習が最も性能が高いことがわかる。
また、睡眠段階別のF1スコア—下図参照—から、複合アプローチの性能を比較した。
その結果、提案モデルにおける、睡眠時の F1 は 0.71 となり、ECG・PPGよりも有意に高い結果となった。同様に、REM 睡眠・N1/N2・N3においても、提案モデル—ドメイン+決定層の学習モデル—のF1スコアは0.74となり、ベースラインモデルよりも高い性能を達成していた。
考察
本研究は、睡眠モニタリングに基づき、PPGを活用した睡眠段階に対する分類の転移学習モデルの構築・検証をおこなった。このアプローチでは、睡眠に関する大規模データセットを用いて、深層ニューラルネットワークモデル—時系列データ解析—を事前学習し、その一部をPPGに適合させる形で構築をおこなっている。事前学習には、ECGベースのHRV特徴が利用可能なデータセットを活用した。評価結果として、3つの転移学習モデル—ドメイン層に対する学習モデル、決定層に対する学習モデル、ドメイン層・決定層に対する学習モデル—では、PPG・ECG単体のベースラインモデルよりも高い性能であることが示唆された。こうした結果から、PPGデータセットにおいて、事前学習なく構築されたモデルではモデル性能がより低い傾向にあった—PPGのデータセットが十分でないことが推察された。
本研究の評価結果では、3つの転移学習モデルのうち、複合アプローチ—ドメイン層+決定層の学習モデル—が最も高いパフォーマンスを達成した。関連研究では、学習モデルのソフトマックス/決定層のみが再トレーニングされていた—他の層は考慮されなかった—ため、本結果より、ドメイン層を含めた学習をおこなうことも必要である、ことが示唆された。これら結果を活用することで、家庭での心拍値に基づき、睡眠状態を分類できるモニタリングシステムの実現が期待される。
一方課題として、下記のようなものが挙げられる:睡眠段階での分類;睡眠時無呼吸症候群に対する評価;健康状態以外の評価。本研究では、通常の5 段階の睡眠段階でなく、4 段階での分類評価を設定している:理由として、PSGに基づく評価にて、評価者間一致度はN1—覚醒から睡眠への過渡期—が最も悪く、評価者バイアスが発生するためである。一方、入眠における睡眠障害の事例も報告されているため、これら分類では不適切な場合が存在する可能性もある;そのため、提案モデルにおける5段階分類での評価性能も明確化する必要性がある。また、睡眠障害のうち、患者数の多い睡眠時無呼吸症候群、に対する評価を明らかにする必要がある。睡眠呼吸障害は、睡眠構造を乱し、さまざまな生活習慣病—i.g. 狭心症、心筋梗塞—と関連があることが指摘されている;そのため、無呼吸-低呼吸指数—AHI—により測定される睡眠時無呼吸症候群に対して、重症度分類をおこなうアルゴリズムの性能を明確化することが必要である。加えて、本研究における解析対象者が、健康である—睡眠障害がない—ことも課題として考えられる:提案モデルにおいて、睡眠障害を持つ人に対する推定性能が不明瞭である。そのため、こうしたケースサンプルに対する性能が低い可能性もあるため、より頑健なモデル性能を構築することも必要であることが推察される。
この記事に関するカテゴリー