2018年9月に全5回のシリーズで、健康経営にありがちなまちがいに警鐘を鳴らしました。
そもそも健康経営と健康管理は全く別物ですが、従業員の健康管理として機能する健康経営施策はあります。健康経営はひとつの経営哲学なので、その哲学をもって、企業が労働安全衛生法に従って従業員の健康管理を行えば、その健康管理実務は健康経営施策です。
ところが、不良品を取り除く検品作業と健康管理を混同してしまう経営者が多く、その態度は健康経営哲学とは正反対です。従業員への適切な業務支援につながらない健康管理は、今すぐやめましょう。
第1回 組織の正義 Organizational Justice
Organizational Justice 組織の正義
とはいえ、健康経営の本質から遠いサービスを提供する、自称健康経営支援ビジネスが乱立しています。適切なサービスで従業員の健康を向上し、結果として組織の収益を上げましょう。
健康経営哲学における最重要概念は『組織の正義【0rganizational Justice】』です。 従業員は組織の正義を知覚すると信頼を高め、自律的に健康を向上します。
だからこそ、法定健診やストレスチェックという法定項目を検品作業としてではなく、正義の体現として実施してください。
法定健診の目的は、1)医学的な視点による就業判定、2)労働災害の早期発見および防止、そして3)職業関連性疾患の検出であり、ストレスチェックの主目的はストレスレベルの自覚によるメンタルヘルス不調の一次予防です。
正義といっても、特別なことをする必要はなく、最低限の目的を果たせれば、実施費用や実施時間などのコストを最小にすることを目指すのは、たいへん優れた健康経営戦略です。 一方で、法定外項目や豪華な弁当などを足しても、目的から遠ざかり、コストだけが膨らみます。
健康経営はけっして、福利厚生費で黒にんにくや水素水を購入するような、「健康関連の余計なアレコレをつけくわえる」ものではなく、目的を明確にした上で、公正で合理的な経営判断をする態度、すなわち組織の正義を従業員に広く示すことで、従業員の信頼を勝ち取り、組織の収益拡大につなげるための哲学です。
健康診断やストレスチェックを職場の健康ハイリスク者のスクリーニングと捉えるサービスが多いので、多くの経営者は誤解するようです。スクリーニングは、検出したハイリスク者に対してハイリスク戦略を行う目的で行うもので、その検出力によほどはっきりとした科学的エビデンスと妥当性がないのなら、非医療機関で健康ハイリスク者の検出を行うべきではありません。ましてや、明確にハイリスク者のリスクを低減できるハイリスク戦略の計画がなければ、どんなに検出力の高いスクリーニングも無用です。
無機物対象の検品作業では、基準値を設け、基準範囲から逸脱する品物を廃棄したり、基準値に収まるように修正したり、価格を下げたりしますが、いずれにせよ、コストによって検品や対策を選択します。コストが一緒なら、不良品なのに標準と誤る偽陰性や、標準なのに不良と誤る偽陽性のどちらもないように完璧に検出するスクリーニングが望ましいですよね。
同様に健診やストレスチェック結果によって、従業員の健康レベルに「不良」や「訳アリ」のラベルを付けて、その後、どのような対策を行うつもりでしょうか。
2020年、メタボ健診後の特定保健指導に、メタボ・ハイリスク者のリスクを低減する効果がないことが科学的に確かめられました。臨床医であり、公衆衛生家である私には、全く驚くべき内容ではありませんでした。
経営者が、「いいと思ってやっていたのに」と嘆くのは勝手ですが、従業員は「『思った』だけの判断で、私は大切な時間を使って、効果のない説教を聴かされたの?」、「なぜ、しっかりと妥当性を検証しないの?」、「普段の業務指示も、そんな場当たり的で属人的に、『いいと思った』から発されているの?」と不信感を募らせます。
健康関連以外の設備投資なら、しっかりと妥当性を検証して、類似サービスを比較検討しますよね。
思いが先に走り、興味本位で健康ハイリスク者をあぶりだすことは、愛する配偶者の浮気を見張るため、興信所を使うようなものです。素晴らしい夫婦になりたい、もっと相手を理解したい、愛しているからこそ浮気をされたくない気持ちはわかりますが、興信所には浮気を予防する機能も愛を深める能力もありません。浮気があろうとなかろうと、夫婦と関係のない機関に自分の生活を探られたという事実を知ったとき、相手は愛されていると実感することはなく、急速に愛と信頼を萎えさせていくでしょう。
健康経営施策の選択は、組織の公正性を従業員に広く実感させる最高のチャンスです。 たとえば名義貸しだけの産業医に払う報酬は、労務の代償とはいえませんから、そもそも報酬というよりおこづかいのようなものです。自分が汗水垂らして働いて得た企業の利益が、名ばかり産業医のおこづかいになっていると知って喜ぶ人間はいません。社長の愛人へのお手当と印象は一緒です。それどころか愛人は社長のパフォーマンスをあげるかもしれませんが、名ばかり産業医は誰のパフォーマンスも上げません。従業員は企業の資本に寄与していますから、その使い道によって企業への信頼が変化します。
従業員の中で健康ハイリスク者を見つけたい経営者は、事前にリスクを見つけてそのリスクを取り除いてあげたいと考えるのでしょうが、確実にそのリスクを取り除ける自信がある場合のみ、従業員に同意を得た上で行なってください。
たとえば喫煙は大きな健康リスクです。しかし、見つけて指導してもリスクは低減しません。本人が行動変容をして、受動喫煙も含め完全に禁煙しなければ、喫煙によるリスクは除外できません。また、禁煙までに蓄積した喫煙の害のうちには、禁煙によっても修復しない害もたくさんあります。
とはいえ、従業員に喫煙に関連する健康障害を起こしてほしくないから、就業時間中禁煙を就業規則で定めることで、その規則をきっかけに禁煙したり、本数を減らしたりする従業員はいるでしょう。喫煙は誰にとっても健康リスクになるモノですから、喫煙者だけを抽出して指導するのではなく、就業規則のような手段で非喫煙者も含む全従業員に公正に行なう健康リスクの低減策は多くの場合、有意義です。非喫煙者も喫煙者も喫煙が健康を障害すること、そしてその事実に対し会社が従業員の健康を守るために取り組んでいることを知る機会になります。
たとえば喫煙者のみになにか対策をしようと考えた場合、まず、喫煙者と非喫煙者をわけるスクリーニングを行います。健康経営とポピュレーションアプローチでお伝えしてきたとおり、カットオフ値を定める手間です。まず、喫煙者を完全に定義しなければなりません。たとえば飲み会のときだけむしろ喫煙者に気を遣わせないためにつきあいで吸うけど自分では買わないなんて場合、自分を喫煙者だと自覚していないことがありますが、リスクの有無で言えばリスクありです。産業医面談では、会社に隠している喫煙習慣がよく話題になりますし、健診時の問診では、嘘の意識はなくても、禁煙するつもりやしたことがある状態でも「禁煙した」と記入することがあります。禁煙指導をしてやるから喫煙者は名乗り出ろといっても、完全に喫煙者が抽出できないことは予想できるでしょう。一酸化炭素濃度の測定は有効ですがコストがかかります。そもそも会社にばれない範囲の喫煙習慣は、健康リスクではありますが、会社が関与すべきところではありません。
健康経営の定義
健康経営とは企業の資産を従業員に投資して、リターンを回収し、組織の収益を拡大する経営戦略です。
投資対象は従業員個人の「健康」という人的資本であり、投資対効果(ROI)を見極めるために、科学的エビデンスと妥当性、統計学的手法を用います。
健康経営は母のように従業員をいたわって過保護にすることでも、医師の行うビジネスでもありません。 ごくごく当たり前の企業のあり方そのものが健康経営であり、たとえばソーシャルビジネスという言葉と同じように、なんでわざわざ特別定義しなきゃいけないの?って感じる方が自然です。
健康経営なんて、うちはまだまだ・・・という経営者の声をよくきくのですが、健康経営じゃないなら、社会のためにならないし儲からないので、存在意義が不明です。 皆さん、まだまだとおっしゃるのですが、よくよくお話を伺うと、それぞれすでに素晴らしい健康経営を実践していることがほとんどです。 そうでなければ企業として存続していません。 すべての経営者はすでに健康経営者で、しかも大きな伸びしろがあります。
そもそも健康経営は、ローズ先生のヘルシーカンパニーにはじまりますが、ローズ先生の唱える健康経営は企業理念に主眼を置いています。企業は強みであるバリューを活かした手段で社会に貢献するというミッションを達成するというビジョンがあるからこそ存在しているわけで、企業が儲かっているとき、その企業は当然、社会に貢献できます。
ヒトを健康にする要素はたくさんありますが、PURPOSE(生きがい、やりがい、働きがい)が最も効果的です。もちろんそのほかに、他人への信頼感やコミュニケーション、社会的な安全感などの心理社会的要因があり、アウトカムを組織レベルで測定するときには、個人のライフスタイルや遺伝情報は、組織に及ぼす影響の小さい下流の要素です。
働く、つまり仕事があるということだけで、逆の因果を排除しても充分に健康と相関しますから、心理社会的風土の優れた職場で、自分の会社が社会に貢献している、そして自分の仕事がその一翼を担ってやはり社会に貢献しているという実感を持ったり、そのような企業を誇りに思ったり、企業へのロイヤリティーをしっかりと持ったり、ともに働く仲間に信頼感を持ったりすることは、なにより従業員の健康に寄与します。従業員が健康になればパフォーマンスが上がるだけでなく、従業員を健康にする環境が創られて、また従業員の健康もパフォーマンスも上がるという好循環が起こります。
これが健康経営で、健康経営という言葉が登場する前から、よい経営というのは当然、健康経営でした。
健康と生産性 Health and Productivity
科学的エビデンスを用いるという点で、準拠する学問領域が必要になってきます。もちろんそれには企業理念に関わる組織心理学や組織開発という分野も含まれますし、マーケティングやヘルスプロモーション、ヘルスコミュニケーション、行動経済学、社会疫学などなども含まれます。医学もギリギリ含まれるでしょう。健康経営に利用できる学問領域は枚挙にいとまがないのですが、ズバリ健康経営と呼べる領域として、公衆衛生(Public Health)というくくりの中の、産業環境保健(Occupational Environmental Medicine)の中の一分野である、Health and Productivity があります。
経産省による健康経営優良法人認定事業ではこの Health and Productivity を健康経営の訳語として用いています。
2018年5月にはこの領域の第一人者であるロナルド・リプケ先生が来日され、本物の健康経営について、東京、福岡、熊本の3都県でご講演くださったので、実際に企業において投資効果をいかにして測定するかについて学んだ経営者も多いのではないでしょうか。
このリプケ先生が代表をつとめられていたACOEMという学会が学問的には産業保健をリードしている機関で、JOEMという雑誌を出版しており、このコラムでご紹介する文献もJOEMのものが一番多いですね。私のストレスチェックの研究もJOEMに掲載され、2019年にはBusiness Leadershipの認定講習を受けました。 ACOEMメンバーに届く米国企業からの求人が面白いのですが、まあこの話は別の機会に。
腐ったミカンに翻弄される間違いだらけの健康経営
先生、ストレスチェックでどの従業員がうつになるかわかるんですか?
ストレスチェック制度が義務化され、50人以上の事業場での実施を前にした2016年の前半には、多くの経営者や担当者からこんな質問を受けました。 不思議なことに、彼らは将来うつ病になる社員を知りたいようでした。
もし、うつになる従業員がわかったらどうするんですか。と質問すると、
事前にわかってたら、その原因を取り除いてならないようにします。と答えます。
その原因はたとえば何かと問うと、過重労働やハラスメントが上がるので、それはうつになる可能性の高い従業員だけから取り除けばいいのですか?と問うと、担当者の言葉が詰まります。
冒頭の喫煙の話と同じです。過重労働やハラスメントは誰にとっても健康リスクです。組織から一掃するのが望ましく、そのために事前にリスクの高い従業員を抽出する必要はありません。
堤先生らの研究によると、確かに高ストレス者はそうでない従業員に比べて、傷病休職のリスクが高いといえます。
JCOH-スタディによる長期疾病休業発生率に総務省「労働力調査(基本集計)」による男女比をあてはめると年間の精神疾患を原因とする長期疾病休業発生率は1,000人当たり4.36人、堤先生の研究では1,000人当たり0.4人であり、厚労省の言うとおり、ストレスチェックを受けるだけで発症率が10分の1になっているのがわかります。
つまり、意外にも「ストレスチェックでストレスリテラシーを高めてメンタルヘルス不全を予防する」効果は絶大だという、ストレスチェック制度を肯定する結果があきらかになったのです。
一方で、特に男性では高ストレス者の休職リスクが8.69倍も高いとはいっても、あたりまえですが休職した人数は非高ストレス者のほうが3倍くらい多いのです。高ストレス者は全体の10%程度ですから、当然といえば当然ですよね。これは、健康経営とポピュレーションアプローチでご説明したPARの概念を参照にしてください。
たとえば1,000人の会社でストレスチェックを実施すると、実施しない場合には4~5人出ていた長期疾病休業者が0~1人になるかもしれません。その上、なんといっても法令ですから、ストレスチェックを実施しないという選択肢はありません。そこで高ストレス者として抽出された100人に対し、なんらかの介入を行なったとすると、0~1人の長期疾病休業者が0~1人になる可能性があります。わかりますか?
この介入が産業医面談だと仮定すると(なぜ仮定かというと産業医面談が高ストレス者に対して何か影響を及ぼすかどうかは、現在のところ明らかになっていないからです)、面談を受けるのは高ストレス者の0.5%程度ですから、100人中の介入すべき1人に当たる可能性は1.33×1/1,000,000%です。
スクリーニングの妥当性より先に、介入の妥当性を検証することが重要なのです。
次回以降、感度特異度などスクリーニングの見方については、もう少し解説します。
先生、ストレスチェックで嘘を答える従業員を見つけられますか?
この質問もよくききました。実は弊社の扱うストレスチェックには、そのような消費者の満足を高めるという目的のため、回答への信頼度をチェックする尺度を入れていますが、結果の解釈には用いていません。 世界的に用いられている、臨床心理質問紙には概ね、真偽判定が含まれています。 たとえばMMPI(ミネソタ多面人格目録) (Minnesota Multiphasic Personality Inventory)などはたいへん厳しいチェックをクリアして、本当のことを言っていると認定されない限り、判定すらしてもらえません。私は何度も正直にトライしていますが、毎回、ミネソタには信用してもらえず、一度も判定に至ったことがありません。
クライアントの従業員には迷ったら、なりたい自分になって答えるよう指導しています。本当のことなんて、誰にもわからないし、行動科学的にはポジティブな選択肢を選べばその分ポジティブになれます。自分がどっちか、ではなく、どんな自分になりたいか、という姿勢で、常に答えていきましょう、と。
嘘をつく従業員を見つけたい。
嘘をついている従業員を見つけたとして何をしたいのか。従業員を信じられない人事なんていりません。そんな台詞を吐いてしまう管理職の存在こそが、全従業員の大きな健康リスクです。
健康経営には科学的エビデンスが欠かせません。 組織の健康経営の参考とする科学的エビデンスを構築するには組織への介入効果を組織単位で測定するという高度な技術が必要で、そのエビデンスのいわんとするところを理解するのにもいくらかの高度な専門知識が必要です。 健康経営は社内の資源ですることで、専門知識がないとできないことは一つもありませんが、エビデンスの利用というプロセスだけは、上記の理由で専門家の手助けが必要になります。それにしても専門家は統計的手法に対して解説できるだけで、企業の存在意義については全くの素人です。だからこそ彼らに任せず、彼らに何をさせるのかを明確にして発注します。 それ以外の魔女狩りや浮気調査のような機能を外注する必要は一切ありませんのでご注意ください。
第2回 スクリーニングの妥当性 ⅰ血圧測定
企業で行なうスクリーニングの価値をどう見積もるか
スクリーニングというのは検査のことで、検査というからにはなにかの疾患や疾患リスクを明らかにするモノです。
血圧測定
たとえば血圧測定というスクリーニングでは高血圧症という疾患と、血圧の高さと相関する心及び脳血管イベント(脳卒中や心血管疾患などの致死的なイベント)のリスクを検出することができます。
ほかにも生きていること、拍動していること、脈拍、血圧が人それぞれ、そして自分の血圧も測る度に違うこと、腕の太さなどがわかります。
ちなみに血圧の単位、mmHg ですが、Hgは化学の元素記号にあった水銀です。そしてmmはミリメートルで、水銀柱として〇〇ミリメートルの高さの圧、という意味です。 昔は水銀を利用した血圧計を用いていたのでこのような単位になりましたが、水銀はあまり日常的じゃないと思うので、水柱や気圧に変換してリアルに血圧をイメージしたい方は、こちらをどうぞ。よく映画などで上がる血しぶきの高さのリアリティなども想像できますし、止血の際にどれくらい強く抑えるべきかの参考にもなるのではないでしょうか。
上腕にマンシェットを撒いて自動血圧計で血圧を測定するのは、企業が選択するスクリーニングとしてたいへん優れています。
まず自動血圧計を用いた血圧測定はコストが安いです。1,000人の企業で3,000円の血圧計を20台買っても1人当たり60円、100台買っても300円です。維持費は電池代のみです。10人に1台あるとなると、ときどき血圧を測る想像がつきますよね、毎日でも測れます。測定に要する時間は準備を入れても5分足らず、測定そのものは1分もかかりません。検査にかかるアブセンティーイズムも非常に小さいです。
経済的な視点から最も血圧測定が優れているのは「誰でも測れる」ということ。機器の価格以上に検査費用に直結するのはその検査を誰がやるかです。医師しかできない>ナースでもできる>技師でもできる>誰でもできる>自分でできると最も高額な人件費分の上乗せが減ります。処方箋などもいりません。
医学的な視点から血圧測定が最も優れているのは、低侵襲であるということ。侵襲とは外的(物理的)ストレスのことですが、たとえば採血は皮膚に針を刺して静脈壁までを傷つけて進み、血液を採取するのですから、出血・血腫や感染・膿瘍、神経損傷などのリスクを伴います。放射線検査は被曝します。体の一部や状態を観察するものなので、スクリーニングにはある程度のリスクが伴い、一つも細胞を殺さない検査はなかなかありません。まあ、血圧測定で死ぬ細胞はゼロではないかもしれませんが・・・
一人でできるので個人結果漏洩の心配はありません。
法定健診と合わせて職場で日常的なリスクチェックを行ない、シミュレーターで血圧のリスク低減効果を可視化することで、運動や食事、禁煙という他の健康行動へのモチベーションにつながる可能性も高いです。
それでは血圧計で測った血圧がどれだけ正確なのか。
実はこの質問、よくされるんですよね、血圧に限らずあらゆる検査値について。
よい質問だとは思うんですが、よい質問だと認めるためには、血圧の正確さによってあなたの行動が変わるなら、という前提が必要です。
血圧は拍動ごとに変化し、1日に10万回以上拍動しています。血圧は心臓が血液を押し出す力とそれを受け止める動脈の抵抗によって違いますから、測る場所によっても変化します。生理的な日内変動もありますし、当然ですが必要に応じて高くなったり低くなったり変化します。それが生きているということです。
1年に1回、健康診断で測った血圧を「私の血圧」として1年間大切に記憶しておくことは、「正確とは言えない」でしょう。正確か正確じゃないかを知るためにはともかく数を測って、自分の血圧の傾向を知るしかありません。
医学的にはスクリーニングが正確か(有効か)どうかは、次回以降お伝えする感度と特異度で見ることになり、高血圧症を検出するための血圧測定ならその感度と特異度を見ることになりますが、そもそも高血圧症の定義が測定血圧値なので、血圧測定はスクリーニングというよりは診断器具ですね。
たとえばおなじように低侵襲で安価な腋窩体温計による発熱の検出感度および特異度はそれぞれ64%および96%だそうで、その意味では感度も特異度も100%、すごく優秀な検査といってもいいんですけど、変動するからこそ、何度も測る必要はあります。
同時に血圧が高いと何が悪いのかや血圧をどう下げるのか、なにより血圧の薬を飲んでいても血圧が下がっていなければ飲んでいないのとリスクは変わらないということなどを啓発して、社内全体で血圧に対する意識を高め、それぞれ2mmHgでも下がれば、イギリスの例を取ると1,000人の会社で350万円以上の医療費を簡単に節約できます。1人分は3,500円でも、血圧計にかかっているのは300円、医療費だけで10倍以上のリターンのある職域のヘルスプロモーションプログラムは概ね、アブセンティーイズムで同等から1.5倍、プレゼンティーイズムで3~20倍の効果があると言われていますので、計算上、ものすごく導入する価値のあるプログラムだとわかります。
たとえば、LOXインデックスというたいへん素晴らしい検査がありまして、血管壁の様子を知ることができます。もちろん心陽クリニックでも、1回14,000円で、この検査を行なっております。採血検査などで医師、または医師の指示の元、医療従事者が医療機関で行ないます。少なくともオフィスのデスクでは不可能で、アブセンティーイズムが数分で済む血圧測定とは異なりますね。
企業や健保の中には、この高額で素晴らしい採血検査をハイリスクの従業員に限り無料で提供しています。健康ハイリスク従業員が大きなインセンティブを受ける設定ですね。自分で払えば14,000円なら拒否する従業員はいないでしょうから、ハイリスクでよかったと喜んで受けることでしょう。しかし、そのあと14,000円をどういうロジックで回収するのでしょうか。
会社経営は慈善事業ではありません。従業員の健康管理は生活保護ではありません。採用時の健康状態で労務の提供が可能と判断されたのだから、その健康状態を維持する自己保健義務は労働者に課せられています。だからこそ労働者の努力によって健康状態が向上し、より高次の労務が提供できるようになった、している、となれば、企業に対して再評価を堂々と求めていいのです。
自己保健義務を怠って健康ハイリスク群に移行した従業員がインセンティブを受けるしくみは Organizational Justice とはいえず、健康な社員のロイヤリティーを高めません。血圧は誰にとっても下げるべきもので、血圧測定とLOXインデックス、どちらも同じように致命的なイベントへのリスクを示唆することができます。
会社に最も貢献してくれているのは健康な従業員です。会社に貢献する社員を適切に評価し、その労務の提供次第でしっかりと報酬を配分しましょう。これは Organizational Justice の中でも distributive Justice という領域で、職場のストレスとも大いに関連する部分です。下手な健康管理が多くの健康な社員のメンタルストレスを増やしてしまうリスクについても意識していきましょう。
第3回 スクリーニングの妥当性 ⅱ感度
感度
「あの子はなかなか感度がいいね」
さて、そんな台詞であなたはどんな「あの子」を想像するでしょうか。
感度というのは素晴らしい単語だと思うのですけれど、科学というのは血も涙もない領域で、単語に感情が入りません。
「感度の高い少女」なんてすごく天才的で繊細で美しい感じがしますよね。
感度を好意的にも悪意にまみれてもエッチな雰囲気でも使うことのできる我々の日常とは違い、統計学における感度は常に一定で、よいモノを測ろうと悪いモノを数えようと感度の定義はブレません。
何かを検出したい検査(スクリーニング)において、検出したい対象を検出した場合、その検査結果を陽性といいます。検出しなかった場合、陰性といいます。
これも陰と陽、英語ではPositiveとNegativeですが、「彼女っていつもポジティブで一緒にいると元気が出るよね~~~」とか、「ネガティブに考えないで前向きに行こうぜ!」とかみたいな意味合いはゼロです。多くの場合はリスクを高める因子を検出するので、陽性(ポジティブ)のほうが望ましくない結果です。
そもそも健康経営施策において、ポピュレーションアプローチと比較して、ハイリスク戦略ではカットオフ値を設けて選別を行なうプロセスが余計だと考えていますが、ともかく日本人は検査が好きですね。意味もわからずただ好きなので、隠れインフルエンザなんて恥知らずな現象が起きてしまうのですが、だからこそ、一度くらいはこうして説明する必要がありそうです。
このあたりの検査至上主義はコロナ禍の良い影響として淘汰されるかと思いきや、やはり妥当性の低い検査結果で非医療者が陰性証明を発行するようなビジネスが出てきていますね。検査することと感染対策をすることは全く別物ですが、こんなに大きな変化が起きても、もともとの検査至上主義からはなかなか脱却できないのですね。
血圧測定で高血圧を検出すると仮定した場合、まずはカットオフ値を定めます。 収縮期血圧が130mmHg以上か拡張期血圧が80mmHg以上のどちらか一方でもあてはまれば、被検者を「高血圧症」とラベリングします。 これが血圧測定で得られた結果ですが、本当の高血圧症を定義する必要がありますので、ここでは1日に3回、1週間欠かさず測った血圧の平均収縮期血圧が130mmHg以上か平均拡張期血圧が80mmHg以上のどちらか一方でもあてはまれば、本当の「高血圧症」とします。
スクリーニングでは血圧が130/65なら陽性で、血圧が129/79なら陰性になるわけですが、この2人は本当の高血圧症である可能性があまり変わらないような印象を持つのではないでしょうか。
感度は本当に陽性な人のうち、検査で陽性になった人の割合です。本当に陽性の人は図のa(本当に陽性で検査でも陽性=真陽性)の人と、図のc(本当に陽性だけど検査では陰性=偽陰性)の和ですから、計算式は以下のようになります。
感度=a/(a+c)
感度の高い検査というのはCの少ない検査とも言えるわけです。
なぜ高血圧症者を抽出したいかというと、高血圧症者は図のように脳卒中になりやすい(話を簡単にするためにこの場では脳卒中だけを話題にします)ため、降圧薬の内服という介入をして血圧を下げ、脳卒中から守りたいからですね。グラフは相対危険度を示していますが、たとえば45歳の健康な男性が10年以内に脳卒中を起こす可能性は1%程度で、同じ45歳で血圧をどんどん上げていくとそれがどんどん危険度を増し、喫煙や肥満などのリスクファクターを最大限に盛り込むと16.3%程度まで上がります。
リスクのない人の「16倍以上」という表現だとかなり危なそうですが、どんなにリスクが高くても「85%程度は10年以内に脳卒中を起こさない」という表現だと、大したことがないように思えます。
あたりまえですが、血圧が高くても低くてもこの世には脳卒中を起こさない人のほうが圧倒的に多いわけです。
5%くらいの人を高リスク者として抽出したいと考えた場合は、カットオフ値を収縮期血圧150mmHgにすれば好さそうに思えますが、その検査陽性者の血圧を軒並み150未満に下げたとき、組織全体の脳卒中リスクはどれほど下がるのか、ということを考えなければなりません。
前回話題にした研究を例に取ってみましょう。
誤解のないようにいいますが、この研究はストレスチェックが傷病休職者のスクリーニングに使えることを示すものでは決してないので、その感度について論じているのは例示の意味でしかありません。
ただし、お伝えしたようにストレスチェックを傷病休職者予測として使いたいと考えるよからぬ経営者がいることを踏まえて、例に出します。
感度は 9/(9+25)=0.265 で26.5%となります。
そんなにたいしたことないな~~という印象ではないでしょうか。
そしてスクリーニングには感度以外にもその妥当性を測る上で重要なファクターがたくさんあります。
次回は感度についてもう少し学んだあと、特異度について触れましょう。そして感度と特異度の関係に進みます。
第4回 スクリーニング ⅲ感度と特異度
感度
第3回では、感度とは本当に現実に〇〇な人のうち、スクリーニング(検査)でしっかり〇〇と検出できた人の割合を%で示したもの、ということをお伝えしました。
同じ検査でも〇〇の設定によって感度は変わります。
血圧測定を例として、一回測定時の血圧で高血圧症を定義するなら押しも押されぬ100%ですが、直近100回の平均と1回を比べるとなると100%ではなくなること、血圧を調べる意義でもある、10年後に脳卒中を起こすかどうかを検出したい対象と定義するならば、さらにその感度は下がることをお伝えしました。 その上に、本日お話しする特異度について考慮すると、スクリーニング精度としての価値は大幅に下がるものの、それでも血圧測定をする意義があるのは、血圧測定が安くて早くて効果的だからだとご説明しました。
もし、〇〇を見つけたときに、その〇〇があることの悪影響をゼロにできるような解決策がはっきりとわかっているけれど、その解決策が〇〇ではない人に対しては有害な場合には、感度の高さは非常に重要です。感度が100%の検査ならば、ともかく陽性だった人にその解決策をあてはめればいいわけです。ただし、〇〇ではない人にとっても解決策は影響がないどころか、よく作用する場合が多いには、それが安価な策であれば特に、スクリーニングという手間やコストをかけずに、最初から全員に解決策を施すシンプルなポピュレーションアプローチのほうがいろんな意味で好ましいという結果になります。前述のように血圧測定の場合は、スクリーニング自体も手間やコストが小さいので、健康行動の実践というよい点も評価して、やってもいいスクリーニングにカウントできます。
たとえばこれまでお示しした例では、正常血圧の人々も含めた全員の血圧を2mmHgずつ下げるとか、55歳以上の全員に多剤内服させるとか、もっとわかりやすいのは就業時間中禁煙を定めるとか、社内のすべての窓を紫外線不透過窓にするとかが、〇〇を見つけたときに、その〇〇があることの悪影響をゼロにできるような解決策がはっきりとわかっていて、その解決策が〇〇ではない人に曝露しても一切よからぬことを起こさないとわかっている場合ですね。
まず、スクリーニングというプロセスを省く設定で健康経営施策をデザインすることです。生産性を上げるためには、余計なコストをかけない方法が一番、簡単だからです。たとえば訊かれたくない質問による心理的なストレス、放射線被曝、組織損傷をともなう身体的なストレス、費用や時間という企業にとっては最もリスキーな社会的コストのまったくないスクリーニングはありえないので、スクリーニングによってしか結果を検出できず、結果を検出してからしか、解決策が立案なり実行なりできないという場合でなければ、スクリーニングそのものをすっ飛ばすという英断が最も賢いのです。
特異度
感度というのはガチで、リアルに、マジで陽性な人、つまり表中のa:真陽性(実際に陽性で検査の結果も陽性な人)とc:偽陰性(現実には陽性なのに、検査の結果は陰性になってしまった人)の和のうち、aの真陽性の割合を%で表した尺度です。つまり何か検出したい対象を見過ごしてしまうというぼんやりのミス(c=βの過誤)が少なければ少ないほど、感度=a/(a+c)は大きくなるんですね。
ただし、そもそもなぜ検査をするのか、に立ち戻ってみると、検査をして陽性だった人々に対して、何か対策を施すためにやるわけですよね。先ほども触れたように、その対策が陽性の人の問題やリスクに対し非常に優れた解決力がある上、陽性でない人にとっても無害、無影響であるばかりか、有益なり好ましい影響なりがある場合は、検査のプロセスをすっ飛ばして全員に解決策を施してしまえばいいわけです。
新型コロナウイルスに感染するリスクは皆にあるので、外出せず、他人と接触せずに生活できるのなら、あえて検査受検のためにでかけたりせずに、その生活を続けるほうがいいですよね。PCR検査結果の陰性は「新型コロナウイルスに感染していない」ことを証明するものではありません。陽性だった群のほうが、陰性だった群よりは、感染している確率が高いけど、どちらの群にも感染している人と感染していない人がいます。
その対策が結果に関わらず無害、または有益なり好ましい影響なりがある場合は、検査をせずに全員に対策をするほうがよいですね。コストカットの意図で、ハイリスク者にのみ対策をする場合には、感度100%の検査を採用しないと、検査をしたために有益な対策を受けられない人が出てきてしまいます。そう考えると、職場で行う健康経営施策には、全員に提供できる程度の費用で、誰に対しても有益な内容がふさわしいですね。
さて、特異度とは感度の反対で、現実には陰性なのに検査では陽性になった偽陽性:bと現実と検査結果が一致している真陰性:dの和のうち、dの割合を%で表した、陰性判断の確からしさを示す尺度です。
特異度=d/(b+d)
すなわち、本当は陽性にしなくていいものまで慌てて陽性にしちゃうあわてんぼうの余計なミス(偽陽性=αの過誤)の割合が少なければ少ないほど、特異度は高くなるのです。
医学的なスクリーニングは、この特異度が低くても、感度が高いことが求められます。まずは見落としをできるだけ減らした上で、より確実な検査で偽陽性を除外して、真陽性の患者に適切な医療を提供する必要があるからです。特に高度専門性を要する医療行為は、効果は高くても、副作用や有害事象等があったり、高額であったり、通院や入院を要したり、介入に犠牲を伴う場合があります。それでも治療の有用性が勝る場合、しっかりと必要な人に必要な医療を届けなければなりません。
餅は餅屋。企業は医療機関ではないので、ガチで高度医療が必要なことは専門家に任せて、企業は自社のミッションを達成しましょう。繰り返しますがオススメは、検査不要のポピュレーションアプローチです。
前回のストレスチェックの研究を例に取ると、その特異度は94.5%です。これは充分に高い数値だと感じますか? ちなみに感度は26.5%でしたね。
むろんストレスチェックは長期傷病休職予測スクリーニングではありませんから、この数値について議論するのはナンセンスですが、感度が100%で有効な対策があるのなら、94.5%は悪い数値ではないでしょうね。
第5回 スクリーニング ⅳ 感度と特異度のトレードオフ
スクリーニングの2×2表
これまで、感度と特異度について説明してきました。
何度も使っている表で他の枠の名称にも触れてみましょう。
だいたいこの配置で、横にリアルな病気のありなしを並べ、縦に検査結果を並べます。2×2の表ですね。
まず、検査で陽性になった人のうち、(2×2の表の上の段)本当に陽性だった割合、つまり正解率みたいなモノですね、を陽性的中率といいます。
陽性的中率=a/(a+c)
たとえば法定健診で陽性だった人は精査のため、二次健診に行きます。たとえば便潜血による大腸がん検診なら、検査が陽性だった場合、大腸(下部消化管)内視鏡を行ないますね。
便潜血は大腸がんに対する感度も30~92%と観察する集団によってかなりばらつきがありますが、陽性的中率は高く見積もっても5%未満であることは確かです。
50歳台の大腸がんの発見率が0.1%程度なので、発症率(発見率)を0.1%、感度を40%、陽性的中率を4%として10,000人の結果を見ると表のようになります。
大腸がんがあるかもしれないと告げられるのは恐ろしいことでもありますが、告げられた100人のうち、実際にがんがあるのは4人です。一方で便潜血がないから大丈夫と思っていた9,910人のその他大勢の中にも人数としては便潜血陽性の人よりも多い大腸がんありの従業員が隠れているとすると、社内の大腸がんを何としてでも見つけたい場合は、最初から全員内視鏡が望ましいことが見て取れます。とはいえ、便潜血は侵襲の少ない安価で安全な検査ですから、気づきや健康行動のきっかけにするのは悪い選択ではなく、このようなインフォメーションを加えることによって、便潜血が陽性の社員も陰性の社員も自分で健康行動を取るように促すことは可能です。
検査を受けていたのになぜ? という声も実際によくききますが、表のように検査で陰性だった人の中にもがんのある人はいて、検査が陰性だった人のほうが圧倒的に絶対数が多い(表の場合は99%)ので、陽性だった人の中では4%、陰性だった人の中では0.06%が本当にがんなのですが、人数としては陰性からがんになる人のほうが多いのです。
一方で陰性方面(下の段)の正解率を同じように陰性的中率といいます。
陰性的中率=d/(c+d)
また、集団全体で本当に陽性の人がどれくらいいるかという発症率や有病率は (a+c)/(a+b+c+d) で表せますね。
たとえば健康経営支援サービスとかなんとか名前をつけて、組織のなんらかのスクリーニングをするサービスの多くが、感度しか示していないことがあるのですが、感度だけではそのスクリーニングの妥当性をなーんにも評価できません。
また、健康経営優良法人顕彰事業の銘柄事例集のようなかなり公的なモノにも、「アプリの配布で従業員の健康感度を高めることに成功」のような語句がありますが、この場合の感度は啓発後の意識というようなもので、従業員が自己の健康において特別なものさしを持って、自分が健康かどうか評価できるようになったというわけではないでしょうね。
感度と特異度のトレードオフ
たとえば脳出血発症リスク検出としての血圧測定の感度を上げたい場合、カットオフ値を収縮期血圧50mmHg以上にしてしまえばいいのです。こうなると収縮期血圧50mmHg未満の人が検査上の陰性になりますが、職場で検診を受ける人のうち、収縮期血圧が50mmHg未満の人はいませんから、10年以内に脳卒中を起こす人の割合が多かろうと少なかろうと感度は100%になります。
このとき2×2の表はこんな感じになりますから、1,000人のうち、1人しか脳卒中を起こさないとしても、感度は100%になるわけです。全員陽性なんだから、誰か一人でも脳卒中を起こせば、感度は100%、誰も起こさなかったら分母がゼロなので、計算不能です。 そして、誰かが起こそうと、誰も起こさなかろうと、特異度は0%です。
これが、感度と特異度のトレードオフで、感度を高くしようとして基準値をどんどん厳しくしていくと、本来陰性なのに陽性になってしまう偽陽性(b)が増えてしまい、反対に特異度を高くしようとして基準値をどんどん甘くしていくと、本来陽性なのに陰性になってしまう偽陰性が増えてしまうというわけです。
理想的には感度も特異度も100%のテストが望ましいのですが、現実にはそれはなかなか難しいので、アウトカムを何にするか、陽性だった場合になにをするか、何のためのテストか、などという背景を加味して、落としどころを探っていきます。
新型コロナウイルス感染症を例に取ると、濃厚接触者や有症状の場合は検査結果に関わらず他者との接触を避けるべきで、もし、症状も接触歴もないのに検査結果が陽性になった場合には、偽陽性の可能性もあるけれど、やはり、ありと考えて対策をします。結局は、全員、感染していると考えて、一人ひとりが全力で感染させない努力をすることが重要なのです。
検査精度を上げようとするとお金や時間、被検者に心身の侵襲(ストレス)がかかるので、精度を上げるために躍起になりすぎるのもあまりよくありません。
図のように同じ検査値でも病気の人とそうでない人が存在するので、この2つの分布が重なっている部分の解釈をどうするか、特にここで論じている会社の健康経営におけるスクリーニングでどうするか、という点には慎重になる必要があります。
治療の一環としての検査は感度を優先しますが、それは確定診断や鑑別疾患の除外のために検査をするからです。つまり医者が検査をする際には、被検者の中での発症率は、国民全体とか、会社全体とかという集団での発症率よりずっとずっと高い状態です。そういう場合には多少特異度を犠牲にしてでも、感度が限りなく100%に近い方法を行なう必要がありますよね。とはいえ、陰性の患者さんに誤った治療をすることで、デメリットがある可能性もあるので、やはり患者さんに何らかの病気がある場合こそ、偽陽性を許すわけにもいきません。つまり複数の検査を組み合わせて、本当に陽性、治療を必要としている人を検出し、治療を開始する努力が必要で、それが医療そのものとも言えます。
医者が病院でする検査と、企業が職域でする検査は、同じ検査でも意味が全く違います。 たとえばご存じのようにこのコラムではバリウム健診を批判し、ABC健診をオススメしていますが、バリウムが毒だとわかっているからこそ、誰彼かまわずバリウムを飲ませる消化器外科医も消化器内科医もいない一方で、あえて内視鏡や腹部CTで評価したあとで、バリウムを用いた胃レントゲン検査を行なうことがあります。これはバリウムのコラムでも書きましたが、バリウムという異物による腸管の炎症や被曝のリスクを鑑みても胃レントゲン検査でしかわからない上に治療の選択に影響を及ぼす何かを発見したい、あるいは否定したいという確固たる目的があるからで、行なう医師にしてみれば侵襲のある検査だとわかって苦渋の選択をしているからこそ、するからにはする目的を絶対に果たそうと、より丁寧に目を皿のようにしてしっかりと見落としなく観察します。専門家が行なう胃レントゲン検査を経験すれば、健診センターのそれと同じ検査だとすら感じないかも知れません。そもそも胃レントゲン検査は「動画」であることにその意味があるのに、せっかくの動画をあるかないかまったく見当のつかない状態で健診技師が数枚の静画としてきりとり、健診ではそれを別の医師が読影します。治療の一環としての検査の場合はその結果を受けて治療の選択や治療そのものを担当する医師が行なうので、合目的的で見逃しの少ない、本気の検査になります。
バリウムの胃がんに対する感度はおおむね70〜80%、特異度は90%、陽性的中率は0.7〜2.0%です。つまり陽性的中率が特別高い場合にも、バリウムで所見のあった人のうちの98%は胃がんではなく、感度が特別高い場合にも2割の人は見落とされるということです。
あるかないかわからない発症率の低いアウトカムを検出することは、ほとんどの場合、企業においては必要ないと感じますありません。
感度しか示さないサービスは、おそらく相当特異度に自信がないんだろうし、感度しか示していないのに、50%とか75%とかだとしたら、私は大切な従業員をふるいにかけるのには使いたくないです。
ただし、たとえ感度が99%だとしても、たとえば長期休職しそうなんていうアウトカムの場合、発症率の低いアウトカムだからこそ無実の罪をきせられる偽陽性の従業員がたくさん犠牲になり、そう名指しされることでモチベーションやパフォーマンスの向上につながるとは思えない上に、1%の偽陰性の従業員はたとえあるとしても救済にアクセスできないことになります。
ともかく健康経営を語る上で一番大切なのは職場の正義です。
スクリーニングの感度や特異度ではなく、常に、正義の視点を持ってください。
経営判断はいつも二律背反のトレードオフかも知れません。医療機関の正しさと非医療企業の正しさは検査においては異なることもあるでしょう。健診センターやスクリーニングベンダーのセールストークに流されることなく、その検査に、そのプログラムに正義はあるかというただシンプルな一点で、判断してください。
Comments