プロ野球選手の活躍期間は何年?~ピープルアナリティクスの応用~
はじめに
日本のプロ野球もオープン戦が始まり、いよいよ今シーズンの動きが本格化しています。そこで今回は、ピープルアナリティクスの応用としてプロ野球選手の活躍期間を分析してみたいと思います。
<執筆者紹介>宮中 大介。はたらく人の健康づくりの研究者、株式会社ベターオプションズ代表取締役。行動科学とデータサイエンスを活用した人事・健康経営コンサルティング、メンタルヘルス関連サービスの開発支援に従事。大学にてワーク・エンゲイジメント、ウェルビーイングに関する研究教育にも携わっている。MPH(公衆衛生学修士)、慶應義塾大学総合政策学部特任助教、日本カスタマ―ハラスメント対応協会顧問、東京大学大学院医学系研究科(公共健康医学専攻)修了
使用するデータ
2010年10月28日に開催された2010年度のドラフト会議において指名され入団した選手68名を2024年3月31日まで追跡したデータを用います。なお、育成選手は除外しています。
活躍期間の定義ですが、2011年4月1日からWikipediaの情報から得たプロ野球での活躍終了日とします。活躍終了日は、日本プロ野球での最終出場日とします。最終出場日が不明な場合は日本のプロ野球球団による戦力外通告日とします。なお、メジャーリーグに移籍しその後日本プロ野球に復帰した選手の場合は、復帰後の日本プロ野球での最終出場日あるいは戦力外通告日を活躍終了日とします。
カプランマイヤー法による残留率の計算
今回はカランマイヤー法によって残留率を分析します。この方法は事象の発生の都度残留率を計算する方法です。たとえば、広島にドラフト7位で入団した弦本悠希選手は、2011年6月11日が最終出場日となっています。この時点で、残留率を計算すると、1-1/68=98.5%となります。次に活躍終了事象が発生したのは、ロッテにドラフト3位で入団した小林敦選手が最終出場日となった2011年10月12日です。この時点までの残留率を計算すると、(1-1/67)×(1-1/68)=97.1%となります。このように順次活躍終了事象が発生するたびに累積での残留率を計算します。なお、活躍終了以外の事由で追跡が不能となる場合、例えば病気でなくなった場合等は追跡停止処理をしますが今回のデータではそのような選手は存在しませんでした。また、メジャーリーグに移籍して日本のプロ野球に復帰していない場合は追跡停止処理する予定でしたが、そのような選手は存在しませんでした。
したがって、いずれの選手も2024年3月31日までプロ野球球団に在籍、途中で最終出場日を迎えた、途中で戦力外通告を受けた、のいずれかに該当していることになります。
2010年度ドラフト入団選手の活躍期間は?
まず68人全体でカプランマイヤー法による残留率を計算しました。2689日で50%の残留率となっており追跡終了の2024年3月31日で残留率は約20%です。ドラフト指名から約7年で半数の選手がプロ野球選手としては出場の機会がなくなってしまっていることが分かります。残留率の曲線を見ると1000日程度までは比較的なだらかですが、それ以降は残留率がコンスタントに低下していることが分かります。
次に選手を投手と野手(捕手含む)に2分して残留率を比較してみました。これを見ると1500日くらいまでは同等ですがその後投手の方が残留率が低い傾向にあることが分かります。投手の場合肩を壊すといった選手生命に関わるケガが起こりやすいのことが背景にあるのかもしれません。
次に入団時の学歴別(高卒、大卒、社会人)に残留率曲線を描いてみました。社会人が高卒と大卒と比較して一貫して残留率が低いことが分かります。同じ残留率で比較すると1000日程度差があります。一方で高卒、大卒では入団が4年以上遅れますが、残留率にそこまで大きな差はありません。社会人の残留率が低い理由としては入団時の年齢が高いことも考えられますが、今回の集計では高卒→社会人と大卒→社会人を区別していないため、年齢が理由というよりも選手としての成績が多い分伸びしろをシビアに評価されている可能性もあります。
終わりに
今回はカプランマイヤー法をプロ野球選手の活躍期間に適用してみました。人事分野においては、従業員の入社から退職までの期間や管理職への昇進までの期間等を分析する時に適用できる手法です。退職であれば自発的退職以外で追跡不能となる場合、管理職への昇進までの期間であれば退職によって追跡不能となることがありますが、カプランマイヤー法を用いれば適切に退職までの期間や昇進までの期間を分析することが出来ます。
今回はサンプルサイズが小さいため検定を行っていませんが、残留率曲線に差があるかを統計的に検定することも可能です。例えば職種で退職までの期間が違うか分析してみる、性別で管理職昇進までの期間に差があるか検討するといったことが考えられます。
以 上