中高生・スポーツデータ解析コンペティション2023
JSAA特別賞受賞者ダイアログ
日本統計学会/情報・システム研究機構統計数理研究所が主催する中高生・スポーツデータ解析コンペティション2023の審査が今年2月に行われ、同コンペティションの特別審査員として携わった日本スポーツアナリスト協会(JSAA)が今回JSAA特別賞を選考した。
約150作品にも及ぶ研究作品の中からJSAA特別賞/奨励賞を受賞したのは、早稲田実業学校高等部3年(当時)の黒岩暖さんと関根弘和先生による「総合力!?勝負強さ!? 〜バスケットボールにおけるトーナメント戦とリーグ戦での強さの違い〜」。高校3年間バスケ部でプレーしてきたという黒岩さんは、その実体験から生まれた「トーナメント戦とリーグ戦での強さに違いはあるのか?」という問いに対して仮説を立て、バスケにおける強さの指標となる「4 Factors」を軸に分析。問いの設定と重回帰分析を用いた解析の妥当性が評価され、今回の選考となった。
今回、このJSAA特別賞受賞を記念して、JSAA理事であり日本におけるバスケットボールアナリストの第一人者でもある木村和希氏との対話形式でのフィードバックが実現。その様子をレポートする。
研究概要:バスケにおけるトーナメント戦とリーグ戦での勝敗の要因
【PDFダウンロード】「総合力!?勝負強さ!? 〜バスケットボールにおけるトーナメント戦とリーグ戦での強さの違い〜」ポスター
中学まではスポーツアナリストを目指していたという黒岩さん。JSAAの存在については今回の受賞がきっかけで初めて認知したとのことだが「スポーツアナリスト」という職業の存在は中学生の時点で認知していた。キャリアの志向にも変化があり、研究者を目指していく中で、その基礎となる統計を学ぼうとしていたところ、関根先生に薦められ、今回のコンペティションへの参加を決意した。高校3年間所属したバスケ部で、練習試合で勝てた相手にトーナメントで負けてしまうことがあった。そんな実体験から生まれた「トーナメント戦とリーグ戦での強さに違いはあるのか?」という問いに対して、いくつかの仮説を立てた。
「リーグ戦では確実な勝利のために得点効率にかかわるeFG%とFTR%の二つが重要」
「トーナメント戦では格下に負けないためのTO%、格上に勝つためのORB%の二つが重要」
「特にeFG%に関してはトーナメント戦でもある程度必要」
バスケにおける強さの指標となる「4 Factors(「eFG%」、「TO%」、「FTR%」、「ORB%」)」を要素とした重回帰分析を用いて、リーグ戦とトーナメント戦それぞれにおける各項目の有意性を分析。リーグ戦では「eFG%」、「TO%」、「ORB%」の有意性を認め、トーナメント戦では「TO%」のみ有意性が認められる結果となった。分析結果から、いかにミスをしないかが重要であると考察。スター選手のスーパープレーに憧れ、そこにスポットライトが当たりがちだが、実際に勝敗を分けるのはいかにミスせず堅実なプレーが出来るかであると結論づけた。
※4 Factors
・ eFG% = (FGM(フィールドゴール成功数)+0.5×3PM(3Pシュート成功本数)/FGA(シュート回数)
・TO% = TO(ターンオーバー)/(FGA+0.44×FTA(フリースローの回数)+TO)
・FTR% = FTA(フリースロー試投数)/FGA(フィールドゴール試投数)
・ORB% = ORB(オフェンスリバウンドの回数)/(ORB+相手のDRB(相手ディフェンスリバウンドの回数)
プロも唸る着眼点
この研究発表を受け、今回このコンペに特別審査員として携わったJSAAから、日本のプロバスケットボールにおける分析の第一人者でもある木村和希理事が受賞者との対話を行った。
「まずは4 Factorsが高校生にも知られるほど、その認知度が高まっていることは日本バスケットボール界にとって大きなこと」だと木村理事は語る。バスケに携わる人であれば必ず目にする指標であろう4 Factorsだが、特に今回の黒岩さんの研究では「単純に4Factorsを分析するのではなく『リーグ戦』と『トーナメント戦』を分けるという視点が非常に面白かった」と関心を寄せた。
実際、木村理事自身もこれまでの分析で「それぞれの項目の関連度はリーグ、チーム、トーナメントによって変わってくるということを身をもって経験してきた」という。そのため、リーグ戦、トーナメント戦を分けて考えるという着眼点が刺さったようだ。また、重回帰分析で有意性を検証した分析の妥当性についても高く評価した。
一方で、黒岩さんは今回実際に分析した中で課題点もたくさんあったと言う。不慣れな作業に戸惑った点、統計の知識や技術といった点に加え、「選手のタイプが全く反映されていなかったこと」具体的なを課題点として挙げた。また分析を進める中で「チームが負けている状態での勝負強さ」や「気持ちのブレ」のような数値で測りきれない部分に対してプロのアナリストがどのようにアプローチしているのかという疑問も生まれた。
高校生から生まれたこの疑問に木村理事のテンションも高まった。
プロのバスケットボールアナリストが実践する分析とは?
木村理事によれば、『気持ちのブレ』などは4 Factorsを更に要素分解していくことで辿り着く『心理』に起因する。
「少し抽象度を下げて、なぜOR%が高いのかというのをもうひとつベーシックスタッツを用いて見てみる。そして、もうひとつ個人として誰が取ったのか(Person)、どのエリアで取ったのか(Area)、どの時間帯に取ったのか(Time)、どういう戦術だったのか(Tactics)という点に分解する。最終的に人に起因する場合は、その人の意識で変わるのではないかと考える。(動感、技術、生理、心理=コーチング)」
と木村理事。こうした点から心理学に落とし込むフレームワークを実践していると言う。また、自チームだけではなく、相手チームの分析もすることの重要性も指摘。例えば、TO%に関してはオフェンスとディフェンス両チームの4 Factorsを見てみることで、ターンオーバーした後の相手チームのeFG%が上がっているのかなどが見えてくる。今回の黒岩さんの分析結果からそんなポイントが気になったという。
「こうした表裏を分析してみるだけでもこの分野の研究としても可能性は広がると思う。重回帰分析において勝敗に目的変数を置いてみると4 Factorsの影響度も変わり発展性があるかもしれない。」と木村理事は今回の研究結果を出発点とした、更なる発見への糸口を示した。
黒岩さんも知的好奇心を掻き立てられ、更に疑問をぶつける。怪我など何かしらの理由でキープレイヤーが試合に出られない場合の影響や対策。まさにそれこそ4 Factorsを使用して分析するところだと木村理事は説く。抜けた選手の働きを代替選手で補うのではなく、チームとして戦い方、戦術でカバーしていくことを考えるのだと。
一連のやり取りの中で、黒岩さんからの的を射た質問に乗ってきた木村理事。選手とのコミュニケーションについて問われると、この対話セッションの数日前にチームミーティングで選手に伝えたデータを見せながら、チームと選手個人で解決できることをワークショップ形式でディスカッションしたことを伝えた。
この事実はそれまでJSAAの存在を認知していなかった高校生にとっては新鮮だったようで「監督やコーチを介して選手へのコミュニケーションが行われていると思っていたので、直接選手とコミュニケーションを取っていることを知り、アナリストのチームへの影響力があることがわかって嬉しかった。」と黒岩さんに笑みがこぼれた。
試行錯誤の末に辿り着いた「点差」という変数
さて、今回のコンペに話を戻そう。
黒岩さんは、今回の分析を進める中で「何を目的変数にするか」に悩まされた。
「勝利に関わるデータは「点差」「得点数」「勝率」の3つがあると思う。その3つそれぞれ変数が異なる。得点だけに特化するとTO%が影響していなかったり、eFG%のみがリーグ戦では有効になって、他のファクターは有意性が認められなかった。試合数の少ないトーナメント戦だと得点数だけではどうしてもバラつきが出てしまう。これも重回帰分析で生まれてしまう誤差なのかと感じた。」
こうした試行錯誤の中で、冷静に妥当性のある目的変数を探って行った。
「点差を目的変数に置いたのは良い視点。それも得点数でやってみた結果、点差に変えたというのは面白いストーリーだし、妥当性があって論理的だと思う。」と木村理事もその過程を知り、改めて評価する。
「勝率もやってみたが、トーナメント戦に持ち込むと試合数が圧倒的に少なくなる。勝率0ということもあるので、うまく反映されない。0か1か。極端になってしまうのでうまくあてはまらないと感じた。」と黒岩さんは振り返った。
最後に今回の研究テーマに対するひとつの答え合わせとなる木村理事のコメントがあった。
「リーグ戦とトーナメント戦の戦い方には違いがある。リーグ戦は最終的な勝率を上げるというのが目的になる。(Bリーグで)チャンピオンシップなら勝率6割くらい、優勝となれば8割というのが目標値になる。そこから重回帰分析をして、4 Factorsの目標値を割り出し、最終的な勝率を得るためのそれぞれの要素の目標値を目指すことになる。チャンピオンシップに関しては一発勝負なので勝率を目的変数にするのではなく、勝ち負けを目的変数にして分析する。実際の現場でもリーグ戦とトーナメント戦での戦い方には違いがある。だからこそ今回の仮説と分析は面白かった。」
中高生のプログラミング教育の現在とスポーツアナリティクスの未来
高校生ながら、黒岩さんは関根先生の情報処理のクラスで「Python」を扱ったこともあるという。今回のコンペでは、エクセルの仕様の難易度、数値の可視化の実現性を考慮し、「自分の中で一番理解できた統計方法」と言う重回帰分析が用いられた。
コンペを薦めた関根先生は、あえて多くの助言はせず「まずは過去の事例を見てみよう」と参加した生徒たちに促した。「高校生の時点では素材に注目して、気づきを得ることが重要。『意外だな』とか『こういうことが有効なんだ』という発見をすることが大切。分析手法などはあくまでもスパイス。余裕があれば使ってみなさいという指導をしている」と語る。
授業の中で「Python」などデータサイエンティストが活用するプログラミングの技術も学んでいるが、こうしたコンペに出ることの意義はそうした「技」の披露だけではなく、教科書にはない「自ら作り出すという経験」だと関根先生は説く。提供された膨大なデータを前に「どう扱っていいかわからない」という生徒もいるなど、参加者の中でも個人差はあった。それでも「スポーツデータ」を元にそれぞれの興味に赴く研究をするということ自体に大きな意義があったようだ。とはいえ、高校教育の中で「Python」などのプログラミングに触れているということは、10年前には考えられなかったこと。若年層からの教育で、今後、日本のスポーツアナリティクスのレベルも更に高次元に進化していくに違いないと感じられる対話となった。
今回の研究を経て、「先駆者から学ぶという点では役に立った。こういうコンペに出るのは初めてだったので過去の研究を見て、先行研究から学んだ部分が多い。」と語った黒岩さんの今後の活躍にも大いに期待したい。
(テキスト:小倉大地雄)