※ 当サイトは、アフィリエイト広告を利用しています。

【書籍紹介】Basketball Data Science: With Applications in R【バスケのデータ分析】

記事内に広告が含まれています。

今回は、本ブログの記事を書く際に参考にしている下記の書籍『Basketball Data Science: With Applications in R』の紹介記事となります。

本書に掲載されている分析手法の紹介、本書を読んだ上で感じた「良かった点」と「注意すべき点」などを記載していますので、是非ご確認ください。

書籍『Basketball Data Science: With Applications in R』の概要

今回紹介するのは、2020年にChapman and Hall/CRCから出版されたバスケットボールのデータ分析に関する書籍『Basketball Data Science: With Applications in R』となります。

本書では、NBA 2017–18シーズンのデータとフリー統計ソフトRの使用を前提に、実践的で多種多様な分析手法が掲載されており、読者は本書内で示されているコードを利用することにより、自分自身で本書内の分析を再現することも可能となっています。

著者であるPaola Zuccolotto氏とMarica Manisera氏は、それぞれイタリアのブレシア大学で教鞭をとっており、スポーツアナリティクスをテーマにスポーツ分析に特化した科学分野で研究活動を行っているとのことです。(著者ウェブサイト

本書を手に取ったきっかけ

バスケットボールを観戦していると様々なスタッツを見かけたり、耳にしたりすることが多いかと思います。

FG%、AST、REBといったスタッツであればイメージがつきやすいですが、Rating、PACE、eFG%といったスタッツには馴染みがなく、私はそのようなスタッツを目にするたびにインターネットで調べていました。

NBAに関しては公表されているスタッツが特に豊富であり、その豊富なスタッツを見ているうちに、「これらスタッツを利用してバスケットボールの分析が出来れば、チームやプレイヤーの特徴と傾向が分かってバスケ観戦が更に楽しくなるのではないか」と思いつきました。

そこで、バスケットボールのスタッツを使った分析についてインターネットで調べていくうちに、今回紹介する書籍『Basketball Data Science: With Applications in R』に辿り着きました。

書籍の概要を確認してみると、NBAのスタッツとフリー統計ソフトRを利用してバスケットボールの分析を実践するとの記載があり、統計ソフトRは学生時代に講義で触れた経験もあったことから、「この本を参考にすればバスケの分析が出来そうだ」と思い購入に至りました。

書籍『Basketball Data Science: With Applications in R』の内容の紹介

本書では、フリー統計ソフトRのパッケージであるBasketballAnalyzeRを使いながらバスケットボールのデータ分析が進められていきます。(※BasketballAnalyzeRの詳細はGitHubで公開されています。)

このBasketballAnalyzeRにはデフォルトでNBA 2017–18シーズンのデータが格納されているので、本書を読み進めながら自分でも書籍と同じ分析を実際に行うことが出来ます。

また、NBA公式ウェブサイトから最新シーズンのスタッツを収集すれば、そのスタッツを使って同様の分析手法により最新スタッツの分析が手軽に出来る点が便利だなと思いました。

なお、本書は6章構成となっており、バスケットボールのデータ分析が具体的に紹介されている章は第2章~第5章となります。

実際に本ブログで実践した分析もありますので、それらを交えながら第2章~第5章のおおまかな内容を下記で紹介していきます。

第2章の内容

第2章では、バスケットボールのデータ分析に使うデータの説明や、データの図表化の方法などが中心に紹介され、これからの分析にあたってどのようなデータを扱っていくのかを把握することが出来ます。

データを使って作成する図表として棒グラフ、散布図、レーダーチャート、バブルプロットなどが紹介されており、これらの図表を用いることでデータの分布、散らばり、偏りなどを視覚的にわかりやすく捉えることが可能となります。

本ブログではNBA 2022–23シーズンのスタッツを使って実際に散布図を作成し、プレーオフ進出の有無により各スタッツにおけるチームの分布に何らかの傾向があるかどうかを確認していますので、よろしければ下記の記事をご参考ください。

なお、ケビン・デュラントのフィールドショットを例に、ショットチャートの作成方法もこの第2章で紹介されています。

第3章の内容

第3章では、データ間における関連性、類似性、傾向といったような多数のデータの中に埋もれてしまっている一定のパターンを見つけることに焦点をあてた内容となっています。

スタッツ間の相関関係の確認、多次元尺度構成法によるNBAプレイヤーのマップ作成、ネットワーク分析を使ったゴールデンステイト・ウォリアーズのアシストの傾向、密度推定を用いた同チームのフィールドショットの特徴の視覚化などが紹介され、スタッツ間の関連性やスタッツに基づくプレイヤーの類似性、プレーの傾向などを検討していきます。

一例として、本ブログではNBA 2022–23シーズンのスタッツを使って、ネットワーク分析によるデンバー・ナゲッツのチーム内のアシストの傾向を確認していますので、よろしければ下記の記事をご参考ください。

第4章の内容

第4章では、クラスター分析を中心にデータのグループ化やカテゴライズを目的とした分析手法が紹介されています。

K-means法による非階層的クラスター分析を用いてNBA全30チームのグループ化や、ゴールデンステイト・ウォリアーズのフィールドショットのグループ化を行ったり、ウォード法による階層的クラスター分析を用いたNBAプレイヤーのグループ化が行われたりしています。

また、上記の分析から得られた結果をもとに本章の最後のほうでは、伝統的な5つのポジション(PG、SG、SF、PF、C)を拡張させ、新たに13のポジションを再定義している点が印象的でした。

一例として、本ブログではNBA 2022–23シーズンのスタッツを使って、ウォード法による階層的クラスター分析を用いたNBAプレイヤーのグループ分けを行っていますので、よろしければ下記の記事をご参考ください。

第5章の内容

第5章では、バスケットボールのスタッツに関して一定のモデルを想定した回帰分析が紹介されており、実際に本書ではアシストのスタッツを使ってターンオーバーを予測するモデルの回帰結果などが示されています。

また、フィールドショットに関する成功確率とスコアリング期待値の算出といった分析手法も紹介され、ゴールデンステイト・ウォリアーズの実際のスタッツを使ってクレイ・トンプソン、ステフィン・カリーといったプレイヤーのフィールドショットの成功確率とスコアリング期待値が示されていきます。

一例として、本ブログではNBA 2022–23シーズンのスタッツを使って、ジョエル・エンビード、ルカ・ドンチッチ、デイミアン・リラードのスコアリング期待値の算出を行っていますので、よろしければ下記の記事をご参考ください。

良かった点と注意すべき点

続いて、実際に本書を読んでみて、個人的に感じた「良かった点」と「注意すべき点」を下記にまとめました。

Basketball Data Science: With Applications in R (Chapman & Hall/CRC Data Science Series) (English Edition)


良かった点

良かった点の1つめは、自分自身で分析を実践することで、これまで注目してこなかったプレイヤーに対して、新たに注目するきっかけが生まれるという点が挙げられます。

例えば、下記の記事では2023–24シーズンのルーキープレイヤーに焦点をあてた上で、多次元尺度構成法によるNBAプレイヤーのマップを作成した結果、スタッツの類似性という観点からデトロイト・ピストンズのアサー・トンプソン、ダラス・マーベリックスのデレック・ライブリーⅡに注目するきっかけが生まれました。

良かった点の2つめは、NBAにおいて通説とされている事柄に関して、自分なりの分析を通してその通説に対する根拠を持つことが出来るという点です。

例えば、3Pライン付近から放たれるミドルシュートは効率が悪く避けられる傾向があるという通説に対して、下記の記事では実際に自分で2022–23シーズンの複数チームのショットチャートを作成し、傾向としてミドルレンジにおけるショット試投数が少なく、その成功率は低くなっていることを確認したりしています。

また、下記の記事ではジョエル・エンビード、ルカ・ドンチッチ、デイミアン・リラードの2022–23シーズンにおけるスコアリング期待値を算出した結果、ルカ・ドンチッチとデイミアン・リラードに関してはミドルレンジにおけるスコアリング期待値よりも3Pエリアにおけるスコアリング期待値のほうが高い傾向にあることが確認できました。

注意すべき点

続いて、本書を読んで感じた2つの「注意すべき点」を記載していきます。

注意点の1つめは、本書はあくまでもバスケットボールのデータ分析を紹介する書籍であり、統計学を基礎から詳しく解説する書籍ではないため、統計学の学習に関しては他の書籍やウェブサイトを別途参考にする必要があるという点が挙げられます。

本書の始めのほうでも、読者は大学の基礎課程で通常教えられているレベルの統計学の知識を最低限有していることを前提にしているという旨の記載があり、読者層としては大学の専攻過程、修士課程、博士課程の学生や、スポーツコーチ、スポーツアナリスト、データサイエンティストなどを想定しているようです。

このような記述を見ると本書を手に取るのにハードルが高くなりそうですが、個人的には本書を読み進めるのに統計分野におけるそこまでの専門知識や実務経験は必要ないかなと感じました。

実際に私の場合は、大学で統計学に関する講義を2つぐらい履修した程度で、統計学を専攻していたわけではありませんし、統計学の知識に関しても統計検定2級は合格、準1級は勉強中レベルの知識です。(※統計検定の詳細については、統計検定の公式ウェブサイトをご確認ください。)

そのため、私に関しては統計学の理論的な背景が十分に理解できない論点(密度推定、多次元尺度構成法、ネットワーク分析など)も多いのですが、とりあえずは統計ソフトRから出力された結果の見方を学んで、それらを比較・検討するだけで十分楽しめています。

なお、上記で述べた注意点は統計ソフトRの使用方法に関しても同様のことが言え、統計ソフトRの詳しい使用方法なども他の書籍やウェブサイトを別途参考にする必要があります。

続いて注意点の2つめは、本書は全編が英語で執筆されているため、人によってはこの点が本書を読み進める上での最大のネックになるのではないかという点が挙げられます。

私は英語が得意ではないのですが、無料で使えるDeepL翻訳を使うことで何とか本書を読み進めることが出来ました。

なお、私の場合は電子書籍で購入して下記の手順で翻訳を進めていましたので、もし購入を検討されている方がいらっしゃればご参考いただけると幸いです。

  • ①iPadで翻訳したいページのスクリーンショットを撮る
  • ②スクリーンショットで撮った画像ファイルを写真アプリで開く
  • ③写真アプリで開いたら翻訳したい文章をコピーし、DeepL翻訳へ貼り付けて翻訳する

上記の手順で翻訳を行いながら、日本語で書かれた統計学の参考書やウェブサイトを補完的に確認すれば、英語が苦手な人であっても本書のおおまかな内容を把握することは十分可能だと思います。

さいごに

今回紹介した書籍『Basketball Data Science: With Applications in R』では多岐にわたる分析が掲載されており、それら全てを紹介することは出来なかったのですが、自分が読み進めた範囲内で簡単に紹介してみました。

本書を参考することにより、チームやプレイヤーの特徴と傾向を具体的な数値を交えながら捉えることが出来るようになったり、自分の好きなチームやプレイヤーに対して様々な観点からのデータ分析が出来るようになったりしますので、バスケットボールがより一層魅力的なものになると思います。

以上を踏まえて、本書は下記のような方へおすすめできる書籍となっています。

  • バスケの試合で記録されるスタッツに興味がある方
  • スタッツを使って実際にデータ分析をしてみたい方
  • 学校や仕事でデータや数値を取り扱う作業をしていて、趣味であるバスケでもデータを使った考察をしてみたい方
  • 大好きなバスケを題材にして統計学や統計ソフトRの使い方を学習したい方…など

もちろん上記に該当しない方でもバスケットボールのデータ分析に興味があれば、ぜひ本書をチェックしてみてください。

それでは、最後まで本記事を読んで頂きありがとうございました。

タイトルとURLをコピーしました