本記事は、レギュラー・シーズンごとに作成する記事「NBAチームとプレイヤーから見るリーグ全体の特徴と傾向」に関して、補足と説明を行う記事です。
当該記事をご覧の際に、本記事をご参考ください。
- 「NBAチームの基本スタッツ」の説明
- 「NBAチームのPOSS, PACE, Ratings, Four Factorsと散布図」の説明
- 「各種スタッツを用いた相関行列」の説明
- 「各種スタッツを用いたNBAチームのバブルチャート」の説明
- 「基本スタッツを用いたNBAチームのレーダーチャート」の説明
- 「NBAチームの分類 ~K-means法による非階層的クラスター分析~」の説明
- 「獲得点数とアシスト数における偏りの度合いをチーム別に数値化 ~ジニ係数~」の説明
- 「NBAのリーグ全体のシュートチャートとフィールドショット分布」の説明
- 「NBAプレイヤーのマッピング ~多次元尺度構成法~」の説明
- 「NBAプレイヤーの分類 ~ウォード法による階層的クラスター分析~」の説明
「NBAチームの基本スタッツ」の説明
- GP:試合数
- MIN:試合時間
- PTS:獲得点数
- W:勝数
- L:負数
- P2M : 2Pシュート成功数
- P2A:2Pシュート試投数
- P2p:2Pシュート成功率
- P3M : 3Pシュート成功数
- P3A:3Pシュート試投数
- P3p:3Pシュート成功率
- FTM : フリースロー成功数
- FTA:フリースロー試投数
- FTp:フリースロー成功率
- OREB:オフェンスリバウンド数
- DREB:ディフェンスリバウンド数
- AST : アシスト数
- TOV:ターンオーバー数
- STL : スティール数
- BLK : ブロック数
- PF:個人ファウル数
- PM:プラス/マイナス
「NBAチームのPOSS, PACE, Ratings, Four Factorsと散布図」の説明
「POSS, PACE, Ratings, Four Factors(eFG%、TO Ratio、REB%、FT Rate)」の説明
- POSS.Off : 自チームの攻撃権回数
- POSS.Def : 自チームの守備回数
- PACE.Off : 試合時間1MINあたりの自チームの攻撃権回数
- PACE.Def : 試合時間1MINあたりの自チームの守備回数
- ORtg : 100 POSS.Offあたりの自チームの獲得点数
- DRtg : 100 POSS.Defあたりの自チームの失点数
- F1.Off : 自チームのeFG%
- F2.Off : 自チームのTO Ratio
- F3.Off : 自チームのオフェンスリバウンドに関するREB%
- F4.Off : 自チームのFT Rate
- F1.Def : 対戦チームのeFG%
- F2.Def : 対戦チームのTO Ratio
- F3.Def : 自チームのディフェンスリバウンドに関するREB%
- F4. Def : 対戦チームのFT Rate
- Playoff:”PO”はPlayoff進出あり、”PI”はPlay-inで敗退、”NO”はPlayoffとPlay-inともに進出なし。
※Four FactorsのeFG%、TO Ratio、REB%、FT Rateの説明はこちら。
「PACEの散布図」の説明
PACEの散布図内の各エリアには、下記の特徴を持つチームが属する。
- 左下エリア周辺:試合の展開やテンポがゆっくりしているチーム
- 右上エリア周辺:試合の展開やテンポが早いチーム
「ORtg、DRtgの散布図」の説明
ORtg、DRtgの散布図内の各エリアには、下記の特徴を持つチームが属する。
- 左下エリア:ディフェンス効率性は高いが、オフェンス効率性が低い
- 右下エリア:オフェンス効率性、ディフェンス効率性がともに高い
- 右上エリア: オフェンス効率性は高いが、ディフェンス効率性が低い
- 左上エリア:オフェンス効率性、ディフェンス効率性がともに低い
「eFG%の散布図」の説明
eFG%の散布図内の各エリアには、下記の特徴を持つチームが属する。
- 左下エリア:自チームのフィールドショット精度、対戦チームのフィールドショット精度がともに低い
- 右下エリア:自チームのフィールドショット精度が高く、対戦チームのフィールドショット精度は低い
- 右上エリア:自チームのフィールドショット精度、対戦チームのフィールドショット精度がともに高い
- 左上エリア:自チームのフィールドショット精度が低く、対戦チームのフィールドショット精度は高い
「TO Ratioの散布図」の説明
TO Ratioの散布図内の各エリアには、下記の特徴を持つチームが属する。
- 左下エリア:自チームのターンオーバー率、対戦チームのターンオーバー率がともに低い
- 右下エリア:自チームのターンオーバー率は高いが、対戦チームのターンオーバー率は低い
- 右上エリア:自チームのターンオーバー率、対戦チームのターンオーバー率がともに高い
- 左上エリア:自チームのターンオーバー率は低く、対戦チームのターンオーバー率が高い
「REB%の散布図」の説明
REB%の散布図内の各エリアには、下記の特徴を持つチームが属する。
- 左下エリア:オフェンスリバウンド率、ディフェンスリバウンド率がともに低い
- 右下エリア:オフェンスリバウンド率は高いが、ディフェンスリバウンド率は低い
- 右上エリア:オフェンスリバウンド率、ディフェンスリバウンド率がともに高い
- 左上エリア:オフェンスリバウンド率は低いが、ディフェンスリバウンド率は高い
「FT Rateの散布図」の説明
FT Rateの散布図内の各エリアには、下記の特徴を持つチームが属する。
- 左下エリア:自チームのフリースロー成功率、対戦チームのフリースロー成功率がともに低い
- 右下エリア:自チームのフリースロー成功率が高く、対戦チームのフリースロー成功率は低い
- 右上エリア:自チームのフリースロー成功率、対戦チームのフリースロー成功率がともに高い
- 左上エリア:自チームのフリースロー成功率が低く、対戦チームのフリースロー成功率は高い
「各種スタッツを用いた相関行列」の説明
相関行列に関しては、スタッツ名が記載されている対角線上の要素の下三角部分で各スタッツ間の相関係数を示している。
一方、対角線上の要素の上三角部分では、楕円形と色分けにより相関関係の強弱が表現されている。
ここでは、右上がりの楕円形であれば正の相関関係、右下がりの楕円形であれば負の相関関係を表し、楕円形が細くなるほど相関関係が強くなることを示す。
また、相関係数0は白色で表示され、相関係数が1に近づくにつれ赤色へ変化し、反対に相関係数が-1に近づくと青色へ変化していく。
なお、相関行列内の”×”がついている要素については、相関係数の無相関検定において有意な差が認められず、対立仮説「母集団において相関は0ではない」が採択されなかったことを表している。(無相関検定に関してはこちら。)
チャートに関しては、中程度以上の相関関係がある組み合わせ(相関係数の絶対値が0.4以上※①)に限定し、スタッツ間を結ぶラインとその色でそれぞれの相関関係の強弱を表現している。
色分けの表示に関しては先に示した相関行列と同様で、相関係数が1に近づくと赤色へ変化し、反対に相関係数が-1に近づくと青色へ変化する。
(※①) 相関関係の強弱の判断に関しては、山田剛史、杉澤武俊、村井潤一郎(2008)『Rによるやさしい統計学』オーム社のp 62 – p64を参考にしている。
「各種スタッツを用いたNBAチームのバブルチャート」の説明
「シュート成功率とシュート試投数を用いたバブルチャート」の説明
フリースロー成功率を表すバブルの色に関しては、成功率が高ければ赤色、成功率が低ければ紫色で示される。
また、シュート試投数を表すバブルの大きさに関しては、全チームのうち最小本数となったチームを0、最大本数となったチームを100として置き換え、各チームの本数を0~100の数値に変換した形式で表示されている。
なお、チャート内の各エリアには、下記の特徴を持つチームが属する。
- 左下エリア周辺:2Pシュート成功率、3Pシュート成功率がともに低い
- 右上エリア周辺:2Pシュート成功率、3Pシュート成功率がともに高い
「ディフェンス関連スタッツとプラスマイナスを用いたバブルチャート」の説明
プラス / マイナス(※①)を表すバブルの色に関しては、得失点差のプラスが拡がれば赤色、得失点差のマイナスが拡がれば紫色で示される。(※① ここではそのチームのシーズンを通しての得失点差としている。一般的には、特定の選手につき、その選手が出場していた時間帯のチーム全体の得失点差をいう。)
また、スティール数を表すバブルの大きさに関しては、全チームのうち最小スティール数となったチームを0、最大スティール数となったチームを100として置き換え、各チームのスティール数を0~100の数値に変換した形式で表示されている。
なお、チャート内の各エリアには、下記の特徴を持つチームが属する。
- 左下エリア:ディフェンスリバウンド数、ブロック数がともに少ない
- 右下エリア:ディフェンスリバウンド数は多いが、ブロック数は少ない
- 右上エリア:ディフェンスリバウンド数、ブロック数がともに多い
- 左上エリア:ディフェンスリバウンド数は少ないが、ブロック数は多い
「基本スタッツを用いたNBAチームのレーダーチャート」の説明
レーダーチャート内にある青色の点線は平均値(標準化のため平均0)を表している。それぞれのスタッツにつき、青色の点線より外側に位置すればその水準は平均値より高く、内側に位置すればその水準は平均値より低いということになる。
レーダーチャートの作成に関して、取り得る値の幅が様々であるスタッツ(スティール数は300~500本程度、リバウンド数は3000本以上など)を複数使用することから、比較をしやすくするために全てのスタッツに対して標準化の処理を行っている。(参考サイト:統計WEBサイト「6. データの標準化」)
「NBAチームの分類 ~K-means法による非階層的クラスター分析~」の説明
「クラスター分析によるNBAチームの分類」の説明
- OD.Rtg = ORtg / DRtg
ディフェンスレーティングに対するオフェンスレーティングの比率(1.0超であれば良い) - F1.r = eFG%.Offense / eFG%.Defense
対戦チームのeFG%に対する自チームのeFG%の比率(1.0超であれば良い) - F2.r = TO Ratio. Defense / TO Ratio. Offense
自チームのTO Ratioに対する対戦チームのTO Ratioの比率(1.0超であれば良い) - F3.Off:REB%. Offense
オフェンスリバウンドに関する REB% - F3.Def:REB%. Defense
ディフェンスリバウンドに関する REB% - P3M:3Pシュート成功数
- STL.r = STLt / STLo
対戦チームのスティール数に対する自チームのスティール数の比率(1.0超であれば良い)
※ORtg, DRtg, eFG%, TO Ratio, REB%の説明はこちら。
「各種スタッツから見る各クラスターの特徴」の説明
レーダーチャート内に示されているCHIの数値は、各クラスターの変数の分散の平均値を表しており、下記の算式により算出される。
$$CHI _{h}=\dfrac{\sum ^{p}_{j=1}\sigma _{jh}^{2}}{p}$$
Paola Zuccolotto and Marica Manisera (2020), Basketball Data Science – with Applications in R. Chapman and Hall/CRC. ISBN 9781138600799.
\(p\)は変数の数、\(\sigma _{jh}^{2}\)は\(h\)番目のクラスター内の\(j\)番目の変数の分散を表しており、参考書籍としているP. Zuccolotto and M. Manisera (2020)では、CHIの数値は50%以下となっていることが望ましいとしている。(※本ブログでは、CHIが50%を超える場合は参考値扱いとしている。)
「クラスター別で見るプレーオフ・プレーイン進出チームの有無と平均勝利数」の説明
棒グラフは各クラスターに所属するチーム数を表し、左から順番にクラスター1から並べられている。折れ線グラフは各クラスターの平均勝利数を表している。
「クラスター別で見る得失点数とOD.Rtgのバブルチャート」の説明
OD.Rtgを表すバブルの大きさに関しては、全チームのうち最小OD.Rtgとなったチームを0、最大OD.Rtgとなったチームを100として置き換え、各チームのOD.Rtgを0~100の数値に変換した形式で表示されている。
なお、チャート内の各エリアには、下記の特徴を持つチームが属する。
- 左下エリア:獲得点数、失点数がともに少ない
- 右下エリア:獲得点数が多く、失点数は少ない
- 右上エリア:獲得点数、失点数がともに多い
- 左上エリア:獲得点数は少ないが、失点数が多い
「獲得点数とアシスト数における偏りの度合いをチーム別に数値化 ~ジニ係数~」の説明
「獲得点数とアシスト数に関するジニ係数を用いた散布図」の説明
散布図内の各エリアには、下記の特徴を持つチームが属する。
- 左下エリア:得点を稼ぐプレイヤーの偏り、アシストを出すプレイヤーの偏りがともに小さい
- 右下エリア:得点を稼ぐプレイヤーの偏りは大きいが、アシストを出すプレイヤーの偏りは小さい
- 右上エリア:得点を稼ぐプレイヤーの偏り、アシストを出すプレイヤーの偏りがともに大きい
- 左上エリア:得点を稼ぐプレイヤーの偏りは小さいが、アシストを出すプレイヤーの偏りは大きい
「NBAのリーグ全体のシュートチャートとフィールドショット分布」の説明
「コートを16エリアに区分したリーグ全体のシュートチャート」の説明
シュートチャート内で%表記されている数値は、そのエリアでのシュート成功率を表し、その下の()書きは「シュート成功数/シュート試投数」を示している。
また、シュートチャート内で示されている”playlength”とは、プレイヤーがシュートを放った場合に、そのシュートの直前のイベントからそのシュートを放つまでに何秒経過していたのかを表す。(※例えば、リバウンドを獲得(直前のイベント)した後、その5秒経過後にシュートを放ったのであれば”playlength”は「5」となる。また、対戦チームのターンオーバー(直前のイベント)の後、その10秒経過後にシュートを放ったのであれば”playlength”は「10」となる。)
コートは16のエリアに分割され、各エリアはそのエリア内で放たれたシュートの”playlength”の平均値で色分けされている。(※水色であれば”playlength”が早く、赤色に近づくにつれて”playlength”が遅くなる。)
「ヘックスビンマップ(Hexbin map)を用いたリーグ全体のシュートチャート」の説明
ヘックスビンマップ(Hexbin map)を用いたシュートチャートに関しては、シュートの頻度が最も高くなる範囲が赤色で表示され、赤色→白色→青色(下記を参照。)に変化するにつれシュートの頻度が低くなることを表す。
なお、シュートチャート上の六角形のビンは、シュートが放たれた各地点を表す。

「シュート距離から見たリーグ全体のフィールドショットの分布 ~密度推定~」の説明
分布図内において薄紫色で色分けされている部分は、ノーチャージセミサークルエリア(いわゆるノーチャージエリア)近辺のシュートを表しており、目安として0~4フィート(0~約1.2メートル)の距離で区分されている。
また、赤色で色分けされている部分は、3Pシュートを含む長距離シュートを表しており、目安として22フィート(約6.7メートル)以降の距離で対応している。
なお、紫色で示されている部分は、ノーチャージセミサークルエリアから3Pライン付近のエリア内で放たれたミドルシュートを表しており、目安として4~22フィート(約1.2~約6.7メートル)の距離で区分されている。
分布図内で%表記されている数値は、サンプルに取ったシュート本数の内そのエリアで放たれたシュート本数の割合を表す。また、その下の数値はサンプルに取ったシュート本数の内そのエリアで放たれたシュート本数を表す。なお、()書きはそのエリアにおけるシュート成功率を示している。(※サンプルではなく全数で計算されているケースもあり。)
「NBAプレイヤーのマッピング ~多次元尺度構成法~」の説明
「NBAプレイヤーのマップ」の説明
マップ上では、分析に使用した下記7スタッツ(※①)の成績が似ているプレイヤー同士が近くに配置され、その一方でスタッツ成績が似ていないプレイヤーほど遠くに配置される。(※多次元尺度構成法のおおまかな説明はこちら。)
- P2M : 2Pシュート成功数
- P3M : 3Pシュート成功数
- FTM : フリースロー成功数
- REB:ディフェンスリバウンド数とオフェンスリバウンド数の合計
- AST : アシスト数
- STL : スティール数
- BLK : ブロック数
マップ上では、各スタッツ(出場時間1MINあたり)のトップ7プレイヤーを赤色のハイライトで示している。(NBA公式ウェブサイトを参照)
また、マップに記されている横軸、縦軸の数値は特に意味を持っておらず、マップを見る際には各プレイヤー間の位置関係に注目していく。
なお、マップの右上に記載されているストレス値(Stress index)とは、多次元尺度構成法により表現したマップの当てはまりの良さを示す指標で、このストレス値が小さいほどマップの再現性が高いと評価される。
具体的なストレス値の目安は、0が「完全に適合」、0.025は「非常に良い適合」、0.050は「良い適合」、0.100は「悪くはない適合」、0.200は「良くない適合」とされている。(※②)
(※①)分析に使用した上記のスタッツ関しては、出場時間1MIN(分)あたりの数値に変換したものを使用している。
(※②) Kruskal, J.B. (1964), Multidimensional scaling by optimizing goodness of fit to a nonmetric hypothesis, Psychometrika, Vol. 29, p1–27. および永田 靖、棟近 雅彦(2001)「多変量解析法入門」サイエンス社, p167-168.を参照。
「等高線形式のヒートマップで見るマッピングの特徴」の説明
等高線形式のヒートマップは、分析に使用したスタッツの数だけ作成される。
ヒートマップでは、スタッツの水準が低いプレイヤーが集まるエリアは青色で表示され、反対にスタッツの水準が高いプレイヤーが集まるエリアは黄色で表示される。
また、等高線により特定のスタッツ水準を有するプレイヤーが、概ねどのエリア(どの範囲)に配置されているのかを把握することも可能となる。
「NBAプレイヤーの分類 ~ウォード法による階層的クラスター分析~」の説明
「NBAプレイヤーの分類 ~デンドログラム~」の説明
分析に使用した下記のスタッツに関しては、出場時間1MIN(分)あたりの数値に変換したものを使用している。
- PTS : 獲得点数
- P2M : 2Pシュート成功数
- P3M : 3Pシュート成功数
- REB:ディフェンスリバウンド数とオフェンスリバウンド数の合計
- AST : アシスト数
- TOV : ターンオーバー数
- STL : スティール数
- BLK : ブロック数