※ 当サイトは、アフィリエイト広告を利用しています。

【K-means法による非階層的クラスター分析を用いてNBAチーム内のフィールドゴールのグループ分けをしよう②】クラスター分析の観点から2022-23シーズンにおけるミルウォーキー・バックスのフィールドゴールの特徴や傾向を捉える

記事内に広告が含まれています。
スポンサーリンク

今回は前回記事のクラスター分析の結果を踏まえて、ミルウォーキー・バックスの各クラスター内におけるフィールドゴール試投数に関する偏りと、各プレイヤーのフィールドゴールの特徴と傾向を確認していきたいと思います。(※本記事は前回記事からの続きとなります。まだ前回の記事をご覧になられていない方は、よろしければ下記より前回の記事をご覧ください。)

使用する統計ソフトはR、データは前回記事から引き続き2022-23シーズンのPbP. BDB(過去記事参照)を使用します。

なお、今回の記事では、各クラスター内におけるフィールドゴール試投数に関する偏りを確認する際に、ジニ係数の算出を行います。

ジニ係数に関しては過去記事で扱っていますので、よろしければ下記の過去記事をご参考ください。

それでは、ジニ係数を用いて、各クラスター内におけるフィールドゴール試投数の偏りを確認していきたいと思います。

※データ分析を実践する際に参考にしている書籍『Basketball Data Science: With Applications in R』の紹介記事も書きましたので、よろしければご確認ください。

各クラスター内におけるフィールドゴール試投数に関する偏り<ヤニス・アデトクンボ、ブルック・ロペス、ドリュー・ホリデー、ボビー・ポーティスにFG試投が集中している>

まずは、各プレイヤーのフィールドゴール本数について、クラスター別の内訳を下記に示します。

> shots.plMIL                        
                           1   2   3   4   5   6
  AJ Green                30  37   4   3   3  48
  Bobby Portis           133 104 181 192 115 119
  Brook Lopez            100 183 146 187 199 151
  George Hill             41  15  29  15   5  27
  Giannis Antetokounmpo   88 164 251 255 504  70
  Goran Dragic            12   2   8   7   1   8
  Grayson Allen           62 182  32  69  93 160
  Jae Crowder             25  23   8  15  10  26
  Jevon Carter           119 137  38  70  48 162
  Joe Ingles              98  35  21  14   8  95
  Jordan Nwora            45  29  25  39  17  42
  Jrue Holiday           189 177 147 215 183 197
  Khris Middleton         97  96  67  73  69  90
  Lindell Wigginton       10   3   6   5   6   7
  MarJon Beauchamp        59  48  35  25  28  51
  Meyers Leonard           6   6   4   3   4   7
  Pat Connaughton         98 125  29  39  39 121
  Sandro Mamukelashvili   18   8  12   8   5   7
  Serge Ibaka             10   4  13  16   4   7
  Thanasis Antetokounmpo   5   3  13  16   9   0
  Wesley Matthews         64  22  16  19   5  43

上記の集計表では、行ごとにプレイヤー名と各クラスターに属するそのプレイヤーのフィールドゴール本数が列挙されています。(例えば、先頭のAJ・グリーンの場合はクラスター1に属するフィールドゴールは30本、クラスター2に属するフィールドゴールは37本、クラスター3に属するフィールドゴールは4本・・・というような見方になります。)

上記の集計表を概観すると、ボビー・ポーティス、ブルック・ロペス、ヤニス・アデトクンボ、ドリュー・ホリデーの4プレイヤーのフィールドゴール本数が、全体的に多くなっていることがわかります。

次に、上記のフィールドゴール本数を用いて算出した各クラスターのジニ係数を下記に示します。(※参考のために、前回記事でまとめた各クラスターの特徴もあわせて再掲します。)

各クラスターに属するフィールドゴールに関するジニ係数<ミルウォーキー・バックス2022-23シーズン>
  • クラスター1:クォーターの終盤で失敗したフィールドゴール(ノーチャージセミサークルエリア内を除く)で、その構成は主に3Pシュートが中心となる。playlengthの水準が平均をやや下回ることから、やや早い展開で試投したフィールドゴールが属する。
  • クラスター2:クォーターの序盤で失敗したフィールドゴール(ノーチャージセミサークルエリア内を除く)で、その構成は主に3Pシュートが中心となる。playlengthの水準が平均をやや上回ることから、やや遅い展開で試投したフィールドゴールが属する。
  • クラスター3:クォーターの終盤で試投したフィールドゴール(3Pシュートを除く)で、その構成は主にペイントエリア内とその周辺からのフィールドゴールが中心となる。Playlengthの水準が最も低いことから、早い展開で試投したフィールドゴールが属する。
  • クラスター4:クォーターの中盤で試投したフィールドゴールで、その構成は主にペイントエリア内とその周辺からのフィールドゴールが中心となる。playlengthの水準が最も高いことから、遅い展開で試投したフィールドゴールが属する。
  • クラスター5:クォーターの序盤で試投したフィールドゴール(3Pシュートを除く)で、その構成は主にペイントエリア内とその周辺からのフィールドゴールが中心となる。playlengthの水準が平均を下回ることから、比較的早い展開で試投したフィールドゴールが属する。
  • クラスター6:クォーターの中盤で成功したフィールドゴール(ノーチャージセミサークルエリア内を除く)で、その構成は主に3Pシュートが中心となる。playlengthの水準が平均的であることから、チームの標準的なテンポで試投したフィールドゴールが属する。

上記のチャートを確認すると、クラスター5のジニ係数が最も高い75.06%となっていることから、バックスにおいてはクラスター5に属するフィールドゴールの偏りが最も大きいことがわかります。

クラスター5に属する実際のフィールドゴールを集計表で確認すると、ヤニス・アデトクンボの504本が群を抜いて多く、次いでブルック・ロペスの199本、ドリュー・ホリデーの183本が続きます。

また、クラスター4のジニ係数63.79%とクラスター3のジニ係数62.86%も比較的高い水準であり、両クラスターにおいてはヤニス・アデトクンボ、ブルック・ロペス、ドリュー・ホリデー、ボビー・ポーティスの4プレイヤーにフィールドゴールが偏っていることが読み取れます。

上記の各クラスターの特徴を考慮すると、クラスター3、クラスター4、クラスター5に関してはペイントエリア内とその周辺からのフィールドゴールが主な構成となっていることから、バックスにおいてはリングに近い距離~ミドルレンジまでのエリアからフィールドゴールを放つプレイヤーの偏りが、比較的大きくなっていることがわかります。

一方、フィールドゴールのうち3Pシュートが主に属しているクラスター1、クラスター2、クラスター6のジニ係数はそれぞれ45.27%、56.59%、51.22%と比較的低い水準であることから、バックスにおいては3Pシュートを放つプレイヤーの偏りは、比較的小さいということが読み取れます。

なお、上記のジニ係数を出力するためのコマンドは下記のとおりです。(前回記事で扱ったコマンドをすべて入力していることが前提となっています。)

> shots.plMIL <- table(shotsMIL$player, shotsMIL$cluster)
> XineqMIL <- as.data.frame.matrix(shots.plMIL)
> no.clu <- 6
> p <- vector(no.clu, mode="list")
> for (k in 1:no.clu) { 
+      ineqC <- inequality(XineqMIL[,k], npl=nrow(XineqMIL)) 
+      title <- paste("Cluster", k) 
+      p[[k]] <- plot(ineqC, title=title)
+ }
> library(gridExtra)
> grid.arrange(grobs=p, nrow=2) #grid.arrange()を使ってショットチャートを2行3列で出力

続いて、各プレイヤーが放ったフィールドゴールにつき、所属クラスター別の割合を棒グラフを用いて確認していきます。

各プレイヤーのクラスター別のフィールドゴールの傾向と特徴<バックスのNBA2022-23シーズン>

まずは、各プレイヤーのフィールドゴール本数に関して、所属クラスター別の割合を下記に示します。

> shots.percMIL                        
                                  1          2          3          4          5          6
  AJ Green               0.24000000 0.29600000 0.03200000 0.02400000 0.02400000 0.38400000
  Bobby Portis           0.15758294 0.12322275 0.21445498 0.22748815 0.13625592 0.14099526
  Brook Lopez            0.10351967 0.18944099 0.15113872 0.19358178 0.20600414 0.15631470
  George Hill            0.31060606 0.11363636 0.21969697 0.11363636 0.03787879 0.20454545
  Giannis Antetokounmpo  0.06606607 0.12312312 0.18843844 0.19144144 0.37837838 0.05255255
  Goran Dragic           0.31578947 0.05263158 0.21052632 0.18421053 0.02631579 0.21052632
  Grayson Allen          0.10367893 0.30434783 0.05351171 0.11538462 0.15551839 0.26755853
  Jae Crowder            0.23364486 0.21495327 0.07476636 0.14018692 0.09345794 0.24299065
  Jevon Carter           0.20731707 0.23867596 0.06620209 0.12195122 0.08362369 0.28222997
  Joe Ingles             0.36162362 0.12915129 0.07749077 0.05166052 0.02952030 0.35055351
  Jordan Nwora           0.22842640 0.14720812 0.12690355 0.19796954 0.08629442 0.21319797
  Jrue Holiday           0.17057762 0.15974729 0.13267148 0.19404332 0.16516245 0.17779783
  Khris Middleton        0.19715447 0.19512195 0.13617886 0.14837398 0.14024390 0.18292683
  Lindell Wigginton      0.27027027 0.08108108 0.16216216 0.13513514 0.16216216 0.18918919
  MarJon Beauchamp       0.23983740 0.19512195 0.14227642 0.10162602 0.11382114 0.20731707
  Meyers Leonard         0.20000000 0.20000000 0.13333333 0.10000000 0.13333333 0.23333333
  Pat Connaughton        0.21729490 0.27716186 0.06430155 0.08647450 0.08647450 0.26829268
  Sandro Mamukelashvili  0.31034483 0.13793103 0.20689655 0.13793103 0.08620690 0.12068966
  Serge Ibaka            0.18518519 0.07407407 0.24074074 0.29629630 0.07407407 0.12962963
  Thanasis Antetokounmpo 0.10869565 0.06521739 0.28260870 0.34782609 0.19565217 0.00000000
  Wesley Matthews        0.37869822 0.13017751 0.09467456 0.11242604 0.02958580 0.25443787

上記の集計表では、行ごとにプレイヤー名と各クラスターに属するフィールドゴールの割合が列挙されています。(例えば、先頭のAJ・グリーンの場合、クラスター1に属するフィールドゴールの割合は約24.0%、クラスター2に属するフィールドゴールの割合は約29.6%、クラスター3に属するフィールドゴールの割合は約3.2%・・・というような見方になります。)

次に、フィールドゴールの割合と試投数を用いて作成した棒グラフと折れ線グラフを、下記に示します。

各プレイヤーの所属クラスター別のフィールドゴールの割合と試投数<ミルウォーキー・バックス2022-23シーズン>

上記のグラフに関して、棒グラフはフィールドゴールの割合を所属クラスター別に積み上げ、折れ線グラフはフィールドゴール試投数を表しています。

左側の縦軸はフィールドゴールの割合、右側の縦軸はフィールドゴール試投数を表示し、フィールドゴール試投数が多いプレイヤーを左から順番に並べています。

上記のグラフを確認すると、ヤニス・アデトクンボについては、クラスター5に属するフィールドゴール(リング回りからミドルレンジまでに関するショット)の割合(約37.8%)の大きさが目立つ一方で、クラスター1、クラスター2、クラスター6に属するフィールドゴール(3Pシュートに関するショット)の割合(それぞれ約6.6%、約12.3%、約5.3%)が小さいことがわかります。

また、ブルック・ロペスについては、それぞれの割合がバランス良く配分され、その中でもクラスター1に属するフィールドゴール(3Pシュート失敗に関するショット)の割合(約10.4%)が小さくなっており、ボビー・ポーティスについては、クラスター3とクラスター4に属するフィールドゴール(リング回りからミドルレンジまでに関するショット)の割合(それぞれ約21.4%、約22.7%)が大きくなっていることが読み取れます。

さらに、ドリュー・ホリデーについては、フィールドゴール試投数の上位4プレイヤーの中では、比較的クラスター6に属するフィールドゴール(3Pシュート成功に関するショット)の割合(約17.8%)が大きくなっていますが、その一方でクラスター1とクラスター2に属するフィールドゴール(3Pシュート失敗に関するショット)の割合(それぞれ約17.1%、約16.0%)も比較的大きくなっていることがわかります。

上記のドリュー・ホリデーに関する傾向は、クラスター6に属するフィールドゴールの割合が大きいプレイヤー(グレイソン・アレン、ジェヴォン・カーター、パット・コノートン、ジョー・イングルス、AJ・グリーンなど)に共通して見られる傾向となっています。

なお、上記のグラフを出力するためのコマンドは下記の通りです。

> shots.percMIL <- shots.plMIL/rowSums(shots.plMIL)
> XbarMIL <- data.frame(player=rownames(shots.plMIL), rbind(shots.percMIL), FGA=rowSums(shots.plMIL))
> labclusters <- c("Cluster 1","Cluster 2","Cluster 3", "Cluster 4","Cluster 5","Cluster 6")
> barline(data=XbarMIL, id="player", line="FGA",bars=c("X1","X2","X3","X4","X5","X6"), order.by="FGA", label.line="MIL : Field goals attempted in 2022-23", labels.bars=labclusters) #棒グラフと折れ線グラフを作成するコマンド

おわりに

今回は、前回記事のクラスター分析の結果を踏まえて、各クラスター内におけるフィールドゴール試投数に関する偏りと、各プレイヤーのクラスター別のフィールドゴールの割合を確認していきました。

ジニ係数を用いることで、各クラスター内のフィールドゴール試投数の偏りを数値化して把握し、クラスター分析の結果を考慮することで、各プレイヤーの放つフィールドゴールの特徴や傾向を把握することが出来ました。

今回はバックスについて分析を進めていきましたが、フィールドゴールに強みを持つ他のチームについても同様の分析を行うことで、そのチーム特有の傾向や特徴を把握することができるかと思います。

なお、本記事は、記事の最後に紹介している書籍を参考にして作成しています。

それでは、今回のトラッシュトークは以上です。

【参考書籍】

Paola Zuccolotto and Marica Manisera (2020), Basketball Data Science – with Applications in R. Chapman and Hall/CRC. ISBN 9781138600799.
※本書籍の紹介記事を書いていますので、よろしければご参考ください。

タイトルとURLをコピーしました