Tour de France 2010 : Doping Suspicious Scores

Union Cycliste Internationale(UCI) は Tour de France 2010 の参加選手に対してドーピング検査 biological password に基づいて doping suspicious score を0(低)から10(高)の11段階にスコア化しており、そのリストがリークしたことを “The Science of Sport” のブログで知る。同ブログではL’Equipe の集計をもとにしたローデータがコピペされているだけだったので、グラフにしてみた。

Number of Riders by Suspicious Scores

ちなみに最高スコアの10に君臨する神は以下の2選手

面白そうなところでは

  • Alberto Contador(5)
  • Lance Armstrong(4)
  • Mark Cavendish(2)
  • Fabian Cancellara(0)

Total Scores by Team

Cofidis(4) のスコアが極端に低く、Astana(39)、RadioShack(40)が少し高め。

チーム内の分布がわかるように density plot  すると次のようになる。

Astana と RadioShack はほぼ同スコアでともに高いが、分布傾向は大きく異なることがわかる。

Mean Scores by Nation

左上は見にくいけれども Kazakhstan と Ukraine。画像をクリックすると大きくなります。マイナーな国(日本とか)は L’Equipe の集計からは外されている。
無理やりセグメント化すれば

  • 左下:選手の数が少なく、疑わしい人もいない国
  • 左上:少数精鋭のドーピング部隊(Kazakhstan, Ukraine, Russia, Belarus)
  • 右下:選手の数は多いが、モラルの良い国(France)
  • 右上:略(Spain, Italy)
国別のスコア分布がわかるように density plot  すると次のようになる。(選手が5人以上いる国が対象)

フランス、オランダは優等生。

スコアを国別のヒートマップにすると次のようになる。(選手が5人以上いる国が対象)


面積が小さい国の判別が難しい。エリアを西ヨーロッパに絞るべきか、、、

Participant Numbers by Nation

国別の参加者数のヒートマップは次のようになる。

フランスとスペインの参加者がおおい。

Advertisements

Leave a comment

Filed under bike

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s