JRA-VAN、過去の統計から収集できるようなデータができるだけ望ましいです。
下記を見る限り、競馬新聞に載っていることほとんど全て、と言えるでしょうね。
http://yukke-no-kobeya.ddo.jp/ke_100.html
( 1)騎手
( 2)父馬
( 3)調教師
( 4)母父馬
( 5)生産地
( 6)馬齢
( 7)収得賞金額
( 8)レース経験数
( 9)馬番
(10)斤量
(11)馬体重
その他にも、取り上げたらきりが無い程の要素が考えられるようです。
回答ありがとうございます。
補足で
騎手・調教師・血統等の、引退や怪我・新しい騎手・血統の台頭など、年度・時期別で大きく揺れ動きそうなデータについては除かせてください。
「取り上げたらきりが無い程の要素」。ご指摘のとおりでした。説明がヘタクソで申し訳ないです。他のデータと複合してではなく、特定のレースを対象としてではなく、普遍的に、単独で影響(メリット・デメリット)を与えるだろうと考えられる要素で、統計・比較をできるようなデータができるだけ望ましいです。
望ましい例:競争間隔、休養明けなど。
望ましくない例:
収得賞金額(ある特定のレースを対象とした場合の条件としては有効であるが、普遍的ではなくサンプル数が少なくなると思われるため)、
馬場状態(良馬場を走る馬と不良馬場を走る馬とが同時に走ることはありえないため、単独では比較不可能と思われる)など。
説明がヘタクソですが、引き続きよろしくお願いいたします。