2012-05-09から1日間の記事一覧

がくしゅう(仮)でがっかり

懲りずにTD(1)-leafで学習させてみた。 3000局程度自己対局(回数が不十分) 1手0.1秒の反復深化 評価項目は 駒割 KKP KPP 10対局ごとにパラメータの更新 L1正則化(メタパラメータは0.0005) という条件で学習してみた。で対局実験を行った結果、CSAの大会のプ…