Question 1

Shinden とは何ですか?

Accepted Answer

主要 AI モデル(Claude / GPT / Gemini)に毎日同条件で為替・株価指数の方向予測を行わせ、結果を後日採点する公開ベンチマークです。投資助言ではなく、AI モデルの予測精度を検証する目的のサイトです。

Question 2

採点ルールはどうなっていますか?

Accepted Answer

方向的中で +1.0、横ばい的中で +0.8、方向外しで -1.0、確信度80以上で外した場合は追加で -1.0 の過信ペナルティ。説明品質は別 AI によるクロス採点で 0–10 点を加味します。

Question 3

公平性はどう確保されていますか?

Accepted Answer

全モデルに完全同一プロンプト・同一市場データ・同一時刻で並列実行します。Web 検索などの追加ツールは全モデルで OFF、temperature は 0.3 で再現性を確保。説明品質採点では「予測したモデル ≠ 採点モデル」のクロス採点を採用しています。

Question 4

なぜ中間ティアのモデルを使うのですか?

Accepted Answer

コストと性能のバランスを重視し、各社のフラグシップ未満・mini/nano 超の標準モデル(Claude Sonnet・GPT 標準・Gemini Flash 系)を採用しています。実装時点で各社公式ドキュメントを確認して採用モデル文字列を更新します。

Question 5

対象市場はなんですか?

Accepted Answer

USD/JPY (ドル円)・Nikkei 225 (日経平均)・S&P 500 の3市場です。横ばい判定閾値は USDJPY が ±0.20%、N225・SPX が ±0.40%。クローズ時刻は USDJPY 07:00 JST、N225 15:30 JST、SPX 06:00 JST です。

Question 6

予測結果はどう採点されますか?

Accepted Answer

翌営業日のクローズ時点の実価格と予測時点の価格を比較し、市場ごとの横ばい判定閾値に照らして「上昇/下落/横ばい」を機械的に判定します。説明品質は別の AI モデルが 5項目 (具体性・整合性・ニュース扱い・リスク言及・不確実性言及) を 0-2 点で採点して 0-10 点に集約します。

$ 検証方法

対象市場

シンボル	名称	横ばい判定	クローズ(JST)
USDJPY	ドル円 / USD/JPY	±0.20%	07:00
N225	日経平均 / Nikkei 225	±0.40%	15:30
SPX	S&P 500	±0.40%	06:00