METHODOLOGY
Methodology(手法・更新方針)
StatAtlas は、レビュー平均・加重平均(WR)・信頼区間・効果量・勝率など複数の統計量を組み合わせ、 小標本の偏りを抑えつつ納得感のある順位とサマリーを提示します。ここでは、採用している指標、 ランキング決定のルール、更新タイミング、既知の限界と免責をまとめます。
対象データと範囲
- 対象: 作品評価(平均点・票数・公開/発売日など)と女優/シリーズのメタデータ
- 範囲: 既知の期間(例: 2004年1月〜最新月)のうち、ソースに記録のある作品
- 単位: 作品単位でスコア化し、ページ(女優/シリーズ/月)に応じて集計・表示
- 入手: 内部のバンドル JSON(R2)と索引/メタ(KV)から取得し、静的配信
指標の定義(WR と補助統計)
ランキングや代表作の選定には、IMDb の考え方に近い加重平均(Weighted Rating, WR)を基礎にしています。 記号は R: 作品の平均点、v: 作品の票数、C: 全体平均、m: 最小票数しきい値 を表します。
WR = (v / (v + m)) × R + (m / (v + m)) × C
- 直感: 票数 v が少ない作品は全体平均 C へ収束し、 票が十分に集まるにつれ実測平均 R を反映します。
- 目的: 小標本の偶然高評価を抑えつつ、広く評価された作品を正当に高く評価します。
- 補助統計: 勝率(優越確率)、効果量(Cohen's d 等)、差分の 95% 信頼区間、p 値を併記し、 統計的有意性と実用上の意味合いを示します。
ページ別の算出・掲載方針
- 女優ページ: 代表作(最大 6 件)は WRスコア の高い順。最新作・ジャンル構成・推移などを補助情報として表示。
- シリーズページ: シリーズ配下の作品を WR 順で要約し、年次・月次の傾向を提示。
- ランキング(月次): 対象月にリリースされた作品のみを対象とし、imdb_wr の降順で掲載。タイブレークは票数、次いで日付を参照。
累計“お世話になった”推定の算出方法
この推定は、レビューの取り分(シェア)を日本の成人男性人口へ按分する「レビュー・シェア按分法」を使っています。レビューデータを視聴者数の重みとみなし、以下の因子を掛け合わせてレンジ(下限〜中央値〜上限)を求めます。
- レビュー割合 S = reviewCount / marketTotalReviewCount
- 日本の成人男性人口レンジ(例: 5,000 万〜5,300 万)
- オナニー経験あり男性の割合(JEX 2020: 94.2%)
- 実写アダルト動画を主な“オカズ”にする男性割合(JEX 2020: 75.9%)
- (任意)方法フィルタ: 例として「手による行為」= 93.3% を掛け、特定手段に絞り込む
人口レンジの下限・中央値・上限を用いて人数を算出し、結果を「約◯万人〜◯万人(中央値 ◯万人)」の形式で表示します。レビューの重み付けによる推定のため、レビュー投稿の偏りや複数作品視聴による重複は残ることに注意してください。また、この数は推定のため、算出方法による誤差などを多分に含みます。
参考データ: 総務省統計局 e-Stat(成人男性人口)、公益財団法人家族計画協会 JEX 2020(オナニー経験率・主なオカズ)、TENGA 2017(手の使用率、頻度の参考値)など。頻度モデル(週あたり回数)は累計推定には直接使っていません。
小標本・欠損・外れ値の扱い
- 票数が最小しきい値 m 未満の作品は WR が C に近づくため、 ランキング上の過度な上振れを抑制します。
- 欠損データはスコア計算から除外し、代替値での補完は原則行いません(誤誘導を避けるため)。
- 外れ値は基本的にそのまま扱いますが、集計は WR/信頼区間により影響が緩和されます。
市場比較の読み方
- 差の推定: 対象(女優/シリーズ)と市場平均の差分と 95% CI を表示
- 効果量: Cohen's d を併記し、差の大きさの目安を提供
- 統計的有意性: 既定の α(例: 0.05)で有意かを示し、勝率(優越確率)も補足
- 実用差: 最小実用差(MID)基準を満たすかを示し、実務的な「効きの強さ」を判断
更新タイミングとキャッシュ方針
- ページは静的生成(SSG)で配信し、定期的な再集計で値が更新されます
- データは R2(JSON バンドル)/ KV(索引・メタ)を参照し、適切にキャッシュ
- ページ下部またはメタ情報に生成日時を記載(環境により表示方法は異なる場合あり)
既知の限界と注意点
- 選好バイアス: レビュー投稿の偏りにより、特定ジャンル/時期が過大評価/過小評価される可能性
- 時系列ドリフト: 評価基準の変化により、古い作品と新しい作品の比較が難しい場合
- メタデータの誤り: 作品名・日付・シリーズ名等にソース由来の不整合が残存する可能性
免責・帰属
- 本サイトの数値は集計時点のデータに基づき、正確性を保証するものではありません
- 商標・著作権は各権利者に帰属します。掲載画像/リンクは出所の方針に従います
- 外部サイトへのリンク先の可用性や内容について責任を負いません
よくある質問
- Q. WR のパラメータ(C, m)は公開していますか? — A. 値は内部管理ですが、 期間や母集団の変化に合わせて定期的に再推定しています。
- Q. 票数が少ないのに上位に出ることはありますか? — A. しきい値未満でも R が極端に高いと一定の上振れはありえますが、 WR により C へ収束し、長期的には安定します。
- Q. 市場比較の「有意」表示はどの基準ですか? — A. 既定の α(例: 0.05)での検定結果に基づきます。実用差は別基準です。
変更履歴
- 2025-09-25: 初版公開(WR/CI/効果量・市場比較の方針を明文化)