647 Views
April 21, 25
スライド概要
MCMCプロシジャによるベイズ推定とARSアルゴリ ズムの実装 井桁正尭
Cox回帰におけるBayes推定とPHREGプロシジャ 黒田晋吾
経時データに対する投与前値を考慮した解析モデ ルの比較検討 高橋行雄
薬物併用効果の解析 杉本忠則
臨床試験データへの GLMSELECT procedureの 適用 横溝孝明
がんの第III相試験における2段階デザインの比較 検討 山本倫生
非劣性試験の症例数設計方法の紹介~生存時 間データの場合~ 張方紅
Propensity Score法によるバイアスの調整法に関する実務的な問題点 古川敏仁
SASによる中間解析のデザインと解析 浜田知久馬
データのモニタリング手法について 岡田絵理
金融犯罪対応業務におけるSASの活用 早川武志
SASを用いたローン時価評価ツールの開発 羽柴次郎
イベント・ベースド・マーケティングによる住宅ローンプリペイメントの抑制~銀行取引を考慮したプリ ベイメントモデルの楕築~ 小柳誠
イベント・ベースド・マーケティングによる住宅ローン既存先へのクロスセルの推進~RAROAに基づ く長期的な収益の増強~ 岡部雄一郎
銀行本体発行クレジットカードにおけるイベント・ ベースド・マーケティング~ライフコースを考慮した 利用変化の検知~ 影井智宏
医療用医薬品の市場構造に関する考察 武藤猛
SASによるExcel出力に関する機能の比較検討~ スタンドアロン環境からBl環境まで~ 佐藤耕一
Kaplan-Meierプロットに付加情報を追加するマク ロの作成 長島健悟
RTFを用いた総括報告書の解析結果作成業務の 効率化 吉崎正浩
Webサイトのアクセス解析 須永真昼
サバイバルツリー法の改良とSAS/PHREGプロシジャによる実行 浜田泉
拡張二変量順位和統計量を用いたクロスオーバー臨床試験における薬効比較法のSASマクロ 川口淳
不等分散がDunnett型多i比較の性能に及ほす影響についてのサンプルサイズ別検討 冨田尚希
SASによるWebデータの統計解析:XMLデータ入出力と不動産バリュエーションマップ作成への応 用 松島純之介
産業運関表の三角化の検討 中村竜児
StandardTemplateProgramsの開発 市橋里絵
5回の学生調査から探る実演芸術鑑賞行動パ ターンとその規定要因~学生調査データベースの構築と分析を通して~ 有馬昌宏
時系列予測における外れ値の構造の発見 広瀬俊亮
予測分野におけるSASの活用 石井宏司
通信サービス業におけるデータベースマーケティ ングの潮流 原島淳
SAS言語を中心として,解析業務担当者・プログラマなのコミュニティを活性化したいです
‑ ・‑ ユーザー総会 論文集
SAS、SASを構成するプロダクト群は、 SASI n s t i t u t eI n c .の登録商標です。 その他、本論文集に記載されている会社名、製品名は、一般にそれぞれ各社の商標または登録商標です。 本論文集の一部または全部を無断転裁することは、著作権法上の例外を除き、禁止されています。 本論文集の内容を実際に運用した結果の影響については、責任を負いかねます。
目次 │ 医薬品開発 MCMCプロシジャによるベイズ推定と ARSアルゴリズムの実装 │ 3 井桁正尭(武田薬品工業株式会社) Cox回帰における B a y e s推定と PHREGプロシジャ 23 黒田晋吾(武田薬品工業株式会社) 経時データに対する投与前値を考慮した解析モデルの比較検討 45 高橋行雄(中外製薬株式会社) 薬物併用効果の解析 55 杉本忠則(大日本住友製薬株式会社) 臨床試験データへの G LMSELECTp r o c e d u r eの適用 63 横溝孝明(大正製薬株式会社) 三角俊裕(アステラス製薬株式会社) 高橋行雄(中外製薬株式会社) がんの第E相試験における 2段階デザインの比較検討 75 山本倫生(小野薬品工業株式会社) 伊藤嘉彦 冨金原悟 山口拓洋(東北大学) 非劣性試験の症例数設計方法の紹介 生存時間データの場合 87 張方紅(グラクソ‑スミスクライン株式会社) 寺尾工 P r o p e n s i t yS c o r e法によるバイアスの調整法に閲する実務的な問題点 1 0 1 古川│敏仁(株式会社バイオスタティステイカルリサーチ) 杉本典子 「 チュートリアル SASによる中間解析のデザインと解析 │ 1 1 1 浜田知久馬(東京理科大学大学院) リスク管理 データのモニタリング手法について │ 183 岡田絵理(日本リスク・デ タ・パンク株式会社) 金融犯罪対応業務における S ASの活用 早川武志 ( S A S¥ n s t i t u t eJ a p a n株式会社) 195 SASを用いたローン時価評価ツールの開発 2 0 1 羽柴次郎(みずほ第一フィナンシャルテクノロジー株式会社) 李締
│ マーケティング・調査 イベント・ベースド・マーケティングによる住宅ローンプリベイメン卜の抑制 銀行取引を考慮したプリベイメントモデルの構寵 213 小柳誠(株式会社浜銀総合研究所) 小谷田知行 影井智宏 イベント・ベースド・マーケティングによる住宅ローン既存先へのクロスセルの推進 一一一 229 ‑RAROAに基づく長期的な収益の増強 岡部雄郎(株式会社浜銀総合研究所) 小谷田知行 銀行本体発行クレジットカードにおけるイベント・ベースド・マーケティング ライフコースを考慮した利用変化の検知 245 影井智宏(株式会社浜銀総合研究所) 小谷田知行 医療用医薬品の市場構造に閲する考寮 261 武藤猛 ( M a r k e T e c hC o n s u l t i n g ) S~ システム SASによる E x c e l出力に関する機能の比較検討 スタンドアロン環境から 8 1環境まで 佐藤耕 t 273 (株式会社タクミインフォメーションテクノロジ ) K a p l a n ‑ M e i e rプロットに付加情報を追加するマクロの作成 285 長島健悟(城西大学) 佐藤泰憲(千葉大学、ハーバード大学) RTFを用いた総括報告書の解析結果作成業務の効率化 295 吉崎正浩(小野薬品工業株式会社) 加藤紀隆、加賀保行(イーピーエス株式会社) 冨金原悟(小野薬品工業株式会社) 305 Webサイトのアクセス解析 須永真昼(株式会社ふくおかフィナンシャルグル プ) 村上策史 ( S A SI n s t i t u t eJ a p a n株式会社) 統計解析 サパイパルツリー法の改良と S AS/PHREGプロシジャによる実行 1 321 浜田泉(株式会社イべ 1 )力 CRD) 川口淳(久留米大学) 拡彊ニ変量順位和統計量を用いたクロスオーバー臨床試験における 薬効比較法の S ASマクロ 335 川口淳(久留米大学) 不等分散が D u n n e t t型多重比較の性能に及ぼす影響 l ごついての サンプルサイズ別検討 冨田尚希(東北大学加齢医学研究所) 土居正明(東レ株式会社) 新田明美(東北大学加齢医学研究所) 横山徹爾(国立保健医療科学院) 345
│ 経済分析 SASによる Webデータの統計解析: XMLデータ入出力と不動産パリュエーションマップ作成への応用 357 松島純之介(中外製薬株式会社) 石島博(中央大学大学院) 渡部育恵 369 産業連関表の三角化の検討 中村竜児(株式会社インクリース研究所) 臨床鼠験データ解析 S t a n d a r dT e m p l a t ep r o g r a m s "の開発 l 3 8 1 市橋呈絵(サノフィ・アペンティス株式会社) 江口幸子 渡漫大丞 月田あづさ 経済分析またはマーケティング・調査 5回の学生調査から探る実演芸術鑑賞行動パターンとその規定要因 学生調査データベースの構築と分析を通して l 387 有馬昌宏(兵庫県立大学) 加藤イ憂希(日本コムシス株式会社) 経営管理 時系列予測における外れ値の構造の発見 │ 399 広瀬俊亮 C S A SI n s t i t u t巴 J a p a n株式会社) 泉水克之 サプライチェーン管理一販売予潤・需要予測 予測分野における SASの活用 l 415 石井宏司 C S A SI n s t i t u t eJ a p a n株式会社) ビジネス活用、マーケティング 通信サービス業におけるデータベースマーケティングの潮流 原島淳 C S A SI n s t i t u t eJ a p a n株式会社) │ 433
MCMCプロシジャによるベイズ推定と ARSアルゴリズムの実装
0井桁正尭
武田薬品工業株式会社医学開発本部
日本開発センタークリニカルデータサイエンス部
BayesE
s
t
i
m
a
t
e
sUsingMCMCProcedureandHowt
oD
e
f
i
n
eSamplingAlgorthmonMCMCProcedure
MasatakaI
g
e
t
a
TakedaP
h
a
r
m
a
c
e
u
t
i
c
a
lCampany. L
t
d
.
SAS9
.
2で実装された MCMCプロシジ、ヤ (
E
x
p
e
r
i
m
e
n
凶1
) の使い方と,そのサンプリングアルゴリズム
を紹介する.MCMCプロシジャは USDステートメントで任意のアルゴ、リズムを実装し,サンプリングを
行うことができる.A
d
a
p
t
i
v
eR
e
j
e
c
t
i
o
nS
a
m
p
l
i
n
gを MCMCプロシジャへ実装する例により,ユーザー
定義のサンプリングアルゴ、リズムを実装する方法を紹介する.
キーワード:MCMCプロシジャ, UDSステートメント, M
e
t
r
o
p
o
l
i
sA
I
g
o
r
i
t
h
m,Adap
七i
v
eR
e
j
e
c
t
i
o
n
S
a
m
p
l
i
n
g
1 はじめに
マルコフ連鎖モンテカルロ法 (MarkovChainMonteC
a
r
l
omethods:MCMC法)は,任意の確率分布か
ら乱数を生成するモンテカルロ法の一種である本稿では,まず,回帰分析における回帰係数のベイズ推定
を例に, MCMCプロシジ、ヤの使い方を説明する次に, MCMCプロシジャのサンプリングアルゴリズムと,
UDSステートメントによりユーザー定義のサンプリングアルゴリズムを実装する方法を紹介する.
2 MCMCプロシジャによるベイズ推定ー回帰分析ー
MCMCプロシジャの使い方を,回帰分析における回帰係数のベイズ推定を例に説明する. MCMCプロ
シジ、ャにより妥当な推定値が得られることをパラメータの真値が既知の単回帰モデルから生成したダミー
データを使用して確認する
2
.
1 モデル,夕、ミーデータの作成
単回帰モデル
Yi
、
σ
2
), i=l,
.
.
.
、n
=グ
'
0+β lXi+ei, Et dNO
(
2
.
1
)
におけるパラメータ 8={
グ'
0,
s
l,
(
7
'2}のベイズ推定を考える.まず,次頁のプログラムにより ,
sO=O,
sl=
5,
(
7
'2 = 1
00,
n= 30と設定したときのダミーデータ Du
.
m
myを作成する (
2
.
1
)のもとで,パラメータグ'
0,
s
l,
(
7
'2
の尤度関数は,
p(y1
θ
)=
I
Iゅ(so+s1X;,σ2)
(
2
.
2
)
1
'=1
である.ここで ,
Y={
Y
l,
Y
2ぃ ・ .,
Yn},
ゆ(
μ,
(
1
'2
)は平均 μ,分散 σ2の正規分布の密度関数とする.。のベイズ
推定量は,ベイズの定理
f
(
θ│ν)α p(y1
8
)π(8)
を通して得られる."c
x"は左辺が右辺に比例することを表し,
f
(θ1y
)= c.p(ν18)π(θ), cは基準化定数
(
2
.
3
)
qu
と同義である. 7r(
8
)はパラメータ θの事前分布 ,
f
(θ│ν)は事後分布と呼ばれる .p(y[8
)はパラメータ 0
の尤度関数である.ここで ,s
o,
β1,
σ2が互いに独立であると仮定すると, 7r(
8
) =π (
s
o
)π(β1
)π(σ2) とかけ
る.事後分布に基づく推測では,データの情報は尤度として,事前情報は事前分布として組み込まれる.以上
の仮定のもとで, (
2
.
3
)は次のようにかける.
f
(
s
o,
β1,
σ2[
y
)c<p(y[
s
O,
β1,
σ
2
)
π(
s
o
)π(β1
)π(σ2).
j=
。のベイズ推定量 {
(
2.
4
)
{
.
8
0,
8
.
1,
O
"2
}を 0の事後平均とすると,。は下記の (
2
.
5
)で表されるが,積分計算が困
2
.
5
)を得る方法を紹介する.
難であることが多い.次節では MCMCプロシジ、ヤにより?数値的に推定値 (
島
ト
二 111
万
仙
角
ω仰(P伊川
8
.
1= 111βd(sO,
s
1,
州
(
]
"
2[
(
2
.
5
)
0仏 仰
d
(
σ
]
(
]
"
"
2
2
σ2
(
]
"
2[ 叫 が1d
δ
ρ
ι
2
=111σ 2f仇 β1,
ダミーデータ生成プログラム
・
・
.
.
.
.
‑
・
.
.
.
.
.
.
.
P
IsfDummyDau
data du
皿皿y
(drop;betaObetal s
d
);
call streaminit(9999) ;
betaO;O ;betal;5 ;sd;10 ;
do x;l to 30 ;
e;r阻 d('Normal',
O,
s
d
);
y;betaO+x*betal+e ;
output ;
end ;
且;
ru
proc sgplot data;dummy ;
title "Plot o
f Du
皿皿y D
atall ;
scatter x;x y;y /
markerattrs;(size;10 symbol;"CircleFilled" ) ;
且;
ru
‑
.
.
.
"
図1
: ダミーデータのプロット
2
.
2 恥1C恥1Cプロシジャ
2
.
2
.
1 プログラム例とアウトプット
ベイズ推定において, MCMC法は主に事後分布からの乱数生成に用いられる.生成した乱数を θt,
t‑
1,
.
.
.,
nとすると,モンテカルロ積分
Ig(8)f(θ)d8~ ~γ g(8 t )
(
2
.
6
)
.
,t=1
JS
により, (
2
.
5
)の近似値を得ることができるここで ,
g
(
8
)はパラメータ 0の関数, 5は Oのサポートとする.
本稿では,パラメータの事前情報を推定に組み込まない,以下の事前分布を用いる.
。
π
(
β )=φ(mean= 0,
varニ 100000),
,
,
7
r(β1)=φ(mean= 0 v
ar= 100000)
(
2
.
7
)
π(σ2)= fir(shape= O
.
O
l,
s
c
a
l
e= 0
.
0
1
)
.
ここで, /
;
rは逆ガンマ分布の密度関数とする (
2
.
7
)をプロットしたものを図 2,
図 3に示した .β0,s
1,
(
]
"
2
の事前分布は,これらのパラメータが通常取り得る範囲でほぼ一様分布であるため,事後分布 (
2.4)による推
測は,ほぽ尤度に基づく推測となる.MCMCプロシジ、ャにより,事前分布 (
2
.
7
)のもとで,事後分布 (
2.
4
)
か
2
.
5
)の近似値を算出するプログラムと,そのアウトプットを次頁に示す
ら乱数を生成し,事後平均 (
‑
4・
) P r l o r印刷 butlon:ln"' ,~・ G Ol mm ;a(包 h Olp e-O .OO1 sn陥 司 血 1 P r i o r O i s 回 b L r t ion:Normal(m¥F司0 "戸 旬 開 ∞0 ) 0; 、ご i 丹 。 図2 :so, β1の事前分布 図 3:σ2の事前分布 プログラム ods graphics on ; proc mcmc data=du 血血y o utpost=out nmc=50000 nbi=2000 thin=5 seed=9999 ; parms betaO 0 beta1 0 ; parms sigma2 1 ; prior betaO beta1 ‑normal(me阻 =0,var=100000) ; 血a (shape=O.Ol,scale=O.Ol) ; prior sigma2 ‑ igam mu = betaO + beta1ホ x ; model y ‑ n(mu,var=sigma2) 且; ru ods graphics off ; アウトプット Para 皿e ters Block 1 2 Para 血e ter Sa 且p ling Method betaO beta1 sigma2 N‑Metropolis N‑Metropolis N‑Metropolis Initial Value Prior Distribution 1 .0000 normal(mean=O,var=100000) normal(me阻 =0,var=100000) igam 血a (shape=O.Ol,scale=O.Ol) 。 。 Posterior Summaries N 皿e ter Para Standard Deviation Percentiles 50% ••• 邑 ‑nwu 4ム 民 ︾ 戸 ︒ ••• 民U 7 2 7 2 4 内 4 ム GU A2 7 2 0 u nv ハu k u 349 ‑A6 4 内 n 3 4ム Qu auqd72 RUG‑vau •. 25% 340 434 勺 Lkun4 517 QU 4 内 Fb 309 4ム 838 Fhu ・ ・ 4ム 戸む内4 4ム 7 2 4ム ハU ハU n u ハU ハU ハ u ハ υハ υ ハU ハU ハ u υ n ハ υハ υ 1 υ n 11 betaO beta1 sigma2 Mean 75% 1 .5149 5.2135 117. 。 Posterior Intervals Para 血e ter Alpha Equal‑Tail Interval betaO beta1 sigma2 0.050 0.050 0.050 ‑8.5063 4.6466 59.4374 6.6696 5.4972 173.6 HPD Interval ‑8.6636 4.6501 52.6172 6.3987 5.4989 159.9 アウトプットの Parametersには?パラメータごとに,サンプリングアルゴリズム,パラメータの初期値,事前 分布が出力される posterior Su血 血 紅 白 sには,サンプリング数,パラメータの事後平均,標準偏差,パーセ ント点が出力される.Posterior Intervalsには,パラメータの区間推定値として Equal‑Tail Interval と HPD Intervalの 2種類が算出される.表 2.1に,パラメータの真値と MCMCプロシジャで推定された 事後平均.GUvIプロシジ、ャによる最尤推定値を示す.いずれもパラメータの真値を含んでおり.妥当な推 p h u
定が行われていると考えられる.括弧内の数値は区間推定値である.MCMCプロシジャの区間推定値には, Equal‑Tail Intervalの値を用いた. 表2 . 1 :パラメータ s o,s lの事後平均と最尤推定値 s , s o o MCMCプロシジャ(事後平均) GLMプロシジ、ヤ(最尤推定値) 5 ー 1 .0 1 7[ ‑ 8 . 5 0 66 . 6 6 7 ] 5 . 0 7 2[ 4 . 6 4 75 . 4 9 7 ] ‑ 1 .0 3 1[ ‑ 8. 48 86 . 42 7 ] 5 . 0 7 7[ 4 . 6 5 55. 49 7 ] 5 0 " ・ , ‑ ‑ I o I I " 、 白ζ a CWC •••••• GLMI 図4 ::推定された回帰直線 診断プロット 前頁のプログラムを実行すると,図 5 ,図 6 の診断プロットが描かれる • s lの診断プロット も出力されるが,頁数の都合で割愛した.診断プロットの上段の図は,トレースプロットまたは標本経路と 呼ばれ,横軸に MCMCのくり返し処理の回数,縦軸に生成したサンプルの値をとり,時系列プロットを描い たものである.トレースプロットはサンプリング、において初期値の影響が残っているか,収束した定常分 布からのサンプリング、がとなっているか等を目視で哨l 定するために用いられる.下段左の図はコレログラム と呼ばれ,サンプルそのものと,サンプルの l a g 1から l a g 5 0に対する自己相関係数を順次棒グラフに描いた ものである.サンプル聞に相闘が残っている場合には定常分布への収束が遅いことが示唆される.下段右 の図は,生成したサンプルにもとづいてカーネル推定された事後分布を描いたものである. 宥 2 0 二 o LJ I ¥ , b , uO L ' ~'gl1lõl.ミ 図 6:σ2の診断プロット 図5 :s oの診断プロット ‑ 6・
2 . 2 . 2 乱1C 乱1Cプロシジャの各ステートメント 前節で提示したプログラムにおいて使用したステートメントとオプションについて説明する procmcmcステートメント procmcmcステートメントで使用したオプションを表 2 . 2に示す 表2 . 2 :procmcmcステートメントで使用したオプション オプション名説明 尤度を算出するためのデータを格納したデータセットを指定する 生成したサンプルを格納するデータセットを指定する 生成するサンプル数 B u r n ‑ I nの数 白羽 生成したサンプルから間引を行う seed 生成する乱数のシード data o u t p o s t 阻 c n b i デフォルト 1 0 0 0 1 0 0 0 1 nmc nmcオプションには, outpostオプションに指定したデ、ータセットに保存されるサンプルの候補の数 を 指 定 す る 皿cオプションに指定した数と, outpostオプションに指定したデータセットに最終的 に保存されるサンプル数は必ずしも一致しないことに注意する.例えば.前節で提示したプログラム では nmc=50000と指定したため,データセットに保存されるサンプルの候補として 50000個の乱数が 生成されるが, thin=5と指定したことにより?最終的にデータセットに保存されるサンプル数は間引 きされた 10000個となる. thin thinオプションは,データセットに保存されるサンプルの候補から間引きをして,最終的なサンプル とするためのオプションである.例えば" nmc=3thin=2とすると,生成した 3個のサンプルのうち l 番目と 3番目のサンプルがデータセットに保存される.皿c=10thin=5とすると,生成した 10個のサ ンプルのうち l番目と 6番目のサンプルがデータセットに保存される. nbi nbiオプシヨンには Burn‑Inの数を指定する Burn‑Inの数とは,初期債の影響を受けていると考え られる初期のサンプルの数のことである.nbiオプションで指定した数のくり返し処理の後に,データ セットに保存されるサンプルの候補を生成するため皿cオプションとは干渉しない. parmsステートメント パラメータの初期値とブロッキングの設定を行うステートメント.初期債はパラ メータ名の後に指定する. 1つの parmsステートメントに複数のパラメータを指定した場合,それらを lつ のブロックとして同時にサンプリングを行う.前節で提示したプログラムでは, betaOと betalを lつのブ ロックとし, sigmaは別のブロックとしたこの設定により, betaOと betalは適当な 2変量分布からサン プリングされ, sigmaは適当な l変量分布からサンプリングされる priorステートメント, modelステートメント prlorステートメントにパラメータ名 事前分布'と して事前分布を指定する.前節で提示したプログラムでは,パラメータ betaO,betalの事前分布に,平 均 0,分散 100000の正規分布 normal(me回 =0,var=100000) を指定した MCMCプロシジャには,正 規分布 (normal(凹血, var))や一様分布 (uniform(a, b ) )等の 28種類の分布が組み込まれており, prlor, hyerprior,modelステートメントで利用できる. modelステートメントには, priorステートメントと同 様に,うパラメータ名ー尤度関数'として尤度関数を指定する.modelステートメントにより対数尤度を算出 するため,対数尤度の算出に関するステートメントを全て実行した後で modelステートメントが実行される ようにプログラムを作成することが重要である例えば¥前節で提示したプログラムの血u=betaO+betal町 のようなプログラミングステートメントの後に modelステートメントを記述する. ‑ 7・
2 . 2 . 3 サンプリングアルゴリズム MCMCプロシジャのサンプリングアルゴ、リズムはブロッキングされたパラメータの分布の構成によっ て異なる.表 2 . 3にアルゴリズムの一覧を示す.ブロッキング、されたパラメータの分布が連続分布,または二 項分布を除く難散分布からなる場合は M e t r o p o l i sAlgorithmが適用される.2 . 2.4節でアルゴリズムの概要 を紹介するが, M e t r o p o l i sAlgorithmには,対称型の分布から乱数を生成するプロセスが含まれる.MCMC プロシジ、ヤでは,その対称型の分布として多変量正規分布と多変量 t分布を選択できる.デフォルトは多変 量正規分布である.自由度 dfの多変量 t分布から乱数を生成する場合には, proc mcmcステートメントの オプシヨンに propdist=t(df)を指定する.単変量の三項分布の場合は逆関数法が適用され,多変量の二項 分布の場合は独立サンプラーによるサンプリングが行われる.本稿では, M e t r o p o l i sAlgorithmの概要を紹 介する. 表2 . 3 :MCMCプロシジャのサンプリングアルゴリズム (SASjSTAT(R)9 . 2U s e r ' sG u i d e ) ブロック内のパラメータの分布 連続分布のみ 二項分布を除く離散分布のみ 連続分布と二項分布を除く離散分布 三項分布(単変量) 二項分布(多変量) サンプリングアルゴリズム M e t r o p o l i sA l g o r i t h m M e t r o p o l i sA l g o r i t h m M e t r o p o l i sA l g o r i t h m 逆関数法 独立サンプラー 提案分布 多変量正規分布,多変量 t分布 b i n n e dMVN,多変量 t分布,対称幾何分布 多変量正規分布,多変量 t分布 2 . 2 . 4 MetropolisAlgorithm MCMCプロシジャで使用される M e t r o p o l i sAlgorithmを紹介する. M e t r o p o l i sAlgorithmはアルゴリ ズムの実装も比較的容易で汎用性も高い.M e t r o p o l i sAlgorithmは,乱数生成が容易な対称型の分布から乱 数を生成し,それらを取捨選択して目標の分布からのサンプリングとする.M e t r o p o l i sAlgorithmを以下に 示す (SASjSTAT(R)9 . 2U s e r ' sG u i d e ) . MetropolisAlgorithm ( O )のサポートから適当な初期値を選択し ,O S lとする. ( 0 ) 目標の分布 f 1) ‑ ( 2 )の処理を i= 1, . . . , rについて1 ) 頂に行う 下記の ( ( 1 ) θS iを中心とした対称な分布 q ( OI O S i )から ONを生成する .q (・卜)は提案分布と呼ばれる ( 2 )[ 0, 1 ]区間上の一様乱数 uを生成し,下記のように OS i+l を定める 1 0". = ON, U三f(ON)jf ( O s . ) S i + ' ¥ . θ lS i ' U>f(ON)jf(Os.) ( 2 . 8 ) ( 3 ) 生成された O S lド . . , θS rを,f ( O )からのサンプルとする. S lい ・ ・, O S rの分布は, アルゴリズムの概要を図 7に示す. M e t r o p o l i sAlgorithmで生成されたサンプル O T →∞のとき , f ( O )に収束することが知られている(大森, 2 0 0 1 ). 例:混合分布からのサンプリング M e t r o p o l i sAlgorithmの適用例として,混合正規分布 f ( O )= R.g ( O )+( 1‑R). h ( O ) ( 2 . 9 ) ( O ), h ( O )は,それぞれ N (μ1,(/2),N (μ2,(/2)の密度関数とする.次頁のプログ からのサンプリングを行う .g ラムでは, μ1 =‑2,μ2 =2,(/2 =1,R=0 . 5とし?提案分布は分散 ( T P )が 3の正規分布とした.プログラ ムを実行し,生成されたサンプルのヒストグラムを図 8に示す.一見して,うまく混合分布からのサンプリ ングが行われてるようであるが提案分布の分散 TPを動かすと全く異なる様相のヒストグラムが描かれ る.適切な TPを選択するのは,非常に難しい問題であるが, MCMCプロシジャには提案分布の分散を自動 的に定めるアルゴリズムが組み込まれている. ‑ 8・
MetropolisAIgorithmにより混合分布からの乱数を生成するプログラム
data MCMC ;
SIMN口=10000 ;INIT=O ;TP=3 ;SEED=1234 ;M1=‑2 ;Sl=l ;M2=2 ;S2=1 ;R=0.5 ;
call stre日 init(SEED) ;
do i
=
l to SIMN口;
i
f (ェ =
1 )then X = INIT ;
else X = SAMPLE ;
C =r皿 d('normal',
X,
T
P
);
X,
M1,
S
l
)+(
l
‑
R
)率 pdf('NORMAL',
X,
M2,
S
2
);
P
1 = R*pdf('NORMAL',
P2 =R率 pdf('NORMAL',
C,
M
1,
S
l
)+(
l
‑
R
)寧pdf('NORMAL',
C,
M2,
S
2
);
i
f (P1=0 )then q
=
l;
1
);
else q=min(P2/P1,
工f (r
皿 d
('unifor
血,) <=日) t
hendo ;ACC = 1 ;SAMPLE=C ;end ;
else do ;ACC = 0 ;SAMPLE=X ;end ;
output ;
end ;
ru
且,
S
a
m
p
l
i
n
gf
r
o
mM
i
x
t
u
r
eN
o
r
m
a
lD
i
s
t
r
i
b
u
t
i
o
n
MCMCExpl:m3
:t
t
o
n
。§
│
日
f
(札
、 3主 f(1
!、
,
)
山 lさ
“ー~,; 1 ご0川
=
1
1
",と 1";:,
そ
パ NM 之
g
.
︐
,
"
泊
;
, f(弘
、
,
/f(l
!
s,
) ご
I(
,
人
̲
,
ニ0
.
.
.
..
,'
:
‑
1
‑
<
;
0
0
。
寸 0‑[
,
2
、
・‑15 ‑39 ‑30 ‑22 ・
¥
‑ ‑:60" ¥0 19 26 3・ '2 50 59
‑
5
"
SAAf'LE
図7
:MetropolisAlgorithmの概要
図8
:生成されたサンプルのヒストグラム
3 MCMCプロシジ、ャへのサンプリングアルゴリズムの実装
前節で提示したプログラムを利用すれば, DATAステップで目標の分布からのサンプリングを行うことが
できるが,診断プロットを措いたり,事後平均や信用区間等の統計量を算出するには別途プログラムを作成
する必要がある.また, Burn‑Inや Thiningを行うには,生成したサンプルを加工する手聞が生じる.その意
味でも, MCMCプロシジャは手軽にベイズ推定を行うための有効なツールになる.
一方,目標の分布からのサンプリングを行うアルゴ、リズムは MetropolisAlgorithm以外にも様々なもの
が提案されている.例えば, Gilks (1992)による AdaptiveRejection Samplingや
, Gilks (1995)による
AdaptiveRejectionMetropolisSampling,Neel(
2
0
0
5
)による S
l
i
c
eSampling等が挙げられる.本節以降で
は
, MCMCプロシジャの UDSステートメントにより, AdaptiveRejectionSampling(ARS)を実装する方
.
1節で ARSの基礎となる受容ー棄却法を紹介し, 3
.
2節で ARSのアルゴリズムを説明する.
法を紹介する.3
3
.
3節では, UDSステートメントを使用するための準備として, FCMPプロシジ、ャでユーザー定義の関数,
及びサブルーチンを定義する方法を紹介し, UDSステートメントの使用例を提示する. 3.4節では, ARSを
MCMCプロシジャに実装するプログラムを紹介するー
‑
9・
3
.
1 受容.棄却法
受容棄却法は,乱数生成が容易な分布 g
(
(
}
)から乱数を生成し,それらの一部を棄却することで目標の分布
f
(
(
}
)からの乱数とする方法である.受容棄却法のアルゴリズムは,次の強い仮定のもとで構成されている
f
(
(
}
)s
.c.g
(
(
}
), cは正の定数.
(
3
.
1
)
仮定 (
3
.
1
)は,図 9に示すように,目標の分布 f
(
(
}
)を乱数生成が容易な分布 g
(
(
}
)の定数倍で覆うことがで
(
(
}
)からの乱数となる
きることを意味している.このとき,以下のアルゴリズムで生成されたサンプルは ,f
ことが知られている(小西, 2
0
0
8
).
(
1
)g
(
(
}
)から乱数 P を発生させる
(
2
)[
0,
1
]区間上の一様乱数 uを発生させる.
s
.
(
3
)u f
(
(
}つI
c
g
(
(
}つならば, (
}
*
をf
(
(
}
)からの乱数として受容する.そうでなければ (
1
)に戻る.
g
(
(
}
)を一様分布とすると,ある適当な cが存在して仮定 (
3
.
1
)を満たす.このとき,一様分布から生成した
(
(
}つI
c
g
(
(
}つで受容することになるが ,
f
(
(
}
)の裾の部分からも頻繁に乱数が生成され,そ
乱数 P を,確率 f
の多くは棄却されることになる.したがって,受容棄却法では,仮定 (
3
.
1
)を満たし,かつ目標とする分布
f
(
(
}
)に近い g
(
(
}
)を探すことが効率の良いサンプリングを行う上で重要である.一方,一般の分布 f
(
(
}
)に対
(
(
}
)を選択することは難しい問題である.
して,適切な g
・
凶
・0
"SampUng
・
・
Acc.pUnc.R Ic
t
l
o
nS.
tm
p
l
l
n
l
l
Assum阿 onofRI
ハハ⁝⁝
M
"
0
.
5
cy
(
O
)
" ヘ
・
01
0
.
1
1
(
1
1
)壬
(
:
.g
(
O
)
E
8
"
。
。
採択佐和低い
J
!
?
3
2
i
/
‑1
。 。
1
¥
'
・
N
‑..間分言二‑‑二て扇面画1
1
・E ・E ・‑日帽の分布・・・・・・ペ:
.
.
.
.
72シヲ '
f
iう分竃 1
図9
:仮定 (
3
.
1
),実線 :f
(
(
}
),
破線 :c
.
g
(
(
}
)
図1
0
:g
(
8
)を一様分布とした場合
3
.
2 AdaptiveRejectionSampling
本節では, 1変量の分布からのサンプリングを考える.受容棄却法における g
(
8
)選択の問題に対して,
(
8
)が l
o
g
‑
c
o
n
c
a
v
eである場合に,仮定 (
3
.
1
)を満たす g
(
8
)を構成する方法:Adaptive
G
i
l
k
s(
1
9
9
2
)は,f
R
e
j
e
c
t
i
o
nSampling(ARS)を提案した.目標の密度関数 f
(
8
)が l
o
g
‑
c
o
n
c
a
v
eであるとは, l
o
g
f
(
8
)が凹関数
となることであり,例えば, θ2
1o
gf
(
8
)
1θ82 <0により確認することができる.ARSのアルゴリズムを以下
に示す(大森, 2
0
0
1
).
‑
1
0・
AdaptiveRejectionSampling(ARS)
(
1
)f
(
O
)のサポート上に η+2個の点。0<01< ・ < O
n
+
lを選び, 0
π ={
0
0,0
1,・ ,On+dとする.
(
2
) 針。)= l
o
g
f
(
O
)とし, i= 0,
1,
.
.
.
, πについて点 (
O
i,
e
(
O
i
)
)と (
O
i
+
l,
e
(
O
;
+
I
)
)を結ぶ直線 m
;
(
O
)を引く
e
,
n
(
0
),e
,
n
(
0
)を以下のように定義し ,g
l,
n
(
O
)=ex
叫ん ,
n
(
O
)
}g
2,
n
(
0
)=e
x
p
{
e2
,
n
(
0
)
}とする.
1
2
n
(
O
)ニ g
2,
n
(
0
)
/J
g
2,
n
(
0
)
d
Oとする. (
図1
1,
図1
2
)
さらに ,g
。
ε , ,]
[
O
;O
i
+
l
i= 0
,
1
,
・
・
・ ?η ,
O戸[
O
O
n
+
l
,]
O,
。0
mo(O),
e
n
(
0
)=
2,
< 0・
ml(O),
0
ε [
00,
01,
]
f
f
i
i
n
(
m
;ー I
(
O
),
m
;
+
I
(
O
)
), Oε[O;,
.
.
.
, n‑1,
O
i+
l
]
, i= 1,
mnー 1
(
0
),
8
ε[
O
n,
O
n
+
l
,]
mn(O),
(
3
.
2
)
0>O
n
+
l,
(
3
) 以下の手順で g
π(
0
)から乱数 rを生成する
(
3
‑
1
)図 1
2において,横軸に対する垂線(破線)で区切られた区聞における曲線 g
2,
n 下の面積の大
きさに基づいて,乱数を生成する区聞を選択する
(
3
・2
)(
3
‑
1
)で選択された区聞において逆関数法を適用し ,
g
n
(めからの乱数を生成する.乱数を生成
Z
i
‑
l
'Z
]
iにおいて ,q
(
O
)= e
x
p
(
α s+b
;
),0ε[
Z
iーし Z
;
]と表されるとき ,q
(めか
する分布が?区間 [
らの乱数 rは逆関数法により?次のようにして得られる.
グ =~ l
o
g
{む e
x
p
(
α;
Z
i
)+(
1‑v
)e
x
p
(
α山一1)
,
}
α
t
む
[
0,1
]区間上の一様乱数.
(
4
)[
0,
1
]区間上の一様乱数 uを生成する.
(
5
) u三g
l,
n
(
Oつ/
g
2,
n
(グ)ならば" 0
*を f
(
O
)からの標本として受容し (
3
)へ戻る.
u>g
l川 (
0ホ
)
/g
2,
n
(
0
*
)ならば,以下の (
5
‑
1
)の処理を行う.
(
5・1
) u三f(
B
*)
/
g
2,
n
(
0つならば ,0
*を f
(めからの乱数として受容し ,On+l= OnU0
*として
(
2
)へ戻る.u>f
(
Oつ/g
2,
n
(
0
*
)ならば,。取を棄却して (
3
)に戻る.
この方法はう η が大きくなるにつれて乱数の受容率が高くなっていくことが期待される.ただし,初期値の
設定によってはアルゴリズムが機能しないことに注意する必要がある.
05
、
"
ES修 会
e
‑ 富田
鑑
03
h
.
τ
腕
g
ロ
0:
8
t
!
o
f
J
¥
I
,
:I
I
;
!
l‑
・ ・‑目帽の勿布の)1111'
E
,
1
.
O,
¥
l打 。 沼
.
.
.
.
.
.
(
]
t・ー ー‑
<l~1
図1
1
:l
o
g
f
(
O
)を区分的な一次関数 .
R
,
n
(
0
)で覆う
2
‑
1
1
‑
図1
2
:図 1
1から指数変換したもの
3 . 3 UDSステートメン卜, FCお1Pプロシジャ MCMCプロシジャは, UDSステートメントを使用してユーザー定義のサンプリングアルゴリズムを実装 することができる.前節で紹介したアルゴリズムを MCMCプロシジ、ャに実装する方法を次節で、紹介するが, 本節では,その準備として UDSステートメントと FCMPプロシジャの使い方を説明する. FC恥1Pプロシジ、ヤ FCMPプロシジ、ヤは,ユーザー定義の関数及びサブルーチンを定義するプロシジャで, SAS9 . 2で追加された以下に, FCMPプロシジ、ャの使用例を紹介する. proc fcmp outlib=sasuser.funcs.血y̲funcs ; function twice̲fun(x); /ホ引数 zの値を 2倍した値を返す関数本/ y=xホ2 ; return(y) ; endsub ; x ) ;/ホ引数 zの値を 2倍にアップデートするサブルーチンザ subroutine twice̲s由 ( outargs x x=x*2 ; endsub ; run ; proc fcmpステートメントの outlibオプションには,ユーザーが定義した関数,及びサブルーチンを格納 する場所を指定する.outlib=liname.dataset.packageとすると,ディレクトリ sasuserのデータセット funcsのパッケージ my̲funcsに,関数 twice̲funとサブルーチン twice̲subが格納される.関数を定義 する場合には, functionステートメントを使用し,サブルーチンを定義する場合には, subroutineステー トメントを使用する.関数とサブルーチンの違いは,関数は値を返すが,サブルーチンは値を返さず,指定 したパラメータをアップデートする点である.サブルーチンは CALLルーチンとして呼び出して使用する. 上記のプログラムでは,引数 xに与えた値を 2倍にアップデートした値を返す関数 twice funと,引数 z に与えた値を 2倍にアップデートするサブルーチン twice̲subを定義している. functionステートメン トを使用する場合には,関数 returnの引数に返値となる変数を指定する. subroutineステートメントを 使用する場合には, outargsステートメントにアップデートする変数を指定する.以下に, FCMPプロシ ジャで定義した関数とサブルーチンの使用例と?下記プログラムにより作成したテL タセット ex一fcmpを示す. データセット ex̲fcmp 口BS z 1 y 4LqUFO にu n U 7 f つd にu 12345 4L ︒ 内 ︐L ︐h A z 品 nxuρbn η 12345 options cmplユb=sasuser.funcs data ex̲fcmp ; x=l ; do i = l to 5 ; / zの値を 2倍にアップデートザ call twice̲sub(x) ;ホ y=twice̲fun(x)+l ;ホ / zの値を 2倍して 1を加えた値を yに代人事/ output end ; run ; optionsステートメントの cmplibオプシヨンにより, FCMPプロシジ、ヤでコンパイルした関数,及びサブ ルーチンが格納されているデータセットを読み込む.doループ内では,まず,サブルーチン twice̲subによ り , xの値が zの 2倍の値にアップデートされる.次に関数 twice̲funにより, xを 2倍した値が返され, それに 1を加えた値が変数 yに格納される. UDSステートメン卜 MCMCプロシジャの UDSステートメントにより グアルゴリズムを実装する方法を紹介する ユーザー定義のサンプリン UDSステートメントは FCMPプロシジャで定義したサブ l レーチンを読み込み,サンプリングアルゴリズムとして使用するためのステートメントである.サブルー T チン twice̲subを MCMCプロシジ、ャに実装し,適当な初期値を 2倍 , 4倍... 2 倍した値をサンプル rはくり返し処理の回数とする. として生成するプログラムと,作成されたデータセットを以下に示すーここで , ‑ 1 2・
data empty ; Iteration z LogPrior LogLike LogPost run proc mcmc data=e 皿p tyoutpost=out n血 c=5nb工=0 ; 1 2.0000 4.0000 6.0000 10.0000 uds twice̲sub(z) ; 2 4.0000 8.0000 12.0000 20.0000 3 8.0000 16.0000 24.0000 40.0000 parms z 1 Iuds ; 血y ̲prior=2本z ; 4 16.0000 32.0000 48.0000 80.0000 血y ̲血odel=3本Z 5 32.0000 64.0000 96.0000 160.0 血y ̲prior) ; prior z ̲general( model general(血y̲model) ; run ; proc mcmcステートメントの dataオプションには,何らかのデータセットを指定する必要があるため,空の デL タセット emptyを指定している.生成されたサンプルは, outpostオプションで指定したデ、ータセット out に格納される.くり返し回数は, nmc=5 nbi=Oより, 5回である.udsステートメントは, uds subroutine( 引 数)として,指定したサブルーチンをサンプリングアルゴリズムとして読み込む.上の例では,サブルーチン t'Wice̲subを読み込んでおり, Zの初期値の 2倍 , 4倍 , ・ ・ 2'倍の値をサンプルとして生成することを意図 している pむ回ステートメントでは,サンプリングを行うパラメータを z,初期値を 1とし,オプションに udsを指定することで, udsステートメントで読み込んだサブルーチンにより zのサンプリングが行われる prlorステートメント,皿 ode1ステートメントで使用している関数 genera1は,引数に与えた値がそのまま 2 . 3 )について,両辺の対数をとると, 事前分布の対数 1 対数尤度としてそれぞれ格納される.ベイズの定理 ( l o g f (θ [ y )= c+l o g g ( y[ θ)+logπ(θ) cは定数 ( 3 . 3 ) とかける. prlorステートメント, mode1ステートメントの関数 genera1の引数に指定した変数の値は, 3 . 3 )の logπ(θ),l o g g (ν│θ)に対応している.上記のプログラムでは, 2*z それぞれ ( logπ(θ),3*z =l o g g ( y[ θ )とした.事後分布の対数の値については?推測に影響しない定数部分は無視して,次のように 計算される.上の例では, LogPostは 5ホzとなる. LogPost = LogPrior + LogLike 3 . 4 ARSの MCMCProcedureへの実装 本節では, ARSを実行するサブルーチンを FCMPプロシジ、ヤにより定義し, MCMCプロシジ、ヤで実行す るプログラムを紹介する.プログラムの構成は?大きく分けて以下の 3つに分けられる. 1) ARSのアルゴリズムの初期値 Qη = { i 1o ' ( hぃ・ , i 1n+dの設定 2) FCMPプロシジャにより, ARSのアルゴリズムをサブルーチンとして定義 3 ) MCMCプロシジ、ヤの実行 以下に, ARSのアルゴリズムを MCMCプロシジ、ヤに実装するプログラムを示すが,著者のプログラミング 技術が未熟なため,冗長な箇所や可読性に欠ける箇所が散見されることをご容赦頂きたい.プログラム中に, 、一一ー 番号."の形でコメントに付番した.プログラムを提示した後に,コメント番号ごとに簡単な説 明を追記する.皆様に UDSステートメントを利用したプログラムの一例を提示できれば幸いである. M C M Cプロシジャで AdaptiveRejectionSarnplingを行うプログラム ト一一一一 1:ユーザー定義の関数,サブルーチンを読みこむ. 。 ptions cplib=sasuser.fu cs 血 且 . i let MAXSIZE=100 ; * 一一一 2・ GRIDX:ARSの初期値を格納したデータセット.初期値は昇J 頂に入力する. data GRIDX ; No=O ; do GRIDX=‑2 to 2 by 1 No = No + 1 ;output ; ‑13・
end ;
且;
ru
車 一 一 一 一 3:マクロ変数 G
飢加に A
R
Sの初期値の数を格納する;
proc c
o
n
t
e
n
t
s data=GRIDX out=CDNTnoprint ;
ru
且;
data̲
N
U
L
L
̲;
s
e
t GRIDX end=EDF ;
1
M
'
, ̲
N
̲
);
i
f EDFthen c
a
l
l symput('G飢
ru
且;
ホ一一一一 4
:FCPMプロシジ、ヤの開始;
proc fcmp outlib=sasuser.fu
且c
S
.
u
d
s;
ホ一一一
5:対数尤度を算出する関数.標準正規分布からの乱数生成を想定して対数尤度を定義した;
fu
且c
tionL
L
F
(
x
);
血u
=O ;s
d
=
1 ;pi=3.14159265 ;
y =ー1
/
2ホlog(2ホpiホ (
s
d
本車 2
)
)ー(1/(
2
*(
s
d
ホホ 2
)
)
)ホ ((
x
‑
m
u
)本車 2
)
r
e
t
u
r
n
(
y
)
endsub ;
6:配要J
IG
R
Dの要素を昇I
!
頃に並べ替えるサブルーチン;
subroutine SDRT̲ARRAY(PNT,SAMPLE,G
R
D
[吋 ) ;
outargs G
R
D;
d
oi
=
1 to P
N
T
‑
1;
i
f
(SAMPLE >G
R
D
[
P
N
T
‑
1
J )thenGRD[PNTJ=SAMPLE ;
R
D
[
P
N
T
‑
i
J )thend
o;
e
l
s
ei
f (SAMPLE <G
TMP
=G
R
D
[
P
N
T
‑
i
J;
G
R
D
[
P
N
T
‑
i
J = SAMPLE
GRD[
P
N
T
‑
i+
1
J =T
M
P
end ;
end ;
endsub ;
ホ
ト
7:A
R
Sの初期値に対する対数尤度を算出するサブルーチン;
subroutine LLFX(PNT,GRD[ホJ,L
F
[ホJ
);
outargs LF ;
do i
=
1 toPNT ;
L
F
[
i
J =L
L
F
(
G
R
D
[
i
J
);
end ;
endsub ;
8:アルゴ、リズム (
2
)の直線の傾きと切片を算出するサブルーチン;
subroutine CDEFF̲L(PNT,GRD[ホJ,L
F
[
*
J,a
[ホ], b
[ホJ
)
outargs a,b ;
do i
=
1 toPNT‑1 ;
a[
i
J =(
L
F[i+1
JーLF[iJ)/(GRD[i+1J‑GRD[iJ)
R
D
[
i
J
b[
i
J =LF[
i
J‑a[
i
JホG
end ;
endsub ;
事一一一
9:2つの直線の交点の座標を算出するサブルーチン;
subroutine INTERSECTIDN(PNT, a
[事], b[吋, G
R
D
M
[ホ])
outargs GRDM ;
d
oi
=
3t
oP
N
T
‑
1;
GRDM[iJ=(b[i‑2J‑b[iJ)/(a[iJ‑a[i‑2J) ;
end ;
endsub ;
本一一一
1
0:図 1
1における区分的な指数関数下の面積を算出するサブルーチン;
subroutineAREA(PNT,G
即 [ ホJ
,GRDM[ホJ,a
[
*
J,b
[
*
J,S
[
*,
*
J,S
S
)
outargs S,S
S;
SS=o ;
d
oj
=
1t
o PNT+1 ;
ト一一ー
‑
1
4・
if (j<=2 ) then do ;
j
]+b[
j
]
)/a[
j
]
INT11 = 0 ; INT12 = 0 ;INT21 = exp(a[j]事GRD[
if
(j=1 ) then INT22 = 0 ;
else if (j=2) then INT22 = exp(a[j]*GRD[j‑1]+b[j])/a[j] ;
end ;
else if (j>=PNT ) then do ;
if
(j=PNT) then INT11 = exp(a[j‑2]刈 即 日 ]+b[j‑2])/a[
j
‑
2
]
else if (j=PNT+1 ) then INT11 = 0 ;
INT12 = exp(a[j‑2]刈 叩 [j‑1]+b[j‑2])/a[j‑2] ;INT21 = 0 ;INT22 = 0 ;
end ;
else do ;
INT11 = exp(a[j‑2]刈 叩H口
]+b[j‑2])/a[j‑2] ;
INT12 = exp(a[j‑2]事 GRD[j‑1]+b[j‑2])/a[j‑2] ;
INT21 = exp(a[j]事 GRD[
j
]+b[
jJ)/a[
j
]
]
INT22 = exp(a[j]*GRDM[j]+b[j])/a口
end ;
S[1,
j
] = INT11‑INT12 ;S[2,
j
] = INT21‑INT22 ;SS = SS + S[1,
j
] + S[2,
j
]
end ;
endsub ;
*一
一 11:コメント 10で算出した面積をもとに,乱数を生成する区間を選択するサブルーチン.
subroutine SELECT̲AREA(PNT,S[*,
事
]
, SS,FLG
,
工 FLGj)
outargs FLGi,FLGj
且d
('u
且i
form')
CS = 0 ;FLG = 0 ;u1 = ra
do j=1 to PNT+1 ;
do 工=1 to 2 ;
j]/SS ;
CS = CS + S[i,
if (CS > u1 阻 d FLG=O ) then do ;
FLGi=i ;FLGj=j ;FLG=1 ;
end ;
end ;
end ;
endsub ;
本一一一 12:逆関数法 (3‑2)により乱数生成を行うサブルーチン;
subroutine INVFM(PNT,a[事
]
, GRD[*],GRDM[*],FLGi,FLGj,SAMPLE) ;
outargs SAMPLE ;
u2 = rand('uniform') ;
if (FLGi=1 ) then do ;
if
(FLGj=PNT+1 ) then INV1 = 0 ;
a1ョiI if (FlGj‑PNT ) than TNV1 = 112 書 oxp( ヨ[J1 Ulj~ ヨ] tCRD[
}
o
'LCjJ) 1
else INVl = u2*exp(alFLGj‑2l*GRDM[FLGjJ)
INV2 = (1‑u2)*exp(a[FLGj‑2]*GRD[FLGj‑1]) ;INV3 = a[FLGj‑2]
end ;
if (FLGi=2 ) then do ;
if
(FLGj=1 ) then INV2 = 0 ;
else if (FLGj=2 ) then INV2 = (1‑u2)*exp(a[FLGj]*GRD[FLGj‑1]) ;
else INV2 = (1‑u2)*exp(a[FLGj]*GRDM[FLGj])
INV1 = u2*exp(a[FLGj]叫 叩 [FLGj]) ;INV3 = a[FLGj] ;
end ;
SAMPLE = log(INV1+INV2)/INV3 ;
endsub ;
車一一‑ 13:一次式を算出するサブルーチン;
subroutine LINEAR(INDEX,a[吋
, b[*l,xx,y) ;
outargs y ;
y = a[INDEX]*xx+b[INDEX] ;
endsub ;
ト一一一 14:生成したサンプルの受容 棄却を判定するサブルーチン. ,
ACC=1:受容, ACC=2:受容して点を追加, ACC=O:棄却
←ー ー
subroutine AR̲PROCESS(PNT,FLGi,FLGj,a[吋
, b[*],SAMPLE,ACC,FLGB)
outargs PNT,ACC,FLGB ;
‑
1
5
‑
if (FLGi=1 ) then call LINEAR(FLGj‑2,a,b,SAMPLE,y2) ; else if (FLGi=2 ) then call LlNEAR(FLGj ,a,b,SAMPLE,y2) ; if (FLGj=1 or FLGj=(PNT+1) ) then C1=O ; else do ; call LINEAR(FLGj‑1,a,b,SAMPLE,y1) ; C1 = exp(y1)/exp(y2) ; end ; C2 = exp(LLF(SAMPLE))/exp(y2) ; u3 =r担 d('uniform') ; if (u3 <= C1 ) then do ;ACC=1 ;FLGB=O ; end ; else if (u3 <= C2 ) then do ;ACC=2 ;FLGB=O ;PNT = PNT+1 ;end ; else do ;ACC=O ;end ; endsub ; 15:定義したサブルーチンを組み合わせて ARSのアルゴリズムを構築するサブルーチン. subroutine ARS(PNT,GRD[吋 , SAMPLE,ACC) ; outargs PNT,GRD,SAMPLE,ACC ; ト一一ー ray GRDM[&MAXSIZE] ray a[%eval(&MAXSIZE‑1)] む r ayb[%eval(&MAXSIZE‑1)] ; array S[2, %eval(&MAXSIZE+1)] ; 訂 r ay LF[&MAXSIZE] 訂 む if (ACC=2 ) then call SORT̲ARRAY(PNT,SAMPLE,GRD) ; call LLFX(PNT,GRD,LF) call COEFF̲L(PNT,GRD,LF,a,b) call INTERSECTION(PNT,a,b,GRDM) call AREA(PNT,GRD,GRDM,a,b,S,SS) ; FLGB=1 ; do while( FLGB ) ; call SELECT̲AREA(PNT,S,SS,FLGi,FLGj) ; call INVFM(PNT,a,GRD,GRDM,FLGi,FLGj,SAMPLE) call AR̲PROCESS(PNT,FLGi,FLGj,a,b,SAMPLE,ACC,FLGB) ; 白n f 1~ endsub ; run ; quit ; ト 16:MCMCプロシジャにサブルーチン ARS老実装し,サンプリングを行う; 。 ds graphics on ; proc mcmc data=GRIDX outpost=out NMC=10000 NBI=O thin=1 monitor=(SAMPLE) ; む r ay GRID[1] / nosymbols ; array GRD[&MAXSIZE] ; begincnst ; rc = read̲array('GRIDX',GRID,'GRIDX') ; do i=1 to &GNUM ; G叩 [ i ] = GRID[ i ] ; end ; if No = &GNUM then PNT=No ; call streaminit(9999) ; endcnst ; uds ARS(PNT,GRD,SAMPLE,ACC) ; parms PNT 0 GRD: 0 SAMPLE 0 ACC 0 / uds ; prior PNT GRD: SAMPLE ACC ‑general(O) model general(O) ; run ; ods graphics off ; ‑ 1 6・
アウトプット
Posterior Sum
血a
rユes
Parameter
SAMPLE
N
10000
Me回
Sta
且d
ard
Deviatユon
25%
1.0006
‑0.6806
‑0.00512
Percent工les
50%
‑0.00191
75%
0.6691
Posterior Intervals
Parameter
Alpha
E吐ual‑Tail Interval
SAMPLE
0.050
‑1.9716
HPD Interval
1.9709
2.0163
1.9002
。
円
D
I;
ag s
t
l
c
s(
o
rSAMPLE
何引 J
t
o
C
I
¥
ハ
i
:
:
j
‑
I
l
!
七
J
:
I
~I___) ¥
に
,
1
1
とAA~F じE
L'
図1
3
:診断プロット
プログラムについて.補足ー
コメント 1・ 3 本プログラムでは, FCMPプロシジャで作成する関数及びサブルーチンを sasuser.funcs.uds
に保存するため唱 cmplibオプションで, sasuser.funcsを指定する.。九二 {‑2,‑1,
0,1,
2
}を,データセッ
ト GRIDX に格納し,。η の要素の数~,マクロ変数 GNUM に格納する.
コメント 4
FCMPプロシジャにより,関数及びサブルーチンを定義し, sasuser.funcs.udsに格納する.
コメント 5 関数 LLFは,目標の分布の対数尤度を返す.ここでは,目標の分布を標準正規分布とした.
コメント 6 配列 GRDに格納される Qη の要素を昇[
J
固に並べ替えるサブ、ルーチン.
コメント 7 l
l
nの各要素に対する対数尤度の値を算出するサブルーチン
コメント 8 ARSのアルゴリズム (
2
)における直線 miの傾きと切片を算出するサブ、ルーチン
コメント 9 直線 mi‑l と mi+l の交点、の座標を算出するサブルーチン.
2π
(
8
)下の面積を算出するサブルーチン.
コメント 10 ある区聞における曲線 g
コメント 11 サブルーチン AREAで算出した各区間の面積の大きさをもとに乱数を生成する区聞を決定す
るサブルーチン
‑
1
7・
コメン卜 12 サブルーチン S ELECT̲A 阻 Aで選択された区聞において, ARSのアルゴリズム(3‑ 2 )で提示し た逆関数を適用し , g 2, π ( 1 1 )からの乱数を生成するサブルーチン. コメン卜 13 サブ、ルーチン C OEFF̲Lで算出した係数をもとに,一次式の値を算出するサブルーチン. コメン卜 14 ARSのアルゴリズム ( 5 ),( 5 ‑ 1 )にしたがって,生成したサンプルの受容,棄却を判定するサブ C C = lのとき,生成したサンプルを受容する. ACC=2のとき,生成したサンプルを受容し,S1π に ルーチン. A 生成したサンプルを加える.A CC=2のとき,生成したサンプルを棄却する. コメン卜 15 ARSのアルゴリズムを構築するサブルーチン.FCMPプロシジャは, DATAステップと同様 a yステートメントで配列を定義できる.これまでに定義したサブルーチンを使用して, ARSのアルゴ にぽr リズムを構築する.サブ、ルーチン A R̲PROCESSで生成したサンプルが受容されると, FLGB=Oとなりループ を抜ける. コメン卜 16 UDSステートメントによりサブルーチン A RSを MCMCプロシジャに実装し,サンプリング を行う. PROCMCMCステートメントの MONITORオプションで,解析の対象とするパラメータを指定 本プログラムでは,生成されたサンプルに関心があるため, MONITORオプションに SAMPLEを指定した.本節のプログラムで初出の ARRAYステートメント, BEGINCNST‑ENDCNSTス テートメントについて若干の説明を加える することができる ARRAYステートメン卜 ARRAYステートメントにより, MCMCプロシジ、ャ内で配列を定義すること ができる NOSYMBOLSオプションは,サイズ不定の配列を定義する際に使用する.READ̲ARRAY関数 RIDXから配列 GRIDにデータを読み込むため,配列 GRIDのサイズは不定で、あ を使用して,データセット G RIDのサイズはデータセット GRIDXから読み込 る. NOSYMBOLSオプションで配列を定義しておくと, G んだデータのサイズと等しくなる. BEGINCNST・ ENDCNSTステートメン卜 BEGINCNSTステートメントと ENDCNSTステート メントの聞に記述されたプログラムは, MCMCプロシジ、ヤのくり返し処理の前に実行される.そのため,く り返し処理の準備段階としてパラメータの初期値を設定したり,データを読み込むために使用されることが 1n の読み込みは,くり返し処理の前に行うため,BEGINCNST 多い.ARSのアルゴリズムにおける初期値 S ‑ENDCNSTステートメント内に記述している.READ̲ARRAY関数は, READ̲ARRAY(データセット名,配列名,<データセットの列名 1>,<データセットの列名 2>,. . . ) として,データセットから,配列にデータを読み込ませる関数である.データセットから特定の列のみ読み 込む場合には,第 3引数以降に列名を記述する. d a p t i v eR e j e c t i o nS a m p l i n gの面白いところは,乱数を生成する効率が逐次改善される 本稿で紹介した A 1n に多くの点をとればサンプリングの効率は上がるが,計算の負荷が高まってしまう.あ 点である初期値 S る程度の初期値を与えて , g 2,n が目標の分布と大きく離れている箇所に点を追加していくことで,効率と計算 の負荷のバランスの取れたサンプリングを行うことができる.本プログラムでは,。η ={‑2, ‑1, 0, 1, ‑2} の 5点を初期値として開始したが, 1 0 0 0 0個の乱数が生成されるまでに 5 0個ほどのサンプルが Qπ に追加さ れた • S 1n に点を追加することによって g 2, n が目標の分布に近づく様子を次頁以降の図で示した.I te r a t i o n が 400を超える頃には,目標の分布とサンプリングを行う分布は非常に近いものになっている. ‑ 1 8 ‑
3
S
E
‑
‑
a
。
O
SAM:'
正
SAM.正
ロ1I 0 J-t1'iー…ー剛山一一引川~, . .
l
I:
rきれた命│
口恥円市……町句"一一剛山.仰さ~
。
3
.
h
'
医
.
・
ι
0
9
O
SA昨 日
SAM~LE
白咽白河一一今川~1ìー-o!!Yrl.~ , .過1D?‑l''.T
:4j
日帽の分弐……州刊一一州司.出~
・"rilliOI
>
・
"
Ie
.r
l
l
l
l
o伊 η
‑
."
"
'
h
a
c
o
"
O
SAMP正
刊の分布一一個山一一創出お.過旭川日
l
‑
03
'
5
Z
E
】
"
O
‑
a
‑
a
‑
干
z
;
一︑吋
一
J
二
iMH
v
戸 ‑
.
一:
F一
判
正一一
ド
ド
•
M‑山
町
町
曾1
吋
叫
の
"
栂
帽
n
• ••• •
SAMPLE
RI
l
I
i
)
t
帰…一制山口ー一前日・ "
1
0
.
‑
1
1
1
.
4I
‑
1
9・
・"m n・
'
"
l
!.nllolt'"悶
由
2
ε
SAMP
l
S"""
白
川州内……岬仙一一・醐" . 帥 刊 リ
l
M 刊ト一一剛山一一・岡山.制された血│
・
'
"
l
'
.
r
a
l
l
o
‑
.
.
c2S
"
・e
・
"
・n
Z
o
、,
SN
昨日
SMFLE
同日剛一一一同"一一剛司・ a 旭川~
日 蜘 刊 一 一 ・ 刷 刊 一 一 明 日 .01 '1:刊~
"・g ・t!or~・'"
=
Z
E
S
Z
SA
昨日
SAMPしE
B・ 附 R … … 剛 山 一
一 叫 山 .i
I
o
'
!
:
i
'f
¥
'
:o
.1
目・ m 州一一阿川一一時(;~
.
脚
内
:
:
!
.
J
.
,
1
1
. 1
1
0
.
.
.
.
.
.
.
9
3
‑
t
・0
E
Q
s
A
,
l
APLE
SAM?LE
,
‑
‑
I
B幅 削 ト 一 一 岬 山 一 一 剛 山 ..
.
.
.
"
C
.
.r
.t
:1
:
"の付帯一一岬 ~'I
‑
2
0・
叫{口・"I:Jl ~nt:fl I
おわりに 本稿では, SAS9 . 2で追加された MCMCプロシジ、ヤの使い方と, FCMPプロシジャを使用して Adaptive R e j e c t i o nSampling~ MCMCプロシジ、ヤに実装する方法を紹介した.MCMCプロシジャについて, SAS のマニュアル以外に参照できる資料がほとんど無く,類似のプロシジャもないことから学習しにくい現状が ある.しかしながら.臨床試験や医学統計とベイズ統計を絡めたセミナーが数多く開催されている今日に, MCMCプロシジ、ヤやベイズ、推測を行うためのオプションが SASに追加されたことは大変有用で,ユーザー にとって嬉しいことではないでしょうか.皆様が MCMCプロシジャを活用していく上で,本稿が少しでも 役に立つようであれば幸いである 謝辞 本稿者E 作成するにあたり,ご指導者E 頂いた皆様に感謝申し上げます.また ともに論文作成に励み,数々の 7 頂いた黒田晋吾さんに心より感謝申し上げます. 助言者E 連絡先 Igeta̲Masataka 也t akeda.c o .jp 参考文献 [ 1 ] BaseSAS9 . 2P r o c e d u r e sG u i d e . [ 2 ]G i l k s,W.R .andWild,P .( 1 9 9 2 ), Adaptiver e j e c t i o n叩 叩 l i n gf o rGibbss a r 叩 l i n g ぺAppliedSt以 降 t i c s, 4 1, 3 3 7 ‑ 3 4 8 .K .C .( 1 9 9 5 ),"Adaptive民 j e c t i o nM e t r o p o l i ss a r 叩 l i n g ぺ [ 3 ]G i l k s,W. R . , B e s t,N . G. andTan,K A p p l i e dS t a t i s t i c s,44, [ 4 ] RadfordM.Neal( 2 0 0 3 )," S l i c eS a m p l i n g " .TheAnnalso fS t a t i s t i c s,3 1 ( 3 ),7 0 5 ‑ 7 6 7 .4 5 5 ‑ 4 7 2 . [ 5 ] SASjSTAT(R)9 . 2U s e r ' sG u i d e . [ 6 ] SASjGRAPH9 . 2S t a t i s t i c a lG r a p h i c sP r o c e d u r e sG u i d e . [ 7 ]大森裕浩 ( 2 0 0 1 )マルコフ連鎖モンテカルロ法の最近の展開 [ 8 ]小西貞員[1,越智義道,大森裕浩 ( 2 0 0 8 )計算統計学の方法,朝倉書庖. ‑ 2 1 ‑
Cox回帰における Bayes推定と PHREGプロシジ、ヤ 0黒 田 晋 吾 武田薬品工業株式会社医薬開発本部日本開発センター クリニカルデータサイエンス部統計グループ Bayesianinferencei ntheCox'sproportionalhazardsmodelandPHREGprocedure S h i n g oKuroda ,L t d . TakedaP h a r m a c e u t i c a lCompany 概要:SAS9.2では, PHREGプロシジャにおいて BAYESステートメントを記述することにより, Cox回帰 における回帰パラメータの Bayes推定値を算出することが可能となった.本稿では, SAS9.2で用いられて いる手法である, Cox回帰における回帰パラメータの B ayes推定値を算出する際に尤度の代わりに部分尤 度を用いる手法について,その妥当性を証明する.また, R e j e c t i o nSamplingと GibbsSamplingを用いて Cox回帰における回帰パラメータの事後分布から乱数生成を行い, SGPLOTプロシジャによる事後分布の 密度推定,及び平均値や中央値等の B ayes推定値の算出が可能であることを示す. ayesの定理, R e j e c t i o nSampling,GibbsSampling,PHREGプロシジャ, BAYES キーワード:部分尤度, B ステートメント 1 はじめに 生存時間解析においてよく用いられる手法の一つである Cox回帰では,部分尤度を利用して回帰パラメータ a y e s流の解析では,パラメータの事前分布と尤度の積が事 の推定値を求めることにより解析を行う.また B 後分布の定数倍となることを利用して解析を行う方法がある. SAS9.2では, PHREGプロシジャにおいて BAYESステートメントを記述することにより, Cox回帰における回帰パラメータの Bayes推定値を算出す ることが可能となったが,その際に SASの内部では,尤度ではなく部分尤度を用いることによって事後分布 を算出し,この事後分布を基に B ayes推定値を求めている.本稿では,まず Cox回!帰において回帰パラメー タの B a y e s推定値を算出する際に?回 l 局パラメータの事前分布と部分尤度の積が回帰パラメータの事後分布 の定数倍となることを示し, Bayes流の解析においても部分尤度を用いることの妥当性を証明する.また?回 帰パラメータの事後分布は複雑な形そしており,解析的に回帰パラメータの平均値や中央値等を求めること は難しいため,次に R e j e c t i o nSamplingと GibbsSamplingについて解説を行い,これらの Sampling手法 を用いて回帰パラメータの事後分布からの乱数を生成し, SGPLOTプロシジャによる事後分布の密度推定, 及び事後平均値,事後中央値等の B ayes推定値の算出が可能であることを示す 2 定義及び仮定 Tj, T2, , Tnそあるイベント(例えば死亡)が発生するまでの観測時聞を表す確率変数とし , T i ( i= 1, , n ) ‑ 2 3・
はそれぞれ独立に同ーの確率分布 F ( t ; )に従うとする.このとき, h ( t ; )= 知 P[ t Ti t+hI 民主 t ] f ( t ;) S ( t ;) を7;のハザード関数という ただし , f ( t ; )は Tiの確率密度関数とし ,S ( t ; )は S ( t ; )=P(民主 t ) で定義される Tiの生存関数とする.また,累積ハザード関数 H ( t )を l h 何同 間)= で定義する. また ,C1 , C2, , Cれを打ち切りが発生するまでの観測時聞を表す確率変数とし ,Ci( i= 1 , , Cn) は分 布関数 G ( t ; ),確率密度関数 g ( t ; )をもっ同ーの分布にそれぞれ独立に従うとする.さらに, Ui=min(7 ; , Ci )( i=1, η ) i=れであればム=1,U i= Ciであれば 0 ;= 0として ,0i(i=1, , n )を定義するただし ,t i, C i, U i とし ,U はそれぞれ確率変数 T i, C i, Uiの実現値とする. 観測時間及びイベント発生(打ち切り)の有無のデータ ( U i, ム) ( i = 1, , n )が得られたとき ,u '‑ ( U 1, , un),O'=(Ol, , 0 η )として,ランダム打ち切りの仮定の下,すなわち と が無関係であり,さら に各 i= 1, , nについて ,Tiと Ciが独立であるという仮定の下で,尤度関数 L( , I t ム0 )を計算すると, L (, I u, O )=I I{f(Ui; )P(ム =1IUi,)}0,{g(u;; )P(Oi=0IUi,)}1 0, i = l 二 日 {f(Ui; )(1 G(Ui,))}ム{g(Ui; )S(Ui; )}1 0, t二 = l I If(Ui; )匂 (U;; )1 0日 (1 G(Ui,))ムg(Ui; )1 0, = 1 i=l =L ( i ' I u, o ) L ( I u, o ) αL (I U, O ) となる.ただし, O)=IIf(Ui;)匂 ( U i ;) 1ム L ( IU, i = l L ( I u, 8 )= I I(1 G(u;,))ムg(Ui; )1 0, i = l とする以上から,ランダム打ち切りの仮定の下でパラメータ を見つけることにより を推定する場合 , L (I 仏 8 )を最大L こする の最尤推定量が得られる.以下,本稿ではランダム打ち切りを仮定する. ‑ 2 4・
3 Coxの比例ハザードモデル ( t ; xβ)に比例ハザード性が成り立っているとするすなわち ,h ( t ; x, β)に対し, ハザード関数 h h ( t ; x, β)= h o ( t ) h ( x, β) が成り立っているとするただし ,xを共変量, βをパラメータとし ,h(x, β)は tによらない関数で ,h o ( t )は x,βによらない関数とするーさらに特別な場合として,比例ハザード性の仮定の下で ) x '= =( X l, , xp) ,β, (1, ,p )とし, h(x, β)= e x p ( x ' β) としたとき,すなわち, h ( t ; xβ)= h o ( t )e x p ( x 'β) + + pXp) =h o ( t )e x p (l X l というモデルを考えたとき,これを Coxの比例ハザードモデルというー = = = U i, O i・X i )( i= 1, , n )が得られたときの尤度関数を考え 次に, COXの比例ハザードモデルの下でデータ ( '= =(Ul1 る.u )U η ),d ' ( 0 1, , 0 η ),X ( X l, , xn)',x ; ( X i l・ , X i p )とし? 的 ;x, ト であることに注意して, 1 Z 昌 μ 札町 μ i = l 且 u ' 九 一 一 Zニ l υ c z ηH L ( βh o ( t ) u, d, X )= IIf(ui;s, 叫ん S(Ui;s, X ; ) 1ム 山吋卜 =立川町 )e 1 u xp{ 山 却 問 dt}] = b h o M P M 1叫['" y i( t ) h o ( t )e x p ( x ; 's ) d t ] 4陽子r 古 川 町 ) 川6 ( = L1 β 1u,δX)L2(β,ho(t)1 u, d, X) となるただし, o ~ l e x p ( x ; ' s l l L1(β 1 1 ι, d, X)= 川│一一一一一│ 日 L B(Ui) J L2(s, h o川 μ 局 u z p x e yH ヤ η臼 M U B ‑ 2 5・ 叶1 叶 00 B ( t ) h o (
J1 (
t U
i
),
Y
;(
t
)= {
1
0(t>同)
とする.ここで, L1(
β
1u,
d,
X)は部分尤度と呼ばれ,
.
.
;
,
田
p
(
x
;
'
s)
l0,
L
l
(β1u,
δ,
X)=川│一一一一│
日 lB
(
u
;
)J
.
;
,
e
xp(x/s)
l
O
三
日 l l:~l Y
;
(旬 ) 田p(xz
's
)
J
4
白[
l
:
ニ
z戸~~ 1
以
仰
位叫
p
p
(
何
(
x
ザ
x
;
;
'
'
Fs
)
IER(u,
)田 p
(xz
'β
)
と書くことができる h
o
(
t
)によらない β のみの関数である.ただし ,R
(
U
i
)は時間同におけるリスク集合,
すなわち,
R
(
U
i
)= {
l
lU
l?U
i
}
である.通常 L1(β1u,
d,
X)を最大』こする β=β を Newton‑Raphson法等を用いて求め, β が最尤推定量
と同等の性質を持つとして, Coxの比例ハザードモデルにおける β の推定及び検定を行う.
i,
打ち切りの指標 5
t
,
及び共変量的 (
i= 1, ,
5
)をそれぞれ, (
1
1,
1,
0
),(
1
2,
1,
1
),(
1
3,
0,
0
),
例 1 観察時間 U
i
(
1
6,
1,
1
),(
2
1,
1,
1
)としたときの部分尤度を求める.このとき,各 Uj におけるリスク集合は
R(l
1
)= {
1,
2,
3,
4,
5
},R
(
1
2
)= {
1,
2,
3,
5
},R
(
1
6
)= {
1,
3
},R
(
2
1
)= {
3
}
であるから,部分尤度 L
β
1u,
d,
X)は
,
1(
n
‑
ιl(β1u,
d,
X)= I -土~ì(n
ex:( ,よ~
i
n
i
¥
3
e
x
p
()
+2}¥
3
e
x
p
()
+1}¥2}
は
n
u
︑
u
臼
つv巧t
Qd
EEl‑
ノ
σ6
10
/fl
一
一
ム
つ
1一
︑
︑っ一・‑¥
となり,部分尤度を最大にする
となる.
βの最尤推定量を算出する際には,全尤度 L
(β,
h
o
(
t
)1u,
d,
X)を最大にする βを求めることが必要とされる.
X
)を最大にする β=β を最尤推定量としているが, ι2(β ,h
o
(
t
)1仏 d,
X
)
上記では部分尤度ム (β│仏 d,
にも βが含まれているため,実際は βが βの最尤推定量となることは明らかで、はない.しかし,次の定理に
より 部分尤度を用いる妥当性が示される.
3
定理 (
K
l
e
i
ne
tal
.(
2
0
0
3
)
) 部分尤度 L
β
[
t
ι,
d,
X)を最大にする β=β は最尤推定量である.
1(
t1
, ,
t
D
),
打ち切り時閣を (
t
D
+
l, ,
t
n
)とし,全尤度
証明イベント発生時聞を (
L
(β,h
o
(
t
)1
u,
d,
X
)= II[ho(ui)exp(x/s)]O,[
e
x
p
{ 比 例 )exp(x/s)}]
i=l
D
=
η
I
I
[
h
o
(
t
;
)
e
x
p
(
x
;
's)]
I
I
[
e
x
p
{ HO(ti)exp(x/s)}]
i
=
l
i=l
‑
2
6・
t雇(
t1, ,
t
D
)において L(β,
h
o
(
t
)1
1
ι,
d,
X) は h
o
(
t
)= 0
を β を固定して h
o
(
t
)のみの関数と見るとき
で最大となる.よって ,
tε(
t1, ,
tD)に対し ,h
o
(
ti
)=hO
i= 1,
i(
,
D)とすれば ,
H
o
(
t
j
)= Lt,
:
O
:t
jhO
i
と書けるから.
D
π
I
II
L
L(
βん (
t
)1
uδ,
X)= II[
hO
)
lII 1e
x
p~
hO
iexp(x/s
iexp(x/β)~ 1
i=1
jニ 1 I
l t,
三
わ
JI
D
I
I
D
II
L L
= II[hoiexp(x;'ß)ll'叫~
hO
i
exp(x/β)~ 1
I l i=1 j
E
R
(川
JI
D
I
I
I
l
11
二
日 [hOiexp(x;'β)lI
e
x
p~ hO
i L exp(x/β)~ I
j
E
R
(
t
;
)
JI
となる.
θl
o
g
L
(β,
h
o
(
t
) u,
δ,
X)
δhOi
1
1
h
n
;
山
二叫(x/β)= 0
2
j
E
R
(
t,
)
を解くと,
O
i
h =
玄二す四p(x/β)
となるので,上記の式を L
(β,ho(t)[
u,δX
)に代入すると?
ヲ
D
L(βん (
t
)[
川
X)= II[
h
O
i
e
x
p
(
x
;
'
s
)
]
I
I
I
l
11
ドp~ hOi L 白 州 fβ)~ I
j
E
R
(
t
;
)
JI
1
1
I
1
" , ,~, 1
1
川 I'
"
' ~~~r\-:_t_~'_
I1
e
x
p< 、 、 exp(x/s)>
I
日 山 田(
t,
)田 町 ザ )J
1
‑
‑
‑
'
‑l
LjEl川 xp(x/β)mh)
j
│
品 │ 叫(
x
;
'
β)
ld¥
J
α
品 目p(x;'β)
土
;123ER(tz) p
(x/s)
白
となるから 部分尤度を最大にする β=β は βの最尤推定量である.また,
3
ん=一一一」
L
j
E
R
(
t
;
)exp(x/s)
となる.
4 Cox回帰における Bayes推定
Coxの比例ハザードモデル
h
(
t
;
xβ)= h
o
(
t
)e
x
p
(
x
'β)
=h
o
(
t
)e
x
p
( lXl十 十
p Xp)
におけるパラメータ β をベイズ流のアプローチで、推定することを考える.ただし,ここでは h
o
(
t
)の推定は
行わないこととする.データ (
u
;,
d
i,
x
;
)(
i= 1, ,
n
)が得られた時の Coxの比例ハザードモデルにおける
‑
2
7
‑
尤度は
L
(
βん (
t
)Iu,
d,
X
)=
r[ho(川 町 .s
(
x
;
' )
]
o[
e
x
p{ HO(Ui)exp(x/.
s
)
}
]
i
i=l
であるから, β,H
o
(
t
)の事前分布 (
β,
H
o
(
t
)
)について
(
β,
H
o
(
t
)
)= β
( )(
H
o
(
t
)
)
を仮定するとき, β,
H
o
(
t
)の事後分布は
p
(
H
o
(
t
),
βIu,
d,
X)<xL
(β,
H
o
(
t
)Iu,
d,
X) (
β)(
H
o
(
t
)
)
となるよって, β の周辺事後分布は
州 川 X)α
J βl
p
(品 (
t
)
川
X州
t
)
によって求めることができる.ここで ,
H
o
(
t
)の事前過程をガンマ過程とするとき,ある条件の下で
f
ρ
μ
以
p
州
(
吊
H
凹
問
0附
∞
となることを S
臼1吐1
凶ae
凶ta
l
.(
σ
2
00
め
3)に従つて示そう
Z
(
t
)
l
t三O
}がガンマ過程であるとは
定義確率過程 {
(
i
) Z
(
O
)= 0
くt
3に対し ,Z(ら) Z
(
t,
)
1Z
(
t
3
) Z
(
t
2
), ,
Z(
tn
) Z
(
tη 1)はたがいに
(
i
i
) 任意のれくらく
独立
(
i
i
i
)左連続な増大関数 α(
t
)(
α
(
0
)= 0
)と c>Oが存在して,任意の t>sについて,
Z
(
t
) Z
(
s
) Ga(α(
t
) α(
s
),
c
)
を満たすことである. ただし ,Ga(a,
b
)はパラメータ (
a,
b
)のガンマ分布とする. また,このとき
Z
(
t
) gP(α(
t
),
c
)と書くこととする.
H
o
(
t
) gP(cH(
t
),
c
)とするただし ,H (
t
)は増大関数で H (
0
)= 0,c>0とし ,H (
t
),
cはともに既知
とする.イベント又は打ち切りの発生時聞を U(l)くU(2)く
くU(π) とし ,
U
(
O
) = 0として,
h
j= Ho(u(
j
)
) Ho(u(j 1))
と定義すると?
h
j G
a
(
c
h
O
j,
c
)
となる.ただし ,
hO
U
(j
)
) H(
U(j 1
)
)である.ここで ,
Aj=LIER(U(ρ)eXp(Xlβ)とすると,
j=H (
r
r
i=l
i=l
P(巴 >UiIX
,
β品 (
t
)
)=
.
s
叫 ( 叫(
X; )HO(Ui)
)
=
吋
吉
田 品
作
)
)
p(xβ
)
‑
2
8
‑
=
ベ
む
JlEZ{J))exp(21β1)
ベ
ト
=
I
I
叫
( h
jAj)
であるから ,
Aη+1 = 0として,
E
(
U
P
(
民> X
州
(
t
)
)~E (
ト
(
刷)
1
t
i1
n
/
日
ん
=
e
x
p
( hr
i
A
)
一三一
i
‑
J
J
f(ch )(chit
hOj
o
j
\~'-JI
1e
x
p
(
hi)dh
i
‑.
.
r
¥ c
~'-JI-'-J
=
台
(
市r
7
=
ト (IOg(有)
=
ト(
C
H山 g
(
時)
明ヂ))
hO
Oj
Ch
=
)
D
exp(cH (
t(j))
l
o
g(
1
となり,
L
({
3 t
,
d,
X
)= 1'>0印刷) t,
d,
X
) 剛 州t
)
1
1
凸
1
.¥1.̲ ( 円p(Xj川 ¥
0
5
τ~~/))~ ch(t i) log~(l τ~~'
円p(Xj{
3
)¥¥ (
(̲TTf ¥
l
̲
̲
(
=~J exp~cH (t;)log い
.
J
.
.
)
)
.L
とかける.d:=L~1 <
5i
,h :
=
日
二 1(h (ti))ムとすると,
L(β1t,
d,
X)
~1ô'
割引 1
(噌 )
2)
=
H
(
回 型)
d ¥土
明ヂ)
r
=立(出
凸
(
̲
T
T ¥
1
̲
̲
(
= li~ 1
1exp(cH (
t
;
)
l
o
g(
1
(c)dh (
l
o
gc
)o
5
::10 日\~_. \-', '~b
n
/
.
J
.
.
¥
o
g
n
Ai
lim(
) .~IC) l
o
gc
r
となり,これは Coxの部分尤度に等しい.
例1
(続)観察時間 U
;,打ち切りの指標
ι及び共変量 X; (
i= 1
, ,
5
)をそれぞれ (
1
1,
1,
0
),(
1
2,
1
,
1
),
(
1
3,
0,
0
),(
1
6,
1,
1
),(
2
1,
1,
1
)としたときの部分尤度 L
β│仏 d,
X)は?
1(
L1({31u
‑
2
9・
であった. の事前分布を N(O, l )とすると, α ( 可品) 市)G ) p ( [ u, d, X) となる.また, の事後分布 p ( [ 包, d, X)は , Ce:; の事前分布を ()α1( ∞く く∞)とすると, exp( ( [u, の事後分布 p d, X)は , α ( 可品)(ヰ時1 )G ) p ([ u, d, X) の事後分布 p ( [u, d, X)を基に となるよって,このようにして得られた の推測を行えばよい 5 RejectionSamplingと GibbsSampling ベイズ、手法を用いてパラメータの推定を行う際に,尤度とパラメータの事前分布から得られた事後分布を基 に推定を行うが,一般にパラメータの事後分布の密度関数の正確な形を表現することは難しく,また,平均や 分散等を求める際に事後分布の密度関数を用いた積分計算を解析的に行うことも難しいことが多い.そこ で,そのような場合には事後分布からの乱数を発生させ,その乱数を基に事後平均や事後中央値を求めるこ ととなる.本稿では乱数生成の手法として, R e j e c t i o nSampling,及び GibbsSamplingを用いる. R,ejectionSampling 乱数を生成したい分布 Fの密度関数を f ( x )とし,定数 cと乱数の生成が容易である分布 Gの密度関数 g ( x ) を g ( x ),VxER f ( x ) c が成り立つように選んだとき,次の手J[国 (1)~(3) によって生成される乱数は分布 F に従う.これを R巴jection Samplingと呼ぶ. 1.一様分布 U(O, l )からの乱数 U を生成する. 2 .分布 Gからの乱数 X を生成する. 3 .h ( x ):=f ( x ) j ( c g ( x ) )に対し , U h(X)であれば X を受容し , U >h(X)であれば X を棄却する. , 上記の乱数 X は P(X x[U ( X)) P(U h (X)) ( X ) )= ん ff)g(t)ddt J 。 工 : 二j : r y P ( ο 肋 の t ) 切 〆 9 仰 州 ( 収 的 の t t ) d 1 吋 l ι d j r ∞h ( 収 的 の t ) g ( 収 的 の t) d t C ‑r o o oh(t)g(t)dt =F(x) より,分布 F に従う.また,以上のことから,密度関数の定数倍の形がわかっている場合,すなわち,分布 F の密度関数 f ( x )に対して, f( x )= k f ( x ),kε R ‑ 3 0・
がわかっている場合であれば, R e j e c t i o nSamplingにより分布 Fからの乱数を生成することができる. さらに 乱数を生成したい分布の密度関数 f ( x )に対し ,1 0 g f ( x )が凹関数のときには下記の方法を用いるこ f ( x ) c g ( x )を満たす密度関数 g ( x )を構成することができる. とよって乱数の生成が容易でかつ , l .n個の点 Xj <X 2< <Xn を選ぶ. 2 .l ( x )= l o g f ( x )について ,( x ;, l ( x i ) )と ( x ; + j, l ( x ; +l ) )を通る直線 m;(x)( i= 1, 川 1 )を考える. 3 .l o g ( c g ( x ) )を mj(x) ( x<x, ) l m2(x) (Xj <x<X 2 )、 1 0 伽 ( x ) )= ~ mi伽 il ( x ), m i + j ( x ) )( X i<X<X i + l( i= 2, η2)), mn 2 ( X )( xη 1 <X<xn), mn j ( x )( xη <x ), とする. c g ( X ) 八 ( X ) l o g f ( x ) グ ; ー z ,・ X ? X 3 X 4 f(x)老 酒 う cg(x)の例.左図はー繊分布の宮、度!則数の定数倍右図は logf(x)が凹関数であることを利用して logcg(x)者構成し,その後に逆対数 変換を行うことで cg(x)が定まる 例2R e j e c t i o nSamplingを用いて,切断正規分布 (5 X 5 ), ( X< 5, X>5 ) : e ︑ hハ た /︐句ー 一 丁 ら カ っ ︑ を 成 生 数 乱 の 〆115︿3111 z 一 一 rJ t 方 exp( f ) 乱三 j 5 5 j Tペ令 dx とする‑ R e j e c t i o nSamplingにより乱数の生成を行う場合には,密度関数の定数倍の部分,つまり今の例の場合では ム o E﹄ 1 ︐ ノ 位 e a E E D ︑ ・ ︐ ︑ r‑‑Jll︑ rJ 一 一 ) z ( l ジ一 2 ︑ ︑ 2)を無視しでもよいので. l / ( aV (5 X 5 ), ( X< 5, X>5 ) ‑ 3 1・
として , f I(x)を用いて乱数の生成を行う.まず,一様分布 U( 5, 5 )の密度関数を g ( x )とし, c g ( x )=1 を満たすように cを選ぶことによって, f I(x) cg(x) (5 x 5 ) とすることができる以上より , f I(x)を覆う関数 cg(x)が定まったので, RejectionSampling の手順1. ~3. を繰り返すことにより密度関数 f ( x )をもっ分布からの乱数を生成することが可能となる. SASを用いて乱数を生成するプログラムの例は下記のようになる. dataTRNNOR ; I=1 ; N=100000 ; do while ( I<=N ) ; U=r 祖 国i ( 1 1 1 1 ); V=10ホ ( r 祖 国i (1111)‑O.5) ; ト一一一発生させる乱数の数; ト一一一受容と棄却の判定用の一様乱数; ト一一一 c(g(x))からの乱数; H=exp(‑V寧 *2)/1 ; if (U <=H )thendo ; x=V ; I=I+1 ; ト一一一受容と棄却の判定; output ; end ; end ; ru 且; o gf I(x)= x2は凹関数であるため,すでに紹介したように ,cの値を指定せずに f I(x)を覆う関数 また, l c g ( x )を構成することができる. SASを用いて f I(x)を覆う関数 cg(x)を構成し,さらに確率密度関数 f(x) を持つ分布からの乱数を生成するプログラムを参考 lとして記載した. 上記の例においてRe j e c t i o nSamplingを使用し , c g ( x )を定数とした場合 , l o g f ( x )が凹関数となる性質を 利用して c g ( x )を構成した場合のそれぞれにおいて乱数を生成し(それぞれ 100000個),生成した乱数のヒ ストグラムを描くと下図のようになる. 事, B 一 E三三三互~ 左から , N(O, けからの乱数のヒストグラム , g(x)に一様分布の密度関数を使用した R e j e c t i o nS a m p l i n gによる乱数のヒストグラム,凹関数の性質 e j e c t i o nS a m p l i n gによる乱数のヒストグラム. を利用して cg(x)を構成した R さらに , l o g f ( x )が凹関数となる性質を利用して c g ( x )を構成し,乱数を生成する方法において,乱数生成の 効率をより上昇させる方法として, AdaptiveRe j e c t i o nSamplingと呼ばれる,最初に選んだれ個の z軸上 ‑ 3 2・
の初期点 X 1<X 2< <Xn に点列を追加していく方法もある詳しくは井桁 (2010),大森 (2001),Gilks l .( 1 9 9 5 )を参照ー e ta GibbsSampling 確率変数 X = (X1, X2, , Xn)について, X( i ) (X1, , Xi 1, Xi+ l , , Xη)で条件付けた下での Xiの条件付き密度を f(XiI x( i ) )とし,各 f ( X iI x( i ) )は既知であるとする.このとき?以下の方法によ り?xzの周辺分布からの乱数を生成することができる. l 初期値 z f ) ? , zf)を決める 2 . 4 1 ) ? ? z f )を以下により生成する f(Z1140), , d))から乱数を生成し 141)とする O ) x ; l ) , , x~O)) から乱数を生成し, zil) とする. f ( X 2 1 x i f(xn l x ; l ), , X~l\) から乱数を生成し, zf) とする 3 .2を繰り返す. 上記の手法は G ibbsSamplingと呼ばれる j x j 1 ) ? GibbsSamplingにより生成される乱数手l X(π) はその条件付き密度関数が k ) X~k f ( x l I k ) X~k 1)):=g ) ( xI t ) (Vk>1 I ) 1 ) , X~k 2 ( x l ,X~l)) = f を満たすことより推移核 g t )をもっマルコフ連鎖であり,さらに, x ( XI ( x )について, tの周辺分布 fx, 11 =11 = 11 1 11 = [ f ( !1 1 X 1 仇 仇+ X n 、叫 d 1 d f ( X 1 f x人 吋 = ) )似 (i f ( X iIx i ) )d x1 仇 ん d X n ) ) 仇 川ω 1 d (i X i1 X n d x i + 1 d f ( X iIx ( 州 制 州 問 仇 紙 仇1 f ( x ;Ix = 山 〔叩 d X n t ) (i 日川 吟帆〕 い 1 = 1 t ) d t 似 山( より f ( x )が定常分布となっていることがわかる.また,このとき, GibbsSamplingにより生成される乱数 x, ? ), ,x Ix [ 手J π) は定常分布 f x )に収束することが知られている (Chan(1993)). 以上のことから? x,( j η )は密度関数 fx, 十分大きな η に対し, GibbsSamplingにより生成された乱数 x ( x )をもっ分布からの乱 数と見なすことができる. 例3G i b b sSamplingを用いて, 2変量正規分布からの乱数 X,Y を生成する.ただし ,E(X)= E(Y)ニ Y)= 1/2 とする • X = xを与えたときの Y の条件付分布は N(x/2, 0,V(X)= V(Y)= 1 ,ρ(X, ( 1 ( 1 / 4 ) ) であり ,Yニ Uを与えたときの X の条件付分布は N(y/2, ( 1 ( ( yI y ),f 1 / 4 ) )であるから ,f(xI x )を算出 することが可能である.また, G ibbsSamplingでは f ( xI y ),f ( yI x )からの乱数の生成を行うこととなる ‑ 3 3・
が,今の例では f ( x[ y ),f ( y[ x )は正規分布の密度関数となるので,乱数の生成は容易である. SASを用い て GibbsSamplingを行うプログラムは次のようになる. DATAm且 or G ; keep X Y ; X=O ;Y=O ; ト一一一初期値; n=100000 ; ト一一一標本の大きさ, seed=llll ; ←一一一シード値; do i = l to n ; エf i = l then do ; X=Y!2+sqrt(3!4)*ra 且且 o r(seed) ; Y=X!2+sqrt(3!4)*ra 且且 o r(seed) ; output ; Z=Y ; end ; else do ; X=Z!2+sqrt(3!4)*ra 且且 o r(seed) ; 且且 o r(seed) ; Y=X!2+sqrt(3!4)*ra output ; Z=Y ; end ; end ; run ; 上記のプログラムによって GibbsSamplingを行い , X,Yについてそれぞれ 100000個の乱数を生成した結 果 , X と Y の標本相関係数は 0 . 4 9 7であった.また ,X,Yそれぞれのヒストグラムは下図のようになった. 宅 忌 ー ヨ 話 ζL ム 。 . . . . . . 1 0 . . . 王国 h E三三三三工 E三三三.....n互~ 左図は, X のヒストグラムー右図は Y のヒストグラム. また,上記の例では各条件付き分布 f ( x ;[ x (i ) )からの乱数生成が容易であるが , f ( X i[ x (i ) )からの乱数 ( X i[ x (i ) )の定数倍の形しかわからない場合には,各条件付き密度関数の対数 生成が容易でない場合や f o g f ( x i[ x (i ) )が凹関数であれば,参考 1のマクロ %RSを応用することにより GibbsSampling をとった l を行うことができる(例 4参照) • 上記で解説した RejectionSamplingと GibbsSamplingを用いて, Cox回帰におけるパラメータの Bayes推 定値を算出する. 例 1 (続)観察時間以,打ち切りの指標 O i, 及び共変量 z パi= 1, ( 1 3, 0, 0 ),( 1 6, 1, 1 ),( 2 1,1, 1 )とし, の事前分布を , 5 )をそれぞれ ( 1 1,1 , 0 ),( 1 2,1 ,1 ), N(O,I )としたとき, ( の事後分布 p ( [ 仏 8 , X)は , 1 ¥ ( exp() ¥ (1¥ ̲ ̲ ̲( 2¥ ‑ ; ; ‑ ) ¥3exp( )+2} ¥3exp( )+1} ¥2}‑'‑r ¥ 2} p ( [u, 8, X)c x I一一一一一)I 一一一一一 )I~)expl ‑34・
となりう の事前分布を ()oc1( ∞ < <∞)としたとき, の事後分布 p ( [ 1 ムδ, X)は , ( 1 ' ¥ ( exp() ' ¥ (1, ¥ p ( [u, d, X ) o c ( ; : ; ‑ 一一一一)(一一一一一)(i ;) ¥3exp( )+2) ¥3exp( )+1) ¥2) となったそれぞれの の事後分布から R e j e c t i o nSamplingにより乱数を生成させ,平均値,中央値,標準 偏差, 90%CIを求めると下記のようになる.また,生成した乱数のヒストグラムを描くと下図のようになる. 事前分布 一様分布 平均 0 ,分散 1の正規分布 平均値中央値標準偏差 ー0 . 7 4 ‑ 0 . 7 4 1 .8 1 4 ー0 . 2 2 ‑ 0 . 2 2 0 . 8 4 2 90%CI ( ‑ 3 . 6 8, 2 . 2 1 ) ( ‑ 1 .5 9, 1 . 18 ) . • E Z a a 。 叩 Pl[O E 三三三三E互 = E三三三三三三亘亘亘亘歪司 左図は, β の事前分布を 様分布としたllJ合の事後分布からのヒストグラム.右凶は β の事前分布を平均 0,分散 1の正規分布とした場合の事後分布か らのヒストグラムー 例 4 観 察 時 間 Ui,打ち切りの指標 di,性別 Xli ( 1 男性, 0 女性), BMIX2i ( i= 1, , 5 )をそれ 9 8, 1 , 0, 21 .5 ),( 1 0 4, 1 , 0, 3 6 . 7 ),( 1 2 7 8, 1 , 1 , 23β),( 1 8 8 9, 0, 1 , 2 3め , ( 2 0 3 1, 1 , 0, 3 2刈 , ( 2 1 1 4, 0, 1 , 2 5 . 8 ), ぞれ ( ( 2 5 9 5, 0, 0, 3 0 . 1 )とし, 九( t, xβ)=h o ( t )e x p ( lXl+ 2X2) というモデ、ルに基づ、き い 1 , 2の Bayes推定値を算出することを考える. また, 2 <∞)とする.このとき (1,2 )o c 1( ∞ く 1, 2 の事後密度は部分尤度の定数倍となるので, p ( 1・ 2 [ 仏 δ, X) e x p ( 21 .52 ) α ほp ( 21 .52 )+e x p ( 3 6 . 72 )+e x p ( 1+2 3 . 62 )+ ほp( 1+23.3 2 )+e x p ( 3 2. 42 )+ ほp( 1+25.8 2 )+e x p ( 3 0 . 12 ) 田 p ( 3 6 . 72 ) xexp(36.72)+exp(l+23.62)+exp(1+23.32)+exp(32.42)+exp(1+2582)+exp(3012) 目 p ( 1+2 3 . 62 ) ( 1+2 5 . 82 )+e x p ( 3 0 . 12 ) xexp(l+23.62)+exp(I+2332)+exp(32.42)十 位p x e x p ( 3 2. 42 ) e x p ( 3 2. 42 )+ ほp( 1+25.8 2 )+ ほp(30.1 2 ) となる.ここで, GibbsSamplingによって 1, 2のそれぞれの周辺分布からの乱数を生成したいが,今の 例では GibbsSamplingの手順における条件付き密度からの乱数生成が容易でないため,条件付き密度から の乱数生成の際に l o g p ( 1・ 2 1 1 ムδ, X)が凹関数である性質を用いた R e j e c t i o nSamplingを使用する.上 記の手順を実行するプログラムを参考 2として記載した. 以上により 1 , 2の平均値,中央値,標準偏差, 90%CIを求めると下記のようになる.また,生成した乱数 のヒストグラムを描くと下図のようになる. ‑ 3 5 ‑
2 平均値 中央値 ・2 . 3 1 ‑ 2 . 1 9 ‑ 0 . 1 5 ‑ 0 . 1 6 • 標準偏差 1 .9 6 1 0 . 2 0 7 90%CI ( ‑ 5 . 7 1, 0 . 7 1 ) ー (0 . 5 2, 0 . 1 6 ) " 迂 a 遍 仏 Y E三三三三五"''''0. , , , , . , ,. 1 E三三三三三三五三玉三五日 左図は, βェのヒストグラム.右図は β2のヒストグラム. 6 PHREGプロシジャにおける BAYESステー卜メン卜 SAS9.2からは PHREGプロシジ、ヤで BAYESステートメントを使用することにより, CoX回帰におけるパ a y e s推定を行うことができる.大まかなアルゴリズムとしては, A d a p t i v eR e j e c t i o nS a m p l i n g ラメータの B やG i b b sS a m p l i n gを使用したものであり,これらの解説については前節まで、で、行った ( S A S ( 2 0 0 6 ) ) .以下 にB a y e sステートメントにおける主なオプションを紹介する. ( 1 ) COEFF又は COEFFPRIORオプシヨン I COEFF=UNIFORMJ 又は I COEFF=NORMALJ の指定により, Cox回帰におけるパラメータの事前 分布を一様分布とするか正規分布とするかを選択できる. COEFFオプションを指定しない場合,パラメー タの事前分布は一様分布となる.また, ICOEFF=NORMALJ を指定した場合,各パラメータの事前分布 COEFF=UNIFORMJ である. の平均値,分散及び共分散を指定するとともできる.デフォルトは I ( 2 ) INITIALオプシヨン IINITIAL=SASデータセット名」の指定により, G i b b sS a m p l i n gを行う際の初期値を指定するととがで きる. ( 3 ) NBIオプシヨン INBI=nJ ( nは自然数)の指定により, B u r n ‑ i nまでの繰り返し数 n (最初の n個の乱数を捨てるとと)を 指定できる.デフォルトは INBI=2000J である. ( 4 ) NMCオプション INMC=nJ ( nは自然数)の指定により, B u r n ‑ i n後の繰り返し数 n (モンテカルロ法を使う際の乱数の数 n ) を指定できる.デフォルトは INMC=10000J である. ( 5 ) SEEDオプション ISEED=nJ ( nは整数)の指定により,乱数生成の際のシード値を指定できる. ( 6 ) SUM又は SUMMARYオプション ISUM= (出力したい要約統計量) Jの指定により,指定した要約統計量を出力することができる.指 定可能な要約統計量は, DESC又は DESCRIPTIVEで平均,標準偏差,四分位点の出力, INTERVAL 0 0 ( 1 ‑ α % )確信区間, HPD区間の出力, CORRで分散共分散行列の出力を行う.デフォル (ALPHA=α) で 1 町 PTIVEI NTERVAL)J α ( は0 . 0 5 ) であり, ISUM=ALLJ により,すべての要約統 トは ISUM=(DESC 計量を出力することが可能である. ‑ 3 6・
(
7
) THIN又は THINNINGオプション
の乱数を用いて推測を行うよ
ITHIN=nJ (
nは自然数)の指定により, 1番目, n+l番目, 2n+l番目,
うに指定できる.デフォルトは ITHIN=lJである.
例 4のデータを解析する際のプログラム例及びその出力の一部は以下のようになる.
data DATA ;
工n
put TIME CENSDR SEX BMI ;
datalines ;
98 1 0 21
.5
1889 0 1 23.3
2595 0 0 30.1
104 1 0 36.7
2114 0 1 25.8
1278 1 1 23.6
2031 1 0 32.4
日
t
ru
且;
,
,
‑
;
;
,
;
‑
‑
‑
‑
‑
0"
,
.
.
.1
data INITIAL ;
input SEX BMI ;
datalines ;
o0
三 。。一
η与寸
"-<'-一一一T一一~一一一寸
o
1,
)
:
:
0
"
'
0
J
J八 i
L.~')
ru
且,
data NDRMALPRIDR ;
input ̲TYPE̲ $ SEX BMI ;
datalines ;
MEAN 0 0
COV 10 3
COV 3 5
ru
且,
リーも
宗一古布 tJUO
ヨ
ods graphics on ;
proc phreg data;DATA alpha;0.1 ;
血o
del TIME事 CENSDR(O) ; SEX BMI ;
bayes coeff;NDRMAL(input;NDRMALPRIDR)
initial;INITIAL
nbi;O n
且c
;10000 seed;1111
su
血;
ALL thi
且=
1;
且,
ru
ods graphics off ;
0 5‑
‑
11
OO~
AK
0;
"o
P
H
R
E
G プロシジャ
モデルの詳細
B
u
r
n
‑
I
nS
i
z
e
M
CS
a
m
p
l
eS
i
z
e
T
h
i
n
n
i
n
g
0
10000
1
}{一セント
打ち切り
打ち切り
イベント
4
3
42.86
回帰係数の正規事前分布
ハU ハU
連鎖
1
共分散行タ~J
均
w
r
パラメータ
S
E
X
B
M
I
S
E
X
B
M
I
10
3
I
n
i
t
i
a
lV
a
l
u
e
so
ft
h
eC
h
aユE
シード
S
E
X
1111
30
L:J'
J
B
a
y
e
sユa
nA
n
a
l
y
s
i
s
全体
7
‑
:
!
O
0
‑
3
7・
3
5
B
M
I
O
J
L
ハ
二
事後要約 パラメータ SEX B M I パラメータ SEX 8 M I 平均 ‑1.5 9 7日 N 1 0 0 0 0 1 0 0 0 0 ‑ 0 . 1 1 0日 アルフア 0 . 1 0 0 0 . 1 0 0 様車偏差 1 .5 4 9 3 0 . 1 8 4 9 事後間隔 両側対称区間 ‑ 4 . 2 0 0 0 ‑ 0 . 4 2 5 8 2 5 % ‑ 2 . 5 8 5 5 ‑ 0 . 2 2 6 1 0 . 8 8 4 3 0 . 1 8 1 4 パーセント点 5 0 % ‑1.5 8 0 7 ‑ 0 . 1 0 5 8 H P D区間 ‑ 4 . 1 5 2 2 ‑ 0 . 4 1 4 1 7 5 % ‑ 0 . 5 8 4 4 0 . 0 1 0 6 0 . 9 2 0 6 0 . 1 9 1 1 P o s t e r i o rC o v a r i a n c eM a t r i x P a r a m e t e r SEX B M I SEX 2 . 4 0 0 1 0 . 1 8 2 8 8 M I 0 . 1 8 2 8 0 . 0 3 4 2 nM a t r i x P o s t e r i o rC o r r e l a tエo P a r a m e t e r SEX B M I SEX 1 .0 0 0 0 0 . 6 3 8 2 1 .0 0 0 0 B M I 0 . 6 3 8 2 7 おわりに 本稿において, COX回帰におけるパラメータを Bayes流に推定する際に,尤度の代わりに部分尤度を用いる 妥当性を Sinhaら (2003)に従って示したまた, RejectionSampling及び GibbsSamplingを紹介し,これ らの乱数生成手法を用いることによって, Cox回帰におけるパラメータの事後分布からの乱数を生成可能な ことを示した. SAS9.2では,本稿で紹介した方法を PHREGプロシジャの Bayesステートメントを用いることによって実 行可能となっており, Bayes推定を行う際には非常に便利なプロシジャとなっている. PHREGプロシジ ヤ では現在のところ,事前分布として一様分布,正規分布のみ指定可能となっているため,一様分布や正規分布 以外の分布を事前分布として指定する場合には, S i叶l aら ( 2 0 0 3 )により.部分尤度を求めたうえでパラメー タの事後分布を算出し,事後分布からの乱数を生成することが必要となるが,事前分布の密度関数 f ( x )の対 数をとった l o g f ( x )が凹関数の場合には,本稿で紹介した RejectionSamplingのプログラム %RSと Gibbs Samplingを組み合わせた手法を応用することにより,パラメータの事後分布からの乱数生成を行うことが 可能となる. 謝辞 本稿を作成するにあたり,熱心なるご指導をいただいた方々に心より御礼申し上げます.また,ともに論文 作成に励んだ井桁正尭さんに感謝の意を伝えたいと思います 連絡先 e‑mail: Kuroda̲Shingo唖takeda.co.jp 参 考 1 RejectionSamplingのプログラム例 l o gf ( x )が凹関数であることを利用して f ( x )を穫う関数 c g ( x )を構成し, RejectionSamplingにより密度 ( x )をもっ分布からの乱数を生成する SASプログラムの例は下記のようになる. 関数 f proc fc皿p outlib=work.myfu 且 C .xxx ; fu 且c tionf( x ); f=‑x**2 ; return ( f ); endsub ; 且; ru ‑ 3 8・
options cmplib=york.myfu 且c ; 1 皿a cro RS(LIST, SIMSIZE, SEED=llll) / 率 LIST x紬上の初期点 SIMSIZE 乱数の生成数 回目 乱数のシード * / data TRNNOR̲2(keep=SAMPLE) ト一一一初期値の読み込み; む r ay c[率 J c1‑c999; i . l e t I=l ; %do %u 且t il( %qscan(&:LIST, & : I, " ")=%str() ); c[ & : I J=i.qsca 且( & : L I S T, &I,"り %let I =%eval(&:I+1); Y . e n d; 率 一‑‑ x軸上の点の数の計算, PNT=%eval(&I‑1) ト一一一配列の定義; 紅 白y a [率J a 1 ‑ a & : I ト一 直線の傾きの配列; array b[率 J b 1 ‑ b & : I ト一一一直線の切片の配列; む r ay d[*J d1‑d&I ; 率 一一一‑ 2直線の交点の x座 標 の 配 列 ; &IJ S1̲1‑S1̲&I S2̲1‑S2̲&I ; array S[2, 率一一一一区間の面積の配列; 率一一一ーその他の初期値の設定; 率一一一生成数; k =1 率一一一 0 ACC=O ; :棄却, 1 :受 容 ; do yhile (k<=&SIMSIZE ) ; ト一一一(c[i J,f( c[iJ)) と(c[i+1J,f(c[i+1]))を結ぶ直線の傾きと切片の計算; do i=1 to P町T‑1 ; J))/( c [ エ +lJ‑c[iJ) ; a[iJ=(f(c[エ+1J)‑f(c[i J b[iJ=f(c[i+1J)‑a[ェ]率c[i+1 end ; $ 一直線の交点の計算; do i=3 to PNT‑1 ; d[エJ=(b[i‑2J‑b[エ ])/(aエ [J‑a[i‑2J) ; end ; ト ー各区間の曲線下面積の計算; do i=1 to PNT+1 ; if i=1 then do ; iJ=0 ; S[1, i J=exp(a[ i J*c[ i J+b[ i J)/a[ i J S[ 2, end ; else if i=2 then do ; S[ 1, i J=0 ; i J=(exp(a[ i J率c[i J+bェ [J)‑exp(a[エ]率c[i‑ 1 J+b[iJ))/a[iJ S[ 2, end ; else if i=PNT then do ; S[1, iJ=(exp(a[i‑2J率 c [ ェ J+b[i‑2J)‑exp(a[i‑2J率c[i‑1J+b[i‑2J))/a[i‑2J S[ 2, i J=0 ; end ; else if i=PNT+1 then do ; S[1, PNT+1J=‑exp(a[i‑2J率 c[i‑1J+b[i‑2J)/a[i‑2J PNT+1J=0 ; S[ 2, end ; else do ; S[1, iJ=(exp(a[i‑2J率d[ i J+b[ エ ー2 J)‑exp(a[ ェ ー2 J率c[ェ ー 1J+b[i‑2J))/a[ェ ー2 J S[2, iJ=(exp(a[エ ] 率 c [ エ J+b[ i J)‑exp(a[ i J率d[iJ+b[iJ))/a[エ ] end ; end ; 率 一一ー全面積の和の計算; SS = sum(of S[率]); ‑ 3 9・
ト一一一乱数生成を行う区聞を面積比に対応させて選択; ul =r 担 u ni(&SEED.) ; CS =0; BLOCK=O ; do j=l to PNT+l ; do i=l to 2 ; j]/SS ; CS=CS+S[i, if CS>ul and BLOCK=O then do ; FLGi =i ; FLGj =j ; BLOCK=l ; end ; end ; end ; ト一一 選択した区聞から乱数を生成し,受容と棄却の判定; トーー 逆関数法用の一様乱数; ホ一一一 判定用の一様乱数; u2=ranuni(&SEED.) ; u3=ranuni(&SEED.) ; .︐.︐ ‑ 4 0・ 可E ﹂ 一 if ACC=l then do ; if SAMPLE<ー5 or SAMPLE>5 then ACC=O ;←一一一範囲外の乱数を棄却; else do ; k=k+l ; output ; end ; end ; ︑ if FLGi=2 then do ; if FLGj=l then do ; SAMPLE=log(u2)/a[FLGj]+c[ F L G j ] ; H =exp(f(SAMPLE))/exp(a[FLGj]時 制PLE+b[FLGj]) ; if u3<=H then ACC=l ; else ACC=O ; end ; else do ; if FLGj=2 then SAMPLE=log(u2句 xp(a[FLGj]町 [FLGj])+(1‑u2)ホ exp(a[FLGj]町 [FLGj‑l])) /a[FLGj] else SAMPLE=log(u2句 xp(a[FLGj]ホc[ F L G j ])+( 1‑ u2)ホexp(a[FLGj]ホ d[FLGj] ) ) /a[FLGj] ; H=exp(f(SAMPLE))/exp(a[FLGj]*SAMPLE+b[FLGj]) ; if u3<=H then ACC=l ; else ACC=O ; end ; end )J] )] n︐ ︑ J n 4 可 H=exp(f(SAMPLE))/exp(a[FLGj‑2]ホSAMPLE+b[FLGj‑2]) ; i f u3<=H then ACC=l ; else ACC=O ; end ; end ; 可E J ‑ 1j1J rrL r rLTI﹁ L ‑nu‑nu JTI︑ JTI nup‑nup‑ 内 ︐& 企 T I P ‑aw‑ a ﹁︐ L ︐ 干 . ‑内 cc T ‑ ]] ん Tl ‑J4&一 4 p 7﹂ p nunu P ロ ‑J.J j D . xz [[ aa (( 企 ﹄ 干T 可 J T p ee T ‑ uu ) 干 . ‑) 2 2 )) 1 1 (( ++ 可 T﹄ ]J] GG ‑ . 干 [官 [ 勺︐&‑勺︐ι 企 T﹄ Cd T ‑ . ] ]‑ 臼 Y L j J GG aa (( [官 [ p 干T 4 門︐& D.D. ‑ . 干 4 & 内 ︐ x x ee T ‑ . 臼 ι 4 4 ん Tl uu (( σむ ︒ σ ︽︾︽︾ r ム可 P 1 = = aAAMn Tl MHMn pん. p ‑ aueω Ee qunD hl 別刷 干ム te 一 一 p ・ ;n j u 字企 OL d r・ o h w o h w e ・ 51 ︐ ‑4 2 1ム if FLGi=l then do ; if FLGj=PNT+l then do ; SAMPLE=log(1‑u2)/a[FLGj‑2]+c[FLGj‑l] ; H =exp(f(SAMPLE))/exp(a[PNT‑l]ホSAMPLE+b[PNT‑l]) ; if u3<=H then ACC=l ; else ACC=O ;
end ; 且, ru %mend ; %RS(LIST=ー 10.0 ‑9.5 ‑9.0 ‑8.5 ‑8.0 ‑7.5 ‑7.0 ‑6.5 ‑6.0 ‑5.5 ‑5.0 ‑4.5 ‑4.0 ‑3.5 ‑3.0 ‑2.5 ‑2.0 ‑1.5 ‑1.0 0.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.54.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 10.0, SIMSIZE=100000) ; 【 上記のマクロ %RSを実行することにより,正規分布からの 1 0 0 0 0 0個の乱数を生成することができる. 参考 2 例 4のプログラム例 (GibbsSampI ingと RejectionSampI ingの組み合わせ) proc fcmp outlib=work.myfunc.xxx ; y ) ; function f(x, f= log( (exp(21.5*y)/(exp(21.5事y)+exp(36.7事y)+exp(x+23.6事y)+exp(x+23.3事y ) +exp(32.4事y)+exp(x+25.8事y)+exp(30.1牟 y))) 事( exp(36.7事y)/(exp(36.7事y)+exp(x+23.6事y)+exp(x+23.3事y)+exp(32.4牟 y)+exp(x+25.8事y)+exp(30.1牟 y))) 事( exp(x+23.6事y)/(exp(x+23.6牟 y)+exp(x+23.3事y)+exp(32.4事y)+exp(x+25.8牟 y)+exp(30.1牟 y))) 事( exp(32.4事y)/(exp(32.4事y)+exp(x+25.8事y)+exp(30.1事y)))) ; return ( f ); endsub ; 且; ru options cmplib=work.myfunc ; GS(LIST,Y,SIMSIZE,SEED=1111) ï~acro / 牟 LIST x勅上の初期点 Y Yの初期値 SIMSIZE 乱数の生成数 SEED 乱数のシード 牟/ data GS̲PHREG(keep=X y ) ←一一一初期値の読み込み; array c[ 牟 ] c1‑c999; %let I = 1 ; %do %untユl( %qscan(&LIST,&I,"")=%strO ) ; c[ & I . ] = %qsca 且( &LIST., &I., %let I = %eval(&I.+1) ; %end ; ←一一‑‑ x軸上の点の数の計算; PNT = %eval(&I.‑1) ; " っ ト一一一配列の定義; array a[事 ] a1‑a&I.; ト一一一直線の傾きの配列; array b[事 ] b1‑b&I.; 率一一一一直線の切片の配列; array d[事 ] d1‑d&I ト一一一 2直線の交点の z座標の配列; array LF[吋 LF1‑LF&I . ; array S[2, &I.] S1̲1‑S1̲&I. S2̲1‑S2̲&I. ; ト一一一区間の面積の配列; ←一一ーその他の初期値の設定; k =1 ACC =0 COUNT =0 Y ト一一一 ; ; =&Y.; ト一一一生成数; ト一一一 0 :棄却, 1 :受 容 ; ト一一一 O:Xの乱数を生成中, 1:Yの乱数を生成中; トー一一一 Y の初期値; ギブスサンプリング; do while ( k <= &SIMSIZE) 牟 乱数の棄却,採択,出力に関する処理; i f (ACC ne COUNT) then do ; ト一一一 Y の乱数を生成; if (ACC=1) then do ; ト一一一 SAMPLE を採択する場合; X=SAMPLE ;COUNT=1 ; end ; do i=1 to PNT ;LF[i] = f(X, c[i]) ; end ; ‑ 4 1 ‑
end ; else do ; ホ一一一‑ Xの乱数を生成; if (ACC=l) then do ; ← ‑ ‑ ‑ ‑ SAMPLE を採択する場合; Y=SAMPLE ; COUNT=Q ;k=k+1 ;output ; end ; do i=l to PNT ;LF[ェ J = f(c [i J, Y) ;end ; end ; ト一一一(c[i J,f( c [iJ)) と(c[i+1J,f(c [i+1J))を結ぶ直線の傾きと切片の計算; do i=l to PNT‑1 ; a[iJ=(LF[i+1JーLF[iJ)/(c[i+1J‑c[iJ) ; b[iJ=LF[i+1J‑a[iJ事 c[i+1J end ; ←一一一直線の交点の計算; do i=3 to PNT‑1 ; d[iJ=(b[i‑2J‑b[iJ)/(a[iJ‑a[i‑2J) ; end ; トー一一一各区間の曲線下面積の計算; do i=l to PNT+1 ; if ( i <= 2 ) then do ; iJ=O ; S[l, S[2, iJ=(exp(a[iJ事c[ i J+b[ i J )ー ( ェ ー1 )事 exp(a[iJホ c[l J+b[ i J) )/a[ i J end ; else if ( i >= PNT) then do ; S[1, iJ=((PNT+1‑i)事 exp(a[ i ‑ 2 Jホ c[iJ+b[i‑2J)‑exp(a[i‑2J事 c[i‑1J+b[i‑2J))/a[i‑2J S[ 2, i J=0 ; end ; else do ; S[1, iJ=(exp(a[i‑2J事 d[iJ+b[i‑2J)‑exp(a[i‑2J事 c[i‑1J+b[i‑2J))/a[i‑2J iJ=(exp(a[iJ事 c[i J+bェ [J)‑exp(a[ i J事 d[ェ J+b[iJ))/a[iJ S[2, end ; end ; ←一一ー全面積の和の計算; SS = sum(of S[*J) ; ト一一一乱数生成を行う区聞を面積比に対応させて選択; u1 =r祖 国 エ (&SEED.) ; CS =0; BLOCK=O ; do j=l to PNT+1 ; do i=l to 2 ; CS = CS + S[i, jJ/SS ; if CS > u1 a 且d B LOCK=O then do ; FLGi =i ;FLGj =j ;BLOCK=l ; end ; end ; end ; ←一一一選択した区聞から乱数を生成し,受容と棄却の判定; u2=r 祖 国i (&SEED.) ; ト一一一逆関数法用の一様乱数; u3=r 祖 国i (&SEED.) ; ←一一一判定用の一様乱数; if FLGi=l then do ; if FLGj=PNT+1 then do ; SAMPLE=log(1‑u2)/a[FLGj‑2J+c[FLGj‑1J ; if COUNT=l then H=exp(f(X, SAMPLE))/exp(a[PNT‑1J事 SAMPLE+b[PNT‑1J) ; else H=exp(f(SAMPLE, Y))/exp(a[PNT‑1J事 SAMPLE+b[PNT‑1J) ; if u3<=H then ACC=l ; else ACC=O ; end ; else do ; if FLGj=PNT then SAMPLE=log(u2珂 xp(a[FLGj‑2J町 [FLGjJ)+(1‑u2)*exp(a[FLGj‑2J*c[FLGj‑1J)) /a[FLGj‑2J ; 2 J町 [FLGj‑1])) else SAMPLE=log(u2珂 xp(a[FLGj‑2J*d[FLGjJ)+(1‑u2)事 exp(a[FLGj‑ ‑ 4 2 司
/a[FLGj‑2] if COUNT=1 then H=exp(f(X, SAMPLE))/exp(a[FLGj‑2]寧 SAMPLE+b[FLGj‑2]) ; else H=exp(f(SAMPLE, Y))/exp(a[FLGj‑2]ホSAMPLE+b[FLGj‑2]) if u3<=H then ACC=l ; else ACC=O ; end ; end ; if FLGi=2 then do ; if FLGj=1 then do ; SAMPLE=log(u2)/a[FLGj]+c[FLGj] ユf COUNT=1 then H=exp(f(X, SAMPLE))/exp(a[FLGj]時 AMPLE+b[FLGj]) ; Y))/exp(a[FLGj]寧 SAMPLE+b[FLGj]) ; else H=exp(f(SAMPLE, ユf u3<=H then ACC=l ; else ACC=O ; end ; else do ; if FLGj=2 then SAMPLE=log(u2ホexp(a[FLGj]町 [FLGj])+(1‑u2)旬 xp(a[FLGj]ホc[FLGj‑1])) /a[FLGj] ; ) else SAMPLE=log(u2寧 exp(a[FLGj]ホc[FLGj])+(1‑u2)寧 exp(a[FLGj]ホd[FLGj] ) /a[FLGj] ; SAMPLE))/exp(a[FLGj]寧 SAMPLE+b[FLGj]) ; if COUNT=l then H=exp(f(X, else H=exp(f(SAMPLE, Y))/exp(a[FLGj]ホSAMPLE+b[FLGj]) if u3<=H then ACC=l ; else ACC=O ; end ; end ; end ; 且; ru Z 皿e nd ; %GS(LIST=‑10.0 ‑9.5 ‑9.0 ‑8.5 ‑8.0 ー7.5 ‑7.0 ‑6.5 ‑6.0 ‑5.5 ‑5.0 ‑4.5 ‑4.0 ‑3.5 ‑3.0 ‑2.5 ‑2.0 ‑1.5 ‑1.0 ‑0.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 10.0, Y=1,SIMSIZE=10000) ; 参考 3 SGPLOTプロシジ、ヤを用いたグラフの作成 S A S 9 . 2から使用することができる SGPLOTプロシジ、ャを用いると生成した乱数の収束診断のプロット やヒストグラムの作成,自己相関のグラフの作成等を簡単に行うことができる例 4において SGPLOTプ ロシジ、ヤを使用したプログラム,及び出力される図は以下のようになる. ods graphics on / imagefmt=png ; proc sgplot data=GS̲PHREG ; histogra 皿 B MI ; density BMI / type=kernel ; ru 且; ods graphics off ; J Z 時 E三三三三三三玉互豆玉~ ‑ 4 3 ‑
o d sg r a p h i c so n/i m a g e f m t = p n g; p r o cs g p l o td a t a = G S ̲ P H R E G ; s e r i e sx = ny = B M I ; *一一一 E は乱数の生成番号 x a x i sl a b e l = " I t e r a t i o n "; ru 且; o d sg r a p h i c so f f; " ' hH山山 o d sg r a p h i c so n/i m a g e f m t = p n g; p r o cs g p l o td a t a = C口R R ; v b a rn/r e s p o n s e = B M I b a r Y i d t h = O . l; x a x i sf i t p o l i c y = t h i nl a b e l = " L a g "; a b e l = "A u t o c o r r e l a t i o n "; y a x i sm i n = ‑ O .2 l ru 且; o d sg r a p h i c so f f; τ ~ ' " 7 ' " ττ ,~ . " , '7 '" ~1 ~" ~笥言 7 2! l 3' 3一、ヨ処河 r 河 句 " ・. ・ ー ・ , ・. 3 " ' " 参考文献 C a s s e l l a,G.andGeorge,E .1 .( 1 9 9 2 ) . Explainingt h eGibbsSampler . TheA mericanS t a t i s t i c i a n,46, 1 6 7 ‑ 1 7 4 Chan,K .S .( 1 9 9 3 ) . AsymptoticBehavioro ft h eGibbsSampler .J o u r n a l0 1t h eAmericanS t a t i s t i c a l 88, 3 2 0 ‑ 3 2 6 A s s o c o a t i o n, G i l k s, W.R .andTan, K .K .C .( 1 9 9 5 ) .AdaptiveR e j e c t i o nM e t r o p o l i sSamplingw i t h i nGibbsSampling A p p l i e dS t a t i s t i c s, 44, 4 5 5 ‑ 4 7 2 . K l e i n,J .P .andMoeschberger,M.L .( 2 0 0 3 ) .S u r v i v a lA n a l y s i s, S p l i n g e r,B e r l i n . J .M.( 2 0 0 0 ) .B i o s t a t i s t i c a lM e t h o d s : TheA s s e s s m e n t0 1R e l a t i v eR i s k s ,Wiley,NewYork. Lachin, SASjSTAT(R)U s e r ' sG u i d e .( 2 0 0 6 ) .P r e l i r n i n a r yC a p a b i l i t i e sf o rBayesianA n a l y s i si nSASjSTAT(R) S o f t w a r e .G.阻 dChen,M.H.( 2 0 0 3 ) .A b a y e s i a nj u s t i f i c a t i o no fCox'sp a r t i a l l i k e l i h o o d . Sinha,D.Ibrahim,J B i o m e t r i c a,90, 6 2 9 ‑ 6 4l . 井桁正尭 ( 2 0 1 0 ) .MCMCプロシジ、ヤによるベイズ推定と ARSアルゴリズムの実装. 大森裕浩 ( 2 0 0 1 ) .マルコフ連鎖モンテカルロ法の最近の展開.日本統計学会誌, 31,3 0 5 ‑ 3 4 4 . ‑44 ・
経時データに対する投与前値を考慮した解析モデルの比較検討 高橋行雄 中外製薬・臨床企画推進部 ComparingtheA n a l y t i c a lmethodsUsingBaselinew i t hL o n g i t u d i n a lData YukioTakahashi ChugaiPharmaceuticalCo.,L t d . 要旨: 平行群間試験で反復測定される臨床検査データにおいて,投与前の平均値が群間で均ーとなるこ とは極めてまれであり,有意な差となってしまう場合もときには生ずる.投与後の経時変化を検討する際 に,群聞の投与前値の違いをどのように考慮したらよいのだろうか.ランダム化が適切に行なわれた場合 には,投与前値が高かければ平均への回帰の現象により投与後は低めに,低ければ高めになりがちである. このような場合に投与前と投与後の差について有意差検定を行うと有意な差が出やすくなる.そのために, 投与前値を共変量,投与前後の差を反応とする共分散分析を適用することが,投与前値の差を群間で「補 正」することになるのだろうとの考えが蔓延している.投与前値を共変量,投与前からの各時点聞の差を 反復測定とするような線形混合モデルを適用事例も目にする.さらに時点間の相関構造を得られたデータ から探索して,最も合うような相関構造で解析するアルゴリズムを使っている事例も目にする.複雑な統 1き起こしている. 計モデルで、あっても手軽にすばやく解析できる MIXEDプロシジャの出現が百家争鳴を 5 この事態を鎮静化するために,各種の解析法の性質を量的に把握できる追試可能なシミュレーションプロ グラムの作成した.このプログラムを用いて,特徴的な経時データについてシミュレーションを行い,各 種の解析の結果について考察を試みた. キーワード:経時データ,反復測定,投与前値, MIXEDプロシジャ,共分散分析,平均への回帰 1 解析方法をめぐる討論 0例の平行群間ダブ、ルブ、ラインド試験を想定する.反復 初期の開発時期で, R薬と P薬を対照とする l群 1 投与によってターゲットとするバイオマーカ Y の経時的変化を統計的に調べたい. 投与前 TO,投与中T1,投与後 T2の各時点でバイオマーカ Y を測定した.先行する非臨床試験の結果から, Compound T1よりも T2 時点でのほうが減少するとの予想が立てられた.時点聞の相関構造は CS タイプ < Symmetry) と想定されるが,相関が低めか高めかを特定できる実験データがまだ集積されていない. A さんは r この疾患領域では投与前 TOからの投与後 T2の差についての結果が多くの論文で示されてい るので,投与後 T2と投与前 TOとの差について有意差検定を使うべき」と主張している. B さんは r 投与前と投与後の差での群間比較は,単純でわかりやすいのであるが,申請後に規制当局か ‑ 4 5 ‑
らのクレームが付きやすいので,投与前 TOを共変量,投与後 T2を反応とする共分散分析を行なうべきだ」 と提案した . Bさんは,こんな経験談を語った.別の薬剤で規制当局への申請後, I 投与前 TOに統計的に有 意な差にはならないが, R薬群の平均値が P薬群よりも高めになっているので,平均値への回帰現象により 実薬群のほうが減少の程度が大きくなったために,群問で有意な差が出たのではないか.実データでの解析 も追加して提出すこと」と言われたので, C さんは, I 最近は,共分散分析を標準的に使うようにしている」と言う. I 経時データの解析は,投与前 TO,投与中Tl,投与後 T2を反復投与として 2群聞の反復投与 分散分析を適用して,薬剤l 群と時点聞の交 E作用があれは,統計的に何らかの差があるという結論を出し, その後に時点聞の有意差検定をすることでいいのではないか」と言う. D さんは, I 投与前 TOと投与後 T2の 2時点だけではなく,投与前 TOを共変量,投与中Tlと投与後 T2 の 2時点を反復測定とした共分散分析を適用して,投与後 T2時点で R 薬群と P薬群の平均値の差を主要評 価変数とするほうが検出力の観点で望ましい」と提案した.最近, D さんは M医 EDプロシジャに凝ってい て , A さんと B さんは,そんなことができるのかと驚いた様子である. E さんは,途中入社の切れ者で, I 投与前値を共変量としても投与前 TOで 2群聞の平均値に差がある場合 に,投与前の群問の平均値の差を統計的に調整しているわけではないので,投与前 TOを共変量,投与中Tl と投与後 T2も投与前 TOとの差のデータにして,反復測定共分散分析を行ったら」と提案した の会社のグローパルで標準的な解析法としているけどね」と E さんは付け加えた.さらに, I 実は,前 ICPMPの P o i n t s 町 o na d j u s t m e n tf o rb a s e 1 i n ec o v a r i a t e s ( h t t o : / ! h O m e . a l l .n e .j o / r e d / a ki hi r o / e m e a / 2~63 9 g e n .odO でもこの方 t oc o n s i d 法が示されていたと記憶しているよ」と言う. F さんは, I 投与前値を 2群で共通とするような解析方法がいいというような話も聞いたようなきがする けども,どうなんでしょうか」と言う [ 1 ] . どのような統計手法を適用したらよいか,社内の統計メンバーで意見がまとまらない.そこで,様々な状 況設定が行える経時データの発生プログラムを作成し,それぞれの解析方法の統計的性能を比較検討するこ とが相互理解のため必要との結論となった, 2 . 経時データ発生プログラム G さんがプログラミング担当となり,各種の解析が可能となる解析用のデータセットを作成することにな った.時点聞の相関構造は, CS タイプ (CompoundS戸田町町,複合対称)とし,時点聞の相関の大きさは, 個体問の分散 SD1 と個体内の分散 SD2を指定することにより自由に設定できるようにした.表 lに SD1 と SD2が足して 1 6となる場合について 時点聞の相関がどのように変化するかの目安を示した. SD1=8 表 l 個体間 SD1 と個体内 SD2に対する経時データの時点、聞の相関 個体問 SD1 1 6 1 2 1 1 1 0 9 8 個体内 SD2 時点聞の 個体間 個体内 SD1 相関 SD2 1 6 1 .00 4 1 2 0 . 9 0 5 1 1 0 . 8 3 6 0 . 7 4 1 0 0 . 6 2 7 9 0. 50 8 8 相 関 =SD1 ^2/(SD1 ^2+SD2^2) 。 4 5 6 7 8 。 ‑46・ 時点聞の 相関 0 . 0 0 0 . 1 0 0 . 1 7 0 . 2 6 0 . 3 8 0. 50
と SD2=8と同じ場合に時点聞の相関係数は 0 . 5となり, SD1>SD2の場合に時点聞の相聞が高く,逆の場合は 小さくなる. 基本的な検討が可能な最小限の経時データとして,薬剤数=2,時点数 =3 (投与前を含む) ,群ごとの症例 数を m1=10,m2=10とし,薬剤群・時点ごとに反応の期待値をシミュレーション条件に即して代えられるよ うにした. 表 2 経時データ発生のための変数 設定項目 解析データの反復 群 症例番号 群ごとの例数 正規乱数発生の seed 個体問誤差 時点 個体内誤差 投与前値 反応 変数名 差 ( y t‑yO) 群と時期の組合せコード d t g t 説明 解析データの反復回数を n=99999で与える ' 1 : P ',' 2 : R ' g = ' 1 : P ',g= ' 2 : R ' で異なる症例番号 g = ' 1 : P ' の場合 m1,g=' 2 : R ' の場合m2 seed=9999999999で与える SDを sd1=99 で与える 0, 1,2 とする SDを sd2=99 で与える 期待値をg=' 1 : P 'の場合 y10,g= ' 2 : R 'の場合 y20 t =1の場合期待値を y11,y12 で与え, t =2 の場合 y21,y22 で与える g sub m seed e 1 t e2 yO y t y t‑yO 投与前は両群とも GO ,g=' 1 : P ' の場合, G1̲ T 1 , G1̲T2, F'2:R' の場合 G2 T 1 , G2 T2 とする プログラム1, 1000組分の経時データセットの作成 (seed=20100534) Title 'Logi̲Ola.sas 20100521 Y .Takahashi ' Title2 '1 *seed=20100534 n=1000 ml=10 m2=10 sdl=7 sd2=9 * 1' Title3 '1 *yl0=100 yll=100 y12=90 y20=100; y21=100; y22 80; 二 n r ‑ FU ) ︐ T 白 つ n n ︐ DA l T PU p u 白 つ ︐ ︐ ハU P‑ FU ‑ ‑ 4 7 ‑ ︐ m I 白 つ 二 ︐ 三 Pι d oi = 1t on ; d o1 = 1,2 1 ) g g̲name( d oj = 1t o m( l ) sub=1*1000+j el=rannor(seed)*sdl ; d ot = Ot o2 ; e2=rannor(seed)*sd2; y = y ̲ g t ( l,t + l ) +e l +e 2; 1 ,t + l ) g t g̲time( i ft = Ot h e ny O二 y ; d= y ‑y O; i ft = O then d = output e n d ; e n d ; e n d e n d ; keep ig j s u be l te 2y O yd g t l 二 三 ︐ l T p u ︐ ︐ nu p u ︐ ( つlM 白 つ Cb ‑‑vJ ︐ ︐ )‑ 'つ白つ白 R 2g v d つ‑ M n U 'つ白 よ 白 'P U2‑ょっg PU1 nvsnu'l TLVd :2E 'nFlM1よ /︑ t 1ょ σb V 4 つl M n u V 川 σ b 1よ 1よ 14 作 る ム qJnr‑ ム σbnhu ly ム γム γム γム ρ 匂 u ハe A ‑ ‑ ょ .︐ ︑nd lJI ' m ム ム eAVV︐︑トル {'il 白 つ つ em e 白 m f t m .︐ 白 つ a + L I ‑0 n g t‑2 一一 g y一 gr mi y n vdVdVdVdEl l a aγaγaγ a ︐ . ハU γ + L 十 t パU V aLa a a a r a JU s e e d = 2 0 1 0 0 5 3 4 ; n = 1 0 0 0 ; 0 ; m 2ニ1 0 ; m lニ1 y l 0 = 1 0 0 ;y l l = 1 0 0 ;y I 2 = 9 0 ; y 2 0 = 1 0 0 ;y 2 11 0 0 ;y 2 2 = 8 0 ; s d l = 7 ;s d 29 ;
アウトプット1.一組目の 2X3x1 0=60例のデータセット. 1 0症例中 3例分を表示 C 由3 日1 : P : P 日1 日1 : P 3 4 5 G 1: P G 1: P G 1 : P G 1 : P G 1 : P G 1 : P G 2 : R G 2 : R 日2 : R G 2 : R G 2 : R 日2 : R G 2 : R G 2 : R G 2 : R 自 2 8 2 9 3 0 3 1 3 2 3 3 3 4 3 5 3 5 8 5 9 0 , , , ub J o 1 0 1 0 1 0 1 2 2 2 1 0 1 0 1 0 1 , , , , , , ,‑ , , , , , , , , , , , , , , , , , ピー" 支 J げ 5 . 4 5 5 0 9. 7 1 8 3. 7 1 8 日 2 . 1 7 2 5 ‑ 7 1 8 1 2 . 1 7 2 5 ‑ 1 . 2 8 2 7 9. 0 0 . 8 9 0 4 . 1 7 2 3 日1 FT T 2 1 0 8 3. 7 1 8 7 2 . 1 7 2 5 ‑ 1 2 .7 3 . 5 0 2 ‑ 1 7 . 2 1 5 8 G 1 P 0 . 8 2 1 5 0 . 8 4 8 5 1 01 . s7 0 1 01 . s7 0 G O 8 . 8 0 7 8 1 01 . s7 0 108.8297.8593GIFT 0 . 8 2 1 5 T 2 1 7 .4 2 4 G 1 P 4 . 0 2 8 ・1 . 7 3 4 0 1 0 1 .7 0 8 0 . 8 2 1 5 1 1 . 0 4 3 8 1 0 . 48 5 1 21 .5 1 2 1 21 .5 1 2 G O 1 1 . 0 4 3 8 ‑ 5 . 3 3 2 7 1 2 1 . 5 1 2 105.711‑15.8013GIF PT1 0 . 3 5 0 G 1 PT 2 1 1 . 0 4 3 8 2 2 1 . 83 0 . 8 1 3 2 1 2 1 . 5 1 2 1 2 . 3 8 7 7 8 0 . 8 2 4 8 0 . 8 2 4 3 . 8 1 1 5 ・2 G O 0 . 8 2 4 1 1 8 . 3 3 8 37.5143G2RT 3 . 8 1 1 5 14.52" 8 T 2 1 5 .5 1 4 . 8 3 2 G 2 3 . 8 1 1 5 1 1 . 8 4 4 9 8 0 . 8 2 4 3 3 . 00 ‑ 0 . 1 1 0 7 1 0 3 . 4 9 5 1 0 3 . 4 9 5 G O 3 . 00 ‑3.1007108.485108.505a2.8888 G 2 RT T 2 1 3 . 00 ‑ 4 . 2 0 4 1 1 0 3 . 4 3 5 8 5 . 4 0 2 ‑ 2 4 . 0 3 3 4 G 2 ‑ 0 . 10 1 8 . 4 3 3 3 1 0 8 . 2 7 3 1 0 8 . 2 7 3 G O 1 ‑ 0 . 10 3 . 1 8 4 3 1 0 8 . 2 7 3 103.024‑5.2480G2RT T 2 1 ‑ 0 . 10 1 ‑ 3 . 11 8 1 1 . 5 3 5 1 G 2 R ̲ T 2 0 8 . 2 7 3 7U78 ・3 1 0 0 1 1 0 0 1 1 0 0 1 1 0 0 2 1 0 0 2 1 0 0 2 1 0 1 0 1 0 1 0 1 0 1 0 2 0 0 1 2 0 0 1 2 0 0 1 2 0 0 2 2 0 0 2 2 0 0 2 2 0 1 0 2 0 1 0 2 0 1 0 アウトプット 2 . 1 0 0 0組のデータセットについて基本統計量 ( 1 0例 x1 0 0 0組) u‑ ・ I ﹃l lT ‑l 同 ‑h ‑a'L‑ ‑nyu‑ 川‑ ‑" ‑" lu 同 ‑ ‑会 u‑ ‑‑e ‑ uM ‑l 同 ‑ m 川‑ ll+ll+ ‑a'L‑ ‑nλu‑ y‑ll+ ‑nH‑ ‑会 u ‑ ‑av‑ ‑‑ ‑ ‑‑ ‑ u‑ ‑‑ ‑ ‑ ‑‑ ‑ ‑ ‑l 同 EEl‑TaEl‑T ‑﹃ ‑a'L‑ ‑nyu‑ ‑nH‑ ‑会 u ‑ ι‑‑BEE‑T 内〆 白 い ‑av‑ ‑um‑ ‑ ‑ ‑l 同 ‑Hm‑ ‑ ‑ ‑‑ ‑ ‑ u‑ ‑‑ v ‑‑ ‑ ‑ 14i‑TIll‑T 目 司 ﹃ ‑a'L‑ ‑nynu ‑司 ‑‑ ‑ ‑ u" ‑‑ 司 ・ll‑TIli‑‑ 白 い 司 ‑nH‑ ‑ a‑ ‑e v ‑ ‑ ‑ 川﹃ " ‑ u " ‑ ‑ ‑ EEEEEEEEEEa‑T Mm同 一 ' p h s p h l a E l a a ‑ ‑ E 門 門H H 内 ‑ A E n u ‑ ‑ n t n u ‑ ‑ n r ι ‑=.. ‑pa ‑.EE ‑ gnGun G u . = ι r S D l = 7 .S D 2 = 9 .y l O = l O O .y l l = l O O .y 1 2 = 9 0 .y 2 0 = l O O .y 2 1 = l O O .y 2 2 = 8 0 設定した初期値を反映したデータセットが作成されているかを T ABULATEプロシジャで集計して確認 3 . 各時点ごとの比較 p o s t 0 5 ).投与前からの差 dについての群間比 各時点ごとに実データでの P薬群と R薬群の平均値の比較 ( 較 ( d if f 05 ).投与前値を共変量とする比較 ( a n c o v a 0 5 ) を行い. 2群聞の p値が 0 . 0 5以下の数をカウントし て名目の有意水準が保たれているか確認しよう.時点七=0の両群の期待値はそれぞれ 1 0 0であるので,実デ ータで 2群聞の平均値の差で pく 0 . 0 5となる回数の期待値は 1 0 0 0回中 5 0回である.時点t=1の両群の期待値 はそれぞれ 1 0 0と同じであるので,実データ y .差d . 共分散分析 a n c o v aとも pく0 . 0 5となる回数の期待値は 1 0 0 0回中 5 0回である. d 1 = 7 . sd2=9と与えているので, 時点聞の相関係数の期待値は. s SD , 2 ρ=一一一」一一‑=ーァーす=0 . 3 8 SDt+SD; 7 "+ヂ となり,時点t= 2の両群の期待値はそれぞれ 90と 8 0なので,時点聞の相関の期待値が 0 . 3 8と 0 . 5よりも小 さいので. pく 0 . 0 5となる回数は. ( a n c o v a ) > ( y ) > ( d )と期待される [ 2 J . 正規乱数の初期値 seed=201 00534 でのシミュレーションの結果(アウトプット 3 ) .t =1時点では ( y : =4.3%)主 (d:5.5%)与 ( a n c o v a :4.2%)今 50 と名目の有意水準 α=5%が保たれ. t =2 時点では ( a n c o v a : 4 3 / 1 0 0 0 / 10 000=46.7%)>( y : 4 4 . 7 % )>( d :3 6 . 8 % ) となり,差 dの場合に検出力が最も低くなっていることがわかる. 467 時点聞の相関が 0 . 5以上の場合は. ( a n c o v a )>( d )>( y ) のように実データ yよりも差のデータ dについて検 出力が高くなる.表 lから. SD1= 9 . SD2=7とすると ρ=0.62となる.シミュレーションを行なうと ( a n c o v a : .8%)>( d :5 4 . 9 % )>( y : 4 4 . 7 % ) と差についての検出力が上がることが確認できる. 61 ‑ 4 8・
アウトプット 3,2群聞の有意差検定の結果 (ρ=0.38)
y
O
g
lI
y比 1I
Y
Og
2l
yは2 Id
O Id
t
)
│
!
日
I--~~~~~~~--t--~~!~~~~刊半~--I A11
liiflitilii:111:1111│ii;ls│:;il35│:21411│1111
t
=2て、有意となった回数 (
a
n
c
o
v
a:4
6
7回) > (
y
:3
6
8回) > (
d
:4
4
7回)
P とR の TOの平均値 (
y
O
g
I,y
O
g
2
),T
Iまたは T2の平均債 (
y
t
g
I,戸g
2
)
群聞の平均値の差がt=
2では d
O
=
O
.
I,t
=2では d
=
9
.
8であることが読み取れる
A さんは「投与後 T2と投与前 TOとの差について有意差検定を使うべき」と主張している.時点、問の相闘
.
5 以上の場合には,時点ごとに実データを使うよりも,差のデータにした場合に検出力が高くなり,時
が 0
.
5 以下の場合には時点ごとの実データを使う方が検出力が高くなることはわかった.しかし
点問の相関が 0
ながら, A さんは,時点聞の相関の大きさに応じて実データか,差のデータかを選択するのは「後知恵」で
気が引けるという.
B さんは
I
投与前値を共変量,投与後 T2を反応とする共分散分析」は,シミュレーションの結果,時点
聞の相関の大きさにかかわらず,実データ y
,差のデータ d よりも検出力が大きいことが確認され一安心し
た .Bさんは, Eさんも言っているように共分散分析を用いても投与前 TOで群間差が有意な差とまでにはな
らないが, p<0.20となるような場合に
I
平均への回帰」現象により,検出力が落ちるのではなし、かと危倶し
ていた.
4
. 投与前値の群間差を考慮した解析
B さんは, 0 さんに投与前の群聞の平均値の差が P薬群が R薬群よりも p<0.20で大きくなる場合,その逆
に R薬群が P薬群よりも大きくなる場合,群間の平均値に p>0.20と大きな差がない場合についてT1時点と
T2時点についてシミュレーション結果を層別してもらえなし、かと提案した.
G さんは,投与前 TOについて P薬群と R薬群の平均値を算出し, OLMプロシジャを使い,平均値の差の
検定を行い p値をファイルに出力し,ミュレーション結果のファイルとマージし層別したアウトプット 4を
追加した . 0さんは
I
平均への回帰」が見えるようになったと説明した.T1時点の t
Og
=
'1:P>R' の場合, P
薬群の TOの平均値が 1
0
4
.
3からT1で 1
01
.5に減少し, t
O
g
=
'
I
:
P
>
R
' の場合の場合, 9
5
.
5から 9
8
.
2に増大し,
TOで群間差 dO=9
.
0であったのが T1で dt
=
2
.
7と群間差が縮小していることが読み取れると説明した.
T2で t
O
g
=
'1:P>R' の場合,実データで有意となる回数は post05の欄から, 751107=70.1%であるのに対し,
i貸出では 10/107=9.3%と激減する. T2時点の t
Og
=
'1:P>R' の場合は,逆に post
05で有意
差のデータの場合 d
となる割合は, 2
5
1
106=23.67%であるのが,投与前後の差 d
i
f
fでは 83/106=78.3%と激増する.
A さんは,差のデータについての有意差検定の結果が,投与前の群間差にこれほどまでに影響を受けるこ
とにショックであった .B さんは,共分散分析の結果から,全体での 46.7%が,投与前の群間差の大きさに
依存せず, 40/107,51/106と 46.7%前後となっていることで,共分散分析が投与前の群間差の影響を受けない
ような調整機能があることに大満足で、あった.
‑
4
9
‑
アウトプット 4,投与前の群間差を考慮、した有意差検定の結果 (ρ=0.3769)
A八門‑‑
11‑MN‑
'aEEEEEEEEa・?'EEE・?
司‑‑
Ru‑‑‑‑MN‑
n
H
U
u‑‑‑
角
vy‑Ill‑‑?'EEE・?
内︾‑‑四
角
﹃
四
pu‑‑
n‑nu‑uNM
u‑‑
‑1t‑MN‑
四
内︾‑‑‑
‑
‑
﹃︐t﹃︐tnhunu
川A
Hunu
川 nU
川
nU
1aヲtelnu
nURu‑‑ヲt
a
n
M
1
﹃
f
a
F
h
d
n
h
u
n4uan吟
7a ヲJanonu
川
nHUAMυnHunU
11﹃fa・lnU
d崎 11ヲtqL
A4uan吟
ヲtqlphuqo
h
d
n
4
υ
nhu‑‑﹄F
d
A守
F
h
u
﹃
RUヲtEUヲt
臥
マ
ワ ιA崎
ヲt A
内
4 u a n吟
‑
9ιqO9ι
8ヲt5
1
2
83
nU
川F
hdn4υnMU
T‑ヲtnuno
︐
ι
内
n
υ
4
合u
︿n
huhυ
司A
M
υ
nUFhun3EU
4l J q u
︐ιFhd
Janhun
ヲ
'i内
正 TiEυ
崎
78
nHU41aanV
F
h
d
n
M
1
可n
huhυ
司a
hυ
JaFhu‑E︐n4U
︐ι・E'an吟
n
ー
ヲ
崎
︐ι 内u
n
川‑
E
E
n
4
υ
4
内υ
anYAHUFhd
anM1Fhd
‑
U
HUanM1hHU
川A
n
‑‑‑‑
nAvnwunhunwu
i
可
内川
内川
内川
u・1lAMU‑‑a
‑
‑
‑
‑
‑
‑
hυ U
A
M
υ U
nunu‑‑nU
ヲtnununo
7‑
1
8
‑‑
‑1
‑
‑
可
品
の結果をファイルに出力し必要な情報を d
a
t
aステップで取り出し方を示した.
TBt4・?IIla‑すTIla‑す
F内
U‑‑‑
‑nu‑MN‑
目
同
nHu‑‑‑
F T ‑ l l + l lよT
F't‑‑
・
11‑‑
﹂
口
F内U ‑ ‑
司
‑1l‑MNa
BEE‑‑?︐El・?︐El・?
‑‑‑
eAw‑‑
nv‑nHu‑um同 "
H‑
a‑
︒
‑e
‑
eb‑
y‑um‑
且
n
4
u
n
H
u
v
n
4
u
n
H
H
V
‑
‑
‑
‑
‑
FhdhυavnwU
8
80
9
‑
nhuhυ
司 内
内司
υ
υ
4
守
1
1
・
n
w
u
n
H
u
n
w
u
司A
MυAMυAMU
hυ
可
anM1nwuphdhυ
‑
3
858
‑az‑‑‑
n円 n円
円uQUQUqu
1
円 n円 円 円 円 円
‑gnγp・p・‑lEP・P・PSI‑
‑ 内H
U‑‑‑‑‑‑ph︐ANU‑‑‑‑‑‑EE'
‑ 且t f l内
正 qdA的 at‑‑9ιndA的
‑
5
0
‑
nHu‑‑‑
l
'﹂ ‑EBEE‑?'1ll・?
s'SIt‑tEEE‑‑?1Ill・?
‑n
‑
︒
‑円
a'L‑ a‑
Eu
門 ‑ p u ‑
‑UM川 ‑
111111E 且
TIt‑‑+
am
︒
‑e
m
nHU‑
﹂
口
‑Mm‑
1111111+ll+
nL‑n‑
門
E11111111'・すfll T
﹂
+
︐
nι ‑ H ‑
eb‑ ︒
a‑
nu‑e‑
門 ‑
H
vvd‑um‑
111111+ll+
‑EE‑
eb‑ ︒
a‑
AE‑a‑‑
y‑um‑
‑
Z
E
E
‑
E
a
z
E
E
'
・
?
t
i
l
t
‑
す
eb‑ ︒
a‑
H
内 U‑a‑‑
ーi ‑ n ‑
‑n
uy‑um‑
・?
••••
‑︑︐︐‑‑/色︑︑︐︐‑‑/色︑
‑a'L4E'
1
反復投与分散分析を適用して,薬剤j
群と時点聞の交互作用があれは,その後に時点問
C さんの考えは,
1
1
1
1
2
1
1
i
j
i
l
t
l
i
j
i
l
l
:
;
!
t
O
g
:投与前の群間差, dO:投与前 TOでの群間差の平均, d
t
:Tlまたは T2での群間差の平均
E さん, F さんは,首をかしげつつ,アプトプット 4 の (
I
:
P
>
R
) の場合と (
3
:
P
<
R
) の場合について共分
散分析の模式図を図 lに示して 1401107=37.
4
%
, 511106=48.1%よりも大きな差があると想像していたのだが」
と言いつつ「時点聞の相関が 0
.
3
8と小さいので投与前の群間差が,共分散分析の結果にそれほど反映しにく
いのではなし、かと思われる.時点問の相関を大きくした場合も検討すべきだ」と主張した.
」
l‑1
1f
「
[
図 1 投与前値に P群と R群の群問差が p<0.20の場合についての共分散分析の模式図
。
:P薬,ム ;R薬
, I
:
P
>
Rの場合に群間差が縮小し, 3
:
P
<
Rの場合に拡大すると想像される
5
. 各時点を込みにした解析
の有意差検定をする」で、あった.他のメンバーから,この設定は,投与最終日 T2における結果が主要な評価
であり,中間時点T1は副次的であり,薬剤群と時点、聞の交互作用を前提とした経時プロファイルの検定の適
用は,不適切だとの指摘があり,今回のシミュレーションには含めないことに同意した.
G さんは, M医 EDプロシジャに詳しくないので D さんにサンプルプログラムを示してもらうことにした.
D さんは,プログラム 2で GLMプロシジャと異なるのは, Randomステートメントで症例 s
u
bを指定して同
干
じ症例の時点T1と T2の対応付けを行い, lsmeansステートメントの p
d
i
f
fで時点ごとの群問比較を行い,
プ ロ グ ラ ム 2,時点T1と T2を 込 み に し た 共 分 散 分 析
proc mixed dataニdOl ;
where (
t
=
l or t
=
2
)
class g t sub
ニs
atterth
model y = yO g t g*t / ddfm
lsmeans g*t / pdiff ;
random sub /
make '
d
i
f
f
s
' out=sOl
by i
run ,
アウトプット 5
. 時点Tlと T
2を込みにした実データの共分散分析 (
ρ
=
0
.
3
8
)
‑AHυ
HU
︽
HU
︽
‑oo
‑AHυ
A八円‑
‑‑‑‑・ li‑‑a
Illit‑‑14+IIlli‑‑‑
n
u
件
‑‑aAm1hHυ
hu
‑‑8
申
‑‑伊
‑
h
伊 u m ‑ ‑
︻ド‑‑
nHu‑‑
v
d‑‑
‑AHυ‑
戸
Lw‑‑FhunHu
n川 ‑ ‑ n w U
h
伊 u
事
alw‑31111I
e‑IEEE'116
r
‑ ‑・
8
0
a‑‑
11111111111VIlli‑‑1111
‑ 1 1 4 1内
£
Eさんの「投与前値を共変量,時点、Tlと投与前 T
Oとの差,時点 T
2も投与前 TOとの差を反復投与とした
反復測定共分散分析」については, mixedプロシジャの modelステートメント反応 yを差 d に置き換えるだ
けなので, G さんはすぐアウトプット 6を提示した.
アウトプット 6
. 時点Tlと T
2を込みにした差についての共分散分析 (
ρ
=
0
.
3
8
)
‑AHυ
凸
H
υ
‑nHunHu
anHunHU
hH‑
aA守 ︽HU
‑‑‑1lql
‑司
‑‑EU
問
11111i+111111
‑ 目 ・ 4nu
nF‑m
‑‑
FhUEe‑‑
HU‑
alw‑3Illi‑‑‑EEEEEEEEBB‑
r
"‑80
‑︽
︒
‑‑
Ju‑‑
翁
戸句 " ‑ F h u n H u
n川 h ‑ n w U F h u
u‑‑
‑Ill111+SIlli‑‑‑
‑t12
Eさんは,アウトプット 6を見て, I
あれ,これはアウトプット 5と同じ結果だ,プログラムミスではない
aと 7
bに示した.
か」と G さんに質問する .Gさんは,シミュレーション途中の結果をアウトプット 7
a,時点Tlと T
2を込みにした実データの共分散分析 (
ρ
=
0
.
3
7
6
9
)
アウトプット 7
L
e
a
s
¥S
q
u
a
r
e
sM
e
a
n
s
+
'
E
f
f
ec
¥
E
E
s
¥i
m
a¥
e
S
¥
a
n
d
a
r
d
.
'
E
r
r
o
r
D
F
¥V
aI
u
e
¥[,̲J
P
r >[
g
*
¥
g
*
¥
G
l
:
P
G
l
:
P
9
7
.
3
1
8
6
9
0
.
4
0
1
0
3
.
1
7
2
4
3
.
1
7
2
4
3
2
3
2
3
0
.
6
8
2
8
.
5
0
<
.
0
0
0
1
.
'
<
.
0
0
0
1
ν
t
t
G
2
:
A
G
2
:
A
9
9
.
7
1
1
7
81
.6
9
4
8
3
.
1
7
2
4
3
.
1
7
2
4
3
2
3
2
31
.4
3
2
5
.
7
5
<
.
0
0
0
1
.
'
<
.
0
0
0
1
E柑
車柑
・
l
Di
f
fe
r
e
n
c
e
so
fL
e
a
s
¥S
q
u
ar
e
sM
e
a
n
s
.
E
f
fe
c
¥
g
*
¥
車市 t
G
l
:P
G
l
:P
E
E
s¥
im
a
¥e
S
¥
a
n
d
a
r
d,
E
r
r
o
r
D
F
¥V
a
l
u
e
P
r >[
¥[
'
.
G
2
:A
G
2
:A
‑
2
.
3
9
3
2
8
.
7
0
6
2
4
.
4
9
1
6
4
.
4
9
1
6
31
.9
31
.9
‑
0
.
5
3
1
.9
4
0
.
5
9
7
9
.
'
0
.
0
6
1
5.
'
‑
5
1・
アウトプット 7b,時点Tlと T2を 込 み に し た 差 の デ ー タ の 共 分 散 分 析 (ρ=0.38) L e . s ¥ Squ.resMe.nsザ S ¥a n d a r d . ' Error Effec ¥ 富市t g榊t 車市 t 阜市t im.¥e Es¥ ¥V . Iu e P r >¥ [[ ' " ' G l: P G l: P ‑ 5 . 2 2 4 1 ‑ 1 2 . 1 4 1 7 3 . 1 7 2 4 3 . 1 7 2 4 3 2 3 2 ー1 . 6 5 ‑ 3 . 8 3 0 . 1 0 9 4 μ 0 . 0 0 0 6 . ‑ ' 日2 :A G2:A ・ ‑ 2 . 8 3 0 9 2 0 . 8 4 7 8 3 . 1 7 2 4 3 . 1 7 2 4 3 2 3 2 ‑ 0 . 8 9 ‑ 6 . 5 7 0 . 3 7 8 9 . ' < . 0 0 0 1 μ ι v q咽 aUVE a u ﹄u 門 va 問 a e u Md r ro 刷叫託 ι n ︑ bu ‑ し 匂 w 翁 @ A ‑ ︾ w 4 . 4 9 1 6 4 . 4 9 1 6 L 目 ‑ 2 . 3 9 3 2 8 . 7 0 6 2 @ A ‑ E s¥ ima¥e rnc ﹂ aa t ‑ fnU ‑ ‑ し 匂 w 日2:A G2:A FU t E G l :P G l :P e n H e r f f .l υ n E f f ec ¥ E市t g~\ D F D F 3 1 . 9 31 .9 ¥ Value P r>¥ [μ [ 0 . 5 3 1 .9 4 0 . 5 9 7 9 0 . 0 6 1 5 . ' 司 ・ I l s m e a n nは解析方法に対応して妥当な推定値になっているが,時点ごとに群間比較をした結果は,実デー タでも投与前からの差のデータでも結果が一致しているので,シミュレーションの結果は間違いない」 と G Eさんは,この結果を見て, CPMPの P o i n t st oc o n s i d e ro na d j u s t m e n tf o r さんは結果が正しいと主張した . b a s e l i n ec o v a r i a t e sを 再 確 認 し て み た . 1 1 . 7 . Changefromb a s e l i ue 'a n a l y s e s W h e l lt h ea l l a l y s i si sb a s e donaC O l l t i l l U O U SO u t C O l l l et h e r ei sc O l l l 1 1 1 o n l yt h eC h O i C eo fw h e t h e r 1 't h ec h a n g e企01ll b a s d i l l ea st h ep r i m a r ye n d p o i n t . t oU S et h erawO u t C O l l l evaIiabk0 W h i c h e v e ro ft h e s ee n d p o i n t si sc h O S e n .t h eb a s d i l l ev a l u es h o u l db ei l l c l U d e da sac o v m i a t e i l lt h ep r i 1 1 1 a I ya l l a l y s i s . TheU S eo fc h a l l g ef r 0 1 1 1b a S e l i l l ew i t h o u ta d j u s t i l l gf o rb a S e l i l l ed o e s 1 l0 tg e l l e r a l l yC O l l s t i n l t ea l la p p r o p r i a t ec o v a r i a t ea d j u s t 1 1 1 e l l t .N o t et h a tw h e l lt h eb a s d i l l ei s d d .t h ee s t i l l l a t e dt r e a t l l l e l l te f f e c t sa r ei d e n t i c a lf o rb o t h i l l c l u d e da sac o v a r i a t ei l lt h e1ll0 ' c h a l l g e企u l l lb a s d i l l e 'a l l dt h er a wO U t C O l l l ea l l a l y s i s . C O l l s e q u e n t l yi ft h ea p p r o p r i a t e a d j u s t l l l e n ti sd O l l e .t h e l lt h ec h o i c eo fe l l d p o i l l tb e C O l l l e Ss o k l ya l li S S U eo fi l l t e l p r e t a b i l i t y Eさんは, 1 1 .7 . をじっくりと読んで、「なんだ,実データでも差のデータでも投与前値を共変量に入れれば 結果は同じになると書いてある」と再認識した. E さんは,差のデータにすれば,群聞の投与前値の平均値 の差を統計的に調整する方法として広く使われていると思い込んでいたのは誤解であったと気が付いた. I Fさん,投与前値を 2群で共通とするような解析方法」は,どのようなモデ、ルするのかと, G さんが尋ね る. Fさんは,こんな感じで良いと思うけど,少し自信なさげであった. 群時期 T O 2 2 2 G l : P G l : P G l : P G 2 : A G 3 : A G 4 : A GO G I PTl G I PT2 GO G2ATl G2AT 2 Tl T 2 T O Tl T 2 ‑ 5 2・ ダミー変数 z l z 2 1 0 o 1 o 0 1 0 o 0 o 0 一 時期 話 一0 0 0 0 0 1 群 一 症例 No oo‑‑000 投与前を群間で共通とする解析モテaル 叫 一0 0 0 0 1 0 一 ︒ 表 3 .
G さんは早速,プログラムを作成しアウトプット 8 cにシミュレーション途中の結果を示した. F さんは, 共通の投与前値はモデルを使わない算術平均に一致することを確認したが,群時期ごとの推定値は算術平均 I このモデ、ルは,投与前値をモデルでは共通にしている に一致しないことを気がついた.しばし考えた後に ので,投与前 TO の群間差を統計的に調整しているのではなし、かと」推論した.ただし I シミュレーション の結果が悪ければ魅力に欠けると JGさんに話し,シミュレーションの結果の提示を求めた. アウトプット 7 c,時点Tlと T2を込みにした差のデータの共分散分析 (ρ=0.38) E ff e c t g t 草 i G O L e a s tS q u a r e sM e a n s令官 S t a n d a r dt ‑ ' E s ti m a t e E rr o r D F 1 0 2 . 5 4 2 . 6 7 3 2 4 4 . 4 g t g t G 1PT 1 G 1PT 2 3 7 . 2 2 8 2 3 0 . 3 1 0 7 3 . 6 5 3 5 3 . 6 5 3 5 z z t i 、 G 2 AT 1 G 2 AT 2 3 3 . 8 0 2 0 8 1 . 7 8 5 1 3 . 6 5 3 5 3 . 6 5 3 5 tV a l u e 3 8 . 3 6 P r >[ t[ t ‑ ' く. 0 0 0 1t ‑ ' 5 3 5 3 2 6 . 5 7 2 4 . 6 8 く. 0 0 0 1t ‑ ' く. 0 0 0 1J 5 3 5 3 2 7 . 2 7 2 2 . 3 5 く. 0 0 0 1t ‑ ' く. 0 0 0 11 E f f e c t g t Di f fe r e n c e s口fL e a s tS q u ar e sM e a n st ‑ ' S t a n d ar d ν gt E s ti m a t e E r r口r D F g t g t G 1PT 1 G 1PT 2 G 2 AT 1 G 2 AT 2 ー 2 . 5 7 3 8 8 . 5 2 5 8 4 . 3 3 8 4 4 . 3 3 8 4 5 4 5 4 ・ tV aI u e P r >[ t[ t ‑ ' 0 . 5 1 1 . 71 0 . 6 0 8 7 ν 0 . 0 3 3 8t ‑ ' 向 G さんは早速プログラムを書き,アウトプット 8 を提示した.これを見て, F さんは, I え!検出力が 5 3 1 1 1 0 0 0 = 5 3 . 1%とこれまでの結果で最も高いではないか」と驚きの声を上げた.他がメンバーも G さんのプ ログラムを検証した結果,間違いはないらしい. アウトプット 8,時点 TOを群聞で共通とした解析 (ρ=0.38) ‑ 1 i │卜卜卜一一一‑一寸子 : 一一一一一一‑一一一一一一白一一一一‑一一一一‑一一一‑一一『一‑一十‑ 6 . 投与前を共変量とする共分散分析における平均への回帰 E さんは, TOを群で共通とする方法で, T2時点での検出力が高くなるのは興味深いが, TOを共 変量とする共分散分析に積極的に変えたくなるような検出力の差があるようには思えない.さらに, 共分散分析の「平均への回帰」現象をシミュレーションで見えるようにして,その結果をみてから 再検討したらどうかと提案した. G さんは,シミュレーションのデータの組数が 1, 000 回程度では, TO で群聞の平均値の比較で pく 0 . 0 5 となる回数は, 200回程度であり,それをさらに上下に分けるので,最低でも 10, 000組 の シ 000組程度を確保しないと結果が不安定だという. ミュレーションデータを発生させて上下で各 1, ‑ 5 3 司
G さ ん は 計 算 ス ピ ー ド の 速 い PCで シ ミ ュ レ ー シ ョ ン を で き る よ う に 準 備 し た . こ れ ま で と 同 じ 000回 に 増 や し た 結 果 を ア ウ ト プ ッ ト 9に示した.アウトプッ 条 件 で , シ ミ ュ レ ー シ ョ ン 回 数 を 10, ト 4 で 共 分 散 分 析 の 結 果 に 平 均 へ の 回 帰 の 影 響 が で た よ う に 思 え た の だ が , 的 g =' I : P > R ' の場合 429/1009=4 2.5%,t Og=' 3:P<Rの場合 4 3 6 1 1 0 1 9 =42.8%とほぼ同じ結果となった .Gさんは,図 lから,共分散 分析で有意差があったとしても T2時点で P薬 >R薬の方向だけなく,逆に P薬 <R薬となる場合もありそう だと思い, ancova05の欄に逆の場合の件数を分離したのであるが,わずか 2 / 1 0, 000=0.02%で、あった. 時点Tlと T2を込みにした場合の検出力は,別々の場合が 4 8 3 8 1 10000=48.4%に対し a n c r e p y 0 5で 51.5%と 3.1%向上し,投与前値を群で共通としたモデルの場合は, c o r n r n o n 0 5で 54.9%とさらに 3.4%向上した. アウトプット 9 . 1 0, 000回 の 実 デ ー タ , 差 の デ ー タ , 共 分 散 分 析 の 検 出 力 7 . 今後の課題 経時データの解析をどのように行ったらよし、かは,古くて新しい課題である.現代の統計ソフトは無限に とも思われる解析の方法を提供するが,ユーザは戸惑うばかりである.そのため経時データの解析の基本的 な考え方について整理を試みている [ 3 ],今回は,実データおよび投与前からの差のデータに投与前値を共変 量とする反復測定共分散分についてシミュレーションを主体にした解析の性能評価を取り上げた. 経時データでの「平均への回帰」について計量的な評価を試み,実データあるいは投与前からの差のデー タについては, i 平均への回帰」による影響が無視できない大きさであることが確認された.投与前値を共変 量とする共分散分析は, i 平均への回帰」の影響を受けるのではなし、かと考えていたが,今回の検討の範囲内 では,影響を受けにくいことが確認された. 投与前値を群間で共通とするモデルの検出力は,投与前値を共変量とする共分散分析よりも高くなること が確認された.確率的には群問で投与前の群間平均は等しいのであるが,現実のデータでは,何らかの差が 出てきて,それは明らかに投与後のデータに影響を与える.投与前に高めの症例は高めに,低めなら低めに という現象を考慮しつつ, i 平均への回帰」の影響を弱める方法として,投与前値を群間で共通とするモデル が優れていると考えていたのである.しかしながら,投与前を共変量とする共分散分析もメカニズ、ムはまだ わからないが,優れた調整機能を持っていることが,このシミュレーションから判明した. 文献 [ 1 ] F r i s o n,S .a n dPocock ,S . J .( 19 9 2 ), R e p e a t e dM e a s u r e si nC l i n i c a lT r i a l s :An a l y s i sUsingMeanSummaryS t a t i s t i c s e s i g n .S t a t i s t i c si nM e d i c i n e,1 1,1 6 8 5 ‑ 1 7 0 4 . a n di t sI m p l i c a t i o n sおrD [ 2 ] L i a n gK., Zeg 町 S .L .( 2 0 0 0 ), L o n g i t u d i n a lD a t aAn a l y s i so fC o n t n u o u sa n dD i s c r e t eR e s p o n s e sf o rP r e ‑ P o s t D e s i g n s .TheI n d i a nJ .o fS t a t i s t i c c s, 6 2 :1 3 4 ・1 4 8 . 2 0 0 9 ),薬理学研究における経時データ解析の考え方一血圧降下試験事例による解説一, 日薬 [ 3 ] 高橋行雄 ( 理誌 ( F o l i aPharmacol .J p n . )1 3 3,325~33 1. 1 1 t t p : l l w w¥V. i s t a g c . i s. tg o・i p / a t 1 i c l d f p i / 1 3 3 / 6 / 1 3 3 3151 a r t i c k / ‑ c h a r / i a . ‑ 5 4 ‑
薬物併用効果の解析 杉本忠則 大日本住友製薬研究管理部 Ana n a l y t i cmethodf o rt h ec o m b i n a t i o n a le f f e c t T a d a n o r iSugimoto R e s e a r c hA d m i n i s t r a t i o n, D a i n i p p o nSumitomoP h a r r n aC o ., L td 要旨 薬物を併用した場合の相乗効果の評価を行う際に検定を用いることがあるが、薬物反応の理論的背景 を考えると適切でない場合がある。受容体理論から、薬物用量と薬物反応との関係は数式として記述す ることができる。二薬物が併用された場合も、薬物反応が相加反応であると仮定すれば数式として記述 することができ、理論反応値を計算することも可能である。併用により相乗効果や措抗効果が発現して いれば、得られる反応値は理論値から:i1E離する。これを利用すれば、実験により得られたデータから併 用による反応が相加的であるかどうかを調べることができる。今回、二薬物併用における反応を数式で 記述し、非線形回帰により解析する方法を提案する。本解析法では、非線形回帰に用いる数式の中に相 加効果からの君離度合いを示すパラメータを組み込んでおり、このパラメータを推定することにより二 薬物併用の相加・相乗・桔抗効果が評価できる。本解析法を実施する場合、非線形回帰の解を算出する 解析ソフトウェアが必要であるが、 SASの NL 町 PROCEDUREはこのツールとして広く知られているた め 、 SASを利用した解析例も紹介する。 キーワード:受容体理論、薬効評価、薬物併用効果、非線形回帰、 NL 町 PROCEDURE 緒言 薬物を併用した場合に生じる相乗効果の評価をどのように行うことが適切であるかという問題は以前より あったが、最近の医薬品研究開発現場でもこの問題に遭遇する研究者は多い。併用の際の効果を的確に評価 できれば、薬効発現のメカニズムを探る手がかりにもなる。しかし、薬物併用をどのように解析するのがよ いかという問いに適切な回答ができる研究者は少ない。 仮説検定による有意差を薬効発現の判断材料とする研究者がし、るが、同じような考え方を併用効果の判断 b用量)、薬物 A(σ 用量)と薬物 B ( b用量) に使う場合がある。すなわち、薬物 A(σ 用量)、薬物 B ( との併用での反応値をそれぞれ E 、 。E b、Ea+bとすると、 Ea‑E川 .聞の検定や Eb‑E + b問の検定で解析結果が有 a 意となれば、更なる効果があったとするものである。しかし、これでは有意差が認められでも、それが相加 効果であったのか相加効果を超える反応値であったのかはわからない。しかも、相加効果よりも小さな反応 ‑ 5 5・
値しか生じなくても検定で有意差が付く場合があるため、研究者が求めたいことと解析結果から期待できる こととは異なる。 二元配置分散分析は三因子効果解析の強力な手段である。交互作用項は二因子が共存する場合に現れる項 α の効果が存在すると言える。このため、交互作用項を薬物併用効果 であり、これが統計的に有意となれば+ の解析に利用する場合がある。この解析手法は実験計画法の分野ではよく見かける手法であり、一見合理的 であるが、薬効を評価する場合には注意する必要がある。例として、薬物 A ( a用量)と薬物 B ( b用量)と a用量)と薬物 A ( a '用量)とを併用する場合を考えてみる。この場合の併 を併用するのではなく、薬物 A ( 用とは薬物 A を σ+ a '用量投与することになる。薬物 Aが G 用量、が用量、 a + a '用量での反応値をそれぞれ Ea, Ea 、 ・ E計 a'とすると、各反応値の関係は交 E作用項を加えると E計 a . = E σ , +Ea・ + α となる。薬物用量を横軸に、反応 値を縦軸にした場合、一般に反応曲線は上に凸な曲線 i こなることが知られているため、 E的 ・ くE a + E a 'である(図 1 ) 。このため三元配置分散分析を行えば、 αはマイナス値となる。しかも、実験の例数を多くとれば αは統 計的に有意となる。解析結果をそのまま解釈すると薬物 A は用量が増加すると括抗効果を示すという結論に 至ってしまうが、このような結論を導かないためには対象データに適用できる解析手法であるかどうかを事 前に検討しておかなくてはいけない。二元配置分散分析の場合、薬物と反応値とが近似的に線形関係である という前提が満たされなくてはいけないが、薬理実験から得られるデータではこの前提が満たされる範囲は 限られている。 多くの薬物反応、は薬物とその標的部位(受容体)とが結合した複合体の量に依存するが、薬物と受容体と の結合は質量作用の法則に従うため、複合体の量は薬物量と解離定数から算出できる。しかし、実際の薬物 反応には、単純なモデルでは説明できないものもある。今回提案する方法では、薬効が複合体の量に比例す るモデル、すなわち、余剰受容体がない薬物反応での薬物併用効果について考えることにする。なお、本稿 で定義する相加とは、二種類の薬物を併用した場合に各薬物が同一受容体に結合し独立に発現する反応の加 算とする。そして、相加を超えれば相乗とし相加に達しなければ桔抗と定義する。このため、各薬物の結合 部位が異なっていたり、それぞれの薬物反応が分子レベルで影響しあっていたとしても、発現する反応値が 相加と判断される大きさであれば相加効果とみなされるので、注意して欲しい。 憎l i 乏 出 E Z l : :ご 。 α α ' 針。'薬物用量 図1.薬物反応の一般的反応 一般的な薬物反応は上に凸な曲線になるため、反応値は Ea+a くEa+Ea ・ ' となる。(文献 lより出典) ‑56・
理 ; j ' b . ロ岡 1.薬物単独で、の反応 薬物 Aと受容体 Rとが存在し、薬物 Aと受容体 Rとの複合体 A R(活性化された受容体)ができる反応式 ︑︐︐︐ l ( は式(1)で示される c A+R付 AR それぞれの量を[]で表し、受容体全体の量を [ R ]。とすると、 判。=[ R ] + [ A R ] ( 2 ) であり、 A と R との解離定数をんとすると、 h I R I k d 一 再T ( 3 ) である。式( 2 )、式( 3 )から式( 4 )が導かれる。 [ R ] o [ A ] ドR ] = τ下 つ ア ( 4 ) lAJ+AA 反応値は活性化された受容体の量に応じて決まるので薬物 A の固有活性をんとすると、反応値 E は R ] o [ A ] 有[ 五 7 =kA[AR]= 肋 となる。ん [ R ] oはこの系において薬物 Aにより起こりえる最大反応値であるのでん [R]o=EA 聞とおくと、 n [ A ] l A J + K A τ E=‑ , " ででー ( 6 ) が導かれる。 薬物 Bでも、同様に反応値 E を求める式が得られるが、薬物 A と薬物 B とは同一受容体に結合するが発現 f 奇異なるとすると l = k / んである。なお、 p は固有活性比とよばれる。 EB m a . ,= k B [ R ] o = r k o = r E する薬効は r B n I A[R] A 田 であるので E一主斗国主斗国 一 [ B ] + KB ( 7 ) [ B ] + KB となる。 2 . 二薬物併用での反応 薬物 A と薬物 B とが共存し、同一の受容体に結合する場合の反応式は、 A R R B+R B ( 1 ) A+R~ ( 8 ) 特 となり、基本となる式は、 K ‑ h I R ] A ‑ K B‑ [ A R ] ( 3 ) 是 主 l r B R l ( 9 ) [ R ] o=[ R ] +[ A R ] +[ B R ] ( 10 ) である。式( 3 )、式( 9 )、式( 1 0 )から、 ‑ 5 7・
B ︑︐︐︐ 1 1 ( いIR]oKB [ A R ]= +[ A] KB +[ B ] KA [BIR]oKA [ B R ]= B ( 12 ) +[ A] KB +[ B] KA が導かれる。従って、反応値 E は E=kA[AR]+kB[BR] k A [ A l i R ] o KB kB[ B I R ] oKA ‑KAKB+ [ A] KB+[B] KA'KAKB+ [ μ A] KB+[B] KA ι E ' A m a : c [ . 一 KAK A] K B+[ B] K A B+[ EA m a . , [ A] KB+rEAma̲ , [ B] K A A] KB+[B] KA ‑ KAKB+[ EA m a x a A ] KB+r[B] KA) A ] KB+[B] KA ‑KAKB+[ ( 1 3 ) となる。式 ( 1 3 )により算出される反応値は相加効果のもとで期待される反応値であるので、本稿では式( 1 3 )に より算出される値を相加効果期待値とよぶことにする。なお、薬物単独投与の場合、一方の薬物濃度はゼロ 1 3 )は式( 6 )または式( 7 )に一致する。 となり、式 ( 3 . 相乗効果・措抗効果の解析 薬物 A と薬物 B とが単独あるいは併用された場合の相加効果期待値は式 ( 1 3 )により示されるが、併用によ り相乗効果もしくは措抗効果があればその反応値は相加効果期待値の k倍となる(但し、が 1 ) 。そこで、薬 物 A と薬物 B とが単独あるいは併用された場合の反応値を記載すると式(14 )となる。 E= (~"伴出 l A J + K " (薬物 A 単独) 宣盟困 (薬物 B単独) ( 14 ) [B]+K 8 k k E " , 血訓加町 ε ' m " , 叩 K"Kn+[ A] K8 +恒] K " (薬物 A薬物 B併用) 式( 1 4 )の第三式は薬物 A と薬物 B との併用時の薬物反応値を表すが、相加効果であれば k=1 、相乗効果であ れば k > 1、措抗効果であればド lとなる。実験では、薬物 A の用量 [ A ]、薬物 Bの用量 [ B ]を決め、反応値 E を測定するが、得られる測定値は反応値 E の真値に測定誤差が加わった値である。この測定誤差に独立性、 正規性、等分散性が期待できれば、式(14 )を用いて非線形回帰による解析が可能となる。 解析手法と解析例 解析は S ASの NL 悶 P ROCEDUREを用いて非線形回帰を行う。なお、式(14 )で示される三つの回帰式につ いては、ダミー変数 zを用いることにより一つの回帰式( 1 5 )として記述することができる。 E=ll+(k ー 1)z}E"m~([A]K8 +r [ B] K A} ( 1 5 ) KsB+[ A ] K8+[ B ] K A ‑ 5 8・
(但し、薬物単独の場合z=0 、併用の場合 z =1 ) 単独の場合はz=0として投与しない方の薬物用量を 0とするため、式 ( 1 5 )は式(14 )の第一式や第二式に一致す る。また、併用の場合はz=1とするため式(15 )は式(14 )の第三式に一致する。 ) を用いて、この回帰式を用いた解析を試みる。こ 次に、薬物 A と薬物 B の各用量に対する反応値(表 1 れらのサンプルデータは薬物 Aと薬物 Bの各単独での反応値と薬物 A( 用量 1 5 ) と薬物 B (用量 1 0 ) との 併用での反応値であるが、ダミー変数 zの値は併用では lとし、他では 0としている。 SASの NLINPROCEDUREを用いて解析した出力結果より、必要な数値を取り出し表 2にまとめた。なお、 解析プログラムについては、 Appendixに示しである。解析により、各ノ fラメータの推定値の他に近似標準誤 差と 95%信頼限界が得られる。なお、今回のサンプルデータについては JMP (Ve r .6 ) を用いた解析も行った がほぼ同様の結果が得られた。 表1.解析用サンプルデータと解析結果を元に算出した推定値(文献 lより改 変) 解析用データ 薬物 A 薬物 B 用量 用量 解析結果からの 反応値 個別値 。 。 。 。 。 。 。 。 。 。 。 。 。 ダミー 平均値 0 . 5 3 1 3 1 5 1 4 . 0 1 0 33 34 3 3 . 5 30 5 8 6 1 5 9 . 5 1 0 0 82 84 8 3 . 0 300 93 94 9 3 . 5 3 1 7 1 8 1 7 . 5 1 0 38 42 4 0 . 0 30 59 6 1 6 0 . 0 1 0 0 73 75 7 4 . 0 300 76 7 8 7 7 .0 1 0 6 8 70 6 9 . 0 1 5 推定値 z ) 式(16 変数 ( ) 。 。 。 。 。 。 。 。 。 。 。 I 式(17 ) 0 . 0 0 1 3 . 1 3 3 3. 45 5 9 . 9 9 8 3 . 0 4 9 3 . 2 9 1 8 . 2 0 3 9 . 7 3 6 0 . 0 0 7 3 . 0 4 7 7 .88 表2 . 解析用サンプルデータを用いた解析結果(文献 lより改変) パラメータ 推定値 近似標準誤差 EAmax 99. 41 8 9 0 . 9 7 6 1 9 7 . 3 7 5 8 1 01 .5 KA 1 9 . 7 1 9 2 0 . 7 3 8 3 1 8 . 1 7 3 8 21 .2645 KB 1 0 . 2 7 6 5 0. 4465 9 . 3 4 2 0 1 1 .2109 r 0 . 8 1 0 2 0 . 0 1 1 3 0 . 7 8 6 4 0 . 8 3 3 9 k 1 .2248 0 . 0 1 8 9 1 . 1852 1 . 2 6 4 5 ‑59・ 95%信頼限界
考察 解析により得られたパラメータの推定値を式( 1 5 )に代入すると、 E=( 1+0 . 2 2 4 8 z X 10 21 .6 8 [ A ] +1 5 8 8 . 3 7 [ B D 一 0 2 . 6 4 4 +1 0 . 2 7 6 5 [ A ] +1 9 . 7 1 9 一 2 ( 16 ) が得られる。また、式(13 )に代入すると E= ̲ 1 0 21 .6 8 [ A ] +1 5 8 8 . 3 7 [ B ] ( 1 7 ) 2 位 644+1 0 . 2 7 6 5 [ A ] +1 9 . 7 1 9 2 [ B ] )は表 lの実験結果の推定値を求める式であるが、各単独で となり相加効果期待値の算出式が得られる。式(16 はz=0とするため式(17 )と同じになる。また、併用では解析に用いた配合組成(薬物 A の用量 1 5、薬物 Bの 用量 1 0 )における推定値を算出する式である。データの投与用量における推定値を式( 1 6 )、式(17 )を用いて算 )を用いて算出される相加効果期待値曲面と式( 1 6 )を用いて算出される各用量での反 出し表 lに示した。式(17 応値の推定値を三次元的に表したグラフを図 2に示す。図 2より併用された反応値は相加効果期待値曲面の 上方に位置することがわかる。パラメータ kは併用における反応値の推定値と相加効果期待値との比を示し ている。すなわち、 kは相加効果からの恭離度合いを意味している。非線形回帰により、 kの推定値とその 95% . 26 4 5 ) となった。 信頼区聞は1.2 2 4 8 (1.1 852~ 1 データの統計的解析には検定と推定の二種類の評価方法が存在する。多くの薬理実験データの解析では以 前から検定が使われているが、検定は帰無仮説の保留か対立仮説の採択かという択一的評価であるため量的 考察が難しい。しかも、検定で設定される仮説の多くは平均値の差の有無であるため、薬理研究者が述べた い結論を支持するには不十分なこともある。一方、推定としては以前から線形回帰が使われているが、最近 では薬理実験データに対し非線形関数の反応モデルを当てはめて解析する非線形回帰も使われている。この 場合、薬理学的な意味を持つパラメータが数値として得られるため質的かっ量的考察が可能となる。しかし、 得られたパラメータの推定精度が悪いとその考察も漠然としたものになる。 95% 信頼区間とはその区間内に パラメータの真値が存在していることを意味しており、 95%信頼区間の幅が大きければ推定精度は悪く、幅 が小さければ推定精度は良いことなる。パラメータに対する質的かっ量的考察とは薬理研究者が持つ専門知 識を背景に総合的な評価をすることであり、検定のような択一的評価を超えて薬理学的にも妥当性のある判 断が下せる。このため、今回のように相加効果からの恭離度合いが数値として得られる解析結果は、薬効発 現のメカニズムを考察し、更なる実験計画を行う際の有効な情報となる。 サンプルデータでは併用を薬物 A の用量 1 5、薬物 B の用量 1 0の一つの配合組成に限定しているが、配合 ASの NL 別 組成が複数あっても式( 1 4 )を用いて解析することが可能と思われるかもしれない。もちろん、 S PROCEDUREは問題なく解析結果を出力する。しかし、それは科学的に妥当な解析とは言えない。なぜなら、 式( 1 4 )で設定した kの値が薬物 A と薬物 B との配合組成が異なっても一定であるとしづ保証がなし、からであ る。もし、配合組成を複数にしてそれを同時に解析したいのであれば、 kを複数個設定しなくてはいけない。 今回二薬物を併用した場合に得られる反応値が相加効果であるか、それとも相乗効果あるいは措抗効果で あるかを評価するために S ASの NL 町 P ROCEDUREを用いた非線形回帰解析手法を紹介した。データ解析で 重要なことは解析手法の原理を知り、その手法が適用できる前提条件を実験系や解析対象データが満足して いるかを考えて解析手法を選択することである。本手法を利用される方はこの点に注意して欲しい。 ‑ 6 0・
100 80 伽 判 昨 dh h w m04費 qL a u﹃ 門 U aunu 図 2 薬物 A、薬物 Bの単独、併用による反応値と相加効果期待値 式( 1 5 )を用いてサンプルデータを非線形回帰した解析結果より、各データ の推定値を算出する式( 1 6 )と相加効果期待値を算出する式(17 )が得られる。 式( 1 6 )より算出される推定値を O( 単独)と・(併用)とで示した。式(17 ) より算出される相加効果期待値曲面を三次元図で示した。(文献 lより出 典) 参考文献 1 )杉本忠則.薬物併用効果の解析. 日本薬理学雑誌. 2 0 0 9 ;134:265・2 7 0 . ム 一 ゲ ノ Xフ 叩プ ド山口 中広 ps AFP3 da 匂 ; i n p u t a b r e s p o n s e z @@; c a r d s ; o 0 0 0 o 010 3 0 1 3 0 3 0 1 5 0 1 0 0 33 0 1 0 0 34 0 30 0 5 8 0 30 0 6 1 0 1 0 0 0 82 0 1 0 0 0 84 0 300 0 9 3 0 300 0 94 0 o 3 17 0 o 30 59 0 o 300 76 0 o 3 18 0 o 30 61 0 o 300 78 0 o 10 38 0 o 100 73 0 o 10 42 0 o 100 75 0 1 5 1 5 1 0 6 8 1 p r o c n l i n ; parms EA=90 KA=100 KB=100 r=1 k=1 ; ‑ 6 1 ‑ 1 0 70 1
model r e s p o n s e= ( l +( k ・l ) * z ) 坦 A*(a*KB+b 呪 A行 )/(KA*KB+a*KB+b*KA); r u n ; ‑ 6 2・
1 1 三十能いらんーら r 2 側 勺 i 臨床試験データへの GLMSELECTpro cedureの適用 横溝孝明¥三角俊裕 2、高橋行雄3 1大正製薬株式会社臨床統計部 2アステラス製薬株式会社データサイエンス部 3中外製薬株式会社臨床企画推進部 An a p p l i c a t i o no f GLMSELECT procedure f o rc l i n i c a lt r i a ld a t a TakaakiYOkomizo1 , T o s h i h i r oMisumi2 , YukioTakahashi3 td . 1TaishoPharmaceuticalCo.,L 2 A s t e l l a sPharmaI n c . 3ChugaiPharmaceuticalCo.,L td . i:1-~-.* ISAS … 一 一 一 7 t JW rH J mI 要旨: 得られた臨床試験データから、 反応変数に影響を与えうる変数を効率的に 選択する方法について GLMSELECTprocedur eを用いて検討した キーワード:臨床試験、探索的解析、変数選択、 交互作用、 GLMSELECTprocedure ‑ 6 3・
D I似十総会一泊~,WlßZC,!U'J加 謝辞 この研究は、財団法人日本科学技術連盟の 「臨床試験セミナ一統計手法専門コース(略称:BioS) (運営委員長:大橋靖雄) J のフォロー研修の一環として行われたものである 3 !3 │ャーや … … m 本研究の背景(1 / 4 ) [I1l~ 例.臨床試験 ( A c t i v eとPlaceboの2群比較) 効果あり 効果なし I !υ」基E 1000 8 . 0 0 600 4 . 0 0 2 . 0 0 0 . 0 0 ‑200 ‑ 4. 0 0 毛0 0 昼間. ・ ‑ . P ! . , 哨0 .AC!仏 e 1寸,~刀,.,.(': ト ' 一一平 l~ 一一中央値 ‑ 8 . 0 0 P l a c e b o A c t i v e 全集団で、 A c t i v eとPlaceboの問 l こ差がつかなかった ‑ 6 4・ 町 3
I
5
A
5.:r.-~-..……1~~
.2Òl~
本研究の背景 (
2
/
4
)
例.臨床試験 C
A
c
t
i
v
eとPlaceboの2群比較)
探索的解析として背景項目ごとの結果をみていき、
原因究明や次試験のために、効果がうかがえる集団を探す
(たとえば、性別)
r 性別男性
;
じ71t│ρ1::T
全集団一一一‑‑‑,
‑
:
1
こ企直 E
、f
l
I
1
̲
.1...引一
P
l紅 ど1
・
"
、
九cI) ι
I
・
~~
│ 鈍 隙 加 点J
目付加知仰シ
本研究の背景 (
3
/
4
)
例.臨床試験 C
A
c
t
i
v
eとPlaceboの2群比較)
しかしながら、試験によっては背景項目が 100個にもおよぶ
臨床試験データでは、一つ一つの背景項目ごとに
効果を見ていくことは大変!!
r性別男性
:4Fd川
i
ト.
.
.
.
、 rrr~
(
''
J
:
二
ヨE
~
o
c
~.,)C
• 00
P
;
;ιdUI
,
'
¥
、
口
、
、
‑
6
5・
|鈍sユーや総会的府岬~抑 制 。I 本研究の背景 ( 4 / 4 ) 得られた臨床試験データから、反応変数に影響を与えうる変数を 効率的に選択できる方法があれば、解析業務の質および生産性 向上!! 背景項目 年齢一身長 体重 BMI 擢病期開 発症年齢 i 性別)合併症の有無 前治療薬の有無 重症度... 反応変数に 影響を与えうる変数 ⑩ 上記のような方法を、 GLMSELECTo r o c e d u r e lこ基づいて検討した 鮎~~健全7tJn.YIT'/)…ω J3 I 間 i D J 本研究の目的 得られた臨床試験データから、 反応変数に影響を与えうる変数を効率的に 選択する方法について検討する 当選択された変数について、医学的に意味のある変数 ということが確認できれば、その後の研究仮説を引き 出すために大いに役立てることができる ※lCHE9i臨床試験のための統計的原則」においても、 探索的解析の必要性について記載されている では、反応変数に影響を与えうる変数とは どのようなものか? 13 ‑ 6 6・
I
総ュー付金……一
例.
円.mJ~
反応変数に影響を与えうる変数の考え方
A
c
t
i
v
e 効果あり
A
<
.
:
I
Iι
"
園児lc"..ho
Placebo
効果なし
呼吸器合併症無
呼吸器合併註有
「薬剤」と「呼吸器合併症の有無」の聞に交互作用あり
「呼吸器合併症の有無」は反応変数に影響を与えうる変数
※薬剤との交互作用を見つけてやればよい!!
I
似ザー蝕対的m':l抑 ・m
2
加
ー
2~
薬斉]
1との交互作用を効率的にみつけるために、
以下のような線形モデルに、変数選択法を適用することを考える
線形モデル
反応変数=薬青白生別+薬剤*年齢+薬剤 *BMI+・..
変:25;J寸てすア!ム lP~~l
影響一、る可
I
~f
↑ J~ f= rFl
よって、交互作用項の変数選択が行えれば
LMSELECTの登場!!
本研究の目的が果たせると考える=キ G
‑
6
7・
[鈍t."Jí~jー健全……w 亡 ~I GLMSELECTprocedureについて (参考:C o h e n,2006) ロ SAS9.1.3では評価版、 9.2で正式版として利用可能 LMp r o c e d u r e fこ変数選択の機能を付加したイメージ ロ G ロ説明変数の数が多くなっても変数選択可能 副値│ロ説明変数に交互作用項があっても変数選択可能 ロ近年提案された変数選択法の L A R ( E f r o neta. l,2004)と LASSO(Tibshiranieta. l,1996)が利用可能 =今説明変数の数が症例数より多くても (N<p でも) 変数選択可能 1/3 "*#)4会……b~~ 201~ 各 procedureの比較 • REGorocedure: 様々な変数選択法が用意されているが、 交互作用項を含む変数選択が行えない • GLMprocedure: 交互作用項を含む回帰分析は行えるが、 変数選択が全く行えない • GLMSELECTorocedure: 様々な変数選択法が用意されており、 交互作用項を含む変数選択が可能 2 / ヨ ヲ ‑68・
I ぬ日」給料山川シ日{ E 1 0 : REGと GLMSELECTの比較 y :反応変数(連続変数) x 1、x2、x 3 :説明変数(連続変数) C 1、c2、c 3 :説明変数(カテゴリカル変数) rocedure 一二 日u e一 二 一一一 d : : 一 一 r e Auz O a= QU= α一 泊 = ﹂ 一 ︼一 PL=E3 a‑xqu ! ご一! 同一 : 21 ︻h mvdm 四一山立刊凶 M一M M W L‑gs ぬ G一χ 回 収 一 EE‑‑zX2 1 一 ・ E CC1c procr e gd a t a = d a t a ; modely=x1x2x 3 / s e l e c t i o n = s t e p w i s e SLE=O.15SLS=O.15; ① CLASSステートメントが 利用可能 ②交互作用項を含む 変数選択が可能 x 1 x2x 1C I s e l e c t i o n = s t e p w i s e ( s e l e c t = S LSLE=O.15SLS=O.15); 台 党 r u n ; 1 3 S I ぬ ‑ 健 全 均 一 一 一 ‑ 山 ‑ 庁捌~ 本研究の目的(再確認) 線形モデル 反応変数=霊童J~性別+薬剤*年齢+薬剤唱 MI + ・ ・ ・ 霊童凶主~Il が変数選択された 11 ~~l 円 I'!. ,c:t川、‘~ , L̲ ‑ 、 ( r F l 臨床試験データ(人工データ)に対して、 GLMSELECT を適用し、交互作用項が選択されるかを確認した 1 ‑ 6 9・ 3
I. D 十 蝕 … … … 臨床試験データ(人工データ)への適用 佐倒番 号 │ 反 応 変 量 y 1 2 3 I 1 I 聾剤 P l a c e b o P l a c c b o A c t i v e 器+ 4 号 Act ¥ i ' c A c t r v e P j e ' : n告白併症の i f努 呼吸器,.併症第 f~J~n 守一 り あ 刻 h ︒ v 〆 J 制型3 ‑症例数200 倒、反応変数y / / / y " . r薬剤」と「呼吸器合併症の有無」 の聞に交互作用あり z 二一一一一一一・門aCfI司 初里なし 呼吸錯合併症無 r 丙噌1 1 岬唖騒合併症有 呼吸器合併症ー構 J / E11KL 1 I l i ! ' l n 9 内 ' 1 ' 1 2 1 5 7 8 1 5 6. 1 18 2 . 7 1243 I i緑 色 提 呼吸器合 ( 昨 Il]~, Wi 汗l 引なが右 ‑ 52] 3田 1 1 . 18 =背景項目 2 5 個 呼吸器合併症者 (連続変数 20個、カテゴリカル変数5個) 上記データに対して G LMSELECT を用い、 S t e p w i s e法により、 「薬剤!と「呼吸器合併症の有無 jの交互作用項が選択されるかを確認した l 刊 D 純 一 総 会 … …ω SASコード 症倒昇平号 呼吸法,.俳注目 ( f匂 吋略2 5f ?的生組 副 ~I 依 2 3 師 " l器 合 f )f ' ( [{ f 開 1 2 叩 坪唖器合併症有 呼吸器合併症〕慢 j~plj 総合併自然 4 5 I1 5 7 8 到.2 11 9 7 6 2 11 5 61 . 18 2 . 7 1243 中埠 1 l ! : 荊 型2 中等度 荊母1 1 1 0 13 今 ‑ 7 0 ‑
1
1
R
~ÜJ
付 金 … … 仰 向
結果
選択された変数
P~nrr. t?t..;-r
E
:̲
ti
r
l
l寸ぞ f
I
n
l
e
r
c
e
p
l
k
e
y
I
I
c
l
i
v
e
key.......P
l
a
c
.
b
o
u
m
u
U叫
en~
~J~. .
呼吸器合併症R
n'f~琵会[耳鹿ー有
薬剤との交互作用として、
「呼吸器合併症の有無」が選択されることを確認した
2
附l
…ー蝕……ームシ
l
シミュレーションの実施
l
i
E
伊
'
i
l
昏
号
制到t
!
1
2
i
9
9 1
2∞ I
6
.
4
8
U9
1A
c
t
i
v,
1 呼吸器合併症街
IA
c
t
t
v
eI 呼 吸 盤 合 怖 症 鴛
・』 ^ctjVA 到'p..あり
E
X
:
i
ι 一一
14
8 11
7
2
3 16
2
.
01
2
4
.
11
1 " 11
6
4
.
9 16
5
.
7 12
3
.
61
一
1 軒}Jf̲ 1 女 │ 柑 明 3
1
ψ 悼 庄 l女 1
1
,¥噌!
‑症例数 2
0
0例、反応変数y
y .
r
薬剤」と「呼吸器合併症の有無」
の聞に交互作用あり
1
ドl
nr
.d'lO
I
効票なし
呼吸器合併症無
.
8
.
8
呼吸器合併走者
・背景項目 2
5個
(連続変数20個、カテゴリカル変数5個)
上記のようなデータを人工的に 1000組作成し、「薬剤」と「呼吸器
合併症の有無」の受互作用項がどのくらい選択されるか検証した 18/23
‑
7
1・
I 崎〉付金印刷…一 D シミュレーションの設定条件 , E‑N( 0,42) ‑真のモデル :y=1.0+yx薬剤*呼吸器合併症の有無 +E ‑ ‑ 戸 ‑ . . . 、 │薬剤 ( = A c t i v e )脅呼吸器合併症(=有)司 1、その他司 o I ・身長、年齢、性別などの背景項目: 正規乱数、一様乱数をもとに薬剤聞で偏りなく作成 (連続変数 20変数、カテゴリカル変数5変数の計25変数) A c t i v e :Placebo=1: 1) ・サンプルサイズ :200例 ( ‑変数選択法として、 Stepwise; 去を使用 (変数の組み入れ・除外水準 Sしを通常使われる 0.15と設定) γ=1.0、2 . 0、3 . 0の 3 / ¥ターンで 1000回データを発生させ、 「薬剤*呼吸器合併症の有無」の選択回数を比較 1 9フ3 2 0 1 U I Irnユ+蝕……t~~~ シミュレーションの結果 = 1 .0 薬剤*呼吸器合併症の有無 選択回数 ( / 1 0 0 0回中) 1 6 3 1 " [ ι一一一 押日止盤台酔雇無 耳目.:ti吉併症有 ︐ 銀 山 併川一早川 有)一 コ中一 危畑一 合川一俳 ・ 一 鵬 跡 一 一 明 一 a‑ 叫概一 剤選一 一 薬 呼吸器古傍Itl!'. oJ ι 一 呼吸器肯償措有 = 3 . 0 薬剤*呼吸器合併症の有無 選択回数。 1 0 0 0回中) 899回 s ロ手暗器古'JI建時 0/.3 呼極器合世位有 ‑ 7 2・
l u ; I ぬ5FFmw 叫ん..附.mJ シミュレーションの結果 圃交互作用の傾き ( y )がある程度大きければ、 目的の交互作用項が選択される SL)をいくつに ‑変数の組み入れ・除外水準 ( 設定するかの課題はあるが、 本研究の目的は真のモデルの推定ではなく、 薬効に影響を与える変数の探素であるので、 見逃しを防ぐためにも、 SLをある程度大きく設定すべきであると考える L = O . 1 5が妥当と考える) (よく用いられる S 1 1 ω〉宇治均一一一…ム‑冒と D 灯 まとめ 得られた臨床試験データから、 反応変数に影響を与えうる変数を効率的に選択する方法 について GLMSELECTprocedureを用いて検討した ※なお、反応変数がカテゴリ力ル変数の場合は、 で 、 同 様 の こ と を 行 う こ と が 可 能 LOGISTICp r o c e d u r e (高橋, 2006) ‑ 場合によっては背景項目が 1 0 0個以上にもなる 臨床試験データにおいて、検討手法を用い、 薬効に影響を与えうる変数に当たりをつけることができれば、 効率的に探索的解析を行えると考えられる . 7 3・
I~ユ+総会……… ~~ 参考文献 1 . 医薬審第 1047 号(平成 10年 1 1月30日付)r 臨床試験のための統計 的原則」 2 . Cohen, ̲ R .( 2 0 0 6 ),I n t r o d u c i n gt h . eGLMSEU:CTProcedurefor ModelS e l e c t i o n,Proceedingso ft h eT h i r t y ‑ F i r s t A n n u a lSAS UsersGroupI n t e r n a t i o n a lC ‑ o n f e r e n c e . 3 . E f r o n, B .,H a s t i e, T ., Johnstone, , . 1 andT ibshirani,R.(2004), L e a s tAngleRegression( w i t hD i s c u s s i o n ), Annalso fS t a t i s t i c s, 32, 407 ‑ ‑ 499. ibshirani,R.(1996),RegressionShrinkageandSelectionvia 4 . T ~h_~L~~~o , J o u r n a lo ft h eRoyalS t a t i s t i c a r S o c i e t yS e r i e sB,58, 267‑288. 5 . 高 橋 行 雄 (20 . 06 ),j[頂序カテゴリー反応の探索的データ解析 h t t p : / / w w w . y u k m s . c o m / b i o s t a U t a k a h a s i / r e c / 0 2 3 . h t m 3 l ‑ 7 4 ‑
がんの第 E相試験における 2 段階デザインの比較検討 山本倫生 1 ) 伊 藤 嘉 彦 l ), 冨 金 原 悟 l ), 山 口 拓 洋 2 ) 1)小野薬品工業株式会社データサイエンス室, 2 ) 東北大学医学統計学 T w o ‑ s t a g ed e s i g n sf o rp h a s eI Ic l i n i c a lt r i a l si nc a n c e r , Y o s h i h i k oI tol ) ,S a t o r uF u k i n b a r al ) , T a k u h i r oYama思l c h i2) MichioYamamotol ) 1 )D a t aS c i e n c e,ONOP h a r m a c e u t i c a lCO., LTD., 2 )B i o s t a t i s t i c s, TohokuU凶 v e r s i t yS c h o o lofMedicine 要旨 がん患者を対象とした第 E相試験では,実薬投与群のみで実施し,検証段階に進めるかを判断することが多 い.その際には,薬剤の有効性が想定よりも低い場合に,コスト及び倫理的な観点から,試験を早期に中止す ることが望まれるこの早期の無効中止を目的とした多段階デザインが多く提案されており,特に 1度だけ中間 解析を実施する 2段階のデザインが実際に利用される頻度は高い.しかしながら,各多段階デザインが多様な 特徴を持っているため,単純に性能を比較することは難しく,利用の際にも適切なデザインの選択を姐悶する , Simon 法 , ことがある.そこで,これまでに提案されている 2 段階デザインのなかで,一般的な Gehan 法 F l e m i n g法,及び近年利用され始めている Bayes流の方法について,シミュレーションによって各デザインが持 つ特性を整理するとともに,性質の比較検討を行った.その際には,患者数/第一種,第二種の過誤確率/ 奏効確率の設定値と真値とのズ、レに対する頑健性などを用いて評価した.さらに,シミュレーションで得られた 結果に対して主成分分析を実施し,各方法の系統的な分類を行った.その結果,平均的に必要な患者数の観 点からは, Bayes 法が他の方法と比較して必要な患者数を抑制できることが示唆された.その他,いくつかの 観点から 2段階デザインを系統的に分類し,利用する際の指針を考案した. キーワード:多段階デザイン,がんの臨床試験, Simon法 , F l e r n i n g法 , Gehan法 , Bayes法 l 緒言 新規抗がん剤の第 E相試験の目的は,ある特定のがん種に対する薬剤の抗腫療効果を代替的評価項目で探 索的に評価することにあり,奏効確率が汎用的に主要評価項目として用いられている.一般的に, 50名以下 の患者に対して臨床試験を実施し,できるだけ迅速に,薬剤J の有効性を確認する,若しくは無効な薬剤を除 外することも暗に目指している.第 E相試験では,通常,生存時間若しくは無増悪生存時間を評価項目とし たランダム化試験で実施され,薬剤の効果を確認するためには多くの患者が必要となり,コストも莫大なも のとなる.よって,第 E相試験は,第 E相試験に進むかどうか判断することが目的のーっとなるため,抗が ん剤の開発において重要な試験と考えることができる. 第 E相試験における患者数の決定方法について,中間解析を含む多段階デザインが多く提案されている. ‑ 7 5 ‑
最初に提案されたものは, Geh組 法 (Gehan,1 9 6 1 ) である. Gehan法は,薬剤が無効で、ある場合は第 l段階 で早期に中止し,第 2段階である精度のもと奏効確率を推定することを意図した方法である.また, Fleming ( 1 9 8 2 ) は,薬剤に明らかな有効性が見込まれる場合,若しくは明らかに無効でーあることが見込まれる場合 には,早期に試験を中止できる多段階の試験デザインを提案している.さらに,薬剤が無効であるという仮 説のもとで,平均患者数若しくは最大患者数を最小にすることにより, Fleming法を改良した 2段階デザイン が Simon ( 1 9 8 9 ) によって提案されている.他にも,上記の方法の亜種が多く提案されているが,実際に利 用されているのは,基本となる上記の方法の場合が多い.また,近年では, Bayes流の多段階デザインが提 l l釦 dSimon ( 1 9 9 4 ),H e i t j組 ( 1 9 9 7 ) など),実際に利用され始めている.これら 案されており(例えば,百 a の方法は,それぞれが中間解析時に判断する内容が異なり,必要患者数などの算出方法も多様に含んでいる ため,その性能については単純に比較を行うことが難しく,どの方法を利用すべきか悩むこととなる.本稿 では,シミュレーションを実施し,各多段階デザインの性能について検討する. 2 多段階デザイン 本節では本稿で取り扱う多段階デザインについて概説する.なお,各方法に共通な部分として,多段階デ ザイン,特に 2段階デザインの一般的手順について述べる. まず,評価項目である患者の反応は成功/失敗の 2値変数とする.例えば,成功とは RECIST基準でいう c o m p l e t er e s p o n s e(完全奏効)や p a r t i a lr e s p o n s e(部分奏効)以上の反応などと定義されることがある.なお, 本稿では, I 成功」とし、う意味で「奏効」としづ言葉を使用する.薬剤の有効性は,母集団における奏効確 O以下である場合,薬剤は無効であると判断し, 率pによって評価する.そして,真の奏効確率pがある値 P P l以上であれば,積極的に開発を進める価値があると判断する.ここで ,Poを闘値奏効確率 ,P lを期待奏効 確率と言う.第 E相試験において提案されている 2段階デザインの単純な例は,以下の通りである.第 l段 階で n l名の患者を集積し,観測された奏効数 X l名によって,試験の中止若しくは第 2段階への継続を判断す + X 2 ) る.また,第 2段階では,さらに n2名を集積し,そのうち X2名が奏効した場合に,累積奏効数 R2 (弓 1 名によって,意思決定を行う. 3段階以上の場合も同様で,第 k段階では,それまでに観測された累積奏効数んによって,試験の中止若 しくは継続を判断する.第 k段階において,んがある規定値(下限値 Gk) 未満であれば有効性が不十分であ l ると判断し,薬剤が有効であるとし、う仮説を棄却する.その際の第二種の過誤確率《は,真の奏効確率が P 以上である時に,薬剤が無効であると判断する確率として定義される.逆に,んがある規定値(上限値 rk ) より大きければ薬剤は有効であると判断し,薬剤が無効であるとし、う仮説を棄却する.その際の第一種の過 O以下である時に,薬剤が有効であるとし、う判断を行う確率 誤確率 αkは,第 k段階において真の奏効確率が P と定義される.んが下限値と上限値の間にある場合には,次の段階に継続する.なお,最終段階では,下限 値と上限値の聞が生じないように規定することで,判断を保留しない. 以下に,各試験デザインの詳細を示す.なお, ah rb んなどの表記について,最終段階(本稿では第 2 段階が最終となる)では添え字 kを省絡することとする. 2 . 1 Gehan法 Gehan法は薬効が全く期待できないような場合に早期中止を判断するための 2段階デザインである.真の l名集積し,帰無仮説 H o:p壬P lを対立仮説 Hl: P > P lに対して,有 奏効確率を pとすると,まず第 l段階で n 意水準 αで検定する.帰無仮説が採択された場合には,試験を中止し,また,帰無仮説が棄却された場合に ‑ 7 6・
は,試験を継続し,第 2段階において奏効確率を推定する.なお,第 2段階で必要な患者数は,第 I段階の データを基に算出される. Gehanのデザインでは試験計画時に,期待奏効確率 P1を任意に設定し,第 I段階で必要な患者数 n 1を推定 こ最小となるため ,B(O, n, P 1 )= する必要がある.患者数は, 1人も奏効しないときに帰無仮説を棄却する場合 i (I‑P1)"壬αを満たす最小の n ( B ( x ;n, p)は累積二項確率を示す) ,すなわち ,n>logαIlog( l‑P1)を満たす最 小の nで与えられる.第 2段階では,第 l段階で帰無仮説が棄却された時,さらに患者を追加してより安定 した奏効率を推定することを目的とする. Gehan ( 1 9 6 1 ) では, 75%信頼区間の上限値を戸とするとき ,p= 戸での標準誤差を E 以下とする基準に従い , m~p (l 一戸 ) II?‑nを満たす最ノトの m を,第 2段階で追加する 患者数 n2とすることが提案されている.本稿では ,t:=0. 10と設定する. なお,通常は Gehan法では,第 2段階では奏効確率の推定のみを実施し,仮説検定は行わない.しかし, 以下でシミュレーションを実施する際には,他の方法と比較するために,第 2段階において l段階デザイン と同じ仮説を用いて仮説検定を行っている(第一種の過誤確率の調整は行っていなしつ. 2 . 2 Fleming~去 薬剤が無効な場合及び有効な場合において,早期に中止を決定できる 2段階デザインである ( 3段階以上 にも拡張可能) .第 l段階では ,n 1名の患者に投与し,奏効した患者数 X 1が a 1以下のとき,試験を無効中止 1が r 1以上であれば試験を有効中止する .X 1が a 1より多く r 1に満たないときには,試験を続行する. する .X 第 2段階では,総奏効患者数 R が α以下の時に薬剤は無効であると判断し ,r以上であれば薬剤は有効な可 能性があると判断する.いずれでもない場合は判定保留となるが,通常は α+I=rとして判断保留がないよ うにする.なお, Fleming法では,総患者数及び各段階における患者数の比率に制約はない.しかし, Fleming ( 1 9 8 2 ) でも推奨されているように,本稿では,総患者数は通常の I段階デザインにおける患者数設定によ り算出し,各段階における患者数は等しく設定した. 2 . 3 Simon~去 薬剤が無効な場合のみ早期に中止する 2段階デザインである.第 l段階では,奏効した患者数 X 1が a 1以下 のとき,試験を無効中止し,それより多ければ試験を続行する.給、奏効患者数 R が α以下のとき,無効と判 断し,試験を終了する.そうでなければ,薬剤は有効である可能性は高いと判断する.なお, Simon法とし て,最適法とMinimax法の 2つが提案されている.最適法は,同じ薬剤について多くの試験を行った場合に, すべての試験にわたっての総患者数を考えたときに,薬剤が無効である試験に参加する総患者数を最小にす ることを意図したデザインである.また, Minimax法は,薬剤が無効である試験に参加する患者数の最大値 を最小にすることを意図したデザインとなっている. 2. 4 Bayes~去 Bayes流の方法では,奏効確率に対する事前情報を反映させた上で,事後分布若しくは予測分布に基づい て試験の中止/継続を判断する.真の奏効確率 pがベータ分布 Be(u, v )に従うと仮定し,奏効確率に対する事 前情報に基づいて,ベータ分布のパラメータ u,vを決定する.なお,本稿では,一様事前分布 (u= 1 ,v= 1 ), v=9) ,及び積極的事前分布 ( u= 5 ,v=5 ) の 3つの事前分布を想定した.次に患者 懐疑的事前分布 (u=l, 数を決定することになるが,一般的に, Bayes流の枠組みでは,試験開始前 l こ患者数を決定する必要はなく, 意思決定に十分な情報が得られたと判断した時点で試験を終了すればよい (Beπy,1 9 9 3 ) . しかし,実際的 ‑ 7 7 ‑
な理由からほとんどの試験では,試験開始前に最大患者数を決定する必要がある.そこで, Bayes流の枠組 みにおいていくつかの患者数設定方法が提案されているが,実用上は,事後分布の推定精度に基づく方法 ( T hal Ja ndSimon,1 9 9 4 ) ,及び事後分布に基づく方法(Wh i t e h e a de ta , . J2 0 0 8 ) が有用であろう.なお,本稿 では,後者の事後分布に基づく方法によって患者数を算出した.中止規則については,無効中止のみを考え た場合,事後分布に基づく方法及び予測分布に基づく方法がある.これらはそれぞれ,第 l段階での事後奏 効確率(若しくは予測奏効確率)が p oを超えない確率が大きい場合 τ ( より大きい場合)に「無効」として 試験を中止する.本稿では,予劃分布に基づく方法を選択し,関値 t を 0 . 9 0と設定した.また,第 2段階に おいて,事後奏効確率が P t以上となる確率が 0 . 5以上となる場合に,薬剤が有効であると判断した.なお, 明流のアプローチについては,手良向 ( 2 0 0 8 ) に詳しく記載されている. ここで述べた Ba) 3 シミュレーション 3 . 1 方法 がんの第 E相試験における 2段階デザインとして一般的な Gehan法 , Simonの最適法, SimonのMinimax 法 , Fleming法,及び Bayes流の方法について,シミュレーションを通して性能の比較を行った.なお,比較 を目的に, 1段階の方法も実施した.また,本シミュレーションでは,多段階デザインのうち 2段階の試験 デザインについてのみ検討した. o,期待奏効確 まず,各 2段階デザインにおける試験開始前の薬剤効果に対する見積り値(関値奏効確率 P 率P t ) に対応するパラメータ (n,r n, G1, G, r , } r ) を各 2段階デザインごとの理論式より算出した.実際の臨床 試験から得られる結果を想定し,見積り値 ( p o,p l ) の数パターンの組み合わせについて,真の奏効確率 P t のもとで仮想データを作成し,各 2段階デザインを適用した.なお,シミュレーションでは ,P tは 0 . 0 5の刻 . 1 0から 0 . 5 0の範囲とし ,P tとp oについては,その差として 0 . 1 5,0 . 2 0,0 . 2 5の 3パターンを想定し, み幅で 0 p oの値を 0 . 0 5の刻み幅で 0 . 1 0から 0 . 2 5までの範囲とし(つまり ,P tについては, 0 . 2 5から 0 . 5 0までの範囲 となる),合計 1 0 8個の組み合わせを考えた. 1つの見積り値の組み合わせごとに各 2段階デザインを 10000 回繰り返した.シミュレーションの結果について,①薬剤j が無効であるとしづ帰無仮説を棄却した割合,② 1試験あたりに必要だ、った患者数の平均値),及び③第 l段階で早期中止した割合を性能評価の 平均患者数 ( ための指標として算出した. また,シミュレーションの結果より,各方法の特徴,性能を客観的な判断基準により系統的に分類するた 0 8 め,主成分分析を用いた.解析では,上述の 3つの指標それぞれについて,各 2段階デザインに対して 1 個の変数を持つデータを想定し,予備的な吟味を目的に主成分分析を行い,各 2段階デザインの特徴を考察 した.主成分分析の結果, 2段階デザインごとに主成分得点が得られる.主成分得点は各変数(組み合わせ ごとの評価指標)の重み付き合計であり,重み(因子負荷量)の値を参照し,各主成分の意味を考察した. その後,各主成分の値をもとに,各 2段階デザインの特徴を考察した.なお,その際には,主成分の累積寄 与率を確認した上で,第 l主成分,第 2主成分を用いて考察した. なお,シミュレーションは SAS ( v e r s i o n9 .1.3)を用いて行い,その際に,各見積もり値に対応するパラメ ータを各 2段階デザインについて算出する SASマクロを作成した.さらに,主成分分析を用いた解析も, SAS の P町 NCOMPプ口、ンジャを利用した. ‑ 7 8・
3
.
2 結果
紙面の都合から, 3つの指標のすべての数値結果を示すことはできない.代表的な事例として, 3つの指標
それぞれの結果を,関{直奏効確率 (
Po
)が0
.
1
0の場合について以下に示す.
薬剤が無効であるとし、う帰無仮説を棄却した割合について,関値奏効確率 p
oが 0
.
1
0の場合,つまり ,(
p
o
,
Pl)=(0.10,
0
.
2
5
),
(
0
.
1
0,
0
.
3
0
),
(
0
.
1
0,0
.
3
5
)の結果を国 Tに示す.
吐;
:
0
1
0,
:
1=
030
、,
.
'
ご
0
=0;
0
.r=
0
ー
‑‑SinE!:
.
.
tC
C
'
i
J
ご
一一‑['., :
;
.
e:
,,(一恥
‑
・4炉・"円。 mlJ'1E
0000000OGOO
DOD00000OD
国『ー-~3d'Jn
DS‑R76540こ
‑
j
漏
ιm
僻 刷 諸 d罰則昭和
ch
凶 陸 巾 ヱ﹂一例岡山沼山巴彬聖
同皆同﹃
∞見白河田辺刊一
fCC00000口
I -"---Sirr.,),, ~1 r
川町"
0
一一一‑Si:'T).̲
'
n
OC".
‑ーーー・引.
.
.
‑
.
.
;
.
n1
l
.
'
i
"
.
mる喧
ーーーー‑ G,
,
;
,
a
.n
i
f
l
,
"l
e
Sk
>
,
;
ぞ
ーーー司 $
一一ー‑
f
.
.
.
..
,
.
.
,
.
6
.(‑H)
-・.・・円。 mln~
~e.".,, (l害時的}
予 ー E耐 過 6(1事府がJ
)
010
ー か‑
f""YI"s(時極的)
10
一→一 E師団 (l=î~O~Ìl
O
;
:
X
J
010 Olt Q
:
?
O O~~~
010 0
1
'
: 020 025 日30 03
:5 040 O
.
i
5 050
臼 30
O~~~!
040 Q
4
!
) 058
'
.
'
、
p
M
向τ
0;0.司
:
1=
035
100
090
ー一一一円 m(,
"
'
)
(
lr
,
t
H OoO
言
。7
‑‑‑‑.5;内no
,,1
.
!,
.
,i
maぜ
司
/
;
,
,
.
,
;
n
ーーーー‑
(
̲
l
令 口 5白
日
民
ーーーーさ ìn f' ~Sτas.,.
O~O
一
‑e
..‑l;吋{寄〉
、υ
ョ
040
・
ー
~ 0羽
~
‑F:".!IT
"
,
I
'
I
ど
02
日,
き"檀挺j'
J
)
一 唱‑ e d y
c
ー弓-ß....> ,::;(fAI !ii ~j
口1
0
o
コ
.
c
010 015 日:
:
0 a;~5 030 O~5 O‑
K
J 0.
:
1
, C50
r
む
国 T 闇値奏効確率 (Po) が 0.10の場合の帰無仮説を棄却する割合
t
"
),Minimax法(図中の"SimonMini
m
a
x
"
),F
l
e
m
i
n
g法(図中の"
F
l
e
m
i
n
g
"
)
Simonの最適法(図中の"SimonOp
は同様の挙動を示すことが分かる.一様事前分布を仮定した B
a
y
e
s流の方法(図中の"Bayes (一様) ,
,
)
は
,
l段階デザイン(図中の"
S
i
n
g
l
e
S
t
a
g
e
"
) と同様の棄却割合を示している.また,懐疑的事前分布及び積極的事
前分布を用いた B
a
)
明流の方法(それぞ、れ図中の"
B
a
y
e
s (懐疑的) " "
B
a
y
e
s (積極的) ,,)について,後者の
方法はすべての方法の中でも最も棄却する割合が高く,前者の方法は全体的に棄却する割合が低く,特に Pl
の{直に依存して棄却割合が変動していた.
次に,平均患者数について,闇値奏効確率 p
oが 0
.
1
0の場合 ,(
p
o
,
P
l
)= (
0
.
1
0,
0
.
2
5
),(
0
.
1
0,0
.
3
0
),
(
0
.
1
0,0
.
35
)
の結果を図 2に示す.
‑
7
9
‑
p
c
"
:
:
O1
0
.
D
唱えお
:
‑
,
j
'
‑0
1
0
.
,
:
:=030
,
;
0
50
.
1
5
4
5
ー一一‑Si
l
'
l
"
Q
州0"
o 40
ー ----Sir.~η~.もr.I"Tlil ‘
35
1
一 ‑ G .h制
占O
‑
司
ー
・
・ S,
m
、.
町.
!
r
r
,
imヨ
×
ho I
:
'
:
5
ー
‑-Si~~".S'."四
e~O
一ー-Edyo!'J; I:-~D
凶
ー‑ S
,
m句
、
:
・
日
840
い己云云云三̲̲̲.==‑=
ー
‑
・
‑
F
l
.
,
.m刷 S
<
l
: 1
5 ト
き 10 I
ー‑e‑c
""..l円以保持 8
:
u
』
一 ー
‑‑i:r‑&ye
叫I
I
I
凶う}
j
1
D
010015 020025 030 035 0
4
:
)0
:
'
5 050
一‑G...ha.n
ーーー‑S'.
.
.
1
,.Stol.l!e
f
1
‑ー一白,,"Sくー弓〉
.
c
‑ー・‑Fl舎川咽
~←-[h)'・'"S{ 惜疑日'1)
L
-一白 ~õqltØ'j)
r
‑
010 01j 020 020 030 0
.
3
50
'
1
00
.
1
5 OÓ~
p
t
pt
向;
‑
:
0
1
0
.1
=
"
,
亡 035
50 r一一一一一一一一一一一一一一
'
1
5
ー
ー
ー‑Sirn肝 心 同
‑
‑
‑
‑
‑
S
i
m
o
t
J
.
!
i
n
i
mi!l.
田 主5
3
3
0
ーーーー・Geh.Jt1
一 -S i t1 s叫 1...~
こ
!o ~ ̲ ̲ ̲ ̲
一二二
「
圃
幽
・‑F..
g
キI""l
l
'
~'5 t~--=--...:... -ー~~一
三 10 f.~
一ー‑E'I.lY軒《ー慢j
‑ ー ー ー ー ー ♀
.
.
.
.
.
.
.
f
!
‑
‑
!
:
.
:
I
舟(
!
宮
崎5
可j
,
:
j
同s
(
H
i盛S")
ー せ‑ f
010 015 020 025 :
'
)
;
30 035 040 045 0ち
司
'
p
国 2 闇値奏効確率 (po) が 0
.
1
0の場合の平均患者数
Fleming法及び Gehan法では,真の奏効確率 P
rが増加するにつれてある最大値をとった後は減少する傾向
があった.一方それ以外の方法については ,P
rが増加するにつれてある最大値に達した後は,定常値となる
傾向があった.また, Simonの最適法及び Minimax法が平均的に多くの患者数が必要となることがわかる.
rが高くなるにつれて,平均患者数が増加している.また,いずれの場合でも, 3つの Bayes法及び
特に ,P
Fleming法では
1段階デザインよりも平均患者数は少なかった.
第 l段階で早期に中止した割合について ,(
P
.
oP
l
)
=
(
O.
10,0
.
2
5
),(
0
.
1
0,0
.
3
0
),(
0
.
1
0,0
.
3
5
)の結果を国 3に示す.
80・
ー
:
:
'
(
r
‑
‑
o1
0,
.
:=
025
[
¥
:
r
=
O・
C
.,
p=
o三日
∞ ー一一一一一一一一一一
い
ー-(;';'ha~
ー
‑‑ S ;::le,Sta?
L
f
1
号
一
ー
ー‑Eo押.(‑IJ)
ー
‑
・
同
・ Fl.,.,fUrS
一吾一白戸 S、惇P
割方 l
ーせ「ー E.押 6:r~t~ [I'lì
一一一一一一一
一-S" I!~f
一一・ 3mc.刷 同 町 出
ーーーー-G~h.", .
!‑ -S'n~I-::St;,.l!'('
一
ー
ー‑ 6,
円
,
: ''J)
! ‑+‑F!iom,
n
:
z
一 ー ‑f1", ye:<;~ 煙 t~R~)
コ
m2AZEU4vvc‑HUω1‑F5PSρa
﹄
‑
o
a
pQ
n
A
ω
w
o
p
‑
nv
Mω‑04JM勺a
ODDGOODC
8765432
・ D
EEDDODOD
じ
り凶行ザ的
ー一一-'_:;'f!\'~I')J:
ー・ーー -S ,/)1(~fII.~川HlðX
330U3933
U67C54321
0ucooocco
1(0 r一一一一一一一一一一
︒
1
090
i
ー『トー ß,,~..~(f a tE的;
0
0
:
;
0:0 8
1'
:
1 020 025 O
:
J
u o:~:' 040 0
4
:
) 050
010 C1~ 0.
20 0
:
:
:
50
:
3'
J 0
35 040 C ,l~ 050
pt
正1・
n
y
:01O.p , ~0::')
旬︑
000000D
E76542210
22E22:toc
ー‑ 5 i
守'),¥
0目
‑
・
・
・
・
ヨ
, mコn
'
‑
!,
r
,
imnバ
ー
ー
ー‑Gch
曲門
ー
‑‑
Slll p. k,S! ,H~Q
一ー‑Eo世,(一世;
一
・
ー
同er n.
s
;
l
1
t
一ー-E.;;V'ë'~.(惇 r'1:~~;)
~F.向日 l 布 IE !t-))
の
伺 uou υて日ピanh
222Eご
中旬
︒
1口
:
;
9
0
010 口1
5 O~O 0
2
!
:
. 030 035 040 045 050
ι
t
図 3 闇値奏効率 (Po) が 0.10の場合の第 1段階で早期中止した割合
p
oとP
Iの差が小さく,かつあが小さい場合に,懐疑的事前分布による Ba)
制法が最も早期に中止する害J
I
合
oとP
Iの差が大きい場合には ,P
tが増加するにつれて逆に早期中止割合が高
が高いことがわかる.さらに ,p
tが p
oとP
lの聞に含まれない場合には,早期中止の割合が高くなっている
くなった.また, Fleming法は ,P
去は,真の奏効確率が小さい場合であっても早期
ことが示唆されている.なお,一様事前分布による Bayest
中止割合が低かった.
以上は,闇値奏効確率が 0.10の場合についての結果である.次に,それ以外のシミュレーション条件の場
合 (
0
.
1
5,
0
.
2
0,
0
.
2
5
) も含めて,各 2段階デザインの系統的な解釈を行うため,各指標ごとに全ての試験結果
を利用して主成分分析を利用した.その結果を以下に示す.
o,P
lの各組み合わせについての薬剤が無効であるとし、う帰無仮説を棄却する割合を変数とみなし
まず,p
て行った結果を以下に示す.
表 1 主成分の寄与率(帰無仮説を棄却する割合)
震1
主liI分第2主 成 分 第 3
主 成 分 第4
主 成 分 第5主 成 分 第6
主 成 分 第7主 成 分 第8主 成 分
0
.
0
0
6
0
.
2
0
7
0
.
0
5
5
0
.
0
2
9
0
.
0
0
2
0
.
7
0
0
O
. 0
0
.
0
0
.
9
0
8
0
.
9
9
8
0
.
7
0
0
0
.
9
6
2
0
.
9
9
1
1
.0
1 o
1
.0
∞
‑
8
1・
∞
∞
∞
∞
︒ XGehan d ) ( S l n 草l e S t , ' g e 。 20 っ ! l ・ ! lay 円(一線) . . 司 l ' 1日 ... ~n主成分 PtB~y('~ (懐疑的) , i‑Bay. (積極的) 1111155533353322225333 .Fl.uung ‑R3 UF3 HU3 E‑3 vRU HUE ‑v RUFHUFHUFHUFHUFHUFHUFhu ‑ 4F 4 4 2 2・nu 3. 3. 3 己 ・・ 3 ・4 ・・・・4444444 .3 . u E‑ ‑. nu nn u・ n unu un nu nU nu nu n. u u nunun nn u u nununununU 園日 uwmMIHU I l 日X ー 品 巴.巴・.・.・.・.・ J J a a a a J n u 0 . a EU0.nuO.O. J n ununununununun unU +Smwn(}pl ‑bi‑‑ 令制岨州間同町 十 10 araraB3F司 ︑ ︐ EEUB3EUB3raEUEUraraE0 122F421.2・1 1 J 3 1 J 3 J I ‑ ‑ 3 1 1 1 3 ・ 比 一 1‑00.nu00.OGOo‑OUGOo‑OGao‑U00.a lj 0 . 1 1 2 0 . 1 1 6 0 . 1 1 4 0 . 1 1 1 0 . 1 6 5 0 . 1 1 1 0 . 1 7 5 0 . 1 6 7 0 . 1 1 5 0 . 1 1 4 0 . 1 7 1 0 . 1 1 3 0 . 1 1 2 0 . 1 7 7 0 . 1 7 6 0 . 1 7 0 0 . 1 1 4 0 . 1 6 7 0 . 1 7 7 0 . 1 7 2 0 . 1 1 0 国 4 主成分得点による各デザインの布置と因子負荷量(各成分で絶対値がよ位 10% の組み合わせ) (帰無恒説を棄却する割合) 表 1において,累積寄与率が第 2主成分までで 90%を超えている.各 2段階デザインの第 l主成分得点と 第 2主成分得点のプロットが図 4であり,また,その右に示しているのが各主成分でその絶対値が上位 10% の組み合わせについての因子負荷量である.第 l主成分については,因子負荷量の符号がすべて正であるた め,棄却する割合が高い程,主成分得点は高くなる.また,特に ,p, が Plと同程度の場合に因子負荷量の絶 が Poよりも小さい場合に,因子負荷量の符号が正で絶 対値が大きかった.第 2主成分については,逆に ,P, 対値が大きいため,棄却割合が高い程,主成分得点は大きくなる.国 4より,積極的事前分布による Bayes 法 , S i r n o nの最適法, Min i r n a x法 , Fleming法の1 ) 慎に高く,一様事前分布による Bayes法,及び Gehan~去は l 段階デザインと同程度であった.特に,積極的事前分布による Bayes法は第 I主成分及び第 2主成分ともに 他の方法よりも高かった.また,懐疑的事前分布による Bayes法は,第 l主成分得点が相対的にどの方法よ りも低かった. o,P lの各組み合わせについての平均患者数を変数とみなして行った結果を以下に示す. 次に ,p 表 2主成分の寄与率(平均患者数) 第1 主 成 分 第2主 成 分 第3 主 成 分 第4主 成 分 第5主 成 分 第6主 成 分 第7主 成 分 第8主 成 分 0 . 7 3 1 0 . 7 3 1 0 . 1 3 4 0.0ω0.016 0.865ω63 0 . 9 7 8 ‑ 8 2・ 0 . 0 1 2 0 . 9 9 1 0 . 0 0 8 0 . 9 9 8 ∞ ∞ O . 2 0 . 0 1 加。1. 0 ∞
り&
富
j
:
:
;
'
.
t
一
ー
・0
,
.
.
。
1
)
.
AFlt"lllin~
XGc
h
i
:
m
話
量
tBay
円(懐疑的)
"q
0
.
1
1
0
0
.
1
1
1
0
.
1
0
9
0
.
1
6
4
0
.
1
7
4
0
.
1
7
9
せ
品ロ
わ
M
・
分
成
各
︾
﹄
量数
荷者
負患
子均
因伊
置
布
イ
の
ン
47
ザ
各
点
得
分
成
主
Rd
囲
る
よ
副主成分
内 ‑
d d
E
﹄‑
F
内
‑Baye< O
l
t領的、
、
唱
P
0
.
1
5
9
0
.
1
6
2
0
.
1
6
4
0
.
1
6
4
0
.
1
6
5
山川引引一
.B.Jve
‑
:
; (一線)
0
.
1
0
8
0
.
1
1
1
0
.
1
1
0
0
.
1
0
8
9988‑ ゆ
OOGnu‑M陪
.
n
Illili‑‑dhu
J
:Singl~Stage
RURURUFO‑4
凋﹃凋﹃凋﹃必﹃‑・宵
OGoo‑ 制
.~
円
.Slluunupt
園日 l
l
l
l
o
n
!
¥
h
r
u
m
a
.
.
.
x
十 ト十
~:
円
‑
立
URURURURununununununununuRURURURURununu
‑4u
‑
H
n
uU
o
‑
+
1 U U141414141ntntntntntntntntntntntntnt
一0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 O G o o ‑ 矧
一却回初日却回初犯話相羽田部叩話相羽田部判的特一地
t
・
000000000000000000OGoo‑
4
p
1
0
.
3
5
0
.
3
5
0
.
3
5
0
.
3
5
0
.
3
5
0
.
3
5
0
.
3
5
0
.
3
5
0
.
3
5
0
.
3
5
0
.
3
5
0
.
3
5
40
0.
40
0.
40
0.
40
0.
40
0.
0.
40
表 2において,累積寄与率が第 2主成分までで 86%を占めている.第 l主成分得点と第 2主成分得点、のプ
ロットが図 5であり,その右に因子負荷量の各主成分における絶対値が上位 10%のものを示している.第 l
主成分はすべての因子負荷量の符号が正であり,平均患者数が多い程,主成分得点は大きくなる.また ,p,
がP
Iよりも大きな場合に,因子負荷量の絶対値は大きかった.第 2主成分については ,p
oとP
Iの差が小さい
oとP
Iの差が大きい場合に因子負荷量の符
場合に,因子負荷量の符号は正で,絶対値が大きかった.逆に ,p
号は負で絶対値が大きかった.国 5より,第 l主成分については, S
i
r
n
o
nの最適法, M
i
n
i
r
n
a
x法以外の方法
では, 1段階デザインよりも値が高かった.また,第 2主成分については
Gehan法が他の方法と比べて値
が低かった.
最後に ,p
o,P
Iの各組み合わせについての第 l段階で早期中止した割合を変数とみなして行った結果を以
下に示す.
表 3 主成分の寄与率(早期中止劃合)
│
第 1主 成 分 第2主 成 分 第3主 成 分 第4主 成 分 第5主 成 分 第 6主 成 分 第 7主 成 分 第8主成分
0
.
6
5
2
0
.
6
5
沼
0
.
1
7
5
0
.
哩
.
87
0
.
1
3
0
0
.
9
5
7
0
.
0
2
4
0
.
9.
81
‑
8
3・
0
.
0
1
3
0
.
9
9
4
0
β
0
4
0
.
9
9
7
∞
.
03
.
1
∞o
O
.
∞o
∞
.
1o
8 i (• • + S i l l l o n O p t .SimonMi 凹1U . a . ' X 4‑ • 宮 4 之 . & F l e m i n g ' 。「ーー 月 ー 。 5 XGeha I l : l :S m g l e S t a g e ぷζ 総 1 5 ‑10 : 1 : . , 1 10 1 5 -弘、y~,; (一様〉 + B a y e s(懐疑的 j a + ‑ B a y e s (積極的〕 前主成分 p t p l I 第1 主 成 分 第2 主成分 P O 0 . 2 5 0 . 1 0 0 . 2 5 0 . 2 5 0 . 1 5 0 . 3 0 0 . 1 5 0 . 1 5 0 . 3 5 0 . 2 0 0 . 1 5 0 . 3 5 0 . 1 0 0 . 1 5 0 . 4 0 0 . 1 8 2 0 . 1 5 0 . 1 5 0 . 4 0 0 . 1 8 2 0 . 2 0 0 . 1 5 0 . 4 0 0 . 1 6 6 0 . 3 0 0 . 1 5 0 . 4 0 0 . 1 1 3 0 . 3 5 0 . 1 5 0 . 4 0 0 . 1 1 3 0 . 3 0 0 . 2 0 0 . 3 5 0 . 1 1 3 0 . 3 5 0 . 2 0 0 . 3 5 0 . 1 1 3 0 . 1 0 0 . 2 0 0 . 4 5 0 . 1 7 7 0 . 1 5 0 . 2 0 0 . 4 5 0 . 1 7 0 0 . 2 0 0 . 2 0 0 . 4 5 0 . 1 5 9 0 . 4 0 0 . 2 0 0 . 4 5 0 . 1 1 2 0 . 1 0 0 . 2 5 0 0 . 1 5 7 . 4 5 0 . 1 0 0 . 3 0 0 . 4 5 0 . 1 7 9 0 . 1 5 0 . 3 0 0 . 4 5 0 . 1 7 6 0 . 2 0 0 . 3 0 0 . 4 5 0 . 1 6 9 . 3 0 0 0 . 2 5 0 . 4 5 0 . 1 5 6 0 . 4 0 0 . 3 0 0 . 4 5 0 . 1 1 5 . 3 0 0 0 . 4 5 0 . 4 5 0 . 1 1 5 図 6 主成分得点による各デザインの布置と因子負荷量(各成分で絶対値が上位 10%の組み合わせ) (早期中止劃合) 表 3において,累積寄与率が第 2主成分までで 82%を超えている.第 l主成分得点と第 2主成分得点のプ ロットが図 6であり,その右に,因子負荷量の各主成分における絶対値が上位 10%のものを示している.第 l主成分は,すべての因子負荷量の符号が正であるため,早期中止割合が高い程,主成分得点は大きくなる. tが P lよりも低い場合に,因子負荷量の絶対値が大きかった.第 2主成分については ,P tが P lよりも 特に ,P 大きい場合には因子負荷量の符号が負で絶対値が大きく ,P tが poよりも小さい場合には因子負荷量の符号が 正で絶対値が大きかった.国 6より,第 l主成分については,懐疑的事前分布による Ba) 閣法, Fleming法 , Simonの最適法, Minimax法,一様事前分布による Bayes法 , Gehan法の順に値が大きく,積極的事前分布に よる Bayes法は, 1段階デザインと同程度に値が小さかった.また,第 2主成分については,懐疑的事前分 布による Bayes法が最も値が低く, Simonの最適法, Minimax法,一様事前分布による Bayes法の順に値が高 かった. 3 . 3 考察 主成分分析の結果及び個々の詳細なデータから,各指標における各 2段階デザインの特徴について考察し た. まず,帰無仮説を棄却する割合は,主成分分析の結果について,累積寄与率が第 2主成分までで 90%であ り,データのばらつきが第 1,2主成分によってほぼ説明されることがわかる.主成分得点から, Simonの最 適法, Minimax~去, Fleming法の特徴は類似しており,積極的事前分布による Ba) 唱法よりは低いが全体的に tとP lが同程度の場合,つまり,薬剤の効果が想定通りであっ 帰無仮説を棄却する割合が高かった.特に ,P た場合に,検出力が高い方法であると解釈できる.一様事前分布による Bayes法は,これら 3つの方法と比 較すると少し検出力が低いと解釈できる.また,積極的事前分布による Ba) 閣法は,第 l主成分得点だけで ‑ 8 4・
なく,第 2主成分得点もすべての方法の中で最も大きいことから,薬剤の効果が想定よりも低い場合であっ ても,他の方法と比して有効であると判断しやすいと解釈できる.ただし,薬剤J が実際には無効である場合 にも有効と判断してしまう可能性がある.また,懐疑的事前分布による Bayes法では,全体的に帰無仮説を 棄却する割合が低く,薬剤の効果が大きい場合にも,無効であると判断してしまいやすいと考えられる.な お , Gehan法は一様事前分布による Bayes法と同程度の棄却割合であったが,実際は,第 2段階において仮 説検定を行わないため,単純には比較できない.以上より,帰無仮説の棄却しやすさ,特に,薬剤が有効で ある場合の検出力の観点からは, Simonの 2つの方法,及び Fleming法を使用することにより,高い検出力 が見込めると考えられる. 次に平均患者数は,主成分分析における累積寄与率が第 2主成分までで 86%を超えているため,第 2主成 分までを用いて結果を解釈した.第 l主成分得点から,懐疑的事前分布による Bayes法,積極的事前分布に よる Bayes法,一様事前分布による Bayes法の順に平均的に患者数が少ない方法と考えられ,その後, Gehan 法 Fleming法と続く. Simonの最適法, Minimax法は第 I主成分得点が l段階デザインと同程度 l こ小さいた め,平均的に l段階デザインと同程度の必要患者数が必要であると考えられる.また Gehan法の第 2主成 分得点が他の 2段階デザインと比較して値が小さいことから ,PoとPIの差が小さい場合には平均的に必要な 患者数は少なく,逆に差が大きい場合には平均的に必要な患者数は多いとし、う特徴を持っと解釈できる.な お,懐疑的事前分布による Bayes法の平均患者数が少ない理由としては,奏効確率が低いとし、う事前情報の 影響を受け,早期中止の割合が高いことが考えられる.また,積極的事前分布による Bayes法では,早期中 止の割合は高くないが,事前の設定値(集積すべき患者数)が少ないため,平均的に必要な患者数も少なく てよい結果が得られていると推察される.以上より,事前情報の程度に関わらず, Bayes法を利用すること で,必要患者数が少なくなる可能性がある.特に,高い奏効確率が期待される場合には, Bayes法ではより 患者数が少なくなることが見込まれる. 最後に,早期に中止する割合は,まず,主成分分析における累積寄与率が第 2主成分までで 82%を超えて いるため,第 2主成分まででデータのばらつきは十分に説明されると考える.第 I主成分得点から,懐疑的 , 事前分布による Bayes法及び Fleming法が最も早期中止割合が高く,その後, Simonの最適法, Minimax法 一様事前分布による Bayes法,及び Gehan法の順に,早期中止割合が高いと考えられる.また,第 2主成分 得点から, Simonの最適法及び Minimax法は,奏効確率が無効である場合には早期に中止しやすいことがわ かる.さらに,懐疑的事前分布による Bayes法が他のデザインと比べて ,p, が大きい場合でも早期に中止し やすいことがわかる.これは,図 3において ,POと P Iの差が大きい場合に ,p, に対する傾向が異なることに も見て取れる.また,懐疑的事前分布による Bayes法については,上述のように,事前情報の影響を受け, p, が想定よりも高い場合で、あっても,帰無仮説を棄却する割合が低いことと関連していると考えられる.つ まり,実際には奏効確率が十分高い場合で、あっても,早期に無効中止してしまう可能性がある. Fleming法に ついては,特に , P, が想定よりも高い場合には有効中止による早期中止が,想定よりも低い場合には無効中 止による早期中止割合が高いため,全体の早期中止割合が高いと考えられる.なお,薬剤が無効である場合 に早期に中止することを目的としている Gehan法では,全体的に早期中止割合が高くなかった.以上より, 特に,有効中止についても考慮するのであれば, Fleming法が早期に中止しやすく,平均患者数も少ないため, 試験期間も短縮できる可能性がある.有効中止を考慮、しない場合,懐疑的事前分布による Bayes法の次に早 期中止割合が高いのは Simonの最適法であるが,薬剤が少しでも有効である場合には,必要な患者数が多く, 第 I段階で必要な患者数も多いため,試験期間の短縮はあまり見込めなし、かもしれない.一方, Bayes法は 事前情報の設定により多様な挙動を示すが,条件によっては早期に中止しやすく,さらに平均的に必要な患 ‑ 8 5 ‑
者数が少ないという特徴を持っている.よって,無効中止のみを考える場合には, Bayes法の利用により, 他の方法よりも試験期間の短縮が見込める可能性がある. 4 結論 本稿では,実際に臨床試験を実施する際のいくつかの状況を想定し,シミュレーションを実施することで 得られた 3つの指標(帰無仮説を棄却する割合,平均恵者数,早期中止割合)それぞれに対して,探索的に 主成分分析を利用し,客観的な指標により系統的に各 2段階デザインの特徴を整理した.その結果,利用す る際の指針として, 3つの指標それぞれの観点から,以下の事項が示唆された. ・ 薬剤の有効性が高く見込める場合,無効中止のみを考慮するのであれば Simonの 2つの方法を,有効中 ・ ・ 止も含めるのであれば Fleming法を利用することで,高い検出力が見込める可能性がある. できるだけ少ない患者数で試験を実施したい場合, Bayes法を利用することで,患者数の抑制が期待で きる. 薬剤が無効若しくは有効である場合に試験を早期に中止することを企図するのであれば, Fleming法を利 用することで,試験期間を短縮できる可能性がある.また,無効中止のみを考える場合には, Bayes法 を利用することで,早期中止とそれに伴う試験期間の短縮が見込めることが示唆された. また,本稿では 3つの異なる事前分布による Bayes法を含めて検討した.帰無仮説の棄却しやすさ及び早 期中止の割合は,事前情報に依存して大きく結果が異なっていたが, 3つの場合に共通して必要な患者数が 少なかった.また, Ba) 制法は事前情報以外にも,中止基準や第 2段階の判断基準等を変化させることで, 多様なプロファイルを示すと考えられるため,本稿で、行ったことに類したシミュレーションを実施し,その 性能を事前に確認しておく必要がある.さらに,実際の臨床試験において 2段階デザインを計画する際には, 今回考慮、した指標以外にも,実際の患者の集積スピード等の実施面からの条件も考慮すべきであろう. 5 参考文献 B e r r y , D.A .( 19 9 3 ) .A c a s ef o rB a y e s i a n i s mi nc l i n i c a lt r i a l s .S t a t i s t i c si n}.会d i c i n e1 2,1 3 7 7 ‑ 1 3 9 3 . Fleming , T .( 19 8 2 ) .One ‑ s a r n p l em u l t i p l et e s t i n gp r o c e d u r ef o rp h a s e1 1c l i n i c a l甘i a l s .B i o m e t r i c s38,1 4 3 ‑ 1 51 . H e i りan, D.F .( 19 9 7 ) .B a y e s i a ni n t e r i ma n a l y s i so f p h a s e1 1c a n c e rc l i n i c a l甘i a l s .S t a t i s t i c si nM e d i c i n e1 6, 1 7 9 1 ‑ 1 8 0 2 . E .( 1 9 6 1 ) .百l ed e t e r m i n a t i o no f t h enumbero f p a t i e n t sr e q u i r e di nap r e l i m i n紅 yandaf o l l o w ‑ u pt r i a lo fanew Gehan, . tJ o u r n a l01C h r o n i cD i s e a s e s1 3, 3 4 6 ・3 5 3 . c h e m o t h e r a p e u t i ca g e n Simon, R .( 19 8 9 ) .O p t i m a lt w o ‑ s t a g ed e s i g n sf o rp h a s eI Ic l i n i c a l仕i a l s .C o n t r ol / edC l i n i c a lT r i a l s1 0, 1 ‑ 1 0 . 手良向聡 ( 2 0 0 8 ) . 二値エンドポイントの単群臨床試験におけるベイズ流デザイン.計量生物学 29,1 1 1 ‑ 1 2 4 . 百l a l l, P .F .andSimon, R .( 1 9 9 4 ) .A B a y e s i a na p p r o a c ht oe s t a b l i s h i n gs a m p l es i z eandm o n i t o r i n gc r i t e r i af o rp h a s e1 1 a l s .C o n t r ol / edC l i n i c a lT r i a l s1 5, 463‑ 481 . c l i n i c a l甘i Whi t e h e a d,J .,V a l d e s ‑ M a r q u e z, E . ,J o h n s o n,P .a n dG r a h a r n,G .( 2 0 0 8 ) .B a y e s i a ns a r n p l es i z ef o re x p l o r a t o r yc l i n i c a l , 甘a i a l si n c o r p o r a t i n gh i s t o r i c a ld a t a .S t a t i s t i c si nM e d i c i n e272307 ・ 2 3 2 7 . ‑ 8 6・
可 D 非劣性試験の症例数設計方法の紹介 ー生存時間データの場合ー 張方紅・寺尾工 グラクソ スミスクライン(株)バイオメデイカルデータサイエンス部 E Ani n t r o d u c t i o nt osamples i z ee s t i m a t i o nf o r n o n ‑ i n f e r i o r i t yt r i a lw i t ht i m et oeventdata FanghongZhangandTakumiTerao GlaxoSmithKlineK . K . 8iomedicalDataSciencesDepartment, 7 ' J H 1 . 7 1 f ' J … 加 : 二 D SAS. : : 1 ‑ " 1 ‑ & . 要旨: 生存時間を評価項目とする非劣性臨床試験における症例数設 計方法を紹介する.優越性試験で用いられている 2つの方法, ハザード比に基づ、く方法とハザード差に基づく方法を非劣性試験 に適用できることを説明し,使い勝手と導出方法から 2つの方法 は当日報告する. を比較,考察する.数値伊l キーワード:症例数設計,生存時間,非劣性 ‑87・
|凱~付金問… 背景:非劣性試験での報告が少ない 生存時間解析における症例数設計 ・優越性: ー浜田・藤井 ( 2 0 0 3 ) ‑浜田・安藤 ( 2 0 0 5 ) ‑中西・五条・菅波 ( 2 0 0 6 ) ー水津・浜田 ( 2 0 0 8 ) ‑非劣性: ー浜田・藤井 ( 2 0 0 3 ),76‑78枚目 |会………~[1 背景:なぜ少ないか? 以下の点について調べた ・非劣性と優越性の関係 .非劣性の特徴 ・考察 .課題 ‑ 8 8・
! ぶ . 付 金 a i i l s . 1 . l ! P . . : l 1 . i I 1 l ・ ‑ … ~ 非劣性と優越性 ( 1 / 2 ) .両群で必要なイベント数 優越性( S c h o e n f e l d ) 非劣性( S c h o e n f e l d ) FF一院 +一十 ZP一旬 一 円 uq 何 一 の f7 一O 一 〆 ︐ . ︑ C o l l e t t e . ta. l(1994),p.255 浜田・藤井 (2003), 5枚目 4 l ( og( θ ) y 化配制v D D ‑ 4 ( z α +zpy ADDPLAN@ 5p.538 0 :両群での必要なイベント数, Z :標準正規分布の上側パーセント点, θ :ハザード 比 (Hazardr a t i o ),1 50 非劣性マージン( n o n ‑ i n f e r i o r i t ymargin) I 総 ‑ 隙 … … … t2818I 非劣性と優越性 ( 2 / 2 ) ‑非劣性を優越性に変換 。 = =8 8 1X 、 一 1 D一 =4 ( Zα +Zβy 一 1 ( 09( θ ) y ‑89‑
I
D
鍋 日 嚇 一 … …
非劣性:対照薬と比較
人一人
一
一
σ
A
‑実対照薬と比較
T
:治験薬 vsC:対照薬
.治験薬の対照薬に対する非劣性
.J¥:ハザード関数
ハザード比
・ <1は治験薬が対照薬より優れると表す
•e
:
e
[や隣町円)Dl'-&'}I},_~:d:"' ' 'J
非劣性:対照薬の効果
︒
︒
‑対照薬の効果 C
a
c
t
i
v
ec
o
n
t
r
o
le
f
f
e
c
t
)
一
一
λc一
λP
C
:対照薬 vsP
:プラセボ Cplacebo)
• o<1は対照薬がプラセボより優れると表す
‑
9
0・
2
O
l
0
I
‑2 m u l I 鈴E-~や儲……ω 非劣性:非劣性マージン ‑非劣性マージン ( δ。)は対照薬の効果から決 められる(森川, 2000) ・対照薬の効果 。 δの95%信頼区間の上限 δ= .対照薬の効果の半分 仇 = J δの95%信頼区間の上限 • l o g ( o o ) = l o g ( o )の95%信頼区間の上限の半分 ,oo < 1 川ふ……ーシ ー m U I 非劣性:統計仮説 C h y p o t h e s e s ) • o。を非劣性マージンとする. Hoθ :三 ま VSH1:θ<丈 Ho: l o g ( θ )三一 l o g ( δ。 )v sHj: l o g ( θ )<‑ l o g ( δ。 ) ム θ= λ c 10 ‑ 9 1・
I 似+総会的… 非劣性:治験薬効果の確認 • T薬の C薬に対する非劣性が確立した場合 。 。 く ま δ<δ 。二~ 1 d=与 。 ム δ= <17 λ p ・非劣性が確立したとき,少なくとも治験薬がプラ セボより優れることを保証する 11 Ir!!-~ーか…ーシ ~~ 非劣性と優越性(再掲) ‑非劣性を優越性に変換 。 θ=司 ×δ Dー =4(Zα +Zβy ー 1 ( 0 9(θ)y ‑ 9 2・
s I 給付ー随一 問 叫ん m 捌~ ? 非劣性と優越性:比較の変換 ‑対照薬との比較からプラセボとの比較ヘ Ho:θ=丈vsH 1:θ=的 Ho:θδ=1v sH1: θ δ = θ l δ。 D ‑=4(Zα+Zβy l ( og 。 ω () y 1 3 I似4・健会対同…~加 ‑ 2 8 1 8 1 非劣性:ハザード比 ‑ハザード比に基づ、く方法 C S c h o e n f e l d ) ‑ α+ ZsY l ( o g ( 司)+logO ' o ) Y N=‑ 主‑ 7 rr+π c 2 0 :両群での必要なイベント数 Z :標準正規分布の上側パーセント点 θト対立仮説での(真の )1、ザード比 : oo 非劣性マージン N:両群での症例数 同 庁c・治験薬群,対照薬群における死亡率 " ‑ 9 3・
I [ I T I UI 似十健全印刷…… 非劣性:ハザードの差 ( 1 / 2 ) ‑ハザードの差(入C ^ c )I こ基づく場合 ・d . o < O :非劣性マージン D=(Zα+Zβy~λt+ λc +~oY s/ ( λ t一 λ c+~oY N= ( F r e e d m a n1 ) D l rf +1 r 浜田=藤井 ( 2 0 0 3 ), 77枚目 2 1 5 … │ωb ← 蝕 印 刷UOJ [ I J l U I ω 非劣性:ハザードの差 ( 2 / 2 ) バ ‑ハザードの差 ( A c )I こ基づく場合 • N :両群での症例数 ・L l O < O :非劣性マージン • T T , T T 治験薬群,対照薬群における死亡率 t c: N 2 ( z α + z β 二 r ( パー・ o Yl 、 同 一 ( λ r一 人 +L'l λfzlλ ~T-;:-) 2 ) ma問 Chow ,S h a oa n dWang(2003),p . 1 6 9 1 6 ‑94・
1 1 F や縫い肋ん J、ザードの比と差のどっち? ‑ハザード比の方が望ましいと思われる: ー非劣性マージンの大きさが把握しやすい.例えば 00= 0 . 8,1 / 00=1.25の場合治験薬が対照薬より 25%劣ってもよいと解釈できる. 一必要な死亡数 Dはハザード比と非劣性マージン だけで計算できる(対照薬のハザード不要)ので, 対照薬の情報が少ないとき試験デザインの検 討に便利 ー検定統計量の分散が仮説の影響を受けにくい. Iω‑ 髄…日明!mm加 一 一 D 検定統計量 •X : を検定統計量とする. ・j . Joとj..J,をそれぞれ,帰無仮説と対立仮説の 下でのXの期待値とする. ・σ 2とσ12をそれぞ、れ,帰無仮説と対立仮説の 下でXの分散とする. 。 ・正規分布以外は検定統計量の分散が仮説に よって変わる. 18 ‑ 9 5・
11 十吟…… ~~ ω SampleS i z eEquation ‑以下の式を Samples i z ee q u a t i o nと呼ぶ. │ μ。 ‑μII=Zασ。 +Zβσl ( L a c h i n ) L a c h i n( 1 9 8 1 ) 浜田・藤井 (2003),18枚目 i z e ‑今まで、の症例数算出式は全て Samples e q u a t i o n( L a c h i n )の近似である. 1 9 Ir!!'.~~蝕……-…~~ J、ザード比:S choenfeld式の導出 1 / 2 .生存時間が指数分布に従う,検定統計量を 対数ハザード比の最尤推定量とする. X =l o g (人)‑log(λJ μ。 =log(λt )‑log(λJ=‑ logδ。 μ 1=l o g ( λt )‑log(λJ=l o gB 1 ‑ 9 6・
|…ー一一…:.n}~;'WJt,; . .:f
• ,.
"?".
".
2Òl~
J、ザード比:(
S
c
h
o
e
n
f
e
l
d
)式の導出 2
/
2
.ハザードの最尤推定の漸近分散を観察 F
i
s
h
e
r
情報
量の逆数で計算する場合,検定統計量 Xの分散が
ハザードに対する仮説と関係しない.
2
σ
ハ
U
c 4
2
1 1d,
=d
= σ ‑一一+一一一一‑
i
d
f dc‑D
・1
J0,J
I1
とσ
0
2,σ
1
2をSamples
i
z
ee
q
u
a
t
i
o
n
lこ代入す
ると (
S
c
h
o
e
n
f
e
l
d
)式が得られる.
尚
一
一
健
全
一
一
I
戸
川
三 . 却
[
D
J
ハザード差:(Freedman2)の導出
.検定統計量Xの分散がハザード l
こ対する仮説と関
係する.
X=A‑1c μ。=人一 λc=‑Ao,μ1‑λt一λ
c
χ λ ? λ :い r λ ? λ :
=一
一
一d
一
一一一+一N
一一一
d
.+.
̲= 一
N
2
,
.
. 2
・σ2とσ12をvx
で近似して, 1
J0'
J
I1
と一緒!こ Sample
一
口
一
日
。
s
i
z
ee
q
u
a
t
i
o
n
lこ代入すると (Freedman2)式が得ら
れる
‑
9
7
‑
同総ユ~総会……t~,,~ 201~ まとめ ‑非劣性の症例数設計は優越性で使われている 2つ の方法,ハザード比に基づ、く方法 C Schoenfeld)とハ ザードの差に基づく方法 CFreedman)が利用できる. .使い勝手からハザード比に基づ、く方法 CSchoenfeld)はより良いと思われる I や 髄 mmmMa‑ 2 8 m l 補足 ‑本報告では,指数分布のパラメータのハザードに対 する Wald検定に基づいている. ・登録,打ち切りなどを考慮していない. ・登録,打ち切りなどを考慮した方法は Crispand 2 0 0 8 )を参照する. C u r t i s( ・非劣性マージンを既知の定数としている ‑ 9 8・
│ 一 一 一 . . 課題 ーペ却[illI ‑紹介した2つの方法とも Wald検定統計量 l こ基づ、き, 特に症例数が小さいとき名目有意水準を保ってい ないという問題がある非劣性に適する Score 検定 統計量に基づく症例数設計方法を開発する必要が ある • Wald検定に基づ、く症例数設計方法にハザード関数 を定数とする指数分布の仮定が必要である.この 仮定を満たすのは困難である.区分ごとの非劣性 の方法論研究も必要と思われる I~Ii'#胎…ーム与え子一一1m叫 参考文献 ( 1 / 2 ) ・浜田知久馬,藤井陽介 ( 2 Q O 主),生存時間解析の症例数 3 ‑ 9 8 . 設計.日本 SASユーザー会論文集, 7 ・浜田知久馬,安藤英一 (2005), pOW_~ R:プロシジャ!こよ る症例数設計.日本 SASユーザー会論文集, 127・1 5 1 . .中西豊支,五条正彦,菅波秀規 (2006),POWERプ口 シジャを用いた生存時間解析による症例数設計の統計 学一考察.日本 SASユーザー会論文集, 161‑169. ・森 ) ' 1(2000),統計ガイドラインと対照薬の選択. EBM ジャーナル, Vo. I15,130‑135. . 7J<~畢純基・浜田知久馬 (2008) 生存時間解析による症 例数設計方法の性能比較.日本 SASユーザー会論文 集 1 9 ‑ 2 8 . 2b ‑ 9 9 ‑
ω 1ユーや蝕一…….' ‑ 2 O l 0 ' 参考文献 ( 2 / 2 ) • ADDPLANAdaptiveDesigns‑PlansandAnalyses@ rsGuide,Release5 Use' ・CollettD.(1994),ModellingSurvivalDatai nMedical Research.Chapman& H a l l :London. • ChowS.C.,ShaoJ .andWangH.(2003), SampleSize C a l c u l a t i o n sI nC l i n i c a lResearch.MarcelDekker.New Y o r k . ・CrispA.andCurtisP . ̲(2008), Samples i z ee s t i m a t i o nf o r n o n ‑ i n f e r i o r i t yt r i a l so ft i m e ‑ t o ‑ e v e n td a t a . PharmaceuticalS t a t i s t i c s,7 :236‑244. n t r o d u c t i o nt oamples i z e • LachinJ . M .(1981),I d e t e r m i n a t i o nandpowera n a l y s i sf o rc l i n i c a lt r a i. l C o n t r o l l e dC l i n i c a lT r i a l, 2:93・1 1 3 . 27 ‑ 1 0 0 ‑
P r o p e n s i t yS c o r e法によるバイアスの調整法に関する実務的な問題点 0古川敏仁、杉本典子 株式会社ノ〈イオスタティステイカル リサーチ P r a c t i c a lp r o b l e m so fu s i n gp r o p e n s i t ys c o r em e t h o d sf o rb i a sr e d u c t i o ni nt h ee v a l u a t i n gt h ee f f e c to fe x p o s u r e v a r i a b l ei nan o n ‑ r a n d o m i z e ds t u d yd a t a N o r i k oSugimoto T o s h i h i t oFurukawa, B i o s t a t i s t i c a lR e s e a r c hC o .L td . B i o s t a t i s t i c sDept, 要旨 無作為化比較試験以外の疫学データや観察試験のデー夕、あるいは市販後調査などにおいては、治療 効果や曝露要因聞の影響を評価しようとしても、比較群聞の患者背景には偏りがあり、単純な解析結果 はバイアスによるミスリーディングな結果となる可能性がある。このような非無作為化データにおける 治療群聞の比較において、被験者背景の偏りからくるバイアスを減少するための方法論の lつに P r o p e n s i t yS c o r e法がある。 P r o p e n s i t yS c o r e法には大きく 2つの利用法があり、 lつは観察された曝露要 因を Q u a s ir a n d o m i z e d な状態にする Matchingへの利用、もう一つは共変量や層別因子として調整 崎 匂u s t m e n t )因子としての利用である。 P r o p e n s i t yS c o r e法は理論的な整備が進み、観察データにおける ( a 治療効果比較、無作為化比較試験における無作為化割付のバイオレーションの補正、ペイジアン試験デ ザインにおける背景因子の調整など、さまざまな分野で数多くの実例が報告されてきているが、実際そ れを利用してみると教科書にはない注意すべきさまざまな問題があることに気付く。そこで今回は P r o p e n s i t yS c o r e法を実際に利用する際に注意すべき点を報告する。 , db i a sr e d u c t i o n, m a t c h i n g , a d j u s t m e n t, n o n ‑r a n d o m i z e ds t u d yd a t a キーワード:p r o p e n s i t ys c o r emetho 1 .P r o p e n s i t yS c o r e~去とは P r o p e n s i t yS c o r e法の原理を説明するには、無作為化試験の優れた仕組みを理解することが一番分かりやす し 、 。 今、薬剤 A 、 B の治療効果 eA と~の差 edrug を推定することを考える。通常の無作為化比較臨床試験では観 察された治療効果えと ι から ~ntg = e a‑ e b と推定できるとする。また、例えば、性別などの予後因子(背 ‑ 1 0 1 ‑
景因子)も治療効果に影響を与え、男性では e男、女性では e!J:を治療効果 e Aとf:j,にそれぞれ等しく与えるも のとする。 すると、 男性での治療効果差は ニ ( e e e dl1lg a +句)一 ( b +句)= e a‑ e b 女性での治療効果差は e ( e 女 ) 一( e 女)=e dmg = a+e b+e a‑ e b と、それぞれ、男性、女性という層の中では治療効果の差は正しく推定されることになる。 例えば、男性と女性の比率が 1 : 1で固定されていた場合、男性と女性で構成される薬剤!JA群と B群中の性 : 1で固定した A 群と B群の薬剤効果の 別の効果はその平均値 e件別問として寄与することになる。男女比を 1 差は、下記のように正しく推定される。 当 主 ) 一 (e +当主)=ι ‑e e ( e a+ dl1lg = b b しかし、仮に、 A 群の男女比が 1 : 1、B群の男女比が 2 : 1のように、比較する群問で予後因子のバランスが 等しくないとき、薬剤j 効果の差はもはや正しく推定されない。 竺 主 ) 一 (e +川 ; l x eee ( e + a b 女 )= t . a ‑ b つまり、薬剤I J A、B の治療効果 e Aと f:j,の差 eA‑f:j,を正しく推定するためには、 A 群と B群の予後因子の分 布f aと f bが等しいと見なせることが前提となっている。無作為化比較臨床試験の素晴らしいところは、臨床 試験で観察(データ収集)された予後因子 z l, z 2 , . ., 'z iと潜在的な(データ収集されなし、)予後因子 z i + l, z i + 2, '.・両者を含めた A、B群の予後因子分布 f a ( z )と f b ( z )が、無作為化害l 付としづ操作により等しいとみな すことができるようにする点である。すなわち、 ! a Cz)=! a Cz1, z2, … ,z i, z i+1 , z i+2,…)=! b ( Z ) つまり、無作為化比較試験では、登録された症例群の予後因子の分布f(z )を持つ症例が、固定された確率 で A群 、 B群に無作為に割り付けられるため、 A群 、 B群の予後因子の分布はf(z )を保持することになり、 結果として f a ( z=f b ( z )となり、その結果、薬剤 A、B の比較可能性が保証されることになる。 無作為化比較臨床試験においてもこの前提が必ずしも保証されるわけではない。例えば、情報を持つ打切 り ( i n f o r m a t i v ec e n s o r i n g ) が発生すればこの比較群の予後因子の分布ノ〈ランスは当然崩れ、統計解析結果に バイアスが存在することになる。このような場合、予後因子から打切りが発生する確率を推定し、それをバ ランス因子としてお ( z = f b ( z )のときの治療効果差を推定する IPCW(I n v e r s eP r o b a b i l i t yofCensoringWeighted)と いう因果推論の方法もある。 a ( z )手 f b ( z )であるので、そのままでは治療効果差 無作為化割付されていない観察データにおいては、当然 f は推定できない。そこで、観察された予後因子 z l, z 2 , ・ ・ ・ ,z iから、個々の症例 jが薬剤!JAあるいは B が曝露 される確率 p j=p r o b ( D r u g=A[Zlj, Z2j'…,勺)を求め、 A 群と B群でこの値が等しい症例を選択し比較 a ( z=f b ( z )の する matching、あるいは、この値を予後因子の代表値として調整や層別化に用いれば、理論的に f ときの治療効果差を推定することができる。ここで、討を P r o p e n s i t yS c o r eと呼び、それを利用した方法が P r o p e n s i t yS c o r e法である。 ‑ 1 0 2 ‑
Matchingや統計解析モデ、ルによる予後因子の調整は、 P r o p e n s i t yS c o r e法を用いなくても、観察された予後 l, z2, ・ ・ ・ ,z iを用いても当然可能である。ただ、例えば、 Matchingの場合、 z l, z2, ・ ・ ・ ,ZIすべての変数 因子 z を Matchすることなど現実的には不可能である。また、調整においても、複数の共変量による調整について は、多重共線性の問題以外にも、共変量全体での z空間の線形性の問題や計算手法上での制約など、目的と する治療効果の推定についてはさまざまな問題が発生することになる。複数の背景因子を Iつの P r o p e n s i t y S c o r eで表現できれば、これら問題からは開放されることになる。 r o p e n s i t yS c o r e法であれ、調整される背景因子は z l, z2, ・ ・ ・ ,z iの観察 ただし注意すべきは、 IPCWであれ P された予後因子のみであり、潜在的な予後因子に関しではなんら調整をしていない。ゆえに、これら方法で 得られた結果はあくまでも感度分析の lつの指標であり、絶対的な結果ではないことに注意する必要がある。 さて、 A、B2薬剤l の治療効果を比較する観察データから、 P r o p e n s i t yS c o r eを計算するに SASプロシジャに o g i s t i cプロシジャ ( g e n r n o dプロシジャの方が汎用的で使いやすいが)があり、次のようなコー は、例えば l r o p e n s i t yS c o r eを得ることができる。 ディングで P PROCLOGISTIC; MODELDRUG=ZIZ2 . . . .Z I; OUTPUTOUT=OUTP=P; RUN; ここで、 DRUGは例えば A=1、B=Oのような曝露治療群を示す変数である。 OUTデータセットに出力され る P変数に格納された値がPr o p e n s i t yS c o r eである。この Pの値を matchingや調整や層別化に使えば良し、かと r o p e n s i t yS c o r eを利用するためにはさまざまな実務的な問題があり、 いうと、 Yesであり Noである。実は P それを lつ lつ解説していかなければならない。以下にそれを解説していく。 2 .P r o p e n s i t yS c o r e法利用の実務的な問題 2 . 1 予後因子の選択 まず、Pro p e n s i t yS c o r eを算出する際に、最初に悩むのが、どのような背景項目を選択するのかという問題 である。教科書によれば、下記の 2点の記載が一般的である。 ① 潜在的な背景因子の偏りをできるだけ防ぐため、可能な限り多くの背景項目をモデ、ルに含める。 ② モデルの安定性の確保のため、例えば P>0.500となる項目はモデルから除外する。 ①、②からして実務者にとっては矛盾のように感じてしまう。実務的には①の原則は保持しつつ、下記のよ うに取り扱うのが妥当ではないか。 ②' 背景間で相関の高い、多重共線性のある項目は、代表的なもの lつを採用する。 ③' 少数例はずれ値の影響の高い背景項目はモデルから除外する。 ④' それでも p値が O .70や 0.80を超える項目がモデ、ルに残ったら、そのとき考える。 このようにして選択された背景因子候補の中にも問題がある。最も注意すべきは ‑ 1 0 3 ‑
0 曝露因子(比較治療法)と関係のある背景項目は決してモテやルに入れないこと。 例えば、外科的治療など、ある背景因子の存在の有無により治療法が選択される場合がある。このような p e n s i t yS c o r e算出モデルに組み込むと、最終的な治療効果の差がほぼ 0となって計算されるこ 背景因子をPro とになりかねない。 0また、背景因子聞の交E作用をつねに確認することが PropensityScore算出モテ守ル作成には Keyとなる。 2.2 選択した予後因子モデ、ルの評価 2 . 1節で苦心して行った予後因子選択の妥当性の評価に関しては、臨床的な観点からの評価とともに、作 r o p e n s i t yS c o r eの持つ具体的なバイアスの減少量を評価することが重要となる。そのために必要な作 成した P 業は、曝露 A、B問の背景因子の偏りを EffectS i z e( A、B問の平均値差÷標準誤差)で表し、作成した P r o p e n s i t y i z eの縮小率を計算することが 1つの方法となる。 S c o r eで調整した EffectS p e n s i t yS c o r eの B i a s r e d u c t i o n 表 lは、観察データに基づく心血管領域の 2つの治療法の比較に用いたPro の評価である。 QOLは受けた治療法により根本的に評価が異なるため、Pro p e n s i t yS c o r eモテゃルの構成項目に は含めなかった。他の項目はすべてPro p e n s i t yS c o r eモデルに含まれている。表の上段には背景因子単独での、 f f e c tS i z eとして示されている。表の下段には、 ロジスティックモデルによる背景因子の治療群聞の偏りが E o p e n s i t yS c o r eの 5区分変数で調整した E f f e c tS i z eと、調整しない E f f e c tS i z eとの比 ( B i a sR e d u c t i o n ) 作成したPr が示されている。Pro p e n s i t yS c o r eモデ、/レに含まれる項目は、し、ずれもバイアスが減少し、その平均値は 30.6%、 つまり、平均して約 70%のバイアス除去をPro p e n s i t yS c o r eで調整することで達成していることを示している。 P r o p e n s i t yS c o r eモテールに含まれない QOLの偏りは、Pr o p e n s i t yS c o r eで調整することでむしろ増大している。 i a s 臨床的には、 QOLの評価自体、治療法で異なるため問題とはならないが、このように個々の項目の B R e d u c t i o nを厳密に評価することが、 2 . 1節で示した予後因子選択の妥当性を吟味することになる。 自由度 心機能検査l 心機能検査2 OL Propensity Score~ ロ nvs Men 心機能検査l 心機能検査三 OL 平鈎 Bias Reduction p { 直 ‑ 0 .1 1 5 一 o .020 ‑ ‑ 0.281 0.338 0.012 0.476 o .12 2.59 0 . 3 5 . o1078 0.5556 0 . 3 4 1 .6 1 0 . 5 9 500 200 500 200 499 1 8 0 ロジスアイツ 500 200 500 200 500 200 . o045 . o023 ‑ ‑ 0.009 0.022 0.015 0.006 4.07 2.36 2.17 0.0436 0.1242 . o1404 2 .0 2 1 .54 1 .47 ‑0. 047 ‑ ‑ 0 .004 ‑ ‑ 0 .224 0.369 0.014 0.530 0 . 0 2 0 . 0 7 O .1 8 0.8987 0.7926 0.6733 O .1 3 0 . 2 6 0 . 4 2 37.4 1 6 . 3 7 l .5 l 0.015 0.001 ‑ 0.010 1 ‑ 0 . 0 2 5 0 . 0 1 7 0.006 0.38 0 . 0 1 2.47 0.5387 0.9332 O .1 1 6 1 0 . 6 2 0 . 0 8 1 .57 3 0 .4 5 .4 1 0 6 . 8 30.6 …I Ag巴 NYHA ピ Bias Effect Reduction ( 話 ) Size 200 200 200 500 500 500 Sex Age NYHA Logisticパラメーター 推 定 値 標 準 誤 差 Wald 500 500 499 200 200 1 8 0 ‑104・ 0.7334
基本的に、 P r o p e n s i t yS c o r e作成に用いた背景因子のバイアスは、必ず減少することが知られており、採用 したモデルの統計量に対し、背景因子の項目が多変量正規分布していると見なせるなら、バイアスはどの背 景因子も等しく減少する。 r o p e n s i t yS c o r eを評価する。 このような知識を下に、下記の点に注意して作成した P o PropensityScoreによる BiasReductionを個々の背景因子(モデルに含む、含めない合わせて)ごとに吟 味する O 平均的なバイアス減少率を評価し、例えば 70%以上のバイアス減少が得られなければ、 PropensityScore 法の効果は低いことを認識し、できれば 90% 以上のバイアスの減少が得られるような P r o p e n s i t yS c o r eを 検討する(背景因子聞の交互作用等の再吟味)。 2 .3 PropensityScoreの Matchingへの応用 ある治療群と対照治療の治療効果を比較する場合、治療群 j症例と P r o p e n s i t yS c o r e が等しい対照群の症 r o p e n s i t yS c o r e で Matingした対照群に対して治療群の効果を 例を N例抽出し、すべての治療群症例に対し P 比較すれば、その被験者背景は理論的に Q u a s i‑ r a n d o m i z e dな状態となり、治療効果の比較からバイアスを除 p e n s i t yS c o r e法による M a t c h i n gの原理である。 外することができる。これが、Pro 一般的に下記の場合に Matchingが用いられる。 ・少数例の治療群と多数の対照群が予想される .必要な被験者背景は全例調査されている •P r o p e n s i t y S c o r eで Matching後、治療群と選択された対照群の Outcomeを調査する計画である。 このような場合に Matchingを適用すれば、 ・コスト、時間の節約 • Outcomeを Matching後調査することにより解析中の選択ノ〈イアスを排除することが可能となる。 0 現実的には、すでに Outcomeの調査が完了したデータに対して Matchingにより対照群の症例を選択する ことを散見するが、これは、上記のメリットが何も無く、また、症例の選択によるバイアスを否定でき ないので、筆者は推奨しない。 P r o p e n s i t yS c o r e法による筆者が推奨する M a t c h i n g方法は下記である。 ① すべての治療群、対照群の症例を用いて、適切な背景因子を選択したロジスティックモデルにより、 P r o p e n s i t y S c o r eのロジット値を計算する。 L j: tC a l i p e r s に入る症例を治療群、対照群から抽出 ② 治療群から任意に l例 jを選択し、そのロジット値 ③ 抽出された症例を用い、より重要で、小数の変数を用いた線形判別関数による治療群、対照群を判別する する。 M a h a l a n o b i sの汎距離を計算する。 ④ 治療群 j症例と最も近い M a h a l a n o b i sの汎距離を持つ症例を対照群より選択する。 ①において、Pro p e n s i t y S c o r eではなく、ロジット値を用いる理由は、条件が揃えば、ロジット値上の治療 群、対照群の分布は、分散の等しい正規分布となることが期待されるからである。 ‑ 1 0 5・
②において、 C a l i p e r sは、ロジット値の標準偏差の l I 4が用いられることが多い ③において、より重要でソト数の変数を用いた線形判別関数により、再度、Pro p e n s i t yS c o r eを作成する理由は、 下記である。 ロジスティックモデルはロジット値と背景因子の線形関係を仮定しているため、分布の中心よりも、 裾に影響を持つ背景因子の影響を受けやすい 背景因子聞の交絡等の存在により、必ずしも z平面全体で背景因子の効果の線形性が成り立っている わけではない 上記の理由から、臨床的に真に重要な背景因子を Matchingする場合、ある程度 Matchした症例に対し、 p e n s i t y S c o r eを計算し、それを Matchingに用いたほう 選択した背景因子で、線形判別関数によるPro が、目的とする Matchingの精度は向上する。 2 .4 PropensityScoreの調整への応用 P r o p e n s i t y S c o r eを調整に利用する場合の推奨する具体的な手順は以下である。 ① 治療群 v s対照群を応答変数とし、適切な背景因子を説明変数としたロジスティックモデルで、 P r o p e n s i t y S c o r eを算出する。 ② P r o p e n s i t y S c o r eをその値の順序に対し 5区分する(以下 5区分変数と呼ぶ)。 ③ 5区分変数を層別因子、あるいは名義カテゴリ変数として共変量に用い、調整した治療効果の差を推 定する。 たった、これだけの作業であるが、実務的にはこの作業がまた、問題を lつ lつ解決して進む厄介な作 業である。 p e n s i t y S c o r e ではなく、 5区分変数を用いる理由は、下記である。 ②で、共変量として利用するのにPro P r o p e n s i t y S c o r e自体は ResponseOutcomeと線形性が仮定できるわけではない P r o p e n s i t y S c o r eの裾、すなわち、 p値が1.0あるいは 0に近い場合の数値は調整統計モデル上での取 り扱いが難しい ②で、なぜ、 5区分かというと、実際的にイベント数から、 5区分以上の区分は難しし、からである。また、 Cochranや Rosenbauma n dRubinによれば、傾向スコアが 5区分化でき充分解析に適する分布であれば、背 景因子の偏りによるバイアスを 90%減少できると報告されている。また、 4区分では 85%、3区分でも 80% のバイアスが除去できることが報告されている。ゆえに、 5区分が一般的に推奨されている。 ②で示した、 5区分変数を作成する方法は、実際的には非常に難しい。 よく利用する方法は以下の 3つである。 治療群と対照群を合わせたイベントが発生した症例の P r o p e n s i t y S c o r eの順位に基づき適切に 5区分 する 治療群か対照群、解析対象のイベントが少ない方の群のイベントが発生した症例の P r o p e n s i t y S c o r e の順位に基づき適切に 5区分する P r o p e n s i t y S c o r eの任意な値に対し、適切に 5区分する . 1 0 6・
では、これが何が難しいのか。それは、治療群と対照群のイベン卜発生症例の P r o p e n s i t y S c o r e上の重な りにある。例えば生存時間解析に関しては、ハザード比の推定に主として寄与するのは、発生したイベン 卜である。治療群 500例、対照群 2000例といった規模のデータでも、その発生イベン卜は高々症例の l、 2害J I である場合が多い。また、一見、治療効果があると見えるようなデータでは、Pro p e n s i t y S c o r e上の治 療群と対照群のイベン卜発生数は、それぞれ両端に分布することが多い。すると、 P r o p e n s i t y S c o r eを単 純に 5区分した場合、それぞれの区画には、どちらかの群のイベン卜がない区画ができやすし、からである。 r o p e n s i t y S c o r e解析の Keyとなる場合がある。 ゆえに、この 5区分変数を適切に作成することがときに、 P また、この課題をクリアしでも、次に、③の 5区分変数を層別因子、あるいは名義カテゴリ変数として 共変量に用いるかという悩ましい問題が発生する。特に悩ましいのは生存時間解析であり o 5区分変数を層別因子として用いれば、ハザード比の推定はより妥当 (5区分間の生存関数に比例ハザー ド性は仮定しなくて良し、から)と恩われるが、逆に、基準ノ、ザード関数を層ごとに仮定するため、治療 効果関のハザード比の信頼区聞は大きくなってしまう可能性がある。 0 逆に、 5区分変数を名義尺度の共変量として用いれば、背景因子の影響を推定でき ( 5区分変数のハザー ド比が推定できる)、また、基準ノ、ザード関数が lつなため、治療効果関のハザード比の推定精度が、 5 区分変数を層別因子として用いるときよりも良い場合がある。しかし、多くの場合、 5区分変数に比例 ノ、ザード性を期待するには無理な場合がある。 0 このように、いくつかの条件で判断に迷うことがあれば、必ずすべての条件で解析を行い、感度分析し、 結果が変わらなければ良しとし、自分の条件の中で適切な条件を選択すればよい。 0 感度分析し結果が大きく食い違う場合には、恐らく、すべての結果は信用できないとし、その原因を探 るのが重要であろう。 3 . まとめ Propensit yScore法を利用して統計解析を行う場合、解決しなければならない実務上の問題がいくつもある。 問題を解決する上でのポイン卜は以下である。 o Propensity Score法の統計学的なパックグラウンドをよく理解すること 0 対象となる臨床領域の基礎知識を良く理解し、 PropensityScoreを構成する背景項目の選択や、結果の 妥当性について吟味すること 0 上記のために、統計家・臨床家のチームワークが重要であること o PropensityScoreを作成したら、その biasreductionの大きさは常に確認すること 0 いくつかの条件で判断に迷うことがあれば、必ずすべての条件で解析を行い、感度分析すること。 0 最後に、 PropensityScore法による解析結果は、すべて感度分析の lっとして考え、常に、解析の制約 条件を理解し、複数の条件の中から総合的に結論を導くことが重要である。 ‑ 1 0 7・
4 . 参考文献 1 )Ral p hB .D ' a g o s t i n o, J r .T u t o r i a li nB i o s t a t i s t i c sP ro p e n s i t yS c o r eMethodsf o rB i a sR e d u c t i o ni nTheComparisono f aT r e a t m e n tt oaNon‑randomizedC o n t r o lGr o u p .S t a t i s t .Med.1 9 9 8 : 1 7 ;2 2 6 5 ‑ 2 2 8 1 P .R .andRubin, D .B .Thec e n 回 1 r o l eo ft h ep r o p e n s i t ys c o r ei no b s e r v a t i o n a ls t u d i e sf o r c a u s a l 2 )Rosenbaum, i o m e t r i k a,7 0, 4ト5 5( 1 9 8 3 ) . e f f e c t s,B 3 )Rosenbaum, P .R .andRubin, D .B C o n s t r u c t i n gac o n t r o lg r o u pu s i n gmu 1t i v a r i a t ematcheds a m p l i n gmethods伽 t ピ , Am e r i c a nS t a t i s t i c i a n,3 9,3 3 ‑ 3 8( 19 8 5 ) . i n c o r p o r a t et h ep r o p e n s i t ys c o r W.Thep l a n n i n go fo b s e r v a t i o n a ls t u d i e sofhumanp o p u l a t i o n s .Joumalo f t h eR o y a lS t a t i s t i c a lS o c i e t y, 4 ) .Cochran, S e r i e sA 1 9 6 5 ;1 2 8 : 2 3 4 ‑ 2 5 5 . 5 ) .Cochran , W.Thee f f e c t i v e n e s so fa d j u s t m e n tbys u b c l a s s i f i c a t i o ni nr e m o v i n gb i a si no b s e r v a t i o n a ls t u d i e s . B i o m e t r i c s1 9 6 8 ;2 4 : 2 0 5 ‑ 2 1 3 6 ) .Rosenbaum, P .a n dD .R u b i n .R e d u c i n gb i a si no b s e r v a t i o n a ls t u d i e su s i n gs u b c l a s s i f i c a t i o nont h ep r o p e n s i t ys c o r e . e r i c a nS t a t i s t i c a lA s s o c i a t i o n1 9 8 4 ;7 9 : 5 1 6・5 2 4 . J o u r n a lo f t h eA m ‑ 1 0 8・
[ 一 一 ー SASによる 中間解析のデザインと解析 浜田知久馬 東京理科大学 I n t e r i mA n a l y s i su s i n gSAS ChikumaHamada TokyoU n i v e r s i t yo fScience ω iユ + 縫 い … 一 1m]~ 要旨 V9.2から中間解析を計画するための SEQDESIGNプロシジャと,解析するための SEQTEST プロシジャが実験版として追加さ れた 本発表では,中間解析の数理と,この 2つの プロシジャが出力する内容についてチュート リアルとして解説を行う キーワード:S E Q D E S I G N, S E Q T E S T ,中間解析,消費関数 ‑ 1 1 1・
Iωユ4ー儲……ン~~ • 2 d l 0 ' 内容 中間解析の数理 情報時間の定義 中止基準(中間解析なし有効中止のみ, 無効中止のみ,有効・無効中止) O ' B r i e r トF l e m i n g型と P o c o c k型) 消費関数 ( S E Q D E S I G Nプロシジャの出力内容の解説 消費関数の種類,中間解析の回数・時期についての検討 S E Q T E S T プロシジャの出力内容の解説 条件付き検出力と予測検出力 生存時間をエンドポイントとした中間解析 │ ャ ミ 干 ー ザ ー 錨 会 … … → ン わ シ 昨 . 症例数設計のペンタゴン α,, 3 ( a,, l I N :~~~暗記 1 1 :効果の大きさ N: (情報時間 1 ) や~ σ: ぱらつき 4つを固定すると 1つは自動的に 定まる 由畢帯当‑ G三一一一一 ‑112・ I s
ω
!‑
"
'
‑
8
.7
f
f
i
t
i
l
l
t
7
J
.
…
知
一
‑
.
:
1
‑
‑
2
O
l
0
'
中間解析の 6つのステップ
l
)
Y
o
us
p
e
c
i
f
ythes
t
a
t
i
s
t
i
c
a
ld
e
t
a
i
l
so
ft
h
ed
e
s
i
g
n,
i
n
c
l
u
d
i
n
gt
h
en
u
l
landa
l
t
e
r
n
a
t
i
v
e
hypotheses,at
e
s
ts
t
a
t
i
s
t
i
c,theType1and1e
r
r
o
rp
r
o
b
a
b
i
l
i
t
yl
e
v
e
l
s,as
t
o
p
p
i円gc
r
i
t
e
r
i
o
n,
thet
o
t
a
lnumbero
fs
t
a
g
e
s,
andther
e
l
a
t
i
v
ei
n
f
o
r
m
a
t
i
o
nl
e
v
e
la
teachs
t
a
g
e
.
p
e
c
i
f
i
c
a
t
i
o
n
s
.The
2
)
Y
o
ucomputetheboundaryv
a
l
u
e
sf
o
rthet
r
i
a
lbasedonthed
e
s
i
g円 s
samples
i
z
er
e
q
u
i
r
e
da
teachs
t
a
g
ei
sa
l
s
ocomputedf
o
rthes
p
e
c
i
f
i
e
dh
y
p
o
t
h
e
s
i
st
e
s
t
3
)
A
teachs
t
a
g
e,
a
d
d
i
t
i
o
n
a
ld
a
t
awithther
e
q
u
i
r
e
dsamples
i
z
e
sa
r
ec
o
l
l
e
c
t
e
d
.Thed
a
t
a
a
v
a
i
l
a
b
l
ea
teachs
t
a
g
ei
n
c
l
u
d
ethed
a
t
ac
o
l
l
e
c
t
e
da
tthec
u
r
r
e
n
ts
t
a
g
ea
sw
e
l
la
sthed
a
t
a
c
o
l
l
e
c
t
e
da
tp
r
e
v
i
o
u
ss
t
a
g
e
s
.
thea
v
a
i
l
a
b
l
ed
a
t
aa
r
ea
n
a
l
y
z
e
dwithaprocedure
4
)
A
teachs
t
a
g
e,
5
)
A
teachs
t
a
g
e,
youcomparethet
e
s
ts
t
a
t
i
s
t
i
c
w
i
t
ht
h
ecorrespondingboundaryv
a
l
u
e
s
.
orthet
r
i
a
li
scontinuedt
o
E
i
t
h
e
r
t
h
et
r
i
a
li
sstoppedt
or
e
j
e
c
tora
c
c
e
p
ttheh
y
p
o
t
h
e
s
i
s,
theh
y
p
o
t
h
e
s
i
si
se
i
t
h
e
rr
e
j
e
c
t
e
do
r
then
e
x
ts
t
a
g
e
.I
fthet
r
i
a
lcontinuest
othef
i
n
a
ls
t
a
g
e,
a
c
c
e
p
t
e
d
.
youcomputeparametere
s
t
i
m
a
t
e
s,
confidencel
i
m
i
t
sf
o
rthe
6
)
A
f
t
e
r
t
h
et
r
i
a
ls
t
o
p
s,
parameter
,
anda‑
v
a
l
u
ef
o
rtheh
y
p
o
t
h
e
s
i
st
e
s
t
I
~~
随ユーザー錯会的問問一
h
・
,
.
.・'"可弓~~.
よ1 TI..
"
・s
、
竺
0
T
:
¥
O
!
I
.岳,>そ:~
s 司_,,'.....'"司副・・.~
1
1
'
.
,
'
.
句".・帽』・ゐ勧....11“.~・
'
u
.
岡山・''l'"''司白血
1
‑ . 抱 同 国 陶V唾"'"野前,
I
.̲̲̲̲J
加 由 S酬
I
ムー「
l
百五百一
曲
,
司
睡
'
,
.
池
尉
1
1
1
aP
‑
, .α; 凧 ~-J
1
I
,
瞬
時
・
内
・
・
l
二二=c::て
l
一
__J帥一帽~
斗
一一
一
何
;
'
,
‑
:
i
i
o
T
r
‑
:
;
T
・
o
,
.
q
,
.
.
.
.
.
.
.
[
i
I
'
"
刷
眠 t¥
畑縛喝
静岡・一一ーー・ー..
~ーーー・
・
吋
‑
1
1
3・
e
~~ ωz ーザー越金印刷…… 中間解析の 6つのステップ 1 )中間解析のデザインを決める条件の設定 検定統計量,帰無仮説 ( Ho H1), ),対立仮説 ( α,。エラー,中止基準, 中間解析の回数・時期 2)SEQDESIGNプロシジャによる症例数と s 棄却限界値を計算しSAS データセット!こ~ おとす 3 )各解析の段階でのデータを得る l i 1 . I ' 司 阿佐内会開…山市t7~~ 201~ 中間解析の 6つのステップ 4 )各解析の段階でのデータをプロシジャで解析 し結果をデータセットにおとす 5 )3 )の棄却限界値と, 4)の解析結果を SEQTEST プロシジャで比較し試験の中止・ 続行を判断 6 ) 中止の場合は,中間解析を考慮したも二 p 1 直,推定値,信頼区間の計算 γ ‑ 1 1 4・
1 1 1 ザ ー 繕 舎 一 … ー : 却u!l 中間解析のデザイン 1)想定条件 一 ‑ ‑ ‑ ‑ ‑ l 反応変数の型・指標,片側・両側, , . d σ,α,s , 12)中止基準 有効中止,無効中止,有効.無効中止 「 戸 で ; 込 必 , 3 ω )中間解析の方法.消費関数 Oω 百 , B附 ‑ F 円 耐│ j 戸 4轟 』 4 剖)中間解析の回数と時期 SEQTEST プロシジャ 棄却限界値と症例数を出力 W4 ー話会……ムャ ‑ 2 m o I 中間解析の情報時間 l 情報時間 l の定義 ‑暦時間 。 2 3 60% ーイベント数 。 生存時間の情報 ‑患者数 。 4 5 (年) 100% 200 へ ・ ン ト ) 4 0 0 (イ 50% 100% 300 1 0 0 0 (人) 30% 100% ‑ 1 1 5 ‑ 10
11 ~~ 会 開 閉 山 均 一 知 中間解析の数理 ZI:中間統計量 Z2 :最終統計量 Z1, Z2""""" m u l t i v a r i a t e n o r m a l 1:情報時間 θ:効果の大きさ . J I : , 1), Z2 :N(θF , , 1) ZI :N ( θ f T ーでア Cov [Z1,Z2] Zk =e^k 問解析と最終解析は =ゾ万 正の相関 2 . J I :コ十台:引の MLE ~~ SAS::J.‑>tf‑総 71ffI,71f'J細 川 仰 向 中間解析の数理 r で一 八 Zk = θk . . J1k コ θk ‑ ヌ. ポ ア 八 八 θ1, θ . ̲ , m u l t i v a r i a , . . .2 , t en o r m a l θ1:N (θ, 1//1 ) , θ2 :N (θ, 1//2) 川 I か 戸 ‑j ‑ 1 1 6・
D I 鍋b~ー儲 rum…… 中間解析の数理(スコア統計量5 ) S,̲ 一 =d l o g一 L ー マ. β.ナ d8 ~k -V ~k Sl' S2"‑' m u l t i v a r i a t e n o r m a l SI :N (8・1I '1I , ) S2 :N (8・12, 12 ) 7 7 Cov [SI れ J =広×布す =11 =V[SIJ SI, S2 ‑ SIは独立 12 ‑ 11)' 12 ‑ 1I) S2‑SI :N (8・( 1 3 D 正規分布の場合 e x p ( ‑ ( Y J ) L 2 口ム' I 鉱S ユーザー範会…~判例 = 同 Lニ ー エ コ ) ( y i ‑ dl o gL NY ̲ Nμ‑ = μ ) 一 s一 = = d μ σ 4 σ 4 d2 l o gL I一 一一 ‑ dμ4σ4 ーと 1 1 ‑ 1 1 7・
D Sa.~ー縫い…一 一標本の母平均の検定 (02既知) H0 :μ=μo ⑨6 F=工 芝Y i H i=l Y~ N(μ,三こ) n L7-μ 。 ~N(e , 乙)=N(e ,~) n 1 = ヱ ア σ 1 Iや十給~…-… ~~ 一標本の母平均の検定 Y1'Y2""'‑' m u l t i v a r i a 1 Nj t e 一 Y l = t ZYi,Y2= 。= 。 n o r m a l 1 士エlYi N2 。 1 Y l ‑ μO, (}2=Y2‑ μ l N ( o f ) O2 N(O , ‑118・ 号 ,) 7
s l 縞会 , f t tfT; n . p # , ¥ @ 一標本の母平均の検定 Zl ヲ = ) (布 = 7 1 J T : , 1) N( ( ) 「 ー よ=y . j I ; , 1) N( ( ) 匹 ω[Z1Z2]=vF 17 I WlJ~ 崎日ー錯会……ン同長 一標本の母平均の検定 Z‑ ‑ EYl++YNi‑fyNl N1 4σ σ. JN1 ・ ・ ・ +YN2 Yl+・ + ・ ・ ・ +YN . JN2 Y l+ YNI+ 2 Z内=ユ一二 = ー‑ ム σ N2 σ. JN2 Nσ 2 OV[ZpZ2 J= 2一l σ fN:~刃~ . 1 1 9・ ニ , IN J云L ~N2
2 帥l 側~..i=.~l会問問山知的知 一標本の母平均の検定 N 1( Y I‑μ。 ) S 二Z よ ニ ‑ 二 N (yσ2‑μ 。) 2 1 S I ~, 二 , N 2 N2 tZyz N μ。 唱 ~Yi-NI μ 。 一 ,S2 = σ2 2 σ2 |ふs ユーザー総会……,_J',I:I~tn~:.r田川 最も単純な場合 (02=1,N1=N2=N) σ2 二 (known), 1 ; N 2=2N1=2N,Ho:μ =0 1 N 。 , . 1 r : 2N 1 X:N( μ , 1) , xI=~LXi , X2i = 1 1,B2‑Y2= I‑YI‑X , . 1 L Xi i=N+I N XI+N X2 N +N XI+X2 2 1/(2N)) θI"‑'N(μ, l/N, ) θ2"‑'N(μ, 11 =N 1 =N ,12 =N 2 =2N フ0 ‑ 1 2 0・
2 蜘│ Js応~ー縫い……ム 最も単純な場合 (a2=1,N1=N2=N) 二十 = $.y[,Z2=十 =‑J2N入 Z [ VN[ VN2 Z[ ' "N ($ μ , 1 ),Z2'"N ( . J 2 N J i ,I ) Z[= $.‑;[ Z2=.J2N・ ( 王 [+‑ ; 2 )/2= $(‑;[+‑ ; 2 )/ . J 2 ω [Z[ ザ匹 =d=0707 c ' o v[ Z Z2 ] =0 .707 . JV[Z[]V[Z2] [ , 一 一 千 錯 舎 一 … … 2帥 条件付き検出力 (a2=1,N1=N2=N) 中間解析の結果が得られたという 条件付(Zl)で対立仮説の下, 最終解析で有意差が出る確率 P r(Z2>C2I Hl' Zl) が小さいときは無効中止する. J74+J71‑‑ Z2= 再~ーァ 応=ど三とと~ N ( e ‑ ! i ,) I [ H, 長万 ' ‑ J 万 ‑121・
|総長付金!.il:t.~
条件付き検出力 (02=1,N1=N2=N)
確率変数
既知
HI
削 Z 2 > c2 I
…[官> ]
,
C2I
H
r
[
5
>ふ ‑i
l
H
l
]
.
J
}
i
.
J
}
i
I
,
,
‑2
~
~
I~~
会
[‑8σ>ふ
r
=P
2
1
一け
σI
H]
,
‑
J
N
]
.
J
2
=1‑φ [
c2 ‑ ZI ‑ 8
w
r
n
~ユーザー健全~
自。 undaryPlot
,
Sd
o
d
.
!
:
.
t
r
o
rSo割叫.Lna{a=
Ono
0
0
2
:
' s =01)
有効犠
同
Z
Z
1
~Z2
続行
.
.
#
#
‑,
.
'
通
介j場
、
.
'
t
r
無効媛
主笠t
!
'
1
0
r
o
3
0
岨
同
Inform.tion
ロ
ー....‑
司
国 R・
R・
1
c"
ロA臨 時U皿
・ R..
E
t
ion
・
国
'
・
A田 町 担 問 .6刷 M噛 叩 o F ,刊d- ~mple Cnb日 IV.
11
岬
,
国 8皿 M叫...,
̲R
・
』 cb
ー圃圃圃園田圃
2
4
‑
1
2
2
司
一一ザー織的別~訪問州知 WiJ~ 帰無仮説の下での Zの分布 (3D表示) 確率密度 = J f =0 . 7 0 7 J i i h l A l i b i ( : : a H f h l M 1 1 1 J R ‑1' 1 7 ‑3.50‑3.50 1 ' 1 7 X 3.50 中間解析 Zl I A S : : z . . . . . ; 1 f ‑ . 番 町 帰無仮説の下での Zの分布(等高線) Y 3.50 仏 505 守J H U 1A /メシー i/f ¥ ず ノノ / モ ー : ; : ; ‑ ‑ ユ グ 守J 4 NN 事 睦 尊 雌 、 、 、 } .‑‑‑イご士子ー→ ‑3.50 確率密度 p 一 一 ‑1.75 0.00 175 3.50 x 中間解析 Z 1 0.0113 一 一 0.0450' 0.1463 0 .1 ' 801 ‑ 1 2 3・ 0.0788 一 一 0.2138 0.1125
D !ωユーザー越金印刷~…愉 想定 1標本の t 検定 (薬剤投与前後の検査値の変化) 標準偏差 S D : 1 (既知) 帰無仮説 H o : μ = 0 対立仮説 H1:1 l= 0 . 5 ( d = 0 . 5 ) α : 上側 2 . 5 % 日 : 10% (検出力: 90%) 中間解析 1回:有効・無効中止 ( Q 1 B r i e n・Fleming型の α消費関数 i (pocock型の日消費関数) 情報時間の半分で実施 富担瞳 11 会 !EL~…拘ン w]~ , 1 . 限界値 ( c r i t i c a lv a l u e )とエラーの消費 画届週│ │ 臨 邑 !幽掴 A最終のみ 1 .95996 α=0.02500 B有効中止 c 無効中止 D有効中止 2.96259 α=0.00153 α=0.02450 1 .88372 0.86592 日=0.06201 0.86994 +無効中止日 =0.06201 1 .96860 α=0.02980 2.96259 α=0.00153 ‑ 1 2 4・ 1 .89189 α=0.02925
Is縞~ー儲 m……問ン 1m]~ SEQDESIGNプロシジャの文法 PROCSEQDESIGNStatement 出力等の指定 DESIGNStatement 中間解析の方法,条件の指定(複数可) SAMPLESIZEStatement 解析対象変数の条件の指定 S I 似ーザー飴一一一川 町 J 守 mI SEQDESIGNのプログラム o d sg r a p h i c so n ; proc seqdesign altref ニ0 . 5 errspend p s s ( cref=0 0 . 51 ) stopprob(cref=0 0 . 51 ) p l o t s = (a s np o w e re r r s p e n d ) ; O n e S i d e d E r r o r S p e n d i n g : d e s i g nmethod(alpha)=errfuncobfa l p h a = O .0 2 5 method(beta)=errfuncpoc beta=0.10 n s t a g e s = 2a l t = u p p e rs t o p = b o t h ; s a m p l e s i z em o d e lニONESAMPLEMEAN ( m e a n = 0 . 5s t d d e v = 1 ) ; o d so u t p u tB o u n d a r y = b o u n d ̲ t ; r u n : ‑ 1 2 5 ‑
W I D J E‑siユーザー錯舎内印刷!EJI:Jソリユー拘均拘ン DesignInformation S t a t i s t i cD i s t r i b u t i o n Normal BoundaryScale StandardizedZ A l t e r n a t i v eHypothesis Upper E a r l yStop Accep t/R墜jectN u l l Method ErrorSpending BoundaryKey Both A l t e r n a t i v eReference 0 . 5 NumberofStages 2 Alpha 0.025 Beta 0 . 1 Power 0 . 9 MaxInformation(PercentofFixedSample) 110.3272 MaxInformation 1 46.37016 N N u l lRefASN(PercentofFixedSample) ASN:AverageSampleNumber 65.68762 HoのNの期待値 A l t .RefASN(PercentofFixedSample) 90.94031H lのNの期待値 3 ' W I U J ~ユーザー鵠会!il.i.~恥山神 PowersandExpectedSampleS目 s ,pss(cref= 0 0.5 1 ) Reference=CRef*( A lt .R e f e r e n c e ) Power CRef SampleS i z e P e r c e n t F i x e d ‑ S a m p l e 0 . 0 0 0 0 0 . 0 2 5 0 0 6 5 . 6 8 7 6 0 . 5 0 0 0 0 . 3 7 9 6 1 8 7 . 8 0 0 1 1 .0000 0 . 9 0 0 0 0 9 0 . 9 4 0 3 MethodI n f o r r r a t i o n Boundary Method A l p h a A J t e m a t i v e Reference D r i f t H Iの下で のZ統計量 Approx O . B r i e n ‑ F l e m i n g 0 . 5 3. 404782 Approx Pocock 0 . 5 3. 4 04782 05*. i I 32 Eπor S p e n d i n g F u n c t i o n UpperA l p h a Eπor Spending 0 . 0 2 5 0 0 UpperBeta Eπor Spending ‑ 1 2 6・
‑ w r n ~ユーザー鑓禽 rH.t.,JiW1.e:.pp1均ン W ExpectedC u m u l a t i v eS t o p p i n gP r o b a b i l i t i e s R e f e r e n c e=CRef ( A lt .Reference) s t o p p r o b (c r e f =00 . 51 ) * Expected Source S t o p p i n gS t a g e CRef S t o p p i n gP r o b a b i l i t i e s StageJ S t a g e ̲ 2 0 . 0 0 0 0 1 . 19 1 R e j e c tN u l lα 0 . 0 0 1 5 3 0 . 0 2 5 0 0 0 . 0 0 0 0 1 . 19 1 AcceptN u l l 0 . 8 0 7 7 0 0 . 9 7 5 0 0 0 . 0 0 0 0 1 . 1 9 1 T o t a l 0 . 8 0 9 2 2 1 .00000 0 . 5 0 0 0 1 . 5 9 2 e c tN u l l R畦j 0 . 0 3 9 3 0 0 . 3 7 9 6 1 0 . 5 0 0 0 1 . 5 9 2 AcceptN u l l 0 . 3 6 9 0 6 0 . 6 2 0 3 9 0 . 5 0 0 0 1 .592 T o t a l 0. 40 837 1 . 0 0 0 0 0 1 . 0 0 0 0 1 .649 R町e c tN u l l 0 . 2 8 9 4 3 0 . 9 0 0 0 0 1 . 0 0 0 0 1 . 6 4 9 AcceptN u l ls 0 . 0 6 2 0 1 0 . 1 0 0 0 0 1 .0000 1 .649 T o t a l 0 . 3 5 1 4 4 1 . 0 0 0 0 0 期待中止ステージ 1 . 1 9 1 = 1ホ0 . 8 0 9 2 2 + 針( 1 ‑ 0 . 8 0 9 2 2 ) S l 似 + 話 番 問 … … ω 33 2 O 1 D ' ‑ ̲ . BoundaryI n f o r m a t i o n( S t a n d a r d i z e dZS c a l e ) N u l lR e f e r e n c e=0 ̲ S t a g e A l t e r n a t i v e 2 BoundaryV a l u e s I n f o r m a t i o nL e v e l R e f e r e n c e Upper P r o p o r t i o n A c t u a l Upper Beta A l p h a 0 . 5 0 0 0 2 3 . 1 8 5 0 8 240754 0 . 8 6 9 4 4 2 . 9 6 2 5 9 1 . 0 0 0 0 4 6 . 3 7 0 1 6 340478 1 . 8 9 1 8 9 1 . 8 9 1 8 9 E r r o rS p e n d i n gI n f o r m a t i o n ‑) 一弓 一 一.弓 d 一 一 て 山 守j ‑ny 一 げ 8 14 一 3 守j r t O A﹃ 一 今 & 内 U 一A﹃ 内 U r ︐ J4fJ4 . . Fコ ヴ ﹄ F31d nu= 内 U= ̲ S t a g e ̲ 2 I n f o r m a t i o n L e v e l C u m u l a t i v eE r r o rS p e n d i n g P r o p o r t i o n B e t a A l p h a 0 . 5 0 0 0 0 . 0 6 2 0 1 0 . 0 0 1 5 3 1 .0000 0 . 1 0 0 0 0 0 . 0 2 5 0 0 Upper 34 ‑ 1 2 7・
201~
J
S
総ユ+鎗会開…山市加
SampleS
i
z
eSummary
Test
I
One‑SampleMean
Mean
1
0.
5
S
t
d
.Dev.
1
4
6
.
3
7
0
1
6
MaxSampleS
i
z
e
ExpectedSampleS
i
z
e(
N
u
l
lRe
f
)
ExpectedSampleS
i
z
e(
A
l
t
.R
e
f
)
SampleS
i
z
e
s(
N
)
One‑SampleZTestf
o
rMean
F
r
a
c
t
i
o
n
a
lN
̲Stage̲
2
C
e
i
l
i
n
gN
N
I
n
f
o
r
m
a
t
i
o
n
N
I
n
f
o
r
m
a
t
i
o
n
2
3
.
1
9
2
3
.
1
8
5
1
24
2
4
.
0
0
0
0
4
6
.
3
7
4
6
.
3
7
0
2
47
4
7
.
0
0
0
0
35
t.s.iユーザー鑓会r.li.tt!,j肘rEl同地』防相神
boundaryscale=stdz オプション
Round
a
:ryP
l
o
t
0..__唱...(cr
N
唱。岨~
~
B・
I
}l)
Z統計量に基づく棄却域
。
続行
y‑μ
z=
t
;
. ',
ー
.
.
'
.
'
f
無効域
.
.最終経知
5
0
!
.
%
!民間
1
0
ロR.t4 .c:t:u~n ~.C曜、
仲
間
r
.
.
f
解
.
e
司
析
副;
0
0
"盟
・
"
'
.
.
刊
同
時
ロ 向c
9
胴
‑
・
・
・
・
.A c c 町 旬 胃 回 B田...."‑"Y 0 Fi".←
50.
司向。曲目, V.
.
岨
‑
1
2
8・
切傷
ーーーーー閥均0<.嗣修"""由吋
36
D
I ‑a.
焔吋
7
1
m
,7fH/Q
:
;
‑
&
'
P
J,
‑
'
,
.
.
"
l
r
>
ゅ
boundaryscale=mle オプション
。
目undaryPlot
o
.
.
s
.
島.
.
.
.
.
.
缶 ‑ .,
・ 6曲!. /
l .01
)
'
"
』
Jd
t
t
4
"
平均値に基づく棄却域
。
y‑μ
司"・・
・..~.
.
,
。
̲
c
$
ミa
"
'
誕
百
E
l
.
.
r
O
l
"
,
.
・t
時四
ロ
l
'喝 事 持 申 . . . . 咽
口 A臼時相.,・向暗・加
0"
"
.
.
,
,‑s制喧'E> v,
t
l
t
d
l
VT
!
¥
.
I
.
",, ~.~Uta.n晶円
ι
.
"
‑
司
.
.
.
.
.
.
.
.
.
.0
¥
<
.
.
:
同.
.
叫..引円
1
7
S縞~ー儲 t:i.dJZW.j山
boundaryscale=score オプション
8ouI"JdarvPlgl
.
. =
司{..
。..忌.....円~s.曹
0田!i l
J:
:
‑
0
1
1
!スコア統計量 (ZXイ
l
。
Jに基づく棄却域
s一= y‑μ。
,
,
,
σ2
g
N
,
1
;~ミ.8 1!.(l
。
・
担
l
.
‑
.
.
.
"
,
.
.
.
.
.
.
U
。
ョ
山
一
…
包0
f'J
n "0町
JntO
R"I~'~lo..... ø~ '
.
‑
"
UA
.
.
.
.
/
1
,
̲
"
.
.
.
.
,
,
,
,
"
<
:
.
.
.
畠
申.sndry " F .可 申 S申I
I
W
C
IC"l
>"
.
.
t1I ~1..・
J;rCl't'~'春日制叫ぜ
i
3
"
'
1
2
9・
I心付金問~.EIJlよJ--r 201~ boundaryscale=pvalue オプション ノ¥ 域 却 棄 宙 罰百叩品回 =w 2冒﹀'色百五ES4 ・ vps 基 つ ゃ 由。 u ndaryP l o t 。噌晶‑.市翁剛官司J(t l.OOZ , S B. .U I ) 無効域 「方 ( 一 千 ) ゐ e x p ~ーす11 。 言 抽 l ロ 岡田岡・山 ・ ・ . . . . . . h Ac' C 旬 融 局 国 B凪,噂崎町 岨 国 , l I l n f o . t i o n 口,,"__~R. ,",," 。R・ ・ d ‑ s . . " " " "C ,由国 V. ,圃 出 日酬で竺i ~ ~ーザー鑓禽 í.ilOïw::'lB'.:Jソリユー知加知 ErrorSpendinc 告 曙2 同 国 E n 冒 』 町 曲 目.(a :;OOZ~ 。 u +u 陣 W ・ A 8 1 9MMl Pocock型の 開智 ∞ 01 言 轡 d E 097S @』 』 E 冒 。 E 00 ヨ 日 A 日消費関数 . ' ‑ 0 . 1 0 0 0 0 ̲ . ‑ . ‑ 0 . 0 6 2 0 1 O'Brien・Fleming型の J 002~ ・ / O ( ) ( 抽 s =0.1) 。 J / 〆/ α消費関数 /J32500 / f / 0 . 0 0 t 5 3 ‑ ' " 一 一 一 一 号 , . . . ‑ 1 2 ・・ St g ‑ 1 3 0・ a
S~'Jザ範会開閉泊山知町 。 ~IljlÜJ , Avera e Sample Number =0025 s =01) UI$i由 d E r r o r S oo n d i n g( α 期待症例数 無効中止の 可能性大 ¥ 有効中止の ¥可能性大 0 0 87 ︒ u e E u ‑ ‑ { 旦aE・凶 ‑ ¥ 90 z・0﹄@色︼ Z凶︿ ぷ藩: 60 。 冊 団 。 025 075 125 100 ・ 1由 M u l t i p l i e rofReferonc Differonce 2rrn~ 検出力 PowcrPlot 白咽 $d・ dE TTÐI'Sq.ndi 岬~{a = 0025 s =01) , 0 J /~.- 0 . 0 / / ノ 06 / J/ ノノJ E e 』 z 04 / X ] J 〆 / ,/ 02. ‑‑‑ ノ/ 。 。 ヤ/ ∞ 。 025 050 075 1回 MuttipUerof向。 f..山 拍 車 臼げfercnee ‑ ‑ 1 3 1・ 可 2 5 '日
1
ふsユーザー錯会
~~
7
1
f
f
1
.
71tU
岡 山 一 ン
デザインの結果
N 1 =24,N 2 =47
: N =4
3
)
(中間解析なし
中間解析
(N 1 =24): Z1 =‑
J
2
4
.Y1
Z1 > 2
.
9
6
2
5
9
:有効中止
ZI < 0.86994 :無効中止
o.86994 < Z < 2.96259
1
最終解析
:継続
(N2=4
7
)
: Z2=.
J
4
7
・7
7
2
Z2 > 1.
8
9
1
8
9 :有効
Z2 < 1.
8
9
1
8
9 :無効
43
I
I}j~
似 + 鑓 舎 内 印 刷ID…V1!<1;'
Aαエラーの領域(中間解析なし)
v
0.50
トJ
fv
草
EL75
r / ‑ r
。
塁
00
E
国
‑'L75
} ー ノ
/'
(~
(
ι
一
三
二
プ
f
ー‑
3.50
‑3.50
ー-~75
0.00
X
P
中間解析 Z
1
0.0113 ‑
‑
‑ 0.0450 ‑ 0.0788 ‑
0.2138
0.1463 ‑ O
.筒 01
‑
1
3
2・
3.50
175
0.1125
I
r
n
2
ユーザー語会的J狗…‑:‑':lt>:;';;'
Bαエラーの領域(有効中止のみ)
V
3
.
!
)
O
175j
∞
Z2 0
〆
/
r
‑
J
‑175
X
p
O.OlB
0.146:
3
:
3.50
175
O.υo
Z
l
().0450
O.07B5 ‑
0.180・
1
0.:n38
0.1125
i 鍋~ー縫い仰向…
~~
Cαエラーの領域(無効中止のみ)
V
:
J.5U
1.88372
175
Z2 0.00
{
‑175
一‑:J.5U
‑:J.5U
‑ レ /
仁l
三五子‑̲..‑
0.86592
ー‑1.75
x
p
O.On
:
:
i
0
.
1
4
(
:
;
3
175
O.UU
0.0450
O.1ROl
0
'
"
:
"
U
7
8
8
0.2138
‑
1
3
3
司
:
J.5U
̲
0.1125
Ia~付金 1'bn7IT~
~~
/Q:
;
‑
&
'
}
'
J, ‑ 山 知
D αエラーの領域(有効・無効中止あり)
V
3.50
175
〆
d
Z
2
/
0.00
‑1.75
0
.
8
6
9
9
4
-~~.50
-:~.5()
P
‑"L75
o
.
n
o
X Z
1
0.0l
l
3 ‑ 0.0450
0.1463
0.1801
1
.75
0,0788
0
.
2
"
1
3
8
~~.5()
0
."
1
'
125
Ia~...:=俗的~仙一
1
7
D
無効中止ありの有意水準‑
正規分布の両側 5%点は1.96(有意水準 0
.
0
5
)
Z
2の棄却限界値は1.89189(有意水準 0.058506
中間解析を行うと有意水準が緩められる?
Z
2が1.96を超えても, Z,
が0.86994未満のときは
無効中止
‑
1
3
4・
I A S [Ill~ ::J.‑"Iー儲……ω v・6 帰無仮説と対立仮説の Zの分布 ~, I i ~~ 1 三 r ー 「 z j 1 o i ‑ 1 : ‑ 2 i ‑ : 3L一一一一一一十一一一ーァーー一一一守一日一戸二‑‑ , ー ニ ‑3 ‑2 ‑1 0 1 2 3 : 4 5 5 7 ‑ ' 9 X 一一一…ムーシンb~/ Nを増やしたときの Zの期待値 v・6 5 4 3 2 1 0 1 2 3 一一一 H。の下で青の領域に 量入る確率は2 . 5 払 • H1の下で青の領域に 私 審入る確率は90 M 組 ‑3 ‑2 ‑1 0 2 0 1 0 1 2 X ‑ 1 3 5 ‑ 3 4 理 5 6
Ir.:.~i!Od付金印刷局…ù7~~ •2Òl~ 両側検定の場合 o d sg r a p h i c so n ; p r o c seqdesign a l t r e f = 0 . 5 e r r s p e n d p s s (cref=0 0 . 51 )s t o p p r o b ( cref=0 0 . 51 ) p l o t s = (a s np o w e re r r s p e n d ) ; T w o S i d e d E r r o r S p e n d i n g : d e s i g nm e t h o d ( a l p h a ) = e r r f u n c o b f m e t h o d ( b e t a ) = e r r f u n c p o c n s t a g e s = 2 a l p h a = 0 . 0 5 alt=twosided s t o p = b o t h ; s a m p l e s i z em o d e l = O N E S A M P L E M E A N ( m e a n = Os t d d e v = 1 ) ; o d so u t p u tB o u n d a r y = b o u n d ̲ t ; r u n ; 5 1 w i l l ~ユーザー健会 PÃt--:;.t~均三叩骨神 両側検定の場合 BoundaryI n f o r m a t i o n( S t a n d a r d i z e dZS c a l e l Nul JR e f e r e n c e= 0 S g e ̲ A l t e r n a t i v e ー 凶 2 I n f o n m a t i o nL e v e l R e f e r e n c e Propo陀i A c t u a l on Lower I Bou哨 r yV a l u e s I Lower Upper ! A l p h a Beta Upper Beta A l p h a 0 . 5 0 0 0 40935 . ‑ 2 . 9 6 2 5 9 0 40935 2. 2 3 . 2 1 9 8 ‑2. . 9 6 2 5 9i . 8 7 5 4 0 2 . 8 7 5 4 00 1 .0000 43959 ‑3. 40733 3. 40733 H . 8 9 0 9 3 ー1 . 8 9 0 9 31 46. . 8 9 0 9 3 52 ‑ 1 3 6・
l
S
縞ト付金一……
.ml~
@ 両側検定の場合 ヨ
‑
6Qundory Plot
τwu Sl d・d亘,.,._SsM n酌n 田 <ù-oo~
8 ニ 0.1】
2
.
9
6
2
5
9
N
‑
E
M菅4Ea
,‑
有効域
‑
1
‑<"三包且旦
0
2
:
.
!
O
:
10
h fo
.rm.t出 向
|二
j.-:~~~-----;
土土
竺士..川山..…
T
山
.
.
川
川
一
一
J
巾
.
a
川
.
.
品
山
一
向
一
.
恥
州
"
川
川
‑‑‑‑‑‑ A~'.;' 'C' u t..u",,<:, I u
.
.
.
.
1 v 0 F概
, c"̲o
e
ψ
"
d
砂
伺"町
叫"同.,
,
C.il
,
.
J
巳
.
州
.
,
、
"
人
、
柑
.
, υ<>
53
鉱
;
(t
4
a
i
健全閉山内Z
R
&
&
消費関数
‑
1
3
7・
加~I
母 羽 幌 品 説j 治国王山心訟叫地主片山 消費のタイプ ハイリスク・ハイリターン ローリスク・口ーリターン ー 、 ‑ 〆 Pocock a 、 L ̲ ' ‑‑ 司! L1 e .̲̲J 0 'Brien 浪費家給料日前はいつも スッカラカン趣味は博打 倹約家趣味は貯金 I 5 5 ~I 総 zー 何 番 印 刷 細 川 山 南 町 拘 ン 消費関数 ̲ 1 1 . E孟E酒田E ‑ ーー . 1 ~ 1( P P ) Pocock Pocock 2(PO) Pocock O'Brien‑Fleming 3( O P ) O ' B r i e n ‑ F l e m i n g Pocock 4( P P ) O ' B r i e n ‑ F l e m i n g O'Brien‑Fleming 5 6 ‑ 1 3 8・
均一鈴向山山ワュヤム
六~[iJ
十
4つのデザインの比較
OneSidedErrorSpendinglpp:
d
e
s
i
g
nmethod(alpha)=errfuncpocmethod(beta)=errfuncpoc
nstages=2 alpha=O.025alt=upperstop=bothj
OneSidedErrorSpending2po:
r
r
f
u
n
c
p
o
cmethod(beta)=errfuncobf
d
e
s
i
g
nmethod(alpha)ニe
n
s
t
a
g
e
s
=
2 alpha=O.025alt=upperstop=bothj
OneSidedErrorSpending3po:
d
e
s
i
g
nmethod(alpha)=errfuncobfmethod(beta)二 errfuncpoc
nstages=2 alpha=O.025alt=upperstop=bothj
OneSidedErrorSpending4oo:
d
e
s
i
g
nmethod(alpha)=errfuncobfmethod(beta)=errfuncobf
nstages=2 alpha=O.025alt=upperstop=bothj
57
I 鉱E-~ーザ嚇
PocockPocock{PP)
60undory Plot
On.S.d d
E
r
r
o
rSotJnd'fll:ltp(
α
.
.
:
.002!
1 s ‑0リ
・
'
0
10
由
v
l︐
‑
1
3
9
‑
町
川
.
.
白
,
ーー‑‑‑. ^t;\;t' u~" t'''' B...",.
.
d
.
.
r
v 0 F
.・
.0司3..
"
.
.
.
1
0 Cnl'I:G'1V
g
1! A.....,向山同罰則"。
n
"
E"for,".t:坤 n
同市川刷同町...
向
1
‑
‑
:
:
l 鍋会 Pi;rðIU7jijl:.,…加~~
2 PocockObF(PO)
Bounda叩
Plo'
t
2Po(a ;
;0但 5 β = .唱}
白 咽 色d・.......島崎町 dm.
2
:
:
;•
。
z
'
a
炉
、
,
,
,
,
,
,
.
,
,
.
.
,
St.
o
l
J
0
1
:C
。
'1
。,
"
L
O
l
o
"
.
.
OR .
c
.0
2>
lnform.tiDn
山
同町申告b世 . R.ψ山 電
‑ー・ーー‑ Ar
.
r
.
由"
t
.
l
ln
r.両目印, n
d
.
A
1
'
¥
I
臼 A日 白 骨
C
' 刷
0 I.~ 骨 d-~:.a. m"l.. C
n
t
.
ι且! V
.
¥
!
同句申o:..t
.o)o'.8咽 岡 山 '
y
岳山
│
ωユ吋ー吟ャ…吋ン
[ij]~
3 ObFPocock(OP)
目
。
。
円
d
t
l
r
yPlo電
島
司
"
'
.
・
d
.
f
1
T
O
l
'
e
.
c
.
.
.
.
,
nn・
h ・,
c
.
.~ Ol)2!1 S 品
。
、3
司
lili‑‑411111filiト﹁ g
za
目
・
5
唱祖・・
2
‑
N
・
.
.
'
・・‑
e
s
t
s
‑
s a
̲
.
'
.
,
g
凋
・
,
.
,
.
,
.
.
.
..
u.
、,
1
:
.
:
:町
一
一
.
.
. 守如 ・γ ?
ーーー ι・‑ A..,
;
t
!
l
.
.
.
.
同
巳
‑"国,判畑町
f...
.
t
‑5
唱 明u
h. c..~~", v.、~
4
'
1
4
0・
‑
一
一
一
一
一
一
一
一
̲
j2
20
~含
‑
2
0
1
0
'
IWilit" 儲……&1~~
4 ObFObF(OO)
目。 undaryPlot
.
.
.
.
.
0
0
2
5 .
8 ‑01)
o.,,, ~ψ吋 E.. <)rsÞ'!O""'''c. 4 刷、 a
2
﹄
N‑E2w
a沼恒句""
、
回
,~~.'~ge
。,
2
lnfor tfon "
20
口
瓦
…
ー
…
R
…‑‑ー"':""'R̲山ふいん│
F
.
.
.
.
t
"
.
.
,
,
,
.
;
;
.
.
・
側唱・
│己
ーーーーー‑
Rふ鉱山 R-ç:;;,~ム
^
.
"
岡1,1.."t...
1:¥蜘",
.
I
.
,,'
v 0
j
υ1"C"
IV.
山 w
6
1
D
!
I
m
l
W
A
t
F
i
ー鈴叩……ω
、
、
消費関数の型
r
11
、
.
.
マ 11、'd./J
・
̲Jr
n
,
Erro Spcn血 n.
マ冨田
・・
!J
苛
日 Pocock
/ア〆
̲
‑
̲
,
.
,
‑
‑
恰電 CQ
,/
ノ~~~
2
~
̲,/
s
~
̲./
・
‑.
‑/
‑‑〆
/
/ / / / 日
l)醐 4
u
OO
i
て3
/
/
/
て
̲,/
/
'
/
J
F
a Pocock
一
ー
。
一
一
一
一
‑
‑
=
:
:
.
=
=
‑
.
.
‑
‑
‑
‑
二「二ごー 〉 obF
ー/
戸
ObF
̲
,
/
J
0(00~ '"缶-ご一一一←一一一一-,,~
「
一‑
一
一
一
‑
一一
・
包包. .
ε
。何噌品ら山仲 い叫.岬叫
.
.0
白c)n..~~臥""叫。~お‘剥a 司""れ.".区E由昆誌.O!恥“‘
一
一
一
一 一-(~..泊 d ÞdI'.何M包均与4 伺d“,..".掲‘附、
‑
1
4
1・
‑
>
|凱俗的~
期待症例数
Avora&o Sarnpfo Numbor
S
叫
F
400
5
畳
f
7
L
う
づ かてう匹1
ー、
P
吐P
「
九
¥
、
2
P〈ト ¥ 、
20P
//,
ー
句
:
息
因。
r
o
/
. /~ .
‑
'
"
'
/
.
s 70
:
づ
て
,
S
u
‑
"
"
¥
"
'
i
.
.
.
.
.
.
.
.
.
.
̲'
‑
人
,
'
‑
、"
.
‑"‑.,:‑‑‑
I
"~~,
"
‑、
ー. ー・、.
ー
ー
̲
』
ー
5
h
圃』
。
ー
。
。
。
6
。
02~
。
,
.
。
.
・・
.
。
.
1
2
:
:
:
;
Wult
.i
p .r0'R.f r nc:. DiH."Dnc
ono畠‑Mdt=.rror5twMlonllpt
One:Mdd<n"';ー..n&n
c2p o
一一喝ー-0.咽S日向~E......... S.回,岨...3 I1u
O
r.
o
:
:
;
.
.
4
0
d
E
.
.
.
.
.
.
.
.
.
4明
圃
‑
ー
『
一
‑
・
s
.
,
咽
噛
,
唱
'
b
|ωユーザー絡会~…一
201~
検出力
Powor Plol
'0
/.:.‑〆‑
‑戸ーーーー一
。
"
06
E
E
04
02
。
。
1/
000
。
.
.
。
o.
.00
01'
MulUpUor0'向 oforonooDUtoronoo
恥 .
s
面 白d
E
O
r
)
O
S
od
叫 E
.
.S
d
o
d
E
r
r
1
1圃 3
"0
dvd
一
一
ー
一
‑0
.
咽
晶
2'
町
U
O
'
"
S
u
.
.
.
.
s
;".2
帥
町
"
'
.
唱
'
'
'
'
'
U
O
'
"
S
o
.
n
Q
,
‑
一
一
一
一
一
島
市
S
o
ndma400
世
Err世 ...
唖
‑
1
4
2・
凹
'>0
1
1
ユ
ー
ザ
ー
存
会
…
一
一
9
型車
I
可 民
考察消費関数か
と て 机J
期待症例数(↓↓)最大症例数(↑↑)
2)Q
'
B
r
i
e
n
‑
F
l
e
m
i
n
g(ローリスク圃口一リターン)
1)Pocock(ハイリスク・ハイリターン)
期待症例数(↓)最大症例数(↑)
3)α 消費関数を Pocock型にすると H1の下で、の
期待症例数が減少
4)日消費関数を P
o
c
o
c
l
く
型l
こすると H
oの下で、の
期待症例数が減少
…
一
語
会
…
…
(
S
ω
‑‑刷│
可
中間解析の回数 1回(nstages=2)
・ BoundarvPfo
Oru:&d ueJNIO'gp.n由"局主《
、
1
.
.
.
:
0
0
2!
J 8̲01
噂﹄
N
‑
z
ma
z淘ベ沼田
9
2
~。
Inform.t "
…
山
町
一
←
一
一
一 一
一
一
一
一
‑
一
一
一
一
一
一
一
一
一
一
一
一
‑ 一一一一一一一一
師"
~
「市示二"同町 ・
旬
"
.
個
"
巳 e Buu J同'v ぽ。弓 F,叫喫..u‑Sam凶ut i
.
;
.
.
む<
:
t
l
lV,
,!U
̲̲9̲̲̲ A
occ
I
!
'
.
噌
‑
1
4
3・
,
,
"
一
一
同
恥
"
町
'
"
川
.
.
.
.
!1
"
1
.
"
川
一
'
D
S[t.~':=~:l金 7'Iffl.1fT'11Dl'-&' 品川崎
中間解析の回数 2回(nstages=3)
BoundaryPI。ミ
問 団m.
:
3{a ‑0025 a
‑Oり
白
、
.
.
.
.
・
.
.
.
.
.
官S
N
‑
‑
z曹司自お
一
.
.
'
."
.
.
.
.
.
.一
.
‑
,ー'
︐
t
e
‑
‑
‑
‑
‑
Sti3S:;。
1
.
~~川:
2
一
…
l
l
'
l
・
削
・n
In'
or
u
同
"
"
'
則
…
'
何
叫
川
川
伺
μ
山
叫
川
山
川
,
…
ト
.
.
.
.
. R"
I
!
.
, 'i
附f
3
"
… :A
ん
川
……
川
山吋吋勾州叩肘山
a
‑‑‑‑‑‑ Acむ守ω凶
"
噌
.
..ω臥畑u
刷
也
μ
』"
刈UUry 0 F
.
刊唆..‑ら姐.1<
守
1
"
1
.
凶
"
怜
。c
,
;
占 U綱
削
, v"
,ω
"
岬
守
一一
l
67
|総会 ü-'l:.t.W1om…i~~~
201~
中間解析の回数 3回(nstages=4)
soundary Plot
:
00・"~OoðE,.(.W'~,,,, 3 ( a :
:
;002~
B
=01)
2
N'Z宮司書昂
‑勾︐
令
日
ω
l
•
4晶
十
1
l
│
{
1
l
│
l
│
l
l
﹄
!
l
i
l
l
l
l
l
J
4
.
,
•
寸
句
J
︐
S
t
i
l
g
e
。
•
︐'一
e1
︐
•••••
15
20
4
2.
網".tJon
Infor
o R・
且
J
・
・l
a
.
.
.
.
'Aer
"
g
<
,
0 A" c:~\A"<;,,, R ・寧,~、
・
・
・
田
‑
ー
‑RIIIJ・
<
.
:
t
.
l
0
<
'
I8OUndd
ー
ー
ー
ー
ー
‑^
,
'
叫
・1............(.¥0岡...{1...y 0 F.. ooð- :;.....lμ,・ c~".".・ I V..I,
.
.
'
1
o
'
‑
1
4
4
‑
IS縞:J.~""一色合ふ?駒山山村
T
5
7
「
2
8
1
8
I
中間解析の回数 4回(nstages=5)
・ soundnryPlot
002!
J B ‑0リ
unQS
, d u丘r
l
'
1
o
M
'
S
c
Mn
d
l
l
l
c
3(
1
.
o'"
‑
・ 1
St~ 民0
En~or 胸噌 ."'on
.
じ
1
‑
‑
‑
け !
竺
川
問
…
…
1
m剛
R e
叶
川山"
一
‑‑‑‑‑‑ Ar:::乞川:
.
o
:u回
t
.
舗 巴.8.υ""
伺
肘
,
円
v
。戸..引tJ‑5o.. ぺ守 c
.
.
.
勺‑勾",、v
ん
e
ω
が
t
Jυ.
I
69
│
鉱
ー
語
会
…
…
…
一
ω
一
消費関数
Frr
n
.rSpn円 dine
.
,
/
S
r
~
/
E
//
E
e n
n
!
点
3
y'e
/
0015
~
/ ヂ
Lj
ω山 4 /,
.
, 令
/ / ; ジ 〆 /
必~. ‑
11000
Ie.ムーーーー一ーー@ーーニーー』骨
P
!
・
.
・
s・
a
.
.
"
E,.'XSa",..官叫
白噌5<<l
、一
.
泊ー
ーー
ー
一
‑
1
4
5・
←
一
一
一
C-'炉開:E.'-"福山ー~-;;-,~i'
D
Srnユーザー語会的~刈ゆ~
期待症例数
期待症例数
Avcraac S a m凶 邑 Numbcr
100
。,
,
。@
/
4;
=
=Z
弓
弓
芝
有i
♂
P
汗
!
「
「
?
j
一
一
ー
v
‑
E
a
‑
J
r
一
解
〆
イ
う
〉5
ア
〆
官
g
幽圃
』‑
// ,
/
,
,
:
‑
'
d
呈
370
4回¥ ¥ 、 3¥
回、と
,///~'/
室岡ー
.
.
.
̲
.
.
.
.
.
.
.
‑
.
.
.
.
//
../
/
。
。
。
025
050
。
"
。
10
凶i
er 0'Rofof
'onco Diffo"onco
Mult
.i
'"、骨 ~i, d・""冒or!kMr>dt n r: 7
,
.
100
由市.~..血dl rrTlol"!""~Ø,司 3l
、
7
IAS.:J.-付金~…'-'~~t?~~
201~
グ考察中間回数弘
1)中間解析回数を増加させると期待症例数は
減少
2)中間解析回数を増加させると最大症例数は
増加.
3)中間解析を 3回以上行っても,性能の変化
は小さい
~
‑
1
4
6・
m
m
I
ω
!干付金…ームン…
吋‑プ
中間解析の時期 25% info=cum{O.25,
l
}
80u円
c
:
b
Iry Plot
Of'\ U s.由止n_'"岡山 ".2~ (幽ー 00
2
"t
o I
J ‑0,1
)
F
N
‑
Z
M
モaEZ
.
.
.
.
"
'
.
・
ー
‑
a
‑
‑
‑
‑
e
R
a
1
t
s
'
0
Intorm.~同町
|μI~..j....j
…,.恥川…
川一………
"ι
叶山山川,,,川白"山"
h
^c ヒ~I>Uo"ヒ <.~ωfluur町'y
0
F
.
.
.
.寸一s.:."附"
ω 噌 G 山巳引 "、v,
.
υ
'
旬
0<
73
二
プ2
。
刷
川三千繕金問問問一
中間解析の時期 50% info=cum{O.50,
l
}
¥¥
旬。 U"dery Plot
h・
S
<d.dt
.r
r
o
rSp.n
l
l,
n.50<山‑0
.
0
,
左
!
I I
J ~ 0り
・2‑=az
‑
N
司似品目
1.ー'
‑
.
,
,
ー
"
St~ 氏。
~υI
?
?
函
子
UP
‑‑‑‑‑. A c
In旬.~前回円
R
恥"叫仲
山 管凡
叫'"劇"句<<
.υω?
叫
υ
4
州
.
.
吋
,
:
一
:
土
F
I
0
問寸一み
e
ら
"
ω
凶
u1
0
:
0C
.
.ミ"母川. Vω
,
川
J
ω
1
υ
グ<
‑
1
4
7
‑
111
会 ~7lHlll:;-&'JfJ'-:-'ン~~~
201~
中間解析の時期 75% info=cum(O.75,
1
)
80undary Plot
白、.s..・....官Sø.ndln.7~ (α ー。 02~
8̲01)
"
.
,,
,
ar
‑
‑
‑
‑
‑
‑
︐
︐
't
,
St;:)go
・
、
三
u
In'or", .tl n
I
‑
̲
‑~け】
̲.‑‑̲‑ A
町山川…町巴叫
ヒ..ロ叫色旬..宮守
刷
B帆 "
.
ψ山d附
叫
…
口
1JA
<
‑
(
;
6
.
"
F.ι.. ,C' ~-sιmωe C~.
附.円 ω
V
.
.
川i
ω
.
.
7S
i 鉱t:'''Fl$ì=2:j会 ~7lH/g:;-&~';'-'....;t1:>:-';'
201~
消費関数
ErrorSpo"di"~
医亙亙
75%
0'00
"//
50%
.
e 007(;
』
,/
占
.
‑ /
‑
+
~25ラも
/
/'
~〆
,/
/ ノ /
イ//,
ー
‑
‑
'
" 75%
J /
,/ :
'
, /‑‑‑‑‑‑‑‑‑‑
ι
ぞ イ 二 一 一 一 一 士 fL
一一 ~~-__.Q
一
P‑
c
号金・ ・
I
=
‑
‑
:
‑
=~~::一川町一
守
噌
"
喝
,
.
ーーーー-0.帽急唱曲..~ ...
76
‑148
・
I
l
I
I
l
鉱怯日禽印刷…ゅ間企
期待症例数
A
.vorlle
:
;e St
!
lmplo Num~r
l1Q
ー
一
‑
1
25%
.
/
'
ーー一ー
ー
50%
75%
︑︑
i
u
:
1レ
ノ
ヲ
/
/
︑
一
一、
J
00
・,.,
一
一
一
一
‑
。且
h ultlpU
l
1‑
ー
1
oI~
00...~.. <.I・4 ・,~司・_"",・ d~
‑
ー
ー
ー
ー 白同::‑....旬.r・
e
・
‑
前
四
時
・
・
.
>
<
>1
←
ー O嗣...拘 dE~ S.ω・同...‘"
俗的lG~ヤω
2
皿
0'
1
' f.f...・ r・ n~ ・J)ltf・'・ n~ ・
~~
考察中間の時期む
1)中間解析を後期に行っても,期待症例数の
減少は小さい.
2)中間解析を早期に行っても,有効中止は望
めないので、 H1の下で期待症例数は 100%よ
り
大きくなる.
3
)中間解析の時期は真中付近が望ましい.
('"1
1
1
.櫨‑
‑
1
4
9・
S縞 ユ ー や 錯 舎 町 … 生存時間解析の統計量 効果の大きさ: b=β=log HR V[ b ]= V山 ニ ル ィ ベ ン ( 数 1( 情報量 z= β )二イベン;数 = 会 .T = 企イベント数 百可t‑'~ ' ‑ t 7' 1 1 1会 … 一 … D 中間解析の条件の設定 生存時間をログランク検定(帰無仮説:対数ハザード比0 対立仮説ハザード比例R ) :0 . 5 :l o g ( 0 . 5 ) = ‑0.69315 対照群 Cのハザード : 0 . 3 5 薬剤群 Dのハザード : 0 . 1 7 5 j 2 . 5 % 日 : 10% (検出力: 90%) α : 片但' 登録期間: 2年 追跡期間: 5年 情報時間の半分で中間解析 1回:有効圃無効中止 エラーの消費 Q ' B r i e r トF leming型の α消費関数 P o c o c k型の日消費関数 ‑ 1 5 0・
I ゃ7 F 話 番 m … I ム ー 2 m カ 叱 想定する生存時間曲線 生存割合 薬剤群 D J、ザード : 0 . 1 7 5 対照群C J、ザード : 0 . 3 5 登録期間 一期 ﹁跡 一追 t 円。」ーで下 t ) I 縞 : J . . . . . A J ー儲……聞が ~~ S E Q D E S I G Nのプログラム o d sg r a p h i c so n ; p r o cs e q d e s i g na l t r e f = O .6 9 3 1 5 e r r s p e n d p s s (c r e f =0 0 . 51 )s t o p p r o b (c r e f =00 . 51 ) p l o t s = (a s np o w e re r r s p e n d ) ; O n e S i d e d E r r o r S p e n d i n g : d e s i g nm e t h o d ( a l p h a ) = e r r f u n c o b fa l p h a = O .0 2 5 m e t h o d ( b e t a ) = e r r f u n c p o c beta=0.10 n s t a g e s = 2a l t = u p p e rs t o p = b o t h : 1/. s a m p l e s i z em o d e l = t w o s a m p l e s u r v i v a l c‑‑ーてで笠 ( n u lI h a z a r d = O .3 5a c c t i m e = 2 foltime=5): 、ふ~、b o d so u t p u tB o u n d a r y = b o u n d ̲ s u r v ; r u n : "~曹p r a p h i c so f f ; j[̲ 叫 担 も o d sg ‑151・
鋪
…
D
e
s
i
g
nI
n
f
o
r
m
a
t
i
o
n
D
ω
:
J
.
‑
"
J
ー 儲 71ff
1
.
7fH/C
脚
、
噌J、
,
日d
,
̲
I
.
"
,
"'''''::;ヨ::::-..,.~
S
t
a
t
i
s
t
i
cD
i
s
t
r
i
b
u
t
i
o
n
、
I円 TLI
I
Normal
BoundaryS
c
a
l
e 棄却限界値の統計量
S
t
a
n
d
a
r
d
i
z
e
dZ
A
l
t
e
m
a
t
i
v
eH
y
p
o
t
h
e
s
i
s 対立仮説の方向
I
U
p
p
e
r
E
a
r
l
yStop 中止基準
司e
c
tN
u
l
l
Accept/R
Method
rSpending
E庁 o
中間解析の方法
BoundaryK
e
y 棄却域構成する上で制御する過誤
Both
A
l
t
e
r
n
a
t
i
v
eReference 対立仮設
0
.
6
9
3
1
5
Number0千Stages
2
A
l
p
h
a
0
.
0
2
5
01
Beta
1
09
i
Power
MaxI
n
f
o
r
m
a
t
i
o
n(
P
e
r
c
e
n
t0千F
i
x
e
dS
a
m
p
l
e
)
Maxl
n
f
o
r
m
a
t
i
o
n
2
4
.
1
2
8
1
5 イベント数/4
N
u
l
lRe
千ASN(
P
e
r
c
e
n
to
fF
i
x
e
dS
a
m
p
l
e
)
65.68762 Hoの平均イヘント数
.RefASN(Percent0千F
i
x
e
dS
a
m
p
l
e
)
A
lt
9
0
.
9
4
0
3
1H
lの平均イベント数
ASN:AverageSampleNumber 期待症例数
83
~
~ユーザー健全均lJm.Gl畑"=J!lI~:m:I!l
MethodI
n
f
o
r
m
a
t
i
o
n
Bound叫
│Method
A
l
p
h
a
Upper
A
l
p
h
a
E庁 o
r
Spending
0
.
0
2
5
0
0
Beta
E庁 o
r
Spending
A
l
t
e
r
n
a
t
i
v
e
Reference
対数HR
D
r
i
f
t
H
lの下で
のZ統計量
Approx
O
'
B
r
i
e
n
‑
F
l
e
m
i
n
g
0
.
6
9
3
1
5
3.
404782
Approx
Pocock
0
.
6
9
3
1
5
F
u
n
c
t
i
o
n
UpperBeta Eπor
Spending
0
.
1
0
0
0
0
3.
404782
キ
.
r
r
対数 HR
PowersandExpectedSampleS
i
z
e
s
Reference=CRef*
(
A
l
t
.R
e
f
e
r
e
n
c
e
)
SampleS
i
z
e
C
r
e
f
対数HRI二対する
効果をC倍
Power
0
.
0
0
0
0
0
.
0
2
5
0
0
6
5
.
6
8
7
6
0
.
5
0
0
0
0
.
3
7
9
6
1
8
7
.
8
0
0
1
1
.0000
0
.
9
0
0
0
0
9
0
.
9
4
0
3
P
e
r
c
e
n
t
F
i
x
e
d
‑
S
a
m
p
l
e
‑
1
5
2・
84
:鍋~ー儲 uum…~~ 0 2Òl~ 各ステージの中止確率 期待中止ステージL191二 1本0080922+2本(1‑080922) ExpectedC u m u l a t i v eS t o p p i n gP r o b a b i l i t i e s A lt .R e f e r e n c e ) R e f e r e n c e=CRef ( * CRef Expected S t o p p i n gS t a g e Source S t o p p i n gP r o b a b i l i t i e s S t a g e ̲ 1 S t a g e ̲ 2 0 . 0 0 0 0 1 .1 9 1 R e j e c tN u l l 000153 002500 0 . 0 0 0 0 1 .1 9 1 AcceptN u l l 0 . 8 0 7 7 0 0 . 9 7 5 0 0 0 . 0 0 0 0 1 . 19 1 T o t a l 0 . 8 0 9 2 2 1 .0 0000 0 . 5 0 0 0 1 . 5 9 2 R e j e c tN u l l 0 . 0 3 9 3 0 0 . 3 7 9 6 1 0 . 5 0 0 0 1 . 5 9 2 AcceptN u l l 0 . 3 6 9 0 6 0 . 6 2 0 3 9 0 . 5 0 0 0 1 .5 92 T o t a l 0. 40837 1 .0 0000 1 .0 000 1 . 6 4 9 R e j e c tN u l l 0 . 2 8 9 4 3 0 . 9 0 0 0 0 1 .0000 1 .6 49 AcceptN u l l 0 . 0 6 2 0 1 010000 1 .0 000 1 .6 49 T o t a l 0 . 3 5 1 4 4 1 . 0 0 0 0 0 8S W I U J E..ß':lユーザー鎗会!L'I.t.l1G~咽シ同シ 棄却限界値とエフーの消費 BoundaryI n f o r m a t i o n( S t a n d a r d i z e dZS c a l e ) N u l lR e f e r e n c e=0 S t a g e I n f o r m a t i o nL e v e l A l t e m a t i v e BoundaryV a l u e s R e f e r e n c e Upper P r o p o r t i o n A c t u a l 1 E v e n t s Upper Beta A l p h a 0 . 5 0 0 0 1 2捌 08 1 4 8 . 2 5 6 3 1 2. 40754 086944 296259 2 4 . 1 2 8 1 5 1 9 6 . 5 1 2 6 2 3. 40478 189189 189189 2 E r γ o rS p e n d i n gI n f o r m a t i o n S t a g e I n f o r m a t i o n L e v e l I C u m u l a t i v eE r r o rS問 由 I Upper P r o p o r t i o n 0 . 5 0 0 0 2 1 .0 000 86 ‑ 1 5 3・
I r n … ユーザー儲 71IYI.7rt'uD ω 201~ BoundaryValuesとエラーの消費 中 間 解 析 上 側 :2 . 9 2 5 6 9 下側:0 . 8 6 9 4 4 Z=logHRx‑ J i 0 . 6 9 3 15 > <‑ J12.06408=0.69315 > <3. 47 3=2. 4075 0 . 6 9 3 15 > < ‑ J24.12815=0.69315 > <4.912=3. 40 478 LJDm( 仰))=0削 5 3 C 勺 VF(N(2. 40 7 , 51 I ー総会的… Samp[eS i z eSummary Test Two‑Samp[eS u r v i v a l N u l lHazardRate 0 . 3 5 HazardRate(GroupA) 0 . 1 7 5 HazardRate(GroupB ) 0 . 3 5 HazardR a t i o 0 . 4 9 9 9 9 9 l og (HazardR a t i o ) ‑ 0 . 6 9 3 1 5 ReferenceHazards A l t .Ref A c c r u a lRate 年あたりの畳録数 6 3 . 3 5 7 5 7 ( 1 2 6 7 1 5 1/2) A c c r u a lTime 登録期間 2 F o l l ow‑UpTime 追跡期間 5 T o t a lTime 登録期間+追跡期間 7 MaxNumbero fEvents 9 6 . 5 1 2 6 2 MaxSampleS i z e 最終までの症例数 1 2 6 . 7 1 5 1 ExpectedSamp[eS i z e( N u l lR e f l 1 2 6 . 7 1 5 1 ExpectedSamp[eS i z e( A l t .R e f l 1 2 6 . 7 1 5 1 ‑ 1 5 4・
…
ー
シ
IM
熔
ウん{万個目
解析時点と症例数
I
│
T
N
w
u
m
o
‑
b
s
ersofEvents(D)andSampleS
I
Z
e
s(
N
)
ampleLog
‑RankTest
r
a
c
t
i
o
n
a
lTime
Stag F
e
D
2
C
e
i
l
i
n
gTime
n
f
o
r
m
a
t
iTimlN N(Gr N(Grpl
n
f
o
r
m
a
N(G巾 N(Grpl
n
p1
) 2
)
2
)
e
t
i
o
n
1
)
。
4
8
.
2
62
.
9
2
3!
1
2
6
.
76
3
.
3
6
127 63
63
12.
4327
9
6
.
5
1
127 63
63
24.1282
6
3
.
3
6
イベント数
続
!
症例数
S
I
縞ユイー録制閉山
棄却限界値の図示
80vndary Pfot
Oo D~d・d 己,~Sp・ ndll'陣 <a ‑ OQ~ !J
︐
4
︐
J
域
〆a ︐ 却
棄
効
J
J
f
‑無
‑g
︐
︐
.•••••
‑
/
f
RY
一︿
一
﹁l1lllll
﹂
V
一
一
﹁1111111﹂
j
JZ
8 ~O ,)
$t̲ag
̲
o
V
‑
同
‑
d
n
h 句 rrn.tlc>n
同
叩
^
1.1
1
.
.
., 川 町 . . ..
.
0 戸川町.t‑OGmu!..0
"
¥
'
<
'
;
'
1
1 V.
,
!ue
網
• • • • • • Ae
.
"
"
,
,
,
l
.
I
I""o S帆J"U'I~
"
.
l~ ~ ~ .;:~.
.
~~~::c~町
90
‑
1
5
5・
ma."':s;~会的問問リ市町 WJl~ エラーの消費 ErrorSpendina : 白、.s;曲 dErr̲Sp・ n山 崎 〈 α : ; :002~ / I: ;01) 。 100 OWAV 目目 E E出E22EE‑‑ ︒︒ 0 . 1 0 0 0 0 。 000 。 ・ s. . . . 111 禽……一WJl~ ・ Averoac S mple Nl , . lmbe . , 白,.Soid.dE.,.曹5cHII1dIItII ( a ; ; 002~ i 無効中止の / I =。 廿 //「¥¥有効中止の マ能性大 可 能 ザ/ ま γ γ 。。 。 。 。 , . 。 。 ¥ 。 " ・・ ・ '00 '2> 。 君 ' Multtph.rof肉 .f.r.nc 0 ff.rene 92 ‑ 1 5 6・
I
m
ュ
ザ
』
話
番 …
…
201~
7
1
i
Y
i
.
1
i
f
.
'
J
薬剤効果と検出力
検出力
。・・
Powor Plot
n.Sd dヒt
rC
f
"
S
o
.mllna( a :: QOl!
.
o B ‑u1
)
'0
••
.
a
4
.
Jノ
./
OD
。
!
K
)
07
,
f
・・
100
・
Mult
.i
o
l
i
l
t
r
r ~r RCtfor nu Oitforonu
対数 HRIこ対する比
I
縞ユーザー縫い駒山ふー訓示
l
i
2
6
1
8
1
デザインの結果
登録期間: 2年
目標症例数:
追跡期間:
5年
1
2
6
.
7
(
2 群計 128) 6
3
.
2
5
/年
期待イベント数:
9
6
.
5
(
C :
5
5.
4
中間解析の時期:
3年 (
2
.
9
2年)
(期待イベント数:
4
8
.
3
(
C :
3
0.
4
Z1 > 2
.
9
6
2
5
9 :有効中止
ZI<0
.
8
6
9
9
4 :無効中止
D:
41
.1
)
D:
1
7
.
9
)
氏主
_,~ f
t
も
タぷf
l
/~~
krM
タ
0
.
8
6
9
9
4 <ZI<2
.
9
6
2
5
9 :継続
最終解析
Z2>1
.8
9
1
8
9 :有効"{̲c:::::〆
9
'
‑
1
5
7・
│純日ー縫い…一加 wll~ 棄却限界の S A Sデータセット化 テ、ータセット b o u n ds u r v S t a g e ̲I n f o P r I n f o o p ̲ 2 E v e n t sN u l l R e fA l t R e f Bound Bound U UB UA 2 . 0 6 4 04 0 . 5 0 0 0 1 8 . 2 5 6 3 1 0 . 8 6 9 4 42 2 . 4 0 7 5 40 . 9 6 2 5 9 1 . 0 0 0 0 2 4 . 1 2 8 19 6 . 5 1 2 6 1 0 .89189 1 . 8 9 1 8 9, 3. 404781 , 9 1 1 ~~ ー ユ ー ザ ー 総 会 印 刷 山 …ω シナリオ ‑Z 哩陪圃・ 1 2 3 4 1J 圃圃圃圃圃圃圃園︑ 凪幽圃函幽圃 1 ︑ J 継続 有効 継続 無効 1 ︑ J 有効中止 1 ︑ J 無効中止 。 @ , .‑ 一 ' , 司 ? 圃 2 96 ‑ 1 5 8・
l E ‑ sE ーや儲 m 尚 一 一 一 七 ml~ qf nU ﹄ nv ' + L・ 4EE41aFhu TI‑‑ nunu+L e ︐ t u. zr o r‑‑ G 司 nHHnunu JUH円 JUJU anu‑‑ +L= 一一v o ︐ . r一n 仮想的な中間解析データ 中間解析は計画通り!こ 可置 はいかない event=1; i f TrtGp=1 then year=ranexp(4989)/O.35; i f TrtGp=2 then year=ranexp(4989)/(O.35*hr); ctime=1+2*ranuni( 4 9 8 9 ) ; i f year >= ctime then do;year=ctime:event=O;end; output; end:end: 97 1 1 1 会的問!.fnm づ WIJ~ L lFETESTによる解析 proc Iifetest data=year̲l notable plots=(s); time year*Event(O); strata TrtGp/test=logrank; ods output HomStats=outs; ods output LogHomCov=outv; r u n ; 98 ‑ 1 5 9 ‑
2 0 1 0 Sr.!'~jー倣~~~~ë1~~ 仮想的な中間解析結果 ( 3年後) : 守 士 二 一: J J J Gj ¥ 一 二l e ‑ ‑ l l l ロ グ ー=2.22871 p=O.O258 揃ユ+錯舎一!I.!l…ë1~~ L lFETESTによる解析結果 201~ 打ち切りと非打ち切り値の数の要約 層 T o t a ! │全体 死亡 打ち切り 1 ¥一セント 打ち切り 50 2 7 2 3 4 6 . 0 0 50 1 7 3 3 6 6 . 0 0 1 1 0 0 4 4 5 6 5 6 . 0 0 ~160 ・
I 鍋ユーザー範番町内…一時三 HJ~ データセット l o g r a n k ̲ 1の加工 b 九四 E ‑ 3 一 data l o g r a n k ̲ 1: m e r g eo u t so u t v : k e e pV a r i a b l e̲ S c a l e ̲Stage̲S t d E r rE s t i m a t e ; c o r e '; ̲ S t a g e ̲ =1 : ̲ S c a l e二, S S t d E r r = s q r t (̲ 1 ); E s t i m a t e = L o g R a n k ; V a ri a bI e = 'T r t G p '; i ft r t g p = 1t h e no u t p u t : p r o cp r i n t : ti tI e' S t a g e 1T e s tS t a ti s ti c s '; r u n ; 2 l o g H R = E s t i m a t dSE =7. 32 2 4 1 3 . 2 8 5 4=0.6784 I s ω 焔 胤 ユ ' = i ザ 予 吋 ザ 苧 ‑ SEQTESTによる中間解析 棄却限界:SEQDESIGN 解析:L lFETEST o d s graphics o n ; proc seqtest boundary=bound̲surv parms(testvar=TrtGp)= l o g r a n k ̲ 1 nstages=2 order=stagewise CONDPOWER PREDPOWER P L O T S= a11; o d s output test ニt e s t ̲ s u r v ̲ 1; r u n : o d s graphics o f f ; ‑ 1 6 1・ 1
総長事総……û>~~ 201~ D e s i g nI n f o r m a t i o n BOUNDARYDataSet BOUND̲SURV (SEQDESIGNの結果) DataSet LOGRANKJ (LIFETEST の結果) S t a t i s t i cD i s t r i b u t i o n Normal BoundaryS c a l e S t a n d a r d i z e dZ A t t e r n a t i v eHypothesis Upper E a r l yStop c tN u l l Accept/R町 e Numbero fStages 2 Alpha 0 . 0 2 5 Beta 00979 Power 09021 MaxI n f o r m a t i o n(Percento fF i x e dSample) 1 0 9 . 5 0 9 3 Maxl n f o r m a t i o n 2 4 . 1 2 8 1 5 4 3 N u l lRefASN( P e r c e n to fF i x e dSample) 6 4 . 0 6 7 5 5 A l t .RefASN(Percento fF i x e dSample) 91 .9 4305 103 鉱 │S ~~ ユーザー繕舎一…一知 エラーの消費 E r r o rSpending 川情報時間が0. 4473のときに行うので エラーの消費は減少 0 O曲 旨﹄占 ~ 豆 g J 0田 E 2 巳2 004 ̲ ̲ . , 002 。 。 ・・ St g 10 ‑ 1 6 2・
向会問向山均的 .
円
m
m
中間解析結果の判定(継続)
T
e
s
tI
n
f
o
r
m
a
t
i
o
n(
S
t
a
n
d
a
r
d
i
z
e
dZS
c
a
l
e
)
N
u
l
lReference=0
a
l
u
e
s
A
J
t
e
r
n
a
t
i
v
e BoundaryV
Test
I
n
f
o
m
唱 t
i
o
nL
e
v
e
!
R
e
f
e
r
e
n
c
e Upper
TrtGp
P
r
o
p
o
r
t
i
o
n
A
c
t
u
a
l
Upper
Beta
A
l
p
h
a
E
s
t
i
m
a
t
e
A
c
t
i
o
n
0.
4473
1
0
.
7
9
3
6
1
2
.
2
7
7
2
5
0
.
6
7
2
8
5
2
.
9
9
6
6
8
2
.
2
2
8
7
1
Continue
1
.
0
0
0
0
2
4
.
1
2
8
1
5
3.
40478
1
.
9
0
6
0
5
1
.
9
0
6
0
5
0
.
8
6側
1
2
.
9
6
2
5
S
t
a
g
e
2
計画段階の
棄却限界
105
ふ
│S
ユザー尚印刷一一戸 … ¥
J
2
由
。
:
中間解析結果の判定(継続)
」
T".
,
:tr
l
o
tf
o
'
‑T司 Gp
3
r
N
'
z宮 司 高 話
目.~~~g-~
.
・
一
一
"
>
1
君。
,.
z“ rort".~ion
阿古京高市三三二口^,..,.~c 山….,… OT.,,,t. 5t
.
.
J
l
>
;
t
:
可
10
‑163・
制 [ 1 SAS.:J.-~ー倣印刷…ン抑 中間解析の結果(継続 )0 登録期間: 2年 中間解析の時期: イベント数: 1 0 0例登録 3年 44( C: 2 7 D: 1 7 ) (期待イベント数: 4 8 . 3 ( C : 3 0. 4 D: 1 7 . 9 ) logHR = ‑ 0 . 6 7 8 3 8, HR = 0 . 5 0 7 4 4 0 . 6 7 2 8 5 <Z[= 2 . 2 2 8 7 1 <2 . 9 9 6 6 8 :継続 条件付き検出力: 0 . 9 7 5 7 2 予測検出力: 0 . 9 0 0 2 7 107 |飢~]ー儲OiÆt.HGl…一 wll~ 条件付き検出力 (ConditionalPower) 試験開始時点:最終解析で有意になる確率 90% Z lとZ 2が未知 中間開始時点:最終解析で有意になる確率は? @ a ? Z lは既知, Z 2が未知(確率変数) Z lの条件付きで、 最終的に有意になる確率が 低ければ試験を無効中止 場 10 ‑ 1 6 4・
ω . . I 鋪ユザ司会一一 ‑ ‑ 2 O l 0 ' 条件付き検出力 (ConditionalPower) C o n d i t i o n a lPowerI n f o r m a t i o n (条件付き検出力) Reference= CRef ( A lt ̲R e f e r e n c e ) * S t o p p i n g Stage Reference 最終解析 までの Zの増分 MLE logHR C o n d r t i o n a l Power Ref CRef 0 . 6 7 8 3 8 MLE 0 . 6 7 8 3 8 NuJ l 。 0 . 2 8 8 1 6 0 . 5 0 0 0 0 . 7 6 0 1 5 1 . 0 0 0 0 0.97572 1 .5000 0.99940 0 . 9 7 8 7 0 . 6 7 8 3 8 0 . 6 7 8 3 8 A l t e r n a t i v e 0 . 6 7 8 3 8 0 . 9 7 2 4 7 109 I‑ 寸」健会…i j ' ; ' B … 叩 " 2 O l 0 I 条件付き検出力 (ConditionalPower) Condi t . ional Power Plot 10 08 08 t L ‑ S 04 / Z 想1定 +対立仮説の 02 。 。 。 025 050 075 100 125 市 50 Reference / Altern. . t i v喧 110 ‑ 1 6 5・
S
r
n
ユーザー縫い…ーン
201~
2種類の検定と信頼区間 C
I
H
R
:薬剤群に対する対照群のハザード比
H
o
:HR
く1
,(
l
o
g
H
Rく0
)を水準αで検定
H H
R
>
l,(
l
o
g
H
R
>
O
)
α水準の下側 C
Iがo
を含まなければ有意
,
:
(有効中止)
H
o
:H
R
>
2,(
l
o
g
H
R
>
l
o
g
2
)を水準日で検定
H,
:HR
く2
,(
l
o
g
H
R
くl
o
g
2
)
。水準の上側 C
Iがl
o
g
2を含まなければ有意
(無効中止)
E .:z.-~-.*
2
0
1
0
l
"
f
f
i
7
f
WQHW
,
‑
,
,
,
,
:
,
.
j
f
,
i
‑
s
;
r
gb
n
pe
nvgb
o
a
hthtト川l
l
M
L
E
Mct
川 内w
er
l
0
.
6
7
8
3
8
R
a
̲
.
・
lEE
1
0
.
9
0
0
2
7
・
"
'
.
.
.
"
.
.
.
i
i
d
C
d
l
lF
id
l
t
"
c
P私自巴
i
1
3
1
j
α
1
水準の
水準の
│上側信頼区間リ下側信頼区間
H
0
.
6
7
8
3
8
H
oもH
lも棄却
l
│(予耐力)
Ho
u
│
されないのす続作
1
1
2
‑
1
6
6
・
l . ユート越金問…一 ‑ ‑ ‑ 2 O l 0 : 仮想的な最終解析結果 ( 7年後) , l ''‑‑L, 可 ログランク ~ ‑ . . . z ニ2 . 45 250 ¥ヘ」ー'‑‑‑‑‑,一同 0142 1 ¥ ¥ 」 」 ー 「 。 l f t Lー ー イl 。 " 仏 、 も ST R . ζ仁.‑¥:百、 t Gp=I ‑TItGp=2 . "Cel l . s o r e dTrtGp=1 日向仁:ell~Ol唱d 唱 TrtGp=ヱ 1 1 3 m 縞ユーザー儲 n w ; . f w ; w W1 ーシ ログランク検定の結果 ‑ 1 6 7・ wll~
2Ü1J~ D e s i g nI n f o n n a t i o n BOUNDARYD a t aS e t WORK .BOUNDSURV D a t aS e t WORK.LOGRANK̲2 S t a t i s t i cD i s t r i b u t i o n N o r m a l BoundaryS c a l e S t a n d a r d i z e dZ A l t e m a t i v eH y p o t h e s i s U p p e r E a r i yS t o p A c c e p t / R e j e c tN u l l Numbero fS t a g e s 2 A l p h a 0 . 0 2 5 B e t a 015653 Power 0 . 8 4 3 4 7 MaxI n f o r m a t i o n( P e r c e n to fF i x e dS a m p l e ) 1 0 2 . 5 8 2 2 MaxI n f o r m a t i o n 1 8 . 8 1 7 9 8 7 5 N u l lR e fASN( P e r c e n to fF i x e dS a m p l e ) 6 9 . 5 9 2 1 5 A l t .R e fASN( P e r c e n to fF i x e dS a m p l e ) 8 9 . 8 3 4 6 4 115 ~ ~ユーザー範金~ill.H.l 判定結果(有効) Testlnformation(StandardizedZScale) N u l lReference=0 Alternati 80undaryValues ̲Stage̲ Test ve lnformationLevel Referenc Upper TrtGp e Proporti Actual Upper 8eta Alpha Estimate Action on 0 . 5 7 3 6 2 . 2 2 8 7 1 Continue 1 0 . 7 9 3 6 1 2 . 2 7 7 2 5 0 . 6 8 3 3 6 2 . 9 9 6 6 8 2 45250 Reject .9 3 7 8 1 1 .9 3 7 8 1 2. 8 . 8 1 7 9 9 3 . 0 0 6 8 6 1 1 . 0 0 0 0 1 N u l l 116 ‑ 1 6 8 ・
m s WlJ~ ザ 縫 い 府 … 叫 最終解析の判定結果(有効) PlotrorTrtCp T~IS( a N ‑ Z M曹司書昌 ド¥ 一 一 ‑ , 主t. : l ig c :̲ .冒 ' 0 1 " ' (10..聞民泊 n " 望 。 ̲ τ s . . . . t , , ,i て1 同弔2言百芯清三石吉寸ヨヌ O:<:~日l1f",τ有c Y.' ....ナ す 干 . , , , 1 1 官 首 玉 ‑ 3 日 4 ー←一一一一一一 ..~ ~ , S~.,,~ @ 汁 ふ 頼区聞が 0 ないので 却 ‑一一一一 一一ー む ' " 酬 ' " ・ I t of " r . . 1 .. """,附一一‑..・かけー‑‑~.~-...,ハ2 ‑ 1 6 9 ‑ 11
I総~J:Fl会 ièiiJWÞP;!.WHSdttゅ~~ 最終解析の結果 登録期間 :2 年 1 0 0 例登録 中間解析の時期 : 7年 イベント数:7 9 ( C: 4 3 D:3 6 ) (期待イベント数 9 6 . 5 ( C: 5 5. 4 D:4 1 . 1 ) 0 . 5 6 5 3 5, HR=0 . 5 6 9 1 6 logHR=‑ 2=2. 45 2 5 0 : 有効 1 . 9 3 7 8 1<Z 119 総~ー範禽 OHL~加知山 唱 刷 ~~ 疑問 ログランク検定の P値と結果カ 異なるのはなぜ? Median E s t i m a t eとはイ可か? 20 ‑ 1 7 0・
I 2 帥│ 随 時 儲 u‑ f c J 8 ) i l .P :. i , p J l ‑I o I : 1 l r 7 ' ' ; ' : ; p f 直=0.0076 3 τ一 = 0.7574 rニ ..JO.言 3 . 5 0 この領域の確率は 0 . 7 6 % 2 . 45 2 5 0 凶笠空 175 r Z2 0 . 0 0 / J /' ・ 『 ー ‑ ー‑ ー ‑"175 0 . 6 8 3 3 6 一 ‑‑ ‑3.50・ ‑3.叩 0 . 0 0 ‑1.75 175 3 . 5 0 x Z1 0 . 0 1 2 2 ‑ 0.0487 ‑ 0.0853 ‑ 0.1584 0 . 2 3 1 5 O .L ' i 50 p 0 . 1 2 1 9 1?1 山 一 番 印 刷 泊 山 市 出 向 シ ~~ MedianEstimate(0.5649859)の下での分布 5 . 0 0 ;一一一一一一ー HU Hu q4 2 . 45 2 5 0 ‑ ‑ ‑ ‑ マ ー i .,,‑‑.. Z2 0.75 ; . . ム" ' 1 i ケf 己/二 1 ・この領域 /, f p / 50% ‑1.381 (θ~, ‑350j ‑3.50 e. J I : ) r1, 1 ; 1 r . ‑135 0. 75 χ p t 2 . 8 t l 0.0122 ‑ 0.0487 ‑ 0.0852 0 .1 ' 532 0 .' l B47 0.231 ' 2 ‑ 1 7 1・ 5.00 Z1 O.12V 12
Ib ……
付 金 m
m
1
0
│
w
95%下限 (
0
.
1
8
2
7
1
)の下での分布
この領域の確率!ま 5%
350[
L
.
q
.OLOU
/ グ / ' ~φ/
ι三シ〆
Z
2
/
‑175
1
"
内U
‑175
AU
-~~.50
h
u
‑3.50+
x
p ‑ 0
.
0
1
2
2‑ 0
.
0
4
8
7
0
..
1
584 .
.
.
. 0
.
1
9
5
0
175
3
.
5
0
Z
l
0
.
0
8
5
3
0
.
2
3
1
5
O
.
1
2
I
D
1
.
'
Ib
~IIIJ~
ザー総会内町テゥ……
一標本Z検定。=1,Ho:μ=0
ι
z‑一三一 =‑
;
.
J
N
N(O,
I
)
N
(
‑
;
.
[
N
,I
)
N((三‑1.9
6
).
J
万
,1)
0
.
0
2
5
Z
‑
1
7
2・
'
2
1
lS縞汗蝕 ~7lH/QHリ山川
201~
町
中間解析で有効中止
.
.
,
̲
、
e
弘 一 九 一 同 → 十 守 ‑ "
I
L
.
.
.
一
一
司
,
.
̲
"
‑
,
「
司
岡
'
0
1.
ー
骨
ー
‑
.
‑
,
Z=4.11414
p<.0001
S
'
l
Hぺ
r
:
九
:
Tr
:
C
.
;
!
,
=I
TrcGp=2
灯、 C" l.~' '
1
'
"
'i
1
'
rl(;p= I
"'C
手LSOI
・
:
r
lT
1
t
G
r
'
=!
.
I
.S
W
I
I
I
J
~ユーザー鎗舎 m野別淘e:wmm軒拘ン
!
TestI
n
f
o
r
m
a
t
i
o
nC
S
t
a
n
d
a
r
d
i
z
e
dZS
c
a
l
e
)
N
u
l
lReferenceヱ O
!
̲
S
t
a
g
e
̲
Altemative
80undaryValues
Test
I
n
f
o
r
m
a
t
i
o
nL
e
v
e
!
Reference
Upper
TrtGp
P
r
o
p
o
r
t
i
o
n A
c
t
u
a
l
Upper
Beta
A
l
p
h
a
E
s
t
i
m
a
t
e
A
c
t
i
o
n
0
.
3
5
4
4
8
.
5
5
2
1
6
8
2
.
0
2
7
0
5
0
.
2
9
1
4
9
3
.
0
6
6
9
4
4
.
1
1
4
1
4
R
e
j
e
c
tN
u
l
l
1
.
0
0
0
0
2
4
.
1
2
8
1
5
40478
3.
1
.9
2563
1
.
9
2
5
6
3
一
一
一 .
,
.
.
1・
z吐 ド 『 申 l'Qr I Go
‑
i
‑lSUEi
・
2
,
.
.
F
' 一・・明
l
3
2
"
一~ー..‘ー・一・
R・一一
n一
・一
.
一
.
一
一
'
.
'
一
一一一
・
"
一
一晶
一
・
ー,一一圃
・
司
時
同 ...'h
‑
一
一
.
.
一
.
.
'
.
.
.
.
:
.
.
.
1
H
F
4
‑
1
7
3・
H
l
F 咽
R
1
:ー儲……ンU7~~
201~
一町布一
一 許hu
一lL
一 円U
一
一
一
"
̲
恒
I
E
s
t
i
m
a
t
e
晶
11
.
40
6829
4
1<口町
一件
40
6829
│
1.
O‑F
1
1
e
I
p
‑
V
a
l
u
ef
o
r
I
HO:Pann=O
一r ‑ n d
一
一
!
日
匂
川 LE
│
I
Median
Stage
‑nヨ 一 マ ︐
r
一
一l L ‑ n u
p
I
…i
w
n
g
一W
I~…r
山tes
Stage‑WiseO
r
d
e
r
i
n
g
,
.
同
"
1
'
1
0
.
rlCgn
.
f
i
申剛日 j
"
1~~~.1
;
'
H
i
l
l
j下側信頼区聞がo
:
i を含まないので
I
lH
Oを棄却
にと欧州h句一一-,.~~,._:!
l
.
‑
‑
.
.
. (,町村・明・ '
1
D
IAS.:l-"f-8会~片山押印
中間解析で無効中止
S
t
a
g
r
! 11
8
s
tS
t
a
t
i
s
t
i
c
s
Z=O.09980
‑
ち
t
o
̲
.
,
̲
γ 1 1 i『 h p = U W
ーで司、
‑ ‑‑‑‑‑
ぬ
│
・
@
.
,
..
'
刊ヘコモ午
。
,
̲
,
r
;
;
ST
R
.¥
T
.
¥・ 一首・ tGp=)
‑1HGp=三
"
'
C
0
1
1
<
;口n
x
lTrtGp=1
"
.
"
C
e
l
l
ぅo
r
e
d百¥
:
t
G
p
=
:
!
.
一
128
‑
1
7
4・
、
守
~ユーザー繕禽?昔抑制1'E!"".-PlIl均ゆン
1
r
I
I
I
I
]
Te
5
t!
n
f
o
r
m
a
t
i
o
n(
S
t
a
n
d
a
r
d
i
z
e
dZS
c
a
l
e
)
N
u
l
lReference=口
̲
S
t
a
g
e
1
2
A
l
t
e
r
n
a
t
i
v
e BoundaryValues Te5t
l
n
f
o
r
m
a
t
i
o
nL
e
v
e
l
Reference Upper
P
r
o
p
o
r
t
i
o
n A
c
t
u
a
l
Upper
TrtGp
A
l
p
h
a
Beta
E
s
t
i
m
a
t
e A
c
t
i
o
n
0
.
5
5
2
8
1
3
.
3
3
7
9 2
.
5
3
1
4
6
1
.0
3325 2
.
6
5
1
7
4 日日制口
1
.0
000
2
4
.
1
2
8
1
5 3.
40478
1
.9
0004 1
.9
0004
ー
T・",.崎~
B
I
Acc叩 tN
u
l
l
(
o
r,
同
a
.
.
一 一 一 一
人 ¥
ー
ー
・
ー
r
.
J
ュ
ミ‑
'
r
.e
'
ー
ー
ー
ー
ー
ー
‑
‑
‑
,
‑
」 一 一 一 一 一
晶一司
u
.
・
0
0
1
.
.
.
̲
.
.
.
.
.
・
・
1
調
ー
1I ..~....ー=-""・R 晶出向 i
!
u
.
.
̲
.
山田,̲
】'
"
129
。
z
;;;-~ol~
・
1
F
τ戸 石 弓
n
1
,,10'同 町
孟孟石示;;,;;-:.~-,. 勾・・…"
‑
1
7
5・
130
I 付禽!ilt.~…拘ン 2Òl~ LOG画面の出力 • W A R N I N G :T h eC O N D P O W E Ro p t i o ni sn o t a p p li c a b l ea f t e rt h eg r o u ps e q u e n t i a l t o p s . t ri aIs • W A R N I N G :T h eP L O T S = C O N D P O W E Ro p t i o n i sn o ta p p li c a b l ea f t e rt h eg r o u p s e q u e n t i a lt r i a ls t o p s . • W A R N I N G :T h eP R E D P O W E Ro p t i o ni sn o t a p p li c a b l ea f t e rt h eg r o u ps e q u e n t i a l t ri aIs t o p s . 11 Option DesignParameters ALTREF= D e s c r i p t i o n s p e c i f i e sa l t e r n a t i v er e f e r e n c e BOUNDARYSCALE= s p e c i f i e s s t a t i s t i cs c a l ef o rtheboundary MAXINFO= T a b l eOutput ERRSPEND s p e c i f i e smaximuminformationl e v e l d i s p l a y scumulativee r r o rspendinga teachs t a g e PSS d i s p l a y spowersandexpectedsamples i z e s STOPPROB d i s p l a y sexpectedcumulativestoppingp r o b a b i l i t i e s GraphicsOutput PLOTS=ASN d i s p l a y sexpectedsamples i z e sp l o t PLOTS=BOUNDARY d i s p l a y sd e t a i l e dboundaryp l o t PLOTS=COMBINEDBοUNDARYd i s p l a y scombinedboundaryp l o t PLOTS=ERRSPEND PLOTS=POWER d i s p l a y se r r o rspendingp l o t d i s p l a y spowersp l o t ‑ 1 7 6・
I 鋪ユーザー飴 filiib>>J'i'!!:J加 叫j 刊 じ て ~~ DESIGN文のオプション Option Description DesignParameters ALPHA= s p e c i f i e sType1errorprobabilityl e v e l ALT= s p e c i f i e stypeofalternativehypothesis BETA= s p e c i f i e sTypeIerrorprobabilityl e v e l BOUNDARYKEY= s p e c i f i e stypeoferrorprobabilitytomaintain lNFO= s p e c i f i e sinformationl e v e l s NSTAGES= s p e c i f i e snumberofstages STOP= s p e c i f i e sconditionf o rearlystopping BoundaryMethods METHOD= s p e c i f i e smethodsforboundaryvalues I~g;es総… SAMPLESIZE文で解析可能な指標 Option s One‑SampleMod巴I D e s c r i p t i o n ONESAMPLEMEAN s p e c i f i e sone‑sampl巴 t e s tf o rmean ONESAMPLEFREQ s p e c i f i e sone‑samplet e s tf o rb i n o m i a lp r o p o r t i o n Two‑Sampl巴 Models TWOSAMPLEMEAN s p e c i f i e stwo‑samplet e s tf o rm四 nd i f f e r巴n c巴 TWOSAMPLEFREQ s p e c i f i e stwo‑samplet e s tf o rb i n o m i a lp r o p o r t i o n s TWOSAMPLESURVIVAL s p e c i f i e sl o g ‑ r a n kt e s tf o rtwos u r v i v a ld i s t r i b u t i o n s R e g r e s s i o nModels REG s p e c i f i e st e s tf o rar e g r e s s i o nparameter L O G I S T I C s p e c i f i e st e s tf o ral o g i s t i cr 巴g r 巴s s i o nparamet巴「 PHREG s p e c i f i e st e s tf o rap r o p o r t i o n a lh a z a r d sr e g r巴s S l o n parameter ‑ 1 7 7・
2 0 1 0 " IS縞~ー除問向山知Ú1~~. SEQTEST文のオプション Option I n p u tDataS e t s D e s c r i p t i o n BOUNDARY= s p e c i f i e sd a t as e tf o rboundaryi n f o r m a t i o円 DATA= s p e c i f i e sd a t as e tf o rparametere s t i m a t e sandi n f o r m a t i o nl e v e l s PARMS= s p e c i f i e sd a t as e tf o rparametere s t i m a t e sands t a n d a r de r r o r s Boundaries BOUNDARYADJ= s p e c i f i e sboundaryadjustmentf o ri n f o r m a t i o nl e v e l s BOUNDARYKEY= s p e c i f i e sboundaryk e yt om a i n t a i nTypeIandIe r r o rp r o b a b i l i t yl e v e l s BOUNDARYSCALE= s p e c i f i e sboundarys c a l e ERRSPENDMIN= s p e c i f i e sminimume r r o rspendingf o rt h eboundaries MAXINFO= NSTAGES= T e s tV a r i a b l e s p e c i f i e smaximumi n f o r m a t i o n s p e c i f i e snumbero fs t a g e s DATA(TESTVAR=) s p e c i f i e st e s tv a r i a b l ei nDATA=d a t as e t PAMRS(TESTVAR=)s p e c i f i e st e s tv a r i a b l ei nPARMS=d a t as e t 13 11一番… MHTMmw -281~ SEQTEST 文のオプション Option Description CITYPE= s p e c i f i e stypesofconfidencei n t e r v a l TableOutput CONDPOWER d i s p l a y sconditionalpowers ERRSPEND PR印 POWER d i s p l a y scumulativee r r o rspendinga teachstage PSS d i s p l a y spowersandexpectedsamples i z e s R C I d i s p l a y srepeatedconfidencei n t e r v a l s STOPPROB GraphicsOutput PLOTS=ASN d i s p l a y sexpectedcumulativestoppingp r o b a b i l i t i e s d i s p l a y sp r e d i c t i v epowers d i s p l a y sexpectedsamples i z e sp l o t PLOTS=CONDPOWER d i s p l a y sconditionalpowersp l o t PLOTS=ERRSPEND d i s p l a y se r r o rspendingp l o t PLOTS=POWER d i s p l a y spowersp l o t PLOTS=RCI d i s p l a y srepeatedconfidencei n t e r v a l sp l o t PLOTS=TEST d i s p l a y sboundaryp l o twitht e s ts t a t i s t i c s 136 ‑ 1 7 8・
尚三千尚一一一一一.柄小ケD 参考文献 l)WaldA : S e q u e n t i a lA n a l y s i s .Wiley ,NewYork, 1947 2 )PocockS J:Groups e q u e n t i a lmethodsi nthe d e s i g nanda n a l y s i so fc l i n i c a lt r i a l s .Biometrika 64:191‑199, 1977 3 )村岡了一,小出俊彦,青木保典ほか:臨床試験 のための中間解析‑基礎から実施するまでー. サイエンティスト社,東京, 2004 DeMetsDL:D i s c r e t es e q u e n t i a l 4)LanKKG, boundariesf o rc l i n i c a lt r i a l s .B i o m e t r i k a7 0 :659‑ 1983 663, ‑ 1 7 9 ‑
~~ 川三十健全……同 岡田絵理 l ミ口づ日本リスク・データ・パンク株式会社 調査企画部 E r iOkada , SeniorManager Research& PlanningDepartment, TheRiskDatabanko fJapan,L imited 斗」ニ :辺住説副主主;王制崩州艇凶ぬ 、 調 峰 要旨 信用スコアリングモデルの構築は RDB の主な サービスの一つであるが、モデル構築の事前作 業として財務指標に関する分析を実施し、デフォ ルト先の判別に有効な要因を把握し、その知見を モデル構築に活用している キーワード:スコアリングモデル、 AR、説明変数の有効性 、 r、 F ι二 主盟立盟 ‑ 1 8 3・
Ip [IJl~ 付 金 … … … 資料の構成 1 日本リスター手ー事リ:\~f).{RÐB) について 1 ‑ 1 . RDBの主な事業内容 1 ‑ 2 . RDB データベースの特徴 1 ‑ 3 . RDBスコアリングモデルの特徴 rliiL : l 二一一三三;瓦塾頭理明事積雪; 2 ‑ 1 . 分析対象データについて 2・2 . 指標聞の相聞の確認 2 ‑ 3 . 単一指標分析によるデフォルト判別力の確認 2 ‑ 4 . 指標聞の相対比較によるデフォルト判別力の確認 11 1 ・1 . RDBの主な事業内容 出晴 拠欄 の 叫 外 一摺 一hfm ナ四 ‑d 願 一先蹴 一信制 一与田 円什 U R いいいじ 共同データベース運営 l 四大金融グループおよび地方銀 0の金融 │行を中心とした全国約 6 │機関が参加し、各会員の与信先 ~I 企業の情報を共有している 1 ・データの還元 (データの分析・加工) ・モデルの提供 サービスの提供 正弘; ‑ 1 8 4・ 門川川口凶 I~I 11 門川U 主な提供サービス
【中園地方】 5行 t 【関東・讃ー 【近畿地方] .甲信越地方】 7f :r重 n ~ー 岨一一一一I E 4 【九州地方】 9行 【四園地方】 4行 一 一 ̲ . . . 1 【北海道・ 東北地方】 5行 【中部地方】 9行 【大手行等】メガバンク、商社、リース他 , │ミムャーい… 1 ・2 . RDB共同データベースの特徴 l 個人事業者 信用 DB 格納データ数 約 60万社 1 m共同一データベース 格納データ数 約4万社 格納データ数 約2万5千社 斗ぷニ ‑ 1 8 5 ‑ t オペリスク : DB (準備中)
2 0 1 0 I I似わ即府~・加t~~~ 1 ・2 . RDB共同データベースの特徴 ‑日本全国のデフォルト事象の約 7割をカバーしている ・時系列の財務情報が取得できる ・メガパンク、地銀、第二地銀、商社・ノンバンク等の保 有データが継続的に集積され、ベンチマーク性が高い e必 【H:土あたり決算期数】 シ (平均 5 . 1期) 【売上規模情成】 /~・・・・h 【業種構成] 曹幽嗣│ (参考)中小企業白書 童 ・ 岡 、 、 、 ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ 1I ' o e 司 ‑ 鴫 凋 . . ‑ ‑ 軍 里 司 (中央値 2 0 6百万円) … 川一一わ.二I ~IIIl~ 1 ‑ 2 . RDBデータベースの特徴 事業法人データベースに関する主なサービス 信用情報、財務情報等のデータ還元 モデル構築、検証等に利用可能なデータの提供 RDB企業デフォルト率の計測九 同開相理~ , ‑ 過去の実績デフォルト件数から算出した企業デフォルト率を 月次にて提供 中小企業財務統計資料の発行蝿凪 代表的な財務指標に関する集計結果を提供 スコアリングモデルの提供(後述) ‑ 1 8 6・ ‑・副 w " ー ' ‑ 目
見 ) 且 ‑ : 1 : . 日 エf L ‑ 2 J r t ー註立組'ViJ.‑.泊 三 脳 出 品 が ほ 注 ト3 . RDBモデ jレ(RDBによる信用スコアリングモデ jレ)の特徴 , r~~J_.;;':~~_.:ニ { 'i c/ t , ) 財務指標に関する分析 ・指標聞の相聞の 確認 ・単一指標分析 ・指標聞の判別力 の相対比較 ‑y 定期的にデータのモニタリング を実施し、その情報をモテル 構築に活用する。 1 1 1 2 . ! 財務指標に関する分析 一一一一一 単一指標分析によるデフォルト判別力の確認 年度別データにより指標ごとのデフォルト半1J l 1 l力を計測し、判別力の 水準の変動等を確認する。 (注)判別力の評価にはAR(AUCと等価)を用いた。 ARの定義!ま参考資料を参照。 指標聞の相対比較によるデフォルト判別力の確認 年度別データによりモデルを試作し、採用される説明変数を比較する。 説明変数は基本的にはデフォルト判別に有効な財務指標から採用さ れるので、当該指標の相対的な判別力を時系列にて確認する。 1 別にはどのような財務指標が有効であるか、 分析結果からデフォルト半] 時系列でのデフォルト半1別力に変化があるかを把握できる 10 斗ぷニ ‑ 1 8 7 ‑
Ia~ユ十健全~ロー 2 ‑ 1 .分析対象データについて 分析対象デコタ 。 2003年度から 2008年度までの 6年間のステータス(信用状態) に関するデータ 。財務情報はステータス認定時点の前年の決算期のものを利用 財務指標 4 。財務分析等で使用されることが多い財務指標のうち、欠損値や 異常値の少ない約 100指標を対象とする 。分析に利用しやすいように上下限値の設定や対数化を行う 1 1 2・2 . 指標聞の相関の確認 分析対象とした指標聞の相聞を確 認するため、因子分析を行う。その結 果を利用し、 ζ の後の分析結果の解 釈を容易にするため指標をいくつかの カテゴリに分類する。 因子分析には SASの FACTORプ ロ シジャを利用し、主因子法により因子 を抽出した。その結果、 1 1の因子が得 られた。財務指標は因子負荷量の大 きさにより分類し、各カテゴリに含まれ る財務指標の特徴から因子の解釈を 行った。 因子の解釈 債務負担 収益性 債務返済 能力 自己資本 金利負担 不健全資産 流動性 資金効率 営業コスト 効率性 企業規模 (注 ) 1 1の因子のいずれに対しても負荷量が小さい指標に ついてはその他として分類し、 E 十12のカテゴリとした。 ‑ 1 8 8 ・ ヨ両~J
Ib宇髄~… 2 ‑ 3 . 単一指標分析によるデフォルト判別力の確認 年度別データに対する AR上位5指標 指標単独でのデフォルト判別力の有効性を確認するた め、年度別データにより指標ごとにARを計測した。 ARの 算出には SASの FREQプロシジャを利用した。 ARの上位5指標をみると、いずれの年度においても金 利負担、債務負担、自己資本に関する指標が判別力が 高いとし巧結果であった。 !年度創データに対するAR の上位5指携が属するカテゴリ 債務負担 金利負担 自己資本 13 三 凶 ニ ユ E ゅ……HンWlJ~ 2 ・3 .単一指標分析によるデフォルト判別力の確認 時系列での ARの変動 時系列で、みた場合に指標ごとのデフォルト判別力に変 動があるかをみるため、 ARの変動の大きさを確認する。 資金効率 【 ARの変動が大きい指標】 AR の.・ i l l; t ; 1 ! ぃ 指 ・ 、 ・ ‑' ‑ ' W ' : ‑ . . ̲ ・ ‑ ‑ . ̲ . ‑ 、 . ー h ~. 炉 . 事 、仁二'‑ 、 . . . . ‑ 運転資本比率 固定長期適合率 自己資本総利益率 流動比率 固定比率 売上高運転資本比率 自己資本経常利益率 '一、'" 流動性 ~ . ‑ ‑ー 自己資本 自己資本営業利益率 キャッシュレシオ 当座比率 醐 岡 山 . . 問 時 間 月 間 " . 問 時 (注)変動の大きさは年度聞の最大値と最小値の差により判断 した。 AR の正負の意味 i 立、正の場合は指標値が大きいほ ど債務者の信用力が高いことを示す。 1 . 斗 ぷ ニ ユ ‑ 1 8 9 ‑
|ω日一綿~ロ… 2 ‑ 3 .単一指標分析によるデフォルト判別力の確認 胴 晴 治 ・ ' " 、 . . . 向 . . . ・ 時系列での ARの変動 不健全資産 【 ARの変動が小さい指標】 資産その他資産率 ARの .blll*~~ 咽・ 総資産事業資本率 流動資産その他流動資産率 収益性 経費キャッシュフロー率 ROA 売よ高税事 l 前当期利益率 売よ高キャッシュフロー率 倶 " 思 ., ∞ ! tS ZOC渇 . ." 鋼 零 ., ω1 1 1 2001." 2 1 1 : 総支出キャッシュフロー率 (注)変動の大きさは年度聞の最大値と最小値の差により 判断した。 AR の正負の意味 l 立、正の場合 i ま指標値が 大きいほど債務者の信用力が高いことを示す。 現金預金当期利益率 売よ高当期利益率 1 5 K : : : ! l鉱 S. : t ‑ 付 金 …m … 2・3 . 単一指標分析によるデフォルト判別力の確認 分析結果 。債務負担、金利負担に関する指標はいずれの年度にお いても ARが高く、変動も比較的小さいため、デフォルト判 別に有効であり時系列でもその有効性は比較的安定して いるといえる 。流動性、自己資本、資金効率に関する指標はARの変動 が大きく、直近になるにつれ判別力は低下している 。収益性、不健全資産に関する指標はARの変動が小さい ‑190・
山 ふ ザ ー 飴 … ム・W 1 J白 州 事2 2 8 1 8 ] 2・4 . 指標聞の相対比較によるデフォルト判別力の確認 モデルの説明変数は基本的にはデフォルト判別に有効 な指標から選択されるので、これによって指標の相対的な 判別力を確認することができる。 最初に年度別データによりモデルを構築する。モデルは ロジスティック回帰モデルとし、 SASの LOGISTICプロシ ジャを利用した。変数選択は変数増加法により行い、各モ デルとも 1 5指標を選択した。 次に各モデルに採用された 1 5指標について、 2 ‑ 2の指標 分類結果に基づき 1 2のカテゴリに分類し、各カテゴリのモ デルに対する寄与度を集計した。 コ i I D 総 会 … …ω 2‑4.指標聞の相対比較によるデフォルト判別力の確認 【各カテゴリのモデルに対する寄与度】 100¥ E圃 > て 80¥ H m砂防 60¥ 40¥ 20¥ 日% ∞ ∞ 2 3年度 20叫年度 2005年度 2006年度 2 7年度 2008 年度 モデル 斗iユ ニ ‑ 1 9 1・ 1 .
Ip←恥……hン~~ 2 ‑ 4 . 指標聞の相対比較によるデフォルト判別力の確認 町 分析結果嵯 E ・各モデルについて寄与度が高い指標カテゴリをみると、 2003年度から 2005年度までは流動性、ついで金利負担の 寄与が大きかった。その後 2 006年度は収益性、流動性、 2007年度は金利負担、債務負担、 2008年度は収益性、債 J 慣に寄与度が高かった 務負担のI ・指標カテゴリ別に見た寄与度の時系列での変動に注目す ると、流動性、自己資本については寄与度が低下傾向にあ る一方で、収益性、債務返済能力、効率性については寄与 度は上昇傾向にあった ・債務負担、金利負担についてはいずれの年度のモデルに おいても寄与度は比較的高く、変動は小さい 19 正k … … 一 一一一回lD │ い; ' 4 f i ' 総括 本稿では、デフォルト判別にはどのような要因が有効か、ま たその有効性に変動があったかということについて分析した。 その結果、債務負担、金利負担といった要因は、分析対象 とした2 003年度 ‑2008 年度のいずれの期間においてもデ フォルト判別に有効であり、債務者が過大な債務を抱えてい ないか、金利負担の水準は妥当であるかといったポイントは デフォルト判別において重要であると考えられる。 今回取り上げた手法は、過去に構築したモデルの有効性を 判断する際にも活用できる。一般的にはモデル改訂の基準に ARが利用されることが多いが、モデル採用指標についても定 期的に検証を実施し、想定どおりの有効性が維持されている か確認する必要があろう。 20 1 9 2・ ー
川
一
健
全
…
P
f
t
s
j
j
I
1
5
f
2
j
2
側
t
y
i
,
o
:
i
I
参考資料 AR
について
1
α
n
ム
︑
‑
?
守hh恥‑mwuR
間制
単宵叫AMm
、
20
臥
、
2
c
1
デフォルト串
'、"
" 穆ョ、
・
累積金体比2
1
(
'
)
¥
AR=2xAUC‑1 :
AR(AccuracyR
a
!
i
o
)は、モデルの判別能力
を評価する統計量である。デーヲセットに含ま
固に並べ、デフォ
れる企業をモデルスコアの昇l
ルト先の累積構成比率を縦軸、対象企業全体
の累積情成比率を横軸としてプロットした曲線
をパワーカーブとしづ。モデルに判jJ
J
1能力が全
くない場合、この曲線は原点と縦繍軸の値がと
もに 100%の点を結ぶ直線となる(ランダムモ
デル)。一方、理想的な判別能力がある場合
は、この曲線は点(全体のデフォルト先件数比
00%)と原点および点 (100%,100%)を
率
,1
結ぶ2本の直線で表される (
1~ーフェクトモデ
ル)。実際のモデルとランダムモデルの曲線に
はさまれる部分と、パーフェクトモデルとランダ
ムモデルの曲線にはさまれる部分の面積比を
ARという。
2
1
正正三
同ミザミ今一一一一辺~'-,.-
‑
‑
‑
r
;
'
f
i
'
"
で
f
I帆l
参考文献
[
1
]L
a
r
r
yHatcher
,r
AStep‑by‑Stepapproacht
oUsingSASf
o
rF
a
c
t
o
rA
n
a
l
y
s
i
sand
S
t
r
u
c
t
u
r
a
lEquationModelingj,SAS
[
2
] 永田靖,棟近雅彦, r
多変量解析入門 j,株式会社サイエンス社
[
3
] 田中豊,森川 l
敏彦,山中竹春,冨田誠 r
一般化線形モデル入門 j,共立出版株式会社
[
4
] 丹後俊郎,山岡和枝,高木晴良, r
ロジスティック回帰分析 j,朝倉書庖
11
口昇,敦賀智裕, r
i
言用リスクモデルの評価方法に関する考察と比較 j,金融
向山下智志, )
2003)
庁金融研究センター (
問自国佳子 r
倒 産 予 知 の 実 務 j,日本経済新聞社
[
η 藤井虞理子,竹本遼太, r
中小企業のデフオJ
レトリスクとその期間構造:大規模財務データ
による実証分析 j
,FSA
リサーチレビュー第6号 (
2
0
1
0
)
r
a
z
z
i,
Ang
e
l
oSecchi,FedericoTamagni,r
F
i
n
a
n
c
i
a
land
[
8
]G
i
u
l
i
oB
o
t
t
a
z
z
i,MarcoG
fEconomicsandManagement
EconomicDeterminantso
fFirmD
e
f
a
u
l
t
j,Laboratoryo
WorkingPaperS
e
r
i
e
s
(
2
0
0
9
)
問大久保豊,尾藤岡1,r
プライムレート革命 j,社団法人金融財政事情研究会
[
1
0
] 柳津健太郎,下回啓,岡田絵理,清水信宏,野口雅之, rRDBデータペースにおける信用
リスクモデルの説明力の年度問推移に関する分析 j
,第27回 JAFE巨大会予稿集 (2007)
斗
ぷ
ニ1
‑
1
9
3・
Ia~~総会7ilTt7/T'J)C~'J1}2-~.I t,.~:t~ 本件に関するお問い合わせは、下記までお願い致します。 日本リスク・データ・パンク株式会社 干1 0 5 ・ 0 0 1 1 東京都港区芝公園 1 ・ 8 ・ 2 1芝公園リッジピ J レ 9F 2 1 8 8F A X : 0 3・ 5 4 2 5・ 2 3 3 2 T E L :0 3 ‑ 5 4 2 5・ E ‑ m a i l:jimukyoku@riskda!abank∞. j p h t t p : / / w w w . r i s k d a ! a b a n k . c o . j p . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . :本置料の作成につきましては弊社保有の子一世ベースその他慣組に足ると判断した情報に基づき正確性を :期しておりますが、その完全性を保医するものではありません。また向容は作成時車における量者の個人的 :な見解垂示しており.所皿金社の公式見解を示すものではありません。 ・ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 三与ζ 1 9 4・ ー : i
SASユーザー総会 金融犯罪対応業務における SAS の活用 早川武志 ビジネス開発本部 R Iゲルブマネージャ SASI n s t i t u t eJ a p a n株式会社 目次 皿金融機関の挑戦 多様化する金融犯罪 • SAS の挑戦 金融犯罪の徴候を発見するシステムへの応用 .アラート検知のための複合アプローチ ‑ルール =ブ口ファイリンゲ .データマイ二ンゲ ・ソーシャルネットワーワ . まとめ S泊 ‑ 1 9 5・ amI
金融機関の挑戦 多様化する金融犯罪 i マネーロンダリンゲやテロ資金供与に加え、振り込め詐欺・還付金詐欺と言った不正口 0盗難、インサイダー取引・横領 座利用、インターネット取引の増大に伴うなりすましゃ 1 │等の内部不正など、金融機関は多くのリスクに晒されています。 主主 ‑ D主主立与Z 量忌~.,. 圃圃圃園田米国向田犯罪ヅループが軍空白慢責話などで詐取した壷 を埼王、千葉牢どの壷融担闘を通じてマネーロンラ リンヅし e f 長…一 嶋 一 挙 r 一 一 鍾鍾 41 ー 睦.t' 極込詐欺で 264万 円 被 害 (2009/8産経新聞) 軍空 1 青草詐欺で約 1000万円被害 (20091 金融機関 王記立王宣=盤~ F E ヨ 顧客の預壷など総姐で計約 1偉 5800万 円を着服 (2008/8 産経新聞) ~ 一 、 ‑ 担 当 が 惜 のM&A(合 併 ・ 買 収 } に 関 す る 未 公 開 情 報 出 血 棒のインサイ fー取引を行っていた疑い (2凹 9/6産経斬聞) 公開買い付け (T08lした際、元社員 1 主位現前に情報を把揮し、 知人に聞社株の踊入を促したり.自ら買い付け (2009/8 日経〕 園・圃園圃圃圃圃画監 守 ……… 万 長J /置、 ‑KS 明帯?司圃 SASの挑戦 金融犯罪の徴候を発見するシステムへの応用 金融犯罪司住を完見つするためのシステム機能として、①金融機関が持っているシステ│ ムのデータを集約②パッチプロセスにより金融犯罪の徴候とされる「アラート」を生成 ③アラートを詳細調査することで、本当の金融犯罪を識別していく(ケース管理) ④統合的なレポート分析環境⑤システム管理が挙げられます。 aE 理里遺空哩圃 ‑ 1 9 6・
アラート検知のための HybridC複合)アプローチ
旦盟
│
、金融翻防検知
一 │
圃圃.18回~室町i'l.'軍司2 軍沼田園圃
盤蓋
圭盗飽l
J
レール
ソーシャJ
レネットワーワ分析
m
z
r
z
:
:
ァ一一寸
圏 全
-・~-+:I:曹九百司・E
アラート検知のための H
ybrid(橿合}アブロ チ
[-~ルール(既知のパ担ーン)
一 一
・・・・・圃・田沼~l 'fy]' 必圃園田園・・圃
属性や、取引振りの集計をもとに、
設定された闇値を超過(もしくは
下回る)ケースをアラー卜として抽
出する。
I
F商 品 = 以xa
n
d総入金額〉しきい値
廿1巴n
;
アラート生成
E
I
s
e…
;
‑
・
・
・
・
・
明
日
丑
、 f;'I'..1JJ'l:JJ哩
・
・
・
・
I
F送金先=イラン
廿1巴n
;
アラート生成
E
I
s
e.
.
.
;
EE 認否 f _:U-,F~Þ.~'i羽目哩:1 1 .
.
闇値は外部ファイルや DB
からパラ
メータとして渡される方が運用しや
すい
条件を緩〈設定すれば大量に、厳
しく設定すればアラー卜が発生しな
いため、十分怠データ分析が必要。
I
F月間海外送金額j月間送金額〉しきい値
廿l
e
n
;
アラート生成
E
I
s
e.
.
.
;
プログラム的には条件分岐であら
わされるため、条件を決めさえすれ
ば実装は比較的簡単
‑ID.'烹核開T
電7事 曹 司 ・
l
轟 轟轟轟樋難勧
r
明"‘'・・・・ø_・・4・同舗内仰.~・.'・,
‑
1
9
7
‑
a~~司圃
アラート検知のためのHybrid(複合)アプローチ ブ口ファイリンヴ(未知のパターン) -_J・-.n:jJV1ifii!:~'=抗a・・・ ‑ ある個人の取引を時系列に 1 Jら ペ 、 一定範囲の取引額の偏差を取り、 その偏差より「一般的怠範囲」を 決定する。 限引額 ・ある取引が、この期間内で設定さ れた「一般的怠範囲」を超過した 場合にアラー卜を生成する。 ・個人の取引動向をベースに異常と 1 Jる領域が決定されるので、絶対 J闇値より個々のデータの状況 的1 が反映されやすい。 一般的怠範囲の決定には 「標準備差 x2J(2シゲマ)が用い られることがあるが、十分怠データ 分析による検証が必要 時間 園風見豆空軍司圃 月号守2 J g i 議猷i らーン) ‑ すでに既知のマネー口ンダラー、も しくはテロリストがいる前提で、ター ゲッ卜集団の傾向をデータマイニン ゲ手法を使ってモデル化する 置覇軍国 ・手法は決定木、口ジスティック回 帰、ニューラルネットワーク怠どが利 用できると考えられる。 ・できたモデルは定期的に運用し、 顧客のマネー口ンダリンゲリスクを計 算して一定値以上であれほアラー 卜を生成することが想定される。 ・日本では、「疑わしい取引の届 ' 1 1 ‑・ ‑ 出」まではできるが本当にターゲツ 卜だったかという情報を正確に入手 することは現時点では困難。 血 L -・EヨE理~理町哩・・ 圃 ・ ・ ・ ・ ・ ・ ・ ・ 画 醤 匙 i ‑ 1 9 8・ ・ ・ 型 a E定室ヨE
アラート検知のための Hybrid( 複合)アブローチ ソーシャルネットワーク分析(組織的怠パターン) ‑ 属性や、取引の相手先 1 J .どをリン つしていくことにより、ネットワークを 形成して、ネットワークの情報から ターゲット集団を発見する手法 . ネットワークの作成方法は 2種類 ハード')ンワ(属性が一致) ‑ソフトリンク(行動によりリンクが形成) 3 a﹄ t 引 F L b a a p . ネットワークの接続数や集団の相 互関係から指標を計算し、しきい 値以上の集団をアラー卜として抽 出する も s t , s ・ 単一のエンティティでは判別し難い ケースにおいて有効と考えられる。 " ill 包 r I ' . , a ' a・~ まとめ ‑金融機関において、各種金融犯罪対策の必要性が高くなっている 圃金融犯罪対策システムの機能は一般的に下記と怠る ・データを集積して .疑わしい取引を見つけ出し .詳細調査する ・検知のアプローチは以下 4パターンがあるが、データマイニンヴとソー シャルネットワーク分析はこれからの分野 ・ルール ・ブ口ファイリンゲ .データマイニンゲ ・ソーシャルネットワーク s~?~I ‑ 1 9 9・
‑ 2 0 0・
一 三 一 … ー シ ‑281E SASを用いたローン時価評価ツールの開発 羽柴次郎、李絡 みずほ第一フィナンシャルテクノロジー、金融工学第二部 D e v e l o p m e n to faL o a nV a l u a t i o nT o o lbySAS J i r oHashibaandL iQi F i n a n c i a lTechnologyDepartmentNo.2,Mizuho‑DLF i n a n c i a lTechnology ! 縦 一 緒 舎 一 … … 要旨: みずほ第一フィナンシャルテクノロジ一社が開発したロー ン債権の時価評価ツールを紹介し、内部ロジックの実装に 用いられた SASの活用事例について紹介する。 キーワード:時価評価、ローン、最適化 ‑ 2 0 1・ ‑叫
I~j日総会……ω [Ill~ アジェンダ . 1 弊社のご紹介 1 1.ツール開発の背景 11.ローン時価評価ロジックの概要 I V .まとめ Ip←ゅ……ω~IIJ~ 1.弊社のご紹介 各業態で日本を代表する銀行・生保・損保を株主とする金融緩術開発事門会社 .株主 株式会社みずほコーポレ ト銀行 (60%) 第一生命保険株式会社 (30%) 株式会社損害保険ジャパン (10%) ‑主な業務 リスク管理(モデル開発・コンサルティング) . 投資・運用手法の開発 ・ 新商品モデル開発(デリパティブ・証券化商品) ‑主な顧客 金融機関(銀行・保険・投資顧問) 公共機関 ・事業法人 ‑ 2 0 2・
ω Iユーザー蝕…リユ… 1 1.ツール開発の背景 .m~ 金融機関が抱えるローンの時価評価の必要性が高まっている A)銀行のビジネスモデル転換 従来の問権金融モデル 企業に一度貸出せば、満期まで資産を持ち切り(プライマリ市場のみの非流動的市場) 司デメリッ卜貸出先の信用力低下に伴う撮失リスクを満期まで抱え込むことに 新たな「市場聖間接金融」モデル 債権譲渡条項によりローンの中途売買が可能に(セカンダリ市場も加わった流動的市場) 司メリット金融機関の与信ポートフォリオの柔軟なリスク・ 1 )';lーンコントロールが可能に =課題セカンダリ市場でのローン芳買E務の涯勿佐・会E佐の活保が市場紘大の鍵 B) 国際会計基準へのコン 1 ¥ ージェンス 経済のグローバル化により企業活動や投資資金が容易に国境を越えるようになり、各国企業の 開示情報を統一的基準で評価したいとしヴ投資家ニーズが高まってきた コ各国が国際会計基準の適用を相次いで決定する中、日本でも 2010年3月期より、 定の要件を 満たす上場企業の連結財務諸表について、国際財務報告基準 (IFRS)を任意に適用可能に コ課題金融機関においては、 B / Sの太宗を占める盆M i f f f a , 1 'の緑{ i ! f f i f { i ! f f ; がひとつの焦点となる .~ユ+俗……ω201~ 日.ツール開発の背景 A)銀行のビジネスモデル転換:シンジケートローンによる市場型間後金融 ・シンジケートローン(シ・ローン)の典型的プロセス ①アレンジャーとなる金融機関が複数の参加金融機関による協調融資団を組成 ②アレンジャーが借入人と参加金融機関の間で各種調整を行い、貸出条件を設定 ③②で設定された条件の下でロ ン組成・実行 ④適宜、参加金融機関と第三者金融機関との問でローン売買取引(流動化)を実施 ‑203・
I 鈴~や蝕印刷PE…~~,,~ 201~ 1 1.ツール開発の背景 シ・ローンの残高は着実に積み上がるも、組成金額・流動化実績はやや頭打ち 金額 (10億円) シンジケートローンの市場規模 7 0 . 0 0 0 6 0 . 0 0 0 5 0 . 0 0 0 4 0 . 0 0 0 3 0 . 0 0 0 2 0 . 0 0 0 。 1 0 . 0 0 0 2004年 初 日 5年 2006年 2007年 初 日 8年 初 日9年 圃期末残高月組成金額 流動化実績 出典全国銀行協会の公開資料をもとに弊社作成 ミ [o c ; e j ー 総 会 … … ー シ ~~ 1 .ツール開発の背景 B)国 際 会 計 基 準 へ の コ ン パ ー ジ ェ ン ス : 金 融 商 品 に お け る 日 本 の 対 応 ' 2 0 0 8年 3月、企業会計基準委員会 l 立、日本の会計基準と国際会計基準の差異を補正 0 1 0年 3月 3 1日以後終了する事業年度 するため「金融商品に関する会計基準」を改訂、 2 の年度末に係る財務諸表から適用されることに 金融商品 債権 有価 証券 貸借対照表価額 取得価額から貸倒引当金を控除した金額 注記事項 売買目的 金融商品の時価等に 時価(時価把握が著しく困鍵なものを除く) 関する事項を明記 満期保有目的 取得原価 子会社・関連会社株式 取得原価 その他有価証券 時価(時価把握が著しく困難なものを除く) 運用を目的とする金銭の信託 当該信託財産の構成物の評価額の合計 デリパティブ 時価 金銭債務 債務額 ‑ 2 0 4・
I .. 付金一一片山ふ? ? ?プ~mJ 1 1.ツール開発の背景 金融機関にとって、園際会計基準に員J Iしローンを時価評価するメリットは伺か? ‑金融商品の聞での評価方法のミスマッチによる損益変動を緩和できる 銀行では、ローンのデフォルトリスクを CDSのプロテクションによってへッジする取引が一般的 CDSI 立原則時価評価 以下のように、ローンを簿価評価するか時価評価するかで、銀行の P/Lの様相 i 立大きく変化 勺三子¥コ 凡 ト 二τ 平定する (ぬ除問…一向 . ‑ ~. 2Ò~ül 川.ローン時価評価ロジックの概要 ? y‑)レは「生存確率算出モジュー jレjと「現在価値算出モジュール Jにより構成 例として「元本 B、固定利率 c 、期間 T年、利払サイクル 3ヶ月」の期目 指返済型ローンを考える ‑生存確率算出モジュール 市場デ ヲを用いて、ディスカウントファク告‑D ( t )と生存確率 S ( t )の期間構造を推定 コぶ年後までデ/;t)L- Hj~い確率 ・現在価値算出モジュール D i s c o u n t e dCashFlow(DCFl法により、ローン時価=審l 引現在価値 PVを計算 ‑ 2 0 5 ‑
I s."J!1十縫い… 川.ローン時価評価ロジックの概要 生存確率算出では、「市場参加者の視点│多踏まえた信用力評価が必要 ‑企業会計基準委員会による時価の「定義」 │時価とは公正な評価額をいい、市場において形成されている取引価格、気配文は指標その他の相 l 場(以下「市場価格」山。)に基づく価舗をい叩場価格がない場合には合理的に算定された 価額を公正な評価額とする。 l 0号・金融商品に関する会計基準 出奥企業会計基準第 1 ‑上記の定義を踏まえた、生存確率 S ( t )推定のための基本方針(ウォーターフォー jレ) 当該ローンの市場価格を再現するように 5 ( 1 )を推定 計算対象であるローンと同一条件の ローンの市場価格が取得可能か? 計算対象であるローンと類似した商品性を 持つ金融商品の市場価格を再現するよう ( 1 )を推定 に5 11 ヤ片付金問… 川.ローン時価評価ロジックの概要 「市場参加者の視点 l 多勘案するためのデータには一長一短がある ‑ローンまたはそれに類似した商品性を持つ金融商品の市場データの例 商品 ローン 特徴 データ取得先の例 0ローンのスプレッドを愚も適切に反映 A単一年隈のスプレッド気配値のみ参照可能 O纏数年限のスプレッド気配値を参照可能 社債 A回収率の差やその他異なる条件の影響で、 ローンスプレッドとは一般に異なる水準に 0豊富な年隈のプレミアム気配値を参照可能 CDS A流動性が高〈市場変動の影響を受け易い ‑ 2 0 6・ 'THOMSONREUTER5LPC .aUICK ‑日鉦也 . s回 mberg .aUICK ' M a r k i l ‑東京金融取号 l 所( J・ CD5l
I r ! . " l ! 1 ー や 蝕 … D f l & ' W Z . V # .M 川.ローン時価評価ロジックの概要 各商品の市場データの有無に応じたウォーターフォールを構築する ‑企業 X に対するローンの時価評価する場合の具体的ウォーターフォール 以降では時価評価ハタ ンAのロジックの概要を紹介する 1 3 1 1 1 ー蝕印刷ム…… ~~ 川.ローン時価評価ロジックの概要 パターン A :ローンデータを優先的に利用、社債(または CDS)デ ー タ で 適 宜 補 完 ・例:企業 Xに対する期間 T年のローンの時価評価をしたい スプレッド ローン市場 スプレッド 社債 (CDS)市場 + 十 般に複数の期間での気配値あり 5年 1年 期間 3年 4年 7年 ‑時価評価パターンAにおける生存確率推定ウォーターフォール 期間T年の社債 (CDS)の気配値を 年物気毘 ローン市場の5 値を利用 水準調整して利用 期間T年の宇土俵 (CDS)の 気配値があるか? 社債 (CDS)の気配値をT年に肉挿また は外領したものを水準額整して利用 1 1 ‑ 2 0 7 司
Iß.~付金……ω
~~
11.ローン時価評価ロジックの概要
パターンA:SASの量適化プロシージャを利用し、社債 (CDS)の気配値を肉掃
‑生存確率のパラメトリックなモデル化
生存確率 S
(
I
)の期間構造(時点 tに対する依存性)を、パラメトリックに表現したい
そこで、パラメーヲロ(=一般に複数のパラメー脅からなるベクトル)を用いて生存確率をパ
(
I
.
o
)として表現する
ラメトリックな関数 S
生存確率に対する社債 (CDS)スプレッドの観測値と理論曲線の聞の「距離」の依存性を表
す関数を F
[
S
]として、 Fを最小化するようにパラメ‑1'ロを決定
'‑レ︼
!
f'︑
J=
zl
γ
a
y
イ
‑
一/最
場開‑/こ
的
市川
)円‑tJ合
‑ E一総
D一
c ‑ こを
(いご一ら
市・+な一れ
去 lhr‑
こ
a =叫 minF[S(
ムα
)
]
】b
Iß.~jー縫い問問h-l>!,t,l>!:;
川.ローン時価評価ロジックの概要
時価評価ツールの画面イメージ
‑208・
2~
WlJ~ 結 縫 い 1 l n . i 白 川 一ω 川.ローン時価評価ロジックの概要 ツ‑Jレで計算された、企業Aのローンスプレッド期間構造 3 9 . 0 dF﹁ nunU J ﹄ 11 )n1 且 ︑ヲム 3 10 7 . 0 5年物の場合は気配値に一致 ̲ . , . , . .. . . . ‑ ‑ . . .• , . .〆 / . . .•. ~ 国mo仇 l . , . Iactal ノ' L l ‑ 1 . 0 0 . 01 . 02 . 03 . 04 . 05 . 00 . 07 . 08 . 0 9.010.011.0 Hコ t'‑l' .'1、月『 (※)画面は開発中のものです 1 7 2 叫l 内千十健会…ソリ 2 川 市 シ 川.ローン時価評価ロジックの概要 ツールで計算きれた、企業 Bのローンスプレッド期間構造 1 8 6 . 0 ま気町直に一致 1 6 5 . 0 5年物の場合 i . . . . . ‑ 占 ̲ ̲ ̲ ‑ , シ . , . ‑ 乙 1 4 4 . 0 ~ 1 2 3 . 0 f l 1 0 2 . 0 -~・ 韓mo l /rr 仇 / ・ a c tL la l 8 1 . 0 0 . 01 . 02 . 03 . 04 . 05 . 06 . 07 . 08 . 0 9.010.011.0 νに ( , 凶 r) (※)画面 i ま開発中のものです 18 ‑ 2 0 9・
i i iユ 十 絡 会 … … ン セ 加 D I V .まとめ 市場価格者F 参考にローン多合理的に時価評価するための SAS ツールを開発 ‑ツールの特徴 市場デーヲの活用 ローン市場価格を優先的に活用して「時価」としての信頼性を確保しつつ、市場価格がない 場合でも、類似商品の市場デー告を有効利用することで、公正な評価額を合理的に算定 ・ 柔軟なスプレッド期間構造 広範囲の非線形関数に対応可能な SASの最適化プロシージャを活用し、市場で観測され るロ ンまたは類似商品のスプレッド期間構造を柔軟に再現 ‑今後の課題 ・ ローン以外の金融商品への対応 ・ 各種分析被能・レポーティング機能の鉱充 鈍 Sザ 健 全 … …ω [Ill~ 本資料についてのお問い合わせ先 みずほ第一フィナンシャルテクノロジ一株式会社 金融工学第二部 羽柴次郎 ・ 035219 ・ 2378 李絹 : 0 3 ・5 219・2364 司 免責事項 当該資料の著作権 l 立、みず l ま第一フィナンシャルテクノロジー株式会社(以下、当社)に属しま 立、当社の事前の承認なしで行わない す。当該資料の全部あるいは一部の加工および再使用 l よう、お願い申しょげます。 当該資料の作成に閉じましては、細心の注意を払っておりますが、その内容を保伍するもので はありません。いかなる場合においても、当社 l 立、当該資料に関連して生じた通常の直接的、 え当社が、そのような賠 間接的、必然的、偶発的、特別な、あるいは懲罰的賠償について、伊j 償が発生する可能性があることを通告されたとしても、なんら責任を負いません。 201随 み ずi ま第一フィナンシャルテクノロジ 株式会社 20 ‑ 2 1 0・
I m 円二認会同市…ムム了‑ vf r 2 6 1 8 1 イベント・ベースド・マーケティング、による 住宅ローンプリペイメントの抑制 銀行取引を考慮したプリペイメントモデルの構築 0小柳誠、小谷田知行、影井智宏 株式会社浜銀総合研究所 C o n t r o lo fMo同gagePrepayment throughEventBasedM a r k e t i n g MakotoKoyanagi, TomoyukiKoyataand TomohiroKagei td . HamaginResearchI n s t i t u t e,L I 俗ユザー尚一向…ヂふ 要旨: 住宅ローンのプリペイメントを銀行保有の債権特性データに加え、 返済履歴や銀行取引に関する情報を用いモデル化する。 また、イベント・ベースド・マーケティング (EBM)の観点から顧客へ のアプローチを検討する。 キーワード:住宅ローン、プリペイメント、 EBM、比例ハザードモデル ‑ 2 1 3・
Ip ←恥… 本発表の構成 霊冨E 住宅ローンとブリペイメジド プリペイメントのモデル化 モデル構築結果と検証 ブリペイメント抑制の検討 まとめと今後の課題 │鮎健会…… ~ÜJ ω 背景と目的 • ιe • I ‑ 2 1 4・
.-俗………~~
【背景と目的】背景
本報告の背景
‑
・
・
・
K
;
・
・
・
‑
;
m
m
t
i
t
l
T
I
e量百・c:::o司;a;雪国1
1
1
¥
o
‑銀行の住宅ローン比率、残高ともに
槍加傾向
0
・今後も住宅ローンは貸出の中で重
要な位置を占める商品となる可能
性が高い。
雪
ー
1
出典金融ジャーナ )~2009.7 、 2007.7より作成
住宅ロ
ン比率(%)=盆宝旦こと盈童 x100
総貸出残高
I縞b付金均一白川~-~~t"'/!I:I~
【背景と目的】目的
本報告の目的
‑住宅ローン特性の概観
• EBMアプローチによるプリペイメント要因の特定
・銀行取引データを用いた住宅ローンのプリペイメントのモデル化の紹介
・プリペイメント抑制への活用の検討
‑
2
1
5・
.ユ一一 mím'H!I . :]IJIJ -~b~
2
0
1
0
住宅ローンとブリペイメント
2
0
1
D
|純一昨……~
【プリペイメントとは】プリペイメントの問題点
住宅ローンとブリペイメント
顧客はいつでも任意の金額をプリペイメント(期限前償還)する権利を持つ。
立、残存金額をすべて返済する「全部繰上返済」と残存金額の一部を返済する
プリベイメントに l
「一部繰上返済」が存在。
-・・・・~t~,t?;司書臣民E・・・・
ー・・・・・邑líJfi江主ヨ!;;-~語句手冨-
園 ハ
FL
・‑岡町
噛題
ょ日
町出か
発'点
1m
川帥
ι
の化観
" /
f
附
/
返済舗の変化
H吋
メ︐泊上
イ隈
M肌
ぺ期
w
引制 m
ム利益
る益収
‑岬収来
品川乱ゆ
hp
川一時 将
行予
拐 し ︐E
の定銀
銀
初︐
‑‑握手書iC!記長‑
鱒網
‑
2
1
6・
mI s I 縞 ト ト 融 … … … 【プリペイメントとは】プリペイメントの抑制 プリペイメント抑制の必要性 ・ 銀 行l 立、プリペイメントの発生に対して受動的であった。 立、プリペイメントの発生要因を経験員J Iでは分かるものの、定量的に把 ・ そ の 理 由l 握していなかった{刻。 ・発生要因を定量的な手法を用いプリペイメントが発生する可能性の高い顧客を 予測できれば、積極的なアプローチにより、プリペイメントの抑制が可能となる。 (※)住宅ローン証券化を目的とした債権プールの特性を考慮した研究は多いが、個別債権 特性に着目した研究 l 立少ない。 砂プリペイメント i 主要因を特定し、モデル化することで抑制可能 11 mI 十 絡 会 的 … ‑ … 【プリペイメントとは】 EBMアプローチ EBMとは EBM(イベント・ベースド・マーケティング ) 1立、原客のライフステージの変化を「イベント」と定議し、 イベントをトリガーとした商品ニーズにマッチした商品をリコメンドする方法。 イベント伊l 金融行動 預かり資産増加 結婚 年収士宮加プリペイメント 子ども誕生 子ども入学 商品ニーズ ‑住宅ローン ・積立定期 息 ‑教育ローン プリベイメント ・マイカーローン抑制施策 預かり資産減少 退職 ラ吋ージ ・投資信託 ・外貨預金 ‑顧客の銀行取引状況やその変化から、イベントを検知。 ・顧客の現在のライフステージに合わせた商品を提案。 ・本テーマではプリベイメントイベントを予測し、プリベイメント仰制アプローチを行う。 ‑ 2 1 7・
… │ 鍋 ー 給 対 的'FI ~~ ω 【プリペイメントとは】 EBMとプリペイメント 住宅ローンプリペイメントと E BM 住宅ローンプリベイメントと他のイベントには密綾な関係がある。 . , . イベント伊l 金融行動 預かり資産増加 年収増加 司 結婚 プリペイメント預かり資産減少 』 子ども誕生子ども入学 退聡 ライフステージ 'プリベイメントイベントは、他のイベントをトリガーとして発生。 • EBM実装することで、金融行動やライフステージをはじめとする顧客特性を容易に取り込むこ とが可能。 1 1 z 2 0 1 0 I l 鮎~付金問附)D~'JI}.J.… 【プリペイメントとは】プリペイメントの要因 プリペイメントが起こる主要因 ‑ ・ ・ l I l J i l 温 ・ ・ ・ ‑融資条件 ・経年効果 ・パーンアウト効果など ノ ト ー プリベイメントが発生する要因は大きく3つに分けることができる。 ‑金利 ,市場金利変化 ,適用金利など ‑ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・2ま 逼 鼠 主 ヨ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ライフステージ 金融行動 属性 年歯令 定期預金の推移 年収 世帯構成 消費系ローン利用 性別 など など など l 一般的なプリペイメントモデルで はプリベイメントの要因として債権 特性や市場環境が主に用いられ る 。 銀行特有の顧客取引デ‑9 を用 いることで、債権特性や市場環境 だけではなく、顧客特性も把握す ることが可能となる。 今回の報告では銀行特有の顧客特性に着目しモデル化を行う。 ‑ 2 1 8・ 1 2
I
鈴 ー 緯 舎 内 向 … …
m
c •
プリペイメントのモデル化
通
13
I
r
n
ユ十健全 m
…
【モデル化】先行研究 (
1)
ブリペイメントのモデル化
+日本圏内の住宅ローンのプリベイメントを扱った研究は少ない。
杉村 (2003) 、一億・森平 (2001) では、圏内の住宅ローン債権デ-~を用い、説明変数{共変量)
として時間とともに変化する時間依存共変量を導入し説明力を高めている。沓沢(
2
0
0
7
)
1
立、アン
ケートデ 告をもとにモデル化、プリペイメント、借り換えの分析を行っている。
モデル化の手法
+回帰モデル
'
,
‑ PSJ(
PrepaymentStandardJapan)モデル
RMBS(
住宅ローン担保証券}のプライシングに利用される棟準的なモデル。プリベイメ
ント率を経過年数の関数として定義。
•
。
Cμ
ι例 J、ザードモデル
杉村(2003)、一傑・森平(2001)、沓沢(2007)で採用。
生存時間解析の一手法。時間依存共変量の取り扱いが容易。
惨 今回の報告で 1;):,Cox比例ハザードモデルによるモデ I!.‑化を行った。
1
4
‑
2
1
9・
u
‑
I
D
[
I
l
l
r
!
1
‑
i
ザ 総 会 … … 加
【モデル化】先行研究 (
2
)
量‑
・
変‑
共
園
の
・
ν
1
円
山
モ‑M
ま
を
量
変
共
る
キ
せ
て
用
れ
宮
山
で
使
先
研
行
本報告では、これらの共変量に加え、プリベイメントのトリガーとなる、顧客特性やその変化
を共変量として検討した。
1
0
I
A
~Iljl~
怯 付 金 … … …
【モデル化】要因の特定 (
1)
EBM
アプローチと共変量の検討
・プリペイメントのモデル化のために、モデルの共変量を考える。
・プリペイメントの要因を3
ヶ月前{※}までに使用可能な顧客情報とする。
(
※ )EBMシステムへの実装するため、イベントが検知されたヲイミングと顧客へのコンヲクトの
ヲイムラグを考慮している。
,
ー~.[bF.毛'liÞl{!i芸品.,:r,~;1;'.f.~f l.[(r;'7;',う lTij,.ßl.i浬~~~::S;;'rl;\I:'~..s::::::I院E圃圃圃
ー
ー
は
と
副
主
ー
一
・
・ … EH!診E診 E診
一一
四三 E季~~({,þlõiI孟函<"" .
.
置霊. .
砂
_.H'.ヨ墨田両r
líii'~~
圃圃~'~'î釘量耳元IrH・・・
川後のプリベイメントを予測
l
I
m
I
10
‑
2
2
0・
[ト総 ~:jIDm1.þs:ÞlJæふω ~ 【モデル化】要因の特定 ( 2 ) 変四九日 補 由 候 四 の 由 量‑ 共阻ん札 部 掲 を 数 の I﹄ 変 討 検 I﹄ て 変 と 量 共 d晶品ムぃ~ザ r ・当初融資額 ‑ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ , t‑訴 事 週 ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・残存比率 年齢 ・残存期間 退職など ・残存元本 ; i2 ライフステージ 属性 年収 性別 返済比率など 金融行動 ・借入金残高 預かり資産 ・約定期間 返済比率 ・増額月 過去の一部繰上返済履歴 ・固定特約期日など 消費系ローン利用 給与振込の有無など ‑適用金利の上昇 1 7 mI I 似+健全……量的 【モデル化】モデル化 ( 1) モデル化の前提条件 ま全部繰上返済モデルと一部繰上 ・ モ デ ルI 返済の 2種類を作成。 全部繰上返済と一部繰上返済ではプリベイ メントに影響する変数が異なるため。 ・繰上返済を「ハザード」とし、繰上返済の有 無をモデル化 全部繰上返済 i 立1回のみ、一部繰上返済は 複数回のプリペイメント発生を許容する多 重イベントモデル。 圃圃圃圃圃圃圃圃~.~証書賓最3幸司圃圃圃圃圃圃圃圃 j F 干二 圃 圃 圃 圃 圃 圃 圃E 苫 叫 幹 事 軍 部 開 園 圃 圃 圃 圃 圃 圃 ; 』 一 一 モデル化の対象となるプリベイメント特性 18 ‑ 2 2 1 ‑
Ip
WlJ~
←附……ッシン
【モデル化】モデル化 (
2
)
ハザード比を用いた共変量の効果検証
Cox比例ハザードモデルでは、ハザ
事前検証に用いた、結果の
ド比による共変量の効果検鉦が可能。モデル化の際の
部を紹介する。
-・・匪ヨE44盟主事õIlJ:Jr.宮司E提言li}'JB;~;_
ー
̲
.
五
i
f
!
.
'
ヨE献出官三宮E主主'量.i!"T.lli.1i辺国語;‑
"
。
.""JO
Iu
~,。
"
.
.
"
"
1
9
11~~ヲヤ印刷Jム…
1m
•
'
1
.
モデル構築結果と検証
20
‑
2
2
2・
I
~~
鮎 怯 付 金 印 刷 … …
【結果と検証】モデル構築
モデル構築概要
・全部繰上・一部繰上モデルの構築
ーモデルには事前の効果検証で有意な共変量のみ
を使用。
fパラ '‑0
の抱定例・1
回 目 咽 凶 p"
曹 洞e
t
er
Es
t
l
m
e
t
e
s
"p
a
r
a
m
e
l
e
r
̲
8
sむm
a
t
e
s
p
r
o
c
pMlgdete=1
i
1
)
凶 d
.
.
.
"毛賓置 e
vemlから 8
v
e
n
t
S
Oを用い司E
R制 eI{tl 町・"問。叩 I~ 四 ntt ‑8
¥
19
同5
0
f
デ
"
欄
"
.
,
"陶C旬。門 =step判..r ステップワイズ設でま叡 ~tR .1
d.凶
‑ SASPHREGプロシージャを用い、ステップ
ワイズ法で変数を選択。
・モデル精度の比較のためにそれぞれ2つのモデルを構築
ー モ デ ル1
「債権特性」、「市場環境」、「顧客特性」の共変量を使用しモデル構築。
ー モ デ ル2
(比較用)
「債権特性」、「市場環境」の共変量のうちローン実行時に分かる情報のみを使用
しモデル構築。
2
1
│
会 問 …
【結果と検証】モデル構築結果概要
モデル構築結果概要
-・・・・~雪ヨ軍主要置11'3守主古書盲目~i!!翫醤訴事通・・・・・ -・・・・I::I~Hf'9_~軍司rt>3主主事盲目理!i 事葺淳司圃圃圃圃園
推定値が正であればプリベイメントが起こりやすいことを表し、逆に負であればプリベイメントが
起こりにくいことを表す。債権特性に加え、顧客特性に関する変数が多〈選択された。
また、全部繰上と一部繰上 l
ま選択される変数や推定結果が異なることが確認できる。
‑223・
22
.
p
~I~~
や や … …hシ
【結果と検証】モデルの精度について
予測の観扇がらの毛布I
l
,
,
‑
.
H
:
.
較
モデルの評価を予測の観点から行った。全部・一部繰上返済ともにアウト・オブ・サンプルを使用し、
1ヶ月聞を予測した場合の ROC
カーブとAR値。また、共変量として、債権・顧客特性を除いて推定
した場合の結果も同時に記厳した。
-・・民事司雄主宰軍司1;,1・:~・1・"ß~咽・・ 圃圃~盟主司書\>:I;;..:l:・I・j;~'"
モデル (1)
債権特性、市場環境、
顧客特性を考慮した
モデル
モデル (2)
融資時点の債権情報
のみでモデル構築。
顧客特性や銀行取引
に関する情報を使用
しない場合の例。
i
事客特性や銀行取引に関する情年を用いることで予測精産向上」た。
.
ム
ュ
ー
一
…
一
23
~Ill~
•
ヲリペイメント抑制の検討
24
‑224・
l. : 1 ‑ . . , . . . . . . … 叫 ん ふ . SAS ヌ ヴ , 九 m m 【結果の活用】モデルの活用 モデルの活用 ‑推定結果をもとに3ヶ月後から一定期 聞のプリペイメント確率を債権ごとに ‑ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ l!司TiI:'''ヨ=置 ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ l l 2 算出。 ‑モデル推定結巣を活用することで、債 権=顧客特性を定量的に把握。 ‑債権・顧客ごとの異質性を考慮したア ブローチ。 ‑共変量から予測プリベイメント率の高 い顧客のセグメント分けが可能。 I ぬ 午 子 一 一 一 一 一ふぷ J ‑'.F ‑ ‑ : ",'~ 2 O l 0 I 【結果の活用】顧客アプローチ 顧客アプローチ 例え 1 1、以下のように Outputの結果から予測プリペイメント確率が高い顧客をセグメントに分ける。 アプローチ 顧客セグメント 退磯による全部繰上 2 預かり資産の増加による 全部繰上・一部繰上 3 固定特約期間満了時の 全部繰上・一部繰上 4 残存金額の低下による 全部綾上 金融商品での運用提案(投資信託など) 「一ーすプリベイメン卜による健会損失・流動性の確保の必要 性を強調 ハレ長期の固定性預金の提案 プリペイメントと同等効果の提供 、・預金連動型住宅ローン J 金 附 仰 利 B 配 4 c東京ス対9 ←一関西ア パ 沌 収益は減少するもののメイン化促進などに効果。 ¥条件変更の提案 債権ごとの費用・収益を考慮する必要があり セグメントごとに顧客のプリベイメントの背景を知り、アプローチ方法を変える必要がある。 ‑ 2 2 5 ‑ 26
111~~]会………~~ 【結果の活用】今後の展望 展望 • EBM実装による相乗効果 ‑他のイベント情報とのリンクで顧客のリアルタイムのニーズを把握することが 可能。 ー他のイベントをきっかけとした顧客へのアプローチ。 27 |組~~付金…… • ~ まとめと今後の課題 26 ‑226・
ω │一一炉問叫んふ ‑mJ 【まとめと課題】まとめ まとめ ・ E BM実装により顧客特性データを扱うことが可能となった。 ‑債権特性や市場特性だけではなく顧客特性を加えることでモデルの予測精度が 向上した。 ‑モデルを用いた予測の結果から顧客のプリペイメントの背景をセグメント化するこ とが可能であり、そのセグメントごとに対応が可能となった。 l 鈍~.:健全一…ω ~~ 【まとめと課題】課題 今後の課題 ・予測精度の向上(全部繰上返済モデル) 一部繰上返済モデルと比較して AR 値が低い。 ・プリペイメント金額の予測(一部繰上返済モデル) 本発表では、プリベイメントの有無(件数)を対象としてモデル化を行った。 このため、一部繰上返済に関してプリベイメント金額を直接的に予測できない。 部繰上返済のモデル化には、本発表で用いた多重イベントモデルを用いる方法と杉村 (2003) をはじめとする先行研究で用いられる債権を分割する方法がある。債権分 ~J とは、 伊j え1 1 1債権を 1万円単位に分劃し、一部繰上が起こった部分(分割された債権)をハザー ドとみなす方法である。 SASの PHREGプロシージャでは、どちらの方法でも推定可能であるが、債権を分劃する 方法では今回推定に使用したデー告数が多いため、莫大な時間がかかることから今回は 多重イベントモデルを使用した。 3U ‑ 2 2 7・
|凱~ー蝕… 参考文献 参考文献一覧 [ 1 ]一傑裕彦,森平爽一郎「住宅ローンのプリベイメント分析 J .JAFEE2001夏季大会予稿集 .2001 悶沓沢隆司「住宅ローンの期限前償還、借り換え行動、延滞の分析 J .都市住宅学. ( 5 8 ), 6 6 ‑ 7 5 .2007 [ 3 ]柴崎健.中村信弘 r I、 ザ 予稿集, 2001 ドレートアプローチによる MBSの評価 J,JAFEE2001夏季大会 [ 4 ]杉村徹「住宅ロ ンのプリベイメント・リスクモデルと実証分析返済ヲイプ別モデル・アプロ 1e ト148,2003 ーチ J,~金融工学と資本市場の百十量分析~. 1 2006. [ 5 ]日本証券業協会 rpSJモデルガイドブック J, " 1 同 同 臼 s ユ 一 一 一 会 m 町附町……デ貯山… テ ?肝 刊 一 ケ Endo fDocument ‑228・
I 会印刷jJ:l~;'}~;';W~~)"....:; 201~ イベント・ベースド・マーケティングによる 住宅ローン既存先へのクロスセルの推進 ‑RAROAIこ基づく長期的な収益の増強 0岡 部 雄 一 郎 、 小 谷 田 知 行 株式会社浜銀総合研究所 C r o s s ‑ S e l lapproach t oMortgagel o a ncustomers throughEventsasedMarketing Y u i c h i r oOkabe,TomoyukiKoyata td . HamaginResearchI n s t i t u t e,L 巴互) lMß付金~…副知仰 ‑ . '‑ ‑ . 2 O l [ i J 要旨 近年、収益性が低下しつつある住宅ローンをゲートウェイ商品として捉え て、イベント=ベースド・マーケティング (EBM)によるクロスセルにより、長期的 な収益を増強していくアプローチを紹介する。なお、収益の観点としては、 RAROA を用いる。 キーワード 住宅ローン,信用リスク, RAROA(RiskAdjustedReturnonA s s e t ), EBM(EventBasedM a r k e t i n g ),クロスセル 巴王) ‑ 2 2 9・
│鈍ー総会一 構成 1住宅ローンビジネスの現況一一一一一一一一一一一一一一一一一一一一 4 2 .住宅ローンの収益リスク構造一一一一一一一一一一一一一一一一一一・ 8 3 .EBMによる住宅ローン既存先へのクロスセルの推進‑‑‑‑‑‑一一一‑‑12 4 .まとめ一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一 28 日 正j Ip内会…ノ:i:i-&'jli~-~'.:!~I ~:(;,?/~ l 1 .t t 日 宅Jシ ム ム ム ム ー 日 正j ‑230・
凶 国 成 作 teo t匂 減︒附 書 マ2 2 ナロ ⁝ι冊一山) • 2006年度までは、ある程度順調に推移してきた。 的問 奥巴ヤ 出︑﹀ 融 リーマンショックを墳に急変した住宅市場 岨 山 山 itt 1J m 1 鉱 ー 儲 f D Z U l 付 … …ν 説︒ぜ 2 ↑;刊のふお 一 EEEE512 宅 融 寸 z N L H 住金↓ EE E t 一 ‑EL 一 一一ナ金 ・しかし、サブプライムローン問題・リーマンショックを境に市場は急激に縮小。 U 酌叫酌町船知計 ‑ZZE︼ 統 凶 齢 エ EE‑‑EaEEB 向 山 e m E よ Ju‑‑‑EEE u ;JEE官4EEmE 品目 ・ E B E ‑ a l l ‑ O B I t ‑ ‑ 問 EEEE‑EEE 成 ヱハ 一︒︒内刊 UUUUU引UUFgohJ凶 着一一一 宅一リー川川リ川叶川ハ JH1 5 口 住一 腹一 分一 動 間町四間目別刷∞︒調 I一一手四 {titss ・ ・ ・ ・ ・ EE ‑ E E E 交 E EE'E 個性8m 土 M E e g h 園 EEEEE・冒E 川 川 同 一 一 一 一 一 時 内 E B E E ‑ E8F ‑ 2 3 1・ ・ ・ ・﹃ 閣 u t 川 川 一 純 出奥住宅金融支援機構 「住宅ローンの新規貸出額及び貸出残高の推移」より作成 声彊 山 山 ⁝ ⁝ 山 一 " ∞ o∞ その他 I 一 州 剛 一 ⁝ ⁝ ⁝ 一 【新般住宅着工戸数の推移】 " ' 一 ー J剛 一 ⁝ ⁝ ⁝ 一 1叫 叩 【金融樋聞の住宅ローン比率の分布1 【住宅ローン貸出残高(期末残)の推移】 一 D 会 0 5 2 0 0 7 W S : Me知山 l 法人向け融資の縮小と個人向け融資への傾斜 ・法人の資金需要の低迷により、金融機関では個人向け融資を強化 0 ・個人向け融資の 9割以上は、住宅ローン(融資金体の約 3割 ) 。 日記
1 鈍砕付金……t~,,~ 2 0 1 0' 住宅ローンビジネスの 3 つの不安材料 .こうした中、住宅ローンビジネスにおいては、以下の 3つが不安材料とし て挙げられる。 ①景気低迷に伴う案件の質の低下 返済負荷の重い顧客の増加、勤務先の経営状態の悪化による影響 ②加熱する金利競争 基準金利からの引下げ幅の拡大、変動金利利用者の増加 ③借換および繰よ返済の増加 借換獲得競争の激化、繰上返済手数料の無料化の流れ ~ Is."Ii'5"':=総会 ……主シセッション l i ‑ ‑ 一 二 ‑ / ゐ ー 均一一一一一一一 ~IljlI 一'‑ 1 ) @] ‑232・
‑ ‑ ‑ ‑ ~ユーザー健全対開府J白河川・民J量伽シ 、 守一‑ ~allJ . ム . . , 金融の収益構造 ‑メーカーと比較した、金融の収益構造は以下のとおり。 利益=(販売価格ー原材料費一人件費)x販売件数 <金融> 利 益 = 世 出 金 塑 坦 達 金 利 上 人 件 費 彊 駐 到 )x貸 出 金 理 主 世 間 x貸出件数 ①不確定なコストが存在する ¥¥J/E//I「 │ II ②当初時点から変動し得 ③期間で捉える必要がある ‑結果、当初の取引時点では、収益が確定しない(収益は、各時点の収益 x貸出期間という面積の考え方で評価していく必要がある)。 ‑言い換えれば、いくつかのリスクが内在。 巴日 畑山}除…I山 一 一 回 1 m 住宅ローンビジネスの 3つのリスク ・具体的なリスクとしては、以下の 3 つが挙げられる。 ①信用リスク 勤務先倒産や年収低下に伴う返済負荷の増加により、返済が滞るリスク。 より具体的には、返済可能性を意味する狭義の信用リスクと、返済不能時の 回収可能性を意味する回収リスクに分けられる。 ②金利リスク 市場金利の上昇により、既存貸出債権が含み損を抱えるリスク。 より具体的には、貸出金利が調達金利を下回ることにより生じる逆鞘リスクと 考えられる。 ③繰上返済リスク 顧客が融資額の一部ないしは全額を繰上返済することにより、貸出期間中の キャッシュフロー(資金の流れ)が変化するリスク。 より具体的には、毎月返済額の減少もしくは貸出期間の短縮による収益低減 リスクと考えられる。 日目 司 2 3 3 ・
|鉱E-~.a~:E]会的~m…ω • 低下しつつある住宅ローンの収益性 • P7の不安材料は、 P10のリスクと密接に関連 0 ・結果、住宅ローンの収益性は低下しつつある。 =。住宅ローンを単体で収益源とするビジネスには限界。 【住宅ローンの収益リスク構造】 信用コストの憎加 ①景気低迷に伴う 案件の貨の低下 ②加熱する金串J U争 、③組上返済リスヲの 1増加 │③借控および l繰上返済の増加 貸出期間の短縮化 ~ iEml誼置 Ip ←昨… ~[J i i I l I I I シンセシン j i ‑ … 一 一 一 ー 一 一 一 示 l 3 . E 、 、 巨互] ‑234・
1 1 1 F 髄………‑‑‑ ZO1DI 住宅ローンに対する発想の転換 ‑ ‑住宅ローンを単体で収益源とするビジネスには限界。 ‑住宅ローンをゲートウェイ商品として捉えて、中長期的な収益を増強して いくとし巧発想の転換が必要。 巴互) 鈍 │1 1 付金竹内 ー h 州市シ 2~ 住宅ローン顧客に対する収益増強の方向性 ・収益増強の方向性としては、以下のとおり。 ① 取引内容の増加(クロスセルの強化) @ 取引期間の長期化(リテン、ンョンの強イじ) 【住宅ローン顧客に対する収益増強の方向性】 取引 " (各時点収益) ・ 取引同容由2m {クロスセル由強化} 取引期間 住宅ローン 町長期比 ~(リテンンヨ J 収益 の強化) ! 取引期聞を 畳期化する ‑ 2 3 5 ‑ 一 一 一 一 一 一 一 → 期間 {取引醐間} 日記
!ω~~ト総会印刷"'1…t~~;,
~III[J
住宅ローン顧客の実像を知る①
・収益増強を実現していくには、住宅ローン顧客の実像に関して、これまで
以上に知る必要性がある(特に新規申込先)。
‑ 30代男性が約 50%司子供が生誕、もしくは小学校入学の年代。
口座非保有先が 50%超=。住宅ローンを契機に、取引開始する顧客が多い。
【口座保有・非保有別の住宅ローン先の内訳】
【年齢・性 ~Il の住宅ローン先の内訳】
満失
'
罰
規
区町蝿・調失
ロ産保有先
‑,
目 2
5到 3
5相
男性
年齢
'"口座保有先
4
5臼 5
5曲 目 司 "
~
女性
2
0
1
0
│
鈍…ー絡会……ー河川市;,
住宅ローン顧客の実像を知る②
・住宅ローン顧客の約半数は 30代男性。
住宅購入後は、ライフイベントが目白押し。金融取引のニーズ、あり。
・住宅ローン申込時には、各種の顧客情報が入手可能。
一高精度のマーケティングが実現可能。
【年齢帯別のライフイベントと関連する金融商品のイメージ】
己:
ヲイフイ J A u d p ‑
・
.
.,
「面孟2
i
・
.
周
ヲレ伊勢作ーが
一
一
一
一 ‑ii'i:a‑
.
開
園
‑
,
ha
函..一一ー
ト 同 一J
ーンーーーー
‑236・
叩 F ι ローン
一 }
幅盟国師
~
I~if'#健全町一四. . ‑ j . S ‑ , i ! ' 1 ' . . . . : . 竺 ‑ EBMによる住宅ローン先へのアプローチ ‑住宅ローン顧客の実像(特性および金融機関との関係性)を踏まえて、 マーケティングを実施する場合・.. =>情報の収集機会が多く、顧客に一定の均質性が保たれていることから、 顧客ニーズに適応した fEventBasedMarketinglP18‑19参 s君 、J が有効。他 のローン商品などのクロスセルの可能性を検討する。 ‑その際には、金融業務の特性として、顧客ニーズと合わせて、収益・リスク│ P o t e n t i a l & P r o f it ) の観点も考慮すべき ( コfRAROA(P20‑21参照)Jにより、リスク調整後収益を評価。 I 0 !・複数商品の収益評価はどのように行うべきか? =今「総合与信管理 (P22参照)J により、収益性を一元管理。 巳記 │鈎ルト隙一 ・ EBMの概要① EBM(EventBasedM a r k e t i n g )の概要 顧客属性や取引内容の変化をイベント(金融トリガー)として顧客ニーズを感 知し、最適な商品を最適なタイミングで提供するマーケティング手法。 一営業推進に活用できるようなイベントを想定し、それを属性および取引データ からどのように読み解いてしてかが成功のポイント。 ‑ EBMのイベントは、以下の 3種類に大別できる。 ( 1 ) ライフイベント.就職、子供生誕、子供入守、退職、相続など =今住宅購入 i 士、子供生誕もしくは小学校入常の時期が多 L、。高校および大午入 学の時期を踏まえて、後に教育ローンを展開することが考えられる。 ( 2 ) 金融イベント:大口入金、為替変動、他行への大口仮込など 司住宅ローンでは、ボーナス前など一時的に資金が枯渇する先が存印する c 資 金動向を踏まえて、カードローンを展開することが考えられる。 ( 3 ) 期日管理定期預金満期、公共債償還など 司住宅ローンの固定金利期間終了時は、他「換を検討する先が存従する ο 期日管 理により、借換抑制を展開することが考えられる。 巴瓦] ‑ 2 3 7 ‑
IA 昨 日 会 … …ω EBMの概要② ・ w l l D EBMの枠組み ‑EBMのプラットホームとして、 SASを使用。 ‑SASE n t e r p r i s eG u i d eにより、マーケティングイベントの検知ロジックを柔軟 に更新することが可能。 【E BMの枠組み】 セグメント cI I 害 ローン II ,刊副 積立役i!I 凱 │sーか……… ・ RAROAの概要① ~~ RAROA( R i s kA d j u s t e dR e t u r no nA s s e t )の概要 一信用リスクなどの各種リスクを考慮した収益性を示す指標。 ‑RAROA=(リスク調整後収益ム平均貸出残高)‑;‑貸出期間。 【RAROA (I)算出のイメージ】 ̲ u . ̲ 巨記 ‑238・
l‑舎一町開富山山冷却 D ・ RAROAの概要② RAROA の特性 ーローン実行後は、返済に伴い、貸出残高は減少してして。 果があるため、 R AROAに ーただし、住宅ローンには、テ フォルトシーズニングヲJ 基づく収益性は改善してし、くことが見込まれる。 F デフォノレトシーズニング効果 f i'宅ローンの場合、貸間間後のデフォルト半は低く、 5‑10 年日 にかけて上好 その後は、漸減してして傾向にあるふ 【ローン経過年敏別の貸出残高・合計利益の推移】 【ローン経過年敵別の RAROAの推移】 3 ぐ! ! i i¥ o 2 4 6 ¥ 聖 8 o 2 r o 12 14 16 18 W 4 6 8 1 0 1 2 1 4 1 6 1 8 2 0 .過隼叡('<, 経過年愈(年〉 E斗 D I~ユーザー総会……ω 総合与信管理の概要 ・総合与信管理 ! ! 債権単位ではなく、個人単位で与信管理を行う考え方。 ー各商品のR AROA を加重平均した個人 R A R O A Iこより、与信判断を実施。 一 一 一【鯵合与信管理の了イメージ】 量盆皇盆HIli 血ム皇益 E玄 . r a r │ 一 理 ω 審査結果 i 立一致。 匝~ ‑239・ Illi‑‑lJ 怒川一 審果一 別結︒ 個査た は審い 来︑て一 世めつ一 叶斗 ttB 一 ートトいいγ L 総合与信管理を導入
釦 │S ユ+総会…2:EIl申告加 . 今回のフレームにおける SASの活用 • EBM ーターゲ、テイング、の検知ロジックの構築=今 SASE n t e r p r i s eM i n e r ( d e c i s i o n 田) t r ーターゲティング の検知ロジックの実装=今 SASEnte 巾r i s eGuide P • RAROA 一信用リスク評価のためのモデ ル構築=今 SAS/STAT(procl o g i s t i c ) 繰上返済リスク評価のためのモデル構築=今 SAS/STAT(procp h r e g )、あるい はPSJモデルにて簡易的に処理 ‑ RAROA 算出=今 BaseSAS ‑総合与信管理 一 個 人 RAROA 算出=今 BaseSAS 巨孟] S ト や … … ン セ ッ シ ョ ン ~~ EBMと総合与信管理の連携によるクロスセルの強化① EBMと総合与信管理の連携により、顧客ニーズと収益・リスクの両方の 観点を踏まえたクロスセル・マーケティングを展開する (P14の「①取引 内容の増加」に相当)。 ・具体的には、住宅ローン先に対して、「教育ローンの推進」を実施。 • 【EBMと総合与信管理の連携のイメージ】 ・ ポテシーャル L ブロフィヲト禽 ポテンシャル & 1 ,プロフイ ノト先 ~ ‑240・
‑ 2
8
1
m
|竺~付金問卵白山一…
EBMと総合与信管理の連携によるクロスセルの強化②
・住宅購入は、子供の生誕もしくは入学の時期が多い。
属 性 や 明 細 デ ー タ に よ り 、 教 育 ロ ー ン の ニ ー ズ 、 先 お よ び 発 生 時 期 が 予 測 可 能0
・住宅ローンに関して一定の返済実績あり。
デ、フォルトシーズニンク。効果により、リスクは低減し、 RAROA
は向上。
【EBMと総合与信管理の連携によるクロスセルのイメージ】
E
L
I
I
一
ー
一
一
一
一
‑
‑
‑
‑
‑
‑従来 l
立
、
ロ ン実行後は別
段フォローせず。
・結果として、顧客ニーズが
把握できず、新たな取引が他
行に流れる場合もあった。
|直宣之里出~/
│
一
一
、
I
:
‑
‑
l
戸
時 の経過とともにローン残高I
;
l
:
減
少
/勺・結果、常に新規顧客を開拓の必要あり。
、
I
J
EBMと総合与信管理を連携
‑
人
酬
"
立、返済実績
‑ローン実行後 i
1に応じてリスヲ低減。
'EBMと総合与信管理を連燐 l
させることで、新たな顧客
ニーズの取り込みが可能に。
l
九時間の経過とともに住宅ロ ンの
:
fI
RAROA
は 向 上 。 !
出E 之 盟J
ψて
三
日
M
Iニ説教育ロ一品ニ一元日程。
I・結果、既存顧客に対するクロスセ レを実│
ヲ
匡豆E
至:D/
J
~l'現し、 RAROAI立更に向上。!
ー
f
‑
,
;
mI
一 .
̲
̲
̲
̲
̲
.
.
.
.
.
.
&
M
I
鋪ト付金戸町
m山 崎 山
→
~~
EBMと総合与信管理の連携によるクロスセルの強化③
・取引内容の増加により、収益の紘大を実現。
m
a
'
︐
i
s
包司"
0
‑
;
'
"鍾 過 I
J
I
I:(.)
e
3
2
1
‑
a
【クロスセル時の収益の増強効果の数値例]
R
.
︒
出
i
r活再百↑主l
:
i
川引;川 2
2
1
1
1日
:
日
に
日
にi
j
l
i
i
1
3
1
!
位
協
相
以
後
叫 H一一円十H斗ヰニFhヨ←す詐本芽ミ
125
腕… i
主!
1
1
1
出j
苛:到来年目i
J
1
3
山幸市首
住宅ローン優遇写霞腐の健貸出蛾賓の鋼,‑
!~
住宅ロン雇過.隆副のRAROAQ)纏.
J
;
一
.
.
霞
{
・
1
‑
2
4
1・
巨日
│一 ‑ 健 全 … … 量 的 . EBMと総合与信管理の連携によるリテンションの強化 EBMと総合与信管理の連携は、リテンション・マーケティングの分野にお いても活用が可能 (P14の「②取引期間の長期化」に相当)。 ・顧客ロイヤルティの醸成を通じて、リテンションの強化を実現。 • 【EBMと総合与信管理の連蟻によるリテンションのイメージ】 皇室盆墨 / ・個別審査のため、 審査結果が不一致。 .追加与信不可先に も推進し否決。結果、 既存の住宅ローンま で消失する場合も。 EBMと総合与信管理を遣自陣 一一 」 血皿 u u {・債権単位ではなく、 l個人単位で総合与信 │管理のよで推進。 1 .顧客に対して盛合 │性のある対応を図り、 Lリテンションを強化。 ー ー ー ー IAS.ì-if-a会…-セ Hン ー _..__~J ~I111~ ¥ ¥ 巴 空 一 一 一 一 巨互j ‑242・
│ ω ユーザー健全印刷山 まとめ ‑住宅ローンビジネスの現況 ①景気低迷に伴う案件の質の低下・②加熱する金利競争・③{昔換および繰 上返済の増加など、高まる懸念 0 ・住宅ローンの収益リスク構造 ‑収益は、各時点の収益×貸出期間の面積で評価(当初時点では不確定)。 ー①信用日スク・②金利リスク・③繰上返済リスクの増加により、収益性は低下 0 ・ EBMによる住宅ローン既存先へのクロスセルの推進 一住宅ローンをゲートウェイ商品として捉え、中長期的な収益増強を目指す発 想、の転換が必要。 収益増強の方向性は、①取引内容の増加(クロスセルの強イじ)、②取引期間 の長期化(日テンションの強化)。 一住宅ローン先は、顧客情報の収集機会が多く、一定の均質性があるため、 E8Mによるクロスセル(および日テンション)の強化が可能。 ーただし、顧客ニーズた、けでなく、収益・リスクの観点も踏まえたマーケテインクー 巴亙) が必要。 RAROA および総合与信管理の考え方が有効。 E総 』 付 金 問 仰 … 今後の課題 ・今後の課題 一住宅ローン完済先に対する E 8Mの検討(キャッシュフローの改善による資金 運用の可能性)。 【年齢帯別のライフイベントと関連する金融商品のイメージ】 L一二 一 Z ライフイペ 一 一 ‑ •••• 明立笠置 一 一 一 一 ・ 一 一 ‑ J ? : r ‑ ‑ . ! . : : : ‑ ; . . . 3 崎医史医E 2 主 Q 失望 ‑243・ 巨孟)
I " ーし… 参考文献 ‑参考資料 [ 1 ]日本銀行金融機構局「住宅ローンのリスク管理 金融機関におけるリスク管理手法の現 状 ~J ( 2 0 0 7 ) [ 2 ]日本銀行「銀行の住宅ローンを巡る畳近の動向とリスク管理上の課題:‑?クロ的視点か ( 2 0 0 8 ) らの検討J [3]岸本義之『金融7 ーケティング戦略~(ダイヤモンド社、 2005) 巴E Ir!l."~附…シ ~I Endo fDocument 巨亙j ‑244・
I~jíí;;;.t=健全……… ‑•‑ 2 O l U I 銀行本体発行クレジットカードにおける イベント・ベースド・マーケティング ライフコースを考慮した利用変化の検知 0影 井 智 宏 、 小 谷 田 知 行 株式会社浜銀総合研究所 8ankC r e d i tCardM a r k e t i n g t h r o u g hEvent8asedMarketing TomohiroKagei and TomoyukiKoyata HamaginResearchI n s t i t u t e,L td . [ 玉 コ I~怯付金印刷叩 要旨 銀行本体発行クレジットカードとし巧利点を活かし、ライフコースを考慮した消 費者の動的変化とクレジツトカード利用の動的変化とを組み合わせることに より利用拡大のための有効的な手段をイベント・ベースド・マーケティング ( E BM)の観点から提案する。 キーワード クレジツトカード¥銀行本体発行, EBM( E v e n tBasedM a r k e t i n g ), ライフコース,ダイナミックペイジアンネットワーク [ 豆 コ ‑ 2 4 5・
鈴~:~や総会……t11-1:t 2~ 構成 1 .クレジットカード業界の現状と本分析の目的 2 .クレジットカード利用の動的変化モデル 3 .顧客の状態やその動的変化の考慮 4 .まとめと課題 日目 1 1 f t ! 一 蝕 … … 加 1 ク凶ツトカー鴻界の現状企本州の目的 WlJ~ ヨ EE ‑246・
I竺~~総会……叩b'.I!;' ブ 2 m I J クレジット力一ド業界の現状 ‑個人消費の低迷によりショッピング取扱高は頭打ち傾向 ・改正貸金業法の影響によりキャッシング市場は縮小。 0 ・縮小傾向にある環境下で収益を維持するためには効果的なマーケティ ングによる顧客の取引活性化が必須。 【ショッピング取扱高の推移】 【キャッシング取扱高の推移】 二 日 v" . ' ' " 醐 l μ .._~J . I 也 雪 "ωg 帽 薗 . '"醐 て 十 i iiiiiiiii ii││iii iiiiiiii 出典「経済産業省特定サービス産業動態統計聞査」より作成 [ 1 m IE-~~蝕71JTl.'1I';J/)C河川河川向 クレジットカードビジ示云亡おl するマーケティング F 司 247・ ~
E .:J.-..,-a~ 盟国園・・・・皿 7 1 l f l 1 1 ‑潜在的なニーズの高い顧客であってもニーズが顕在化していなければリコメ ンド効果は最大化されない。 ・近年、金融機関を中心として EventBasedMarketing(EBM)と呼ばれる手 法が注目されている。 ・ライフステージやライフスタイルの状態やその変化をイベントとして定義し、そ のイベントをトリガーとしてリコメンドすることにより顧客のニーズ顕在化のタイ ミングも意識したマーケティングを行うことが可能となる。 金面直樋随を倒とした婁積的観点から想定されるイベント倒一貫 自冗 」 済 ン ロ 越産宅 引出住 │ 利 一 ‑小学校進学 ・新社会人 ‑定年退職後の再雇用制度活用 ‑配当金入金 ・自動車税引落 ‑クレジットカード百 l 落 .顧客価値観での大きな入金 ・顧客価値観での大きな出金 .定期預金新規作成 Ip ~ 2 0 1 D 付 金 一 … 一 本分析の目的 ・ライフステージやライフスタイルなどの顧客の状態をイベントとして定義し イベントを用いてクレジットカードの利用変化をモデル化する。 ・収益の小さい利用先から収益の大きい利用先へ変化するイベントを見 出す。 利用の流れ圃ー 令 ‑ 業 種A 業種 sO 。‑ ・ 今 E圏 直 仁田 ‑248・
2~;es総会…~別加 1m]~ 本分析語裏吾妻事へ活肩す司事の二而二ヲ ・モデルから得られた知見(収益小→収益大で発生するイベント)を活用 0 ・利用先が収益の小さい顧客において収益が大きな利用先へと変化しゃ すいイベントを検知し、そのイベントをトリガとしてリコメンド。 ・イベントをトリガとしたリコメンドにより、収益の大きな利用先へと利用発 展を促す。 唱沼山川山 A在 書( 利用の流れ・・・・・ー' . . 吟.,~ El … . ユ ー 付 金 111 本分析のアヲローチ ・ダイナミックペイジアンネットワークを用いて動的利用変化をモデル化し、 収益が大きな顧客へと発展するネットワーク構造を構築。 ・利用先変化を顧客の状態やその動的変化から説明。 ・ペイジアンネットワークの評価基準には BICを用い、全てをSASで実装。 T T+l T+2 T+N 業種A 。。 イベント (ライフステージやライフス 9イル などの状態やその動的変化) 業種 B 日互) ‑ 2 4 9・
-総会~…… 鈴 . . ~~ ライフコースの考慮 ・単一のイベントで、はなくライフコースを考慮したイベントのネットワーク構 遣により動的利用変化をモデル化する。 ・ライフコースを考慮することにより、利用変化の理由に資する有益な情報 が得られることが期待される。 ライフコースとは・.. ライフイベントなどの選択の結果として描かれる「人生の軌跡」のこと。 人生には就臓・転聴・出産など様々な選択があり、その選択の結果によって現在の 価値観が決定するというコンセプトから考えられた分析軸(青木ほか 2007)。 ' ‑ ‑ 匹目 │舗日ー健全印刷局山村山 2M ツトカード利用の動的批評ル m u I ヨ ~ ‑ 2 5 0・
mI │ ωユ + 健 全 … … 加 クレジット利用の動的変化モデルの構築 目的 利用明細を用いてクレジツト利用発展のネットワークモデルを構築し 優良顧客へのパスを把握する。 対象 未利用状態から手j I用状態へと変化した顧客 一 一 一 一 一 一 一 一 一 ー 一 一 一 ノ E霊童 1*5 E亘書 a国 c u r o : i ¥ ; ̲ j i T D |舗ト付金…~ン似 分析アプローチ ( 1)業種のカテゴリ化 ‑利用先を 8種類の業種にカテゴライズ。 ・月単位で各業種の利用有無のフィールド作成。 . " : 3 i i ~ ..公共料金 i l l高速 1mガソリンスタンド I I I D交通 I I I ~スーパー・百貨唐・ショッピングモール・コンビニ I 1m家電量販唐・ホームセンター IDネット通販・通信販売 I I h8.趣味・娯楽 , ~ ‑ 2 5 1・
|ωト付金~~1I:Im.lω ~D 分析アプローチ ( 2 ) 優良顧客の定義 ‑利用金額を基準として優良顧客を定義 1 ヶ月の利用金額を基準としたランクを設定 ,. F 連続した2ヶ月間、上位ランクに位置する顧客を優良顧客として定義 ‑ 型 型 ヨ ・ て直ドー 高 ~-_. 一一一一-_._-~: a・・~ ~ . 4 1 ・h ・ ・ ・ レ / J 1 1 ・ ・ ・ ・h a M+1 M ー ト ト 恥 … … 同 シ ~ ~IllD 分析結果 T (利用開始) T+1 T+2 ;冨冨. ( ・ EEE 日目 ‑252・
四1~
結怯ザー融 '
h
I
miHIDH
'
J
'
}
'
;
;
;
;
'
'
t 均
!&臓の張関倒的諮問慮凡
ー】│
L!!!~j
Sß.""~倣……加wl]D
本分析の目的と使用したイベント
一一
、
一一、¥
f目
的
: ライフステージやライフスタイルなどの顧客の状態やその動的変化を
イベントとして定義し、イベントのネットワ ク構造(ライフコース)から
クレジットカード利用変化の理由を推測する
¥対象
未利用状態から利用状態へと変化した顧客(先と同様)
一一戸J
「ライフステージ
冒
.
・長子入学(小学校、中学校、高校.
・長子高校卒業
.
・新社会人
.
・退職
.
‑給料増加
~長子箆生
l
│
│
1
h
a
仁亙]
‑
2
5
3
‑
201~ │ 鋪 ト 付 金 印 刷 …ω 分析内容 1 未利用→利用開始の際のイベント分析 2 .利用開始後の利用発展のネットワーク構造のモデル化 。 。 1 .利用開始時 ;イベント i 戸 ~I AS. : : 1 ‑ 付 金 … … ン セ 加 利用開始時におけるイベント分析 ・本分析の対象は未利用→利用の顧客であり、その対象顧客が利用開始 時点でどのようなイベントが発生しているかを分析し、イベントのネットワ ーク構造(ライフコース)から利用開始の理由を推測する。 /11 園 国 ‑, ¥ , 1 E亘書 lt. ¥ 巨日 ‑ 2 5 4・
|鉱…ー総会的fim.lC~wn叫 æi]~ 分析結果 ( 1)ガソリンスタンドの利用 ,ーーーーーー ー ー ー ー ー ー ー、 ー 一 一 ‑‑ , 一 ノ ¥ f t 、 、 j . ' 1 l i e @ 未利用→GS の利用変化では複数の理由が推測される ‑小さい子供がいて、所得増加などを背景にライフスタイルが変化 ・子供に手がかからなくなり住宅ローンも完済し資金的余裕が生まれたL.~:,~ 一 一 ー 日 付 金 一m w 加 分析結果 ( 2 ) 家電量販庖・ホームセンターの利用 / I I U 叫 ーーーーーーーーーーーーーーーー‑‑ ‑ J 2 1 1 ・ e 1 . ' J 8 ( 1 ‑子供の誕生や、小さい子供がいて住宅購入などを背景にライフスタイルが変化 住宅ローンの残高減少や給料増加など、資金的余裕が生まれた 〔豆〕 ‑255・
~D
i鉱 … ー 飴 印 刷 ! l ' l … 也 市 ン
利用開始後のイベントを考慮した動的変化モデルの構築
・イベントを考慮した上で、再度、利用開始後のクレジット利用発展のネッ
トワーク構造をモデル化し、優良顧客へのパスを把握。
・イベントのネットワーク構造(ライフコース)から利用変化の理由を推測。
e
‑
‑ 0 ‑~O
1:
3
5
回竺. 。
イベント
.Jt.O-~-'O
巨E
Ip
2
0
1
D
付 金 … … …
分析結果(1)ガソリンスタンドへの利用変化
ーーーーーーーーーー、
ーーーーーーーー
戸
@
。
•
‑子供が誕生し、住宅購入や給料増加などを背景にライフスタイルが変化
・子供に手がかからなくなり資金的余裕が生まれた
[
2
<
1
>
>
1
‑
2
5
6・
│
ω
!
= ~:l番印刷叫':~~t";,,:i
2
0
1
D
=
;
;
1
:
:
分析結果 (
2
) 家電量販庖・ホームセンターへの利用変化
‑ーーーーーー一ー‑ーーーーーーーー、
@
砂
:
砂@
、
ーーーーーーー一一一一一ー一一ーーー'
(弱いネットワークしか確認できなかった)
小さい子供がいて、住宅購入などを背景にライフスタイルが変化
・子供に手がかからなくなり、資金的余裕が生まれた
g
〔亙)
|錨b'B::~会的
-ー~ ~ f_~~~,Ê:~;; ~~~ x'.~':> '~.ぉ-ι.戸:, ;jE
F
時 間 い ー さ 吋 む1
1汁 比 二 湖
[_~~~j
‑257・
ω ユ+範幸対一一 まとめ ‑クレジットカード利用発展のネットワーク構造をモデル化した。 ・顧客のライフコース(状態や動的変化によるネットワーク構造)から、クレ ジットカード利用の動的変化の説明を誤みた。 ・その結果、クレジットカードの利用変化にはライフステージやライフスタイ ルの変化が影響していることが確認された。 ・また、同ーの利用変化であっても、複数の理由(顧客状態変化による要 因)が存在していることも確認された。 巨E 1 1 S wll~ ユ+恥……セツシヨシ 今後の課題 ‑モデルのブラッシュアップ 一 f 1 一 じデー矧聞の偏りを無くす ライフコースを詳細に記述できるイベントの開発 ・銀行商品とのクロスセル 力ード利用の動的変化を銀行商品とのクロスセルに活用し、銀行取引 活性化を目的としたマーケティングの実施 ショッピング l キャγシンク l :~'、I ~ │ 雛反 ~ 巨E ‑258 司
I71 1Tfhrr で 三似ート総会的均時色村益性 ウ 汁 c Z D w l .~ 炉 、 s • 骨 参考文献 ・青木幸弘、乳井瑞代、梅本春夫 (2007)[女性のライフコース変化と消費 市場構造変化を読み解く新 たな視点 ‑J,~学習院大学経済経営研究所年報1 第 21 巻, 1-34 頁. ・C ui,Geng,ManLeungWongandHon‑KwongL u i ( 2 0 0 6 ), MachineLeamingl o rO i r e c tM a r k e t i n g [ s :BayesianNetworkw i t hE v o [ u t i o n a r yPr 勾 ramming",ManagementScience, ResponseM凶 e 5 2 ( 4 )A p r i [2006,pp.597‑612 .0 吋 e,Shaun(2002), Softwarer e v i e w :TheSystem陪司 uiremen! sandp r , ∞essi mpact0 1e v e n t ‑ basedm a r k e t i n gi nl i n a n c i a [s e r v i c白 " , J o u r n a lo fDatabaseMarketing ,9 ( 4 ),pp.383‑388 i r t h iandMonteZweben(2002),TheP e r f e c tMessagea tt h eP e r t e c tMomen , " t • Ka[yanam,K HarvardBusinessReview ,8 3 ( 1 1 )November2005,p p . 1 1 2 ‑ 1 2 0 . • Martensen,Anne,L a r sGronho[dt,L a r sBendtsen,andM a r t i nJ u u [Jensen(2007),A p p [ i c a t i o n0 1 o u r n a lo fA d v e r t i s i n gResearch,4 7 ( 3 ) aMωe[l o rt h eE f f e c t i v e n e s s0 1EventM a r k e t i n g ",J September2007,pp. 283‑301. 争 WongK im(2007),A p p l i c a t i o n0 1Bayesian Mωe[ingt oManagement • Gupta,Sumeet,andHe d s ., [nlαmationSystems:A L a t e n tScoresApproach"i nM i l t a [,AnkushandAshralKassim,e BayesianNetworkTechno < l 口g i e s :A p p l i c a t i o n sandG r a p h i c a lModels,[ G [P u b l i s h i n g,pp.103 ・1 2 6 . ・JωephT .P[umm町 (1971),L il e st y 1ePalternsandCommercia[BankCreditCardUsage",Journa[ 口1M a r k e t i n g,V 口 ,L 3 5 ( A p r i l,1971),pp.35‑ 41 ・本村陽一・西国佳史 ( 2 0 0 7 ) r ベイジアンネットワークによるヒューマンモデリング J,人工知能学会誌 2 0 0 5 ) [ベイジアンネットワークを用いた知的学習支援システム J,人口知能学会 ・植野真臣 ( ・村上知子・酢山明弘・折原良平 ( 2 0 0 5 ) [消費者行動分析における因果的差分の倹出 J,人口知能学会 2 0 0 6 ) [基本周波数情報を用いたダイナミックベイジアンネットワークに ・小林隆二・篠田浩一・古井貞照 ( よる音声認識」、電子情報通信学会 L,,~ Ip ← 炉 問 削 ロ ジ … Hシ ~IljlD Endo fDocument [ 五 日 ‑259・
医療用医薬品の市場構造に関する考察 武藤猛 MarkeTechC o n s u l t i n g 代表 SomeC o n s i d e r a t i o n sonP h a r m a c e u t i c a lMarketS t r u c t u r e T a k e s h iMuto MarkeTechC o n s u l t i n g P r e s i d e n t, 要旨 医療用医薬品の国内市場規模は約 8 . 5兆円 ( 2 0 0 8年度)であり、製薬業界はイノベーションを通じて、 今後の日本の経済成長を牽引することが期待されている。本論文では、医療用医薬品の市場を支配する 競争の要因を、製薬企業問および薬効領域内という 2つのレベルで、考察する。第一の分析では、製薬企 業聞の競争の構造分析、つまり売上高を決定する要因について考察する。第二の分析では、薬効領域内 における製品聞の競争の構造分析を行う。各薬効領域に属する製品のシェア競争の構造を規定する要因 を分析し、薬効領域内の競争のタイプを分類する。さらに、これらの分析と関連付けて、製薬企業の高 収益性が、競争の構造とどのように関連しているかについて考察する。 キーワード:医療用医薬品市場、製薬企業間競争、売上高決定要因、シェア競争のタイプ 1 . 医療用医薬品における競争について 2 0 0 8年度の医療用医薬品の国内市場規模は、園内生産が 6 . 6兆円、輸入が1.9兆円、合計 8 . 5兆円の規模で ある (1)0 1 0年前の 1 9 9 8年には 5 . 8兆円であったので、この 1 0年間に約 14%規模が拡大したことになる (2)。一 方、同じ 1 0年聞に行われた 5回の薬価基準改定は合計マイナス 2 9.4%に及ぶ。さらに、 2 0 1 0年度の薬価基準 . 2 %の追加引下げが行われた。 改定では、新薬創出加算を導入する一方、長期収載品については一律 2 このように、わが国の医療用医薬品市場は、規模が微増してはいるものの、大幅な薬価引下げが行われ、 今後は経営環境がますます厳しくなるものと考えられる。一方、イノベーションの観点からは、医療用医薬 品は日本の経済成長や国際競争力を牽引する重要な産業と考えられている。本論文の目的は、医療用医薬品 の市場構造を支配する要因について考察することである。 図表 lに示すように、医療用医薬品の競争は、①製薬企業聞の競争、および②薬効領域内における製品聞 の競争、という 2つのレベルで 行われていると考えられる。医薬品の分類は、図表 lに示したとおり、大分 類・中分類・小分類の 3段階で捉えることができる。製品聞の競争は、適応対象の疾患に対して医師が選択 可能なレベル(小分類)で行われるので、本論文では「薬効領域」とは、この第 3段階(小分類)を意味し ? } J領域内における競争の総計である。 ている。当然のことながら、製薬企業聞の競争とは、薬 5 なお、厳密には、医師は別々の薬効領域を超えて、患者への医薬品を処方することがありうる。たとえば、 ‑ 2 6 1 ‑
ある高血圧症の患者に対して、薬効領域 i C a措抗剤」に分類される医薬品から、「アンジオテンシン E受 容 体桔抗剤 (ARB)Jに分類される医薬品に切り替えることがある。この問題は興味深く、重要ではあるが、通 常の市場データでは把握できず、医師にたいするアンケート分析やレセプトデータの継続的な分析によりは じめて可能で、ある。本論文では、医薬品開の競争は薬効領域内に限定されると仮定する。 図表 1 医療用医薬品市場における 2つの競争レベル 製薬企業 1 (大分類) 循環器官馴 1 (中分額) │降聞 1 (叢効領鴻) C社 Z社 。 Ca宿銃押j ACE阻害剤 B遮断剤・ αB遮断剤・ α遮 断 剤 事l 尿剤・その他 書橿梗塞泊壇剤.J1n1 宝港解剖・樟消血菅拡彊剤 心不全治療Jl! J l ••• 1 ・ ー │・ │ 抗不整脈剤 │・ │ ・ │ ・ │ │ … I ••• 1 ・ │ 狭心症治療再j 代謝系疾患治療剤 !・ 日 1・ │ ・ │ 解 熱i 間炎鎖痛Jl! J ‑bm 解毒剤 ﹄ │ … │・ 一 │・ │ │ … │ ・ │・ │ │・ │ ・ │・ │ │ … │ … │・ l ZJRFteha 寓議長 1 0 1 x I ••• 1 x × 1 0 1 x 1・ 1 x O 1 x 1 x 1一.1 0 0 1 0 1 x 1・ 1 x │・ │ ・ ー │・ │ │・ │・ │ ・ i !樟酒甑圃扇画 袋詰局内にt T .製品聞の早一 B社 医療用医薬品の分類 J k Y ①製薬企業聞の践争、 1 以下、製薬企業問および薬効領域内という 2つのレベルについて、 J 国次考察する。なお、製薬企業聞 の競争に関する分析については、以前にも発表したことがある (3)が、今回はデータの更新とモデルの再 検討を加え、また薬効領域内競争との関連についても考察を行った。 2. 医療用医薬品市場全体における製薬企業間競争の構造 [ l J 売上高の決定要因 製薬企業聞の競争を表す代表的な指標が売上高である。この売上高を決定する要因について検討する。売 上高を決定する要因は、企業内要因と企業外要因に大別できる。企業内要因は、企業努力により統制可能な 要因であり、製品開発、製造・物流、マーケティング、営業、顧客サービスなどが含まれる。企業外要因は、 経済環境、気候、政府規制(診療報酬改定など)、競合企業の動向などが含まれる。 図表 2は、圏内の医療用医薬品売上高と、営業力の代表的な指標である M R数との関係を示す{針。この図 . 8 2 6とかなり大きい。もちろん、医療用医薬品の売 表によれば、売上高と M R数との回帰式の決定係数は 0 上高は M R数だけで決まる訳ではない。そこで、売上高の決定要因を検討するために、次のようなステップ で分析を行った。 ( 1 ) 売上高の決定要因に関する仮説 ( 2 ) データ収集 ( 3 ) 探索的因子分析 ( 4 ) 共分散構造モデル(パス図) ( 5 ) モデルの妥当性検証 ‑ 2 6 2 ‑
まず、売上高の決定要因に関する仮説としては、営業力とブランドカという 2つの要因を想定した。次に、 製薬企業に関するデータ集併)および各社の有価証券報告書からデータを収集した。基本的には 2 0 0 8年度のデ ータを用いたが、一部のデータは 2 0 0 8年度のものが不明であるため、それ以前の年度のデータを用いた。目 的変数は園内医療用医薬品売上高(百万円、単体)である。説明変数としては、公開データを幅広く収集し たが、探索的因子分析の結果、最終的に選択された変数は、 M R数、宣伝費+販売促進費(百万円)、研究開 発費(百万円)、売上高 1 0 0億円以上の製品数、時価総額(億円)である。これらを用いて、因子分析・重回 帰分析を参考にパス図を描き、共分散構造分析を行った。最も適合度指標が大きかったパス図を図表 3に示 す 。 図表 2 医療用医薬品売上高対 M R数 医療用医薬品売上高対 MR散(肉資および外資製薬企業) 6 0 0 . 0 0 0 5 0 0 . 0 0 0 W : . よ . 肉郁製薬企業 外資系製藁企章 E H ミ 同400.∞ o 恒 社 α3 o 間300∞o I ; r ロ E 械 幽 2 0 0 . 0 匪 理 居 幽 1 .ノ / . . レ f =1 5 2 . 6 6 x ‑ • /.. R = 0 . 8 2 6 4 こ ど. . . IN=64 . . J. /元 ∞ y 一 2 .L 1 0 0 . 0 0 0 レ/ "・ . r ・ イv ・ A ・,,‑p 1 . 0 0 0 500 1 . 5 0 0 2 . 0 0 0 2 . 5 0 0 3 . 0 0 0 MR 数 (09年 4月1日現在 a人) 図表 3 売上高決定要因モデル:共分散構造分析 (SEM)の結果 MR数 標準解 0 . 9 7 1 0 0億円以上の製品数 宣伝費+販売促進費 研究開発費 時価総額 適合度指標 :GFI=O.862 0 . 9 9 ‑ 2 6 3・
図表 3のパス図の適合度指標は十分大きいとは言えないが、経験的には納得できる結果である。営業力は M R数と売上高 1 0 0億円以上の製品数から構成され、ブランド力は宣伝費十販売促進費、研究開発費、およ び時価総額から構成される。営業力に売上高 1 0 0億円以上の製品数が含まれる理由は、次のように考えられ る。医薬品の売上高を決定する要因として、ディテーリング回数の他にターゲティング精度がある (3)。売上 0 0億円以上の大型製品であれば、処方数の多い医師に対して効率的なディテーリングが可能になる。つ 高1 まり、売上高 100億円以上の製品数が営業力の構成要因に含まれるのは、ターゲテイング精度の代替指標で あるためと考えられる。 [ 2 J 企業価値(時価総額)の決定要因 図表 3に示したとおり、ブランド力の構成要因に時価総額が含まれ、その影響力は他の 2つの要因よりも 大きい。時価総額は企業価値の指標ともされ、企業の信用力を表わしている。そこで、製薬企業の時価総額 の決定要因を検討することで、イノベーション産業としての製薬業界の特徴を明らかにしたい。 [ 1 Jにおける売上高の決定要因と同様に、まず時価総額の決定要因に関する仮説から出発する。ここでは、 時価総額が収益力と中長期的製品開発力という 2つの要因から決定されると想定した。収益力に関しては、 目的変数が時価総額であるため、連結売上高と海外事業の比率を説明変数として採用した。次に、製品開発 に関しては、製薬企業各社の開発に関するデータ集(5)から、新薬申請件数(日本・米国・欧州)、およびフェ ーズ E ・フェーズ皿段階の新薬開発件数(日本・米国・欧州)を採用した。なお、時価総額に影響を及ぼす のはフェーズ E以降であることが製薬産業アナリストの一般的な見解である。これらを用いて、因子分析・ 重回帰分析を参考にパス図を描き、共分散構造分析を行った。最も適合度指標が大きかったパス図を図表 4 に示す。 図表 4 時価総額決定要因モデル:共分散構造分析 (SEM)の結果 標準解 売上高(連結) 海外事業比率 新薬開発=日本・申筒中 新薬開発・米国・申筒中 新薬開発・欧州・申筒中 新薬開発・米国.Phnm 新薬開発・欧州・ Phnm 適合度指標 : GFI=O.733 ‑264・
図表 4のパス図の適合度指標は十分大きいとは言えないが、経験的には納得できる結果である。収益力は 売上高(連結)と海外事業比率から構成され、短期的開発力は、日本・米国・欧州、[3地域の新薬申請件数、 r r.mの新薬開発件数から各々構成される。パス係 中長期的開発力は、日本・米国・欧州、[3地域のフェーズ: 数を見ると、日本に較べて米国と欧州の影響が大きいことが興味深い。このことは、臨床開発における日本 市場の遅れを反映していると考えられる。 以上、 [ I Jと [ 2 J の分析を総合すると、イノベーション産業としての製薬産業においては、中長期的な製 品開発力が時価総額に影響を及ぼし、時価総額はブランドカの重要な構成要因となっていることが明らかに なった。 3. 薬効領域内における製品問競争の構造 [ l J 使用したデータと分析の方法 最初に述べた通り、今回の分析では、医薬品聞の競争は薬効領域内に限定されると仮定する。使用したデ ータは、医療用医薬品 i こ関するデータブックである ( 6 ) 。このデータブックによれば、医療用医薬品の分類の 4種類、中分類は 5 1種類、小分類(薬効領域)は 1 7 3種類、製品数は 1 1 8 5種類である。し うち、大分類は 2 たがって市場に出回っているすべての製品を含んでいる訳ではないが、金額的には大部分をカバーしている と考えられる。分析の対象は、「製品開競争が十分行われている薬効領域」として、製品数が 4以上含まれる ものに限定した。理由は、①製品数が少なすぎると十分競争的ではないと考えたため、および、②第 l位 か ら第 3位まで、のシェア値やその合計と比率を薬効領域内の競争に関する変数として使用するため、である。 使用したデータブックには、薬効領域内の製品として「その他」という固有名称のないものが含まれる場合 があるので、念のため製品数を 4以上の薬効領域に限定し、そのうちの上位 3製品を用いて詳細な分析を行 4 4種類である。 った。製品数が 4以上の薬効領域は 1 分析の方法としては、各種のグラフ化で薬効領域の概要を把握した後、因子分析とクラスター分析で、製 品開競争の特徴を抽出することにした。 [ 2 J 薬効領域内競争の概要 薬効領域の市場規模には大きな差がある。平均市場規模は 3 7 3 . 8億円であり、最大は 4 1 6 7 . 0億円、最ノトは 1 .5億円である。薬効領域に含まれる平均製品数は 6 . 8であり、製品数が 3以下の薬効領域数は 2 9である。 図表 5は、薬効領域別市場規模(常用対数)と成長率 ( 2 0 0 5年を 1 0 0とした時の 2 0 0 8年の値)の関係を示 0 5 . 6である。数種類の薬効領域が平均値からかなり大きく外れた成長率を持っている。 す。全体成長率は 1 これらの薬効領域を除くと、市場規模が大きくなるほど成長率が大きいことが観察される。 、 0% から 1 00% 各薬効領域内の競争状況を端的に表わす指標が、第 1位の製品のシェアである。図表 6は まで、 5% 刻みで、シェアを区分した際に、各区分値にいくつの薬効領域が含まれるかを示したものである。市 場における企業間競争を整理した「ランチェスター理論 Jによれば、第 l位の安定目標値は 42%とされるの。 ここでは一つの目安として、「安定的シェア目標値」を 40%とする。図表 6によれば、第 l位製品の平均シェ 以上の領域数は 6 6である アは 43%であり、安定的シェア目標値を超えている。また、第 l位のシェアが 40% (全体の 4 6 % )。図表 7は、図表 6と同じ区分値を用いて、第 3位まで、のシェアイ直の合計の分布を示したもの である。この図表によれば、すべての薬効領域で、第 3位までのシェア値の合計は 40%を超えている。図表 6および図表 7から、競争市場として捉えた薬効領域は、第 1位製品のシェアが安定的である場合が半数近 くあり、また第 3位まで、の合計はすべて安定的シェア目標値を超えているので、 3位以内に入っていない製 品が 3位以内に食い込むのは非常に難しいとし、う特徴を持っている。 ‑ 2 6 5・
図表 5 薬効領域別市場規模対成長率
薬効領域別市場規模対成長率
1400
1300
‑脱毛症治療剤
1200
‑
=
‑11∞
g
日 1
000
N=173
+
平均市場規模 3
7
3億円(常用対数値 :227)
l
@11
平均成長宅~zpO_5~:-+勿08年、 2005 気=100 汗 105;6
社
5
N 900
'"一
船
'
. 800
措
∞
ロ
市
t
‑
,
.
.
. 'P':'絹:f.~
700
• Gn'RH7
ン聖ゴニスト
C
e
T
w
3
500
f
桂 田 圃 書 泊 曜 剖1
社+
国
~
500
時
4
∞
∞
・
、
ー
、7"'‑'回l
同地句会主'''''・G温凶 r
金合 1'"
抗コリン骨I
J
(COPD
治療膏1
]
)
世
U
H 3
アンジオテンシン E
JIl.=I++
200
∞L
二
1
。。
‑
・・
一
・
・:
・
・
'a
・
・
ー ‑'
.
.
・r
ー
・ ・ ・!
.
.
.
.
.
.
.
.
t
̲
.
.
.
.
.
.
・
̲
.
.
*
‑‑
...
.
.
̲
‑
.
y.て
‑
'
司
.
.
、
‑
・
・
"
'
P
、
守・
町
‑
、
.
、
.
.
.
0
.
5
p
~.....司・
1
.5
1
.0
2
.
0
2
.
5
3
.
0
3
.
5
4
.
0
市場規模(億円=対数)
図表 6 各薬効領域の第 1位製品のシェア値分布
各薬効領域の第 1位の製品のシェア値分布 (2008年)
薬効領域の数
。
1
0
15
2
0
25
3
0
困 0.1‑0.15
l
i0.15‑0.2
2
型0.2‑0.25
4
1
3
~ n
'
)r
:
;.
.
.
.
.
.
.
n'1
H‑
‑
‑
、
.
'
8
21
曹 司
1
3
0
.
3
‑
0
.
3
5
0
.
3
5
‑
0
.
4
日
巴
ロ 0
.
4‑0.
45
~
ndr
:
;.
.
.
.
.
.
.
nr
:
;
8‑
ー
̲
.
‑
13
s
8
U.O‑U日
1
1
純
,
:
:
r
:
;
G一
….......n
u
.
.
.
.
.
質 問.
.
.
.
.
.
0
.
7
6
‑各薬効領域の製品数が4以上の場合
思 0.7‑0.75
摂 0.75‑0.8
械 0.8‑0.85
型
炉 0.85‑0.9
麗輔議離
6
'N=144
平均シェア値:0
.
42
9
・最大シェア値 :
0
.
9
6
8
(骨粗怒症治療剤(カルシトニン製剤))
0
.
1
6
3
(注射用セフェム系抗生物質)
・最小シェア値 :
‑
第1
位のシェア値が40%以上の薬効領域数 :
66(46%)
2
‑
2
6
6・
図表 7 各薬効領域の第 3位までのシェア値合計の分布 。 第3位までのシェア値合計の分布 ( 2 0 0 8年) 薬効領域の数 5 10 15 20 25 0‑0.05 10 0.05‑01 10 ‑各薬効領域の製品数由旬以上の場合 0.1‑0.1510 'N=144 0 . 1 5 ‑ 0 . 2 10 ‑平同値 0.763 0 . 2 ‑ 0 . 2 5 10 4 日 ̲0 . 2 5 ‑ 0 . 3 口 市 4田 0 . 3 ‑ 0 . 3 5 10 出 0.35‑0.4 10 t > ‑0. 4‑0 . 45 H , λ045‑0.5 第3 { 立ま宅のb主ナ値合計!ま{ ずベモの薬効領域で安定自ザ; 4 80.5‑0.55 10 側 ドJ (l.'i.'i̲(l内 10 S0.6‑0.65 12 J M 0 . 6 5 ‑ 0 . 7 15 持。 7‑0.75 網 ~Iア早縄値 (tQ九)1ぽt_ C1 辛 =3 位以内に入ラ玄いない 、込; む . ‑ 同 11 0 . 7 5 ‑ 0 . 8 14 0 . 8 ‑ 0 . 8 5 21 0 . 8 5 ‑ 0 . 9 18 0 . 9 ‑ 0 . 9 5 13 0.95‑1 15 [ 3 J 薬効領域の因子構造とクラスター構造 各薬効領域の競争状況を指標化して因子構造を抽出した。結果を図表 8に示す。使用した変数は次の通り である。①薬効領域内の製品数、②薬効領域の市場規模(億円)、③市場の成長指数 ( 2 0 0 5年=キ2008年)、④ 薬効領域内の順位変動(第 l位製品)、⑤薬効領域内の順位変動(第 l位 第 l位製品のシェア、⑦第 l位 第 2位製品のシェア合計、⑧第 l位 第 3位製品の順位変動合計)、⑤ 第 3位製品のシェア合計、⑨第 2位 のシェア÷第 l位のシェア、⑮第 3位のシェア÷第 l位のシェア。なお、ここでは順位変動合計とは、 2008 年の順位と 2 0 0 5年の順位の差の絶対値を、薬効領域内の製品について合計したものである。図表 8に記した ように、因子パターンより、第 l因子は「シェア因子」、第 2因子は「順位変動因子」と命名した。 図表 8と同じ変数を用いて、クラスター構造を抽出した。デンドログラムの観察から、 3クラスターとす るのが適切である。結果を図表 9にまとめた。クラスター別の各変数の平均値の特徴から、各クラスターを 各々、「激戦クラスター」、「ハイトップシェアクラスター」、および「エマージングクラスター」と命名した。 激戦クラスターは、薬効領域内の製品数が最も多く、平均市場規模も最大である。第 3位のシェア÷第 l位 のシェアが最も大きく(つまり、第 3位が第 l位に近接している)、競争が激しいことを示唆している。具体 例としては、生活習慣病系疾患用の薬効領域がある。ハイトップシェアクラスターの特徴は、第 l位製品の シェアが大きいことの他に、第 2位まで、および第 3位まで、のシェア合計も最も大きいことである。市場規 模は中程度である。具体例としては、抗認知症剤や抗がん剤(分子標的治療剤)がある。最後に、エマージ ングクラスターの特徴は、成長指数が大きく、順位変動が大きいことである。市場規模は最も小さい。具体 例としては、頻尿・尿失禁治療剤などがある。 0は、シェア因子と順位変動因子を軸として、各薬効領域をプロットしたものである。かなり明瞭に 図表 1 クラスターが区分されているのが観察できる。 ‑ 2 6 7 ‑
図表 8 薬効領域の因子構造 因 子2 使用した変数 項目 固有値 寄与率 累積寄与率 因 子1 4 . 4 5 4 4 4 . 5 3 5 4 4 . 5 3 5 1 . 8 0 8 1 8 . 0 7 7 62.613 因子名称 シェア因子 順位変動因子 一0 . 6 5 9 ー0 . 2 0 0 ‑0 . 0 1 5 0 . 1 2 4 ‑ 0 . 1 6 8 一0 . 1 3 3 0 . 9 6 0 0 . 9 6 2 0 . 9 0 3 ‑ 0 . 6 8 7 ‑ 0 . 8 4 7 0 . 5 1 0 0 . 8 7 1 0 . 9 0 6 ‑0.038 ‑0.032 ー0 . 0 6 6 0 . 0 5 3 ‑0 . 0 5 9 薬効領域内の製品数 薬効領域の市場規模(億円) 市 場 の 成 長 指 数( 2005年司 2008年) 薬 効 領 域 内 の 順 位 変 動 ( 第1 位製品) 薬効領域内の順位変動(曹1位 即位製品の圃也宜動音量 第1 位製品のシェア 第1 位 第2位 製 品 の シ ェ ア 合 計 第1 位 第3位 製 品 の シ ェ ア 合 計 第2 位のシェア÷第1 位のシェア 第3 位 の シ ェ ア ÷ 第1 位のシェア 0.142 図表 9 薬効領域のクラスター構造 クフスタ一番号 クフス合一 1 クラスター2 クフスター3 クラス哲一名称 重量破クラスター ,、イトップシェアクラスター エマージングクラスター 薬効領域数 4 9 1 0 . 4 6 9 0 1 01 . 0 0 . 1 8 4 1 .3 0 6 0 . 2 8 6 0 . 47 4 0 . 6 1 2 0 . 6 9 9 0 . 5 2 5 9 0 6 . 2 3 0 1 1 0 3 . 0 0 . 0 2 2 0 . 7 2 2 0 . 5 1 5 0 . 7 3 7 0 . 8 5 2 0. 48 8 0 . 2 6 5 5 1 0 . 2 2 1 5 1 2 7 . 7 8 . 0 0 0 1 1 . 6 0 0 0 . 2 8 5 0 . 5 1 5 0 . 6 3 4 0 . 8 0 6 0 . 4 3 7 曙 の 製 醐 市場規模(億円) 指数 ( 2 0 0 5年=托∞8 年) の順位変動(第 1 位製品) 薬効領域内の順位変動暗唱句即位製品の順位変動会2 第1 位製品のシェア 第1 位 第2 位製品のシェア合計 第1 位 第3 位製品のシェア合計 第2 位のシェア:第 1 位のシェア 第3 位のシェア÷第 1 位のシェア 攻撃因子開制剤プロトンポンプ阻害嗣I押 1 ) 京楠血管銘張剤 HMG ‑CoA置元副業阻奮剤{スタチン系) 貧血治療剤{ヱリスロポヱチン剤} 抗がん剤【抗がんホルモン剤} 抗箆知症剤 ヒスタミン附桔抗剤 非定聖民精神病剤 件用消費鏑痛剤 抗がん剤{分子標的治療剤) 抗がん剤{代樹措航剤) 合成銃菌剤 0 1 属部・説血小梅剤 経ロセフェム某抗生鞠置 経口銃1 防御因子増強剤および配合剤 ロイコトリヱン措銃剤 注射用セ7ェム系抗生物質 SSRI'SNRI 前 立 国 毘 文 症 治 寝 間 (alー プ ロ ヴ カ 一 割 桐 } 緑内障,古療剤 アンジオ予ンシン E豊容体桔航剤 c . 倍抗剤 具体的な薬効領域の例 ‑268・ カリヱ締貴治療剤 肝集車治療剤{ウイルス性肝世以外) 抗アレルギー点眼剤 性捜剥滋ホルモン剤 頻尿・尿失策治痩剤
図表 10 クラスターの特性図 シェア因子と順位変動因子の二変量の関係 0:クラスター 1(激戦) 6 卜:クラスター 2(1、ィトップシェア) .:クラスター 3(エマージング) . 自3 量 重2 。。 偏 鍋 仏脚。吋 。 0 O 0 00 0 。 α5P 。 0 ‑ 2 ‑ 2 H O' j 今 、 同 二 ‑ 守 円 。 シェア因子 [ 4 J 薬効領域のライフサイクルと薬効領域内の競争(仮説) 製品と同様に、薬効領域自身がライフサイクルを持っている。すなわち、新しい医薬品の新しい作用機序 製品が先行品を がイノベーションとして発見され、それに基づいた製品が上市されると、同じ作用機序の 5 J 3I 追って上市される。このようにして、薬効領域が創出=宇成長=キ成熟=宇衰退=キ消滅という過程を辿る。エマー ジングクラスターは、創出ないし成長期を代表するものと考えられる。この後の経過であるが、その薬効領 域の参入障壁(特許や製造ノウハウなど)により、激戦クラスターに移行するか、またはハイトップシェア クラスターに移行するかが決まると推定される。参入障壁が低ければ前者に、高ければ後者に移行するので はないだろうか。これはもちろん仮説であり、今後より長期間の競争の推移の分析が必要である。 4. 考察と今後の課題 [ l J 考察 9 9 8年度から 2008 製薬業界は、他業界に比べると高収益性と研究開発重視である点が特徴である。実際、 1 年度までの売上高対営業損益の平均値は、全製造業の 5.2%に対して、製薬業は 17.3%であり、他業種に比較 すると高収益性は抜きん出ている向。また、 2008年度の売上高対研究開発費率は、全製造業の 3.9%に対して、 製薬業は 1 1 .7%であり、こちらも研究開発型の特徴が明らかである{針。業界 l位 や 2位などの上位企業だけで なく、なぜ業界全体として、このような高収益が達成出来るのであろうか。第一の理由は、薬価が公定価格 であり、価格競争がないということが考えられる。第三の理由は、本論文のテーマである、医療用医薬品の 市場構造に関係していると考えられる。 すなわち、医療用医薬品の競争市場は多くの薬効領域に細分化され、それぞれの薬効領域で高シェアを獲 6 得すれば、高い利益率を達成できるのである。実際、第 I位製品が、安定的シェア 40%以上の薬効領域は 6 (46%) ある。また、第 3位までのシェア値合計はすべての薬効領域で安定的シェア 40%以上である。この ことから、各薬効領域で第 3位以内の製品をいくつか持つことにより、結果として高い収益性を達成できる。 ‑269・
なお、企業間競争に関しては、医療用医薬品全体の市場について業界1{立の企業であっても、そのシェアは 10%以下に過ぎなし州。このように、医療用医薬品に関する 2つの競争レベル、①製薬企業聞の競争、および ②薬効領域内における製品聞の競争のうち、高収益性に貢献しているのは、②薬効領域内における製品聞の 競争であることが分かる。 製薬企業間競争の構造を分析した結果、医療用医薬品の売上高は、「営業力」と「ブランドカ」で説明でき ることが明らかになった。また、ブランドカの主要な構成要因である時価総額(企業価値)は、「収益力」、 「短期的製品開発力」および「長期的製品開発力」で説明できることも明らかになった。「研究開発型」とい う製薬業界の特徴は、多額の研究開発投資により新製品を(薬効領域単位の)市場に提供するという本来の 目的以外に、ブランドカを通じて、売上高アップに貢献していると言える。 [ 2 J 今後の課題 今後の課題は次の通りである。 ①医療用医薬品市場全体における製薬企業間競争の構造について、サービス業で重視される「顧客満 足度」を取り入れた売上高決定モデルの検討。 ②薬効領域内における製品開競争の構造について、薬効領域自身のライフサイクルに応じた、競争の タイプの長期的な遷移の分析。 ③以上を考慮した、製薬企業聞に関する競争モテ守ルの検討。 参考文献 (1)厚生労働省:平成 20年薬事工業生産動態統計年報 ( 2 0 0 9年) ( 2 ) アステラス製薬:数字に見る医療と医薬品 2009 ( 2 0 0 9年 1 2月) ( 3 )武 藤 猛 : 製 薬 企 業 の 営 業 力 分 析 ‑SFE ( S a 1 e sF o r c eE f f e c t i v e n e s s ) のアプローチによる、 SASForumユ ー ザ 会 学 術 総 会 2006 (2006 年 7 月 27 日 ~28 日) ( 4 ) 医薬ランキング 2009、Month1yミクス増刊号( 2 0 0 9年 9月) ( 5 )2 0 0 8年版製薬企業の実態と中期展望、国際商業出版 ( 2 0 0 8年 3月) (6) 医療用医薬品データブ、ツク 2006 年版 ~2010 年版、富士経済 (2006 年 ~2010 年) ( 7 ) ランチェスター戦略学会監修・福田秀人著:ランチェスター思考 競争戦略の基礎 、東洋経済新報社 ( 2 0 0 8年) ( 8 ) 日本政策投資銀行編集:産業別財務データハンドブ、ツク 2009、日本経済研究所発行 ( 2 0 0 9年 1 2月) ( 9 )総務省:平成 2 1年科学技術研究調査結果の概要 ( 2 0 0 9年 1 2月) 270 ー 司
I ぬ ふ が 尚 一 一 一 一 一 ?γ " . . . .~~.- mI 々 SASによる E x c e l出力に関する機能の比較検討 スタンドアロン環境から 81環境まで 佐藤耕一 株式会社タクミインフォメーションテクノロジー AComparisono fSASF u n c t i o n sDesignedf o r C r e a t i n gE x c e lOutputi naStand‑alone EnvironmentandaB IEnvironmen. t K o i c h iSatoh TakumiI n f o r m a t i o nTechnologyCo.,L td . I ぬ 日 一 儲 … 一 一 昨 ム ム →た寸.mJ~ 要旨: SASシステムを使用して M i c r o s o f tE x c e lで読み込めるファイル形式の出 力ファイルを作成する場合、 ODSEXCELXP、ODSHTML、ODSCSV、 DDE、LIBNAMEEXCEL エンジン、 EXPORT といった、いくつかの方法を利 用することができる。それぞれの機能の基本構文の説明と、利用状況に よる利点・欠点をまとめ、比較検討を行った。 また、スタンドアロン環境と B I環境を実行環境とした場合の利用目的別 の可能性を模索すると共に、それぞれの機能はどのような場面での使 用が有用かを図や表を用いて示した。 キーワ ド ODSE XCELXP、ODSHTML、ODSCSV、DDE、 L lBNAMEEXCEL エンジン、 EXPORTプロシジャ ‑273・
│ ωユ + 蝕 Q …防WlJ ' T i f f 1 . ' 1 I T ' 1 Ja 発表の流れ 1.基本構文 2 .機能比較 3 .利点 4 .欠点 5 .まとめ Ip 内 会 … ノ ロ 4ソ 1.基本構文 ‑ 2 7 4・
I 崎山飴……ミム ー mI 基本構文:ODSEXCELXP 【一般的な構文】 ODSTAGSETS.EXCELXPFILE=明 lename": ODSTAGSETS.EXCELXPCLOSE; 【 Sample プログラム] ODSTAGSETS.EXCELXPFILE= EXCELXP.XLS PROCPRINTDATA= SASHELI 司CLASS: RUN; ODSTAGSETS.EXCELXPCLOSE : 【備考 1 ・ODSのマークアップタグセット!ま、さまざまなマークアップ言語を選択 (TAGSETSを指定)してレポートを出力する機能。 │ 鈍 怯 和 総 fiID2WJ.V;:pm!… 基本構文:ODSHTML 【一般的な構文] ODSHTMLFILE= " f i l e n a m e "; ODSHTMLCLOSE; 【 Sample プログラム】 ODSHTMLFILE= HTML.XLS PROCPRINTDATA SASHELP.CLASS; RUN; ODSHTMLCLOSE; = 【備考】 ODSHTMLIま 、 SASVer9 . 1から ODSのマークアップタグセットです。 ‑ 2 7 5 ‑ ~~
1 鎖怯付金~…
基本構文:ODSCSV
【一般的な構文】
ODSCSVFILE=
"
f
i
l
e
n
a
m
e
";
ODSCSVCLOSE;
【
Sample
プログラム】
ODSCSVFILE= CS
V
.XLS ;
PROCPRINTDATA=
SASHELP.CLASS ;
RUN;
ODSCSVCLOSE;
【備考】
ODSCSVは
:
、 ODSTAGSETS.CSVと閉じ
一
…
一
一
…
ー
.
基本構文:DDE(DynamicDataExchange)
【一般的な構文】
FILENAMEf
i
l
e
r
e
fDDE'DDE・
t
r
i
p
l
e
t
'<DDE‑options>;
【
Sample
プログラム】
FILENAMEOUTDDE e
x
c
e
l
l
s
h田 t
1!
r
1c
1:
r
100c100 NOTAB;
DATA̲NULL̲・
FILEOUT ;
SETSASHELP.CLASS;
0
9
'
x);
PUTしALL̲)('
RUN;
FILENAMECMDDDE e
x
c
e
l
l
s
y
s
t
e
m'
DATA̲NULL̲ ;
FILECMD;
PUT [QUITOl,
RUN;
‑276・
I 付金問問山中‑
守
宅~~
基本構文:LlBNAMEステートメントの EXCELエンジン
【一般的な構文】
L
lBNAMEl
i
b
r
e
f<engine><
'
S
A
S
‑
d
a
t
a
‑
l
i
b
r
a
r
y
'
>
;
【
Sample
プログラム】
L
lBNAMEI
NEXCEL"
L
lBNAME.xls"・
DATAIN.EXCEL;
SETSASHELP.CLASS;
RUN;
I
t
g
;
S
S
健会一……主
3
m
9
基本構文:EXPORTプロシジャ
【一般的な構文】
PROCEXPORTDATA=<libref.>SAS‑data‑set<
(
S
A
S
‑
d
a
t
a
‑
s
e
t
‑
o
p
t
i
o
n
s
)
>
OUTFILE=明 lename"I
OUTTABLE="tablename"
<DBMS=identifier><REPLACE>;
トs
t
a
t
e
m
e
n
t
(
s
)
;
>
<
d
a
t
a
‑
s
o
u
r
C
E
RUN;
【
Sample
プログラム】
PROCEXPORTDATA =SASHELP.CLASS
OUTFILE="EXPORT.xls"
DBMS =EXCEL :
SHEET=sample;
RUN
10
‑277・
. 一 一 純 一 2 .機能比較 1 1 I r n 一昨……シン I W l J 機能比較:ファイル形式 XLSファイ jレ × XML ファイ jレ 。 HTML ファイ jレ CSVファイ jレ × × X X 。 I X × × × 。I I × × × I0 10 × X X 。 1 : ‑278・
I A S.:lーザー健会……… ~I 機能比較:ページ設定 ODS ODS ODS 日: c e 凶 P HTML CSV ページ (印刷の向き等) 余白 ヘッダー/フッダー シート (印刷タイトル) 。 。 。 。 。 。 。 。 × × × × 。 。 。 。 。 UBNAME 日 PORT I DE EXCEL プロシジャ エンジン × × × × × × × × 13 [ I T I i ) |鈍S時総会~…… 機能比較:セルの書式設定 UBNAME EXPORT ODS ODS ODS DDE EXCEL プロシフャ EXCELXP HTML CSV エンジン 表不形式 配置 フォント 罫線 パターン 。 。 。 。 。 。 。 。 。 。 × × × × × 。 。 。 。 。 × × × × × × × × x x 14 ‑279・
Ip WlJ~ 付金印刷ロ…… 機能比較:その他 既存ファイル修正 ワークシート追加 ODS ODS ODS EXCELXP HTML csv 。 。 。 X × X UBNAME DDE EXCEL EXPORT プロシジャ 。。 。 。。 。 エンジン " │ 一一総会…ー でシ O O I J I 3 .利点 1 6 . 2 8 0・
│ ー ー 会 均 一 … 同 . 利点 機能 詳細 ODSEXCELXP カスタム帳票(非定型)が作成可能 ODSHTML カスタム帳票(非定型)が作成可能 ODSCSV 出力されるファイルの構造が単純 他アプリケーションとの連携が容易 DDE 出力されるファイルの形式が M i c r o s o f tE x c e l カスタム帳票(非定型)が作成可能 L 1BNAMEEXCELエンジン 出力されるファイルの形式が MicrosoftExcel SASデータセットと同等に使用可能 EXPORT 出力されるファイルの形式がM i c r o s o f tE x c e l ポイント&クリックで作成可能 1 7 Ib ト 総 会 … 4 .欠点 13 ‑ 2 8 1・
I 宇か……>KIシ . 欠点 樋能 欝細 ODSEXCELXP 出力されるファイルの形式が XML ダブルバイト対応していないスタイルがある。 ODSHTML 出力されるファイルの形式が HTML ワークシートの複数作成不可 ODSCSV 出力されるファイルの形式が CSV ワークシートの複数作成不可 DDE B I 環境で使用不可 処理終了まで DDEサ‑/¥ーの起動が必要 L lBNAMEEXCELエンジン カスタム帳票(非定型)の作成不可 SAS/ACCESSI n t e r f a c et oPCF i l e sが必要 EXPORT SAS データセット以外入力不可 カスタム帳票(非定型)の作成不可 l ' ( ω トザ一昨一品ソ ー ~lllI 5 .まとめ 2 0 ‑282・
1 1 1 + ~~ 健全印刷!Ell!rPJ… まとめ 帳票種 類 非定型 定型 環境 結果 スタンドアロン環境 DDE B I環境 ( s p,AMO) EXCELXP※ DDEの機能が使用不可のため スタンドアロン環境 UBNAMEスアートメントの EXCEL エンジン B I環境 ( s p、AMO) UBNAMEステートメントの EXCEL エンジン 1環境の普及や DDEの代わりを模索する傾向が強まり ※非定型帳票では、近年 8 つつある中で ODSのマークアップタグセット (TAGSETS.EXCELXP)はかなり有 効 。 ※定型帳票では、テンプレートファイルを事前に作成し、データ用ワークシート (データ出力)と定型帳票ワークシート(印刷)をリンクで結ぶ方法でより締漫な定型 帳票が作成可能 I‑ 付金町一一回 D 参考文献 SASI n s t i t u t eI n c ODSMARKUPResources" . htlp://suppo バ sas.com/rnd/ba s~l国豆国主凹宣国QI_ SASI n s t i t u t eJapan."SASレポートライティング 1プロシジャと ODSの使用" ‑283・
K a p l a n ‑ M e i e rフ。ロットに付加情報を追加するマクロの作成 長 島 健 悟 l, 佐 藤 泰 憲 2.3 l城 西 大 学 薬 学 部 薬 科 学 科 2千 葉 大 学 医 学 部 ハーバード大学公衆衛生大学院生物統計部門 3 ASASmacrof o re x t e n d e dK a p l a n ‑ M e i e rp l o t s Y a s u n o r iSato2 • 3 KengoNagashima1, , 1D e p a r t m e n to fP a r m a c e u t i c a lT e c h n o c h et I Us 仕 yJ o s a iU n i v e r s i t y 2S c h o o lo f M e d i c i n e, C h i b aU n i v e r s i t y , 3D e p a r t m e n to f B i o s t a t i s t i c sH a r v a r dS c h o o lo f P u b l i cH e a l t h 要旨 生存時間データの解析結果を報告する際には,生存曲線(多くの場合 K a p l a n ‑ M e i e rプロット),生存期 間中央値,リスク集合の大きさ,生存時間の群間比較の検定(例えば、 l o g ‑ r a n k検定の P値),ハザード 比などを示すことが望ましい.実際に,主要医学雑誌や新薬の承認申請などに生存時間データの解析結 a p l a n ‑ M e i e rプロットと上に挙げた項目等を合わせて示すことが要求される. したがっ 果を示す場合, K て,統計解析ソフトウェアで簡便に出力できる事が望まれる. SAS9 . 2 の LIFETESTP r o c e d u r eでは, ODSGraphを利用することで,リスク集合のサイズを出力は可 能だが,それ以外の付加情報を追加することは難しい.また, SAS9 .1.3では K a p l a n ‑ M e i e rプロットに リスク集合の大きさを含めた付加情報を追加することができない.そこで,これらの付加情報を追加す ることができる SASマクロを作成した. r o c e d u r eの a n n o t a t eo p t i o n を用いて実装しており,上に挙げた項目(生存期間 本マクロは, GPLOTP o g ‑ r a n k検定の P値,ハザード比)以外の付加情報を加えたい場合にも, 中央値,リスク集合の大きさ, l . 2 の ODSGraph によるリスク集合のサイズの出力と,本マク 容易に拡張が可能である.また, SAS9 ロの出力の比較を行った結果についても紹介する. キーワード:K a p l a n ‑ M e i e rp l o t ;Numbera tr i s k ;LIFETESTP r o c e d u r e ;GPLOTP r o c e d u r e ;ODSG r a p h ; TEMPLATEP r o c e d u r e 1 . % 初1d l σt a O マクロ 本稿では,作成したマクロおよび SAS9 . 2 でのグラフ描画例を紹介する.すべてのグラフ描画例を実行する 場合には,付録のプログラム 7およびプログラム 8を事前に読み込んでおく必要がある. 開 285‑
1.1.マクロの機能と構成 本 マ ク ロ は 現 在 (Ver2 .1.1)以下の機能を提供している. 1 . 付 加 情 報 の 出 力 . 生 存 期 間 中 央 値 , リ ス ク 集 合 の 大 き さ , 生 存 関 数 の 差 の 検 定 (Iog‑ranktest,Wilcoxon t e s t,L i kelihoodr a t i ot e s t ), Coxの 比 例 ハ ザ ー ド 、 モ デ ル に 基 づ く ハ ザ ー ド 比 2 . 生存関数の信頼区間の出力 3 . 打ち切り記号の拡張 %加l̲dataO マ ク ロ を 実 行 す る と , GPLOTP rocedure 用 の デ ー タ セ ッ ト と annotateoption 用 の デ ー タ セ ッ ト を 生成し,それらを用いてグラフ描画を行う構成となっている.マクロ実行の際に必要となる引数(入力デー タ セ ッ ト 名 , 付 加 情 報 に 関 す る オ プ シ ョ ン な ど ) を 表 lに 示 す . 1 : γokm̲dataO マ ク ロ の 引 数 表 引数名 説明 引数名 d a 阻 入力データセット名 B a s e t u n e [ d a t a ] 内の生存時間変数名 S t e p 説明 リスク集合の大きさの縦軸出力 i t r .控. 0を設 定すると機軸に銭する. リスク集合の大きさの表示間隔.重なってし まう場合は値を変える. S甘a [ d a 凪]内の層の変数名 Lab e l リスク集合の大きさの一番上の行に出力され るラベル. c e n s o r [ d a 阻]内の打ち切りの変数名 T巴員 0 : 出力しない, 生存関数の差の検定の出力 ( c e n s α r v 変数 [ c e 田町]の t Jち切りを表わす値 T c 説X 生存関数の差の検定の出力位置{償軸).デー 1 : 出力する) 0 0 タエリアのパーセンテージで指定します.1 が一番布. (以ドの出力 i t r .位指定も問機) o u t 出力データセット名 T巴司Y 在住(縦軸).デー 生存関数の差の検定の出力 f ∞ タエリアのパーセンテージで指定します.1 が一審上. (以ドの出力枕位指定も同様) a n n o 出 力 す る 回n o t a t eデータセット名 T刃措 検定の種類 ( l o g r 阻 k :l o g ‑ 回n kt c s t, 聞I c o x o n : 町a l i z e d聞 I x o ∞ntes,l likeliho叫 ratio:like‑ g e n l i h o o d悶 t i ot e 5 t ) C I 信頼 l 豆聞の出力 ( 0 : 出力しない, 1 : 出力す HR ハザード比の出力 ( 0 : 出力しない, 1 : 出力す る).対照群には param=r e f r e f =加 を 指 定 る) します. E 奴X 生存関数の差の検定の出力位置(償軸). 拡張打ち切り記号の高さ HRY 生存期数の差の検定の出力佼置(縦軸). 拡張打ち切り記号の太さ MST censEXT 打ち切り記号の拡張。:拡張しない, 1 : 舷張 c H e i g h t c Wid t h する) 生存期間中央値と 95% 信頼区間の出力 ( 0 :出 : 出力する) カしない, 1 S i z c a t r i s k 付加情報の文字サイズ MlabX 生存期間中央値の層ラベノレの出力枕世(績 リスク集合の大きさの出力 ( 0 : 出力しない, MciX i / : 世 生存期間中央値の 95% 信頼区間の出力 i 1 : 出力する) ここで,本マクロを利用する際の注意点について述べる.ハザード比の出力においては,層の変数の値を ラ ベ ル と し て 出 力 し て い る た め , 出 力 し た い ラ ベ ル は datastep 上 で 編 集 し て お く 必 要 が あ る . ま た , リ ス ク ‑286・
集合のラベルについても各自で設定する必要があるため,群を取り違えないように注意する必要がある .n を層の数とすると,出力されるデータセット [ o u t ] には,生存関数の推定値を示す変数 SVI‑SVn,生存関数 の信頼区間の下限と上限を示す変数 SLl‑SLn,SUI‑SUn,打ち切りを示す変数 CSDFI‑CSDFnが含まれる. 色の設定については,グローパルマクロ変数 c o l o rI ‑ c o l o r n( 打ち切り記号拡張用), s c o l o rI ‑ s c o l o r n(信頼区間 用)を設定する必要がある.これら [ o u t ]に含まれる変数と, a n n o t a t 巴データセット [ a n n o ] を組み合わせる ro c e d u r 巴を用いて多彩なグラフを出力することができる. ことで, GPLOTP なお,本マクロは SAS9 . 2上で作成されており, SAS9 .1.3上では動作確認のみを行った.異なるパージ ョン問で,出力が微妙に異なるため,複数のパージョンが共存する環境では注意が必要である. l ユ実行例 %km̲dataO マクロを用いたグラフの出力例を示す.次節で示す ODSGra p h形式のグラフにハザード比の 出力を加えたプログラム lを作成し,その出力を図 lに示した.実行例では, SASのアウトプットフォン トサイズが 1 2p tの場合に適切な出力が得られるように調整した. また,信頼区間の出力や打ち切り記号の拡張を利用しない場合も考えられる.その場合は,変数 SLl‑SLn, SUI‑SUnや変数 CSDFI‑CSDFn を p l o ts t a t 巴 mentに指定し, s 戸n b o ls t a t e m e n tで記号や線種を適宜変更する 事で対応できる(詳細は Webページで公開予定のサンプルプログラムに収載した). プログラム 1 :%km̲dataO マクロによるグラフ出力 1 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 1I1 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 紳 * * * * * * * * * * * * * * * * * * * * * * * * * 1 1 I1 *Graph output setting * 1 1 *Color 5etting * 世g lobal colorl color2 color3 scolorl 5color2 s c o l o r 3 ; 世l e tcolor1 = cx445694; Igoptions reset ニ a 1 1 ; 9i nh t it l e=3.5htext=3 . 5 ; goptionsvsize= 1 2i nhsizeニ 1 options linesize : 98 pagesize ニ 2 0 0 ; 覧l e t color2 = cxA23A2E; %lel color3 = cx01665E; filename grafouL " & P a t h .k m ̲ d a l a .e m [ " ; %let 5colo1'l= cxD4D9E8; goptions device e r n fg s f n a r n e = grafout gsfmode = replace; goptions ftext "Times ¥ew Homan"; 二 首l e t 5color2 ニ cxFICECE; Iproc gplot data = Graph; 百l e t scolor3 ニ cxDIE4E3; * plot ( S v1Sv2 S v 3 ) TI anno = anno 1 *autovref cautovref = cxE9DECA * 1 I over1ay skipmiss noframe 1egend = 1egendl I haxis axisl v3xis = axis2; I axisl label = ( '. ¥ I o n t h s after entry') major=(w=2 height O .7 ) w=2 m i1 1 0 r = none order = ( 0 to 12.5 by 2 . 5 ) offset = ( 2,7 ) ; I axis2 label (a=90'Proporlion o[ overall survival') major=( w 2height=l) w=2 minor = none I order ニ ( 0to 1by 0 . 2 ) offset = ( 2, 2 ) ; 1 * C I :f i1 1,Censor: need1 e,At ri s k : shO¥v , Logrank test, Hazardratio * 1 世km̲data( 二 D l,T,GroupC,Censor,1 , out ニ graph, anno = anno, 二 C Iニ 1 , , censEXT ニ 1 legendl l a b e l = none position = ( i n s i d e ) mode = protect origin = ( 4, 1 .5 ) value = ( h 2 "high‑risk" "middle‑risk" "low‑risk"); Size ニ 2, at ri s k 1 ,atriskorder = 0 to 12.5 by 2.5,Step ニ 5, I symboll i= sleplj cニ"&color1." w =5; ¥ 0 . a t risk ( 1 s t entry・ high, 2 n d : middle, 3 r d : I symbo12 i= steplj c color2." w = 5 ; Label ニ " low)", I symbo13 iニ steplj cニ"&color3."w = 5; ,TestX ニ 98,TestY =97,Type logrank, Irun; quit ; Test = 1 , HRX 98, HRY ニ 92 HR ニ 1 ) ; 二 、 二 二 二 士 ‑ 2 8 7 ‑
'EEA ハU L o g ‑ r 出 1 kPニ 0 . 0 3 0 . 6 1 1[ 0. 359, 1 .0 3 8 ] 2 : m i d d l e ‑ r i s kHR~ 0 3 : 1 o w ‑ r i s kHRニ 0 . 5 0 2[ 0 . 2 8 9, 0 . 8 7 1 ] i 0 8 d ロ υョ ~ 0 . 6 。 0 〉 ' ‑ 20.4 。 ロ 3 6 l~ ~ ~ 0.0150 判 3 6 28 7 . 5 5 . 0 Monthsa f t e re n t r y 2 . 5 一low‑risk 'EEA AU ‑ AU ‑higb ・巾k ー 凶d d l e ‑ 田 k 33 03 2 2 凶: 叩 I 50 仏 5 5 6 AU ' 白 星 ︑ ︐ ‑ ︑ ︐ ‑ AU 邑 0 . 2 己 I No.a tr i s k( 1 s t t r y :h i g h , 2 m i d d l e, 3 r d :l o w ) 1 2 . 5 図1 : プログラム lの出力(%初l ̲ d a l a Oマクロ) 積極限法による生存推定 リスウ由晶晶対極散.師、信頼限界 1 .0 +打ち切り L o g r a n kp =O . 0 3 0 1 0 . 8 J ; i j ‑ 0 . 6 土 件 H 0. 4 。 。 > 0 J6 2 8 23 " " " 36 JO 2 . 5 5 . 0 75 >0 。 。 " J2 " " 100 26 。 I 。 。 125 r y Monthsa f t e rc門 t G同 国i : : 2 . 一一一一‑1high唱曲一一一一 21o.....‑risk 一一‑ 3mid山 ‑nsk 図2 : プログラム 2の出力 (SAS9 . 2ODSGr a p h ) 2 . LIFETESTP r o c e d u r e(SAS9 . 2 ) との比較 2 . 1 . ODSGraph SAS9 . 2 では, ODSGr aph を利用した高品質なグラフが出力可能である.以下では, LIFETESTP ro c e d u r e の出力と,作成したマクロの出力についてそれぞれの特徴を述べる.なお, SAS9 .1.3では付加情報を加える ことができないため,%初l ̲ d a l a Oマクロを利用すると簡便だろう. ODSGraph を利用したプログラム 2を作成し,その出力を図 2に示した. ‑288・
プログラム 2:ODSG raph によるグラフ出力 ods listing gpath ~ "&Path." style ods graphi c so n/ 二 StatistIcal sge o n : n border o[f scale ~ o n imagename ~ "Lifetest o d s " widtb ~ 6.33333333 i n height ~ 4 i n ; antialias ~ o proc lifetest data ~ D I plots~(survival(atrisk~(O t o1 2 . 5b y2 . 5 )t e s tc l ) ) ; ti m e T Censor( 1 ); strata G r o u p C ; r u n . ods graphics o f f ; ods listing c l o s e ; ods listing; * ODSGraph を用いたフ。ログラムは,詳細な設定を行う必要が無く,非常に簡単に高品質なグラフが出力可能 である事が分かる.しかし,フォントサイズ、が小さく,軸ラベルは固定されているため,このまま用いる事 ができない場合もあるだろう.ODSLIST町 G statement で sge= on オプションを指定し sge 形式のグラフを 出力すれば, きであり, ODSGraphicsEditor でグラフを直接編集できる.だが,複数のグラフを出力する場合には不向 TEMPLATE Procedure を用いて雛形を書き換える必要がある.また, SAS 9.2 TS2MOでは, ODS Graph の出力はファイル形式に拠らずラスター画像に変換されてしまう.ベクトル画像を出力したい場合, 現状では ODSG raph は利用できない. 2ユ TEMPLATEP r o c e d u r e グラフの雛形を書き換えるためには,プログラム 3を実行して,ログ、画面に出力される雛形を編集する必 要がある.雛形をコピーし, TEMPLATE Procedure で適切な部分を書き換えると,オリジナルの雛形を作成 することができる.スペースの都合上全文は省略するが,プログラム 4のような形式で実行することができ る.また,プログラム 5やプログラム 6を実行すると,デフォルトの雛形に戻すことができる. プログラム 3・グラフ雛形の表示 proc t e m p l a t e ; .L ife t e s t .Graphic s .ProductLimit S u r v iv a l ; source Stat r u n ; プログラム 4 :オリジナル雛形によるグラフ出力 proc t e m p l a t e ; de[ine style S t y l e s . l l y S t a t i s ti c a l ; parent s t y l e s .Statistical; style GraphFonts / ; e w Roman",24pt, b o l d ) 'GraphTitleFont'~("Times : ; e w Romanヘ24pt, i t a li c ) 'GraphFootnoteFont'~("Times : 'GraphLabelFont'~("Times : ; e w Roman",2 4 p t ) 'GraphValueFont'~("Times : ; e w Romanぺ 2 4 p t ) ,G r a p h D a t a F o n t 'ニ ( " T i m e s: ; e wI l o m a n ", 2 4 p t ) " くl l T s a n s ‑ s e r if‑unicode) 七 2 4 p t ) 'GraphLnicodeFont'~ ( , G r a p h A n n o F o n t 'ニ ( " T i m e s: ‑ ; e w Roman", 2 4 p t ) ; e n d ; define statgraph .Li f et e st .G raphi c s .ProductLimi t S u r v iv a1; Stat 二 i f (PLOTATRISK~I) innermargin / align bottom; blockplot x~TATRISK block~ATRISK / 二 repeatedvalues~true display~ ( v a lu e s ) valuebalign~start valuefit p o li c y truncate labelposition~left l a b el attrs~GRAPHVALLETEXT v a lueattrs~GRAPHDATATEXT 主当主辺陛1includemissingclass~false; 二 e n d ;r u n ; & P a t b ."style ニ MyStatistical s g e~ o n ; ods listinggpath ~ " ods graphi c so n/ n border ニ offscale ニ o imagename = L t e s t ̲ o r i g i n a l ̲ o c l s ife height 1 2i n width ニ 1 9i n ; proc 1i [ e t e s t data ~ D l plots~ ( 5 u r v iv a l( atrisk~ ( 0t o1 2 . 5 by 2 . 5 )t e 5 tc l ) ) ; 1 ); t i m e T本 Censor( strata GroupC2; r u n ; o d s graphics o f f ; ods 1i s ti η gc l o s e :o c l s 1i s t i n g ; H H 二 ‑289・
1 .0 • C c n s o r c d L o g r a n kp=0 . 0 3 0 1 0 . 8 ー 〉、 号 a 』. 06 E 伺 2 0 . 4 " ' 0 . 2 。 。 一一 , 3 1 :h i g h ‑ r i s k ー..2 :l o w ‑ r i s k̲ . ̲ . .3 :m i d d l e ‑ r i s k 5 n 5 1 1 5 0 。 。 、:z . 2 2 8 J 6 3 6 J ( ) 1 5 2 6 2 5 : ! . 5 5 . 0 7 . 5 1 0 . 0 J 6 H 2 J 1 2ラ MOl 1 lh sa f t e re n tl ) ' 図3 : プログラム 4の出力 (SAS9 . 2ODSGraph オリジナル雛形) : デフォルトの雛形に戻す方法 プログラム 5 proc t e m p l a t e ; delete Stat .L ifetest .G r a p h i c s .ProductL im it S u r v i v a l ; r u n ; プログラム 6 : 全ての雛形を初期化する方法 ods path s a s h e l p .tmplmst( r c a d ) ; proc d at a s e t s 1ibrary=sasuser; delete templat(memtype=it e m s t o r ) ; r u n ; ods path s a s u s e r .t e m p l a t( u p d a t e )s a s h e l p .t m p l m s t( r e a d ) ; 3 . 考察と補足 本稿では,%加l ̲ d a t a O マクロおよび ODSGraph による付加情報を追加した Kaplan‑M巴i 巴r プロットの比 較を行った.どちらの方法でも高品質なグラフを作成することができるが,より詳細な拡張が必要な場合や, ̲ d a t a O マクロを有効に利用できると考えられる. ベクトル画像が必要な場合には%加l ̲ d a t a O マクロの本体,図 4のグラフを描画できるサンプルプログラムおよびスペースの都合上省略し %加l たプログラムについては Web ページ(http://www.josai.ac.jp/‑nagasima/)上で公開予定であり,ライセンス (GPLv3;http://www.gnu.org /licenses/) で認める範囲内で自由に利用できる. 参考文献 [ 1 ] SASInstitut巴Inc .SAS9 . 2MacroLanguage:Rφr e n c e .C紅 y, NC, USA:SASI nstituteI nc ., 2 0 0 9 . [ 2 ] SASInstituteI nc .S AS/STAT ( R )9 . 2【 ! s e rs Gui d e ,S econdE d i t i o n .C紅 y , NC, USA:SASI nstituteI nc ., 2 0 0 9 . [ 3 ] SASI nstitut巴Inc .S AS/GRAPH(R)9 . 2 :GraphT e m p l a t eLanguageU s e r' sG ui d e ,S econdE d i t i o n .C訂 y ,NC,USA: SASInstituteI nc ., 2 0 0 8 . ‑290・
由
~ 0
.
6
﹀
"
。
。0.4
。
〉
﹄
巴令.
口
1.0j
L
o
g
‑
r
a
n
kP=0
.
0
6
7
円
r
!
0
.
8
jて L
}}}
1戸0
a 同ゐ
7
.
8
1
1
.
)
>
句
1
'
¥
'
町一
1 1-~,
日0
.
6
j
'
l
.
.
.
1
,
"
L
,
言 │ L 4 1 L
→ L
OO.
4j
c
o
~.
~
‑‑‑‑‑‑‑u
亡
旦0.2
E
おとω
225 町
一 a
μ
‑5
nuJi 比山
刷
地泌位
il
州︒蹴
MMM
心
一
ま
でι
ョ
=
宮 ω﹀︒﹄oco‑EoaEι
一
一
!
:
h
i
g
h‑
r
U
.
.
I
:
:
2:n
温d&
,
引
i
.
L
k
3
:
1
o
w‑
r
i
sk
C979'h
・
‑
6I
8
4'
[
m
民
10.0
町
5m
‑au
一
7﹁1
一
M
一ぬH
‑qa
M
DE
一
K
4
‑
o川
田羽目一
同一
削一
M 盟問珂
凧ご
国一
m
¥h ‑
町一
由一勺
曲一刷
1
2
.
5
山一嗣
1
0
.
0
即日日目一
5
.
0
7
.
5
Monthsa
f
t
e
ren
町
計ゆ
2
.
5
一
一1
0もィ包k
o一
ot
色
マ
一
一
一
一
一
一
一
一
一
一
一
一
一
一
ー
一
一
一
ー
マ
ー
‑
0
.
0
‑
b
.
.
i
d
H
"
U
.
I
:
: ‑mid
o
f
k
.
.
.
.
r
i
s
k
川町
。
。
唱
u‑m
8
.0
.
2
0
』
a
W肱
コoxonP=0
.032
72‑5
E
βββA2│││
2
﹄仏一↓
Eg=EO D DSEDaD
"
~ 0
.
8
一周﹀
‑
2Lo
g(LR)P=0
.
0
2
9
2団 岨H 凶 同 =
0
.
6
1
1(
0
.
3
5
9,
1
.0
3
8
}
3
:
1
o
w
̲
"
巴
.
1
:
:HR=0.
50
2[
0
.
2
8
9,0
.
8
7
1
]
〉
4inununununu
1
.0
│
川
N
o叩 ( いI
s
引t
e
町 同 h,2
n
d
:而
mi
出
IW
E
D
0.0150
4
2
3
6
3
0
0.0
2.5
5.0
7.5
二 ~~ddr:~Sk
D
10.0
Monthsa
f
t
e
re
n
t
r
y
図4
: その他の実行例(%かl̲dataO マクロ)
プログラム 7
: 初期化,マクロの読み込みおよび仮想データの生成
option 1inesize = 200 pagesize = 5000 mprint;
dm '
l
o
g
;c
l
e
a
r
; output; clear;';
/* setting path */
世l
e
t execpath ニ " ,
"
1d
ata D
l
;
lenglh GroupC $
2
0
.
;
c
a
l
l streaminit(32789238);
2
; /* withdrawal time */
t
c 1
h
l =0.100; n
lニ 5
0
; /* h1
: hazard of group 1*/
h2 =0.075; n2 =5
0
; /* h
2
: hazard of group 2 */
3=5
0
; /* h
3
: hazard of group 3 */
h3 = 0.050; n
士
唱l
e
tPath = " "
百macrosetexecpath:
百l
e
t execpath =唱sysfunc(getoption(
s
y
s
i
n
)
)
;
首i
f首1ength(&execpat
h
) ニ O首then
百l
e
t execpath 二百 sysget(sas̲execfilepat
h
);
data nul1 ;
do i二 length(
百e
xecpath") to 1 by ‑
1
;
i
f substr("&execpath", i
,1
) "Y" then d
o
;
二
,i
)
)
;
call symput
("
P
at
h
", substr("&execpathぺ 1
s
t
o
p
;
e
n
d
;
e
n
d
:
r
u
n
;
世mend setexecpat
h
;
首s
etexecpat
h
;
H
libname O
u
t H&Path ;
/
*Eσ)=l/h*
/
array h
[
*
] hl‑h3; array n
[
*
] nl‑n3;
do Group =1t
o3
;
do i = 1t
o n[group];
'exponenti
a1
'
) / h[
g
r
o
u
p
]
; Censor = 0
;
T rand(
c then d
o
; T= t
c
; Censor = 1
;e
n
d
;
i
f T >t
'
仁 niform') >0.9 then d
o
; Censor = 1
;e
n
d
;
i
f rand(
/
キ l
ost to follow‑up (
r
a
n
d
o
m
) キ/
ifGroup = 1then GroupC三, 1
: high‑risk';
i
f Group =2 then GroupC ='
2
: middle r
i
s
k
';
3
:l
o
w
‑
r
i
s
l
ど
,
i
fGroup = 3 then GroupC = '
output;
e
n
d
;
e
n
d
;
l
a
b
e
lT二 "
¥
I
o
n
t
h
safter entry";
kecp T CensorGroupGroupC;
二
←
r
u
n
:
‑
2
9
1・
プログラム 8
:%km̲dataO マクロ
/*****************材料材料*柿材料材料柿材料料材料材料材料
likelihoodratio = likelihood ratio test
H
R
: 0 = none
1= show hazard ratio
H
R
X
: x position 覧
( ofd
ata a
r
e
a
)
H
R
Y
: y position 覧
( ofd
ata a
r
e
a
)
日S
T
: 0 ニ none
1: show median survival time
¥
l
l
a
b
X
: x position of strata l
a
b
e
l目
( ofdata a
r
e
a
)
Copyright (
C
) 2010,Kengo ¥AGASHIMA.
Thisprogram i
s freesoftware: y
o
ucanredistribute i
tand/or
modify itunder the terms of t
h
e G¥C General Publi
cL
icense
as published by the Free Software Foundation, e
ither
version 3 of the License,or any later v
e
r
s
i
o
n
.
but WITHO
仁TA
.
¥
Y WARRA¥TY; without even the implied
warranty of MERCHA¥TABILITY or FIT¥ESS FOR A
PARTIC
じLARPじR
P
O
S
E
. See the G¥L General Public L
icense
¥
l
m
e
d
X
: x position of median 目
( ofdata area)
¥
l
c
i
X
: xpositionofconfidence interval 目
( ofdata a
r
e
a
)
¥
!
S
T
Y
: y position 略
( of d
at
aa
r
e
a
)
*********柿柿*******************************************/
for more details
略n
acrokm̲data(
Thisprogrami
sdistributedi
nthehopethati
twi11beuseful,
data,time,stra,censor,censorv,
out : graph,anno : anno,
C
I = 0,Pattern = x4,
censEXT = 0,cHeight = 0.025,c¥
Vi
dth = 5,
Size = 3,Step = 4,
afont
Times}
;
e
w í~oman''' ,
じG
eneral Public
You shou1
d have recei
ved a copy of the G¥
License along with t
hェsprogram
I
f not, see <http://www.g
n
u
.org/licenses/>
**************紳*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
1
1
*
*
*
*
*
*
*
*
*
*
*
*
*
*紳*紳*************梓**********紳材料***材*
二 円
Macro n
a
m
e
: 目kmdata0
Author: Kengo ¥
A
G
A
S
I
II
¥
I
A
.1
Version: 2
.1
atrisk = 0, atriskorder = 0 t
o 0,
¥
0
. at risk",
sase = 0,Label = "
a
t
e
: 06/01/2010
Last じpdated D
System Recommends:
,SAS 9.2,
Windows XP 32 b
it
s
e
t up SAS output fint size
System Requirements:
二
Test = 0,TestX = 90,TestY = 1
0
0,Type ニ logrank,
HR = 0,HRX = 90,I
I
R
Y = 95,
¥
I
S
T ニ 0,¥
!
labX = 60,MmedX = 80,¥
l
c
i
X=9
8,¥
I
S
T
Y = 95
同i
f'
ι
s
t
r
a
. :
1
2
p
t
Windows XP / Vista / 7,SAS 9
.1
.3 or l
ater,
Base SAS,SAS/STAT,SAS/GRAPH
***************************************************紳***/
1
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
Make graph datasets for extended K
a
p
l
a
n
‑
¥
I
e
i
e
r plots
d
a
t
a
: ai
n
p
u
t dataset name
t
i
m
e
: as
u
r
v
iv
a
l time variab1
e name
s
t
r
a
: a stratum variable name
censor: a ccnsor variable name
censorv: censored variable code
out
: output graph dataset name
a
n
n
o
: output annotate dataset name
afont: n
o
.a
t risk text font
C
I
: 0 ニ none
lニ showconfidence interval
Patt
e
r
n
: confidence interval f
i1
1i
n
gp
a
ttern
s
e
e [Annotate Dictionary STYLE Variablel
ce
n
s
E
X
T
: 0 = none
1 = censor extension (
n
e
e
d
l
e
)
cHeight: extended censor height
cWidth: extended censor width
S
i
z
e
: font size of at risk, test and hazard ratio
t risk,¥
I
S
T & HR interval step size
Step・ a
atrisk: 0 : none
1= n
o
.a
t risk
atriskorder: n
o
.a
t risk order
Base・atrisk base position
Label: a
t risk l
a
b
e
l
Test・o
:
:none
1: show homogeneit
yt
e
s
t
( of d
ata a
r
e
a
)
TestX: = x position 覧
yposition 覧
( of d
ata a
r
e
a
)
TestY
Type: logrank = log‑rank test
ilxocon t
e
s
t
w
ilcoxon ニ generalizedw
二
HH
覧t
hen 同d
o
;
%let stra = d
s
t
r
a
;
data &
d
a
t
a
.;
s
e
t &data.; dstra ニ 1
;
覧e
n
d
;
ods exclude a
l
l
;
proc 1ifetest data ニ晶dat
a
. outsurv :
:
:
晶o
ut
.;
ti
m
e &ti
m
e
. *晶c
e
n
s
o
r
.(&censorv.);
t
r
a
.;
strat
a 晶s
ods output
HomTests = Test CensoredSummary =CS
imitEstimates = PLE Quartiles = QEST;
ProductL
."= "9.2"略thenproc phreg;
%if "&sysver
同e
lse 目i
f "&sysver
.
"="
9
.1
"略thenproc tphreg;
d
at
a =&
d
a
t
a
.;
class &
s
t
r
a
. / param = ref ref = f
i
r
s
t
;
s
t
r
a
. /r
l
;
model &
t
i
m
e
. &censor.(&censorv.) = &
ods output ParameterEstimates : HazardRatio;
run.
ods select a
l
l
;
proc sort data = &out
.
; by &
s
t
r
a
.;
data &
o
u
t
.;
s
e
t &out
.
; retain CSDF 0
;
a
l =. then Survival C
S
D
F
;
i
f Survエv
else CSDF = Survival;
drop&
s
t
r
a
.;
.;
data &out
s
e
t
) drop=
CSDF)
&
o
u
t
.(whereニ (̲CE¥SOR 三 1
&
o
u
t
.(where=(̲CE¥SOR̲ = 1
)
)
;
drop ̲CE¥SOR̲;
*
三
proc sort data =&out.; by晶t
i
m
e
.:
;
data ̲nu11ー
s
e
t CS(where=(contro)̲var‑="‑"));
call symput('Stra¥ぺ cat(̲'̲));
‑292・
もや
合小
*
︐
︐
*
*
*
もや
もや
もや
*
*
合小
もや
もや
z
神山
林
*o
もや
柿'
*t
告や!パ
申︒ー
もや
合
T
晶
PL
ー
也
曹
申
告
晶
占不十
件前田
U
W情
L
1
h
u
円
︑リ.
し
し一 守 ム
/dM
T'
*et
*lf
材
OJf
n︑
xa
もや
︼
匂
**H
神
ψγ
ー
河
︑
︑
すL
内
低
・
l
︑
占 す L
1i
Quo
=γ
し
し
口
+
m
T 胃ム→﹄ V A =
もや
Q VA+L
もや
nHR
ド
し
︼
円
︑u m w
b
沓
T
品
伊 ρU
也
T
働
干?
IL h ︐ . ︐
γi
*xee
︐ .a
ψγ
ρ U ρ vmω
一河uγ
干
晶
*干晶r m t T
よ
a
Q
u
*O1buKnHuu'AAduo低
*S
nnHoaM
︐
ψaTnHnunu
*erttF
ム
ホCcaae1
*aJutsM
苅
**m'a
d
M布 ︑
J ︐
/'Jノ
)
i
)
oa
じ
門仙寺
nu
Qu
ニ‑
.
︑ノ
l
rLTL
‑P
FarL
nu‑
QUFa
TL‑l
oa
Pし nunト
ι=
TLnbnUTL
‑PしQUPし
Fa 三 Pし TL
nunuF
一
1
u‑a
=
︑
ノ 1 y 也U
︑
向
TLFaoaQU
E
・ パ
ll‑‑
し
QUOoaFa
)r
Du ・円︑ u
︑
丹
T﹄ 二
tuJtL
﹂
'MM U M M o a
Fa
nu
→﹄可ム
aAAaAAQu
rnkvnkp
︑
︑
丹
︑
丹
ou‑‑ou‑‑
‑ rし 二 ド レ
y λ T﹄ Tよ → ﹄
︑
︑
向︑
円
M清川
企
uuv
ト
ν
l
+u 〆t
ι
OMU
r ︐tu n
nu
一一日 u =
u
oeQuep
し
tr(r(
昧川w
./句︑
﹄︐
﹄胃
1hue‑he
'lwmwm
arι ︑ a
L
十
‑nHnH
u t e t一一e
nuρ
AHUγ&
川凶
γ
oaghuoo
roo 包
oa
nuρ A
U
A
U
+LmωM
a
︐
*(1 ̲ CSDF1) );
I
ra
A
QU
υ
nFし
l
n
m
︐
仰
(O
ψ干
l
(
︑ノ
σ
b
t
;
1
h
u 3
i
e)
︑} J
1 ・
u
ー
't
v
一
︑
aca
︑
向
H e m凶
xD
ny
+lMoa
w
m
‑nunト
ι
(
︒
u
u
l
S
Y
m
I
e
‑
‑
よ
sa
P
L
河
N
1
e
l
aa
t
e
m
‑‑vy
υ
u川 町 h
﹄
rし
﹄
.
︐
T
unv
aa
R
tU
T
日u
An‑
︐
A
u
t
nd
A
U
︑
円
p
nu‑‑
r
︐
lr
e
︐
.
鴨川
;mt
;to
Juoas
n
︒
UV3FLV
M fhunv
r
n
u
F
、
call symput( xht",&cHeight.
drop=Survival
)
Id"t
a &out
.;
r
un
;
1
*Censor extension *
1
同i
f"&censEXT." = "1"覧then
百回 c
ensEXT(
&
o
u
t
., &
ti
m
e
.,&
S
t
r
a
¥
., &cHei
g
h
t
.,
length color function $
1
0
.;
retain xsys ysys '
2
' size &cWidth.;set &
d
a
t
a
.;
%do iニ l覧t
o&
S
t
r
a
¥
.;
i
fC
S
D
F
&
i
. =. then d
o
;
&
c
W
i
d
t
h
., cens);
&
晶c
olor&i
."
;
color = "
function='move'; x=&time.; y
ニC
SDF&i.; output;
function='draw'; x=&time.; y=CS
D
F
&
i
. +&exht
.
; output;
1
*¥
0
.a
t risk *
1
覧i
f"&atrisk." = "1" 覧then
同km̲atrisk(
P
L
E, QEST, &
s
t
r
a
.,&
t
i
m
e
., &
S
t
r
a
¥
.,
1
*Homogeneity test *
1
同i
f"
&
T
e
s
t
." = "1" 覧then
同km̲homtest(Test,&
TestX., &
T
e
s
t
Y
., &
T
y
p
e
.,
&
S
iz
e
., &afont
.
, HTEST);
1
*Hazard ratio *
1
e
n
d
;
覧e
n
d
;
keep xsys ysys size color functi
o
n xy
;
n
u
︐
.
r
&atriskorder., &
B
a
s
e
., &
S
t
e
p
.,&
S
i
z
e
., &Iabel
.
,
&afont
.
, atrisk);
覧m
end km censEXT;
1
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
材 *
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
1
1
*¥0. at risk *
1
覧m
acrokm̲at
r
is
k(
%
if "
&
I
!R
." 三 "1
" 首then
覧k
m̲hr(HazardRatio,&
H
R
X
.,&
H
R
Y
., &
S
t
r
a
¥
., &
S
t
e
p
.,
data, eSl, stra, t
i
m
e, S
t
r
a
:
¥, order,
base, s
t
e
p
. size, l
a
b
e
l, afont, out
&
S
i
z
e
., &afont.,HR);
1
*Confidence interval *
1
%if "&CI
.
" = "1" 首then
百k
m
̲
c
i(
&
o
ut
.
, &time., &Stra¥
., &Pattern., CI
)
;
1
*Quantile estimate *
1
覧k
m̲qest(
Q
E
S
T, &
s
t
r
a
.,&
¥
l
l
a
b
X
., &
¥
l
m
e
d
X
.,ωIciX.,
.
, Q
E
)
;
ω
I
S
T
Y
.,&Stra¥., &
S
t
e
p
.,&Size., &afont
覧i
f首e
v
a
l(
&
c
e
n
s
E
X
T
.+&atrisk.+
&
t
e
s
t
.+
&
h
r
.+&ci.) ー
=0
覧t
h
e
n 首d
o
;
data &
a
n
n
o
.;
length when $
1
. style $30
set
首i
f&CI
. = 1覧then C
I
;
同if&censEXT
. = 1首then cens;
首i
f&atrisk
二
l首then atrisk;
首i
f&
t
e
s
t
. = 1覧thenHTEST;
同i
f邑hr
. = 1%then HR;
同i
f&
¥
I
S
T
. ニ l首then QE;;
retain whcn • s
';
r
u
n
;
%end;
proc datasets 1i
b = work;
delete C
S PLE QEST HazardRatio Test
首i
f&CI
.
ニ i首thenC
I
;
同i
f&censEXT. ニ l覧then ccns;
首i
f&atrisk.
二
百if&
h
r
. = 1首thenH
R
;
同i
f&
¥
I
S
T
. = 1覧then Q
E
;
r
u
n
;q
u
i
t
;
set &data.; by STRATCM &
t
i
m
c
.;
.;
d
o x = &order
i
f&
t
i
m
e
.<
= x then d
o
; leave; e
n
d
;
e
n
d
;
data &
o
u
t
.;
length color function $
1
0
.
; set &out
.;by STRAT
じ¥
1x
;
2
' ysys '
1
' color'b
l
a
c
k
' position'
3
' function
rctainxsys'
'
l
"
h
e
l
' size &
s
i
z
e
.;
百d
o i=&
S
t
r
a
¥
. %to 1首by ‑
1
;
i
f STRATUI = &
i
. t
h
e
n y=
&
S
t
r
a
¥
.̲ 1
)
) ̲&step.
(
&
b
a
s
e
. +&
s
t
e
p
. (
*
*(&i. ̲1);
%end;
t
e
x
t =c
at(
L
e
f
t
);
i
fl
a
st
.x then output;
d
at
a dummy;
length color function $
1
0
.;
retainxsys'2
' ysys'
1
' color'b
l
a
c
k
' position'3
' function
'label
' size &size.;
じ¥
1 = 1t
o&
S
t
r
a
¥
.;
do S
T
l
l
A
T
.;
d
o x = &order
%do i= &
S
t
r
a
¥
. %to 1覧b
y‑
1
;
1 =&
i
. then y ニ
i
f STRATじ¥
(
&
b
a
s
e
. +品 s
t
e
p
. (
&
S
t
r
a
¥
. ̲1
)
) ̲&
s
t
e
p
.
覧e
n
d
;
*
output:
I首then atrisk;
世i
f&
t
e
s
t
. = 1覧then !
ITEST;
首m
end km d
at
a;
data &
o
u
t
.;
e
n
d
;e
n
d
;
data &out
.;
mcrge dummy &out.; b
y STRATCM x
;
format xtext S
2
0
.
; retain xtext "
if t
e
xt ニ
then xtext : t
e
x
t
;
H N
else text : xtext;
‑
2
9
3・
*(&i. ̲ 1);
I1 * * 件*************************************柿*帥*帥****紳 * 1 data L a b e l ; ナレハ u v ハ o aTn ︐l n r ρ u +し.‑︐ tn) 白 ‑ m e l 1 レ + U ︐ .n M a 山崎 免叫 凶 ゆ 伯鴎 ︐白 4 ニ 晶 ﹄ ヲ白 ‑‑'t o' a 合 合 鴨川 川 ﹄司 ト t JMM f 白川 ﹃ LYLU ﹄ リ ト 山ト 円 山 江 同氏 Mddd JO'b 1u ﹄ ︐ u ‑‑‑︐ p ‑ ett 'buu apho u・︐︐ '+L Hunu+L︑︐︐︑︐︐ npau︑j' ot'paTi︑J 1untn t0・UFO CTio'' ︐︑︐J?ν n.︐ uonpし・'t︑BJu fA1dT﹄︑J・11LP Bum‑‑mt 'nHUMFD・‑FhuHU LAe︐QdFbyLO C1nny' at一一'et‑‑ 1ム=ewl︑ t ' hυ︑aJ?L+LOm‑ 'nuxtayL・1a pbexmrkyLr V4.︐+lwρ I&令Lヤ&令L 0・=t+Lues ド n MaDMU y ! J +L.︐.︐E'QMn onto‑︐・nιrkpf‑ condY‑‑(S m じ feumTYoatsrki 'aCQMT﹄uetr 140arnunnb*prut ︐.︐eeogumpapa e‑phog‑=mf︑= S14v︑a+L=paOS =e+Lccd?IM V4V4aogN ‑strytxex ‑yst・‑'nyse'r;e nU円︑ul'14︐aatnpa't ﹁ ・&&4n; Lm6 41Le'VA‑‑︐︐︒︐.︐ ︒ f ︑ c ‑ ea'zo‑‑一‑AUVA‑‑︐︐ 也 lt=eel‑x・t=x tss 百 MMmcydxa'b x・'V4 a 臥 r し n u m M 川 T﹄e1cmna .︐e‑S1AT﹄0・1ugoUQumco‑‑ ・+L令LxeAA‑‑ogHUAHMMM三'・1MM =Dn令Mun‑‑=・'ιaasueaw+Lua φluS u‑nFun‑T﹄lJut‑ otpals‑円︑uSFIXVAn‑‑==VAS‑‑.︐ aaEars︑0・1eeo'AU nttopN 河 M苅yxxtpax‑dn aeeeAUF‑ne t‑isrw苅・leM 布 ! パu 紳同 合 mTVA ︐/ t 合 合 合 Z *t *u'vd * mo y'VA my'ρ *tn'l 坤旧 01BY 0・1rL't 司 味 Jt'ns ホ包・ 1n *s'1Je *'o'nwZ myρ 也市 *i'N3)) 柿'町︐ *QULK・︑J︐︑I'n 問仏以ド *e'bnnoc *t'l''n *円︑u.︐w+L 也市 紳'一一同日 ﹄ *vλ14φL︑3JJueeo 同町∞加一一九山町川畑山 *円︑u'anuvanknkl *?ム'aa一SHnHHHns *''l(S(((C VAeeatttp *DnS1b1i*14uuu‑ *口uvdavdpしp‑Dhpa 貝 •. nv︑I'・1ム ︐︑f''s •. */'VAOAUessssx **nUH‑‑ハU'n‑teeeec *口口tη41ioe円︑urrrr5 *oae ゐ' l z a a p a p p ‑ P *i'Rt1mmmm‑ t ハ V ! U t ハununuハV m y φ L ︐︑ パ φLQMPUQM一︐ ︑ *ar‑‑rxvdnaa.︐+Leccej *rht'aesu‑‑a;s *一aztxfeXYC)' *AumnktaznknkS *rkduHhnlHH=x *arooat‑‑sogaa *zoaaagatp *arztnt==xe m y t h U F L V U9uρしρ ρ OUρu・' *anuts‑irxvd+LLKn **m.︐au rf︐JU苅︑J1dr ‑294・ ︑い免 貝 す 二 町 1 b e n D p tS tb ︐ γ v u ハ unM.+し a S ra ?ILνm︐'v ︐.可ム u‑ ︑ 門e'1o4lV(4 ・‑eFA meat‑‑ lsa tnv .︐nu'Vム 12e ︐x t . l 't aacn vrnSTi rtuye e円︑MFtsc t uV4n £ 're no o s・ l d etilyl 目 &osf c n・CVAn e‑to JUULHnpし 1 二 O t l o a f&ga nlntt oaeee pし0?IM1ムrs .︐Aua ︐ U ︑N A H 令 脳 す AVA ae 河 別品 r 官 srh 古川 出e lse 目i f "&Type" = " l i l くe lihoodratio" 出then /*********************帥* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 1 text=c a t( 仁 2Log( L R )P p u t(ProbChiSq,PYAL 仁E 5 .4 ) ) ; ;I 1 *Quantile Estimates + 95首 CI * 1 I = ぺ ︑︼' N ︐.︐ te U1 よ p ︐ v︐ t.t c Hu n n ︒ L I 'Fo t dat 士 ︑ 4 ‑bey a1Aii ?仏民AVd3' +L︑V1i SZ lt 令LnuQM X11 ρ u unu φlbtovd ρ u ・ 守 ム .︐V4 IMm m ‑ p u nω u v︑ぃ.︐nu︐AU alu rep&e tbt 戸︑Mane aalMO‑‑ ・ 1e z 羽 y t d n‑l QM. ︐ 町 UOK 令L︐AunMaVA 出 日れし則氏 lt;l' 臥 旧 3st L'k ι e 円剖 eu 刻 z=.︐set ‑‑ysa sytsa ・'uxtm 'い h oalK にa 1 4r aDhJU ρu=ρu︐AU uρup卜︼︐ axtLMnone ‑‑arum ︐︐AunMavaw keepxsysysyscolorpositionfunction sizestylexytext; r u n ; %mend 如T I ̲ q e s t ; 時m end k m ̲ h r ; ﹄‑﹀ ;t +l UA length color function $ 1 0 .t e x t$ 1 0 0 .; I1 *confidence interval * 1 retainxsys• 2 ' ysys• l ' color'b l a c k 'p o s ition• 3 ' function I 目n a c r okm̲ci( 1 * * * * * * * * * * * * * * * * *件**********************************件* 1 1 1 *homogeneity test * where SL &i . =.; color = " & & s c o l o r & i ." ; a r ' ; x=& ti m e . ; y= t m p ; output; function 二, b tmp =S 仁 & i .; 出m acrokm̲homtest( function : ・ move'; xニ &time.; y =SL&i . ; output; Test, TestX, TestY,Type, Size, afont, o u t keep xsys ysys style l i n e color function. xy ; 出e n d ; data & o u t .; 出i fH&Type"二 "logrank"出t h e ns e t& T e s t .( f i r s t o b s = 1o b s = l ) ; data & o u t .; 出e lse出i f "&Type" ニ dwilcoxon 出then s e t set &Test .( f i r s t o b s = 2 obs 2 ); 出d o i= 1%to & S t r a ¥ .; H 品o u t .& i .(firstobs=2) 出e lse 出i f "&Type" = "likelihoodratio 首t h e ns e t n d ;; & T e s t .( f i r s t o b s = 3o b s = 3 ); ; 出e 1 ' ysys ' 1 ' color ' b l a c k 'p o s it i o n' 7 ' 時d o i= 1出t o& S t r a : ¥ .; retain xsys ' ' size & s i z e . style &afont .; function 'label proc d at a s et s 1i bニ work; x= &TestX.; y=& T e s t Y .; delete& o u t .& i .; 出i f H&Type" ニ "logrank" 出then 首e n d ;; ぺ put(ProbChiSq,PYALじE5.4)); Irun; text= c at("Log‑rank P= H 世e lse也i f "&Type = "wilcoxon" 世t h e n I目mend km ci; ぺ put(ProbChiSq, PYALじE5.4)); t e x t = cat("Wilcoxon P士 N 二 keepxsys ysyscolorposition function sizestylexyt e x t ;I 首m acrokm̲qest( r u n ; I Est, stra,MlabX, MmedX, ¥lciX, MSTY, Stra:¥, Step, 出m end km̲homtest; I Size, afont, out
RTFを用いた総括報告書の解析結果作成業務の効率化 0吉 崎 正 浩 l), 加 藤 紀 隆 2), 加 賀 保 行 2) 冨 金 原 悟 1) 1 ) 小野薬品工業株式会社データサイエンス室 2 ) イーピーエス株式会社臨床情報処理部門 統計解析部 Approachf o re 伍c i e n tmakingo fCSRu s i n gRTF MasahiroY o s h i z a k i1), N o r i t a k aKato2), Y a s u y u k iKaga2), S a t o r uF u k i n b a r a1) 1 )DataS c i e n c e, ONOP h a r m a c e u t i c a lC o ., L td . L td .B i o m e t r i c sD i v i s i o n 2 )EPSC o ., 要旨 医薬品開発において各臨床試験の結果をまとめる総括報告書には,統計解析結果が添付される.総括 報告書は M i c r o s o f tWordで作成されることが多いため,解析結果も M i c r o s o f tWordで利用できる形式と すると利便性が向上する.そこで,本稿では解析結果を RTF ( R ichT e x tF o r r n a t ) ファイルで作成する方 e s z e kら (1998)の紹介した %RTFマクロを利用する方法について実例を示しながら紹介する. 法として, P また,総括報告書の 1 4章には多くの解析結果を添付するため,帳票ごとに別々の RTFファイルとして 2 0 0 6 ) を参考に, SASを利用して複 保存しておく方法では利用及び管理が煩雑となる.そこで,田村 ( 数の RTFファイノレを結合するプログラムを作成した.また,総括報告書の章番号に基づいて表番号を連 i c r o s o f t Wordのフィールドコードの機能を利用したプログラム 番で自動的に付与することを目的に, M を作成した.この 2つのプログラムを組み合わせて用いることにより,複数の解析結果の RTFファイル を一つのファイルに結合し,表番号を付与する過程を自動化し,総括報告書の作成業務の効率化を達成 した. キーワード:臨床試験,総括報告書,標準化, RTF,VBS,フィールドコード 1 緒言 臨床試験の結果は,データ収集後にデータベースへ入力し,そのデータを用いて解析が実施される.その 解析結果は,総括報告書としてまとめられ,申請資料の一部となる.解析結果を作成する際には幾つかの出 力フォーマットが利用できる.最も作成が容易なのは TXTと考えられるが,見栄えには限界があり,視認性 も高くない.そこで DDE(DynamicD a t aExchang 巴)を利用した E x c e lへの出力が比較的良く利用されている. E x c e Iはセルの幅や罫線などの自由度は高いが, Mi c o r o s o 食W ordにて作成している総括報告書に図として挿入 した場合,文字検索の対象から外れてしまうことや,テキスト情報を持つ形で挿入した場合はレイアウトが 崩れる問題などがある.また, HTML出力は解析結果のレイアウトに対する自由度は低いという課題がある. こは様々な特徴があるが,総括報告書は通常 M i c r o s o食 Wordで作 このように,解析結果の出力フォーマット i ‑295・
成されるため,解析結果も M i c r o s o f tWordで利用可能な形式である方が利便性は向上する.そこで, P e s z e k らの提案した %RTFマクロを利用した解析結果を作成する手法を紹介する.このマクロを利用することによ り,解析結果を自由なレイアウトで RTFファイルにて作成することが可能となった.帳票を作成する際の業 務の効率化を念頭に %RTFの利用法を整理し,かっ幾つかの改良を行ったため,その内容を 2章で紹介する. 解析結果の RTFファイルによる作成以外にも,総括報告書の作成業務を効率化するためのプログラムを作 成した.一般的に,総括報告書の固定までの期聞は,次相試験の立案や承認申請の準備に対して律速の原因 となることが多く,業務の効率化が求められる.そのため,臨床試験のデータ固定後に実施される解析の実 行及び総括報告書の作成などの一連の業務の効率化は重要と考えられている.そこで,本稿では複数の解析 結果の RTFファイルを効率よく利用及び管理するために作成したプログラムを紹介する. 3章では,複数の RTFファイルを結合して lつの RTFファイルにするためのプログラムを紹介する.このプログラムの利用に より,多数の RTFファイルの管理や運用による煩わしさが解消できる.また,総括報告書では各解析結果に 対して表番号を付与するが,通常は手作業で lつ lつ付与していくことになる.この問題を解消するため, 4 章では RTFファイルを結合した際に,自動で連続の表番号を付与させるためのプログラムを紹介する. 2 %RTFマクロを利用した解析結果作成 解析結果の RTF化を行うには幾つかの方法が考えられる. SASを利用する最も単純な方法は ODS機能を 利用することであろう. ODSとそのオプションであるアウトプットテンプレートを利用すれば,詳細な設定 などを行わなくても,解析結果を RTFとして出力することはできる.ただし, ODSでは,その簡便さの半面, 複雑な構造や罫線を用いたレイアウトの解析結果を RTFで作成することは困難である.そこで,昨年の本会 2 0 0 9 ))にて,複雑な構造や罫線を用いたレイアウトを RTF にて出力できる Peszek らの提案し (吉崎ら ( た%RTFマクロを利用した手法を紹介した. 2 . 1 %RTFマ ク ロ の 紹 介 と 利 用 法 %RTFマクロは RTFファイルを構成するタグを自動生成するマクロである.本マクロを用いる最大のメリ ットは,表全体の幅,表を構成するセルの幅,各セルの上下左右の罫線の有無,用紙の縦・横の向きなどを プログラマが自由に設定できることである.それゆえに,解析レイアウトに対する自由度が非常に高く,複 雑なレイアウトの解析結果であっても作成が可能である.また, RTFのタグの構造と意味を理解すれば, %RTF マクロを自由に改良することができるようになり,罫線の太さ,用いる文字のフォント,用紙内の解析結果 . 2で紹介す を出力する範囲などに対するデフォルトの設定も自由に行うことができる.このような改良は 2 る. %RTFマクロは以下に示すような 1 2個の引数で構成されるマクロである. %RTFマクロの構成 %RTF(n,m ,s = 3 03 0,b=l,r =2,o=p,h = O,v=0,hline=b,l i n e = s,l a st =O,w=); n 該当列のセル数(必須) ex:5 ロ1 各セルの占有幅の比(必須) ex:23121 ‑ 2 9 6・
文字上下とセル罫線とのスペース幅 e x:1 0 01 0 0 表の囲み線有無 e x:1 小数点、桁合わせの位置 ex: 1 。 用紙縦 ( p )・横(1)の設定 e x:p h 横線をヲ!くセルの指定 e x:135 V 縦線(右)を引くセルの指定 e x:a ( = a l l ) h l i n e 横線がセルの上 ( t ) か下 ( b )か e x:b l i n e 線は普通か二重線カ当 e x s l a s t 行の下部に二重線をヲ l くか e x :0 w 表の横幅(インチ) e x:5 b この %RTFを利用することにより,各解析結果を希望のレイアウトで RTFにて作成することが可能となっ た.以下に例として,データ 1の SASデータに対して %RTFを用いる簡易なプログラムを示す.このプログ ラムにより,結果 1の解析結果を出力する RTFファイル ( e x a m p l e . r tt!が作成される.なお,プログラム例 で用いている &b , . l & b c .,& c c .,& e .などはセルや行を区切るために %RTFの中で定義されているマクロ変数 e s z e kらの論文や,昨年の論文集を参照いただきたい. である.マクロの詳細な利用法は P データ 1 (下配プログラム例で作成している) fi I e n a m eo u t fi [ e" e x a m pI e .r t f " : d a t a n u[ [ s e td a t a 1 : fi I eo u t fi [ e : I * R T Fファイル作成* 1 i f n= 1t h e nd o : 制T F (O. o = p.w = 3 ) :1 * 縦向きの R T Fファイルを作成* 1 Auinu nHnH auou .︐.︐ au7anDnudnU4lnL のdau守 rDCU7anDqunu‑‑‑nt のdau守 tIT‑‑t 唱l 唱l 唱l 唱l 唱l 唱11lqL のL q L のL q L プログラム例 1d a t ad a t a1 : 2 l e n g t ht x t$ 1 0 : 3t x t = " O N O ‑ 1 2 3 4群":v aI u e 1= 1O .5 :v a[ u e 2= 4 .6 :s pg =1: e o f = .: o u t p u t : a[ u e1 =8 .2 :v aI u e 2 = 5 .3 :s p g = .: e o f = 1: o u t p u t : 4t x t = "プラセボ群":v 5 r u n : 1 1 *タイトル行の設定 * i fs p g = 1t h e nd o : 首R T F(1.1.o = p.h = a .w = 3 ) : 1 "表 1 "& e .: p u t& b. 明R T F (2.35.s=1001 0 0.o = p.h = a.v = 1 .w = 3 ) : p u t& b c . "投与群" & c c . "平均値士標準偏差" & e .: ‑ 2 9 7・
2 5 2 6 /本データ行に対する処理本/ T F (4,3212,o=p,h = a,v = l ,w = 3 ) ; 2 7 百R u t& b c .t x t& c r .v a l u e 1& c c . "士" & c. 1v aI u e 2& e .; 2 8 p 2 9 /R T Fファイルを閉じる本/ 3 0キ fe o f = lt h e nd o ; 3 1 i F (1 0 0, o = p, w = 3 ) ; 3 2 間T 3 3 e n d ; 3 4 3 5 r u n ; 結果 1 上記の例のように, %RTFを利用する場合の一般的な手法は,出力するレイアウトと同様の形 l こSASデー タセットを整形した上で,セルの個数や幅,罫線の位置を設定することである.そのため,あらかじめ出力 したいレイアウトが固定されていれば,上述の例のような投与群が縦に並ぶ解析結果で あっても,投与群を 横に並べる解析結果で、あっても,投与群の数に依らない一般化を容易に行うことができる(縦に並ぶ場合の 方がセルの数が変わらないため,プログラムの開発は容易である).例えば,セルの数を一般化するには,投 与群の数に応じて計算されるマクロ変数を準備して %RTFの第一号│数 nの部分に利用することで達成される. このような一般的なプログラムは一度開発すれば,投与群の数に依らずに様々な試験において利用できるた め,汎用性の高いプログラムとなる. 2 . 2 %RTFマクロの注意点と改良 標準の %RTF マクロでは,解析結果の帳票を作成するのに不足している機能や不便な機能があるため,実 業務に対応できるように,以下で示す 6つの機能について %RTFマクロを改良した.以下にプログラム例を 挙げて紹介する. l ) ヘッダーにプロトコール番号や試験課題名を挿入する機能 /時 R T Fマクロ内の首 i f& n=O百t h e n刷。;の中で追記するホ/ p u t" ( 平h e a d e r平q c 平f s 2 1平b品h e a d e r t i t l e . } " ; /本ヘッダ一本/ &headedこプロトコール番号や試験課題名をマクロ変数として与えておけばヘッダ一部分に表示される.な お,上記の例では¥f s 2 1で,ヘッダーのフォントサイズを 1 0 . 5( 2 1の半分となる)とし,¥bで,ヘッダーの 文字を太字に指定している. 2 ) フッターにページ数を挿入する機能 /時R T Fマクロ内の略 i f& n = O略 t h e n% d o ;の中で追記するホ/ p u t"{平footer~qc~fs16 {~field{~*粁 I d i n s tP A G E} }{ / }{平field{~*粁 Idinst N U M P A G E S} } } " ; ‑ 2 9 8 司 /本フッタ一本/
R
T
Fファイル全体のページ数と現在のページ数を自動で取得して表示させることができる.上記の例では,
フォントサイズ 8で「現ページ/全ページ」と表示される.
3
) 文字フォントを切り替える機能
/
時RTFマクロ内の首 i
f&n=
O%then制 o
.の中で追記する本/
put "
{
平f
l平f
n
i1M S 明朝:}":
/
ホM
S明朝準/
put "
{
平f
2平froman平fprq2
平f
charsetOTimes NewRoman:}":
/
ホTimesNew Roman本
/
n
i1M S ゴシック:}":
put "{H3平f
/州Sゴシックホ/
put "
{
平f4
平f
swiss平fprq2
平f
charsetOArial:}"
/
ホAri
a
l本
/
標準の %
RTFマクロのままでは日本語に対応したフォントが定義されていないことから,解析結果に日本
語を利用すると文字化けする.そのため,上記のような日本語対応のフォント設定を行っておくことは非常
に重要である.上記のように利用するフォントをすべて定義しておくと,例えば MS明朝で表示したい文字
は
, {
¥
f
1MS明朝体で表示したい文字列}とプログラムコードすることで,フォントの自由な指定が可能にな
る.
4
) 罫線の太さを変更する機能
/時RTFマクロ内の首 i
f&
n
>
3
1首
then刷。;に対する %
e
l印刷。;の中で以下を各々変更する *
1
引巴 t vl&i=~clbrdrr 平 brdrhair:
→
引e
t vl&ii=~clbrdrr 平brdrhair:
→目 1 e
t v1
&
ii=平 clbrdrr平 brdrs~brdrw12:
引巴 thl&i=
平c
lbrdr&hline~brdrhair:
→
似e
t hl&i=~clbrdr&hl ine~brdrs~brdrw12:
制巴 t hl&ii=~clbrdr&hline~brdrhair:
→
制巴 t hl&ii=~clbrdr&hl ine~brdrs~brdrw12:
目l
e
t vl&i=~clbrdrr平 brdrs~brdrw12:
標準の %
RTFマクロで用いられている brdrhairの場合,かなり細し、罫線が出力される.罫線の太さもフォン
'
b
r
企w12 と変更した. 12 の数字を大き
トサイズと同様に数字で表現した方が調整が容易となるため,¥brdrs¥
くすれば罫線が太くなる.
5
) 解析結果の出力範囲を制御する機能
/
時 RTFマクロ肉の目 i
f&
n
>
3
1目
then刷。;に対する %
e
l印刷。;の中で以下を追加する *
1
目i
f&o=p首
then首
d
o
:1
*
標準の駅 TFで設定されている部分 *
1
目
│
巴 tt
w=9000:
目
巴n
d
:
目i
f&
ο
=
p
l %then 首
d
o
:I
本新たに追加した部分*
1
目l
e
ttw=7500:
%
e
n
d
:
標準の %
RTFマクロでは,解析結果を表の横幅すべてを手J
I
用して出力する.そのため,何も制御を行わな
い場合は,小さな表で、あっても用紙の横幅すべてで出力されるため,見栄えの悪い表になる. %
RTFマクロ
の F の引数で、も制御可能で、あるが,どの数字を指定すればどの程度の横幅で出力されるのかは分かりづらい.
1
そのため,用紙の縦・横を制御する F オプションに標準で設定されている pと l以外にも,上記のような p
などを新たに定義しておくことで,表全体の横幅を容易に制御することができる.なお,上記の例の 9000や
‑299・
7 5 0 0の数字の単位はドットである. 6 ) セル境界の左右のスペースを制御する機能 1 * 日R T Fマクロ内の首 i f品n > 3 1% t h e n目d o ;I こ対する私自│印刷。;の中で以下を変更する * 1 p u t"lHr o w d平t r g a p h l 0 8 平t rl e f t O 半t r q c " ; → p u t" 半t r o w d半t r g a p h O半t rI e f t O半t r q c " ; 標準の % RTFマクロでは,下図の網掛け部分のようにセルの境界の左右に文字が出力できない一定のスペ ース領域が確保されており,セル幅の全領域を利用した文字の出力ができない.これにより,横に長い解析 結果を作成する際に,出力できる情報量が制限され,レイアウトの自由度が低下する原因となる.そこで, p h 1 0 8を 句a p h Oに変更することにより,このスペース領域を削除することができる. 上記のように匂a 「 I 蚕 玩 市 長; J L 亙 円7 石両円 各社,文書を作成する際のルールとして,罫線の太さやフォントなどが規定されていることが多い.上記 のような会社ごとのルールに則した改良を行うことで,社内要請に合致した解析結果の出力を達成すること が可能となる. 3 複数の RTFファイルを結合するプログラム %RTFマクロを利用することにより,解析結果を R T Fファイルで作成することが可能となった.しかしな T Fファイルを作成した場合,一般的 がら,臨床試験における解析帳票の種類は多いため,解析結果ごとに R には数十から数百の R T Fファイルが作成されると考えられる.このように多くの R T Fファイルを個別に管理 するのは煩雑であり,業務効率の低下に繋がる.一方,すべての解析を一つの R T Fファイルに作成すると, 一つの解析を修正する度に,すべてのプログラムを実行することになるため,業務時間の面からも QCの観 T Fファイルの結合を行う必要があり,そのプログラム作成に着 点からも現実的でない.そのため,複数の R 手した.また,一つの R T Fファイルに結合することにより,そのまま総括報告書の 1 4章に用いることがで RTFを利用せずに R T Fファイルを作成した場合でも きる.そのプログラムを以下に紹介するが,本内容は% 利用可能な方法である. R T Fファイルに限らず,単純なファイルの結合は, Windowsのコンピュータであればコマンドプロンプト のc o p yを用いることによって達成できる.そこで,複数の R T Fファイルの解析結果に対して試してみたが, 被結合ファイルの様々な設定が優先されるため,例えば,用紙設定が縦のファイルに用紙設定が横のファイ ルを結合すると,横の設定の解析結果が,結合元の縦の設定が優先されて結合されるため,適切な設定の結 果が得られないなどの不具合が生じた. そこで,この問題を解決するための方法として,田村 ( 2 0 0 6 ) の方法を利用し, S ASから M i c r o s o丘 Word の処理を制御するプログラムの作成を試みた.この方法は, S ASを利用して VBSのコードを格納した... V B S " ファイルを作成し,その.. . V B S " ファイルを SASから実行させることで,プログラマが M i c r o s o丘Wordを直 接操作せずに,自動に処理を行わせるものである. VBSでは M i c r o s o f tWordのメニューを利用した処理なら ば一通り行うことができる.田村の論文に詳しく述べられているため,本論文では詳細な解説は省くが, 3 . 1 ‑ 3 0 0・
でその処理に対する考え方を示し, 3 . 2で、プログラムコードを記載する. 3 . 1 実行に必要な処理 前述のように, M i c r o s o f tWordのメニューの処理を組み合わせて利用できる処理であれば, VBSを用いて 自動実行が可能である.そこで, RTFファイルの結合を実行するために必要となる M i c r o s o f tWordのメニュ i c r o s o f tWord2007に基づいている.他のパージョン ーと手順を考察した.尚,下記メニューの名称などは M とはメニュー構成が大きく変更されたため注意が必要であるが, 3 . 2 で示すプログラムの利用における M i c r o s o f tWordのパージョンの違いによる問題は現在のところ確認していない. ( 1 )M i c r o s o f tWordで , 5I J のファイルの内容を挿入するためには, r 挿入J→「テキスト J→「オブ、ジェクト j で「ファイルから Jタプにファイル名を入力することで可能である. ( 2 )( 1 )のように単純にファイルを挿入するだけでは,挿入されるファイルはファイルの先頭に挿入される. r o s o f tWordを開いた際,カーソルはページの先頭にあり,そのカーソルの位置にファイルの挿入 これは, Mic こ,カーソルの位置をファイルの最後に移動さ が行われるためである.これを解決するために,挿入する前 i せる必要がある.これを達成するためには,多少強引で、あるが, 動させることにする r すべて選択Jをし,カーソルを下へ l度移 r すべて選択」は「ホーム j →「編集J→「選択Jで可能となる. ( 3 ) 解析結果には用紙の縦・横が混在する.例えば,縦のファイルに上記 ( 2 )→ ( 1 ) を用いて横のファイ ルを挿入した場合,挿入前のファイルの設定が優先され,縦向きの設定で横ファイルが挿入される.そこで, ファイルの挿入の直前にセクションを区切り,用紙の向きを変更する必要がある.セッション区切りは「ペ ージレイアウト」の「ページ設定 j タブで設定可能である. ( 4 ) 必要なファイルの結合が終了すれば,ファイルに名前を入れて保存し, Mic r o s o f tWordを終了させる. ( 5 ) ( 1 )~ ( 4 ) を組みわせ,以下のようにしてファイルの挿入を繰り返すことにより,多くの RTFファイ ルを lつに結合することが可能となる. くり*し す , 、 . 、 て 遭 択 し, 下 蓄 用セ のシ ア 績ヨ イ 種を 挿 を 轟 定 喜 り 入 . / ' ニ , ~}J.,. ‑301・
3 . 2 プログラム 以下に, 3.1 で示したアルゴPリズムを実行可能にするプログラムを示す.ここでは, Before.rtfに Addl .r t f (用紙設定:縦)および Add 2. r t f (用紙設定:横)を結合し, A f t e r . ばというファイル名で保存して終了する 例を示す. 抽n a c r oFi r s t( f n a m e ); , , " & f n a m e . "ぺ . .False'; 1宇 Falseで読み取り専用でなくする. TrueI ま読み取り専用ホ/ p u t. w d .D o c u m e n t s .O p e n, 3p u t' w d . A p p l i c a t i o n . V i s i b l e=T r u e ' ; I * T r u eで Mi c r o s o f tW o r dを画面に表示する牢/ 4 ~end F ir s t ; 5 6 ~acro A d d( f n a m e .p o r1 ); 7p u t 'w d .S eI e c ti o n .W hoI e S t o r y '; 1 牢すベて選択 ( C t rI + A l ホ/ 8p u t 'w d .S e1 e c ti o n .M o v e D o w n '; 1 字下に移動宇/ 9p u t 'w d .S e1 e c ti o n .1 n s e r t B r e a k2 '; 1 * 2 :w d S e c ti o n B r e a k N e x t P a g e←次ページから改セクシヨン * 1 1 0 p u t 'w d .S e1 e c ti o n .P a g e S e t u p .O ri e n t a ti o n=."& p o r. 1" 1 ホO : w d O ri e n t P o r t r ai t← 用 紙 を 縦 向 き 1: w d O ri e n t L a n d s c a p e← 用 紙 を 横 向 き り 1 1 1 2 p u t' w d . S e l e c t i o n . l n s e r t F i l e ' "" & f n a m e . "' ' ' ' ; I * & f n a m e .を 指 定 場 所 に 挿 入 * 1 1 3 唱m e n dA d d ; 1 4 1 5 伽a c r oF i l e S e t ( f i l e 1 =,V B S F i l e P a t h = ' D¥ ・S A S ¥R T Fファイル結合ー v b s ' ); 1 6 B S Fi 1 e P a t h ." ; 1 7 f i l e n a m e̲temp"品V 1 8 d a t a n u1 1 9 f i l e̲ t e m pL R E C L = 1 0 0 0 ; 'W o r d . A p p li c a t i o n ' γ ;1 柑 d の定義事/ 2 0 put'S e tw d=C r e a t e O b j e c tC 2 1 put'w d .C h a n g e Fi I e O p e n Di r e c t o r y 1 i b . "' ' ' ' ; 1 ホカレントディレクトリの変更 * 1 2 2 2 3 唱F i r s t ( B e f o r e .r t f ) ; 2 4 % A d d( A d d1 .r t f .0 ); 1 牢縦向きで街入牢/ 2 5 % A d d( A d d 2 .r t f,1 ); 1 宇横向きで掃入牢/ 2 6 2 7 put'w d .A c ti v e D o c u m e n t .S a v e A s f i1 e 1 . " ,,,勺 / 宇f n a m eを f il e 1の名前で名前をつけて保存宇/ 2 8 p u t' w d . A p p l i c a t i o n . O u i t ' ; 1 宇終了宇/ 2 9 put'S e tw d=N o t hi n g '; 3 0 r u n ; 3 1 1 宇作成した V B Sファイルを実行宇/ 3 2 O P T I O N SN O X W A I TN O X S Y N C ; 3 3 X"品V B S Fi 1 e P a t h ." ; 3 4 3 5 o p ti o n sX W AI T ; 3 6 % m e n dFi 1 e S e t ; 3 7 、 的 、 山 3 81 宇肯女肯*肯*肯*肯育実行*肯育肯*肯*肯台育宇/ 3 9 引e t1 ib=D :~SAS~; 4 0% F i l e S e t ( f il e 1 = A f t e r .r t f ) ; 本例では, 15~36 行自の %Fileset マクロ内で"RTF ファイル結合 .vbs"が作成される.このファイルには VBS コードが含まれており,そのコード l こは 3.1で示した命令を持たせてある.この VBSファイルを犯行目の "X 吐 VBSFilePa 也 γの部分で、実行させており,コードの作成から実行までを本プログラムで一度に行っている. このプログラムにより, "Before.rtf'の下に用紙設定が縦で"Addl .r t f 'が挿入され,さらにその下に用紙設定が 横で"Add 2 . 此f 'が挿入され,以上の RTFファイルが "A 食e r . r t f 'として保存され, Mi c r o s o f tWordが自動で終了す る.なお,用紙の向きは結合するファイルごとに %Addマクロの第 2引数で制御している. ‑ 3 0 2・
4 表番号を自動付与するプログラム 臨床試験の解析結果は総括報告書にて利用される.総括報告書の 14章は「本文中には含めないが,引用す る表,園及びグラフ」を掲載する章であり,各社のポリシーに依存するが,総括報告書用に用意した解析結 果の中の多くの表を 14章に示すと考えられる.その中で,例えば有効性の解析結果は 1 4 . 2章にすべて掲載 し,順番に表 1 4 . 2 ‑ 1,表 1 4 . 2 ‑ 2,・・・と表番号を付与することになる. そこで,本章では, 3章で RTFファイルを結合する前に,このような表番号を自動的に付与するプログラ ムを組み込んでおき, RTFファイルの結合を実行した後に,自動で表番号を付与するプログラムを作成した. これを利用すれば,結合後に表番号の付与のために手作業が発生することを防ぐことができ,更なる業務の 効率化に繋がると考えられる. 表番号の付与のためには, MicrosoftWordのフィールドの機能を利用する.フィールドには様々なフィール ド、コードが用意されており,そのフィールドコードによって様々な機能が利用できる.今回は見出しの番号 に応じて章番号を付ける STYLEREFフィールドと,表の個数に応じて連番を付与する SEQフィールドを利 用する.その他,利用できるフィールドは, i 挿入」メニューの「テキスト」→「クイックパーツ」→「フィ ールド」で確認、いただきたい.フィールドコードはMicrosoftWord上では特殊な{}で括られて表現される. この{} は C凶 +F9とタイプすることで入力される特殊なコードである.そのため, SASプログラムからフィ ールドコードを RTFに埋め込む際にも,この特殊な{}のコードをタイプする必要がある. RTF の解析結果にフィールドコードを埋め込むには, ¥ {field{ ¥ 呼fldinst c o d e } }を利用する.そして ,c o d e の部分に利用したい種類のフィールドコードを入力する. %RTFマクロを利用して RTFファイルによる解析 結果の表番号に連番を付与するためには,表のタイトルを出力する部分に p u t コマンドで,このフィールド コードを埋め込めば良い.実際に上記の例のように表 14.2‑X (Xに連番を付与)を埋め込む場合は以下のよ うになる 例えば, 2章のプログラム例であれば, 2 1行目にある"表 1 "の代わりに以下を用いれば良い. " 表 1 4 . 2 ‑ [半f ie l d[ 草 刈 fI di n s tS E Q表 ~~s 2 J[ 肝 Idrslt 1 ]J " なお, ¥ {fldrsltI }は連番の初期値を lにすることを示している.また,上記例で、は{再s2 }オプションを付け ている.持sの後の数字は,連番の付与を初期化する見出しレベルを示しており,例のように 2であれば,見 出しレベル l及び見出しレベル 2の章が新しく始まるごとに,表番号の連番の付与が lから始まるようにな る. 更に, 1 4 . 2の部分も見出し番号から自動取得する場合は STYLEREFを用いる.この場合は,表を張り付け た場所の見出しに応じた番号が自動取得される.なお, 1 4 . 2は見出しレベル 2に該当するので,オプション として STYLEREFの後ろに 2を用いる.なお前述の砦sによる表番号の連番の付与のリセット機能は,この STYLEREFと組み合わせて利用すると効果的である. " 表 { ¥f ieI d[ l f : * ¥fI di n s t STYLEREFl f : l f :s2 J[ l f : fI d rsI t1 ] ト { ¥field[l f : * ¥ fldinstSEQ表¥¥s2 JJ " このフィールドコードを解析結果に埋め込んだ後に, 3章のプログラムを利用して解析結果を結合すれば, 上記のプログラムにて設定した箇所の表番号がすべて連番となって振り直される.これにより,そのまま総 ‑303・
括報告書の 1 4章として利用することが可能である. . 2の 2 ) ではフィールドコードを利用し, RTFファイルの全体ページ数と各ページ数の取得を目 ※なお, 2 的とする NUMPAGESや PAGEの機能を利用している. 5 まとめ 以上,解析結果を RTFファイルで作成することを始まりとして, RTFファイルの結合プログラム及び表番 号の連番付与プログラムを組み合わせて用いることにより,多くの解析結果を自動的かっ効率的に総括報告 4章に掲載するための準備が整った.本稿でまとめた解析結果出力過程を以下にまとめる. 書の 1 ( 1 ) %RTFマクロを活用・改良し,複雑なレイアウトの解析結果に対応できる方法を整備した. ( 2 ) %RTFマクロを活用する際に,群の数に依らないプログラムの標準化を踏まえた効率的な活用方法を提 案した. ( 3 ) 複数の RTFファイルを, VBSを利用したプログラム制御を用いることで,自動的に一つのファイルに 結合する方法を整備した. ( 4 ) Microso 食W ordのフィールドコード機能を用いて ( 3 ) による RTFファイルの結合と同時に表番号を自 動的に付与するプログラムを整備した. ( 5 ) ( 1 )~ ( 4 ) の過程を利用し,総括報告書用の解析結果について,汎用的かっ効率的に業務を推進する 過程を整備した. 4 ) のプログラムの作成は総括報告書作成業務の効率化を見据えて取り組んだ業務であった.そ ( 1 )~ ( の中で, ( 4 ) のプログラムの作成の動機は,メデイカルライティング部門から iRTF ファイルを総括報告書 に lつ lつ貼りつけるのが煩雑なので,何らかの工夫をして効率的に業務を行うことができなし、か」との相 談を受けたことであった.臨床試験のデータ固定から総括報告書の作成,更には次相の立案もしくは承認申 請の準備は,スピードと質の両方が要求される業務である.本稿で紹介した一連のプログラムの作成には一 定の労力がかかったものの,一度作成すれば何度でも繰り返し利用できるため,非常に汎用性が高いプログ ラムである.実際に,各試験で共通に用いることが多い臨床試験の被験者背景情報や安全性に対する解析プ ログラムの大半を一般化し,群の数に依らずに利用できるプログラムを開発し,自社で解析プログラムを作 成する際の時間は大幅に削減できている.これらのプログラムの利用により,総括報告書の作成におけるス ピードと質の向上へ寄与することができたと考えている. 参考文献 1 )田村洋介 ( 2 0 0 6 ), SAS‑Microso食 Word聞の自動化処理による出力の加工・整形, SASForumユーザ会 1 3・1 2 2 学術総会 2006,1 2 ) 吉崎正浩,初道正博,冨金原悟 ( 2 0 0 9 ),%RTFマクロを用いた解析結果の効率的作成に向けた取り組みー医薬 品開発における解析業務の標準化司, SAS ユーザ総会 2009論文集, 25‑39 ichTextFormat(RTF)S p e c i f i c a t i o nV e r s i o n1 .9 . 1, h t t p : / 加w w . r n i c r o s o f t . c o m l 0伍 c e / 3 )M i c r o s o f tO f f i c eR 4 )P e s z e k ( 1 9 9 8 ), A u t o r n a t et h eC r e a t i o nandM a n i p u l a t i o nofWordP r o c e s s o rReadySASO u t p u t, 食p . s a s .c o r n l t e c h s u p / d o w n 1 o a d l o b s e r v a t i o ns / obswww1 3 / obswww1 3 .pdf ‑304・
同
三
+
悌
一
一
一
l
'
l
I
1
!
:
I
帰
宅
加
7
‑
281~
Webサイトのアクセス解析
(株)ふくおかフィナンシヤルグループ営業企画部
須永真昼
SASインスティチユートジャパンプロフェッショナルサービス本部
村よ廉史
W
e
b
‑
S
i
t
eA
n
a
l凶c
s
F
u
k
u
o
k
aF
i
n
a
n
c
i
a
lG
r
o
u
p,I
n
c
.
M
a
h
i
r
uS
u
n
a
g
a
SASI
n
s
t
i
t
u
t
eJ
a
p
a
nL
t
d
.
K
i
y
o
s
h
iM
u
r
a
l
くa
m
i
川一+総会! ,"JaH'J'}~-:-r1 ,..,.:i
t
加~
要旨:
結合ログ形式 (
C
o
m
b
i
n
dl
o
gf
o
r
m
a
t
)のA
p
a
c
h
eのログファイルを入力
ファイルに、具体的な Webサイトのアクセス解析を実施する方法を、
サンプルプログラムを交えてご紹介します。
キーワードを続けてキーワードを記載
W
e
b
‑
s
i
t
ea
n
a
l
y
t
i
c
sa
p
a
c
h
ec
o
m
b
i
n
e
dl
o
gf
o
r
m
a
tB
a
s
eSAS
‑
3
0
5・
w
m
~ユーザー健全対印刷JII:;-&W,宵知世伽ン
J
Webア 空 セ ス 口 室 、 と は ・ ..
ホームベ ジへの外部からのアクセス履歴を、テキスト形式で保存したもの。
<例>
XXX.XXX.XXX.XXXー
‑[
02
l
M
a
y
/
2
0
1
0
:
1
2
:
5
2
:
5
5+0900j"GETl
u
r
l
/
uけ21page2.htmHTTP/1.1"200‑
.
.
h
t
t
p
:
/
/www
.
d
o
m
a
i
n
.
c
o
.
j
p
/
u
r
l
/
u
r
l2
lpage1.htm.."(compatible;MSIE8
.
0
;WindowsNT6
.
0
;T
r
i
d
e
n
t
l
4
.
0
;
Y丁
目7
2
0
;G丁目 6.
4
;SLCC1;.NETCLR2.0.50727;M凶 i
aCenterPC5
.
0
;.NETCLR3
.
5
.
3
0
7
2
9
; .NET
CLR3
.
0
.
3
0
6
1
8
)
"
Webア ク セ ス ロ グ か ら 分 か る こ と . ..
アクセスログに肥蛾される主な情報
4
聾続元I
Pアドレス
J
)クエストの日時
ス)
砂
J
)クエストファイル(=閲覧されたページ)
J
)クエスト結果
デ‑')1サイズ
‑リファラー(前のページの URLと検索キーワ
エージエント(筏続環境)
だれが(lPアドレスベ
いつ
どのページを
見た/見ょうとした
どこから
どんな環境で
6
ド
)
3
ト鉱任付金印刷…
大量のアクセスログを処理することで分かること
‑よく見られるページ(人気のあるベ ジ)がどこか
・どの時間帯/曜日のアクセスが多いか
=今時間帯/曜日で人気に差異はあるか
・どのページがから、 HP!こ来ているか
E どのページで、自社の HP
から出て行ってしまっているか
E ページに来た人は、目的とするページに到達しているか
E どのような環境からイン9ーネットに後続しているか
‑顧客のニーズは何か(注目されている商品は? 商品の人気は上昇/下降)
E 自社の HP
で、訴求できていない部分(不満足なページ)がわかる
=今コンテンツ肉容、デザイン等を見直す
E ケ‑')1イからのアクセスはどれくらいか?
・ユーザーの利用している、 OS、ブラウザi
ま
斗ケ‑')1イのページ必要性や、新しい機種への対応の必要性
‑306・
1
1
叫ん…
。
│一般的なデ‑$1取り込みの流れ│
定型レポートなど・・
。卜
l
SAS⑧を使用して… │
l sy
定型レポートなど・・
柔軟なアドホック分析
l 鈍ー健全 ~zmi-7l!l!:JIlI1!
│アクセスログを取り込む上での課題│
バ分析に不要なテ‑$1が大半
く理由>
アクセスロクは全てか志載されているため Webベーシ内の画像ファイル等の取り込みにつ
いても全てか♀鼓されている
<対応策>
ロクフィイルの中から・. g
l
f、
l
P
9、bmp 等の画像ファイルを削除する
X
いわゆるクローラーと呼ばれる、ロボットによるアクセスが大量に存在する
<理由>
検索サイト等か、世界中の Webサイトを巡回し、ヘ ンの内容を取り込み INDEX化を実施して
いるため、定期的に自社サイトにもアクセスしてきている
(自社の HP
で没 i
在している、サイト内積索ツ ル等も巡回している)
く対応策>
クローラ と判断できる(できそうなノアクセスについて削除する
r一部の大手サイト i
立、自社のクローラーの情報を公開しているか、非公開のクローラーも多く、
デ 習を見たうえで判断していくしかないものも多い、
立、も01"'や "
c
r
a
w
l
" といったキ
多
くI
ワードを agentに埋め込んである
‑307・
Iぷb←蝕~加 ~9 ) ( Web サイトへの 7'j.ックによるログが残る く理由> 園内・海外を問わず、 Webサイト内の情報を取得するために、多様なアタyクの形跡がある く対応策> Webへーシ i こ公開していない URL で、拡振子か Zlpや 9Z、mdbなどをリクエストしてくるケ を削除する ス x 検索キーワードの文字コードは様々であり、エンコ ドしないと読めないの また、検索キーワードの抽出は 筋線では上手くいかない c く理由> 検索エンジン等によって[立、多樵なフラウシンク環境へ対応するため、ユ ザ か文字コ ド を指定して利用する乙とができる 検索キーワードのアクセスロクへの埋め込み方は、多績であり個別の対応かどうしても必要 く対応策> 検索サイトからの流入してきたログについては、検索エンジンの種類、ログ内のリフアラー情 報の沼載内容に応じた制断処理を実装し怠ければならない (現在 99%程度 l 立、対応できているが・・・) │ ω $ . : 1 ‑ 付 金 一 一 …ω ZIP形式で圧縮された テキストファイル ¥γ/ マクロ化しておくと、便利! ‑308 ・ ~~
J l ふE:Eザ』除…m山 内 … : 一 │詳細プログラム│ │まず、検索エンジンのエンコード9イプの指定をしたデ ' ; 1 │セットを作成しておきます。(固定で、デ‑';1セットとして、保 i していても問題なし) 一二三三一一一一一一 l e叫 P . j p s e a r c h . g o o . n e . j p 1 * * *more****1 ¥ ここでは、 31¥ ' ; 1ーンを記載していますが、 実際は、 40パ9ーン程度を設定していし ます。 〉乙ニ一一一 k e y l e n = l e n g削 除y ), S国 間 y ahoo I l ‑ ‑ ‑ ‑ ‑ レ f検索エンジン設定ファイ 1 1 / ' d a t as e n g i n e ; i n f i l ec a r d s ; i n p u tdomain:$40.k e y : $ 1 5 .ke y 2: $ 1 5 .e n c : $ 5 . ; ; ; ; 広 明 ∞ 加 。 │ / l i 州 = UT同 陶 刷2 を用意することで、検索ワード ?p= &p= UTF ・ 1 の表示位置の差異に対応しています。 つMT=aMT=UTF‑811¥4 徐 8 、....?" 合 ノ ~ r u n ; …. ‑‑ ぬュヂ除…ーι '~2ÒiOI %macrog e t l o g ( l o g d i r =, z i p f i l e =, l o g f i l e =, out̲DS=); 1"マクロとして定義V * ' ファイルのまま読む込むための、 ステートメント . ,王 ; 社の正式サホ ト構文ではない 1 ZIP f i l e n a m e SAS f i l e n a m eINPUTZIPsaszlpam" & 1勾 d i仁 ¥& z i p f i l e " ; ' * saszipam d a t a̲ b l勾; f アクセスログのデリミヲ l 立、半角スペースワ i n f i l eINPUTZIP(& 同f i l e )dlm=""MISSOVERDSDI r e c l = 3 2 7 6 7 ; f o r m a ti p a d d$ 1 5 .̲ c i d e n t$ 1 0 .̲ u i d$ 1 0 .d t i m ed a t e t i m e 1 9 .d a t eyymmdd10 t i m et i me 8 .̲gmt$ 6 .̲f伺 $ 5 5 0 .method$7 u r l$ 5 1 2 .h t t p$ 3 . ̲ s t a t u s$ 3 .s 匂t u s3 .̲ s i z e$ 1 2 .s i z eb e s t 1 2 .r e f e r e r$ 1 0 0 0 .agent$ 2 5 6 . ; i n f o r r n a ti p a d d$ 1 5 .̲dtime$ 2 1 .d t i m e8 .̲gmt$ 6 .̲ r e q$2 ̲ s t a t u s$ 3 .s t a t u s3 .s i z eb e s t 1 2 .r e f e r e r$ 1 0 0 0 .a g e n t$ 2 5 6 . ; i n p u ti p a d d̲ c i d e n t̲ u i d̲dtime̲gmt̲ r e q̲ s t a t u s̲ s i z er e f e r e ra g e n t ; 目 ∞ . 1 "g i f . j p g等を削除ヴ i fp r x m a t c h ( " . ( g i f U p g i j s l c s s l p n g l b m p l z i p l g z l m d b ) I '. ̲ r e q )t h e nd e l e t e ; e l s ed o ; 1 * * * * * * * * * * * * * * * * NEXT PAGE * * * * * * * * * * * * * * * j 10 ‑309・
.
ー
会
…
…
‑
…
~
f 監視アクセス(ロード 1¥ランサー)を削除ヴ
i
f(i
p
a
d
d
=
'
10
.
10
.
10
.
10・
o
ri
p
a
d
d
=
'
10
.
10
.
10
.
1
1
')t
h
e
nd
e
l
e
t
e
;
e
l
s
ed
o
;
,
'
.
fクローラー等の削除ワ
一一一一一¥
十Webの世界を巡回している、クローラーと
一勾 e
nt=lowcase(agent);
汗(indexしagent'
,b
o
t
'
)口r
1 公開されているものもあれば、非公開のも
呼ばれるアクセスを削除していく。
ind叫しagent':c~.~w') o
r
i
n
d
e
x
しagent'
,y
!j
'
)o
r
~.のもある。(キレイにするのは、かなりの手
‑
‑
‑
‑
‑
‑
‑
‑
‑
.
問
)
ーノ
/
*
.
.
・m
o
r
e
.
.
.
.
j
1
ipadd='XXX.XXX.XXX.XXX'
f 関係者や監視系については、 I
Pアドレスで削除.,
I
、
.
.
.
.
.
."
"
'¥' J 社
1内からのアクセス、制作会社のアクセス J
)t
h
e
nd
e
l
e
t
e
;
I
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
NE
灯 同GE
…
…
…
…l¥サーバー監視関連のアクセスについては、
I では分からないものも多いので、 l
I
I
P
agent
が特定できる場合は I
Pアドレスを使って、
│
¥ 削 除 。 )
11
IAS.:1-~-総会……rn副知山
~I
e
l
s
edo
・
│
d
t
i
m
e
=
i
n
p
u
t
(
s
u
b
s
t
r
しdtime,
2
),
d
a
t
e
t
i
m
e
2
0
.
)
;
1
3
ごf
詑;
Z
J
2
1
2
ζ〈f生のテキストデータのf~から、 SAS 日付値・ 1
1
SAS時間値を生成する。
1
method=scanしreq,
1, " な ー ‑ , ー ←
i
fs
t
a
t
u
s
=
"
ー"
then s
t
a
t
u
s
=
"
.
"
:
しstatus.3.);
s
t
a
t
u
s
=
i
n
p
u
t
i
fs
i
z
e
=
"
‑
"t
h
e
n s
i
z
e
=
"
.
"
:
一
‑
,/,
.
.A .
.
.
.
̲
.
1
.
.
.
.
.
, .CII. •
J
̲.u.̲ h "
̲
̲
.
ISASで扱い易いように、欠損値の置換処
<
.
̲
、
s
i
z
e
=
i
n
p
u
t
しsize,
b田 t
1
2
.
)
;
u
r
l
=
u
r
f
d田 凶 e(scanしreq,
2,
""
)
)
;
http=scan(scanしr
e
q,
3,
""
)
之"
f
'
)
;
sengine=scan(referer
,
2,
"
f
'
)
;
e
n
d
;
end
e
n
d
;
drop̲
:
;
r
u
n
:
I̲ ̲ . ̲
.
.
.
.
.
Lg
1‑+ ̲
理をおこなったり、文字列=数値への型変
‑
1 換を実施するなど、 SASで取扱いやすくす
1 るための処理を実施
I
¥
,
.
.
・H ・
*
*
*
*
*
*
*
*
*
* NEXT PAGE .
.
*
*
.
.
.
.
,
.
,
.
*
.
.
*
*
/
‑
3
1
0・
'¥
¥
,
̲
←
.
ー
,
γ
邑
ヨ
~II[IJ
~ユーザー健全対開府~幽泌t伽ジ
o
p
t
i
o
n
scompress=YES;1*ファイルサイズを小さくするためのオプションワ
d
a
t
aWLOG.&out d
s
;
f
o
r
m
a
ti
p
a
d
dd
t
i
m
ed
a
t
et
i
m
emethodu
r
lh
t
t
ps
t
a
t
u
s
s
i
z
er
e
f
e
r
e
rkeywordsa
g
e
n
t
;
勾;
s
e
t̲
b
l
f マージをしていく部分・・・ デーヲが大きいので merge を使わず、
SET + SETで対応していく V
i
fmissing(sengine)=Ot
h
e
n
d
o
;
doi
=
1t
on
a
;
主~WI勾 .sengine p
o
i
n
t
=
inobs=na;
i
fsengine=domaint
h
e
nl
e
a
v
e
;
e
n
d
;
,
,
,
.
.
.
.
̲
*
‑
*
"
'
.
"
'
.
,
.
*
'
*
"
'
'
'
' NEXT PAGE *
"
'
.
,
.
,
.
"
'
'
*
*
'
'
'
*
.
'
*
'
'
'
*
*
/
̲
b
l
o
g
(V
AA>
くVAA>
songm
aho。
哩
(V
AA>
。
0.1
aho。
。
01
:[
0
aho。
~
…順│
~ rsengin = d
「番に見て行って、一致する obs
i
を横結合する。
13
:
I
鰯トト倣一……‑可一、
1
m
!
]
Jω=kind附 山 則 明 f 内はじまるパヲーン・'‑<:::三子検索キーワードの入 L
)方 を 、 問
̲
po生 kindex(refe町 key2); &ではじまるパヲン V 寸する。
r
、
Fリファラー内でエンコーディングが指定されているもの・
、
J
l
r一一
>0t
h
e
nenc="UTF-8'~ここご J フアラー内でエンコードが指定さ
「 ー
i
fk
i
n
d
e
x
(
r
e
f
e
r
e
r
.
"
e
i
=
U
T
F
‑
8
"
)
i
fk
i
n
d
e
x
(
r
e
f
e
r
e
r
. i
=
S
h
i
f
t
̲
J
I
S
"
)>0t
h
e
nenc="SJIS れ て い る ケ ー ス も あ る 。
i
fk
i
n
d
e
x
(
r
e
f
e
r
e
r
.
"
e
i
=
E
U
C・
J
P
"
) >0t
h
e
nenc="EUC";
ー
f more*
*
*
1
・食合
1
I
「
合
i
f̲p国>0t
h
e
n
1
(
u
r
l
d
e
c
ω
e
(
s
c
a
n
(
s
u
b
s
t
r
(
r
e
f
e
r
e
r
.
̲
p
o
s
+
k
e
y
l
e
n
)
.
1
.
'
&
'
)
)
.
e
n
c
.
"
S
J
I
S
"
)
;
keywords=kcv
pos2>0then
e
l
s
ei
f̲
keywords=kc
叫(
urldecωe(scan(
s
u
b
s
t
r
(
r
e
f
e
r
e
r
.
̲
p
o
s
2
+
k
e
y
l
e
n
)
.
1
.'
&
'
)
)
.
e
n
c
."SJI
S
"
)
;
e
n
d
;
、『べょ‑‑一ー
口u
t
ゆ
p以
utw
削
│
同
勾&
伽
o以
u
t
仁
一
止
̲
d
s
.
;
岬o
p
…口叩
d
r
scanとsubstr
r
u
n
;
2) 文字列の S
J
I
Sへの変換
%mend; ,・マクロ定義終了 V
K
C
V
TとurIdecode
fマクロの実行処理伊'
1
"
%
g
e
t
l勾 (
I
o
g
d
i戸 E
:
¥SUGI̲LOG.zipfile=apache̲te山 g
.
z
肌 ! 例 ) 間 世 印 刷 唱7
B%8C
%E
A
│勾 f
i
l
e
司 p
a
c
h
e
̲
t
e
s
t
l
o
g.l勾 .
0
u
t
̲
D
S
=
a
l
l
)
;
‑
3
1
1・
司戸本語ノ
I
崎ユ十範幸……‑…
~~
│プログラム集計/加工用の処理(例〉
F媒体、ブラウザ、 OS
を判定 V
l
I
2
;
d
a
t
aw
l
o
g
.
a
s
e
tw
l
o
g
.
a
l
l
;
l
o
n
n
a
tMOB$
1
5
.
;
l
o
n
n
a
tB
r
o
w
s
e
r$
1
5
.
;
1
0
π
n
a
tOS$
1
5
.
;
「媒体合l
ログ内のエージェントの項目を利用して、
接続媒体やブラウザ、 05の判定を実施
lする
一ー二三三士二
s
e
l
e
c
t
;
,DoCoMo')>0)MOB=可 o
como';
when(
i
n
d
e
x
(
a
g
e
n
t'
when(
i
n
d
e
x
(agent'
,B
lackBer
r
y
'
)>0)MOB='BlackBe
when(
i
n
d
e
x
(agent'
,SO‑018
'
)>0)MOB=χperia';
when(
i
n
d
e
x
(
a
g
e
n
t'
,KDDI
'
)>0)MOB='
A
u
'
;
when(
i
n
d
e
x
(
a
g
e
n
t'
,S
o
f
t
B
a
n
k
'
)>0)MOB='
S
o
f
t
B
a
n
k
'
;
when(
i
n
d
e
x
(agent'
,i
P
h
o
n
e
;
'
)>0)MOB='
i
P
h
o
n
e
'
;
when(
i
n
d
e
x
(
a
g
e
n
t'
,N
intendoW
i
i
'
)
>0
)MOBピ W
i
i
'
;
when(
i
n
d
e
x
(
a
g
e
n
t'
,Windows')>0)MOBピ WIN';
when(
i
n
d
e
x
(
a
g
e
n
t'
,M
a
c
'
)>0)MOB=
'
M
ac
';
町
ヘ
r."m~町e・ H ・i
otherwiseMOB='
o
t
h
er
'
;
e
n
d
;
F金
̲
.
.
・
‑
*
*
*
*
"
'
.
合 NEXT PAGE
.
.
.
.
.
̲
.
.
.
.
.
.
.
.
,
15
I~~'=~:l会 7tJ'rl.7fT'JJD!i…山~~
Fブラウザーl
s
e
l
e
c
t
;
when(
i
n
d
e
x
(
a
g
e
n
t
:
O
p
e
r
a
'
)>0)Browser=
'
O
p
e
r
a
'
;
S
a
f
a
r
i
'
;
when(
i
n
d
e
x
(
a
g
e
n
t
:
S
a
f
a
r
i
'
)>0)Browser='
C
h
r
o
m
e
'
;
when(index(agent:Chrome')>0)Browser='
when(
i
n
d
e
x
(
a
g
e
n
t
:
F
i
r
e
f
o
x
l
3
.
6
'
)>0)Browser '
F
i
r
e
f
o
x
l
3
.
6
'
;
when(index(agent:MSIE5
.
5
'
)>0)Brow
宮e
r='
I
E
5
.
5
;
・
when(index(agent:MSIE6
.
0・
)>0)Browser=
'
I
E
6
'
;
when(index(agent:MSIE7
.
0・
)>0)Browser=
'
I
E7
'
;
when(index(agent:MSIE8
.
0・
)>0)Browser=
'
I
E
8
'
;
r**lImore
*
*/
o
t
h
e
r
w
i
s
eBrowser='OTHER';
e
n
d
;
=
r OS.J
s
e
l
e
c
t
;
when(index(agent:Window
宮 NT5
.
1
'
)>0)OS=WIN̲XP';
when(index(agent:WindowsNT6
.
0
)
・>0)OS=
WIN̲VISTA';
附 e
n(index(agent:WindowsNT6
.
1
'
)>0)OS=WIN̲
7
'
;
when(
i
n
d
e
x
(
a
g
e
n
t,
Windows9
8
'
)>0)OS=
'WI
N9
8
'
;
r...more....J
o
t
h
e
r
w
i
s
eOS='OTHER';
e
n
d
;
札m
;
‑
3
1
2・
[t]J~
1
S
心
付
金
>
i
l
l
.
‑
‑
y
r
.
;
:
7
E
J
I
.
l
:
]
…
パフォーマンスに関して
v
.
SAS化前
一部 SAS化
SAS化後
Z
I
Pファイル司テキスト
ファイ jレ
f
:
l
現 在 約 2時間程度
でデ‑1>セット化終了
フ一一
EV 企 守 山
山川で訂
をみ川
アト主
テリ司
フフお
トソ明
スのれ
キ一 α
'
CSV形式ファイルを、 SAS
に取り込み
3日‑4日の手作業処理
あきらめ・・・
│ωb
[1]~
付 金 si
?
R
f
i
W
5
l
ν
炉 問 加
SASデータセット化したアクセスログの活用
SASデ‑1>セット化してしまえば、後は比較的自由に活用できる・・.
(例)
rWeb
サイトへの訪問者の動きをトレースしたしリ
訪問ーセッションを特定しておく必要がある。
I
Pアドレス i
立、閉じ I
Pアドレスが利用されるので、同一 I
Pアドレスからの後続について、
30分以上開いたら、男1
1セッションとする。 (
1つの考え方)
一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一;;tt:
i苅
..♂ι ー由。'.I l~.・5 ・
司
岬4
聖守一一ーム1:" III..:.~と一一一i一一
.,一M一λーJJ一'0隻-型:tf~
、.,町会認.
s
且
,31111ア"士4
.
'
.
‑
r
.
o
r
.
.
τ
.
て
"
宅
"
.
ω
,
I:~
会トリ'
u
H.
す
,a
.
.
:
'
.
0
;
:
‑
.
1
,
;
,
:
o
t
.
1A .•
'
"
、
"
"
,
̲
V
'
S
T
i
側
.
'
,
.
.
1
;
:
ゐ
:
:
‑
, '
Jt
'
.
lo
:
.
;
!
.
.
I
ヌ"
A).1
J
T
:
,T/
,
.
t
:
'
l
l(
L
'
:
‑
:
:
;
t
.
3
持
I
f
1
t;
1 1 ,
ι
"
1 l
!
I
'
IO
'
T
'
1
0
'
1
'
1
'
.
.
'
.
.
.
.
<
:
.
1
t:u
・
"
1
i
金蝿
に 1
01
(
'
l'l\~H'
は1
0
:
[
:
'
l:l"lr'
t
.
l
(
l
1
{
.
'
1:1111C
'
0
1
(
.
1
l
:
ll
1l
f
'
.
1
0
1
(
'
I:Wt:也3
l
(
‑但
l )
,
l
J
~.,
A
:~.).l沼地~:,'
言、"月 In :n-~H
, ∞
4
(::rl1 n:;-;-...~ x<
内t~'~
も
,
;
'
f
.
. C) U1]
ゐ.'A.;
'
}
!
O:
‑
JI
I
"
.
晴a
"
1
,
.
)
.
I
'
,'}・
l
,
o "1;
昨
"
:!.J c:m引に .T:~:
1
.,
0
:1
('00
1:1ntt'OO
'
1
0
1
(
.
'
、
:
!
'
l'
r 四E
崎
)t t)~争』苫
U .l泊'0, 1)
.
且 )Iun'''''l!
,
I
.o
"
,
z
,
:
,
誕
再J )
)
l
l
a
叫柑
町 a
仇
!
'
J
"
1
'1
昨」
町 a
,
:
0
1
:
守
1
:
1
E~
"
'
】"
IB
,
u
,
.
.
'
t
.
'
.
'
!
i
.
τ,
両.
,
ぬ予祖'"
ゐT
.司
命蜘 p
,
τ.
,
"
.
,
.
..,.~
1
"
.
3
,
,何
1
官
,
"
'
.
r
r
・1
1 .
:
も
"
1 ;
}
.
J
18
‑
3
1
3・
結 Sザ 縫 い ' F l … 加
Fセッシヨンをまとめる V
~D
1度の後続をある程度特定したい。
〈(来訪回数や、平鈎閲覧ページ数、
退出されやすいベージを見たい)
p
r
∞sσtdata=wlog.ALLout=̲so門
,
byi
p
a
d
dd
t
i
m
e
;
r
u
n
;
d
a
t
a̲
s
e
s
s
i
o
n
;
、
よ
;
:
:
:
‑
‑
‑
‑
'
‑
s
e
t̲
s
o
r
t
;
(ー・いたしかたないので、ソ ティング)
¥
b
y
i
p
a
d
d
;
~※デ一望サイズが大きい場合には、 sortプロシー
同t
副 S白 s
i
o
n1̲dt
2view̲no
│ジャーを変更することで、パフォーマンスの改善が
1
*1
P
アドレス毎の初期値を指定ワ
│可能。
i
ff
i
r
st
.
ipaddthend
o
;
̲dロ=d
t
i
m
e
; view̲no=O; s
e
s
s
i
o
n
=
1
;
e
n
d
;
ベ
,
‑
.
<
'
七
同一 l
Pで
、 30分以上間隔が空いたら、別セッショ l
*
1dtime+30minをーdt21こ設定する 9.1.3SP4Iンと見なす帆
:
:
.
.
̲
.
;
;
+
.
:
:
.
,
;
.
;
;
,
;
‑
"---,-,,~-,,- ̲‑‑
,"
'‑
‑‑
‑│
I
̲dロ
=TINTNX('min3ぴ
,̲
dt2,
1:SAME');
‑̲‑‑‑‑.
.
.
*
130分以上のケース新セッション~
¥
)
汗̲d
也 <d
t
i
m
et
h
e
nd
o
;
ー
‑
=
=
二
ニ
一
一
一
SESSION+1; V
iew̲NO=1
; ̲dt
2=dtime;
o
u
t
p
u
t
;
e
n
d
;
1
*
.
.
.
.
.
.
.
.
.
.
.
.
・
.NEXT PAGE .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
,
I~十総会71ffl1IHJC'j-f,~I},…
iヨ
D
*
130分以内同ーセッションワ
e
l
s
ei
f̲d也 > =d
t
i
m
et
h
e
nd
o
;
VIEW̲NO=VIEW̲NO+1
;
ωtput;
F前OBSの値を格納 V
dt
2=dtime;
e
n
d
;
d
r
o
p̲
:
;
r
u
n
;
F流入ページ、流出ページヴ
∞
p
r so
同d
a
t
a
=
̲sessionωt
=
̲sessαt;
田 s
l
o
n
;
byi
p
a
d
ds
r
u
n
;
i
.
n
o
u
t
;
d
a
t
aw
l
o
g
s
e
t s
e
s
s
α
t
;
l
e
n
g
t
hi
n
̲
pout̲
p$
3
.
;
田 s
l
o
n
;
byi
p
a
d
ds
i
f
f
i
r
s
.
t
s田 s
i
o
nt
h
e
ni
n
̲
p="lN";
.
tsessionthen out
̲
p="OUT";
i
fl
a
s
n
.
m
;
2
υ
‑
3
1
4・
I 鈎トト総会内向… 各種集計等を行えば・.. ページビュー 平均閲覧ページ数 倹素エンジン 検索キーワード AAA BBB AAA+CCC AAA+DOO EEE FFF GGG AAA+HHH 21 Irnユ十蝕WittmJ.æ8WÆt?J~仰 ~~ 更に、加工をしていくなら=・・(専用ツールなら、ボタン 1つですが・・.) フ2 ‑ 3 1 5・
結 Sユ 十 蝕 … … ー 加 w l l D サンプルプログラムのハイライト什 / 2 ) • SASZIPAMアクセスメソッド Windows版 SASでのみ利用可能で、サンプルプログラム中でZIPファイルの解;車に使用 SASZIPAMf 立 、 SASのインスト ルプロセスにて使用されるツール インストール時以外の使用は、サポート対象外 UsageNole31244:SASZIPAMaccessmelhod‑usea ly o u rownr i s k h t t ι血 ! ! R阻色呈旦旦E旦m l k b D 1 / 2 坐1l 1 ̲ r r 11 .URLENCODE.URLDECODE関数 URLENCODE:URLIこ含むことでできない文字を符号化する URLDECODE:復元 DATA̲null̲: English%日本語・); a=URLENCODE(・ b=URLDECODE(a); PUTa = ;PUTb = ; RUN; a=English%25%93%FA%96%7B%BC%EA b = E n g l i s h'Io日本語 Ip←総会問~ゅω 2 0 1[ J サンプルプログラムのハイライト ( 2 / 2 ) • KCVT関数 lW i'イプのエンコ ディングデ‑$1に変換する関数 DATAa; a="E697A5E69CACEBAA9E"x;l 'UTF ・ 8の 16進数にて日本語を指定 V b=KCVT(a ・ ' ,UTF ・ B . . . . . S J I S . . ) ; PUTb = ; RUN; 司注意点一 文字列を出力する K関数の子フォルトの変数長!立、 2001、イトとなる LENGTHステートメントにて変数長を事前に定義する ιとを、お勧めします 変数と属性の昇Il固リスト # 変数 ヲイプ長さ 1 a 2 b 文字 文字 9 200 " ‑ 3 1 6・
I ヂ縫い向山中μ ー~ ,‑ '" 2 O i O I , . ‑ <参考サイト> 之b │側一総会… … 4 ご清聴ありがとうございました。 2 t i ‑ 3 1 7・
月 … [ぬ斗完全 Oll;JJ:;m 戸 ~~ サバイバルツリー法の改良と SAS/PHREGプロシジャによる実行 浜 田 泉 1),川口淳 2) 株式会社イベ 1 )カCRD1),久留米大学バイオ統計センター 2) Extendeds u r v i v a lt r e emethodand SAS/PHREGprocedure IzumiHamada1 ) ,A t s u s h iKawaguchi2) IBERICACRDCO., L td1 ) ,B i o s t a t i s t i c sCenter ,KurumeU n i v e r s i ty2) I 蝕悶… 要旨: 生存時間と予後因子の関係を明らかにするための手法の一つ であるサパイパルツリー法を改良し,その手法を適用するにあ たり SAS/PHREGプロシジャを有効に用いた実際のプログラム を紹介する. キーワード サパィパルツ 1 )ー , Cox比例ハザード、モデル, PHREGプロシジャ, SBC,スコア検定統計量,予後予測 ‑ 3 2 1・
a~~仰い閉山lJMW 2 8 1 8 1 3( i t O u t l i n e ‑はじめに ・サバイバルツリーとは ・改良方法 ・ ・実データ適用例 SAS/PHREGプロシジャを用いた処理 ・まとめ ・付録 │ ーー金持問…… ~I はじめに 生存時間とその共変量 (性別,年齢,治療前の検査データなど) の関係を明らかにしたい. ‑生存時間に関連しているのはどの因子か ・どれくらいの程度で効いているのか =今 YとXの回帰問題 回帰関係を明らかにすることで新しくきた患者さんのリスクを予測した りするために用いる それは生存時間の多変量モデル解析です Cox比例ハザードモデルがあるじゃないか! ‑322・
‑
2
O
l
0
I
l t:H-~ー健全……ーシ
はじめに
多変量解析,重回帰分析・・・・
l
o
g
λ(
tI
z
)=
λ。
(
t
)+μ GE+βSEX+βDOSE+β叫 SEXLD
t
白
生
I
' 寝2
て
納
'
φ
曾
.
・
"
!
J
.
f
;
!
l
.
'
!
λl
0.83STG+0.71BORR+0.922A
GE‑0.19STGxAGE
0.114BORRxAGE
・0
.098xSTGxBORR
??
司
4ロ
例え l
ま,生存時間のリスクグループを共変量の条件で分けて予後が
良好,普通,悪いなどささつくり 3ク
、
ル ブに分けて解釈できないだろうか
そうし可場合サパイパルツリーは有用です
2
0
1
0
I
!純日』総会71Imi~JDiJ.,.&"I'I,-~:.t!,.;,":;,
サバイバルツリーとは
目的変数と説明変数聞の関係を樹形図であらわすツリーモデルに
生存時間データを目的変数とする方法
Step1.木を育てる(分岐)
Step2.育ち過ぎた木をメJ
Iり取る(努定)
Step3.リスクグループを作成する
ルートノードから各患者
のプロファイルをたどって
いくと予後予測ができる
J
土 巳
:
J
ロ日
日ぷ "己
‑323・
S
f
i
4
2
S
i
i
l
会fD'illJHEl…
ω.2010I
サバイバルツリーとは
サバイバルツリーの利点と問題点
・利点
①共変量の測定尺度についての制約がない
②結果を樹形図として表すことにより得られた
リスクグループの説明が比較的容易
(予後因子の二値化もできる)
LeBlancandCrowley(1992)
サパイパルツリーの方法に基づいたデータ解析を実施骨髄腫の試
験 SWOG82291こ適用
I昨日書 O$L;;zw.æ:9>>#btP.i~加
[IJl~
サバイバルツリーとは
・問題点
①SASでサパイ J心レツリー解析ができない・..
②分岐に使用する共変量の出現頻度が偏る(場合もある)
変監名
現ゆl
b
o
<
T
h
ホルモン拍療のイi
橿
且~
{目または皿)
<
J齢 (il)
"
'
'
"
'
"
凶t
〈
嘉
:
,
,
t".
'
1
'変量E田
l
u
¥
。
阻
J
6
a判 6
Jill~状睡
"=間匝曲。=間制後)
周到島サイズ(mm)
四描グレド
(1<且 <
I
I
I
)
雌性結節世{個)
プロゲステロン畳容体 (
f
エストロゲン畳容体(伝叫j
生存時 1
1
1
)
(
日
}
打、切り変量
。
回
,
05988
くO
曲1
。
α
J
O
l
l
く飢Xl
くO
国1
倒
。11
(O~ 打ち切り l~ イベント)
そこで....木の本数を増やしてみる!!=。改良方法「複数木作成」
‑324・
I‑ ザ』恥町三叫w ‑ D c 改良方法(準備) 盆 基本ツリー 1.第 3分岐まで行う 2 ノードの n lこ含まれるイベント数が全体の 5%未満になった時点で 分岐を終了する n o d e # O 第l 分厳 n αJ e#2 │ nn「汁 「十一… n 吋e # 5 n吋 e#7 n o d e # 8 n吋 e 岬 一 一 一 第2 分舷 n o d e尚 n吋 e#l O n 吋e # l l n 吋e #12 n αJ e# 1 3 n o d o # 1 4 1 1 t ; e s 除……干叫ら ‑ け D 改良方法のアルゴリズム(例:二本まで) 1 )集団全員を対象に第一木を育てる. 2 )第一木を表すダミー変数を作成する(第一木モデル). 3 )ダミー変数を調整因子としてモデルに含ませ,集団全員を対象に第二木 を育てる 4 )第二木を表すダミー変数を作成する(第二木モデル). 5 )得られた第一木モデルの SBC,第一木モデル+第二木モデルの SBCを それぞれ計算し, S BCが小さい方を最終モデルとして採用する 第一木 P"""_3~ 4 p 第二木 ま 。 λ( tl x ) =λ( t ) e x p ( s x ) λ(tlx, u J ) ニλ o( t )叫 ! X + @ 冨 : 木を表したもの= 調整因子 ‑ 3 2 5 ‑ h
結Sユーザー範会一白山J,-~,t~~:t
2~
改良方法 分岐(比例ハザードモデル)
第二木
第一木
λ(
t[
x
,
ω)=λ。
(
t)
e
x
p
(
βt
x
+
y
'ω)
λ(
tIx
)=λ。
(
t
)e
x
p
(
s
x
̲
)
ノ
HO=s=O
ニ値化後変数
HO=s=O
のスコア検定統計量が一番大きい
ものからI
J
頂に取り出し分岐
ニ値化後変数
!
のスコア検定統計量
第 木を夕、ミ一
変数表示(調室副
=調整済みスコア統計量
因子)
が一番大きいもの
第一木モデル
。
λ(
t[
ω)=λ (
t
)
e
x
p
(
Y
rωr+
Y
2ω2+…+Ykωk)
第二木モデル
,
λ(
t[
ω,
¥
1
1
)=.
i
u(
t
)巴Xp(Y/lJ +
Y
2ω2+…+
Y
kωk+'
h
,
l
¥ +勾2
¥
12
+…+Y
/m
¥
lm
)
11
a
l 以E--~付金町閉山~…シ
実データの適用例
Rのi
p
r
e
dパッケージに
含まれる GBSG2
データ
(
S
c
h
u
m
a
c
h
e
r
e
ta
l,1
9
9
4
)
を使用する
(さっきと同じです)
686
例の乳がん患者データ
を用いて得られた
グループ化とその条件を
示す
置世名
担明
国司
*,レモン拍般の有笹
(""または田1
年齢{歳}
問量状瞳
注o= M並~宝同羽 IH量)
層1lIサイズ(田宮)
棚田昌グレ ド
(
1<日<1lI)
旦E
nrOO$Ut
~""
l
P
I
e
‑
E生Z
E望空包
鶴 田C
COffi
.
.
.
n
"e
唱
r
o
・
5
8
vs 59
悶
7
3
r
o 3
2
)
'
1
15 5
9
悶
6
5
問
8
0
刊,
データセットの一部コ
プロゲステロン畳容体{白叫)
ヱストロゲン受容体〈色",D
't存時 I~j( n)
打ち切り置数
(0= 打ち出り l~ イベンド)
s
t
a
tt
S
t
!
et
r
;r
a
:
!epn泌鍋 p
r
a
c
r
e
c舗 trect.
,
lec
伺 s
P
I
ls
t 2
1
[
[
3
4
8
661814
1
2
[
[
7
6
1
772018
J5
1
1
9
5
2 271712
P
I
lH
1
7
[
[
4
G
J
291807
P
as
t 1
5
1
1
2
6
6
5 m
P
r
e 釘
1
1
1
2
4
0
1
3 8
拘 5t
8
1
1
2
1
8
1
02172 0
P
I
ls
t 1
6
r
t
I~
2
5
2
[
6
1 口
拘はお
"
お
o 59471
闘 閣
7
0
,・ 56
v
盟主畳堅生出i
拘s
t
拘s
t
醐 レ コ4
‑326・
,~置量C叫
イ
1
1
1
。
田36
0
.
4
4
6
0
.
5
9
田
く似'"
0αl
Ol
く依'"
'
0
く似通
0倒 1
1
仰I
│一一一竺三ζζ
実データへの適用例
E豊三三旦
第一木
SBC=3468.799
̲2
r 寸
門 門 門 門
r
"'企川
且 己L 寸
世
第一+二木
SBC=3453.013
oode=O
主亘耳とE
耳寸
γ
戸記~
1
1 if
た
﹁
一
門
山
一
SBC=3468.
4
5
1
戸出~
﹁
叫
門
州
第一+ニ+三木
L
r
I!!I会
実データへの適用例 ‑ 1本と複数の比較
(
r
p
a
r
t
) 結果
646(日)をカットオフ値と設定し
(生存時間の中央値)
予後良い・悪い群に振り分けた
予後が悪いリスクグループの因子条件
pnode>9のとき
1
.progrec~23
2
.progrec>23かつ horTh壬o
pnode三日のとき
1
.ptogrec~55 かつ horTh 孟 0
2
.progrec壬89かつ e
s
t
r
e
c語
。
3
.progrec>170 かつ age~37 かつ horTh 三日
R附 y)の結果
字
干
魚
狩
;
E
E
J
U
N
このデータ例での結果では一本木では出現しなかった
e
s
t
r
e
c,horThが予測条件に
従来型サパイパルツリーでは・..
組み込まれたことが確認できた
これらは単変量解析においても有菅トつト因子
死亡リスクの高いリスク因子の条件
ゃ ー ー
はpnode>3かつ progrec<=20 1i
(
e
s
t
r
e
cのp
i
直=0
.
0
4
1
1 horThのp値 =0
.
0
0
3
6
)
‑
3
2
7・
1 1 ヤザー総会一… SAS/PHREGを用いた処理 何をしなければいけないか まず一番最初の第一分岐はどの変数の どのカットオフ値かを特定しなければならない 伊l えl ま ・ ・ ・ ・ ・ ・ ・ ・ カットオフパターン数 性別:男,女 1 年齢 : 20‑60歳 4 0 腫療のサイズ : 0.1‑5mm 1 0 0 腫虜グレード・I. I, 3 血庄 3 0 5 0 LED値・ m E明司p l ‑ 3 I VC l 司p l‑ 4 g w . 司p l ‑ 5 g r o o p !‑ 6 =計2 0 0固くらいの 2群検定をやって統計量が 一番大きいのが第一分岐のカットオフ h |鈴~ー健全印刷I'EJ…t~,,~ 2 0 1[ J SAS/PHREGを用いた処理 分岐のための統計量 T群なら0, 2群なら 1という値をとるダミー変数を作成し 回帰モデルで2群検定を行うことができることを利用 分岐に使う最大のスコア検定統計量が一つのステップで求 められる PROCPHREGDATA=i n d a t a ; MODELtime*cens(O)=すべてのダミー変数/ SLE=0.99SELECTION=FORWARDSTOP=1 ; r u n ; H ‑328 ・
ゆ~付金印刷叩IJi叫 1 2 8 1 0 1 SAS/PHREGを用いた処理 分岐のための統計量 S A Sアウトプット N o t e :T h em o d e lh a sr e a c h e dSTOP=1 ̲ 17 i f i f # # 融 問 ふ 山 1 l I 1 ! ・ . . 主← ク 三 2D~,DI SAS/PHREGを用いた処理 2本目はどうしますか プロシジャのオプションをうまく利用する ①第一木グループのダミー変数を用意する ω=(ω1.ω2'" . ,ω k ) ' ② PROCPHREGDATA=i n d a t a ; MODELtime*cens(O)=ω+すべてのダミー変数/ SLE=0 . 9 9SELECTION=FORWARDSTOP=k+1 INCLUDE=k ; r u n ; 1 8 ‑329・
Sr!l..~ザー蝕町一
SAS/PHREGを用いた処理
2本目 SASアウトプット
ステッブ 1
.J
t
盈 ̲hor
Th1̲1を追加します。モデルは次の脱明 E監査含みます
J国 eHn̲1̲1聞 01m̲2̲1国 01
f
n̲3̲treo1m̲
4̲1聞 e
1
f
n
̲
5
̲
t
r
田 1m6 同 副 f
n
̲
7̲hor
Th1̲1
N
o
t
e
"
Them
o
d
e
lh
a
sr
e
a
c
h
e
dSTQP=8
Il尤推定量の分続
Il敏
自由度
パラメータ
推定
力
イ 2最
領皐
Pr)ChiSq
ハザー F
比
0027
鼠聾
t
帽 e
l
f
n1 It
民
3
.
6
0
6
5
0 0
.
4
6
5
2
3 6
0
.
0
9
5
5
<0001
廿 輔 1m2 11
‑
2
.
8
4
7
0
1
0
.
4
3
6
1
9 4
2
.
6
0
2
1
<
.
0
0
0
1
0
.
0
5
8
,廿車骨 I
m̲3 I1
‑
2
.
7
7
9
0
9 0
.
4
5
1
0
6 3
6
.
9
7
0
8
<
.
0
0
0
1
0062
一廿・・ 1
合,‑
4 I1
‑
1
.9
5
9
5
5 0
.
4
3
7
8
8 200265
<
.
0
0
0
1
0141
‑
'
問
。 1fn̲5 I1
凹
238794 047522 2525
<0001
0
.
0
9
2
t
聞 a
l
f
n6 It
0
.
5
1
8
0
8
1
.
08645 0
.
2
2
7
4
0
.
6
3
3
5
1
.8
7
9
開園 1
m7 I1
t
ー
1
.
2
3
3
4
0 044424 7
.
7
0
8
1
0
.
0
0
5
5
0
.
2
9
1
horThlJ I1
.
1
2
6
0
4 8
‑0.
3
6
2
1
3 0
.
2
5
5
2
1
0凹 4
0
.
6
9
6
I l lmI
直披増加法の要約
)
.
'
t
'
.
1
1 闘の
追加
,
l
.
h
oThlJ
取勘定
蹟
I
8
力
イ2.
I
834凹
… 刷
I
00039
1
9
W
I
D
J
~ユーザー総会7:tIR7f~JD:;-&1'I,-l-sン蜘加
SAS/PHREGを用いた処理
本数を決める
第一木モデル,第二木モデル及び第=木から
それぞれの情報量基準 S
BC
(
S
c
h
w
a
r
z1
9
7
8
;J
u
d
g
ee
ta
.
l1
9
8
0
)よ
り
小さいほうを最良モデルとして木の本数を決定する
モデルの適合度統計量
MODELt
i
m
e• c
e
n
s
(
O
)=第一木グループダミー変数;
基準
共変量
共変量
MODELtime c
e
n
s
(
O
)=第一+二木グループダミー変数;
t
J
.
し
あ
り
MODELtime c
e
n
s
(
O
)=第一+ニ+三木グループダミ一変数;
2LOGL 3576.346 3428.896
金
金
自
A
I
C
S8C
‑
3
3
0・
3576.346 3442.896
(
3
,g
3576.346 1 468.79
一
I 鮎t.~jー蛤………
←
:
竺
D
まとめ
》サバイバルツリーは見た目に解釈しやすい有用な方法
》しかし因子の抽出が十分ではない=辛改良方法を提案
~ SASの PHREG
プロシジャをうまく用いることで分岐特定
や本数決定が容易にできる
今後の課題など
》改良方法に関して
シミュレーションによる予測精度の評価(目下検討中)
》データ解析に関して
複数木作成による結果のグループ化はやや面倒な作業
でもあるのでツール化できれば実用性も向上する
"
|紘~付金一……
281~
付録
得られた樹形図に基づくグルーフ化
第一木グループ及び第二木グループの全ての組み合わせにより
最終グループとする.
この例では
何
.
,
n
l
.
' o
m
l
l
n
I‑
4 貯白血 I.~
n
l.
t
.
.
.
.
.
̲
,
.
. .
.
.
.
.
.
.
.
‑ .
.
.
‑
.
.
.
.
‑ .
.
.
.
‑
,
町 国
g
r
。
叩2
‑
1
(
I
f
'
D
¥
4
)2
‑
2
g
m
.
.
悼 3 grwp
2
‑
4
F 叩2‑6"""匝?
第一木モデルでの最終グループ 6グループ
第二木モデルでの最終グループ 6X7~2グJ レープ
予測方法
ある対象患者 Lさんが属するグループの生存時間
(力プランマイヤ一法 )
1こ基づいて予測を行う
最終グループi
のS
;
(
t
)を求め
刻、}<0
.
5 →悪い
e
S
;
(
t
o
}と 0
.
5 →良い
※t
。は研究の目的によって自由に与えられる
‑
3
3
1・
問1
D
付録
※第一木と第二木のターミナルノードからグループ化を行うイメージ
第一木
第二木
#忌戸ふ
c>
宮訳.
3
S~..,. CS‑.i:I健全……ω
[iJl~
付録二値化変数作成サンフルプログラム(ひとつの変数例)
/吋直のバリエーションを抽出合/
/
*
2群フラグをカットオフあるだけ作成V
procfreqdata=data1n
o
p
r
i
n
t
;
datatemp3;
byk
e
y
a
l
l
;
mergedata1d
a
t
a
3
;
byk
e
y
a
l
l
;
t
a
b
l
e
s&
v
a
r
./out=f
r
e
qd
a
t
a
2
;
r
u
n
;
/*績にするワ
a
r
r
a
yc
o
l
{勺x
&
v
a
r
.
:
;
proctransposedata=data2
a
r
r
a
ytempf{ &var.̲1‑̲&var.̲&obs.;
o
u
t=data3p
r
e
f
i
x=x
&
v
a
r
.
x
;
byk
e
y
a
l
l
;
doi
=
1t
od
i
m
(
t
e
m
p
f
)
;
var&
v
a
r
.
i
f .<&
v
a
r
.<=c
o
l
{
i
}thent
e
m
p
f
{
i
}
=
r
u
n
;
i
fc
o
l
{
i
}<&
v
a
r
.
thent
e
m
p
f
{
i
}
=
1
/
りt
リエーション数をマクロ変数に格納 V
e
n
d
;
procc
o
n
t
e
n
t
sdata=data2(keep= x
&
v
a
r
.
:
) dropx
&
v
a
r
.
:
;
out =̲tempn
o
p
r
i
n
t
;
r
u
n
r
u
n
data n
u
l
l
s
e
t̲tempend=e
o
f
;
i
fe
o
ft
h
e
n
c
a
l
lsymput("OBS",
compress(put
しN,
一b
e
s
!
.
)
)
)
;
r
u
n
;
4
'
つ
‑332・
I 郷三一今日信……叫ん 付録 γ 十 円 l 1 i J [ I J PROCPHREGのモデルステ トメントの右辺に 指定する変数文字列の作り方のサンフルフロクラム f全変数情報を取得ワ procc o n t e n t sdata= master data2(keep= varnumname)n o p r i n t ; o u t= r u n ; = a t a 2 ; procs o r tdata d byvarnum; r u n ; I * & v a r l i s tマクロ変数にブランク区切りで変数の文字列を作るワ procs q ln o p r i n t ; s e l e c tname , i n t o :v a r l i s tseparatedby, fromdata2 r u n ; q u i t ; . ; %put& v a r l i st I m 日喰‑仇冷I ふ ん h 十 F ケ D 参考文献 [ 1 ]LeBlanc,M.,andCrowley , J .,Relativer i s kt r e e sf o rcensoreds u r v i v a ldata, B i o m e t r i c s( 1 9 9 2 ) . [ 2 ]M.Mizumoto,H .Harada,H .Asakura, T .Hashimoto, K .F u r u t a n i,H .H a s h i i, T . Takagi,H .K a t a g i r i,M.Takahashi, T .Nishimura, P r o g n o s t i cF a c t o r sanda ScoringSystemf o rS u r v i v a lA f t e rRadiotherapyf o rMetastasest ot h eS p i n a l Wiley( 2 0 0 8 ) Column, [ 3 ]M.Radespie トT rogeにT .Rabenstein,H .T .Schneider,B .Lausen,Comparisono f A r t i f i c i a l t r e e ‑ b a s e dmethodsf o rp r o g n o s t i cs t r a t i f i c a t i o no fs u r v i v a ldata, I n t e l l i g e n c ei nMedicine( 2 0 0 3 ) . 1NGTSAI,Tree‑augmentedCoxproportionalhazards [ 4 ]XIAOGANGSU,CHIH‑L B i o s t a t i s t i c s( 2 0 0 5 ) models, .,Crowley,J . [ 5 ]C l i n i c a lT r i a l si nOncology , SecondE d i t i o n .Green,S .,B e n e d e t t i,J CRCPress,LLC( 2 0 0 3 ) . [ 6 ]生存時間解析 ‑SASによる生物統計大橋靖雄,浜田知久馬東京大学出版会 [ 7 ]Cox比例ハザードモデル中村剛朝倉書庖. 26 ‑333・
拡張二変量順位和統計量を用いたクロスオーバー臨床試験における 薬効比較法の SASマクロ )1口 淳 久留米大学バイオ統計センター SASMacrof o rA p p l i c a t i o no fE x t e n s i o n so fB i v a r i a t eRankSumS t a t i s t i c st ot h eC r o s s o v e rD e s i g nt oCompare TwoT r e a t m e n t s A t s u s h iKawaguchi B i o s t a t i s t i c sC e n t e r , KurumeU n i v e r s i t y 要旨 本発表では Kawaguchie ta l .( 2 0 0 9B i o m e t r i c s )におけるこ変量順位和統計量を拡張した方法をクロスオー バー臨床試験データ解析に応用するための SASマクロを紹介する.はじめに方法論の説明を行う.概要 は以下のようである.眼科領域の臨床試験が研究の動機となっており,デザインは試験薬を T,プラセ ボを Pとした場合, T : T , T : P , P : T ,P : Pの 4処置系列群をもっ 2剤 2期クロスオーバーデザインであり,左 目,右目の順に処置が行われる.それぞれの側別々に 2組の処置系列群を比較するためにウィルコクソ ン順位和統計量を用い,左右の相聞を考慮、してこれらの統計量を平均する.この際の 2組の処置系列群 においては例えば T と Tの比較など同ーの効果が見込まれるものも含まれ,この同一であるという事を 表す線形モデルを構築した上で重み付き最小二乗推定量の形で、統計量の平均が行われる.この平均され た統計量を基に薬効比較に関する仮説検定が行われる.またモデルの適合度を測る統計量も導出される. シミュレーション研究が行われ,合理的な第一種の過誤を持つこととある状況下では先行研究の方法よ り高い検出力を持つことが確かめられる.次に SASマクロの使用方法を実際のデータへの適用により解 説する.マクロ及び適用データは B i o m e t r i c sのホームページから入手可能である.入力引数はデータセ [を表すインデックス変数名である. ット名,アウトカム変数名,処置系列を表すインデックス変数名,倶J マクロでは始めに PROCRANKによりアウトカムの側別の順位が算出され,次に重み付き最小二乗推定 量が SAS江MLを用いて算出される.薬効比較のためのカイ二乗統計量と p値が出力され,薬効の比較 が行われる.また,モデルの適合度をみるためのカイ二乗統計量と p値も出力される. キーワード:Balaamデザイン,対応のあるデータ,無作為化臨床試験,ノンパラメトリック共分散分析, 重み付き最小二乗推定量, IML ‑ 3 3 5・
はじめに 本論文ではKa waguchi, Koch, andRamaswamy( 2 0 0 9 )において開発された拡張二変量順位和統計量の SASマク ロを紹介する.表 lは本研究の動機となったデータであり,先行研究である Rosner ,Gゆm,andLee( 2 0 0 6 )にお いても方法の説明のために用いられた. 表 l 眼科領域における無作為化臨床試験における重症度スコア 側毎の処置系列群 T : T 被験者番号 左 T : P 右 P : P 左 右 左 右 左 右 3 3 3 2 2 3 3 2 。 3 3 3 2 . 5 2 2 2 . 5 1 . 5 2 3 1 . 5 2 1 . 5 2 . 5 2 . 5 0 . 5 1 . 5 2 . 5 2 2 2 . 5 2 3 3 2 3 2 2 2 3 2 . 5 2 2 . 5 3 3 2 . 5 3 4 2 2 3 5 2 2 . 5 6 0 . 5 2 7 8 P : T 9 1 0 2 2 . 5 0 . 5 。 1 1 1 . 5 2 . 5 2 . 5 2 . 5 1 2 2 3 2 . 5 3 . 5 1 3 3 3 1 4 3 2 . 5 3 0 . 5 2 . 5 2 . 5 この例は眼科領域における双方性クロスオーバー臨床試験からのもので,試験薬を T ,プラセボを Pとした 場合,処置系列群として T : T , T : P , P : T , P : Pをもっ.またこの処置の[ J 慎は左目,右目の順に相当する.このよう 1 9 6 8 ),J o n e sandKenward( 2 0 0 3 ),上坂 なデザインは一般に Balaamデザインと呼ばれる.詳しくは Balaam( ( 2 0 0 6 )を参考にされたい.反応変数は眼の重症度を表すスコアであり,良い方から 0,0 . 5,1 ム lム 2.0,2ム 3.0 の順序変数である. Rosnere taJ .( 2 0 0 6 )はこのデータにおいて 2段階無作為化に基づく両方の眼における相関 を考慮した方法を開発した.Kawaguchie ta J .( 2 0 0 9 )に指摘されてあるように,この方法は潜在的な左右の違い を考慮する事ができず,また片側において効果が等しく期待できる群の組を考慮することができない.これ に対し Kawaguchie ta J .( 2 0 0 9 )では,両側別々に反応変数の順位をとり,効果が等しく期待できる群の組はそ の順位平均の差が 0であるとしづ制約の下,順位平均の差を用いて Tの Pに対する効果を調べる方法を提案 した.本論文の目的はこの方法を実行するための SASマクロの使用方法を表 lのデータへの適用を基に紹介 i o m e t r i c sのホームページ ( h t ゆ: / / w w w . b i o m e 凶c s . t i b s . o r g/)から する事である. SASマクロと表 1のデータは B ダウンロードできる.本論文の残りの構成は,方法の節において Kawaguchie ta . I( 2 0 0 9 )の方法の説明を行い, その次の節においてシミュレーション研究を紹介,そして SASマクロの適用方法を解説する. ‑ 3 3 6 ‑
方法
i=1,
2,
3,
4でそれぞれ処置系列群 T:T
,
T:P
,P:T
,P:Pを表すインデックスとする.また j=1,
2でそれぞれ左側,
右側を表すインデックスとする.これは処置順にも対応する.すなわち j=1が第 1期
, j=2が第 2期である.
:{=lni で試験全体での被験者数を表す.
k= 1
,
2
,
…
,n
iで i群にn
i人いる被験者のインテ子ツクスを表す. N=l
Y
i
j
kで I群 j側における k番目の被験者の反応変数を表す.Ri
被験者は無作為に 4群に割り付けられるとする '
j
k
を全被験者の j側においてとられた反応変数の順位のうち ,1群の k番目のものとする.タイには中間順位を
に対するコンセプトモデルを次に示す.
用いられる.この{Ri
j
k}
i= 1 (
T
:
T
)
iニ 2 (
T
:
P
)
i= 3 (
P
:
T
)
i=4 (
p
:
p
)
jニ 1 (左側)
μ1+τ
μ1+τ
μ
1
μ
1
]ニ 2 (右側)
μ2+τ
μ
z
μ2+τ
μ
z
(
1
)
このモデルにおいて μ
1は左側における Pの位置パラメーターであり, μ
zは右側における Pの位置パラメータ
ーである.今は順位{Ri
を考えているためμ
1及びμ
zは統計学的には意味を持たない.よって一般性を失うこ
j
k}
となくこれらは任意であると考えられる.また τは T と Pの効果の差を表すパラメーターである.帰無仮説 H。
k
a
1
・
W
a
l
l
i
s検定統
はτニ 0,すなわち ITと Pの効果が等ししリである.この検定においては,二変量のKrus
u
r
ia
n
dSen,1
9
7
1
) が基本となる.以下にこの検定統計量の導出を行う.
計量 (Kocha
n
dBhapkar
,1
9
8
2
;P
頁j
i={
l
:ι1Rijk!ni(N+1)} をi
群]側における標準化順位平均とする.これらを要素としてもつベクトル
夏=(頁 11'R
1
2
'R
2
1
'R
2
2
'R
3
1
'R
3
2
'R
4
1
'R4
'
のH。の下での分散共分散行列V
,o
:
R は被験者の各群への無作為割り付
2)
けに基づき次のような形で与えられる(一般論としては Koche
ta
,
.
11
9
9
8を参照されたし、).
二
%
引d叫1
:
'
2
:
'
3
:
'
J
:‑
~ 14吋
VR
:.
o
(
2
)
ただし②は左クロネッカー積を表す(左側の行列が右側の行列の要素毎にかけられる). diagはその要素を対
角成分にもつ対角行列であり, 1
4は全ての要素が lの (4X1)ベクトルである. V
.
。
は H。の下では既知の有限
,
j
'
)
要
素 Vjj叫ま次のように与えられる .
母集団における (Ri
Ri
1
k,
2
k)の分散共分散行列であり,その U
.
.
‑
‑
、
.
.
.
.
.
, /H̲.,,‑
、
, ,
τ
t ~I r.
、
]山=) ) ドILL‑0.5)保 土 土 ー 0
.
5)
/
(
N‑1)
ムd ム...¥N+1 ‑‑J¥N+1
I
次に i= 1
,
2,
3群の標準化順位平均(頁i
1,
Rρ とi=4群の標準化順位平均(R4
R4
を比較するためのベクトル
1,
2)
をd= (R11‑ R
4
1
'R1
4
2
'R2
4
1
'R2
1‑R4
R
3
2‑R4
'と定義する.この行列表現はd= CoR
2)
1‑R
2一頁仙頁3
1,
2‑R
12 ② (
‑13)}でーあり, I
tは (
tXt
) の単位行列である.無作為化に基づく H。の下でのdの
である.ただしCO = {
13,
分散共分散行列はVd,
O= CoV
,o
:
RC
bとなり,展開すると次式のようになる.
(
1111¥ 1
)
Vd
一,一, -I+-131~f
O=Vo ② ldiag[
~
‑¥
n1n
2n
3/ n4 ‑
)
tこ対するこ変量Krus
k
a
1
‑
W
a
l
l
i
s検定統計量はQoニ dFVJJdと与えられH。の下では
こうして帰無仮説Ho:τ=o
もは漸近的に自由度 6のカイ二乗分布に従う. QoはH。に対して有効な検定統計量であるが,コンセプトモデ
ル(
1
)において T と Pを比較するにはτ
iこ関する自由度 Iの比較になり,自由度 6のもは潜在的に検出力が劣
ると考えられる.これに対し, Kawaguchie
ta
1
.(
2
0
0
9
)ではより検出力の高いと考えられる方法として,側毎に
4群からの 2組に対する Wi1coxon順位和統計量を構成し,効果が等しいと見込まれる 2組に関しては制約を
設けた上で,統計量の平均をとる方法が提案された.この方法はもを自由度!と 5の統計量への分解に対応
する.次にその方法を説明する.
‑337‑
Q。の分解
始めに 2つの統計量F1とF
zを次のように定義する.
頁11+nZ
F1ニ {
(
n1
RZ
)
}一{
(
n
3頁3
1+n
4R
4
1
)
/
(
n
3+n
4
)
}
/
(
n1+nZ
1)
頁1
Z+n
3R
n)/(n1+n3)}一{(nz頁z
z+n
4R
4
Z
)
/
(
n
Z+n
4
)
}
F
z= {
(
n1
ともに T と Pの比較を行うための Wilcoxon順位和統計量であるが. F1は左側(
)に対し. F
zは右側J(
j= 2
)
j= 1
に対するものである.次に 4つの統計量 F
3
'F
4
'F
5
'F
6を次のように定義する.
F
3= (
R11‑ RZ
,F4ニ(頁 3
1‑R
,F
5= (
頁1
Z‑Rn),F
6= (
頁z
zー頁 4
Z
)
4
1)
1)
F
3とF4は左 f
J
l
.
l
J
(
j= 1
)における,むと F4は右側(
)における同じ処置がされる群同士の比較のための統計量で
j= 2
ι
(らら, f4,f5,f6)'を構成する.ただし
ある.次にこれらを用いた T と Pを比較するためのベクトノレf=
ι =(
F1+Fz)/2ι=(
F3+F4+F
5+F6
)
/
4
九二 (F3+F4‑F5一F6)/2
f
3ニ (
F1一F
z
)
ら=(F3一F4+F5一F6)/2
先ニ (
F3‑F4一F
5+F6
)
九については T と Pを比較する統計量の左右に対する平均である.f
zは T:T群と P
:
P群より T と Pを比較する
統計量の左右に対する平均と T:P群対 P:T群として TとPを比較する統計量の左右に対する平均の差である.
ι
は左側(j= 1
)での T と Pを比較する統計量と右側(j= 2
)での T と Pを比較する統計量の差であるι
.は T:T
群対 P:P群として T と Pを比較する統計量と T:P群対 P:T群として T と Pを比較する統計量の差の左右に対
5とらは ι,
f
,
f
,
f
6が互いに直交するように作られたものである.これらのうち hだけがτに対
する差を表す. f
4
5
する統計量であり,残りは 0であることが期待される.このことより次のような線形モデ、ルを考える.
f~ [
10000Ol
'b= xb
(
3
)
だたし 会"は 左辺は右辺より推定される"を意味しており. xはデザイン行列, bは調整済みのτの推定量
と見ることができ重み付き最小三乗法によって求められる.そのために以下にf
の分散共分散行列を導出する.
fをdからの線形変換f= Adとして表す.ただしAは次のような (
6x6
)行列である.
n1
nz
n1
) 2
(
n
1+n
z
) 2
(
n
1十 n
z
)
2(n1+nz
nz
4
)
2
(
n
z+n
n3
n
3
2
(
n
3+n4
) 2
(
n
1+n
3
)
0
.
2
5
‑0.25
0
.
2
5
0
.
2
5
‑0.25
n1
n1+nz
nz
n1+nz
n
z
nz+n4
n3
n3+n4
n1+n31
0
.
5
‑0.5
‑0.5
‑0.5
0
.
5
0
.
5
0
.
5
0
.
5
‑0.5
0
.
5
‑0.5
0
.
5
1
‑1
‑1
1
‑1
1
0
.
2
5
n1
A = In1+nz
すなわち f=Ad= AC。誌であるので
n
3
(
4
)
H。の下での無作為化に基づく fの分散共分散行列は (
2
)式の VR.
Oより
Vr
.
VR.oC~A' と与えられる.こうして線形モデル(3) における重み付き最小二乗推定量は次のようになる.
o= ACo
b= (x'Vr~lx)一1 x 'v.ふ1f=h-v;40VJg
の
の部分行列であり ιとgの共分散ベクトルで、ある.また V
ただし g=(らち, ι,
f
,先)'であり, v
i
,
s
oはVr
.
,
goもVr
.
o
o
5
部分行列であり gの分散共分散行列で、ある . H。の下で、の無作為化に基づく bの分散共分散行列は
Vb
,
o=(xFvdx)‑1=(vωviuviJV1u)
のHoの下でらの分散である.帰無仮説 Ho:τ=0
となる.ただし V
f
.
1
.
0はf
'こ対する検定統計量は
1
Qb= b
Z
/
V
b
.
O
として与えられ,漸近的に自由度 lのカイ二乗分布に従う.このもが Kawaguchie
tal
.(
2
0
0
9
)で提案された検
‑338・
定統計量である.またも=Qb+もともは 2つの統計量に分解される. Q1はH。の下では漸近的に自由度 5の 3 )の当てはまりの良さを測る指標であり次のように与えられる. カイ二乗分布に従う線形モデル ( Q1ニ (Qo‑Qb)= ( f‑xb)'vr~l(f ‑xb)= g'viJg この一連の方法についての一般的な詳細は KochandBhapkar( 19 8 2 )を参照されたい. Qbに対し gの調整なしの統計量も考えられ,それはもv eとして次のように与えられる. Q a v e= f f l v f , ω ただし Vf, l, O= C~ve V r , oCa 1, 0, 0, 0, 0, 0 ) 'である.この統計量も H。 の v eであり f v e= ( 1のHoの下での分散であり, Ca 下で漸近的に自由度 lのカイ二乗分布に従う.この統計量は両眼の相関が考慮されていない. vb, Oは明らかに v r , l, oより小さくもの方が Q a v eより検出力が高い事が期待される.このことについては後述のシミュレーシヨ ンにおいても確認される.また各群のサンプルサイズが等しく ( n1= n2= n 3ニ n4 = n ),反応変数にタイが無 い場合,統計量 QbとQaveは次のように簡略化することができる. Q2n( 九‑P ) 2 ~ 2nf{ Of 2 b=vo(1‑pi)'Qave=ττ ただし Vo= Vl O= V2 2 l, か POニ V1 O/V 。である.この式からわかるように 1‑ P5が単純に f 2, 1を用いるより bを用 いた場合の分散の縮小度合を表しており,相関が強まると縮小度合が高まる傾向にあることがわかる. また別の統計量として次のようなも q uも考える. Qequ= (C~qUd)2 /C~qu Vd , oCe q u 1 ,, 11, ‑1, ‑ 1 ,1 ) 'である. QequもHoの下で、漸近的に自由度 lのカイ二乗分布に従う. Ce 4 ) ただし Ce q u= ( q uは( 式のAの 1行目の要素の絶対値を lにした場合に対応する.よってこの統計量はもv e同様に T と Pの比較を : Pや T:P対 P:Tから平均して行うが,それぞれ重みを等しくとっている事になり, Q a v eで 両側における T:T対 P はサンプルサイズに比例した重みをとっている事になる. 本論文で紹介する SASマクロではこれら 4つの統計量 Qb,Q 1 'Q a v e,Qequ及び対応する p値が出力される. シミュレーション ここでの目的は第 l種の過誤と検出力を調べることである. 2変量の正規乱数を用いて 4群問では同ーの分 0, 2, 0. 35, 0 . 5, 0 . 6 5, 0 . 8を考える.コンセプト 散共分散を仮定する.両側における分散は lにし,相関は P= 0, 1 =0,1 1 2 =1 ,τ=0 として第 l種の過誤, τ =0 . 7 として検出力を調べる.サンプルサ モデル(1)において, μ イズは次のような 3パターンを考える. パターン 1 パターン 2 パターン 3 n p= n1= n4 = 16, n c= n2= n 3= 8 c= 12 n p= n1= n2= n3= n4 = n n p= n1= n4 = 8, n c= n2= n 3= 16 ただし npが T:T群と P : P群のサンプルサイズ, n cが T : P群と P:T群のサンプルサイズを表す.またすべてのパ ターンにおいて N = : L{=1ni =48である.各 N =48のデータに対し,統計量 Qb,Qave' Qequを算出する.また Rosnere ta . 1( 2 0 0 6 )の検定統計量Z cを算出する.そして各々の統計量から p値を計算し, p : : ;0 . 0 1であれば 1 , p >0 . 0 1であれば 0としづ定義変数に変換し, 1 0, 000回の繰り返しのあとにその値を平均して第一種の過誤 及び検出力の推定を行う. 8通り ( pが 6通り×サンプルサイズが 3通り)の第 l種の過誤が計算されたが,そ 結果として Qbに対して 1 0 . 0 0 8 8‑0 . 0 1 0 5 ) であった.これは 1 0, 000回の α =0 . 0 1のシミュレーションに対する両側 95% 信 の範囲は ( ‑ 3 3 9 ‑
頼区間の幅I̲2V
在
百1/100=0
.
0
0
2とほぼ同じである.この事は他の統計量にもあてはまり, Q
a
v
eに対しては
(
0
.
0
0
8
3‑0
.
0
1
2
0
) であり, Qequで1
ま (
0
.
0
0
7
8‑0β120) で、あった.図 1の上段には第一種の過誤の結果を図
示している. Qb,Qave,Qequに関してはどの場合でも水準 0βlをほぼ保っている.しかし Z
cに対しては大き
cが左右の差異 (
μ
1=0,1
1
2 =1) を考慮していないためだと考えられる. Kawaguchi
く下回っている.これは Z
e
ta
.
l(
2
0
0
9
)でおは仇 =0,μ
2=0とした場合の結果も載せており,この場合には Z
cは 0
.
0
1水準を保っている.図
1の下段には検出力に関する結果が図示されてある.検出力は (
0,1
)の範囲にばらつくので 1
0,
000回のシミュ
I
J
9
5
%
信頼区間の幅は士 2'
‑
'
0
.
2
5
/
1
0
0 =0βlとなり,結果はほぼこの範囲内で あった.
レーションにおける両似.
Qbは他の統計量と比べて相関が強まるにつれて検出力が高くなっていることがわかる .QaveとQequに関して
は(
np
'
n
c
) =(
16,8
)のときには相関が強まるにつれても veの方が検出力が高くなり, (
np>n
c
) =(
8,1
6
)のときに
は逆に Qequの方が検出力が高くなる. (
np,
n
c
) =(
12,1
2
)のときにはこれらの統計量は等しくなるので,全く同
じ結果になっている.
(
1
2,1
2
)
2
4
4
4
今
(
8,
1
6
)
計一一 ~-::=':=-"=-l'':':':':':':'':.t
今・-"ー t.=τ台ττ2 士士士~.l
t
一一ー喧一一‑;z‑.
『 … … 刊 日 目
マ
︒
︒
︒
︒
︒
︒
︒
a
h
L
F
O
﹄ヒ
凶‑﹁ @
NFoomooo
(
1
6,
8
)
2
g ~ ~'ì一一 '-1~'l に i
~ ~ ~4
~ ~
E
0
.
2
0
.
3
5
0
.
5
0
.
6
5
呂
0
.
6
0
.
3
5
0
.
2
C
o
r
r
e
旭1
1
0
0
.
5
./'
2イ.‑‑‑‑‑‑‑‑‑
6色
4
0
.
6
Co~凶 110 門
0
.
6
5
0
.
6
.
‑
ー
ー
ー
ー
‑
,
‑
‑
‑
‑
‑
‑
‑
‑
'
gfJ2//l//i2
︒
凶 O
0
.
6
5
﹄@逮
‑j‑
0.己‑<
"'
0
.
5
(
8,
1
6
)
•̲
̲
̲
̲
̲
̲
̲
̲
包=寸‑‑‑'
図.‑‑‑‑‑‑‑‑
Eこ
H一
一
.
‑
‑
‑
‑
‑
‑
‑
‑
‑
'
0
.
5
0
.
3
5
Co ~e 凶tion
OFao 図O N O @
oa
﹄@主
@
︒F m o e o h o︒
師
︒
‑I
0
.
3
5
0
.
2
(
1
2,1
2
)
(
1
6,
8
)
0
.
2
0
.
6
Co門@凶t
悶 n
門
:
一
:
:
つ
0
.
6
5
1
0
.
2
0
.
3
5
0
.
5
0
.
6
5
0
.
6
0
.
2
0
.
3
5
0
.
5
0
.
6
5
0
.
6
c
o
庁e凶 t
i
o
n
Co~旭Uon
図 1 シミュレーション研究の結果.第一種の過誤(上段)と検出力(下段).横軸は相聞を表す.各線
は l=Qb,2=Qave'3=Qequ,
4=Zcである.各国の上側はサンプルサイズが (np,
n
C
)という形式で表示されてある.
またKawaguchie
ta
.(
l
2
0
0
9
)では次のようなモデルに対するシミュレーションも行われた.
i= 1 (
T
:
T
)
i= 2 (
T
:
P
)
i= 3 (
P
:
T
)
i= 4 (
p
:
p
)
jニ 1 (左側J)
μ1+τ1
μ1+τz
μ
1
μ
1
j= 2 (右側J)
μ2+τ1
1
1
2
1
1
2+τ2
1
1
2
すなわち, Tと Pの比較がT:T対 p
:
pと T
:
Pまたは P
:
T対 p:pで異なる場合であり,それぞれのパラメータ
τ
l
'
τ
2
)
=
(1
,0.
4
)
,(
0.
4
,1
)として他のパラ
ーを τl'τzとしている.このときの帰無仮説はτ1‑τ2= 0を考える. (
メーターは前述のものと同じ設定が考えられ,統計量Qb,Qave,Qequに対する検出力が比較された.どの統計
.
7以上とし、う合理的な検出力を持つが, (
τ
l
'
τ
2
)
=(
1
, 0.4)においては Qbは他の 2つに比べて低い検出力を
量も 0
示し, (
τ
l
'
τ
2
)
=
(
0,
4
.1
)の場合で、は逆にもの方が高い検出力を示した.
‑340・
SASマクロとその適用例 本節では前節までの方法を SASで実行できるマクロを紹介する.はじめにマクロの入手は, B i m e t r i c sの HP .bi Ol 1 1e t r i c s .t ib s .o r e!/)から行う.その HPの左側のメニューから I P a p e rI n f o r m a t i o n J に進み ( 1 1 t t p : i / W¥VW I S u p p l e m e n t a r yM a t e r i a l s J に進む. IVo. l6 5, No.3S e p t e m b e r2 0 0 9 J に進み,論文タイトル I A p p l i c a t i o n so f 侃 t e n s i o n so fb i v a r i a t er a n ksums t a t i s t i c st ot h ec r o s s o v e rd e s i g nt ocomparetwot r e a 位l e n t st h r o u g hf o u rs e q u e n c e g r o u p s J をクリックすれば I D a t aa nd/o rComp 叫t e rCodeJ とし、うリンクから z i pファイルにまとめられたマク i pファイルを解凍したフォルダ内には SASマクロ (EBRST2008凋 s ), ロを含むファイル一式を入手でLきる.z 適用例ファイル ( E x a m p l e . s a s ),表 lの SAS用データ ( e x a m p l e d a t a品 s 7 b d a t ) が含まれており,ここではこ ta . l( 2 0 0 6 )の方法の れらのファイルを使った適用例を説明する.フォルダには他にも R用の関数や Rosnere SASマクロも含まれている.ファイル IEBRST2008.sasJ のマクロ EBRST2008を表 1のデータに適用する ためには E x a m p l e . s a sの中身を実行すればよい.この中身を順に説明していく.その一部は表 2のようにな a m p l e d a t a . s a s 7 b d a t J を読み込む部分である. l i b n a m eの設定は各 っておりデータ保存場所から SASデータ「は. ユーザーによってデータ保存場所を指定する必要がある. Example品 S では筆者の保存場所が指定しである. 表 2 Example.sasの中身(その 1) 1 * * *S p e c i f シt h eL o c a t i o nofDataS e t* * * 1 l i b n a m eI b' C :¥DocumentsandS e t t i n g s ¥b c l u s e r ¥MyDocuments¥s o丘w a r e ' ; 1 * * *ReadDataS e t* * * 1 d a t aむn p ;s e tI b . e x a m p l e d a t a ;r u n ; データフォーマットは表 3にあるように 4群 T:T , T : P , P:T , P : Pを表す変数 s e qと反応変数を表す r e sと傾. I J ( 時 期)を表す p e r i o dとし、う 3列から成る. s e qの入力のように群は 1 , 2,3, 4に変換される必要がある.これは方 法の節の i= , 1 2, 3 , 4 tこ対応する.また p e r i o dも 1 , 2と変換される必要がある.これはj= , 12 tこ対応する. 表 3SASデータ I e x a m p l e d a t a . s a s 7 b d a t J の中身(上から 3行と下から 3行) OBS seq res period l 2.0 2 2 1 .0 2 3 2.0 2 80 4 2.0 8 1 4 2.0 82 4 円〔 ‑341‑
次に Example品 S の中の表 4に対応する部分を実行する.これはマクロファイル IEBRST2008品 s J を読み込 みそれを実行する部分である.ここにおいてもマクロファイル IEBRST2008.sasJ の保存場所を各ユーザーで、 指定し直す必要がある.マクロの引数はカンマ区切りで,データセット名 (tmp),反応変数名 ( r e s ),群を表す s e q ),側を表す変数名 ωeriod)となっている. 変数名 ( 表 4 Example.sasの中身(その 2) /材*RunMainM ethod* * * / %include' C :¥DocumentsandS e t t i n g s ¥b c l u s e r ¥MyDoc山 田n t s 1 ) ! s o合war e 1 ) ! E BRST2008.sas'; %EBRST2008(tmp, r e s, s e q, p e r i o d ) ; マクロ EBRST2008の概略は次のようである.はじめに RANKプロシジャにおいて byステートメントに period を指定して側毎の反応変数の順位を計算する.次に MEANSプロシジャにより c l a s sステートメントに s e qと p e r i o d を指定して,群毎に側別の順位の平均を求める.方法の節において統計量の算出が行列演算を用いて ι に読み込む事により統計量の算出ができる.これらの順 行えるようにまとめているのでこの順位平均を m 位は各サンプルサイズ +1で除算され標準化され頁ニ CRll, R1 R Z 1 'R z z 'R 3 1 'R3 R 4 1 'R4 Z' Z' Z)'が計算される. Qb= bZ/Vb.O を算出するには f と Vf• O が必要になるが , f はf= Ad= ACoRという行列演算により貢から計算する. また Vf• O ニ AC o Vïï.oCbA' より Vf• O を計算で、きる.ただし Vïï.O は順位R ijk から計算される VO を用いるため IML には この順位も読み込まれる .IMLのクロネッカー積演算子である@を用いて計算を行った.こうして b及び V b . Oが 行列の積及び逆行列演算により求められる.これらより統計量が計算され,それと対応する自由度から PROBCHI関数を用いて p値が計算される. この SASマクロを実行した結果,出力は表 5のようになる l列目は統計量名, 2列目は自由度, 3列目は計 算された検定統計量, 4列目は p値となっている. 1行目から順に Qb,Ql,Qave,Qequが出力される. 表 5 SASマクロの出力 F i n a lOutput DF C h i ‑ S q u a r e Pr>ChiSq 1 . 4 3 1 4 8 1 5 5 0 . 0 1 9 7 7 6 9 5 3 . 2 0 4 8 7 3 4 0 . 6 6 8 4 3 4 Qave 1 4 . 8 4 2 6 5 2 9 0 . 0 2 7 7 6 4 2 Qequ 1 3 . 3 4 4 3 9 3 2 0 . 0 6 7 4 3 4 3 Qb 戸‑‑‑ Q1 結果を見ていく,ただし有意水準は 5%とする.Qbの結果から T と Pには有意な差が見られた ( p値 =0.0198). またもの結果化からモデ、ルの当てはまりの悪さは示唆されなかった ( p値 = 0 . 6 6 8 4 ) . b= ・0 . 1 2 2 3,v b . o = 0 . 0 0 2 7 5 5 であり推定値の符号より Pより Tの方が反応変数の値が低い傾向にあること,すなわち Tの方が良いスコア ‑342・
の傾向にあることが示唆されている.この出力を得るための p r i n t文は B i o m e t r i c sの HPに公開されているパ J ではコメントアウトされておりそれを解除する必要がある.解除しであるパー ージョンの lEBRST2008品 s ジョンは筆者問い合わせで得ることができる.また同様にして二変量Krus k a l ‑W a l l i s検定統計量Qoに関する結 果も表示することができ, Qo=8.64,p = 0 . 1 9 5 0となり有意差が示唆されない. 参考として両側それぞれで T と P に対する単変量 Wilcoxon検定を行った.すなわち左側では群i= 1, 2対 13対i= 2, 4の比較である.これは NPAR1WAYプロ、ンジャで実行可能であり表 6 i= 3, 4の比較,右側ではi=, には SASコードを記載している. 表 6 NPARIWAYに よ る 単 変 量 Wilcoxon順 位 和 検 定 data t m p 2 ; s e tt m p ; i f period = 1then g r o u p l= ( s e q = 1o rs e q=2 ) ; i f period = 2 then g r o u p l= ( s e q = 1o rs e q二 3 ); r u n . proc sort data=tmp2; b yp e r i o d ;r u n ; proc nparlway data=tmp2 w iI c o x o n ; class g r o u p l ; v a rr e s ; b yp e r i o d ; r u n ; 結果として左側では p=0.6102,右側では p = 0 . 0 1 8 6となり左右で結果が異なった.統計量Q a v eはこれらの検定 統計量を平均して比較を行うものであり,表 5のマクロ出力より p値 は 0 . 0 2 7 7となり T と Pの有意差は見 られたが, Qbの p値より大きくなっている.シミュレーションで見たように相関が強まると Qbの検出力が高 まる事が反映しているのかもしれない. Vf , 1, O = 0 . 0 0 3 2 2 2 9 の大きさが また ι= ・0 . 1 2 4 9 であり bと 似 た よ う な 値 に な っ た が , 分 散 p値に影響を及ぼしていると考えられる.またQequの p値はさらに大きかった ( p= 0 . 0 6 7 4 ) . シミュレーションにおけるサンプルサイズの記号を使うと表 1データではほぼn pく n cであり, c )=( 8,1 6 )の場合Q叩の方が検出力で劣るという結果を反映しているのか シミュレーションにおける ( np'n もしれない. まとめと考察 本論文では 2期 2剤 4群のクロスオーバーデザインにおけて 2期が同一被験者の左右に対応する強い相関を 示す場合のノンパラメトリック検定法についての SASマクロを紹介した.シミュレーション研究により相闘 が強まれば検出力が高まる事が示唆され,この状況に適した方法だと考えられる.その検定統計量は反応変 数の順位平均から行列演算によって導くことが可能にするようにまとめており, RANKプロシジャ, MEAN 江MLを利用することができた.方法はいくつかの拡張を持って プロシジャを用いて順位平均が求まれば SAS いる.一つ目は処置の反対側への影響である.これは Kawaguchie ta . l( 2 0 0 9 )でも議論されているようにら求。 ‑343・
であることが期待され線形モデ、ルにおいてらに対応するパラメーターを増やす必要がある.二つ目は処置期 が 2からそれ以上への拡張である.Kawaguchia n dKoch( 2 0 1 0 )では降圧剤に対する臨床試験を例とする方法を : P : P ,T : P : T ,P : T : P ,P : T : Tの処置系 提案している.この試験は 3期 2剤 4群のクロスオーバーデザインであり T 列群を持つデータである.方法は仮説検定のみならず信頼区間の構成も行っている. 6期 6剤 6群まで拡張 可能である.この方法は Kawaguchi,Koch,a n dWang( 2 0 1 0 )において多施設試験などに応用をもっ層別解析の ta , . I1 9 9 8 )に基づく方 ための方法に拡張されてある.これらの方法もノンパラメトリック共分散分析法 (Koche 法であり統計量はすべて重み付き最小二乗推定量の形で与えられる.よって SAS 品仏を用いたマクロの開発 が見込まれ今後の課題と考えている.まとめとして,同一被験者への同時の処置は眼科領域のみならず皮膚 科領域などでも考えられる.本論文の方法はこのような試験において治療法を比較するための有効な方法で あり開発された SASマクロを用いればデータに簡単に適用することができる. 参考文献 2 ( 1 ) B a l a a r n, L .N .( 1 9 6 8 ) .Atwo ・ p e r i o dd e s i g nw i t ht e x p e r i r n e n t a lu n i t s .B i o r n e t r i c s24, 6 1 ‑ ‑ 7 3 . ( 2 ) J o n e s, B .a n dKenward, M.G .( 2 0 0 3 ) .D e s i g na n da n a l y s i so fc r o s s ‑ o v e rt r i a l s( 2 n de dふ L o n d o n :C h a p r n a na n d H a l. I ( 3 ) Kawaguchi,A . , Koch,G .G .,Wang,X .( 2 0 1 0 ) :S t r a t i f i e dM u l t i v a r i a t e Mann‑Whi t n e yE s t i r n a t o r sf o rt h e C o r n p a r i s o no fTwoT r e a t r n e n t sw i t hR a n d o r n i z a t i o nB a s e dC o v a r i a n c eA d j u s t r n e nt .Toa p p e a ri nS t a t i s t i c si n B i o p h a ロn a c e u t i c a lR e s e a r c h . ( 4 ) Kawaguchi,A .a n dKoch,G .G .( 2 0 1 0 ) :M u l t i v a r i a t eMann‑Whi t n e yE s t i r n a t o r sf o rt h eC o r n p a r i s o no fTwo T r e a 位l e n t si naT h r e eP e r i o dC r o s s o v e rS t u d yw i t hRando r n IyM i s s i n gD a t a .J o u r n a lo fB i o p h a r r n a c e u t i c a l S t a t i s t i c s, V o l u r n e20I s s u e4, 720 ・7 4 4 . .,Koch,G .G .,a n dR a r n a s w a r n y ,R .( 2 0 0 9 ) :A p p l i c a t i o n so fE x t e n s i o n so fB i v a r i a t eRa nkS u r n ( 5 ) Kawaguchi,A S t a t i s t i c st ot h eB i l a t e r a lC r o s s o v e rD e s i g nt oC o r n p a r e Two T r e a t r n e n t s Through F o u rS e q u e n c eG r o u p s . B i o r n e t r i c s, V o l u r n e6 5I s s u e3, 979‑9 8 8 . .G .叩 dB h a p k a r ,V .P .( 1 9 8 2 ) .C h i ‑ s q u a r et e s t s .I nE n c y c l o p e d i ao fS t a t i s t i c a lS c i e n c e s,Vo. I1 ,S .K o t z ( 6 ) Koch,G a n dN .L .J o h n s o n( e d s ), 4 4 2 ‑ ‑ 4 5 7 .NewYor k :W i l e y . ( 7 ) Koch,G .G .,T a n g e n,C .M.,J u n g,J .w . ,a n dArn a r a,LA .( 1 9 9 8 ) .I s s u e sf o rc o v a r i a n c ea n a l y s i so fd i c h o t o r n o u s a n do r d e r e dc a t e g o r i c a ld a t a企o r nr a n d o r n i z e dc l i n i c a l仕i a l sa n dn o n ‑ p a r a r n e t r i cs 甘a t e g i e sf o ra d d r e s s i n gt h e r n , S t a t i s t i c si nM e d i c i n e,1 7,1 8 6 3 ‑ ‑1 8 9 2 . M.L .a n dSen, P .K .( 19 7 1 ) .N o n p a r a r n e t r i cr n e t h o d si nr n u l t i v a r i a t ea n a l y s i s . NewY o r k :J o h nW i l e y . ( 8 ) P u r i, ( 9 ) R o s n e r ,B .,GI 戸m,R ., . Ja n dLee,M.工 ( 2 0 0 6 ) .E x t e n s i o no ft h er a n ks u r nt e s tf o rc I u s t e r e dd a t a :t w o ‑ g r o u p c o r n p a r i s o n sw i t hg r o u pr n e r n b e r s h i pd e f i n e da tt h es u b u n i tl e v e . IB i o r n e 仕i c s62,1 2 5 1 ‑ ‑ 1 2 5 9 . ( 10 )上坂浩之.( 2 0 0 6 ) . 医薬開発のための臨床試験の計画と解析.朝倉書庖. ‑344・
不等分散が D u n n e t t型多重比較の性能に及ぼす影響 についてのサンプルサイズ別検討 冨 田 尚 希 l、 土 居 正 明 2、 新 国 明 美 l、 横 山 徹 爾 3 l東北大学加齢医学研究所老年医学分野 2東レ株式会社 医薬開発推進室 3国立保健医療科学院人材育成部 TheI n f l u e n c eo fH e t e r o s c e d a s t i c i t yandSampleS i z e 句r p eM u l t i p l eComparisonProcedure ToDunnett‑ 1 Nao 組T o m i t a1,MasaakiDoi2, AkemiN i t t a, T e t s吋i YokoyamaJ l .I n s t i t u t eofDev 巴l o p m e n t, AgingandC a n c e rTohokuU n i v e r s i t y 2 .C l i n i c a lDataS c i e n c eD e p a r t m e n tB i o s t a t i s t i c s, TorayI n d u s t r i e s, I n c . 3 .D e p a r t m e n tofHurnanR e s o u r c e sDevelopment, N a t i o n a lI n st i t u t eo fPu b l i cH e a l t h 要旨 検定目的で使われる多重比較 ( M u l t i p l ec o m p a r i s o np r o c e d u r e :MCP) 手法の多くは、正規性・等分散性を前 提としている。正規性の前提が満たされないデータの解析を行う場合、分布形の前提を必要としないノンパ ラメトリック法が使用される。しかし、ノンパラメトリック法においては、比較群ごとの分散が等しいとい う等分散性の前提が満たされない場合、 αエラーが制御されないことがありうる。実際の臨床研究におい てこれが満たされない場合が少なくない。バランスのとれた小規模のサンプルサイズにおいて不等分散が多 重比較の性能に及ぼす影響については先行研究で検討されている。本研究では不等分散を示すデータに対し 多重比較(対照との比較)の検定を行う場合、サンプルサイズにより性能に対する影響の仕方がどのように 変化するか、複数の手法についてモンテカルロシミュレーションを通じて検討した。 キーワード 不等分散、正規性、多重比較、アンバランスデー夕、有意水準、検出力 1.はじめに 多重比較 ( M u l t i p l ec o m p a r i s o np r o c e d u r e :MCP) とは、ファミリー基準過誤率(全体として少なくとも lつ 以上の過誤(正しい帰無仮説を棄却してしまう誤り)をおかしてしまう確率)を有意水準 α以下に保つ手法 のことをいう(永田・吉田 1 9 9 7 ) 0 MCP手法の選択は、(1)統計モデルに関する仮定、 ( 2 )比較の目的、 ( 3 ) 検定したい要素の集合の設定、の 3点を明らかにすることを通じて行われ、有意水準を担保したうえで検出 司 3 4 5 ‑
力の高い手法を適用することが必要である ( W e s t f a l l1 9 9 9 ) 。パラメトリックな多重比較の手法は通常、正 規性・等分散性を前提としている。正規性の前提が満たされないデータの解析を行う場合、分布形の前 提を必要としないノンパラメトリック法が使用される。これに対して比較群ごとの分散が等しいという 等分散性の前提は、古典的なパラメトリック手法に加えノンパラメトリックの手法においても必要とさ れている。したがって、等分散性の前提が満たされない場合、その性能への影響は避けられず、どのよ うな影響があるかについてある程度の見通しを持っておくことが重要である。先行研究でその一部が検 討されているが(阿部 1 9 9 9 ) 、先行研究では「毒性試験 j を念頭におき、一群のサンプルサイズが 6, 1 0 と小規模な試験についての検討に限られている。小規模な非臨床試験、疫学者や医師による探索的な臨床 研究、薬効検証のための臨床試験、大規模疫学研究と様々な規模の研究において多重比較の手法は用いられ ているが、このそれぞれの規模の研究すべてにおいてこの先行研究の結果を単純にあてはめられる保証はな い。また疫学研究の場合、規模が大きくなるにつれて比較する群のサンプルサイズがアンバランスになる可 能性が高くなることからも、先行研究の結果があてはまるかどうかは改めて検証する必要がある。多重比較 法の中では対照群との比較を行う D u n n e t t法の使用頻度が高い(浜田 2 0 0 9 ) 0 Dunne 民法は比較群の例数が アンバランスな場合、実質の有意水準と名義の有意水準が異なることが分かつており、その詳細については 0 0 5 ) 。しかし、この研究では等分散での検討に隈られており、不等分散 先行研究で検討されている(中島 2 で例数がアンバランスな場合についての検討は行われていない。 対照、群との比較を行う多重比較法は、パラメトリック手法としては D山 m叩の方法が、ノンパラメトリッ t e e 1法がある。また、より柔軟なノンパラメトリック手法として r R e s a m p 1 i n gに基づく方法 ク手法では S (MULTTEST プロシジャ) Jがある (Dmitrienko2005)。これらいずれの手法においても比較群ごとの分 伐の方法が、 SAS 散が等しいことが前提となっている。また、比較群問で分散が異なるモデルに対する Dunne では M医 ED プロシジャを用いて実行可能である ( W e s t f a l l1 9 9 9 ) 。本研究では、比較群ごとの分散が異な る場合にこれらの多重比較法を用いた時の性能の違いについて以下のように検討する。 ( 1 ) (分散の不均等さの程度による性能変化の検討) 各比較群の分散が不均等な場合、不均等の度合いに応じて多重比較法の性能がどのように 変化するのかを複数の症例数において検討する。 ( 2 ) (群ごとの症例数のアンバランスによる性能変化の検討) 対照群の症例数が他の群よりも少ない場合について、多重比較の性能がそのサンプルサイ ズの違いにより性能がどう変化するのかを検討する。 2. モンテカルロシミュレーションの具体的な設定 本研究の目的は、対照との比較に関する各多重比較法の性能が、不等分散やサンプルサイズによりどう変 化するか検討することである。分布型については全て正規分布を仮定し、分散の大きさのみ異なるデータを 用いた。以下具体的な手順を記載する。 (1)比較群の設定 比較する群は 3群で、第 I群は「対照群」とする。群 2、群 3の聞には順序関係(例.低用量と高用量) . 3 4 6 ・
があるものとする。各群のサンプルサイズについては以下のように設定する。 ( a ) 対照群(第 l群)とその他の群(第 2群、第 3群)で等しいサンフ。ルサイズの場合 各群のサンプルサイズが 1 0, 30, 50,1 0 0, 200であると設定する(総計 3 0, 90,1 5 0, 300, 6 0 0 )。 ( b ) 対照群(第 l群)のサンプルサイズがその他の群(第 2群、第 3群)よりも小さい場合 、 2倍である状況につき検証する。対照群のサ 対照群に比べ第 2群・第 3群のサンプルサイズが1.5倍 ンフ。ルサイズは ( a )と閉じとする。 ( 2 ) 検討対象とする手法の詳細について ( a ) パラメトリック手法 :D山 m e t t法 GLM プロシジャを利用して古典的な D u n n e t tの両側検定を行った。 ( b ) ノンパラメトリック法:S t e e 1法 e p a r a t er a n k i n g , j o i n tr a n k i n g と大きく 2 多重比較のノンパラメトリック手法は、順位の付け方により s つに分けられるが、群ごとの分散が異なる状況では S e p a r a t er a n k i n gによる手法がより適している。順位 情報に基づいたノンパラメトリックな多重比較を行うプロシジャは未だ SASには存在しない。このため PROBMC関数を用いて作成された Steel検定のマクロ(浜田 1 9 9 9 ) を利用した。 ( c )Resamp1ingに基づく方法(復元抽出 ( B o o t s t r a p )) 群ごとに分散が異なる場合、群ごとに独立に r e s a m p 1 i n gを行う必要があるため復元抽出による方法 ( b o o t s t r a p法)を用いる。 Resamp1ingによる多重比較手法を用いる場合には、 1 0, 000回以上の r e s a m p 1 i n g が必要といわれることから本研究では 1 0, 000回行うこととした。以上の設定で MULTTESTプロシジャを 利用した。 ( d ) 不等分散を考慮、した D山 me口の方法 古典的な Dunnettの方法は各群の分散が等しいことを仮定しているが、 SASでは MlXEDプロシジャで 不等分散の場合の計算が可能であるため、これを利用した ( W e s t f a l l1 9 9 9 )。 ( 3 ) 母数の配置について 群 l、群 2、群 3の期待値をそれそ。れ μJ'μ2'μ3とし、各群の標準偏差をそれぞれσ J,σ 2 ' 0'3とする。 ( μ ' J ' σ / )U = 1ム3) に従い、以下のパターンをとる場合につき検討する。 全ての群は正規分布 N ‑ 3 4 7 ‑
第 l群(対照群) 第 2群 第 3群 ばらつき ) N( 0ム 1 N( 0 . 3, 1 ) ) N( 0ム 1 等分散 2 N( 0 . 3, 1 ) ) N( 0ム 2 ) N( 0ム 2 3 N( 0ム 1 ) .5 ) N( 0 . 31 N( 0ム 2 ) 4 N( 0 . 3, 1 ) ) N( 0ム 2 N( 0 . 6, 2 ) 5 N( 0 . 3, 1 ) N( 0. 45 ,1 .5 ) N( 0 . 6, 2 ) Pattern 1 N ( 0 . 3 . 1 ) なし 不等分散 あり Pattem4 N ( 0 . 3 . 1 ) N ( 0 . 3 . 1 ) 群間差 ) N ( 0 . 3 .1 N ( 0 . 6 . 2 ) N ( 0 . 6 . 2 ) 0 . 3f '一 一 一 一 一 一 一 一 一 一 0 . 3ト 一 一 一 一 一 一 一 一 一 ー 一 ・ ー 司 日 一 一 一 一 一 一 一 一 4ー ー Group1 Group2 Group3 Group1 ( R e f e r e n c e ) Pattern2 N ( 0 . 3 . 1 ) Group1 N ( 0 . 6 . 2 ) N ( 0 . 6 . 2 ) Group2 Group3 N ( 0 . 4 5 .1 .5 ) N ( 0 . 6 . 2 ) G r o u p1 a p2 G r o u p3 ( R e f e r 創刊,) Pattem3 N ( 0 . 3 . 1 . 5 ) N ( 0 . 3 . 2 ) G r o ' u p2 G r o ' u p3 T111611li d 令 Group1 ) N ( 0 . 3 .1 0 . 3 f ( R e f e r e n c e ) N ( 0 . 3 .1 ) Group3 P a t t e r n5 γlil‑‑lli O.H Group2 ( R e f e r e n c e ) ( R e f e r e n c e ) ‑348・ ,仙
( 4 ) r 性能」の定義について 多重比較の場合、「検出力」に複数の定義を考えることができる。本研究で考えられる帰無仮説としては ( a ) HO.2} : μ = 山 、 ( b ) HO.3} :仇=州、である。各手法を、①全ての群の平均値が等しい状況で、少な くとも lつの比較で有意差を検出する確率が 0 . 0 5に近し、かどうか、②第 2群・第 3群の両方の平均値が 対照群より大きいときに、少なくとも lつの帰無仮説が棄却される確率の大きさ、の 2点から評価した。 以上の設定のもと、全体での繰り返しの回数(シミュレーション回数)を 1 0 0 0固としてモンテカルロシミュ レーションを行った。 3. シミュレーション結果 モンテカルロシミュレーションの結果を T a b l e1 ‑ 1 から T a b l e3 ・2 に 示す。 T a b l e1 ‑ 1, 2 ‑ 1, 3 ‑ 1 はαエラーを確 認する目的で平均値が 3群ですべて同じパターンのシミュレーション結果を示した。 T a b l e1 ‑ 2,2之 ,3 ・2 に は、 手法ごとの検出力について検討する目的で、少なくとも lつの群で平均値が異なるパターンのシミュレーシ ョン結果を集めた。検討は、(1)αエラー、 ( 2 ) 検出力のそれぞれに対して、 ( a ) 不等分散、(b)比較群ごと のサンプルサイズ、(c ) 比較群聞のサンプルサイズのアンバランスが及ぼす影響について、先に挙げた多重 比較の手法ごとに検討した。 ( 1 ) αエラーに関する検討 古典的 Dunn出法、 S t e e l法 R e s a m p l i n gに基づく方法、不等分散を考慮、した D山 m出法のすべてにおいて、 等分散性の前提が保たれている場合は有意水準の増加はほぼ抑制できていた。群ごとのサンプルサイズそ のものは αエラーへの影響は見られなかった。不等分散のもとでは、例数のアンバランスの度合いが強ま るにつれ、 αエラーが過剰に小さくなって保守的になる傾向が見られた。 ( 2 )検出力に関する検討 群ごとのサンプルサイズそのものの影響は αエラーには見られないのに対して、検出力については大き く影響し、サンプルサイズが大きくなるにつれ検出力は増大していた。今回はどのようなシチェーショ ンでも不等分散を考慮した Dunn出法が一番検出力が大きかった。 ( 3 ) 手法別の検討 ( a ) パラメトリック手法:Dunne 抗法 バランスのとれた例数でーあっても、等分散の前提が満たされないだ、けで αエラーが小さくなる傾向が見 られた。不等分散のもとで例数がアンバランスになった際に保守的になる傾向はとても強く、ノンパラメ t e e l法よりも αエラーが過剰に小さくなっていた。 トリック手法である S ( b ) ノンパラメトリック手法:S t e e l法 数のバランスが取れている場合、 αエラーがわずかに増加する傾向が見られた。不等分散 不等分散で、伊l 下で例数がアンバランスな場合には、逆に αエラーが過剰に小さくなる傾向が見られた。 ‑349・
( c )R e s a m p l i n gに基づく方法(復元抽出 ( B o o t s t r a p )) バランスのとれた例数であっても、等分散の前提が満たされない度合いが強くなると(分散比 1 : 2 : 2 )、 αエラーが大きくなる傾向が見られた。例数がアンバランスになると αエラーが過剰に小さくなる傾向が 見られた。 ( d ) 不等分散を考慮、した Dwme 仕の方法 バランスのとれた例数において、 αエラーがほぼ 0 . 0 5に抑えられながら、高い検出力が見られた。 古典的な D unnett法とは異なり、例数がアンバランスになっても αエラーが過剰に小さくなる傾向は見 られなかった。 4. まとめ 対照群の例数が他群より少なく例数がアンバランスになった際に古典的な D u n n e t tの方法が過剰に保守的 になる傾向は中島らの先行研究でも確認されており、本研究の結果と合致していた。この傾向は等分散性が 仮定できない状況では古典的な D u n n e t tの方法に限らず S t e e l法 、 Resamplingに基づいた方法においても見ら れ、例数を増やしてもこの問題は解決されなかった。不等分散を考慮した D u n n e t tの方法では唯一保守的に なる傾向が見られず検出力の点でも十分な大きさが保たれることがわかった。 本研究の結果で重要な点は、正規性の仮定が満たされていても、等分散性の前提が満たされない場合には 古典的 Dunn 出法、 S t e e l法 R e s a m p l i n gに基づく方法は過剰に保守的になる傾向があるということであり、分 e t tの方法を適用すべきである。 散が不均等で群間の例数がアンバランスな場合は不等分散を考慮、した D田 m 本研究では、不等分散として対照群の分散が最小である場合のみ、例数のアンバランスとして対照群の例 数が最小の場合のみについての検討にとどまっており、これ以外の状況については改めて評価する必要があ る。また、データが正規分布に従わない場合についても、今後検討が必要である。 参考文献 山永田靖 吉田道弘 (1997) :r 統計的多重比較法の基礎」、サイエンテイスト社 [ 2 ]P e t e rH.Westfa , 1 l Rand a l lD.T o b i a s,Dr o rRom,Russel 1D.Wolfinger , YosefHochberg.M u l t i p l eC o m p a r i s o n sand .1 9 9 9 . M u l t i p l eT e s t sU s i n gSAS [ 3 ]A lexDmitrienko,GeertMolenberghs,ChristyChuang‑Stein, W a l t e rO f f e n .A n a l y s i so f C l i n i c a lT r i a l sU s i n gSAS:A P r a c t i c a lGui d e .2 0 0 5 . 和訳:治験の統計解析理論と SASに よ る 実 践 森 川 │ 馨 、 田 崎 武 信 監 訳 講 談 社サイエンティフィク 2009 [ 4 ] 浜田知久馬他 (1999) 薬理学研究での統計手法の実態 日薬理誌 133306‑310. [ 5 ] 土居正明「土居正明のホームページ J http://www012.up ̲ n. s o ̲ ‑ n e t . n e . j p j ̲ d Qi ! (2010年 6月 3 日) [ 6 ] 例数がアンバランスなときの近似 Dunnett法の性能評価.中島章博豊泉滋之浜田知久馬 SASForum ユーザー会学術総会 2005, 371‑380(2005) .28,NO.2(1999) [ 7 ] 阿部研自、岩崎学多重比較法における不等分散の影響評価応用統計学 Vol [ 8 ] 浜田知久馬他 (1999) rSeparate‑ranking型ノンパラ多重比較 J SUGI‑J '99論文集, pp383‑390. ‑350・
T a b l e1 ‑1.サンプルサイズのバランスがとれている場合の各手法の α エラー 母数の配置 多重比較法 例数 n l . n 2・n 3 Dunnett S t e e l Resampling Mixed 1 0 : 1 0 : 1 0 0 . 0 4 9 0 . 0 3 9 0 . 0 3 9 0 . 0 4 1 1 .N ( 0 . 3,1 ) 3 0 : 3 0 : 3 0 0 . 0 4 5 0 . 0 3 4 0 . 0 3 8 0 . 0 4 2 0 . 3,1 ) 2 .N ( 5 0 : 5 0 : 5 0 0 . 0 5 0 0 . 0 5 4 0 . 0 5 8 0 . 0 5 9 0 . 3,1 ) 3 .N ( 1 0 0 :10 0 :1 0 0 0 . 0 5 6 0 . 0 4 5 0 . 0 4 2 0 . 0 4 5 2 0 0 : 2 0 0 : 2 0 0 0 . 0 4 1 0 . 0 5 5 0 . 0 5 3 0 . 0 5 8 1 0 : 1 0 : 1 0 0 . 0 3 0 0 . 0 3 8 0 . 0 6 2 0 . 0 5 0 1 .N ( 0ム 1 ) 3 0 : 3 0 : 3 0 0 . 0 3 0 0 . 0 6 3 0 . 0 5 3 0 . 0 4 1 0 . 3, 2 ) 2 .N ( 5 0 : 5 0 : 5 0 0 . 0 2 9 0 . 0 6 5 0 . 0 6 0 0 . 0 5 0 3 .N ( 0 . 3, 2 ) 1 0 0 : 1 0 0 : 1 0 0 0 . 0 3 3 0 . 0 5 9 0 . 0 7 2 0 . 0 4 2 2 0 0 : 2 0 0 : 2 0 0 0 . 0 1 9 0 . 0 6 0 0 . 0 6 2 0 . 0 4 8 1 0 : 1 0 : 1 0 0 . 0 3 5 0 . 0 5 1 0 . 0 6 6 0 . 0 5 0 1 .N ( 0 . 3,1 ) 3 0 : 3 0 : 3 0 0 . 0 2 6 0 . 0 6 2 0 . 0 7 4 0 . 0 5 5 2 .N ( 0 . 3,1 勾 5 0 : 5 0 : 5 0 0 . 0 3 4 0 . 0 5 7 0 . 0 5 7 0 . 0 5 2 0ム 2 ) 3 .N ( 1 0 0 : 1 0 0 : 1 0 0 0 . 0 4 4 0 . 0 6 2 0 . 0 5 1 0 . 0 4 9 2 0 0 : 2 0 0 : 2 0 0 0 . 0 3 6 0 . 0 6 7 0 . 0 5 0 0 . 0 4 5 T a b l e1 ‑ 2 . サンプルサイズのバランスがとれている場合の各手法の検出力 母数の配置 多重比較法 例数 n l・n 2 . n 3 Dunnett S t e e l Resampling Mixed 1 0 : 1 0 : 1 0 0 . 0 5 3 0 . 0 7 8 0 . 0 8 0 0 . 0 7 8 1 .N ( 0 . 3,1 ) 3 0 : 3 0 : 3 0 0 . 0 9 4 0 . 1 2 7 0 . 0 8 7 0 . 1 2 6 2 .N ( 0 . 6, 2 ) 5 0 : 5 0 : 5 0 0 . 1 2 2 0 . 1 7 9 0 . 0 9 8 0 . 1 6 5 0 . 6, 2 ) 3 .N ( 1 0 0 : 1 0 0 : 1 0 0 0 . 2 7 0 0 . 3 3 8 0 . 1 7 9 0 . 3 4 3 2 0 0 : 2 0 0 : 2 0 0 0. 46 9 0 . 5 7 7 0 . 3 1 8 0 . 5 7 6 1 0 : 1 0 : 1 0 0 . 0 4 5 0 . 0 5 9 0 . 0 6 2 0 . 0 6 5 1 .N ( 0 ム1 ) 3 0 : 3 0 : 3 0 0 . 0 9 1 0 . 1 1 8 0 . 0 7 9 0 . 1 1 0 2 .N ( 0. 45 ,1 .5 ) 5 0 : 5 0 : 5 0 0 . 1 4 0 0 . 1 3 9 0 . 0 9 0 0 . 1 2 9 3 .N ( 0 . 6, 2 ) 1 0 0 :10 0 :100 0 . 2 2 3 0 . 2 3 7 0 . 1 1 6 0 . 2 4 2 2 0 0 : 2 0 0 : 2 0 0 0. 438 0. 42 4 0 . 1 9 1 0. 429 ‑ 3 5 1 ‑
Table2 ‑1.サンプルサイズがアンバランスな場合 ( 1 :1 ふ1.5 ) の各手法の α エラー 母数の配置 多重比較法 例数 n l . n 2・n 3 Dunnett S t e e l Resampling Mixed 1 0 : 1 5 : 1 5 0 . 0 6 2 0 . 0 5 9 0 . 0 5 7 0 . 0 5 9 1 .N( 0ム 1 ) 3 0 : 4 5 : 4 5 0 . 0 5 7 0 . 0 5 1 0 . 0 4 1 0 . 0 4 4 0 ム1 ) 2 .N( 5 0 : 7 5 : 7 5 0 . 0 5 5 0 . 0 3 7 0 . 0 4 6 0 . 0 4 1 3 .N( 0 . 3,1 ) 1 0 0 : 1 5 0 : 1 5 0 0 . 0 4 4 0 . 0 6 4 0 . 0 5 4 0 . 0 5 6 2 0 0 : 3 0 0 : 3 0 0 0 . 0 4 7 0 . 0 4 8 0 . 0 5 4 0 . 0 5 0 1 0 : 1 5 : 1 5 0 . 0 2 7 0 . 0 3 6 0 . 0 5 1 0 . 0 3 7 1 .N( 0ム 1 ) 3 0 : 4 5 : 4 5 0 . 0 1 1 0 . 0 6 3 0 . 0 5 7 0 . 0 5 5 0ム 2 ) 2 .N( 5 0 : 7 5 : 7 5 0 . 0 1 7 0 . 0 4 7 0 . 0 4 7 0 . 0 5 0 3 .N( 0ム 2 ) 1 0 0 : 1 5 0 :1 5 0 0 . 0 1 7 0 . 0 3 8 0 . 0 4 6 0 . 0 5 3 2 0 0 : 3 0 0 : 3 0 0 0 . 0 2 0 0 . 0 5 5 0 . 0 5 7 0 . 0 5 0 1 0 : 1 5 : 1 5 0 . 0 2 9 0 . 0 3 2 0 . 0 5 3 0 . 0 3 7 1 .N( 0 ム1 ) 3 0 : 4 5 : 4 5 0 . 0 2 3 0 . 0 3 7 0 . 0 5 4 0 . 0 5 1 0ム l 勾 2 .N( 5 0 : 7 5 : 7 5 0 . 0 2 3 0 . 0 4 2 0 . 0 4 0 0 . 0 4 9 0ム 2 ) 3 .N( 1 0 0 : 1 5 0 : 1 5 0 0 . 0 2 0 0 . 0 3 8 0 . 0 4 1 0 . 0 4 6 2 0 0 : 3 0 0 : 3 0 0 0 . 0 2 5 0 . 0 3 9 0 . 0 4 8 0 . 0 4 2 Table2 ‑ 2 . サンプルサイズがアンバランスな場合 ( 1 :1 ふ1.5 ) の各手法の検出力 母数の配置 例数 多重比較法 n l . n 2・n 3 Dunnett S t e e l Resampling Mixed 1 0 : 1 5 : 1 5 0 . 0 3 6 0 . 0 7 7 0 . 0 6 4 0 . 0 9 5 1 .N( 0 . 3,1 ) 3 0 : 4 5 : 4 5 0 . 0 7 0 0 . 1 1 7 0 . 0 6 6 0 . 1 4 2 0 . 6, 2 ) 2 .N( 5 0 : 7 5 : 7 5 0 . 1 2 1 0 . 2 1 0 0 . 0 9 0 0 . 2 3 5 0 . 6, 2 ) 3 .N( 1 0 0 : 1 5 0 : 1 5 0 0 . 2 4 0 0 . 3 6 1 0 . 1 7 1 41 0 0. 2 0 0 : 3 0 0 : 3 0 0 496 0. 0 . 6 2 4 0 . 3 3 3 0 . 7 0 5 1 0 : 1 5 : 1 5 0 . 0 3 8 0 . 0 5 8 0 . 0 5 1 0 . 0 6 6 1 .N( 0 . 3,1 ) 3 0 : 4 5 : 4 5 0 . 0 7 3 0 . 1 0 0 0 . 0 5 0 0 . 1 2 3 0. 45 ,1 .5 ) 2 .N( 5 0 : 7 5 : 7 5 0 . 1 0 6 0 . 1 5 4 0 . 0 8 5 0 . 1 7 4 0 . 6, 2 ) 3 .N( 1 0 0 : 1 5 0 : 1 5 0 0 . 2 2 0 0 . 2 9 7 0 . 1 3 5 0 . 3 2 3 2 0 0 : 3 0 0 : 3 0 0 463 0. 0. 49 1 0 . 1 9 8 0 . 5 6 1 ‑ 3 5 2・
T a b l e 3・1.サンプルサイズがアンバランスな場合 ( 1 : 2 : 2 ) の各手法のα エラー 母数の配置 例数 多重比較法 n l . n 2・n a Dunnett S t e e l Resampling Mixed 1 0 : 2 0 : 2 0 0 . 0 4 4 0 . 0 4 4 0 . 0 4 1 0 . 0 4 9 1 .N( 0 . 3,1 ) 3 0 : 6 0 : 6 0 0 . 0 5 4 0 . 0 4 4 0 . 0 4 9 0 . 0 5 2 ) 2 .N( 0 . 3,1 5 0 : 1 0 0 : 1 0 0 0 . 0 5 4 0 . 0 5 0 0 . 0 3 6 0 . 0 5 1 ) 3 .N( 0 . 3,1 1 0 0 : 2 0 0 : 2 0 0 0 . 0 6 2 0 . 0 5 0 0 . 0 6 2 0 . 0 5 5 2 0 0 : 4 0 0 : 4 0 0 0 . 0 5 8 0 . 0 5 7 0 . 0 5 9 0 . 0 5 3 1 0 : 2 0 : 2 0 0 . 0 0 8 0 . 0 3 1 0 . 0 4 1 0 . 0 6 0 1 .N( 0 . 3,1 ) 3 0 : 6 0 : 6 0 0 . 0 0 7 0 . 0 3 2 0 . 0 3 9 0 . 0 4 3 2 .N( 0 . 3,2 ) 5 0 : 1 0 0 : 1 0 0 0 . 0 1 1 0 . 0 3 7 0 . 0 4 0 0 . 0 5 4 ) 3 .N( 0 . 3,2 1 0 0 : 2 0 0 : 2 0 0 0 . 0 1 1 0 . 0 3 3 0 . 0 4 5 0 . 0 5 4 2 0 0 : 4 0 0 : 4 0 0 0 . 0 0 9 0 . 0 3 7 0 . 0 5 3 0 . 0 4 5 1 0 : 2 0 : 2 0 0 . 0 1 6 0 . 0 3 2 0 . 0 4 2 0 . 0 4 8 1 .N( 0 . 3,1 ) 3 0 : 6 0 : 6 0 0 . 0 1 3 0 . 0 4 0 0 . 0 4 2 0 . 0 5 4 .5 ) 2 .N( 0 . 3,1 5 0 : 1 0 0 : 1 0 0 0 . 0 1 5 0 . 0 3 7 0 . 0 3 3 0 . 0 4 3 3 .N( 0 . 3,2 ) 1 0 0 : 2 0 0 : 2 0 0 0 . 0 1 5 0 . 0 4 2 0 . 0 4 0 0 . 0 4 6 2 0 0 : 4 0 0 : 4 0 0 0 . 0 0 6 0 . 0 4 9 0 . 0 4 7 0 . 0 7 0 1: 2 : 2 ) の各手法の検出力 T a b l e 3 ‑ 2 .サンプルサイズがアンバランスな場合 ( 母数の配置 多重比較法 例数 n l・n 2・n a Dunnett S t e e l Resampling Mixed 1 0 : 2 0 : 2 0 0 . 0 2 0 0 . 1 0 6 0 . 0 4 5 0 . 0 9 3 1 .N( 0 . 3,1 ) 3 0 : 6 0 : 6 0 0 . 0 6 2 0 . 1 2 6 0 . 0 6 3 0 . 1 8 2 ) 2 .N( 0 . 6,2 5 0 : 1 0 0 : 1 0 0 0 . 0 9 0 0 . 2 0 0 0 . 0 7 7 0 . 2 6 6 3 .N( 0 . 6,2 ) 1 0 0 : 2 0 0 : 2 0 0 0 . 2 5 6 0 . 3 9 0 0 . 1 6 9 0. 484 2 0 0 : 4 0 0 : 4 0 0 0 . 5 3 2 0 . 6 8 5 0 . 3 4 4 0 . 7 7 9 1 0 : 2 0 : 2 0 0 . 0 3 6 0 . 0 5 9 0 . 0 4 9 0 . 0 8 4 1 .N( 0 . 3,1 ) 3 0 : 6 0 : 6 0 0 . 0 6 6 0 . 0 9 9 0 . 0 7 6 0 . 1 3 3 45 ,1 .5 ) 2 .N( 0. 5 0 : 1 0 0 : 1 0 0 0 . 1 1 0 0 . 1 6 2 0 . 0 8 0 0 . 2 0 4 3 .N( 0ム 2 ) 1 0 0 : 2 0 0 : 2 0 0 0 . 2 1 6 0 . 2 7 5 0 . 1 4 3 0 . 3 5 7 2 0 0 : 4 0 0 : 4 0 0 0 . 5 0 0 0 . 5 4 9 0 . 2 3 9 0 . 6 5 3 ‑ 3 5 3・
SASによる Webデータの統計解析: XMLデータ入出力と不動産ノミリュエーションマップ作成への応用 0松 島 純 之 介 * 石 島 博 柿 渡部育恵 *中外製薬株式会社 臨床企画推進部 **中央大学大学院 国際会計研究科 WebDataAn a l y s i sw i t hSAS:I n p u tandOutputofXMLDataandA p p l i c a t i o nt oRealE s t a t eV a l u a t i o nMap へ I k u eWatanabe H i r o s h iI s h i j i m a * JunnosukeMatsushima*, ChugaiP h a r m a c e u t i c a lCo., LTD. * C l i n i c a lResearchP l a n n i n gDepartment, nt e r n a t i o n a lAccounting, ChuoU n i v e r s i t y ** GraduateSchoolofI 要旨 SASによる Web上の Xl ¥ 在Lデータの解析法を紹介し、例として不動産パリュエーションマップを作成 する。 Webデータから不動産の価格とリスクを推定し、結果を GoogleE a r t h上に表示する。 キーワード:XML, Filename, V a l u a t i o nMap, GoogleE紅白 1 . はじめに 1 .1背景 近年、新統計法の施行に伴い、分析可能なデータが膨大に開示されつつある。このようなデータを含め、 Web上のデータは凄まじい勢いで増加しており、 Web上のデータを有効に利用・活用するフレームワークを 構築することはますます重要になってきている。 しかし、いざ Web上のデータを扱うとなると、 2つの問題に直面する。 lつめは、そもそも Web上のデー タをどのようにして SASで取り込んだらよいのか、という問題である。ひとたび知ってしまえば非常に簡単 だが、敷居が高いという先入観のため、初めの一歩を踏み出すことにためらいがちである。 2つめは、 Web 上のデータ形式の扱い方がわからないという問題である。 Web上のデータの多くは XML(e X t e n s i b l eMarkup L a n g u a g e )で、記述されるため、 Web上のデータを扱うには、 XMLの扱い方を知る必要がある。現状の SASユ ーザーにとって XMLは必ずしも馴染みがあるものではなく、その扱いに戸惑いを覚えることもあろう。し かも、 XMLは Webに喰らず多くの分野で汎用的に利用されているため、多くのデータを扱う SASユーザー であれば、今後、 XMLを扱う機会がますます増えると考えられる。 そこで、本論文では、 SASを利用して、 Web上のデータを取り込む方法(第 2節)、および SASにおける XML形式のデータの入出力法を紹介する(第 3節)。そして、応用例として不動産パリュエーションマップ作 成を行う。具体的には、第 4節で、不動産の価格とリスクを評価する統計モデルを提案する。第 5節で、 SAS ‑ 3 5 7 ‑
により、提案する統計モデルを分析した上で、分析結果を XMLファイルに出力する例を、不動産パリュエ ーションマップの作成を通じて説明する。 つまり、 1 )Web上で公開される膨大 「クラウド時代の SASの有効な利用・活用の 1つの方法」として、 ( 2 )分析可能な SASデータセットに変換し、 ( 3 ) ファイナ なオリジナル XMLファイルを SASに取り込み、 ( 4 )SASによる分析結果という高い付加価値を加え ンス理論に基づいた統計モデ、ルを SASによって分析し、 ( 5 )Web上で展開される Google等の強力なツールと連携・利用する方法を提案 た XMLファイルを出力し、 ( する。第 6節で、まとめをする。 1 . 2応用例:不動産パリュエーションマップ作成の概要 「不動産パリュエーションマップ」とは、不動産の XML形式のデータから、不動産の価格とリスクを推 定し、高度な地球儀・地図アプリケーション上に表示するフレームワークのことをいう。このフレームワー クは、以下に述べる 3つの背景より、前節に述べた「クラウド時代の SASの有効な利用・活用の 1つの方法 J をデモンストレーションする上で最適な応用例であろう。 1.従来、不動産のデータはごく一部の人しか利用できなかったが、最近では、 Webから誰もが利用でき るようになった。 2 . 最新のファイナンス理論に基づいて不動産価格とリスクを推定するには複雑なモデ、ルが必要でーあり、 SAS等の強力な統計解析パッケージが不可欠となってきている。 3 . 不動産データを表示する際、 G o o g l eE a r t hや GoogleMapsといった優れた地球儀・地図アプリケーシ ヨンを利用できるようになった。 上記の1.と 3 .により、つい一昔前まで理想でしかなかったことが現実にできるようになった。また、 2 は 、 SASで分析する根拠を与える。不動産ノ〈リュエーションマップの作成は以下の 3ステップで行う。 J の APIを利用した XML 1.マンション情報サイト「スマッチ!(株式会社リクルートの Webサービス ) 形式のデータを SASに取り込み、分析可能な SASデータセットに変換 2 . ファイナンス理論に基づいた統計モデルに基づき、不動産の価格とリスクを SASによって推定(不動 産パリュエーション) 3.SASによる分析結果という高付加価値を加えた KML(XMLの一種)ファイルを出力し、 GoogleE a r t hや GoogleMaps上に表示 本論文では、この 3ステップに沿って、以下のように展開していくこととする。 1.について、 ( 1 )Web上のデータの取り込み(第 2節)、および、 ( 2 )XMLで記述されたデータの汎用的な入 力方法(第 3節)を紹介する。 2 . について、ファイナンス理論に基づいた統計モデルとして、 iBox‑Cox変換付き線形混合効果モデ、ル」 を提案・利用する(第 4節)。本モデルは、 Box‑Cox変換した不動産価格を被説明変数、不動産の属性(延床面 積、築年数、駅徒歩など)を説明変数とし、その係数を固定効果と変量効果とする混合効果モデルである。属 性の単価たる係数をはじめとするモデ、ル推定には、 PROCMIXEDを用いる。 ‑358・
3 . について、 XMLによる出力方法を示す(第 5節) 0 XMLの一種である KMLを用いることにより、 Google E a r t hや GoogleMapsに出力することができる。 2 . Web上のデータの取り込み:F i l e n a m eステートメントの利用 SASを使って Web上のデータを取り込むにはどうしたらよいか。実は、 Filenameステートメン卜を使って 簡単に取り込むことができる。本節では、 Web上のデータを取り込むための Filenameステートメン卜の使い 方を紹介する。なお、 Filenameステートメン卜により取り込むデータの形式は XMLに限らず、どのような 形式にも対応できる。 以下の「スクリプ卜 2 . 1:webge. ts a s Jは 、 rURLJ に存在するデータを r C :¥m y s a s f i l e s ¥xml ¥in.xmlJに保存す るプログラムで、ある。 例えば、不動産パリュエーションマップ作成に用いるデータが以下の URL に存在すると仮定する( r アク セスキー名」はスマッチ!の APIに登録する際に発行される個人識別情報)。 ∞ ' h t 甘 t p : イ / μ ' / a 戸 pi . s m 削 a 剖t c ぬ h . 必/危 a 戸 pa r 巾 t む me 叩n t νI ?ke 句y= r アクセスキ一名 J&r=I&c ∞ O 叩u nt=1 0O & p r i c ω em i t e i ド =O&st a r 此 t = 斗l ' このとき、上記 URL をスクリプ卜 2.1 の行 2 の rURLJ に記述する。なお、行 2 等の~ r l r e c l = 8 1 9 2 J は、行 ごとにデータを取得する際、取り込むことのできる行の文字数の長さであり、十分大きな数字であれば 8192 に限らない。 . 1:webget .s a s スクリプト 2 行 SASスクリプ卜 コメント l l o p t i o n svalidvamame=any; 変数の設定 2 1f i l e n a m ejunku r l rURLJ 'encoding="UTF ・8 "F i l e n a m eスアートメン卜。 rURLJにデータが存在する t e r m s tr = LFdebugl r e c l = 8 1 9 2 ; URL を指定する。 3 1 d a t ad a t a1 ; l n f i l eスアートメン卜によりずータを読み込む。 4 1i n f i l ejunkl e n g t h = l e n ; 5 1i n p u tr e c o r d$ v a r y i n g 8 1 9 2 .l e n ; 6 l r u n ; 司 y s a s f t l e s ¥ x r 凶 血 氾n l J に、取得したデータを 7 l d a t a ; r C : ¥ n 8 1s e td a t a1 ; 保存する。 9 1f i l e' C : ¥ m y s a s f i l e s¥ x r n l ¥i n氾 n l 't e n n s tr = LF encoding="UTF‑8"l r e c l = 8 1 9 2 ; 1 0 1p u tr e c o r d ; l l l r u n ; 3 . XML形式データの入力 本節では、前節で取り込んだ XML形式のデータを、 SASデータセットとして読み込む方法を紹介する。 3 . 1 XMLとは 初めに、 XMLについて簡単に説明する。 XML(e X t e n s i b l eMarkupLanguage)は、データの中にデータ構造や 意味を示す情報(タグ)を含めるマークアップ言語の一つである。特に、 XMLは用途に応じて、柔軟に固有の タグを定義できるという特徴がある。 XMLは、その柔軟性ゆえに、通信形式やファイルフォーマットの定義 など、 Webデータに限らず多くの分野で用いられている。以下に、 XMLで記述される Web上のデータの例 を挙げる: • XHTML(eXtensibleHyperTextMarkupL a n g u a g e ) :HTML を XMLの仕様に準拠するように再定義したもの。 ‑359・
• RSS(
R
e
s
o
u
r
c
eD
e
s
c
r
i
p
t
i
o
nFrameworkS
i
t
eSummary):Webサイトの見出しゃ要約などのメタデータを構造化
して記述する XMLベースのフォーマット。
• WebA
P
I
:API(
A
p
p
l
i
c
a
t
i
o
nProgramI
n
t
e
r
f
a
c
e
)とは、アプリケーションから利用できる、オベレーテイングシ
ステムやプログラミング言語で用意されたライブラリなどの機能の入り口となるものをいう。そして、 Web
サーバ上にある APIを利用したプログラミング手法を WebAPIという。 WebAPIが利用するデータベースに
XMLが使われている。
3
.
2 XMLが特定の 3層構造の場合の入力
本節では、 XMLが特定の 3層構造になっている場合における、 SASデータセットへの入力について述べる。
例えば、「スクリプ卜 3
.
2・1
:
b
a
s
i
c
.
x
m
l
j の場合、 1
(
1
)T,岨 LEJ 1
(
2
)CLASSJ 1
(
3
)NAME,
SEX,
AGEJ の 3層
構造になっている。この場合、「スクリプ卜 3
.
2
・
2
:
b
a
s
i
c品 s
J を実行すると、 SAS デ ー タ セ ッ ト 「 表 3
.
2
:
m
y
f
i
l
e
s
.
c
l
a
s
s
J を作成することができる。 XMLファイルの ITABLE/CLASSINAMEJ に存在するデータを SAS
、 XML ファイルの 1
TABLE/CLASS/SEXJ に存在するデータを
の「データセット :CLASS,変数 :NAMEJ に
SASの「データセット :CLASS,変数 :SEXJ に、そして、 XMLファイルの ITABLE/CLASS/AGEJ に存在す
るデータを SASの「データセット :CLASS,変数 :AGEJ に、それぞれ割り当てる。
・1
:b
a
s
i
c
.
x
r
n
l
スクリプト 3
.
2
1
T
XML
スクリプト
コメント
1
I
<
?
刃n
叫
1
iv
e
尽i
o
n
三
=
,
勺.
0
"encoding="windows
ト‑
1
2
5
2
"?>構造:以下のような3
層構造になってしも。
2
1<T
AB
LE>
TABLE
LCLASS
3
1 <CLASS>
LNAME
4 <NAME>T
a
r
o<lN
A ME>
LSEX
5 <S回 >Male<
lS回 〉
LAGE
6 <AGE>2
5<
lAGE>
7
1<
lC
LASS>
8
1 <CLASS>
A ME>
9 <NAME>Hanako<lN
lS
EX>
e
m
a
l
e<
1
0 <SEX>F
1
1 <AGE>2
4<
1AGE>
1
2
1<
lC
LASS>
lT
AB
LE>
1
3
1<
スクリプト 3
.
2
‑
2
:
b
a
s
i
c
.
s
a
s
行
SASスクリプ卜
l
Ilibnamet
r
a
n
s沼
n
!C
:
¥
m
y
s
a
s臼e
s
¥
刃叫¥
b
a
s
i
c沼
n
!
'
;
2
1
l
i
b
n
a
m
emy
臼.
e
s'
C
:
¥
m
y
s
a
s臼e
s
¥
X
I
叫';
3
1
d
a
t
am
y
f
i
l
e
s
.
c
l
a
s
s
;
4
1s
e
tt
r
a
n
s
.
c
l
a
s
s
;
5
l
r
u
n
;
コメン卜
読 み 込 む 別Lフ ァ イ ル を 指 定
フイブフリとするフォルダを指定
泊,fLフ ァ イ ル の CLASSに 含 む デ ー タ を SASァ ー
タセットとして読み込む。
表3
.
2
:
m
y
f
u
e
s
.
c
l
a
s
s
‑
3
6
0
‑
3 . 3様々な形式の場合の入力 前節のように XMLファイルが特定の 3層構造であれば、難なく XMLファイルを読み込むことができる。 しかし、多くの場合は、 XMLファイルはこのような 3層構造で、はないため、前節の方法では読み込むことが できない。 では、柔軟な構造を取り得る XMLファイルをどのようにして SASデータセットとして読み込めばいいか。 それには、 rMAPファイル」を用いる。 MAPファイルは、 XMLの構造と SASデータセットの構造の対応関 係(マッピング)を表す。すなわち、 MAPファイルにより、し、かなる構造を持つ XMLであろうと、 SASデー タセットの構造に落とし込むことができる。なお、 MAPファイルは rXMLMapperJ という SASの付属ソフ トにより GUIで作成できるが、以下のように、手動でテキストファイルを作成することもできる。 まず、 MAP ファイルの役割のイメージを、「表 3 . 3J に示す。 MAP ファイルにより、 XML ファイルの r r e s uI ts/apartment Ji d J に存在するデータを SASの「データセット :APARTMENTS,変数:id Jに 、 XMLファイ r e s u l t s / a p a r t m e n t J a r ea/nameJ に存在するデータを SASの「データセット・ APARTMENTS,変数 : a r e a n a m e J ルの r に、それぞれ対応させることを考える。 その上で、 MAPファイルにおいて、それぞれの変数ごとに、変数を割り当てる XMLのパス (PATH)、変数 の型(TYPE)、変数のデータ型(DATATYPE)、変数の長さ (LENGTH)を定義する。より具体的な例として、読み . 3 ‑ 1: i n . x m l j に、マッピングを定義する MAP ファイルを「スクリプト 込む XMLファイルを「スクリプト 3 3 . 3 ‑ 2 : i n . m a p J に、そして、実行する SASプログラムを「スクリプ卜 3 . 3 ‑ 3 : i n . s a s J に、それぞれ示す。 表 3.3:MAPファイノレの役割のイメージ XML の構造 SAS データセットの構造 r e s u l t s Lapartment L i d L a r e a L name . . . J ' . , │ M A P │ APARTMENTS >Lid ν 上¥ Lareaname 下 つ. . . スクリプト 3 . 3・l : i n . xmI XMLスクリプト I I < ? x m lv e r s i o n = "1 .0 "e n c o d i n g = " U T F ‑ 8 "? > 2くr e s u l t sXI叫n s = ' ' h t t p : / / a p i . sm a t c h . j p / " > p i ̲v e r s i o n >1 .0 く/ a p i ̲v e r s i o n > 3 くa ( 4 ) p a 口m cnt> 5 くa d>03 0 9 9 0 0 6 6 1 4 2 5 3 4 < 1i d > 6 くi η ( 8 くa r e a > a間 〉 9 くnamc>関東〈ゴn de>03 0 く/ c o d e > 1 0 <co la r e a > I I < ( 1 2 ) la p a r t m e n t > 1 3 1< 口m cnt> 1 4 1 <apa ( 15 ) 1 6 1< l a p a r t m c n t > 行 コメント 構造 r e s u l t s L api̲version L apartmcnt L i d L area L na L code 間 ( 1 7 ) 1 8 l< 1 r e s u l t s > ‑361・
スクリプト 3
.
3・2:in.map
MAPスクリプト
コメント
e
r
s
i
o
n
=
"1
.0
"?>
XML
の宣言
1
I
<
?
沼
叫v
2
1<SXLEMAPv
e
r
s
i
o
n
=
"1
.2">
XMLMAP
の宣百
3
1<T
ABIEname="APARTMENTS"
ァ ータセット名 I
APARTMENTSJを設定
4
1 <T
ABIιPATHs
y
n
t
ax
=
"
x
p
a
t
h
"
>
デ ータセット r
APARTMB
汀S
Jを害1
1
り当てるXML
のパ
5 /
ス
r
e
s
u
l
t
s
/
a
p
a
r
t
m
e
n
t
6
1<
lTABL
E
‑
PATH>
7
1 <COLU
恥1Nname="id">
変数名 l
i
d
Jを設定
H
>
l
r
e
s
u
l
t
s
/
a
p
a
r
t
m
e
n
t
/
i
d<
l
PATH>
変 数 Ii
d
J を割り当てる泊<1Lのパス
8 <PAT
9 <T
YP
E>c
h
a
r
a
c
t
e
r
叫 TYP
E>
変数 l
i
d
J の型
変数 l
i
d
J のデータ型
1
0 <DATATYP
E>STRIN
G
<
lDATATYPE>
1
1 <LENGr
H>1
5<
1LENGr
H>
変数 l
i
d
Jの長さ
1
2 イCOLUMN>
1
3
1 <COLUMNname="a
陀 a
nam
.
e
"
変数名 I
areanameJを設定
H
>
/
r
e
s
u
l
t
s
/
a
p
a
r
t
m
e
n
t
/
a
r
e
a
l
n
a
m
e<
l
PATH> 変数 I
a
r
e
a
n
a
m
e
Jを割り当てるXML
のパス
1
4 <PAT
1
5 <T
YP
E>c
h
a
r
a
c
t
e
阿 TYP
E>
変数 I
a
r
e
a
n
a
m
e
Jの型
a
r
e
a
n
a
m
e
JのフJータ型
変数 I
1
6 <DATATYP
E>STRIN
G
<
lDATATYPE>
GrH>8<
1LENGr
H>
変数 I
a
r
e
a
n
a
m
e
Jの長さ
1
7 <LEN
1
8 イCOLUMN>
他の変数も同様にくCOLUMNname="x
x
"
>で、設定
(
1
9
)
IE>
20イTAB
〈SXLEMAP>
2
1ゴ
行
スクリプト 3.
3‑
3
:
i
n
.
s
a
s
行
SASスクリプト
1
1f
i
l
e
n
a
m
eRESUL
TS'
C
:
¥
m
y
sa
sf
i
l
e
s¥XM
L
¥
i
n
.
x
r
n
l
';
2
1
f
i
l
e
n
a
m
eMAP'
C
九
ロ
マs
a
s
f
i
l
e
sひ
凸<1L
¥
i
n
.ロ
J
a
p
';
3
1
l
i
b
n
a
m
eRESULTSx
r
n
lxrnlmap=MAP
l
c
o
n
c
a
t
e
n
a
t
e=y
e
s;
沼n
4
1
l
i
b
n
a
m
eMYF
I
l
.
E
S'
C
:
¥
m
y
s
a
s
f
u
e
s¥XM
L
'
;
5
1
d
a
t
aMYF
I
l
.
E
S.APARTMENTS;
6
1s
e
tRESULTS.APARTMENTS;
7
l
r
u
n
;
コメント
読み込む泊<1Lフ ァ イ ル を 指 定
読 み 込 む MAPフ ァ イ ル を 指 定
MAPフ ァ イ ル の 設 定
フイブフリとするフォルダを指定
活<1Lファイルの APARTMENTに 含 む デ ー タ を SAS
デ、ータセットとして読み込む。
4
. 最新のファイナンス理論に基づいた不動産の価格とリスクの推定モデル
本論文では、不動産の価格とリスクを適切に評価しうる、統計モデ、ル IBox‑Cox変換付き線形混合効果モ
デ ル (Box‑CoxT
r
a
n
s
f
o
r
r
n
e
dL
i
n
e
a
rMixedE
f
f
e
c
t
sModel)J モデルを提案する。
まず、分析対象とする不動産を、その用途や立地する地域などによって「不動産クラス」に分類する。ま
た、不動産には、延床面積・築年数・駅徒歩といった「属性」が含まれている。これらは便益をもたらすた
め、不動産価格の源泉となる。このように、不動産価格をその不動産が持つ属性の線形結合によって説明す
る枠組みを「へドニック・モデル」としづ。
i=1
,
…,
N)に属する不動産 j(
1,
…,
n
,
)の価格 H
i
jを分析する。各クラス iに属するデータ数
不動産クラス i(
,
.
.
.
, N)とする。叫を iについて lから N
は、問ーでなくても良く、そのバランスの欠いたデータ数を n (i=I,
H
、 Box‑Cox変換 (
まで合計すると、 N である。不動産価格 H
1
9
6
4
)を施したべき乗価格 H;(
λ)を被説明変
υに
λ
(
λ 刊のとき)、 H;(
λ):=l
o
g
H
i
j(λ=0のとき)とした。説明変数で
数とする。具体的には、 H;(λ):=H;‑I/
‑362‑
ある不動産クラス iに属する不動産 j に含まれる属性 k を イ)( k=1 , . . . , K)なる説明変数とする。そして、 β( k ))と変量効果( V ; k )) に分離して推定する。これらはそれぞれ、不動産に依らず共通す その係数を固定効果( る属性単価(添字 iが付かない)と、不動産の個別性に起因して変動する属性単価(添字 iが付く)として解釈で y )(1=1,… ,N)は、不動産クラス iに属する不動産 j が、不動産クラ きる。また、同じく説明変数としての x = 1のときだけ 1を取るダミー変数である。これは、 N 個の不動産クラスについ ス lに属するとき、つまり ,i てのダミー変数によって複数に分離して置き換えられた切片とみることもできる。以上の表記を用いて、本 研究で用いる IBox‑Cox変換付き線形混合効果モテ子ル」は以下のように表現される: H~(λ) ここで、 = ヱ ェ;}pV}+ヱz?}{ptk)+vih})+Eq は,平均 0の NH 次元の正規分布に従う。その共分散行列は対角であって、成分は周ーである e i j とする。一方、 V, は、平均 0の K 次元の正規分布に従う。その共分散行列 G は、混合効果モデルにおいて、 自由にデザインすることができるが、本論文においては最も単純な構造として、対角行列を採用した。分析 .l . 3 の MIXEDプロシジャを用いる(Lit t e l le ta , . l2 0 0 6 )。モテ守ルパラメータの推定は、制限付録尤 では、 SAS9 法(REML;R e s t r i c t e dMaximumL i k e l i h o o d )によって行い、推定値は, BLUP( Be s tL i n e a rU n b i a s e dP r e d i c t i o n )とし て得ることとする。また、被説明変数である不動産価格に施す Box‑Cox変換の係数 λ の推定は、 Gurkae ta l ( 2 0 0 6 )の方法を用いて行う。 本モテ苧ルは、統計学の分野で、「線形混合効果モデ、ル (MixedE f f i 巴c tModel) J あるいは「ランダム係数モデ f f e c tModel) J と呼ばれるものの lつである。経時データ(lo n g i t u d i n a ld a t a )やノ 4ネルデータ ル (RandomE n e ld a t a ) を分析する際に有用とされ、近年盛んに研究されるようになったものである ( H s i a o,2003, ( pa F i t z m a u r i c ee ta , . l 2004 ,McCulloche ta . l2 0 0 8 ) 。 一方で、興味深いのは、本モデルは「動的一般均衡モデル」から導出されるということである(石島ー前田, 2 0 0 9 )。これは、ファイナンスや経済学の分野で、不動産・株式・債券・デリパティブといった資産価格評価 等を行う理論フレームワークである。理論モデルの結果を要約すれば、完全競争市場における均衡不動産価 格は、不動産が保有する属性とその単価との線形結合で表現されるということである。ただし、現実市場の 不動産価格を分析する際には、理論とはかけ離れた 2つの問題点がある。それに柔軟に対応・解決する統計 モデルが IBox‑Cox変換付き線形混合効果モデル」である。(1)現実市場は完全競争ではなく、情報の非対称 性や流動性の欠如によって、線形結合から歪んでいる可能性がある。そこで、これに対応するため、 BoxCox 変換を、被説明変数である不動産価格に施した。その変換係数 λ は、理論上の線形構造を含み (λ=0 )、歪み が大きくなると 0から君離する。 ( 2 ) 不動産価格を説明する属性の単価は、理論上、不動産に依らず共通する。 つまり、港区にあるマンションの平米単価も、足立区にあるマンションの平米単価も同じということである。 これは、ファイナンス理論でいう「一物一価の原則 J に対応する。しかし、直感にも実情にも合わない。そ こで、個々の不動産の強い個別性に起因して、平米単価等の属性単価は確率的に変動することを考慮すべく、 属性にかかる係数を固定効果と変量効果の混合効果とした。こうして、本統計モデルは、理論モデルに基づ きながらも、現実市場における不動産価格を柔軟に捉えうることを特徴としている。 J より取得した 2010年 4月初旬の関東地区のマンションの募集価格と属性に関 さて、先述の「スマッチ ! するデータを用いた Box‑Cox変換付き線形混合効果モデルの推定結果を「表 4 J に示す。なお、不動産クラ スを東京都心 3区、東京都区部、東京都下、神奈川県、千葉県、埼玉県、その他関東の N=8クラスとし、 属性を延床面積(平米)、築年数(年)、駅徒歩(分)とした。 ‑363・
表 4 不動産価格の推定結果 東 京 都 心3区 ダミー変数 東京都区部 ダミー変数 東京都下 タミ一変数 神奈川県 ダミー変数 千葉県 ダミー変数 埼玉県 ダミー変数 その他関東 ダミー変数 Box‑Cox 変換付き線形混合効果モプ、/レ ( λ =・0 . 0 5 ) 東尽都 、 J ; L その他 東京 埼玉県 東京都下 神 奈 川 県 千葉県 3区 関東 都区部 4 1, 6 2 4 . 7 3 ( く. 0 0 0 1) 39 , 7 0 4 . 7 8 (く.∞0 1) 3 9, 3 7 5 . 9 3 ( く. 0 0 0 1) 3 8, 9 9 2 . 0 4 ( く. 0 0 0 1) 3 9, 21 6 . 6 9 ( く. 0 0 0 1) 3 8, 5 9 3. 4 3 ( く. 0 0 0 1) 3 6, 7 3 8 . 0 0 ( く. 0 0 0 1) 6 9 . 0 7 7 8 . 7 8 6 4 . 8 2 7 3 . 0 0 5 7 . 4 4 6 8 . 8 7 7 2 . 2 0 (く.∞0 1) ( く. 0 0 0 1) ( く. 0 0 0 1) ( く. 0 0 0 1) ( く. 0 0 0 1) ( く. 0 0 0 1) (く.∞01) ‑ 3 . 2 1 ‑ 9 4 . 5 2 ‑ 2 4 6 . 5 2 ‑ 3 4 7 . 1 6 ‑ 21 . 14 3 4 6 . 6 9 ‑ 3 2 0 . 7 3 築年数(年) (0 . 8 3 8 5) ( 0 . 9 6 6 2) (0 . 5 2 9 5) ( 0 . 0 2 4 5) ( 0 . 0 2 0 0) (0 . 0 1 0 0 ) ( 0 . 0 2 8 0) ‑ 1 9 . 2 7 ‑ 2 0. 4 0 ‑ 3 3 . 6 3 ‑ 4 9. 4 2 ‑ 3 3. 4 0 ‑ 31 .7 3 ‑ 2 3. 4 2 駅徒歩(分) (0 . 1 7 0 9 ) ( 0 . 0 1 0 6) ( 0 . 0 2 6 7) ( 0 . 0 0 1 2) ( 0 . 0 2 0 5) ( 0 . 0 3 2 9) ( 0 . 0 8 5 2) 価格インゲック 8 , 5 5 2 4, 8 5 6 3, 9 4 0 3 , 9 4 5 3 , 5 1 8 3 , 458 2, 5 8 1 ス (く.∞0 1) ( く. 0 0 0 1) ( く. 0 0 0 1) ( く. 0 0 0 1) ( く . ∞0 1) ( く. 0 0 0 1) ( く. 0 0 0 1) 延床面積 (平米) 5 . XML形式データの出力:G o o g l eE a r t hへの出力例 本節では、 SASにより XML形式でデータを出力する例と方法を述べる。まず、 XML形式でのデータ出力 例として、 SASによる不動産価格分析の分析結果を XML形式で出力し、これを GoogleEarth(GE)上に表示さ 1、図 5 ‑ 2 ) 。前節の不動産価格の分析結果を、ユーザーにとって直感的で分かりやすい指標に置き せた(図 5‑ 換えたものを GE上に表示した。具体的には、(1)収集した個々のマンション情報について、その地理上の座 標に基づいて GE上にピンを打つ。ピンをクリックすることにより、次の情報を表示する。 ( 2 ) そのマンシ ヨンの延床面積・築年数・駅徒歩という属性情報を、前節の推定モデルに代入し、 BLUPとしてマンション 3 ) 理論価格(推定値)と募集価格(観測値) の理論価格を表示する。同時にマンションの募集価格を表示する。 ( の差は、モデ、ル上、正規誤差として表現される。また、その君離が大きいほど「お買い得」であることを意 4 ) 偏差値に応じてピンの色を分けて表示する。 味する。そのお買い得感を「不動産偏差値」として表示する。 ( 赤色(赤点)に近いほど偏差値が低く、青色 ( b l u ec h i p = 優良銘柄)に近いほど偏差値が高いことを意味する。 ( 5 ) 理論価格の 95% 信頼区間を GoogleChartToolsによる青いグラフで表示した(赤いグラフは募集価格を表す)。 9 5パーセンタイル)に対応し、 95%の確率で起 信頼区間の下限は、金融資産の市場リスク測度である VaR 9 5% ( こり得る最悪の底値=リスクを意味する。 開 364・
図 5‑ 1SASによる XML出力の GoogleEarth上への表示例: 不動産の立地座標の不動産偏差値による色分け表示 ' Jレ " ‑ i J ' . 1 I l 幅 * T ・・ 1 < ; '1 1'.;貧三" 1".1 H E 駅司¥"; ~~ 喫 " " . ""悶担川: ム 完珂 哩拘.喝 凶1"1: , ; 図5 ‑ 2SASによる XML出力の GoogleEarth上への表示例: 不動産の基本属性、募集価格・理論価格・偏差値・リスクの表示 次に、このような SASの分析結果を XML形式で出力するための方法について述べる。図 5 ‑ 1、図 5 ‑ 2を表 示するためには、 G o o g l eE a r t hや GoogleMapsで用いられる、 XMLの一種である KMLファイルを SAS側で t .km lJに示す。 出力する必要がある。その例を「スクリプト 5 ‑ 1: o u ‑ 3 6 5 ‑
ス ク リ プ ト 5・
l:out.kml
イ
1
ー
t KMLスクリプト
コメント
構造:以下のような構造になっている。
1
1<
?
X
I
I
Uv
e
r
s
i
o
n
=
"
1
.
0
"encodin
g
=
'
'
u
t
f
‑
8'
7
;
>
21<KML氾叫 n
s
=
'
h
t
ゆ
:
/
/
e
a
r
t
h
.
g
o
og
1e.comlkr叫/2.1う
恥1EN1>
3
1 <DOCU
4 <S1YL
EID=吋CON3う
LICONS
1YLE
LpLACEMARK
1YLE>...</ICONS1YLE>
<ICONS
5
6
7
</SτYL
E>
<S1YL
EI
D
=
'
1
CON4う
8
<ICONSτYLE>...</ICONSτYL
E>
9
1
1
</S1YLE>
<PLACE
MARK>
伍〉ガーラ・レジデンス浅草〈爪1 M
伍〉
<NM
12
<SτYLE
URL>#ICON4</S1YL
EURL>
13
14
15
<DESCRIPTION>.
.
.</DESCRIPTION>
16
17
139.799965,
35.717301
</COORDINATES>
18
<IPOINT>
10
19
(20)
DOCi
l
l
.
担NT
LS1YL
E (アイコン S1YL
Eの定義)
LNA
恥E
LS1YL
EURL(アイコン S1YL
Eの呼び出し)
LDESCRIPTION
<POINτ〉
くCOORDINATE
S>
(説明バルーンに表示される
ユーザー定義コンテンツ)
LPOINT
L
cOORD町 ATES(経度、緯度)
また、 KML
ファイルは以下の 3部に分けられる。
① header部分(アイコン S1YL
E等の定義部分)
<PLACEMARK>の 前
②物件データ部分
<PLACE
MARK>の繰り返し
③ footer部分(終了タグ〕
<PLACEMARK>の 後
</PLACEMARK>
21 </DOCUMEN1>
22く/IO.征>
ス ク リ プ ト 5‑2:out.sas
SAS
スクリプト
コメント
II%LETkml̲header̲file='
'
C:
¥
m
y
s回日 e
s
¥
o
u
t
p
u
t
¥
k
r
叫 h
e
a
d
e
r
.
c
s円 h
e
a
d
e
r部分を外部ファイルに記述しておく。
2
1%LETk
m
l
̲
f
o
o
t
e
r
̲
f
i
l
e
=
''
C
:¥
mys
回日 l
e
s
¥
o
u
t
p
u
t
¥km
l
̲f
o
o
t
er
.c
s
v
"
; (kml̲h
e
a
d
er
.c
s
v
)
f
o
o
t
e
r部分を外部ファイルに記述しておく。
k
m
l
̲
f
o
o
t
er
.c
s
v
)
e
=
"
C
:¥m
y
s
ぉ白 l
e
s¥
o
u
t
.
1
a
叫
'
:
出力する KMLファイルを指定
31%LET1a叫白 l
4
1d
a
t
aMYFILES.APARl
乱1E
NTS;
SAS
データセット l
こKML
スクリプトのタグを文字
5
1s
e
tMYFILES.APARl
乱伍NTS;
変数として加える。(②物件データ部分)
6
1 keepi
dname.
.
.t
a
g
lt
a
g2…;
7
1t
a
g
l='くPlacemark><name>';
g
2= 吋name><styleUrl>';
8
1t
a
(
9
)
1
0r
u
n
;
ロd
a
t
a
f
i
1e=&kmlh
e
a
d
e
rf
i
l
e
①h
e
a
d
e
r
部分をSASデータセット (kmlh
e
a
d
e
r
)
r
o
cimpo
1
1p
e
a
d
e
r r
e
p
l
a
c
e
;
として読み込む。(変数名士 v
a
r
lが白動的に与
out=MYFILES.1a叫 h
えられる)
e
t
n
a
m
e
s
=
n
o
;
1
2 g
1
3l
r
u
n
;
1
4p
r
o
cimpo
ロdatafile=&kml footer f
i
l
e
③f
o
o
t
e
r部分をSASデータセット (kml f
o
o
t
e
r
)
t
=
MYFILES.kml̲footer r
e
p
l
a
c
e
;
として読み込む。(変数名 =
v
a
r
lが自動的に与
ou
1
5 g
e
t
n
血n
e
s
=
n
o
;
えられる)
1
6l
広
r
u
p
t
i
o
n
sm
i
s
s
i
n
g=fI ;
1
7o
以下の処理で欠損値をnuI
l
に
す
る
。
1
8d
a
t
a
;
b叫 h
e
a
d
e
r(
①h
e
a
d
e
r部分)、 APARτMENTS
(②物f!:データ部分)、 kml f
o
o
t
e
r(
③f
o
o
t
e
r部
1
9 s
e
tMYFILES.kml h
e
a
d
e
r
MYFILES.APA
R
τ恥1E
NTSMYFILES.kml f
o
o
t
e
r
;
分)の順に、 SASデータセットを結合し、 3行で
i
l
e&
k
m
l
̲
f
i
l
et
e
r
m
s
tr
=LFencoding
=
'
1
.
J
I
F
・8
"
指定したKMLファイルに出力する。
20 f
I
r
e
c
l
=
8
1
9
2
;
にのとき、 p
u
tステートメントで、②物件データ部
u
t四 r1t
a
g1namet
a
g
2a
d
d
r
e
s
s.
.
.
;
分が KMLスクリプトになるよう、変数の出力順序
21 p
を指定する。)
22r
u
n
;
行
‑366・
上記の「スクリプト 5 ‑ 2 : o u t 品 s J は、「スクリプト 5 ‑ 1: o u t .km lJを出力する SASプログラムである。 Header 部分と F o o t e r部分はあらかじめ外部ファイルに ωvファイルとして記述しておく。物件データの繰り返し部 u tステートメントにより出力する。 I H e a d e r部分 J I 繰り返し部分 J I F o o t e r部分」という構造はどのよ 分を p うな XML形式のデータにも共通の特徴であり、本出力プログラムはどのような XML出力形式にも共通で対 応できる。 6 . まとめ 本論文では、今後ますます重要だがその基礎が十分に浸透しているとは言い難い、 Web上の XMLデータ を SASに取り込む方法と、 SASにおける XMLファイルの入出力を行う方法を示した。要点は以下の 3点で ある。 I.Web上のデータの取り込みには、 F i l e n a m eステートメントを用いる。 2 任意の XMLファイルを、 SASデータセットとして入力するには MAPファイルを用いる。 3 .SASデータセットから XMLファイルに出力する際には、 XMLの I H e a d e r部分 JI 繰り返し部分 JI F o o t e r 部分 J としづ構造に着目する。 また、応用例として、不動産パリュエーションマップを作成した。今後も、このようなチャレンジを通じ て、クラウド時代の SASの役割や可能性を模索・提案し、また、高度に発展しつづける金融・不動産分野へ 貢献し続けたいと考えている。 7 . 参考文献 [ 1 ]Box,G .E . P .a n dD . R .Cox( 19 6 4 ), AnA n a l y s i so f T r a n s f o r m a t i o n s( w i t hD i s c u s s i o n ), "Joumal01t h eRoyal S t a t i s t i c a lS o c i e ・ かS e r i e sB, 26, 2 1 1 ‑ 2 5 2 . .M.,N.M.L a i r da n dJ . H .Ware( 2 0 0 4 ), A p p l i e dL o n g i t u d i n a lA n a l y s i s,J o h nWiley& Sons,I n c . [ 2 ]F i t z m a u r i c e,G [ 3 ]Gurka,M., . JL .J .Edwards,K . E .M u l l e ra n dL . L .Kupper( 2 0 0 6 ),E x t e n d i n gt h eBox‑CoxT r a n s f o r m a t i o nt ot h e かム 169(2),273‑288. L i n e a rMixedModel, "J o u r n a l01RoyalS t a t i s t i c a lS o c i e [ 4 ]H s i a o, C .( 2 0 0 3 ), A n a l y s i s01PanelD a t a :SecondE d i t i o n, CambridgeU n i v e r s i t yP r e s s . 2 0 0 9 ) I 不動産価格評価の一般麗命 J [ 5 ] 石島博,前回章 ( 季大会予稿集~ W日本金融・誌券計量・工学学会 (JAFEE)2009 冬 9 3 ‑ 1 11 . [ 6 ]L i t t e l l,R . C .,G . A .M i l l i k e n, w . w .Stroup,R.D.WolfingerandO.Schabenberber(2006),SASlorMixedModels: SecondE d i t i o n,SASP u b l i s h i n g . . E .,S . R .S e a r l ea n dJ . M .Ne 吐l a u s( 2 0 0 8 ),G e n e r a l i z e , dL i n e m ;andMixedM o d e l s :SecondE d i t i o n, [ 7 ]McCulloch,C J o 凶 W iley&S o n s . SAS9 . 1 . 3XMLL1 BNAMEE n g i n e :U s e r ' sG u i d e,SASP u b l i s h i n g . [ 8 ]SASI n s t i t u t eI n c .( 2 0 0 4 ), (以上) ‑ 3 6 7 ‑
産業連関表の三角化の検討 0中村竜児 株式会社インクリース研究所 T r i a n g u l a t i o nofi n p u t ‑ o u t p u tm a t r i c e s R y o j iNakamura LTD. INCREASECO, 要旨 産業連関表の産業部門を最終財産業、中間財産業、基礎的産業のl j 聞に並べ替える手法として、産業連関 表の対角線左下三角行列和を最大にする三角化とし、う手法を検討する。 キーワード:産業連関表、三角化、ハイアラーキー 1 . はじめに 産業連関表は、農業からサービス業に向かつて便宜的に並べられた産業部門の l 頃列に従って作成されてい .SimpsonandJ .T s 山u i( 19 6 5 )は、産業連関表の順列を最終財産業、中間財産業、基礎的産業の順で並べ る 。 D 替えることで産業連関表の対角線の左下に取引を集めることで、産業聞の取駅構造が単純化され産業構造の 国家問の類似性や時系列における変化を概観できることを示した。 三角化の手法は様々な方法が考案されているが本研究では産業連関表の対角線左下三角行列和を最大にす る方法を検討する。この方法は部門順列は必ずしも最終財産業から基礎的産業へと並べるものではないが、 順列の基準としては分かりやすい物である。よってこの手法を実際のデータにあてはめその有用性を検討す る 。 2 . 産業連関表の三角化 2 .1 . 三角化の手法 三角化の目的は産業連関表の部門の順列を変えることにより、左下三角行列和を最大にすることである。 産業部門の全ての並び順に対して左下三角行列和を求め、左下三角行列和が最大となるときの順列を求めれ J 慎手iJの数は天文学的な数字となり現実てきではない。三角化の方法論に ばいいが、部門数が増えるに従ってI ついてはこれまで多くの研究がなされてきたが、以下では目建軍・時永祥三 ( 2 0 0 7 )にならって説明する。 , j要素を Xijとすると、左下三角行列和は次のように表される。 産業連関表 X の i R(X)= LX J i• I<J ‑369・
三角化は R(X)を最大にする操作である。 部門数を nとし、全ての部門の並びを N=( l ム … ,n) とする。 この順列 N の隣り合う 2つの部分順列 I = ( i, ., j ‑ 1 ) とJ =0, …却 (k< 司 1 ) を定義し、この 2つの部分順列を入れ替える操作(置換操作)を r uとし、入れ替 (r u ) とする。 え操作を行った結果得られる産業連関表を X ここで置換前後の産業連関表の左下三角行列和の差 λuは次式で表される。 λJj = R(X(r Jj))‑ R (X) 入れ替え操作 r uを図で示すと次のようになる。図 lから分かるように、 r uにより左下三角行列車口から A の部分が除かれ、 B の部分が新たに加わることになる。 J J 主 日 件 仁 つ : J 図 l ここで A、Bに含まれる要素の和 S(A)、S ( B )は次式で表される。 L X j, S(B)= L X i , S(A)= i ε 2l, jεJ j ε 2l, jεJ よって λuは ん =S(B)‑S(A)= 工( X i, j‑xjJ) i E l, jEl λuが正である間置換操作を実行することで左下三角行列和は最大化される。 2 . 2 . プログラムのアルゴリズム 三角化のための実際の処理の手l j 頂を以下にまとめる。 …,n・1 ) について、すぐ下の第 i + 1部門からの投入 X i +l .i と第 i + 1部門への販売 X i什 lを比較す 第 i部門(i=1ム る 。 X川 i > Xi . i + lであれば第 1部門は第 i + 1部門よりも基礎的な部円であるとして、この 2つの部門の順序を入 i + l〆X j, i + Iであれば第 i + 1部門の処理へ移る。 X i + l . i =Xj ・ i + lであれば l部門増やし第 i + 1・i + 2部門から れ替える。 X i + li . +X同 1 と販売 X i. i + l + Xi i .+ 2を比較する。値が等しい聞は部門を増やしていき、最終的に第 i + k部門まで の投入 X X i + l . i +…+ X i 也i ) > (X i . i + l + …+ X i . i + 2 )となったら、第 i部門と第 i + 1, . ・ . ,i + k部門を置換する(図 2参照)。 含め、 ( ‑370・
‑ ・ ・ i + l i + 2I i i + l i + 2 XU+l IXU+2 ・ ・ ・ Xi + l . i 令2 Xi+I, i Ix け2 , iI X付 2, i + 1 図2 以上の処理を第 n・ 1部門まで繰り返し、置換操作が l回でも行われたら第 l部門に戻って同じ処理を行う。 第 l部門から第 n ‑ 1部門までのループの中で置換操作が l度も行われなくなったら処理を終了する。以下、 この第 l部門から第 n ‑ 1部門まで、のループ処理を大ループ、第 i部門における投入額と販売額を比較するルー プ処理を小ループと呼ぶこととする。 3 . データへの適用 3 .1 . 使用するデータ 前節に示した三角化のアルゴリズムを日本の産業連関表に適用してみる。使用するデータは経済産業省の 1 9 7 3年から 1 9 9 9年までの延長表(取引額表)とする。取引額は 1 9 9 0年基準の実質額である。 5で以下の通りとする。 部門数は 4 表 l 2 3 4 5 6 7 8 9 1 0 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 2 0 2 1 2 2 2 3 農業 林業 漁業 石炭・原油・天然ガス その他の鉱業 食料品(含:飼料) 飲料・たばこ 繊維製品 木材・木製品・家具・装備品 パルプ・紙・紙製品 新聞・印刷・出版 化学肥料・農薬 化学中間製品 化学最終製品 石油・石炭製品 ゴム・プラスチック製品 皮革・同製品 窯業・土石製品 鉄鋼・同製品 非鉄金属・同製品 金属製品 特殊産業機械 その他の一般機械 2 2 2 5 2 2 2 4 4 4 4 4 4 4 4 4 4 4 3 4 3 3 3 24 2 5 2 6 2 7 2 8 2 9 3 0 3 1 3 2 3 3 3 4 3 5 3 6 3 7 3 8 3 9 40 4 1 42 4 3 44 4 5 民生用電気機器 その他の電気機械 自動車 その他の輸送機械 精密機械 その他の製造工業製品 建築 土木建設 電力 ガス・水道・熱供給 下水道・廃棄物処理 商業 金融・保険・不動産 運輸 郵便・通信 対企業サービス 公務 教育・研究 医療・保健 その他のサービス 分類不明 家計外消費支出 3 3 3 3 3 3 5 5 5 5 5 5 5 5 5 5 5 5 5 表 lの 3列目はブロック分類で、 1:公共サービス、 2:第 l非金属、 3:金属、 4:第 2非金属、 5:エネルギ ー・民間サービスとした。 ' 3 7 1・
3ユ 三角化の最適解 呂建軍・時永祥三 ( 2 0 0 7 )に「プログラムの性格上、主対角線から下の要素の比率が最大となる組み換えは複 数個存在する」とある。また三角化のアルゴリズムにおいて、大ループの実行回数に制限がかけられている ものが見受けられる。最適解が複数存在するのは大ループを途中で終えているためなのかは分からないが、 今回作成したプログラムは置換操作が行われなくなるまで大ループを繰り返すようにした。データへの適用 では大ループは最大 3 0回繰り返されていた。また部門の初期順列により結果が変わるかどうかを確認するた め 、 1 9 7 3年のデータについて乱数を用いてランダムに所期1 ) 慎列を変えて三角化を行う処理を 1 0 0回繰り返し たが、三角化後の順列は全て閉じで、あった。 3 . 3 . 三角化後の部門順列 1 9 7 4・1 9 8 0・1 9 8 5・1 9 9 0・1 9 9 5・1 9 9 9年の三角化後の部門順列を表 2に示した。順列は産業聞の取引額の 相対的な大きさによるところもあるため、経時的に部門の順位が大きく変動しているからといって基礎的部 門から最終財部門へと大きく転換したとは一概には言えないであろう。そのなかで全期間を通じて順位がそ れ程変化していない産業部門は、基礎的部門として新聞・印刷・出版 ( 1 1 )、電力 ( 3 2 )、ガス・水道・熱供 給 ( 3 3 )、下水道・廃棄物処理 ( 3 4 )、金融・保険・不動産 ( 3 6 )、運輸 ( 3 7 )、郵便・通信 ( 3 8 )、対企業サー ビス ( 3 9 )、中間財部門として商業 ( 3 5 )、最終財部門として民生用電気機器 ( 2 4 )、自動車 ( 2 6 )、建築 ( 3 0 ) が確認された。 表 3 は三角化後の部門順列をブロック分類で表示したものである。 1~45 の順列を最終財産業、の 3 段階 に分けたときのブロック分類の配置を考えてみる。上下の変動誤差を考慮、し、 1~18 位を最終財産業、 13~ 33 位を中間財産業、 28~45 位を基礎的産業とすると、全期間に渡って金属産業のほぼ全てが最終財産業に入 り、基礎的産業のほぼ全てが第二非金属とエネルギー・民間サービス産業で構成された。公共サービスは基 礎的産業(公務及び医療・保健)と中間財産業(教育・研究)とに分かれた。 三角化後の産業部門順列の経時的な類似性をみるために Spearmanの相関係数を求めた(表 4 )。表では 0 . 8 以上をボールドで示している。全て 0 . 6以上で、あったが、オイルショックの年である 1 9 7 4年が前年とは 0 . 8 6 3 であるものの、それ以降については全ての期間に渡って 0 . 8未満で、あった。一方で、、全ての取引額の和に対 9 7 4年だけ 80.3%と突出し する左下三角行列和の割合を求めてみると他の年が 60%台であったのに対して、 1 て高かった。 図 3は三角化後の産業連関表に対して、取引額に対応してマトリックスをグレースケールで色分けした物 である。色分けの仕方は恋意的であり、産業聞の相互依存取引を計量的にとらえたものではないが、 1974年 は全体的に産業問の相互依存取引が低い中で左下三角行列和の割合が最も高くなっており、逆に左下三角行 列和の割合が最も低かった 1999年は相互依存取引が高くなっていることが示唆された。 4 . まとめ 本研究では、産業連関表による経済分析手法の lっとして産業連関表の三角化とそのアルゴ、リズムについ て検討した。プログラムは SASのデータステップを利用し(本報告では省略)、このプログラムを 1 9 7 3年か ら1 9 9 9年の日本の産業連関表に適用した。三角化後の部門 1 ) 慎列を検討するため産業部門を 5つのブロックに 分け、最終財産業、中間財産業、基礎的産業それぞれにおけるブロックの構成を検討した。また経時的な産 業構造の推移を検討するため、 Spearmanの相関係数により各年の部門順列の類似性を見るとともに、取引額 に応じて産業連関表をグレースケールで、塗りつぶすことにより産業聞の相互依存取引の程度を表し、左下三 ‑372・
角行列和の比率とともに比較検討した。 取引額表を用いた場合は取引額の構成比が影響を与える。今回の三角化では、他産業との取引がまばらな 部門が基礎的産業に配置されるなど直感的には解釈しにくい結果も得られた。また産業構造の経時的変遷を 考察するには至っていない。産業構造の類似性をみるには投入係数表の三角化も検討する必要がある。 参考文献 [ 1 ]D . Simpsona n dJ .T s u k u i ( 1 9 6 5 ) :The加 d a m e n t a ls 回 c t u r巴 o ft h ei n p u t‑o u t p u tt a b l e s,Ani n t 巴m a t i o n a l c o m p a r i s o n、 ReviewofEconomicsa n dS t a t i s t i c s, v ol .47, no. 4 , pp. 43 4 ‑ 4 4 6 .K o r t e and W.O b e r h o f e r( l9 7 0 ) :T r i a n g u l a t i o ni n p u t ‑ o u t p u tm a t r i c e s and t h es t r u c t u r 巴 o fp r o d u c t i o n、 [ 2 ]B E u r o p e a nEconomicReview ,v ol .l ,no, 4 .p p . 3 9 8 ‑ 4 3 3 .T o v i s s i, T . S p i r c uandAL.T a s n a d i ( 1 9 7 8 ): Economics y s t e ms 廿u c t u r eh i巴r a r c h i z a t i o n、EconomicComput 且t i o n [ 3 ]L ,v o . ll 3,n o . l,pp. 45 ‑ 6 1 andEconomicC y b e m e t i c sS t u d i e sandR e s e a r c h [ 4 ]A . R .B e k i n (1 9 8 1 ) :A p p r o x i r n a t et r i a n g u l a t i o no fm a t r i c e si np r o b l e mo fr a n k i n gandp r o c e s s i n go fi n t e r ・ b r a n c h b a l a n c e s、E n g i n e e r i n gC y b e m e t i c s,v o l l 9,n o . l, p p . 1 3 ‑ 1 7 8 9 ):産業連関構造分析の研究生産技術とハイアラーキ一、啓文社 [ 5 ]福井幸男(19 [ 6 ]日建軍・時永祥三( 2 0 0 7 ):アジア国際産業連関表の三角化によるハイアラーキー性分析、九州大学経済 学研究 ‑ 3 7 3・
表2
ω
‑
・
斗 AF
1
9
7
4
l食料品(合:~oj 料)
21
1
.
出
1
;
3化学肥料・ j
由来
4
1'
1
1
耐J
!
J
i
5村干問機械
6その他のー般機械
7特 保 f車業機械
8民ノ'
l川電気機器
9也築
1
0その他の製造 1
:業製品
1
1漁業
1
21‑1:木Uto
l
t
1
3その他の電気機械
1
4皮市・ I
,
l
i
製品
1
5木材・本製品・家具・装備品
1
6令脂製品
1
7鉄鋼・ I
,
l
i
製品
1
8公務
1
9医術・保健
2
0化 学1
止終製品
2
1教‑()・研究
2
2ゴム・プラスチック製 l
U
1
2
3窯業・T.イ1製
1
1
:
,
2
4繊維製品
2
5化?'i'
II
l
!
¥
<
:
!
品
2
6
1
4
1鉄イHJ
¥
・ I
,
i
l
!
¥
<
:
!品
2
7その他の鉱業
2
8休 業
2
9商業
3
0運 輸
3
1その他の輸送機械
3
2 ドホ道・暁梨物処剤
3
3パルプ・紙・紙製品
3
4ガス・ホ逝・熱供給
3
5
1
1
l
i力
3
6
1
1
,
司 h・ィ,炭別品
納・人ー然ガス
3
7イ1m・町1
3
8金融・保険・不動庵
3
9対企業サービス
401*,叶外泊代文/11
4
1その他のサービス
4
2飲料・たぽこ
4
3郵便・泊目
4
4分知不 i
Y
J
4
5新 I
I
H'印刷)
'
1
1
1版
1
9
8
5
1
9
9
0
飲料・たばこ
食料品(合。飼料)
t
‑
c
本佳品t
公務
祢業
その他の輸送機械
1
',
励
。1
:
0
特殊伴ー業機械
医療・保健
性!築
l
l
r
&
十
:
本i
公務
その他の輸送機械
特殊所業機械
特殊版業機械
七本企s:i
世
公務
1
'
1
1
d
J
'
IO
:
u
t築
1
9
8
0
1
‑
̲,
f
;
U
to
l
t
公務
特殊""業機械
l
'
I
1
0
J'
1
他策
l
e
l,川屯気機器
村拝i
機械
その他の一般機械
その他の電気機械
その他の製造 :
1業別品
皮 Itl'~ • 1
,
i
J
!
製
品
医械・ 1
記他
金属製品
鉄鋼・j,l
i
製品
4
1
'鉄俊民・ h
i
J別品
j
官業・ I
:
+
>製品
その他の鉱業
その他の輸送機械
化学1
吐終製品
ゴム・プラスチック製 l
1『
繊制忠則品
化学t!q
l
l
J製品
教育・研究
l
'j~ 文 111
家,叶外iI
その他のサービス
飲料・たぽ ζ
食料品(‑;'}j:飼料)
J
出来
漁業
木材・本拠品・家具・装備品
林業
品集
化午肥料・ l
イ
'
f
V
I
分
l
'
Ji
商業
迎4
曲
トホ迫.If!JIti物処P
I
!
誼・熱供給
ガス・ホ i
能力
金融・保険・不動雌
対企業サービス
郵便・通れ
新I
H
J・
印
)
(
,1
卜1
1
1版
パルプ・紙・紙製品
石油・石炭製品z
l
イi
J
;
R
.
.
J
j
i
;
訓1
・天然ガス
l( ノ|二 J lJ'r1t~(機器
M需機械
その他のー般機械
その他の Ylì~( 機械
皮相・│川製品
繊維製品
その他の製造 1
:
:
革製 t
i
l
t
Jl~業
ノトー材・木製品‑家具・装備品
化
♂{
:
I
巴料・!出来
イ任属製品
鉄鋼・[li
J
!
l
l
!
U
I
I
'
化"i':J止終 ~lM,
ゴム・プラスチック!ruM,
u
宮
? 長・士イ1製品
化γ '
i
'
i
日l
製品
非鉄イ托属・ h
i
J拠品
その他の鉱業
林業
教育・研究
向1;
運輸
ガス・ホ道・熱供給
1
l
i力
J
eJlti物処 P
I
!
ドホ道.I
金融・保険・寸'
1
0
1雌
対企業サービス
家,叶外 il'lt~文 1 1\
その他のサービス
分f
t
iイ、明
踊i
f
出
・ j
i
l
l
f
オ
新1
m・
同1
,(1
)
'
1
1
1版
ペノレプ・紙・紙製品
ポれ1
I・石炭製品
・ぷ然ガス
イ3炭・原則1
1
9
9
5
l
'
1
1
0
J
'
I
'
l
e
l,川地主[機器
その他のー般機械
l~ ノ 1 ,川電気機器
民械・保側
M務機械
半月続機械
皮.
'
I
・
.
i │
μ
l製品
その他の・般機械
その他の1li気機械
その他の製造 :
1業製品
木材・本製品・家具・装世H
A
l
l その他の屯気機械
金属製 I
l『
木材・本製品・家具・装備品
鉄鋼・[l
l
i
製品
繊維製品
・
i
止終製品
化予 M終製品
化7
教‑()・研究
ゴム・プラスチック製品
医療・保健
t
且築
家 J十外 il'lj~ 主/1 1
イÎ'i: kJ\~見品
その他のサービス
飲料・たばこ
皮市・│川製品
林業
繊維製品
食料品(合飼料)
その他の製造t:業製品
1
民業
品集
化''f:肥料・ I
漁業
ゴム・プラスチック製品
,
l
i
拠品
鉄鋼・ I
気 楽 .‑
1
‑
̲
1
可
i
.
m
"
lM
,
i
'
'
I
'
I
I
U製品
化 ρ'
4
1鉄金属・│川製 1
1
その他の鉱業
教育・研究
然来・イ:1->-~到 I~;I
化学, !
q/:J製品
4
1鉄イh属・j,l
i
製品
その他の鉱業
開業
且t
輸
ガス・ホ道・熱供給
イ
k融・保険・不動'
l
巨
分軍 l
イ
.
"
珂
ドホ道.If!泉:物処刑1
地力
対企業サービス
郵便・岨 f
;
l
新1
m・
印
)
(
,1
卜I
I
H
恒
パルプ・紙・紙製品
石油・イ可炭製品
l
:
R
.
'
原
則I
'}i.然ガス
イi
家,1-十外 iì'lt~主/1\
その他のサービス
林業
飲料・たばこ
食 料 M,(合,飼料)
J
1
2業
F
i柴
化学肥料・ l
漁業
商業
ドホ泊・)蕗楽物処刑1
迎輸
その他の輸送機械
ガス・ホ泊・撚{J~給
百I
力
金融・保険・ ‑H
l
)
J
雌
対企業サービス
i
l
l
f
オ
郵便・ j
新1
m
.印刷・ 1
1
:版
分宮川、 I
Y
J
パルプ・紙・紙製品
石油'1‑>炭製品
イ可決.D
;
t
訓l
'天然ガス
1
9
9
9
七
本
U
t
,
i
l
l
:
公務
飲料・たばこ
皮
,'
I
.
i'
I,
]
i
製品
食料品(合.飼料)
m
占業
その他の輸送機械
特味厳業機械
I
H
O
J
'
IO
:
化学肥料・ j
員柴
u
t策
l
t
'̲
'
I川電気機器
その他のー般機械
医療・保健
その他の製造 :
1業製品
漁業
利害i
機械
その他の電気機械
木材・木製品・家具・装備 t
i
l
t
合属製品
鉄鋼・ I
,
l
i
製品
繊維製品
'
:
J
t
,
t
終
製l
1
1
化 ρi
林業
ゴム・プラスチック製品
ヲ~~位・七千イ製品
製品
化
乍
'
i
'
i
日l
非鉄<1>:縞・ I
,
l
i
製品
その他の鉱業
教育・研究
商業
ド水道・廃染物処 P
I
!
i
i
l
l
輸
明白力
対企業サービス
*
,l
十
外1
1
'
l
j
'
/文 1
1
1
その他のサービス
ガス・水道・熱供給
全国連・保険・不動躍
郵便・ j
i
l
l
f
汀
新I
I
H・印刷 '
1
1
1版
分聖i
‑
f
、
明
パルプ‑紙・紙製 t
i
l
l
布引1
I・4
可炭製品
/
f
.
!.
原則1
・人ー然ガス
イi
表3
‑∞斗切・
2
2
1第‑.41
金属
2
3
1第一‑.41
合同
2
4
1第一 J
Iイ
T
:l
J
¥
2
5
1第一 J
Iイ
T
:
l
J
'
.
2
6
1第一 J
Iイ
T
:M
I合同
2
7
1筑 J
2
8
1
m 1
令属
2
9
1エネルギー・[,, 1
:
1サービス
3
0
1エネルギー・[,, 1
1サービス
3
1
1合同
3
2
1エネルギー・[.::I
U
I"¥1ーピス
3
3
1第‑.41
イ
T
:M
3
4
1エネルギー・民 1
:
1サービス
3
5
1ェ才、ルギー・民l1iJ‑tJーピス
3
6
1第←ソl合服
3
7
1エネルギー・サービス
3
8
1エネルギー・民 1
:
1サービス
3
9
1エネルギー・ 1
,
1
/
1
1
サービス
4
0
1エネノレギー・民1/
1
:
サービス
411xネルギー・ 1
'
:
:
1日l
サーピス
4
2
1第サ│合同
4
3
1エネノレギー・民間l
サービス
4
4
1エネルギー・ W日l
サービス
4
5
1第一 J
I金属
,'
エネノレギー・ l~111Jリーピス
令胤
イ
T
:M
4
刈
品
イ
T
:
1
I
l
4
け4
第一 J
I金 属
公共サービス
イ任属
イ任属
第て非イT:l
J
¥
第て非イ任属
第非金属
イ川品
第て非イ任属
第一非命.属
第 非イ任属
第一非合属
公共サービス
¥
;
I
I
I
)サービス
エネルギー・ L
1
リサービス
エ ネ ル ギ ー ・ 民:
百
¥,
.1
ィ
T
:l
.
t
第 '~I ィÞ: M
第サドイ任属
第 ~I 金属
第一, 州立
第サドイT:M
.
百¥
‑
.
J
I金 属
:
1サービス
エネノレギー・民 1
:
1サービス
エネノレギー・民 1
1
リサービス
エネノレギー・民:
エキノレギー・民 1
:
1サービス
1
'
<
エキノレギー・民/Il
I
サービス
:
1サービス
エネルギー・民1
エネルギー・ l~l: lJサービス
エネルギー・民1/
1
1
サービス
サーピス
エネノレギー・民I1U
筋て, 1合同
第一非金属
第
JI' <i~11\
立
¥'
J
I
'0
.
l
J
¥
,
令1
(
0
.M
0
.
H
J
¥
公共リーピス
:
1サービス
エネノレギー・[, 1
金制
ィ
T
:l
.
t
合同
合同
第‑., 1合 同
第一J!'0.腕
0
.1
品
百
¥.
J
I合 同
第一J!金属
第‑.J!イ川見
合同
ィ
T
:M
.
第一 J
I令 M
l
f
¥‑
.
J
I合 同
.
J
Iイ
T
:M
第‑
m
‑
.
J
I
'<
i
予
防
第一 J
I
'0.1
1
¥
百
¥,
.1
ィ
T
:M
苛
¥.
J
I合同
公共サービス
mサービス
エ ネ ル ギ ー ・ 民1
エネルギー・[,, 1
:
1サービス
:
I
Iサービス
エネルギー・ W
エネルギー・1(1:
1サービス
エネルギー・ l
¥
:
I
I
I
Jサービス
エネルギー・民間サービス
エネルギー・民IIlJ
サービス
エ ネ ル ギ ー ・ 民1
1
¥lサービス
サービス
エネルギー・[,/Il1
1サービス
エ ネ ル ギ ー ・ 民1
エネルギー・民1/
1
1
サービス
第←ソ│イT:M
m
‑
.,IィT:l.
t
第一,1' イÞ: l~
百¥
‑
'
.
J
I
ー
イ
i
l
:M
エネノレギー・サービス
エネノレギー・サービス
エネルギー・ W
:
I
Iリーピス
イ
T
:M
合属
イ
T
:M
イ ¥
I
第て非合川
イ
Q属
H
イ
h属
第て非イT:M
公共サービス
エネルギー・ t
,l
iiJサービス
エネノレギー・ l
此
t
υ
1
:
川
日
!
1
]
"
1
サ
F一ピス
第
第て非イ令Þ: l~
4
第
第て非イ令任属
首
筋1
イ
令
任
川
』
似
品
第非合 j~
第 てJ
Iイ
T
:M
第サ│合同
第て非合』見
書I
でJ
I金属
第ぺ非合川
第て非合川
首
¥.
J
Iィ
T
:
f
l
¥
エネルギー・ L
c
.
l
/
Uサービス
エネルギー・ 1
,1
:
1サービス
'
:
:
1
:
1
1サービス
エネルギー・ [
エネルギー・民川サービス
エネルギー・民 1
:
1サービス
:
:
Iサービス
エネルギー・ W
,
1
/
1りーピス
エネルギー・ 1
I
Iサービス
エネルギー・ K/
エネノレギー・[.::川ザーピス
第て引金属
第一非合属
1
金属
第‑.,'
エネノレギー・サービス
1
9
9
5
ススススススススススススス
ピピピピピピピピピピピピピ
一一一一一一一一一一一一一ス
サササササササササササピ
川間間問問問問問問川山一
民民民民民民民民民民民民民サ
ス・スス・
一ピ一ピ以属
M M属 属
M刷 局 属 ピ 一 一 MMM胸 属M M 一 一 一 一 一 一 一 一 属 一 属
M 一
ギ一ギ一命令命令
A
司令金命令一ギギ命令命令令合ギギギギギギギギ合ギ命令ギ
白1 i tレh I I I ‑ I I I ‑ ー ト ノ レ レ Illli‑‑11111レ レ レ レ レ レ レ レ
じh
I
aJllL
ifレ レ h
l
J J J J 4下4
J44
寸ノノ JJJJJ4
4
4l4
F
ノノノノノノノノ
2
1
1公共サービス
エネノレギー・ W
I
I
Iサービス
公共サービス
e
1
4
1第一 J
Iィ
T
:l
J
¥
1
5
1第一非合以
1
6
1金 属
1
7
1合同
1
8
1公共サーピス
1
9
1公共サービス
2
0
1節目吟,1
合同
J
¥
イ
T
:l
金属
1
9
9
0
エネルギー・[, I
I"
'
t ピス
公共ザーピス
イ任似
合同
合同
公共サービス
レ aノ レ
ノーノ
1
3
1ィT:l
J
¥
1
9
8
5
耳
¥ J
Iイ
T
:M
品川エ公品川エ命令 公 令 都 合 併 第 第 第 筋 合 併 第 第 第 第 公 エ エ 都 第 第 第 筋 第 エ エ エ 合 エ エ エ エ エ 第 エ 第 加 工
,
1
9
8
0
エネルギー・ 1
'
:
:
1
:
1
1サービス
公共サービス
ノ
M ネ 共 属 ネ M M比胤一 MM叫一一 ‑ ‑ M M 一 一 一 ョ 共 ネ ネ ‑ ‑ ‑ ‑ 一 ‑ ネ ネ ネ 脂 ネ ネ ネ ネ ネ 一 ネ 一
.一ネ
1
9
7
4
1
1
m '~I 合同
2
1百
¥ '~I イÞ: lJ\
3
1第一:,11
ィ
T
:l
J
¥
4
1イ任以
5
10.1
(
6
1ィ
i
l
:
!
J
'
.
7
10.!
J
'
.
8
1ィ
i
l
:M
9
1エネノレギー・ 1
,
1
I
i1
リーピス
1
0
1ィ
i
l
:l
J
¥
1
1
1
m'
,
1
'
1
合同
1
2
1エネノレギー・ W
:
I
I"¥Iーピス
1
9
9
9
エネルギー・ W
:
I
Iサービス
公共サービス
第 J
I合 同
第一非金属
第
~I イÞ: M
江
¥ '~I イÞ: M
イ
T
:M
0
.
H
J
¥
イ
T
:
k
I
¥
"
,
‑
.
,1
イ
T
:M
エネルギー・[,川サービス
合同
イ
T
:l
J
¥
公共サービス
金属
第 .
J
I
'金 属
合同
合同
第て非金属
イ
T
:l
正
ィ
T
:O
¥
第て非合属
第て ~I'イÞ: lJ\
2
日サドィT:M
第て非令属
加て非イÞ: l~
苫I て ~I イÞ: M
第て非合照
宮
¥ 'JHイÞ:,~
公共サービス
m
‑
+
)ーピス
エ ネ ル ギ ー ・ 民1
エネノレギー・民 I:il-~ ーピス
エネノレギー・[, 1
:
1サービス
:
:
Iサービス
エネルギー・ W
:
1サービス
エネノレギー・民 1
'
(I
lJサービス
エネノレギー・ L
'
:
:
1
:
1
1サービス
エネルギー・ [
,:
I
1Iサービス
エネルギー・ t
エネルギー・ [
'
:
:
1
:
1
1サービス
エネノレギー・民1/
1
:
サービス
I金 属
第て J
エ ネ ル ギ ー ・ 民:
1
リサービス
第一非合民
第一 J
I
'俊 民
エネルギー・サービス
表4 │ 比串 1 9 7 3 1 9 7 4 1 9 7 5 1 9 7 6 1 9 7 7 1978 1 9 7 9 1 9 8 0 1 9 8 1 1 9 8 2 1 9 8 3 1 9 8 4 1 9 8 5 1 9 8 6 1 9 8 7 1 9 8 8 1 9 8 9 1 9 9 0 1 9 9 1 1 9 9 2 1 9 9 3 1 9 9 4 1 9 9 5 1 9 9 6 1 9 9 7 1 9 9 8 1999 6 8 . 7 7 8 0 . 3 3 6 7 . 1 5 6 8 . 6 4 6 6 . 4 8 6 7 . 8 6 6 6 . 3 9 6 6 . 7 9 6 5 . 6 7 6 4 . 7 1 6 3 . 9 6 6 2 . 4 3 6 2 . 9 7 6 4 . 7 7 6 4 . 4 1 6 3 . 1 9 6 2 . 8 3 6 3 . 9 7 6 2 . 2 5 6 4 . 3 2 日 6 2 . 0 6 4 . 2 8 6 3 . 5 0 6 2 . 9 7 6 2 . 1 8 6 0 . 6 2 6 0 . 7 5 1 1 0 . 8 6 0 . 8 2 0. 7 7 0 . 8 2 0 . 7 1 0 . 7 2 0 . 7 1 0 . 7 1 0 . 8 0 0 . 7 7 0. 7 7 0 . 8 4 0 . 7 5 0 . 7 4 0 . 7 4 0 . 8 2 0 . 7 4 0 . 7 4 0 . 7 2 0 . 8 0 0 . 7 4 0 . 6 8 0 . 6 6 0 . 7 2 0 . 8 3 0 . 8 2 0 . 7 1 0 . 7 0 0 . 7 5 0 . 6 5 0 . 7 6 0 . 6 7 0 . 7 7 7 7 0. 0 . 7 5 0 . 7 2 0 . 7 4 0 . 6 6 0 . 7 5 0 . 7 4 0 . 7 5 0 . 6 3 0 . 6 8 0 . 6 4 0 . 7 8 0 . 6 6 0 . 7 1 0 . 6 8 0 . 7 5 7 7 0. 0 . 7 7 1 1 0 . 9 6 0 . 9 6 0 . 7 8 0 . 8 2 0 . 7 5 0 . 8 0 0 . 9 1 0 . 8 9 0 . 8 3 0 . 9 4 0 . 7 7 0 . 8 0 0 . 8 4 0 . 9 0 0 . 8 0 0 . 8 0 7 4 0. 0 . 8 6 0. 75 0 . 7 0 0 . 6 8 0 . 7 8 0 . 9 2 0 . 8 8 1 1 0自4 0 . 7 8 0 . 8 0 0 . 7 4 0 . 7 8 0 . 8 9 0 . 9 1 0 . 8 1 0 . 9 4 0 . 7 7 0 . 7 9 。. 8 3 0 . 9 1 0 . 7 6 0 . 8 1 0 . 7 4 0 . 8 5 0 . 7 5 0 . 7 0 0 . 6 8 0 . 7 7 目 。92 0 . 8 6 1 1 0 . 8 2 0 . 8 4 0 . 7 9 0 . 8 1 0 . 9 0 0 . 9 2 0 . 8 0 0 . 9 1 0 . 8 2 0 . 8 2 0 . 8 5 0 . 9 1 0 . 8 3 84 0. 0 . 8 0 0 . 8 6 0 . 8 0 0 . 7 5 0 . 7 3 0 . 8 0 0 . 9 1 0 . 8 7 1 1 0 . 8 2 0 . 9 7 0 . 8 3 0 . 7 6 0 . 8 3 0 . 7 2 0 . 7 7 0 . 9 6 0 . 8 0 0. 7 7 0 . 8 3 0 . 9 0 0 . 9 2 0 . 9 5 0 . 7 6 0 . 9 6 0 . 9 0 0 . 8 8 0 . 8 2 0 . 8 0 0 . 7 4 1 1 0 . 8 3 0 . 9 4 0 . 8 2 0 . 8 2 0 . 7 8 0 . 8 0 0 . 8 0 0 . 9 6 目 。86 0 . 8 2 0 . 8 1 0 . 8 7 0 . 7 9 0 . 7 9 0 . 7 9 0 . 8 5 0 . 8 3 0 . 9 2 0 . 8 2 0 . 7 9 1 1 0 . 8 8 0 . 7 3 0 . 7 9 0 . 7 3 0 . 7 6 0 . 9 5 0 . 8 3 0 . 7 9 0 . 8 0 0 . 8 6 0 . 9 0 0 . 9 4 0 . 7 3 0 . 9 5 0 . 9 4 0 . 9 2 0 . 8 5 0 . 7 9 0 . 7 4 1 1 0 . 8 0 0 . 8 2 0 . 7 8 0 . 7 8 0 . 8 0 0 . 9 2 0 . 8 2 0 . 8 1 0 . 7 9 84 0. 0 . 7 8 0 . 7 9 0 . 8 0 0 . 8 5 0 . 8 3 0 . 9 4 0 . 8 2 0 . 7 8 1 1 0 . 9 4 0. 88 0 . 9 4 0 . 7 6 0 . 8 4 0 . 8 6 0 . 9 4 0 . 7 8 0 . 7 9 0 . 7 6 0 . 9 4 0 . 7 6 0 . 7 3 0 . 6 9 0 . 8 1 0 . 9 5 0 . 9 3 1 1 0 . 8 3 0 . 9 3 0 . 8 4 0 . 8 3 0 . 8 5 0 . 9 7 0 . 8 3 88 0. 0 . 8 4 0 . 9 4 0 . 8 4 0 . 7 6 0 . 7 4 0 . 8 4 0 . 9 4 0 . 9 3 1 9 7 4 1975 1 9 7 6 1 9 7 7 1 9 7 8 1979 1 9 8 0 1 9 8 1 1 9 8 2 1 9 8 3 1 9 8 4 0 . 9 0 1 9 8 5 1 9 8 6 0 . 7 0 0 . 8 0 0 . 7 6 0 . 8 6 0 . 7 0 0 . 7 3 0 . 6 9 0 . 8 8 0 . 6 9 0 . 6 5 0 . 6 2 0 . 7 2 0 . 9 1 0 . 9 0 0 . 8 0 0 . 8 5 0 . 8 8 0 . 9 6 0 . 8 0 83 0. 0 . 7 8 0 . 9 3 0 . 7 8 0. 73 0 . 7 1 0 . 8 1 0 . 9 8 0 . 9 5 1 1 0 . 8 2 0 . 7 8 0 . 8 5 0 . 9 2 0 . 9 6 0 . 9 9 0 . 7 7 0 . 9 9 0 . 9 2 0 . 9 0 0 . 8 5 0 . 8 2 0 . 7 7 1 1 0 . 9 0 0 . 8 6 0 . 8 1 87 0. 0. 82 0 . 8 3 0 . 8 1 0 . 8 8 0 . 8 6 0 . 9 6 0 . 8 7 0 . 8 4 0 . 8 7 0 . 8 2 0. 8 0 0 . 7 9 0 . 8 5 0 . 7 8 0 . 8 4 0 . 8 7 0 . 8 7 0 . 8 8 0 . 8 6 1 1 0 . 8 4 87 0. 0 . 8 4 0 . 9 7 0 . 8 4 0. 7 7 0 . 7 5 0 . 8 4 0 . 9 8 0 . 9 5 1 1 0 . 9 0 0 . 9 1 0 . 8 0 0 . 9 2 0 . 8 5 0 . 8 6 0 . 8 4 0 . 8 1 0 . 7 9 1 1 0 . 9 5 0 . 8 1 0 . 9 5 0 . 8 8 0 . 8 6 0 . 9 0 0 . 8 4 0 . 8 1 0 . 7 7 0 . 9 9 0 . 9 3 0 . 9 1 0 . 8 4 0 . 8 1 0 . 7 7 0 . 7 7 0 . 7 1 0 . 7 0 0 . 8 1 0 . 9 4 0 . 9 6 1 1 0 . 9 3 0 . 9 1 0 . 8 5 0 . 8 2 0 . 7 8 1 1 0 . 9 8 0 . 9 1 0 . 7 7 0 . 7 2 1 1 0 . 8 9 0 . 7 4 0 . 7 0 1 1 0 . 8 5 0 . 8 0 1 9 8 7 1 9 8 8 斗∞・ ω ‑ 1 9 8 9 1 9 9 0 1 9 9 1 1 9 9 2 1 9 9 3 1 9 9 4 1 9 9 5 1 9 9 6 1 9 9 7 1 9 9 8 0 . 9 6 1999
S t a n d a r dT e m p l a t eP r o g r a m s " の開発 市橋里絵、江口幸子、渡遁大丞、月田あづさ サノフィ・アベンティス株式会社 医薬開発本部 統計解析・プログラミング部 Developmento fS t a n d a r dT e m p l a t eP r o g r a m s R ieI c h i h a s h i, S a c h i k oE思l c h i, D a i s u k eWatanabe, AzusaT s u k i d a l i n i c a lS c i e n c e& O p e r a t i o n s, s a n o f i ‑ a v e n t i sK.K . B i o s t a t i s t i c s& ProgrammingC 要旨 治験実施計画書、統計解析計画書、総括報告書の社内標準が見直される中、解析出力についても現状調 査を行った上で S t a n d a r dS t a t i s t i c a lT a b l e s "が 20 0 8年後半から 20 0 9年前半にかけて策定された。 総括報告書に必要な帳票の約 65%を網羅しかっ領域に間わず適応できるものとして定められた。 S t a n d a r dS t a t i s t i c a lT a b l e s " に定義されている帳票類を個々の治験の解析において効率よく実現するた t a n d a r dT e m p l a t eProgramsの開 めに日仏米 3国のメンバーで構成されたプロジェクトチームを発足させ S 発を進めた。当初はリリース後の各国での普及を推進するためにも均等に分担することを予定していた が、結果的には 60%の帳票の開発を日本が担った。マクロではなく T e m p l a t eprogramというアプローチ および日本からの貢献について報告する。 t a n d a r dt a b l e s、 T e m p l a t eprogram、C r o s sr e g i o nd e v e l o p m e n tteam キーワード:S 1 . 経緯 2008年度の時点で社内(日欧米)においては治験実施計画書、解析計画書、総括報告書の標準化は図られてい たが、統計解析結果の帳票の形式については同一治療領域、同一プロジェクト内での定型が存在するだけで あった。すなわち、治療領域によらない横断的な解析標準は存在していなかった。またそのような状況のも とさまざまなユーザーのニーズを実現するために開発された解析用のシステムは、融通が利く反面ユーザー が指定できるオプションの数も多く、システムを使いこなすにはある程度の経験が必要で、あった。 実際のところ総括報告書に必要な解析の半数以上は試験に寄らず同じような解析内容であるため、まずは既 に解析済みの個々の試験の実際の帳票から標準的な解析内容及び体裁を調査することを始めた。その結果総 括報告書に必要な解析の 6割強をカバーで、きる約 100種類の帳票を特定し、個々の帳票に対応した T e m p l a t ep r o g r a mの開発を行った。 ‑ 3 8 1・
2 . T e m p l a t eP r o g r a mの開発 特定された約 100種類の帳票を社内の標準的な解析用データセット用いて最ノト限のパラメータの指定で作 e m p l a t eprogramというアプローチをとることにした。 成できるよう、 T T e m p l a t eprogramの導入により、それぞれ独立して開発、整備されていた社内標準、標準ツールの一貫性が強 化された。すなわち解析用データセット作成→解析→帳票出力という一連の業務のトータルパッケージ化が 実現した。 2. 1 解析用データセット作成→解析 解析プロセスのなかでの戻り作業を回避するために、 T e m p l a t eprogramを設計する段階において解析用データ セットの社内標準およびデータセット作成プロセスへのフィードパック情報を以下のように Template programの中に盛り込むことにした。 •T e m p l a t eprogramのヘッダーに必要な解析データセット、変数を明記 e m p l a t eprogramで用いる解析データセットの変数定義の明確化 ・個々の T T e m p l a t eprogramの開発を進めていく経過のなかで、解析用データセットの社内標準の修正および変数の追加、 さらに標準データセット作成のためのマクロの機能追加等が行われ、 Templateprogram内で行うデータ加工の n e ‑ p r o c ‑ a w a yを実現できた。 ステップをより少なくする o 2. 1 解析→帳票出力 前述したように社内には既に解析出力を作成するための解析システム (GST.組S) が存在していた。機能と しては使用する解析用データセット、変数、解析方法、帳票の体裁をマクロ変数で指定すると r t f形式で解析 結果を生成するもので、あった。個々の試験で作成される解析用データセットそのままでは解析システムを使 用するのは困難な場合もあり、データ加工のステップを必要に応じて追加する必要があった。また解析シス テムが非常に高機能で解析方法、帳票体裁の自由度が高い分、容易に社内標準に準拠しない帳票を作成する ことも可能であった。 さらに解析システムの使用経験が浅いと機能を使いこなせないというような弊害もあった。 T e m p l a t eprogramとし、うアプローチにより、 T e m p l a t eprogramのなかで解析用データセットの作成プロセスで はカバーで、きないが、特定の解析では標準的に必要となるデータ加工および、標準的な解析内容に対応した マクロ変数指定を解析システム (GSTARS) を使うために定義することにより以下にあげた多くの問題を解 決することが出来た。 ・データ加工のステップを T e m p l a t eprogram内に含めることにより解析用のプログラム作成の効率化 .マクロ化を行わないことにより各試験の特性に応じたカスタマイズの容易さ •S t a n d a r dS t a t i s t i c a lt a b l e sに準じた標準的な体裁の実現 •T e m p l a t eprogram内にコメントアウトでマクロ変数の意味、各 S t u d yでカスタマイズする場合の指定方法等 情報を可視化することによりユーザーの利便性を向上 既に日本においても T e m p l a t eprogramの実解析作業での活用が始まっており、作業の効率化と質の確保に貢 献している。 3. 日仏米横断のプロジェクトチーム ‑382・
T e m p l a t eprogramの開発プロジェクトは日仏米 3固からプロジェクトリーダーのもと、各国から一名ずつ ProgrammingHeadと開発作業をリードする S i t ec o o r d i n a t o r (シニアレベルのプログラマ)を任命し、そのメ ンバーを中心に開発を推進した。コミュニケーションを蜜にとることにより当初は、国間で相違のあった標 準の解釈、標準ツールの活用度、コード記述のスタイル等の均質化を図ることが出来た。 当初開発後の普及のことも考慮して、各国が均等に開発を担うことを想定していたが、日本がいち早く作業 に取り掛かれたことと、日本から開発にかかわったメンバーのきめ細かい対応により、開発の後半では日本 の担当者指名で作業依頼が届くことが増え、最終的には半数以上の Templateprogramの開発を日本が担うこ ととなった。 今回の経験の副産物として、日本から参加したメンバーの英語によるコミュニケーションカの向上と継続的 な部署内標準ツールの整備への関与を実現できた。 4. 謝 辞 今回の T e m p l a t eprogramの開発は日仏米の協力の下実現できた。その内容をいち早く日本で発表することと なった。 j e c tl e a d e rの L a u r e n c eLeLeam、 P rogrammingHeadの あたらためて Templateprogramの開発Pro YvaneBoudraa、 MeiWu、 S i t eC o o r d i n a t o rの Pa 仕i c eS e v e s t r e、 JamesWu、社内解析ツールのエキスノミート E r i cSum各位への日本からの参加メンバーとの協力に感謝いたします。 ‑ 3 8 3 ‑
5回の学生調査から探る実演芸術鑑賞行動パターンとその規定要因 一学生調査データベースの構築と分析を通して‑ 加藤優希 l,有馬昌宏 2 l日本コムシス株式会社, 2兵庫県立大学大学院応用情報科学研究科 AS t u d yonB e h a v i o r a lF a c t o r swhichA f f e c tP e r f o r m i n gA r tsA p p r e c i a t i o n B a s i cF i n d i n g st h r o u g hC o n s t r u c t i o na n d A n a l y s i sofDatabasef o rP e r i o d i c a lS t u d e n tS u r v e y s ー Y u k iKATO1, M a s a h i r oARIMA2 G r a d u a t eS c h o o lo fA p p l i e dI n f o r r n a t i c s, U n i v e r s i t yofHyogo l N i p p o nCOMSYSC o r p o r a t i o n,2 要旨 文化・芸術に関連する統計が十分に整備されていない状況に対して危機感を抱いた研究者のグループ により,我が国の文化・芸術の状況に関する諸分析のためのデータ整備の一環として, 1 9 8 5年からほぼ 5年ごとに,全国の学生を対象に,有意抽出ではあるが, 1万人規模の標本調査が 5回にわたって積み 重ねられてきている.しかし,これらの調査データは個別にデータベース化され,全体を統合して整合 性のあるデータベースは構築されていない.そのために,変化を読み取るための時系列分析の適用が難 しし横断面分析のみが実施され,貴重なデータが有効に活用されないままの状態が長く続いていた. そこで,本研究では,過去の 5回の学生調査の個票データが効果的かっ効率的に活用できるように, SAS を使用してデータベースを構築することを試みた.また,構築したデータベースの有用性を検証するた めに, 2項ロジスティック回帰分析を適用し,実演芸術のライブによる鑑賞とメディアによる鑑賞が代 替的か補完的かの検証を試みた. キーワード:学生調査,データウェアハウス,実演芸術鑑賞構造,ロジスティック回帰分析 1.はじめに 高度経済成長を達成した上で,人口高齢化,高学歴化,高度情報化といった社会構造の変化を迎えている 我が国では,国民の要求は物質的豊かさの追求から精神的に充実した生活を送る方向へと向かってきており, 3年 文化・芸術に対する関心も量的増大と質的多様化を見せはじめてきている.このような状況の中,平成 1 に「文化芸術振興基本法」が施行され,平成 1 9年には「文化芸術の振興に関する基本的な方針」が閣議決定 されるに至っているが,景気の低迷を受けて文化・芸術関連活動者が低迷する一方で,地域振興や地域活性 化に果たす文化・芸術の役割が注目されるなど,国民ならびに地域住民の福祉向上に直結する文化政策の立 ‑387・
案・実施への関心,および民間部門はもとより,公的部門におけるアーツ・マネジメントやアーツ・マーケ ティングに対する関心が高まってきている. アーツ・マネ、ジメントとは, i 今日の社会の中における芸術文化の意義(使命)を明らか i こすることを通し て,芸術文化の有効性(組織の共通目的を達成する能力)と能率(参加者の欲求を満足させる能力)を拡大 2 0 0 2 ),p . 1 2 ) し,それを以て芸術文化組織の発展,さらには芸術文化の振興をはかつてし、く仕事 J (伊藤他 ( であると定義されている.この定義に基づけば,アーツ・マネジメントには, E x p e r i e n c eBasedの感覚的検証 v i d e n c eBasedの客観的検証が必要となり,文化・芸術の有効性や能率を数値化して評価し, PDCA ではなく, E のマネジメントサイクルをきちんと回していくことが求められる. v i d e n c eBasedのアーツ・マネジメントに必要とされる統計情報に目を向けると,我が国の文化・ しかし, E 芸術に関する統計情報の整備は,有馬 ( 2 0 0 8 a ) が指摘しているように, 1 9 7 6年に開始された社会生活基本 調査などをはじめとして近年になって漸く着手された段階であり, しかも詳細な分析を行うために必要な分 野や種目の細分類による鑑賞・活動実態の把握は行われていないのが現状である. このような状況を踏まえ,ミクロ統計データ(個票データ)に基づく文化・芸術の需要サイドの分析の重 要性を早くから認識していた松田芳郎(一橋大学名誉教授)らの研究グ、ループにより,文化・芸術統計の体 系化と統計調査方法の確立を目的として,文化・芸術の需要者側の実態調査である『学生の芸術意識と芸術 9 8 5年 , 1 9 9 1年 , 1 9 9 6年 , 2002年 , 2008年の各年度で実 活動に関する調査(以降,学生調査と略記)j]が 1 1 9 8 8 ),永山 ( 1 9 9 2 ),杉江 ( 1 9 9 9 ),周防 ( 2 0 0 4 ) ).し 施され,調査研究が積み重ねられてきている(三善 ( かし,これらの調査によって得られたデータは,それぞれの調査回で異なるグループによって作成された独 立のデータベースに保存され,保存されているデータの形式も変数名も異なるなどの問題があり,一括した 集計解析プログラムによる時系列比較のための分析を行うことができない状況であった. そこで,本研究では,第 l回調査から第 5回調査までの独立したデータベースをデータウェアハウスとい う概念を援用して統合し, 1つの集計解析プログラムを適用することで 5回の調査データを使用した時系列 分析や横断面分析が可能な S ASデータベースを構築することとした.その上で,構築したデータベースの有 用性を確認するために,全ての個票データを用いる分析を実施し,その結果を考察することとした. 2. 学生調査の概要 学生調査は全国の学生を対象としており.大標本を確保しながら限られた費用で調査を実施するために, 大学教員のネットワークを活用して,全国の大学の地域と専門分野別の分布を考慮する割当法で標本抽出を 0, 570,第 2回調査で 1 0, 8 1 9,第 3回調査 行って調査を実施している.有効回答サンプル数は第 l回調査で 1 0, 0 6 1,第 4回調査で 3 , 763である.第 5回調査では 7, 682の調査票が回収されているが,現時点では 10% で1 抽出で 789サンプルのデータが入力されている.サンプルの詳細は,表 1に示す通りである. 学生調査では芸術・文化の需要構造の実態把握に焦点が当てられており,調査票の質問は,大別する と,実演芸術 7分 野 64ジャンル(第 1回調査は 48ジャンル)のライブでの鑑賞経験(過去通算と過去 1年)と実演芸術 7分野のメデ、ィアによる鑑賞経験(過去 1年)を問う質問群,映画鑑賞と美術などの 視覚芸術鑑賞の経験と鑑賞場所を問う質問群,鑑賞行動に影響を与える文化・芸術への意識に関する質 問群,稽古事や主体的芸術活動の有無と活動時期に関する質問群,読書に関する質問群,および鑑賞行 動と何らかの関連を持っと考えられる個人的属性に関する事項を問う質問群とから構成されている.調 査方法は原則として,講義など学生の集まる時に調査票を配布して,その場で記入させるか,または次の同 '388・
表 l 学生調査のサンプルの構造 ~ 氏 凡 え 大学 立 短期大学 形 高等JJi.門学校 態 専修学校 日 1 1 大学院 性 男子 思j E ι 7 ‑ ヰ 手 文会系学部 攻 分 社会系学部 里 子 理工系学部 保健系学部 北海道・東北 関東 地 域 甲信越・北陸・東海 5 J 1 1 近畿 中国・四国 九州・沖縄 全体 ~ 大学 第 1同 調 査 ( 1 9 8 5 年度) 有効回収 抽出率(唱) サンプル 母集団 1 .7 3 4 . 0 8 0 3 7 7 . 1 0 7 7 . 8 7 9 1. 44 9 0. 45 4 0 . 3 8 4 5 7 9 . 2 7 4 1 . 2 4 2 0 . 2 1 4 1 , 6 6 6 . 9 9 1 1 .023, 470 8 7 9 . 5 3 0 7 8 5 . 3 0 4 4 9 8 . 9 6 8 1 7 9, 226 2 0 6 . 5 6 4 1 , 4 0 2 . 8 9 1 7 6 . 9 1 5 685 5 5 3, 1 7 2 . 7 4 3 2 4 1, 3 9 8 2, 6 9 0, 4 6 1 5. 40 4 4, 949 2 . 3 6 8 . 9 9 2 4 6 3 . 9 4 8 21 .608 799, 5 5 1 1 6 4, 350 0 . 3 2 4 0 . 4 8 4 2 . 0 1 0 . 7 1 5 1 , 49 2, 3 7 1 6 . 3 4 9 4, 422 0 . 3 1 6 0 . 2 9 6 2, 1 3 6. 180 , 682, 269 1 4 . 7 5 7 3 . 8 7 5 1 . 10 1 664 0 . 5 4 1 0 . 4 9 3 0 . 2 2 1 0 . 3 7 0 1 . 15 5 . 3 1 5 1 .0 5 4, 629 8 5 7 . 8 6 3 838 3 0 9, 3 . 3 9 1 4 . 6 0 6 2, 092 5 8 5 0 . 2 9 4 0 . 4 3 7 0 . 2 4 4 0 . 1 8 9 989 496 5, 47 9 0. 0 . 3 9 2 0. 42 4 0 . 3 1 6 0 . 5 9 3 0 . 4 0 7 0 . 3 9 3 2 6 9 . 8 0 9 1 .420, 8 8 7 4 5 7 . 0 2 4 6 5 2 . 7 4 7 2 2 7 . 0 0 8 3 0 9, 666 3, 503, 086 7 9 2 3 . 4 4 9 1 . 74 7 1 . 725 1 .2 0 1 1 , 903 1 0, 819 0 . 2 9 4 0 . 2 4 3 0 . 3 8 2 0 . 2 6 4 0 . 5 2 9 0 . 6 1 5 0 . 3 0 9 1 .045, 345 1 , 15 7, 923 1 .076.724 372, 262 3 1 4 . 5 5 6 1 , 5 6 9 . 3 8 5 5 2 8 . 3 3 6 7 4 7 . 8 0 3 2 6 6 . 1 8 1 580 3 7 0, 3, 818, 44 9 326 1 . 7 5 1 1 . 0 2 5 983 1 0, 570 有効回収 抽出率(弘) サンプル 622 2 . 0 1 1, , 16 6 1, 3 3 1 423 3 6 6 0 . 2 4 5 0 . 1 2 4 0 . 0 2 1 0 . 0 6 0 1 . 0 6 2 . 5 5 9 9 3 4 . 4 9 5 7 2 5 . 1 5 7 674 2 9 5, 1 6 7 3 3 1 2 4 5 2 9 ! J i : 文主主系学部 攻 社会系学部 分 理工系学部 野 保健系学部 8 8 4 . 3 7 1 1 . 0 4 9 . 2 8 4 755, 7 8 8 213, 7 7 1 北海道・東北 3 2 4 . 8 1 6 1 , 579, 0 2 1 5 2 3 . 7 5 8 7 5 7 . 0 7 3 2 61 . 78 1 372, 2 2 7 3, 776, 639 地 甲信越・北陸・東海 域 思l 近 畿 中国・四国 九州・沖縄 2 . 5 7 3 49 7 5. 1 .280 664 0 . 2 4 6 47 5 0. 0 . 1 1 9 0 . 1 7 8 992 3 . 3 9 7 1 .362 2 . 1 9 7 7 6 1 1 , 352 1 0, 0 6 1 0 . 3 1 5 0 . 2 1 6 0 . 2 5 8 0 . 2 9 4 0 . 2 8 6 0 . 3 6 5 0 . 2 6 3 0 . 2 5 2 0 . 2 6 2 抽出率(也) 、 0 . 0 7 9 0 . 1 1 0 5 J 1 1 ! ' c r 関東 内有効回 0 . 0 0 5 0 . 0 2 0 1 .804 1 , 954 2 . 1 7 0 1 .302 1 6 2 1 2 9 3 7 1 1 . 0 6 6 704 1 . 12 4 1 7 8 324 763 3, 男子 大宇院 0 . 3 7 9 0 . 1 5 8 0 . 3 7 0 0 . 0 2 3 0 . 0 5 1 1 サ 0% ン 日 プB ル l J ¥ 母集団 740 2 0 1 7 2 . 2 8 3 . 0 9 3 1 , 780, 4 3 1 性 両等#門学校 8 . 9 8 0 733 80 1 8 5 8 3 5, 386 4, 414 第 5回 調 査 ( 2 0 0 8年度) 5 2 0, 593 2, 7 2 6 1 7 2, 5 9 . 4 4 6 6 5 7 . 5 0 2 2 6 2, 686 4 1 4 4 専修学校 有効回収 抽出率(唱) サンプル 丸 ノh 0 . 1 4 7 昨 手 態 リ 日 母集団 0. 40 5 0 . 2 0 8 0 . 9 0 8 0 . 1 4 3 0 . 0 8 8 3 . 6 7 8 短期大学 第 3回 調 査 ( 1 9 9 6年度) 8 . 3 2 2 1 .033 1 8 0 1 , 1 9 4 8 7 2. 49 9 . 1 4 7 2 6 7 . 0 8 6 21 .336 7 6 5 . 5 5 8 223, 5 1 2 五 立 立 母集団 有効回収 抽出率(唱) サンプル 2 . 0 5 2 . 3 3 8 4 9 7 . 5 6 9 1 9 . 8 1 6 8 3 4, 7 1 3 9 8, 650 第 4回 調 査 ( 2 0 0 2 年度) 母集団 1 9 9 1年度) 第 2回調査 ( 1 2 4 3 238 239 1 0 6 9 4 5 1 7 8 9 0 . 1 1 4 0 . 0 6 8 0 . 1 3 4 0 . 1 4 8 0 . 0 6 8 0 . 0 8 7 0 . 1 0 0 全体 3, 6 7 2, 9 5 3 注1 ) 母集団の構造は,第 l回調査では文部省│昭和 5 9年度字佼基本調査 J ,第 2回調査では「平成 3年 度 版 学 校 基 本 調 査 J , 5年度版文部科学統計要覧J,第5回調査では 第 3回調査では「平成 8年度版学校基本調査 j,第4回調査では「平成 1 1年度版文部科学統計要覧」から計算. 「平成 2 2 ) 第I 回調査では,調査対象から高等!Ji:門宇校及び大学院の学生は除かれている. , 3 ) 第 I回調査の専攻分野別には, : 4 修学校のその他の分類 3 4 7, 4 9 3人が除外されている. 4) 第 1回調査の地域別では,東海地域は関東地域 l こ含まれている. 5 ) 第 3回調査の地域別では,高等#門学校の人数が除外されている 日)第 4回調査の設立形態別の大学と大学院と短期大学には,JJi.攻科と別科の学生ならびに聴講生,選科生,研究生等と 通信制の学生が含まれていない. 7 ) 第 4回調査の専攻分野別には, 修学校の 7 6 5, 5 5 8人が除外されている 8 ) 第4回調査の地域別には,高等 4門学校の 2 1, 336人が除外されている. 9 ) 第 5回調査の設立形態別の大学と大学院と短期大学には, !Ji:攻科と別科の学生ならびに聴講生,選科生,研究生等と 通信制の学生が含まれていない. 1 0 ) 第 5回調査の#攻分野日1 1 には ,J ! i .修学校の 657, 5 0 2人が除外されてしも 11) 2 0 1 0年 l月5日時点では,第 5回調査の地域別のデータは公表されていない 1 2 ) 有効回答サンプルには,不明のサンプルが除外されている 6 8 2回収されてしもが,研究費の制約により約 10%のサンプルを抽出したものを集計している 1 3 ) 現時点で第 5回調査の調査員長は 7, W ‑389・
講義の際に回収するという方法で実施されている. 3. データベースの設計と構築 データベースの設計に当たってはInmo n( 1 9 9 2 )のデータウェアハウス (DW)の概念、を援用することとして, D Wの論理設計には多次元データモデ、ルを,その実現にあたってはスタースキーマを適用した.通常,スタ ースキーマにおける事実テーブルは数値尺度で表されるキーの集合で構成されるが,本研究のような社会調 査のデータベースにおいては,分析に際して回答者の名義尺度で測定されるフェイス項目のデータを用いる ことから,フェイス項目を次元テーブルとして分離するメリットが少ないと判断し,事実テーブルに回答者 のフェイス項目を含む形としてデータモデ、ルを設計した.すなわち 回答者を表す事実テープ、ルであるフェ 1の次元テーブル(図 1で示すライブ鑑賞,最近行った公演,視聴覚メデ、ィアによる鑑賞,映 イス項目と, 1 画鑑賞,展覧・展示会鑑賞,文化・芸術についての意見,文化・芸術関連の耐久消費財保有状況,本・雑誌・ 新聞の購読および文化・芸術関連情報取得状況,主体的芸術活動状況,稽古事状況,家族構成)を回答者 ID で,学生調査実施状況の次元テーブルを調査年で結合する多次元データモデルとなっている.なお,この設 計は,分析の実行速度を短縮することに寄与している. データベースシステムのアーキテクチャは,次ページの図 2に示す通りである.図 2では,これまで の 4回の調査で構築されてきたデータベースを黒で塗りつぶした図形によって表現している.本研究に ASで読み込んだものを項目データ,さまざまな問合せに おいては,調査票からの初期入力ファイルを S 対応できるように用意した粒度の違う情報を要約データ(サマリーデータ)と呼んでいる.項目データ 2の次元テーブルと 1つの事実テーブルに含まれている. と要約データは,先述した 1 今回の研究では,第 5回調査票から 10%抽出の第 5回調査データを作成し,これまでの 4回の調査デ ータと合わせて統合的データベースにまとめ上げ,ユーザーが分析やレポート作成,データマイニング を行えるようにした. ライブ鑑賞 家族構成 ⑦ 回 答 者1 0 一一ーす一一 最近行った公演 稽古事状況 ⑦回答蜘 ⑦ 回 答 者1 0 視聴覚メディアに よる鑑賞 主体的 芸術活動状況 ⑦ 回 答 者1 0 ⑦ 回 答 者1 0 映画鑑賞 ⑦ 回 答 者1 0 文化・芸術関連の 耐久消費財保有状況 ⑦ 回 答 者1 0 ⑦ 回 答 者1 0 図 1 学生調査データベースのスタースキーマ ‑ 3 9 0 ‑
データソース
ユーザー
ウェアハウス
:
'
n
a
l
理彊冨
ーーーーー‑‑'砂
→
分析
レポート
デ
タマイニング
五ミl2.りつ",:t>:札〈いゐ部分口. 二九"'.c- 三曹、 1988) 永山 ~1992) 杉江は999}. i
司防(20
04)j(ヒ
ペ ζ鳴後、、れにドたず ‑1‑くー λ
図 2 学生調査データベースシステムのアーキテクチャ
4. ライブとメディアによる芸術鑑賞の分析
学生調査の対象母集団は大学をはじめとする高等教育機関に所属する学生であり,なかでも多数を占める
のは 1
8歳から 22歳までの就学者である.彼らは,テレビ,ビデオ, CDプレイヤー, DVDプレイヤー,デ
ジタルミュージックプレイヤーなどの視聴覚メディアの普及とともに成長し,それらを逸早く生活に取り入
れてきた世代である.このような特徴を有する学生にとって,視聴覚メディアによる実演芸術鑑賞はどのよ
うな位置づけにあるのか,視聴覚メディアによる鑑賞はライブ鑑賞との聞で補完関係にあるのか,あるいは
代替関係にあるのかというテーマは,今後の実演芸術の鑑賞構造を考えるにあたっても重要なテーマである
と考えられる.そこで構築したデータベースの有用性の検証も兼ねて,視聴覚メディアの普及が実演芸術の
鑑賞に及ぼす影響を,ロジスティック回帰分析を適用することによって考察した.分析に際しては,統計解
析用ソフトウェアの S
ASを使用した.
分析に使用したのは,質問項目がほぼ閉じである第 2固から第 5固までの調査データであり,被説明変数
は実演芸術 7分野についての過去 1年に限定したライブ鑑賞経験の有無,説明変数としては,①性別(男子
を基準) ,②居住場所(関東地方を基準) ,③通学形態(自宅通学を基準) ,④視覚メディアによる各実演芸術
の鑑賞経験(経験無を基準) ,⑤聴覚メディアによる各実演芸術の鑑賞経験(経験無を基準) ,⑥第 3回調査以
降はインターネット接続の有無(インターネット接続無を基準)を用いた.分析結果は表 2に示す通りであ
る.
モテツレの説明力は,表中に示した尤度比 χ什直および McFaddenの擬似決定係数の値で確認することができ
るが,これらのモデルの当てはまりのよさを示す指標の値は低く,モデルの説明力は高いとは言えない. し
かし,分野別では,第 2固から第 4回調査までを通じて,伝統演劇,オペラ等,舞踊・舞踏・バレエ,クラ
シック音楽の分野で当てはまりのよさを示す指標の値は相対的に高く,大衆芸能とポピュラー音楽の 2分野
では低いという傾向が存在する.また,第 5回調査ではオペラ等とクラシック音楽の 2分野で当てはまりの
よさを示す指標の値は相対的に高く,大衆芸能とポピュラー音楽の 2分野では低い傾向が存在する.
‑
3
9
1・
説明変数に関しては,舞踊・舞踏・バレエ,クラシック音楽,オペラ等,伝統演劇l
の 4分野では,ポピュ
ラー音楽と大衆芸能の 2分野と比較してモデ、ルに組み込んだ要因の多くが有意で説明力があり,居住地域の
違いや視聴覚メディアによる鑑賞経験の有無が鑑賞活動の有無に影響を及ぼしていることが示唆されている.
ここで,モデルに組み込んだ要因の個別の影響を,各分野の視聴覚メディアによる鑑賞経験がライブ鑑賞
に及ぼす影響に焦点を絞って考察する.視聴覚メディアによる鑑賞経験については,第 2回と第 3回調査で
は全ての分野で視覚メディアによる鑑賞経験有の係数が,第 4回調査では大衆芸能を除く全ての分野での視
覚メディアによる鑑賞経験有の係数が,第 5回調査では現代演劇とクラシックとポピュラー音楽での視覚メ
ディアによる鑑賞経験有の係数が 1 %有意水準でプラスに有意となっている.また,オペラ等とクラシック
音楽については,聴覚メディアによる鑑賞経験有の係数が全ての調査回で 1 %有意水準でプラスで有意とな
っており,第 4回調査まではポピュラー音楽についても聴覚メディアによる鑑賞経験有の係数が 1 %有意水
準でプラスで有意となっている.これらの結果は,メディアによる鑑賞行動がライブによる鑑賞行動と補完
関係にあることを示唆しているものと言える.なお,本研究では,付録のプログラムリストに示すように,
表 2 過去 1年の実演芸術鑑賞経験の有無に関するロジスティック回帰分析の推定結果
l
i
l
1
2
4
0001
m
!
ト
l包 4
l
宅外凶
。
曲
く
υ
叩
U0
乙
t
1
,
・・
U
0
0
6
8
3
i
1
0
4
7
6
5
3
2
9
3
4 〈
叩 01**
〈
9
叩
0
O
5
2
i・
・
)
.
6
9
2
;
1
刷
何
日
経
出
・
東
)
l
(
海
.
l
t
北
陪
近畿
G
O
.
3
2
f
0001
l
i
O
.
6
9
t
000
0
.
1
6
1
〈く U0U0G0I1"
。
0
U
0
Z
0
2・
・
U
0
06
3
3
3
1
6
4
8
2
1
3
2
4
E
1 <
.
0
0
0
1.
.
0
9
0
5
5
1
1
1
0
3
7
5
1
3
9
6
7
5 <.0001**
O.24~
古
〆
プ収
レ
!(Á^' 泣~!立 Xt-2
c
l
i
l
d
d
e
n
U
;ぜ
W.
λ:λ j.1: XZ !f~
8466
2730.5
0.108
255.778
01
)f[l~
u
01..
0.543
1""
0.
482
0
.
8
3
8
0
1*
'
*
0
1.
.
0.365
0
.
5
1
0 0.001..
01..
0
.
7
3
6
0.052 0
.
3
9
6
01‑
0.807
0
.
3
8
6 0
.
1
2?
i
0.169 0.03~ •
[
1モ外述 f
吉
{
両
ヒ越
道
東
北
ー
東
海
・
北
陸
J
1
F
近畿
中凶。四凶
九
訓
・
仲
純
ば
メ
ア
イ
"
こ む杭鞭:rリ
聡詑メアィアにる杭験;り
イ
ン
タ
ー
ネ
ッ
トf長
会
:
"
,
り
1
'
"
.
.
¥1H
;
.
u
4
!
"
Ir
五耐:MJ~
ン
ブ
ル
京
(
.
l
.
.
.
¥
二I
.
!
tX¥
lUUt}
!
'
>
!
:
I
U
c
l
a
d
d
c
nfJ)
と
'
】
λ 主 x~}-I~
!
}
.
:
t
‑
1
1宅外通挙
;
1l,
;
越
辺
・
東
引
海
こ・
北
陸
巾凶
近車
中l
量四凶
九
州
・
仲
縄
M ア
イ
ハ
' 四 日;
[
1
1
'
)
世、j.[メァィアにる組 ~:11勺
インターネッ H~ 手':UI り
ン
ブ
ル
取
京λ:I}..!̲X¥
"江{口 c
n
U
J
j1 川
】
" 人:
l
.
r
貨
IJt ttx2!~~
F
Jモ外通告ヂ
!
ヒ
I
判
北
'
!
,
叩
円
出
悩
{
,
い
け
}
迫
越
.
東
似毎
海北陪
F
み
t
近瞳
中国四国
九州仲間
<
叩
〈
∞
・
・
〈
田
。
田
ij,l.:~正アイ /'í'::_J::/~~' p. ~1f き
主
J
:
E
く
く
2855
2
0
7
6
.
7
。
出
。
9
0
.
3
0
.
1 <
.
0
0
0
1
,
'
.
'
f
I
:
f
!
1
向
口問
・
0
.
1
4
1 0
.
0
2
4
0
.
0
2
194
0
.
1
2
7 0
.
1
'
1
9
0
.
1
2
0 0
.
1
1
6
0
.
2
6
.
1 0.117
0001u
0
.
9
9
4
0.095 0.139
'
0
0
0
1.
.
.
0.657 <
0.012 0
.
9
0
1
0
.
0
0
6 0.932
。
く
見
1
.
:
(
,iH
, ~'ÚÎiíJ~
字
615
615
136.0
4
669.
0
.
06
0.074
23.
409 0.009
3
1
.
8
3
7 0.000
l
自
i
'
r
:
f
l
:
'
f
~_;:E
0.162 0.106
0
.
3
8
1 0.005u
063
0
.
8
2
7 0.115
0.519
0
.
1
7
7 0.282
0
.
0
3
2 0.799
oρ16 0.919
474
0
.
1
4
2 0.
.
2
1
4
.
1
7
9 0
0
.
3
0
9 0
.
3
1
2
.
8
2
8
.
5
2
.
1
0
.
0
5
7 0
0
.
1
3
2 0
0
.
0
9
3 0
.
.
!
9
1
0
.
:
:
!
7
8 0.006d
.
0
2
2
.
0
.
8
1
1 0
0.723 0.000.
0
.
3
2
3 0
.
6
0
2
0.
462 0.
.
156
0
.
1
4
4 0
.
:
:
!
9
1
0.052 0.605
(
,1
'
(l
I
'
l
‑:
1
1
. .
.
.
.
f
Q
i
'
o
1
1:
1
{
1
り
イ
ン
タ ッ
ヌlイ
主
条:Uiり
,
J
:u::pU)卒
事
昨
日
>
il.l.':.IJ¥.fi'!,
事
;
主
n
聴Kメディアに主る祥~!'8!
t
l
¥
:
(
¥l
Il
8
‑
166
5961
.
7
0
.
1
1
.
:
:
;
507.232 <
'
0
0
0
1
》時、
1
L
I
.
0.
191 <.0001.
.
0
0
0
1.
.
.
0.364 <
0.
474 <.0001..
0001**
0
.
3
0
4
.
0
0
0
1.
.
0.325 <
.
436 0001.
0.
0
.
0
6
1 0
.
1
0
2
'
0
0
0
1*
*
0.662 <
0
.
1
2
0 0.
447
'
0
0
0
1.
.
0.199 <
JY.. itr:.tiJt~
2855
1
:
J
3
2
.
6
0.102
1
1
0
.
1
9
1
0
1
王i
i
:l
l
i
l
:
】 Z
l
01‑
0.633
0
.
2
7
1 0.13~
0.127 0
.
3
1
2
0
.
2
&
1 0
.
0
1
3
477
0
.
1
5
4 0.
0.603 0
.
0
2
5
0
.
1‑
12 0
.105
0
1‑
0.805
0.
135 0
.
:
!
1
9
7 0
.
9
3
8
~l;)!"I ,,\:ln
ttl
<
叩
〈
田
〈
開
。
く
∞
〈
叩
く
叩
〈
回
定
主
に
ち
0
.
1
4
1
‑
,
" 杭 剖J
.
,
,
内
。
。
合
,、
昔
!
.
.
iの
勺
こ
】ー
ミ
弓
0.
45
1
182
0.
0
.
4詞
0
.
0
0
1
,
母1・
持
!
f
!
'
i
"ハ
レ
エ
8466
5
1
5
5
.
:
:
0
.
1
9
1
771
.735 <
.
0
0
0
1
)
:
[
1
1
.
i 疋 l~î
0
.
7
2
1 <.0001..
.
0
0
0
1.
.
0
.
.
5
7
2 <
"
.
.
0
0
0
1*
0.312 <
.
0
0
0
1*
*
0
.
3
9
.
'
) <
.
0
0
0
1.
.
.
.
0
.
6
1
3 <
0.243 0.000."
0
.
0
2
5
.
0
0
0
1*
*
0 1
3 <
0
.i
?8h 0001..
13g 0.026
84伍
4022.6
0
.
1
6
6
5
.
1
9
.
5
1
6 <
'
0
0
0
1
否
定
瓜
[
(
1
く
く
く
く
田
く
0
.
7
4
6 0001..
.
0.386 0001.
.
0
0
0
1.
.
0.378 <
0001‑
0
.
5
3
4
0
0
0
1.
.
.
0
.
1
8
1
0.262 0 0 ‑
0
.
0
.
1
2 0
.
3
9
4
0001.
.
0
.
7
0
1
'
0
0
0
1.
.
0
.
5
2
1 <
.
0
1
1.
.
0
.
1
6
8 0
。
九
五
:
)
五
く
。
・
才
へ
そ7^i'
i
言
;
n
・
品
目
ハ
レ
エ
。
,
:
!
8
5
5
1
7
1
8
.
5
0.096
1
2
7
.
2
3
7 <
.
0
0
0
1
i',正 ~I(I
.
0
0
0
1.
.
.
0.546 <
0.~13
0.048
0.096 0.369
0.097 0
.
2
9
5
0.870 0
.
0
1
7
0.015 0
.
9
1
3
0.063 0
.
3
8
9
.
0
0
0
1.
.
.
0
.
6
1
1 <
0.309 0
.
1
8
2
0
.
0
8
; 0
.
2
3
9
・
・
才
ベ
フ
ゲ
615
回1.1
0.142
五
7
.
.
1
6
0 <
.
0
0
0
1
,
"
1;:1:百 内
。
0.28~
0.010u
0
.
2
.
1
0.
'
11
5
.
9
6
1
0
.
0
0
6 0
.
6
0
8
0
.
0
8
7 0
11
6
0.172 0.
.
9
5
3
0
.
0
1
¥ 0
.677
0
.
0‑
17 0
0
.
1
1
1
0
.
3
4
.
0
0
0
1*
*
0.906 <
.
1
0
7
0.183 0
五
)
00
1.
.
0
0
0
0
0
2
3
2
3
0
4
2
2
9
0
7
2
〈
0
0
0
0
0
0
1
1"
‑
く
0001‑
〈
0
0
9
0
0
4
S
1"
。
。
0
.
2
14
'
,
(0
001
クフシック r';--~'"
;J~ ヒュフ
l'.-'X~
0
02
0
2
3
0
6
6
2
6
1
3
2
C
。
叩・・
。
。
・
/
、
レ
コ
ニ
:
t
:
n
¥
l
・
午
討I・
615
1
1
8
.
1
0
.
0
7
1
22.895 0
.
0
1
1
ロi
i
0.309 0.022
0
.
2
0
4 0.539
0.133 0.
12
3
。 O~O
0
.
9
1
7
0
.
2
.
1
9 0
.
3
0
2
1
2
8 0
.
6
6
1
0
.
0
1
0
.
9
2
8
0.610 0
.
0
1
7
0.
43
¥ 0
.
2
6
0
0
.
0
7
2 0
.
5
8
4
‑
3
9
2
‑
,
'
、
"
。
よ
・
・
叩01‑
O
.
2
6
C
003
0
2
オヘフ#
ろ
2
8
5
2
2
1
0
0
.
7
.
1
8
1
287.517 <
.
0
0
0
1
l
ki
)
~II
.
0
0
0
1.
.
0
.
S
4
7 <
.
2
8
.
1
0
.
1
2
1 0
.
0
2
4
0
.
:
!
2
3 0
0.210 0.016"
.
7
5
0
0
.
0
6
4 0
0.178 0.263
0
.
0
9
:
) 0.162
.
0
0
0
1.
.
0
.
5
1
1 <
0.726 <.0001..
.
0
1
1"
0.176 0
!
l
1
I
)
.
1
8
7
〈く υOt叩
p
u
l
!"
0
00
3
4
2
0
t
3
b
田
5
2
0
3
〈
9
O
0
O
O
1
8
l・ ・
〈
0
0
0
0
9
0
0
・1・"
0
.
6
9
4
'
:
ti
:
3
1
'
!
JrS
!1'1~
f
。
α
0
1
0
.
6
j
'
く
0
凹
1
0
6
1
1
く
田01'"
〈
田01..
0
.
0
6
2
。
8166
7583.7
0.194
0
1
1
0
2
9
.
7
8
1
)
f
l
(
i
l~ )Ë (l((
0
1*
.
0
.
5
6
4
0
.
1
0
4 0.074
1
2
2 0.019
01"
0
.
1
9
9
0
.
1
2
.
1 0
.
0
7
1
0
.
0
2
2 0
.
6
6
1
0.016 0.638
01..
0.393
8
0
1.
.
.
.
0.123 0.010.
<
∞
〈
∞
。
く
田
悔
く
曲
。
却 〈
田
2855
:
1
2
9
6.
4
0.289
630.573
01
γ 向
】 l
1‑
0
.
3
7
1
0
1,
.
0
.
6
3
3
.
0
0
1.
.
0
.
2
5
1 0
.
5
.
'
)
2
0
.
0
1
1 0
0
.
0
9
3 0.
485
0
.
1
8
6 0
.
1
1
0
0
.
0
3
2 0
.
5‑
13
01..
0.
110
9
01..
く
叩
く
冊
。
〈
曲
〈
曲
。
印 〈
田
0
.
0
2
7
0.613
î";-'-V~
615
736.1
0.216
1
0
0
.
.
1
6
5
01
<
田
田
。
・・
t
0.003‑
0.995
0
.
9
3
1
0
.
2
8
:
:
!
409
0.
0
.
8
5
0
0
.
1
9
1
01‑
0.000..
0.005
凹
。
曲 く
・・
0
6
1
i
1
9
0
0
0
8
0
2
0
1
9
3
0
2
3
8
C
4
5
7
0.158
0
.
0
0
1.
.
403
0.
O.15~
0.068
81
<66
4337.8
0
.
0
6
0
2
0
5
.
7
6
1 <
.
0
0
0
1
A
'
[
j
'
l
i
~I"(
1
0001
0
.
3
8
0.354 0.000
0.386 <
.
0
0
0
1
.
3
1
3
2
0.046 0
112 0.000..
0.
.
0
0
0
1.
.
0.299 <
0.012 0.797
0.36i <
.
0
0
0
1
0
.
;
)
8
1
0
.
0
5
0
.
8
;
;
2
0.01~
く
巴
2855
3
3
2
6
.
7
0
.
0
3
8
7
1
.
6
0
1 <
.
0
0
0
1
官"
(
{
I
I
'
(
t
伐
.
0.120 0.007.
‑
0.170 0.029
0.308 <
.
0
0
0
1"
.
0.206 0.000"'
0
.
1
7
5 0.110
0
.
1
4
2 0.098
0
.
0
1
3 0.356
002.
.
.
0.160
.
.
0.275 0001.
0.097 0.010
・
・
615
7
9
3
.
5
038
1
7
.
:
H
5 0.068
F
.
'
jjj
l
i
'
0.003 0.913
0.218 0.311
0
.
0
0
9 0.933
.
8
.
1
9
0.026 0
0.053 0
.7
'
27
0.079 0
.
6
8
7
0.053 0.560
.
0
0
1.
.
.
.
0.329 0
0
.
0
4
1 0
.
6
8
1
0
.
0
6
1 0.
496
。
,
,
、 ・・
ノ
,
出
〆
句
、
i
;
:
i
*f
i
1
ニ
6':W~
;
、
ヒ
ュ 7 ‑,
i
グ
フ
ン
ッ7
0
.
2
9
7
0 2
0
.
0
1
1
0.169
0
.
1
4
9
0
.
0
1
1
0
.
1
3
3
9
0
.
4
6
9
0
.
:
'
:
刊
88
。
。
。
く
。
;"::~,; :id主
8466
9568.
4
0
.
0
6
6
388139 <
.
0
0
0
1
Oi
:I
(
i
'
(
企
.
0
0
0
1.
.
0.270 <
1
4
3 0.003*
*
1
8
9 <
.
0
0
0
1‑
.
0
0
1.
.
.
0
.
1
2
1 0
0.307 <.0001‑
0.060 0.137
.
0
2
2 0.
404
0.199 (.0001..
0.260 <
.
0
0
0
1*
*
0
.
1
1
1 0.004
;l~ ヒdュヲ
クラシック,"i''.'f~
81.04
‑
f
1
t
.i
i
J
p
'
( !
P
l
l
i
l
0001
2855
1
7
0
9
.
1
0
.
0
3
1
44.112 (
.
0
0
0
1
必
よ
内
0001
0.333 く
0.259 0.088
。
081 0.
440
0.190
0.012
0.073
0.032
0
.
1
5
1
0.106
0.109
0.032
0.947
0.599
0.665
0.062
182
0.
0.110 i
合
J
¥
.
.i
i
t:
i
i
‑i
I
E
615
532.8
0.037
1
3
.
3
5
8 0.204
r
i
i
:(
n
'
i
川1
0.213 0.070
0.368 0.256
0.068 0.610
0
.
1
9
4 0.306
0
.
01
6 0.807
0.168 0.160
0.110 0.3~0
.
2
6
.
1
0
.
:
:
!
0
5 0
0.
187 0.046
0
.
0
8
1 0.
486
・
変数を書き換えるだけで分析が可能となる汎用 S
ASプログラムを作成し,簡単な操作で一括して分析が行え
るように工夫をしている.
5. ライブ鑑賞行動の時系列的な変化
続いて,学生の実演芸術鑑賞の時系列的な変化を分析するために,質問項目がほぼ同じである第 2固から
第 5固までの調査データを全て用いて,ロジスティック回帰分析を行った.被説明変数は実演芸術 7分野に
ついての過去 1年に限定したライブ鑑賞経験の有無,説明変数としては①性別(男子を基準),②居住場所(関
東地方を基準),③通学形態(自宅通学を基準),④視覚メディアによる各実演芸術の鑑賞経験(経験無を基
準),⑤聴、覚メディアによる各実演芸術の鑑賞経験(経験無を基準),⑥調査回(第 2回調査を基準)を用い
た.分析結果は表 3に示している.
モデルの説明力は,表中に示した尤度比 χ2値 お よ び McFaddenの擬似決定係数の値で確認することができ
るが,これらのモデルの当てはまりのよさを示す指標の値は低く,モテやルの説明力は高いとは言えない. し
かし,分野別では,オペラ等,舞踊・舞踏・バレエ,クラシック音楽の分野では指標の値は相対的に高く,
大衆芸能とポヒ。ュラー音楽の 2分野では低いという傾向が存在する.
次に,モテぶルに組み込んだ、要因の個別の影響を時系列的な変化,すなわち調査回がライブ鑑賞に及ぼす影
響に焦点を絞って考察する.第 3回調査 (1996年)の係数は,オペラ等と大衆芸能を除く 5つの分野におい
て 1 %有意水準で、マイナスに有意,第 4回調査 (
2
0
0
2年)の係数はクラシック音楽において 1 %有意水準で
プラスに有意,現代演劇と大衆芸能において 1 %有意水準でマイナスに有意,第 5回調査 (2007年)の係数
は全ての分野において 1 %有意水準でプラスに有意となっている.
これらの結果は,第 3回調査の学生の集団は他の年代と比較して,ライブによる鑑賞行動を行わない傾向
にあること,第 5回調査時の学生の集団は他の年代と比較して,ライブによる鑑賞行動を行う傾向にあるこ
とを強く示している.
6. 結論と今後の課題
本研究では,筆者が第 5回学生調査の 10%抽出データのデータベース作成を担当することになったことを
機会に,これまで独立して存在していた過去 4回の学生調査のデータベースとの統合を目指すこととし,実
ASプログラムを作成した.その
際に統合データベースを作成するとともに,分析にあたって汎用性のある S
表 3 過 去 1年 の 実 演 芸 術 鑑 賞 経 験 の 有 無 に 関 す る 時 系 列 的 な 視 点 を 含 む 分 析 の 推 定 結 果
.
.
:
;
.
;
三
ド
ヒ
ュ
ラ ,
可Zξ 蹴!~!
叫f
¥
(
I
.
i
l
¥
‑
.
!
1一
一「一一守ベラ咋
z 踊・符 ~li' ハレエ
ク
ラ
ン
ッ
ク
汀
決
、切~~iM
1
9,
973
9i3
1
9,
9
i
3
1
9
.
9
7
3
1
9
.
9
7
3
1
9,
サ
ン
プ
心
世
1
9
.
9
7
3
1
9
.
9
7
3
最大対置λ~JJt X(‑,
)
\kfi!ddぃ,,(1)催国 1~2 最
.
t
;
&
比
,
,2乗
8
3
1
0
.
3
1
.
1
1
9
9
.
1
1
3
0
2
1
.
0
1
0
6
1
6
.
0
19815.~
2
3
8
7
5
.
1
0
.
1
2
7
。1
0
3
O.HH
0
.
1
5
0
0
.
2
1
8
0
.
0
7
1
1
2
8
.
6
3
9 <
.
0
0
0
1u
2
71
.
12
6 <.0001~. 2
8
8
4
.
0
2
7 <.0001" 1
1
8
3
8
.
7
6
9 <.0001" 1
9
5
1
.
7
7
2 <.0001" 1
0
1
9
.
9
4
6
0
1‑
p
L
'
P
1
l
f
宵
p
l.
1
!
.
p
t
'
p.
1
l
p
U
t
.
0
0
0
1
.
.
.
0
0
0
1
.
.
0
.
6
1
6 <
0.
40
1 <
0
.
6
6
4 <
1
0
0
1
.
0
0
0
1‑
0
.
6
5
9 く 加0
0.
49
t
i く0
0
.
2
3
8 〈 曲 。 1‑
1
8
0 〈 凹0
0
.
5
6
2 <
0
.
3
2
1 <
.
0
0
0
1
0
0
1‑
.
0
0
0
.
0
0
0
1‑
0
.
1
8
8 0
0
.
0
3
3 0
.
3
5
6
1‑
0."7 く0
.
0
0
0
1
.
.
<
.
0
0
0
1
.
.
0
.
2
6
3 <
0
.
3
9
7 <
ー0
.
3
1
3 〈 凹 01.'
.
0
0
0
1'
"
'
0
.
1
6
2 <
0
.
2
7
9 く0
.
0
0
0
1‑
O.I~O
0
0
1‑
.
0
0
0
1
.
.
0
0
0
1
.
0
0
0
1••
0
.
2
1
1
0
.
2
9
i <
0
.
:
'
:
0
3 く 0001‑
'
0凹 1"
0
.
3
9
8 <
0
.
1
8
:
: く 凹 01..
0
.
1
'
五 <
.
0
0
0
1
.
.
.
0
0
0
1
1••
.
0
0
0
1.
.
.
O
.
5
:
?
t <
0
.
3
5
2 <
0
.
5
0
1 <
0
.
:
'
:
9:
,
: 〈 凹0
O
.
:
!
3
1 <
.
0
0
0
1
0
.
1
1
6 O曲 0
.
0
0
0
1
.
.
0
0
1••
0
0
1'
"
'
.
0
0
0
1
'
0
0
0
1.
.
.
0
.
7
5
7 く0
0
.
5
3
8 <
0
.
3
6
:
: く0
0
.
1
8
1 <
0
0
1‑
0
.
2
3
3 く0
0
.
1
7
3 <
0
.
0
4
8 0
。1
0
3 く 0001..
.
1
6
3
o
.O
I
:
n 0.00'‑ ‑0.(日7 0.0五J
‑
0
.
0
2
6 0
.
1
9
5
0
.
0
01
:
l
0
.
6
:
:
8
0
0
1.
.
.
.
0
0
0
1.
.
.
0
.
1;
11 <
.
0
0
0
1u
.
0
0
0
1.
.
0
.
2
9
0 <
0
.
0
3
5 O
.
:
!
2
9
0
.
1
1;
1 0
.
0
0
0
0
.
1
2
7 <
0
.
:
.
!
1
8 く0
.
0
0
9••
'
0
0
0
1••
‑
0
.
0
7
3 0
‑
0
.
1
3
9 <
.
1
2
.
1
.
0
0
0
1
0
.
0
1
9 0
.
1
9
0
0
.
0
7
1 0
.
0
9
0
0
.
2
0
7 <
0
.
0
7
5 0
.
0凱)J**
.
0
0
0
1u
.
0
0
0**
0
.
3
1
1 <
0
.
3
3
:
: <
0
0
0
1
。1
3
5 0
0
.
1
2
6 く0001..
0
.
2
6
5 0
0
.
:
;
5
1 く.
.
0
0
3
.
0
0
0
1
.
.
.
0
0
0
1
.
.
.
0
0
0
1
.
'
0
.;
12
0 <
0
.
7
7
8 く0
0
.
6
0
6 <
.
0
0
0
1.
.
0
0
1‑
.
0
0
0
1‑
0
.
7
3
0 <
0
.
1
1
5 <
0
.
2
2
4 <
0
0
1.
.
.
0
0
0
1.
.
.
0
0
0
1.
.
.
0.
4
.4
1 0
0
.
1
8
0 0
.
0
8
7
.
0
0
3‑
0
.
5
9
1 く0
0
.
4
6
4 <
0
.;
13
1 <
0
.
:
:
3
5 く0
0
0
1‑
5%
1寸
推
定
主子
北海辺東北
'
I
'
!
'
;趨 東 榊 北 陪
近後
中1
1
1阿 1
司
雄
定
例
,I1
推
定
慌
推
;
t
!
1
!
・
・
,<
, 推
定
怖
・
・
目
推
,
;
o
!
,
仇
<
叩
。
・・
目
九州 ~I 縄
・・
目
I
I
'
{
'外通』
・
・
;;~:JH 調食
前4
[
"
1調 査
"
'
¥
5
[
"
)調 作
悦
世
メ
デ
ィ
ア
;
こ
よ
る
輯
験 {iり
聴
覚
メ
デ
ィ
アこ
よ
る
梓
験
イ
!
り
liJIHの 叫 は 1%イ
(
.
0
"
:
水
植
村
主
l
・・
有
"
0
:
水
申
で
有
0
"
'
で
あ
る
こ
と
を
‑393・
1
1
0
0
9
.
0
0
.
0
3
9
3
3
4
.
1
5
6 く0
0
0
1.
.
.
p
l
l
f
l
.
.
0曲 1‑
0
.
3
0
2 <
.
0凹 1
'
.
0
.
3
1
5 <
0
.
1
5
6 0
.
0
0
0
0
.
0
2
9 0
.
1
0
1
0
.
1
6
8 0
.
0
0
'
.
0
0
0
1.
.
0
.
2
0
1 <
0
.
0
0
9 0
.
7
3
:
:
0
.
0
5
5 。 070
0
.
0
1
6 0
.
6
8
7
0.
42
5 く 0001..
.
0
0
0
1.
.
0
.
2
5
8 <
.
0
2
1.
.
.
0
.
1
:
.
!
8 0
推
定
統
・・
・・
上で, SASを用いて任意の調査回の集計・解析結果を相互に比較できる形式で出力できることを確認し,さ らに全ての調査回のデータを用いた時系列的な分析を実行し,構築したデータベースの有用性を実証した. また,実演芸術のメディア鑑賞とライブ鑑賞が補完関係にあり, 2007年の第 5回調査の対象となった学生の 集団が 1 9 9 1年 , 1 9 9 6年および 2002年の調査時の学生の集団よりも実演芸術を鑑賞する傾向にあることを示 した.学生という一部の社会集団に関する分析ではあるが,社会生活基本調査の集計結果や,各地方自治体 や文化・芸術関連団体が保有する個別の来館・来場者データの分析結果と組み合わせることで,デジタル時 代のアーツ・マネジメントを効果的に推進することが可能になるのではなし、かと考えられる. しかし,本研究で示した分析はあくまでも実験的なものであり,今後は詳細な分析を行う必要がある.さ らに,鑑賞経験率の集計や 2項目帰分析におけるパラメータの推定に際しては,各個票データの母集団復元 乗率に基づく重み付けの調整が必要であるといった課題が残されている.ただし,復元乗率を求めるために は学校基本調査の学年・地域・学部・設立主体別の在学生数のデータが必要であるが,これらのデータは 5 年前までしか保存されておらず,何らかの方法で復元乗率の推定作業が必要となる.また,変数名に関して, 現在は,どのデータセットの何番目の変数かを示す変数名を便宜的に付与しているが,分析の利便性を考え るならば,各変数が何を表しているかが一目でわかるような変数名を付けるべきであろう.これも今後に残 された課題である. 謝辞 本研究に当たっては,兵庫県立大学神戸学園都市学術情報館の周防節雄教授から SASプログラムの指導を 1 9 8 8 ),永 いただし、た.また,第 1回から第 5固までの調査を行うにあたっては,研究会の諸先生方(三善 ( 山 ( 1 9 9 2 ),杉江 ( 1 9 9 9 ),周防 ( 2 0 0 4 ))の検討の結果としての調査票が使用されており,調査票の配布,学 生への説明,調査票の回収に関しては,多くの高等教育機関の調査への参加を承諾していただいた諸先生方 からの多大なご協力を頂いている.さらに,第 1回から第 5固までの調査では,調査対象となった学生の皆 様には多岐にわたる詳細な質問への回答にご協力頂いた.ここに記して感謝し、たします.ただし,ありうべ き誤謬は全て筆者に帰するものである. 参考文献 p p . 1 3・ 2 9 . 有馬昌宏 ( 2 0 0 8 a ),I 消費支出と行動実態から見た芸術・文化の需要構造J,~季刊家計経済研究11, No.79, 有馬昌宏 ( 2 0 0 8 b ), I 全国学生調査に基づく実演芸術鑑賞行動の規定要因の分析 J,~2008 SA Sユーザー総 p . 9 3 ‑ 1 0 2 . 会 アカデミア/テクノロジー&ソリューションセッション論文集1,p 5年の学生調査データ 加藤優希 ( 2 0 1 0 ),~学生の実演芸術鑑賞行動の規定要因に関する基礎的研究 一過去 2 ベースの構築と分析を通してー1,兵庫県立大学応用情報科学研究科修士論文. 伊藤裕夫,小林真理,中川幾郎他 ( 2 0 0 2 ) ,~新訂アーツ・マネジメント概論11,水曜社. 周防節雄(編) ( 2 0 0 4 ),~芸術・文化政策立案のための統計指標の開発と体系化に関する研究11 (平成 1 3年 度 平成 1 5年度科学研究費補助金(特別研究促進費( 1 ) ) 研究成果報告書). 杉江淑子(編) ( 1 9 9 9 ), ~実演芸術の需要の実態と構造に関する統計情報の収集と時系列分析11 (平成 1 0年 度科学研究費補助金(特定領域研究 A)公募研究成果報告書). 永山貞良J I (編) ( 1 9 9 2 ),~わが国文化・芸術情報の体系化と統計調査方法の研究11 (平成 3年度科学研究費補 助金(総合研究 (A)研究課題番号 0 2 3 0 5 0 0 9 ) 研究成果報告書). 三善晃(編) ( 1 9 8 8 ),~わが国の芸術活動の動向予測に関する基礎研究11 (昭和 62年度科学研究費補助金(特 定研究(1)研究課題番号 6 2 1 2 4 0 1 4 ) 研究成果報告書). W.H .( 1 9 9 2 ), B u i l d i n gt h eDataW a r e h o u s e, 1 0 h nWiley& S o n sI n c . . Inmon, ‑394・
付録 S ASによる分析を実行するためのフ。ログラム / *d a t a s e t make* / 円分析用のデータセットを作成する*/ o p t i o nn o c e n t e r ; l i b n a m es t u d e n t"C:SAS"; d a t at e m p ; . f a c es t u d e n t .l i v es t u d e nt .m e d i a ;byk e y ; merges t u d e nt =1985t h e no u t p u t ; / *第 1回調査*/ *i f s v y e ar v y e ar =1 9 9 1t h e no u t p u t ; / * 第 2回調査*/ * 江 s *i f s v y e ar =1996t h e no u t p u t ; / * 第 3回調査*/ *i f s v y e ar =2002t h e no u t p u t ; / *第 4回調査*/ *i f s v y e ar =2008t h e no u t p u t ; / *第 5回調査*/ u t p u tする*/ /*横断面分析を行う場合には,分析を行う年のデータだけを o r u n ; / * 合 合 * * * * * * * * * 合 合 合 合 合 合 合 合 合 * 合 * 合 合* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 1 / * L o g i s t i c . s a s * / / * d a t a s e tm a k e . s a sによって作成されたデータを使用し,分析を行う * / /***********合合************合合合合合****************合合合合******************合/ o p t i o n sn o c e n t e rn o d a t enonumberm p r i n t ; %letl o g i s t i c c l a s s = c l a s s 目的変数従属変数; %macroa n a l y s i s ( c a l c u l a t e, name, i n d v a r , d e p v a r , o p t i o n ) ; p r o c& c a l c u l a t ed a t a = temp; & l o g i s t i c c l a s s ; & c l a s s;model&indvar=&depvar& o p t i o n ; データについて &name.を実行";r U D ; t i t l e" & i n d v a r . %mend; lo g i s t ic,二項ロジスティック回帰分析,目的変数(伝統演劇), %a n a l y s i s( 従属変数,); %a n a l y s i s( lo g i s t ic,二項ロジスティック回帰分析,目的変数(現代演虜1]), 従属変数,); % a n a l y s i s( lo g i s t i c,二項ロジスティック回帰分析,目的変数(オペラ等), 従属変数,); %a 姐n a l 戸 y 阿 s i s 咲 州 ( lo g 扉 戸 向 s t i c,鳥二項ロジステイツク回帰分析,目的変数(舞踏.パレエ), 従属変数J %a 副姐 n必 a l 凶 y s s i s 吋 州 ( lo g i 山 耐 s は t ic,鳥,二項ロジステイツク回帰分析,目的変数(ポピユラ一音楽),従属変数J %a 姐日 a l y 凶 s s 討i s 州 ( ( l o g 扉 9 山 耐 s t i c,鳥,二項ロジステイツク回帰分析,目的変数(げクラシツク音楽),従属変数,); %a n a l y s i s( lo g i s t ic,二項ロジスティック回帰分析,目的変数(大衆芸能), ‑395・ 従属変数,);
G~ 丸 I 帯十 岬岬岬脚品川 も 時系列予測における外れ値の構造の発見 . . . 1 1 ‑ 広淵俊亮泉水克之 SA5I n s t i t u t eJ a p a nL t d P r o f e s s i o n a lSelVi c e sDepartment ・u . " '..1‑ー‑ ~saS. l~ 司F戸 I 概要 目』生時系列予測の精度向上 国皐ム外れ値を含む時系列における外れ値の扱い 》外れ値とは、時系列の通常の変動パターンから外れた例外的な値を指す。 l y 時系列のモデリングの際に、データに外れ値が含まれると予測 精度が下がる o ,. SASForecastServerlこおける外れ値の取り扱い: ・学習データから外れ値を自動的に検出(将来の外れ値は予測できない)。 ・ユーザーによるイベント定義が可能(将来の外れ値は自動的に検出できない)。 量室主遠午周期性のある外れ値を検出し、予測モデルに取り込む 》データの外れ値度合を外れ値スコアとして数値化 F 外れ値スコアの時系列を分析し、外れ値の出現パターンを検出する。 鎧論提案手法により、将来の外れ値を考慮した予測が可能に →予測精度の更なる向上 ‑ 3 9 9 ‑
~~恥 E 時系列データの予測 旦血ょ時系列データの将来の値を予測すること 入力データ 》一次元の数値時系列(複数あってもよい) 例.アメリカの飛行機利用者人数の推移 経軸.人数 l '」 ー:ーマ一一一一一一一 ' ̲ 1 横軸;日時 ( 1 9 9 0年 1月から 2004年 6月まで) ~5お i 恥~- 時系列データの予測の重要性 リスク管理の必要性 》業務において扱う多くの量が時間的に安定せず変動している。 ・ある商品の在庫、電力の需要、など。 F 変動への対処を怠ると多大なリスクが発生する可能性がある。 変動の予測 》リスク管理の観点から、将来の変動を予測し、その結果を基に事前に対策を 講じることが重要となる。 F 予測の精度が高いほど、リスク管理は容易になる。 F 多大なデータから人手で予測することは、コスト的にも時間的にも困難。 時系列モデリングによる予測 . ,SASForecastServer(以下 rFSj)を用いて高精度な予測を大量に速く 自動的に実行可能 ‑400・
~~抱一 I 外れ値を含む時系列の予測 本発表では、外れ値を含む時系列の予測について取り扱う。 盟運設立 主主L外れ値を含む時系列データ 》外れ値とは、時系列の通常の変動パターンから外れた例外的な値を指す。 cr‑‑外れ値 ̲ . .̲‑.‑ーー... . 、ー一回.凶』・・. 一角、.ー一ー ー 解くべき問題 》出来る限り高精度に、外れ値を含む時系列の将来の値を予測すること。 ~~恥 I 外れ値を含む時系列予測への要請 外れ憧の検出 》学習データに含まれる外れ値の自動検出 ‑外れ{直を考慮せずに予測すると、外れ値の影響で予測精度が下がる。 ・ユーザーが外れ値か否かを目視で判断するのは困難なことが多い。 一 , ど と 三 ベ 一 が 槌 起 こ 叩 つ 冗 叩 て 引 イ 〆f L 外れ値といえる。 しかし、このようお変化を目視で積出する のは非常に困離。 将来の外れ値の予測 F将来のデータにおける外れ値の出現位置を予測する必要がある ・将来の予測における外れ値の影響も考慮することで予測精度を更に向上させたい。 ‑ 4 0 1・
E 側 SiihW 前頁の要請を満たすための手法現状と課題 豊墨 過去の外れ値は検出できるが、将来の外れ値の発生時期を自動的には検出できない 既存手法時系列モテ リングによる外れ(直の自動検出 ψ シ推定されたモデルから外れている点を外れ値として検出→外れ値を除外して 再度モデル推定→推定されたモデルから新たに外れ値を検出→・.. 直の検出も自動的。 戸モデルは自動的に推定されるので、外れ1 P外れ値のモデル化をするわけではないので、将来のテータにおける外れ値の出 現位置の予測はできない。 既存手法イベントの定義と挿入 Fユーザーの事前知識を基に、外れ値が発生するであろう時点(クリスマス、忘年 会、土用の丑の目、等)を「イベント」として定義し、予測に取り込む。 Fユーザーのドメイン知識に依るので、自動的な検出 i ま出来ない。 F いつイベントが発生するかは判っているので、将来のテータにおける 外れ値 ( rイベン卜 J )の出現位置を予測できる。 B s ぉj h E SASF o r e c a s tS e r v e r モデリングによる時系列予測 》時系列の時間遷移をモデル化。 P推定したモデルに従って将来の値を予測。 高精度な予測 シ様々なタイプのモデルが用意され、その中から最適なモデルが選択される。 》トレンド、周期性(季節変動)、等、業務上必ず発生する変動パターンを考慮。 》イベントの定義と外れ値検出の機能を有し、外れ値を考慮した予測が可能。 ForecastServer でできることとできないこと :'>(可)外れ値の自動検出 :.>(可)イベントの定義と挿入 >‑(不可)将来の外れ値の出現位置の予測 →本発表ではこの問題を解決し、予測精度の向上を狙う。 ‑402・
G~ 恥 1 関連研究 ForecastServerにおける外れ値検出 TSAS/HighP e r f o r m a n c eF o r e c a s t i n gU s e r 'sG u i d e . オンラインの外れ値検出 rK.Yamanishi,J .T a k e u c h i .G .W i l l i a m s .andP .M i l n e .O n ‑ l i n eu n s u p e r v i s e do u t l i e rd e t e c t i o nu s i n g f i n i t em i x t u r e sw i t hd i s c o u n t i n gl e a r n i n ga l g o r i t h m s .I nP r o c e e d i n g softheS i x t hACMSIGKDD l n t e m a t i o n a lC o n f e r e n c eonKnowledgeD i s c o v e r yandDataM i n i n g( KDD2000).2 0 0 0 . →確率モデルを用いた外れ値度合いの数値化をオンラインで実行する。 予測には言及しておらず、あくまで外れ値検出が主題。 予測符号化の符号長でモデルを評価 ト . .J .R i s s a n e n .U n i v e r s a lc o d i n g ,i n f o r m a t i o n,p r e d i c t i o n,ande s t i m a t i o n .IEEET r a n s a c t i o non l n f o r m a t i o nT h e o r y .3 0 : 6 2 9 ‑ 6 3 6 .1 9 8 4 →予測符号化の符号長が最小となるモデルを最適なモデルとみなす。 ~@!è@llîl!収 1 提案手法:時系列モデルの外れ値構造の検出 提案手法の概要 . ,SAS時系列予測プロシジャを用いた外れ値構造の検出 l 入力時系列日 予測と外れ値度合 (以下「外れ値スコア J ) のスコアリンヴを 逐次的に実行 ) ι l ( 外 柑 ス コ ア1 )' : , 1 ' 1 丘三土王二J.^'旦当主l 主位麓註量」 圭旦巳主任剖車圭塾量生 1 . .‑ I o gp(x, I 孔,) 空 t 3 1 { 直スコア時系到旦撞造圭金並」主 圭遡i 三孟毘 ‑403・
e h E なぜ提案手法を用いるのか 将来のデータへの予測精度の向上 》外れ値を数値化し、そこから外れ値の構造を予測するので、個々の外れ値にひ とつの変数を劃り当てる必要がなくなり、モデルの複雑度が減少する。 》将来の外れ値の出現位置をモデルに取り込めるので、予測力が向上する。 工数の削減 F 人手によるイベントの検出を(半)自動化することで、工数を削減できる。 可読性の向上 》外れ値度合(外れ値スコア)の数値化により、外れ値(イベント)の発生パターン を目で見て確認できる。 1 0 E esaSi器恥 ステップ 1:確率モデリング 時系列の変動を表す確率モデルを学習 》モデルの例 :A 問M A モデル(詳細についてはA P P E N D I X 参照) A悶 MA モデルでは以下の三つの成分によって時系列の時開発展をモデル化します。 1.平均値周りの振動(上がったら下がり、下がったら上がって平均の周りをうろうろする)成分 2 .トレンド(平均値が上昇または下降する)成分 3 .イベントの発生など、短期的にしか影響を及ぼさない突発的な成分 学習したモデルを用いて新規データの出現確率を計算 時 t I J t ‑ Iまでのデータ :yH yHから推定された確率密支関数 : P ' ‑ I 確率密度関勢,‑1の ノ4ラメータ:乱 時刻fのデータ :y , 過去のモデルから見定見在のデータの出現確存 : P ' ̲ I(y , I D H ) I I ‑404・
s~ 恥珊 ステップ2 外れ値スコアリング ι i 車産金 L ¥ 互主主直1 査盟主二三~&. ( J )姓 一 じ F新規データの外れ値度合を外れ値スコアとして数値化する。 F数値化によって、元の時系列から外れ値スコアの時系列が得られる。 性包!直ユコアを hテ2-1:: テ.~lJ.~ の当てはめ統計量 J と 11 定義 F過去データを用いた予測からのずれ(予測符号長)として外れ値スコアを定義。 外れ値スコア (y, )三 , l o gp,(y, IB,, ) F 数値化によって、元の時系列から外れ値スコアの時系列が得られる。 F 外れ値スコアは学習された過去のデータの出現パターンから新規データが どれだけ外れているかを表す。値が大きいほど過去の傾向から外れている ことになる。 ※K .Y a m a n i s h i .J .T a k e u c h i .e ta . lKDD2000.2000 ※J .R i s s a n e n .IEEET r a n s a c t i o no nl n f o r m a t i o nTheo , y r 30:629‑636.1984 1 2 S鈎 曹 ステップ3 外れ値スコア時系列の構造の検出 外れ値スコア時系列から構造を検出 F非周期的なピーク:モデル推定の際に考慮すべき、学習データに含まれる突発 的なイベントに相当。 F 周期的なピーク:モデル推定と時系列予測の両方で考慮すべき定期的なイベン トに相当。 》よ昇トレンド.時系列の変動の仕方が FSに用意されているモデル族ではうまく表 現できなくなってきているとし汚傾向を表す。 F F 下降トレンド・時系列の変動の仕方が FSに用意されているモデル族でうまく表現 できるようになってきているとし巧傾向を表す。 周期変動:真のモデル自体が周期変動している可能性を示唆する。 O~ー~ピーワ 外れ値スコア時系列。横軸は時間 縦軸は外れ値スコアを表す。 1 3 ‑ 4 0 5 ‑
ssaSihlE 実験設定 実験データ . ,AIRデータ:アメリカの飛行機の乗降客数の月次データ o . ,(現在追加実験を検討中) 註血量翠 》以下の三つの場合について予測精度を比較した。 ・外れ値を考慮しないARIMA モデル( F S ) ・外れ値を考慮するARIMA モデル( F S ) ニ ARIMA モデル(提案手法) ・将来の外れ値(イベント)の位置を指定しT 伊予測精度の評価指標としてMAPEを用いた。 その他の設定 F 提案手法の予測とスコア 1 )ングにはF o r e c a s tS e r v e r lこ付属主盈 SAS! H i g hPerformanceF o r e c a s t i n g のp r o ch p f を使用した。 1 4 川 m ; ; 丸 [ 実験 1 :AIRデータ 入力時系列 , .2 0 0 1年 9月に、 9 1 1による大幅な旅客数減がみられる。 ) , ; ‑1 9 9 6年 6月に、目視では検出困難なトレンドの変化がある。 J パ 貝 J i l i j i J l T ; F i f ; , ,I̲F:,./守 1:\;;.:r.~', 1 1 1 1 ! 」μ何 い JU ・ 1id 仰向 山下 j , L トレンドの変化 /ノ 旅客数の急減 , . . .. ̲ . . . , … 一 一 一 . ' ̲ , . . ‑ . ~寸円一~一一-,-......-,ー,一一[一日一一~-.-,-. 一一一コ町四......~, ..剛一 I.....~... J . u . . . . ・e 1 5 ‑406・
B~ 恥 l 一 一 実験 1 :AIRデータ 外れ値スコアの時系列 》逐次的な学習と予測によって、元の時系列を予測符号長の系列に変換 1 6 e s a恥 S .i │ 実験 1 :AIRデータ 外れ値スコアによって外れ値の構造が検出できた 1 . , i ; : 'J j ! " . I " i‑j 日記月に外れ値スコアの j 1 7 ‑ 4 0 7・
s s a s . !:8:'. まとめ 外れ値多含む時系列の予測問題 》外れ値(時系列の通常の変動パターンから外れた例外的な値)を適切に 取り扱うことで、時系列予測の精度を更に向上させたい。 》リスクの管理の観点から予測精度の向上は非常に重要。 SASの時系列予測プロシジャを用いた外れ値の構造の検出 シ「テストデータへの当てはめ統計量」を用いて外れ値を数値化。 F 外れ値時系列の構造を分析し、予測に活用。 1 8 Ri * I ‑ : , 恥 [ APPENDIX. ARIMA モデルの概略 1 9 ‑ 4 0 8 ‑
S羽 a 恥 E 一一 ARI阿Aモ デ ル . A 悶 MA モデル i 立時系列の時開発展モデルです。 ' A悶 MA モデルを用いると、時系列に含まれる以下の三つの成分をモデル化できます。 1.平均値周りの振動(上がったら下力旬、下がったら上がって平均の周りをうろうろする)成分 2 .トレンド(平均値が上昇または下降する)成分 3 .イベン卜の発生おど、短期的にしか影響を及 l まさおい突発的芯成分 • A悶 MA モデル l 立 、A R(AutoR e g r 巴s s i o n )モデル、 I ( I n t e g r a t i o n )モデル、 MA(MovingA v e r a g e ) モデルの三つのモデルを組み合わせたモデルです。以後のページでは、それぞれのモデルに モデルについて説明します。 ついて解説し、最後にそれを組み合わせたA悶 MA G s a S .i I 恥 一 ARI阿Aモ デ ル ( i n d o n e s i a ̲ d e m a n d ;yと書く)の値が、直前 p個の従属変数の値から決まるとするモデル; y ( t )ニ αl y( t‑l)+α2y( t‑2)+…+α Py( t‑p)+ε( t ) .(はノイズを表します。 .ARモデルで推定されるパラメ-~I;l: p個の係数 al 、缶、...、 a p です。 ' A Rモ デJ レは平同値周りでの振動(値がよ力てったら次は下力句、下がったらよが吾、といった変動)を表します。 ‑ 4 0 9 ‑ ̲.‑.
~~喜弘 I ARI阿Aモデル ,1 モデル{階差モデル ) : I ( d ) 企~d守男目玉型空笠型空竺1哩b(.芳盟型企型E里担竺笠巴豆)0: 一一一一一一一一一一一一一 y ( t )‑y ( t‑d)=c ( y ( t‑1)‑y ( t‑d‑1))+ ε( t ) ε ‑はノイズを表します。 . 1 モデルで推定されるパラメ ‑9 は1 個の係数cです。 . 1モデルは従属変数時系列のトレンド(平均値の上昇や下降)を表します。 s s a S . I i 幸弘 ARI阿Aモデル , y ( t )=μ +b o & ( t )+b& ( t‑1)+… +bq&(t‑q) ε ‑はノイズを表します。 'MA モデルで推定されるパラメ 9 1 まq個の係数t 、 如 b,、…、臥と平均項 Hです。 ・阿A モデルはイベントの発生の影響を受けて従属変数の値がきまるよう怠状況を表しています。 ‑ 4 1 0・
~鉛Sih_. ARIMA モデル独立変数の MA モデル 独立変数の MA モデル : M A ( q ) 従属変数の値現在と過去 q 個の独立変数(c o a [ ̲ I M F1Jど: x t 書く)変化量が、 前の時劃!の変化量から決まるとする。 y ( t )=μ +b o x ( t )+b ) x ( t‑1)+… +bqx(t‑q) ‑独立変数を含む MA モデルで推定されるパラメヲ l 立q個の係数 b 、 旬b ,、.、b, t 平均項"です。 ‑独立変数を含む MA モデルi 立過去の独立変数の値の影響を受けて現在の従属変散の値がきまるようむ状況を 表しています。 . ̲ ~詩吟晶 ARIMA モデル SE /SE 6'b ︑ .︐ノ SE ︐ ︐ ︑ x ︑ ︐ ノ 一 ︑ ︐j J SE ‑411・ AB一 AB ︐ ︐ ω λU 一 ︑て︑ + 一︽ By(t)=y(t‑1) ︑.︐ 6'b 〆︐. ︑ E ︑ . ︐ ノ ‑ ︑ EF' SE ︑ ‑ ︐ ︐ ︐ ︐βv 一A︑ W' + μ JU 一 一 ︑ ︐︐ノ SE 4 ' ι ︐ ︐ ︑ y E F ' J'E ' ι ︑4 VJ ︑ ・ AB B AR(AutoR句 悶s s i o n )モデル、 I ( I n t 匂 旧t i o n ) モデル、 M A(MovingAve 日g e )モデルの三つのモデルを 組み合わせるとA問 問Aモデルとなります。 ARIMA モデルの具体的な表式は以下のようになります。
~ ARI阿Aモデル ‑自は移動平向演算子と呼ばれ、以下のようt J多項式で定議されます。 θ(B)=1α lB‑…‑ α pBP, →θ(B)y(t)=y(t)‑αly(t‑1)一… ‑aPy(t‑p). ゆ(B)=1‑b1 B‑…‑bqBq, →ゆ (B)y(t)ニ y ( t )‑b 1 y ( t‑1)一… bqy(t‑q). ~sぉ ih 目 ARI阿Aモデル ‑ ω も自と同様に移動平均演算子で、日の多項式として定義されます。ただい自と等しくはありません。 ω(B) δ( B ) ‑ 4 1 2・
G~. 岬̲ """'‑F' 予測分野における SASの活用 i 置S ニ SASI n s t i t u t eJapan株式会社 I ! " 'f l " N l :~‑ il'副町田 ビジネス開発本部 SCIヴループマネージャー τ・ 石井宏司 B Agenda • SAS9.2予測ソリューションラインナップ ・共通基盤 F o r e c a s tSe刊 e r機能概要 . 各ソリユーション概要 ・事例 ‑ 4 1 5 ‑
~臼tiI弘| 予測の適用場面の例 ‑ 新製品の投入 ‑ 滞納率 ・モデルチェンジ ・様材発注 ・コールセンター業務 リソース計画 . ワランティ引当金 ・スケジューリンゲ ・プロモーション効果 . 犠材最適化 . 価格最適化 ・歩留まり管理 補修パーツ . 在庫最適化 E ・販売・上市計画 . 財務計画 ・マーケティンゲ計画 . プラント最適化 ・過剰在庫/販売様会損失 ・ロジスティヲス . モデル最適化 . 倉庫稼働率 ug e3fJ SASSupplyChainI n t e l l i g e n c e( o nSAS9.2) 予測ソリユーションラインナップ パッケージソリユーション • SAS<il DemandD r i v e nF o r e c a s t i n g e r v i c eO p e r a t i o n sO p t i m i z a t i o n • SAS<il S • SAS<il S e r v i c eP a r t sO p t i m i z a t i o n • SAS<il W a r r a n t yR e s e r v eF o r e c a s t i n g サービスオファーリンヴ • SAS<il NewP r o d u c tF o r e c a s t i n gS e r v i c e sO f f e r i n g ‑ 4 1 6・
B~
e
SAS F
o
r
e
c
a
s
tS
e
r
v
e
r
GææJl!!~.
0
SAS F
o
r
e
c
a
s
tS
e
r
v
e
r
SAS~ F
o
r
e
c
a
s
tSe同 ed
主、大量の実帽子ータを高速に分析し、時系i!l
1
の予測を簡単駐機作で作り出すことができる、ワライアントーサーバー型
のツールです。予測由初期モデルを自動作成させ、植敬ユザで予測結果を共有し駐がら、予測モデルを高度化させてい〈のに適したツルで
す。分析予測の初心者からエキスパートまで、幅広いユーザ層の二 1に笹えることができる、栂々屯担能を備えています。
一 ̲
胃
、 4・
τ
.
.~.:.::,!"・“仰-"守布告楠a・‘"・
.
:
!
t
ヰ
.
'.1".1'; '
J
J
̲̲̲."
ー
コ‑
‑
L
一
二一一一一一一一
.
j
.
.
.
‑
皿
.
.
申
‑
'
.
.
i
l
I
:
・i
l
い
‑
r‑
‑
‑
i
lj
ι
│
一
ー
ー
町 一 作
パ
! (壬盟王7'),1Q'止
,
,
.
,
.
…
‘ぺ~
晶.バ5
ヤ→‑毛子一
~車部品221;37T
1
1
円
1
1ル1
警警含わ世る ι
凶l
け
す
じ
ι、その開鳳の
立
こヒ
実掴脚圃何畑聖傾唖抗示さ拘廿る
U
圃
ト
一
一
一
一
」
午
斗
斗
一
オ
斗
│
ト
、 iV'̲ ~ ¥ 悶 討
β
f
台 哩τ
胃F烹 r
豆芳ご竺‑¥ユつワ...'~~叩一f)1 r
盟盟盤阻雌
造
τ
τ
「
一
一
一
一
一
一
一
ー
山
町
‑
‑
・
4 町 一S 回
・
】
υS
一
一
一 ̲.̲,
.
.
.
.
1 ̲̲..
1
1 l製品/製品階層の全てについて
"".叫イ IIそれぞれ予測モデルの自動作且ヒ
t
参画が行われます。
室盤量亙よ立至週Jil
自動予到の桔畢を基!こ、予測恒
一̲̲.III""iz:;Jj!の瞳討や手入力修正{オーバーラ
三三三三三二一一二二一二ご三三三ニヨヨ空~翌日」
‑
4
1
7・
イド)が可能です。
G~ 弘司.-
SAS F
o
r
e
c
a
s
tSe刊 e
r一時系列需要予測の概要
0
時系 ~l デ ヲの分析.予剖モデJ
レの禍築と適性判定{力ーブフィヮティンヴ)、予剥値軍出とベストモデル遺出までを自動プロセスで高速化。
実績追加時の迅速担予剥修正やシミュレーション何mat汗分析)も可舵。
万台
、
v
予調開始
・時;jI ~1 予 Z闘のイメージ
'50
F
B コt
:.
.
.
.
"l<・四回目:[;;11 ' 1 ̲
∞
2
1
5
0
∞
1
50
t
:
:
J
"
"
d
't::J"'\~ <:)...,
1
$
>t::J"'\'~ t
:
J
.
f
'
.
.t
:
:
J
t
J
.
r
!
}
‑t
:
:
J
t
J
.
d
't::J~\~ f)~\rf <
:
J
‑
.
.
"
t
:
:
Jt::J~'''''' f
;
)
t
J
.
r
!
;f
;
)
t
J
.
d
't::J"'~ f)"'\~ f
;
l
"
,
¥
,
t
:
:
Jt
:
:
J
t
J
.
'
'
'
't
:
:
J
.
.
.
.
,
c
9
‑<
:
J
'
¥
¥
d
't::J"":~ t
:
:
J
,
¥
¥
1
$
><
:
;
J
,
¥
¥
,
t
:
:
J<
:
J
"
'
.
¥
'
'
'
'<
:
J
"
"
c
9
‑f
;
)
"
'
¥
d
'f
)
'
e
,r
f<:J~\♂
G臼 Slh
SAS.F
o
r
e
c
a
s
tSe刊 e
r一予測プロセス概要
需要!こ対して彫響を及l
まし得る時系列要素{季節位、トレンド草ど)を盟諸し、機々草モデルの中から量適怠ものを自動選
まし得る項目(イベント)を取り込むことで、予測精度を向上させます。大容
択します。さらに、時系列要素以外に彫曹を及l
量の予測対象デ 告を級う場合には、分析のプロセスをコード化してパッチ処理することが可能です。
‑壬墨̲Lg立孟
,
.r
1Mユ二五
‑418・
I
朝 . , ~sasl 議早 SAS. F o r e c a s tS e r v e rーさまざま芯予測モデルを活用 SASでは.予測モデル構築において特別主統計知識を必要とせず、 SAS. Fo同 C出 tSe町"が自動で書楕1;;予測手法からモデルの自動 構築・肝価を行し¥量適白予測手法を自動選択して予測値を算出することができます。 一一ー一一一ー一一ー一一一一一一一、 1デフォルトで用意きれている主肝澗手生 1 :~墨壷量時系列モデル、 ARIMA. 指数平滑 1 容認さアき奇~ 1化、 Unobserved Component Mode!、 i JE i 平旬、ランヲムウ才ーっ :Croston法、 Average demand Model. : iCu町e侃 ting、外部予測の取り込み、移動: ; 」ーーーーーーーーーーーーーーーーーーーー‑ー"ーーーーーーー一 販亮実績 VJ FIll‑ ゐ!担 指数平滑化 AR !MA 一 時間 ~銅DI 弘容? SAS F o r e c a s tS e r v e r‑予測結果の表示・分析 O 司町一←̲. ア J 一 一1 ・予澗ビュー ャ「一一一一一一‑ 1 / 1階層ごとに予測結果をヴラフ・阜で確認することができます。予測結果を手動 │ 門 4で補正する畠のオーバーライド値の入力もこζで特います。 唾 ‑ ‑ l ‑ 下 一 l ^ F 陥悶 q ‑ M l 叩山一一一一が柑叩一一…自閥帥一…動帥叩……作伺即…成献一ほ哨各肝…… 托 予刊 モ 矧叩 引 現測 刊 肺 山 口 刑… 山 口 し つ 叫 一 し 認すること力が〈できます@また、ユーザー定義の予測モデルを新たに作成すること も可能です。 イ…‑ │ F出 … s川 M一 … 一が何向 … 行欣光隔悶…… l 所 淵 … 川 昨 伊 分 州 到 州 恥 口 l 附 析 口 相 附 和川 … できます。各種ヴラフ・査を童示させることが可能で、必要に応じて E x c e l1 d : ど へも容易にコピーすることができます。 ‑ 4 1 9 ‑
│
空
路S
I
=
‑
~
SAS~ F
o
r
e
c
a
s
tS
e
r
v
e
r‑イベント情報の作成
各種イベントを作成し、予測の精度警高める泊に利用することが可能です。各イベントが実績変動にどの程度膨響が
あったのかについては、 F
o
r
e
c
a
s
tS
e
r
v
e
rが自動で判断し、予測モデルに組み込みます。必要により強制的に全ての予
測モデルに含めることも可能です。
‑
4
t
‑
‑
‑,,‑J1Q
円二二日:
←
ULU│
2
盛
よ 川 崎
~\_
r
‑
"
̲
"
̲n
‑
:
̲jー
̲:̲] _:_と~
""..•l
f
l
.Jc̲1
輔劃帥で、一時的怠酬が起き
i
t
金直ちに元のレベルこ贋るよう E場合。
レベルシフト
z ・~
J
J N
」一三宮比
~立三υ --"'lJ
~~Ii!!
一時的
その
1 ̲ 1ある時期から符続して 定期間実掴置の得
│
ー'1
しょげまた下 i
部生じる場合。
/ー│時某到のトレンドが空然にE化 い 永 久 的 +
1‑ たは一定期間の聞置化する場合.
a
E
t
│
‑
L
l
f
m
J
E
F
E
議官民1
3
2
2
~~
O
r
e
c
a
s
tSe刊 町
e「一イべン卜の適用
関3
問
加
慨
対
併
蜘
f
密
按
燃
2
G
皆
U
r
;
F
r
ト
出
レ
富毘配~,..
P 竺Z
三(、、!fl 臨レr盟
!fFi
で子~子
f一ht
亡T
主己己口ijト1 !ケプ
?;::\::!E
百
且凪
一
益三....‑ 3
=
!
=
‑ -I .;c~ー
ー一ー
ー . 厄I
・
一 千 ー ー
.一一」一一
ニ二一一.‑一二一」三̲ __.....u~
一一
己~三ιぷ孟二ー
‑420・
一一一
一一一一
一
ーι」二二一五三ニL二三ー
.
・
一」ー一一
百
0
̲
,
; .
S羽 a語品
帯
SAS.F
o
r
e
c
a
s
tSe刊 e
r‑予測モデルの編集
高度怠分析を行うユ ザ向けには、新規に予測モデルを作成したり、自動生成された予測をコピーして編集すること
により、予測モデルのチューニンヴを行う機能が提供されています。
戸
ー
ー
一
一
、
院共性二一
ナ竺手当-~11
F園 田 =
1
1
1
、
¥
i
=‑;j
.
.
ー
ー
ヨ
f
,
0
‑
ー
ョ
一J
一えよ旦史包~
辛潤モデル・鰻画面
ニ
1 ..!=.:.!!.J~
~ぉjh
SAS"F
o
r
e
c
a
s
tS
e
r
v
e
r一予測プロセスや予測モデルの保存
ブロジェヲ卜作成のすべての局面で、 SASコードが生成されており、保存してパッチ処理等に使用することが可能です。
予測プロセスや予測モデルも全て SASコードとして保存可能です。
園田置園田
三j
V 乞.‑'."1" 1
11
一 噌
エ
F ・\, I'f-....~'..- ,._ r .e.
:
1
"
‑
''
.
.
.
.
0
1叶
?ーァτ;.;τ~一一一一一一一一戸で烹でーすーででアー士一一γ一一π一一ー←ーでヨ
, '吋・.‑:.丹、.似 酢
,
.
.
.,
.
..
"
・
.
'
'
・
•
•
(1.U
,
・
.
‑
a
・
ン
H お
り
そ
ー
・
̲
'
‑
" ・‑ 守 了 ナ ず
;
,
‑
,
で
ー
で
でτzー
で
ー
‑
.
'‑
.
.
‑
,
.
,
.
肉
‑,
,
,
..
.
白 ‑,
‑
" "ポド・ ←
d
」
s
..・・"・
・ ・・ " 、
島
昭
•
'
,
.
̲
・
"
" .
"
.
,
.
:
.
.
,
. ,
.
,.
.
"
・
.
.
.
.
.
.
.
.
.
.
.
.
.
.
・内
・
.
.
山
白
・
.
.
.
.
・
・
・
目
祖
.
.
.
.
.
時
・ ・・・
・ ・‑
̲
.
.
.
・
2
・., ・ ・
.
.
.
"
・
・
・
"
‑ ‑
'
'
"
'
'
'
'
'
'
'
'
・ ー
"
・
.
.
.
̲
.
.
‑
.
.
,
,
'・"・
・
・
・
・
・ ・
・、, ・,,"0<・・ドベ
2
1
1
'
1
".
0
俳
4
a1
4
e
e
1
H
個
館内 'ー"
飽
,.
oj.."
¥
t
f
̲
.
.
'
・
t
;
C ;:;0..,"
2
・1t :.JI'凹6・
9・
・
.
J
"
f
.
.
.
.
.
.
l
.
.
.
.
.
:
.
t
.
̲
s
.
.
.
.
I
I 11
.
.̲
̲
,
1
.
.
'
:
.
)F 町
、 1・,t剛 山 . a : ,J~ 凶・ 4・ー刷温「
R
J
7
,
a
‑
‑
.
.
・
験
組
J
t
.
.
.
.
.
.
T
t
:
.
.
.
.
.、
.
,
.k
}曽同
・
戸
出
仏,
d
;
;
.
.
:
,
,
:
・
.
.
.
u
.
.
r・・,~
誠
h
r
J
j
.
.
:
.
.
f
.
.
.
._.:!1.....:.~.・“ .<<:.Ul. ,_・ a
~
」三J~
.
4
2
1
‑
~~ SAS.Demand‑DrivenF o r e c a s t i n g ~羽a 弘覆 4 D SAS Oemand‑OrivenForecasting SAS ・Demand‑D r i v e nF o r e c a s t i ng (D D F ) ソリューションl 立、より正確な需 た 要傾向の理解、方向付け、予測、といった後能により、コンセンサスの廿L 予測業務の流れを実現することで、企業の S&OP プロセスを支援します。 このソリユーションによって以下が可能に怠ります ‑大規模怠製品階層あるいはビジネス階層における各レベルに対し統計的予測を 自動的に作成 販売ブロモ ション、マーケティンゲ施策、その他の外部イベントの効果をモデル化 販売やマーケティンゲ戦略、あるいは業務レベルでの戦術の変化によるインパワト を理解するための、 " w h a t ‑ i f"分析による想定需要生成 需要予測だけで芯〈、販売、マーケティンゲ、財務情報右どから予測を取り込んで 統合し、自動的にコンセンサスのとれた需要予測を生成 ‑422・
S回 l S I l I ! G T SAS S e r v i c eO p e r a t i o n sO p t i m i z a t i o n │おお!弘 I 廻 G I I SAS ServiceOperationsOptimization SAS.S e r v i c eO p e r a t i o n sO p t i m i z a t i o n l 立、顧客サポートに関連する、 製品、顧客、地媛、サービスコード、コールセンター、技術者一等のデータ l l J の解析機能を提供し、効率の悪い肉部プロセスの根本的な要因を様j するための、モニタリングや分析、あるいは最適化を支援します。 このソリユーションによって以下が可能に怠ります 製品、要求されているスキルレベル、あるいは地理的な位置に基づく、コン担ワトセン担 と フ ィ ールドサービスの必要リソースを予測。 顧客に影響する、あるいは企業に損害を与える前に現れているサービス課題のアラ トを管 理 サービス運用に多大右影響を与える因子群を確認するために根本原因解析を実施 コ ーJ レセン哲一、技術者、あるいはマネ ジメント層向けに、個人/チ ムのスコア力 ド、ラン キンヴ分析を活用したパフォーマンス管理 ‑423 司
11a 恥 SAS.S e r v i c eP a r t sO p t i m i z a t i o n i ) 部 品 欝F 4 P SAS ServicePartsOptimization SAS'S e r v i c eP a r t sO p t i m i z a t i o n l 立正確に部品需要を予測することで、 部品在庫を最適化する能力をサービス編成に提供し、目標サービスレベ ルに合った適切な在庫水準の維持を支媛します。 このソリユーションによって以下が可能に芯ります サービスチ工ーンのあらゆる組織階層からの大量デ‑1]を統合し管理します。さら に、正確な予測をサポートするためにそれらを加工、標準化、ヲレンジンゲ。 階層の各レベルにおいて、短期/長期の予測、そして、終売部品の予測も生成 ‑ 多階層型流通網における、サービスレベル、ソード担イムや費用などユーザ指定 の制約に基づき、部品の在庫水準・ポリシを最適化。 工ゲゼヲティブザッシユボード、 KPIスコア力一ド、スナップショット、あるいは力ス担ムレ ポートにより、サ ピスチ工ーンの中で工ゲゼヲティブヒサービス担当者との聞で情 報を共有。 ‑ 4 2 4・
~sasl=- …| 3 SAS WarrantyReserveF o r e c a s t i n g s~b| SAS*WarrantyReserveForecasting SAS.W a r r a n t yR e s e r v eF o r e c a s t i ng(cI:,業務システム上の販売、保障 、および製品性能データに、洗練されたモデリング・予測技術を適用するこ とで、財務上あるいは法律上のガイドラインに示された保障預金準備率を 正確に予測することを可能にします。 このソリユーションによって以下が可能に芯ります: 正確 t J予測により、保障引当金の見積りと、フォ力スすべき予算を最適化する ことが可能。 自動化されたソソューションヘ移行することで、手動のプロセスから解放されたス9 ツフは、より戦略的怠付加価値業務に焦点を合わせることが可能 去や FASBFIN45といった情報公開規制への対応、コンブライアンス対応 • SOXj が容易 ‑425・
s~ 恥 SAS.NewProductForecasting ServiceO f f e r i n g s G~I!\!"t!II!P'" NewProductForecastingProcess S A Sが提唱する NPF プロセスの基本的危涜れ NewP r o d u c t ForecastindNPF)P r o c e s sO)涜れ 新製品の属性情報を利用した類似製品群の選定 類似製品群からの例外製品の除外と代理製品群の絞り込み 代理製品群から統計的性質を抽出しモデル化 代理製品群から抽出した統計モデルを ~J 用した新製品の予澱 ‑426・
~æmI私事 NewProductForecastingProcess 新製品予測では 4つのステッブを繰り返し行い、予測を行っていきます。 プロセスを標準化することで、一定レベルの予測結果を算出することが可能と邑ります。 町 S 哨 ユ 川沿遅吋 場 F i l t e r Model Forecast 事S 品 事 品 調 ユーザー判断 場 主 a 抽 事 轟 E~hlE 事例 "427・
ssaSI=‑‑‑‑ 食品小売 W a i t r o s e社 (EU) 臨 調 SAS'DemandD r i v e nF o r e c a s t i n g 1 ノ , 庖舗担当者コメン卜 「当初 i 孟システムによる自働党遣ができるとは思え芯かったが、今 l 草安心して自動発注に任せている J(生鮮 童品マネージャ) r 庖闇在庫量がか島り低講し、パッつヤ ドで滞留する在庫が激議した J(位物顛マネジャ} (生鮮マネージャ) 「チルドケース向の在庫市議り、在庫回転車も非常に良(1;;った J Challenge W a i t r o s e 社l 立、英国に全国展開している高甑 童材スーパーマーケット。葺国宣品小売におけ るシェ 74%~ 占酌る. 同社は需要予却の鋪場において以下の隈誼 を抱えていた ・事品種小ロットの商品群の中で大量子 ‑9 1<効率よ〈予耳目する必要があった ‑年間 30怖の新製品市投入され、斬製品予 測の必要が晶った U曲が兜ょの1 3怖 プロモーシヨンによる需要lI を占酌、ブロモ シヨン劫畢を把握する品曹が あった ・売よ処理〆から在庫補充計画インプットま で処理時間 2 時間の制約が晶った SASSolution BusinessImpact SASDemandD r i v e nForecasting~ 導入。 SAS 導入により以下の改善効果を実 現 450万SKUの予測自動化しと繍置向 上を実現。 ‑需要予測精度は 1 0 l以よの SKU で向よ 濡 ・廃棄ロスの同q .在庫金額の削1Il ・注文宜更の頻度低下による章 務効率化 B羽t8&a 大手メール便サービス業 SAS.S e r v i c eO p e r a t i o nO p t i m i z a t i o n 担当者コメン卜 「受持ち斑置の究足 サービスレベル冊雄持、費用のコントロルが確実に昌弘重々は高い精度で ネットワ ヲ計画ができるように屯りました.これら繍度の高い目的豊速成したことで.予報ヴループ は社内外のユザから敬意 t l!用を盛ることに1;;りました o J Challenge SASSolution 繍色疋' wン 実確 u E ム正子シ︒ AR ︑守 E ﹁光 ωLr引 4waa トの 制﹁同 同町 HE の状比初引が 肘ル誤円工 剖二度劃前動 /L m 山 Eょの M73L 白 刀 的 2 王は︑ H 常 H t E 合判山 AR 了む 口提て明明暗 活 レ同L 寸測対ん判航五 サ予にスの川 M Jeat ﹃ EM‑ pt 一す刀ン ι ‑ 品 川 崎 ︐ J1 ヨ刈置平 以引叫哩十 柏市確J ル h定 141開 の 払 代 のを ル剥郡山喝 F1J 発予 tし サ置にこン用 一 f‑‑ mMHh酢 E 岬時間測 }寺ス 一山一明肌 時レ平確 書ユ j 町剛叫町肝 応ピム凶 一 記立ハ一V 4 巾 量うリ昌 0 4サ ユ ‑ ど / ︑ 一 qヒ lU7 u4 q コ封︺﹁ムツ m町 附拘 u づ応岬恒 全でコ 9 ‑ 4 2 8 ‑ BusinessImpact
G泊reJ私署 農耕作輸送機器メー力 K v e r n e l a n d社 (EU) SAS'S e r v i c eP a r tO p t i m i z a t i o n Challenge SASSolution K v e r n e l a n d !;t直耕作樋器、繍送機器の I SASS.刊 回 P a r tO p t i m i z a t i o n !導 製造メー力。ヨーロッパ在中心に展開してい │ 入 。 る 。 補修部品専用の予測モデルを構築し、 K社 I~アフタサピスの領域において以下 │ 在庫量適化モジュールを導入中。 の問題を抱えていた 補修部品の在庫回転車が低い 目標とするサービスレベルが低下している 補修部品の予測精度が低い(量作物 の収覆期にパーツ出荷が大きく右るが+分 対応て・きてい右かった} BusinessImpact 20 凹年現在、ブロジェワト進行中。 定量目槽としては ・サービスレベル ~95% まで向上させる .在庫回転率を向上させる ・予測精度を向上させる を定めている。 SAPの予測モジュールと E x c e I !利用して補 修部品の計画を実施していたが、+分右 精度を出世引こいた. ~~I!!す| 大手ハイテワメーカー SAS'NewProductF o r e a s t i n gS e r v i c eO f f e r i n g s Challenge J 在庫余書記j コスト・販売機会規失 を削減するために、ライ 7サイヲルの 各段階において需要を正確に把 握する必要があった SASSolution BusinessImpact SAS ・ForecastServer を導入。 ‑特に新製品予測においては経験 と勘をもとにした予測から科学的 アプローチをもとにした予測に転換 構成品を用いた予測モデルを構築。 .計画と実績のブレの原因を追及 することができるようにおった J 特に新製品の立ち上りを読むの が難しく、経験と勘で予測していた が、予測根拠を明確化し検認する 必要があった ・その結果、 PDCA サイワルが確立 し、予測精度が改善されている ‑429・
~sas. ‑ 4 3 0・ THE POWER TOKNOW
I ぬ立子治一…1 1 ω 六̲‑ ‑ 2 O l u l 通信サービス業における テ、ータベースマーケテイングの潮流 原島淳 SASI n s t i t u t eJ a p a n株式会社 ビジネス開発本部 OatabaseMarketing i nTelecomSector JunHarashima BusinessDevelopmentD i v i s i o n SASI n s t i t u t eJapan I I!Iー胎刻印加点.加 ‑7‑: 281~ 要旨: 通信事業のデータベースマーケティングの事例から、こんな話を ご紹介します。 ‑行動+人脈によるターゲティング広告 ・全社マーケティングプラットフォーム キーワード:行動ターゲティング、ソーシヤルグラフ、キャンペーン 管理、全体最適 1 ‑433・
│ … 一 点 … … 担川 γ同シ はじめに @ ﹄ F I l i ‑ ‑ LI ・l li‑‑ ‑F . 一 ‑ • 人間関係の効果的な活用 マーケテイングの全社統合 2 I 炉 供 飴 T1ffl.71T'!}困 問 問 曽 仰 WlJ~ 人間関係の効果的な活用 マーケテイングの全社統合 3 ‑434・
‑ " ‑ 8 番 町 … … 仰 l鈍$.:1 ~~ 行動+人間関係によるターゲ、テインク、 ニーズの掘り起こし 4 同一千除…… w 2 m g l 人間関係+行動によるターゲテイング 西野力ナ「会いたくて会いたくて」先行発売 ‑435・ 5
[ωE-~付金……ω ~~ 人間関係+行動によるターゲ、テインク、 ・ターゲ、テイングなしと比較した効果(事例) ・端末推進 6倍の効果 ・料金プラン推進 10倍以上 ・サービス ( e x .インターネット接続)や情報サー ビス(コンテンツ) 3倍以上 6 l 鈴~..í=n舎内町一一t~~シ 西野力ナ「会いたくて会いたくて」先行発売・・・今だけ半額! ‑436・ 201~ 7
一一ー融問均一加古ム タ 2 m 1 I インフル工ンサーを狙った効率的アプローチ • 波及効果を検証 非インフルエンサ一円 オファー , . . . . / ̲ D ~ ー + 守 二 二 一 一 一 ̲ ̲ , インフルエンサ̲"周辺の こも効果が伝搬す ユーザー i 1 1 る ・効果はオファー (x顧客層) によって異なる ・話題性のあるオファーなら ぱ効果大 ・インフルエンサ一周辺には 直接リーチしなくても、直接 1 )ーチした顧客レベルの反 応率にもなり得る 、~ノ ー, て〉 、 ¥ 一 一 一 / 端末発表会、新サービス試用、 対戦/ソーシャルゲームなども・置芭 8 |鈍~付金問問問… ネガティブなインフル工ンス ポイント付与︑安いプラン紹介︑ S n 無料通話/メlルプレゼント・E 8 下ヲト手掛?にァ三一‑ FJ/J1 倹 ー ー ハ 2 4 r J S 解約者を従来比 +30%の精度で特定! インフルエンサーを守り、仲間も守る ‑437・ 9
1 1 吟…ふ知也市シ ~IIII川 ネガティブなインフルエンス . s n ポイント付与︑安いプラン紹介︑ 無料通話/メl &ノレゼント︐ 解約の道連れあり。グルーフリーダーが解約すると仲間 10 の解約リスクは 2倍 ‑7倍に今高いと ζ ろを守る ω 1 … , 日 ー 健 会 開 閉 山I} 2 0 1 U J 効果を創出する 4つの領域 i ①ソーシヤルターゲテイング l ③解約トリガー i i 今キャンペーンのポテンシャルが高し叶 今ネガティブなインフルエンスを理解 j i コミュニティーを選出する ②インフルヱンサー 今商材を効率的!こ(パイラ J レに)普及 させる際の起点とすべき顧客を選出 │ し、重点的に守るべき顧客を特定する! ④顧客の視覚化 : 今施策立案のために、顧客「行動」と i 「人間関係(影響力 )Jを理解 1 1 1 ‑438・
I 鮎I!!総会的… クチコミの効果的な活用 マーケティング、の全社統合 1 2 [鈍ルト健全 ~":'~ν…シ [I]l~ 部門別のプラットフォーム 事 「~ ~ 個別・非効率、情報活用レベルにムラ ‑439・ 1 3
~~ ム ラ軍 グ プ イ ン テ ケ 4Al 全 + 4 ・ マ r ! J . 'iIil:W.t=総会…一… ォ マa I コミュニケーションの整合性・最適化 コ 亡 顧客軸で統合されたデータ管理プラットフォーム インフラ・プロセスの統一 IA怯←蝕……ω 1 4 [I]l~ 全社マーケティング、プラットフォーム 顧客分析資産のレバレッジ 顧客価値 ト 型f .ARPU(一人当たり 収益) ‑顧客生涯価値 ーゲティン']" 行動 9 ヨ ー .Webログや購買置 予測モデル ソーシャJ~1'ラ7 V平 r‑l ‑最適なキャンヘ ーン予測 ・最適なメディア予測 ‑架電の最適な曜日・ 時間帯 a 歴から顧客の関心を 特定 , ‑ ・電話+メーjレの人間 関係 .SNSやT w i t l e r 高度な分析資産を社内各部門に展開 ‑ 4 4 0・ 15
ぬ !F ω ~~ 付 金 問enn 1!H 全社マーケティングプラットフォーム 最適なコミュニケーションの選択 解約トリガー検知 ⑦ 最適な施策を各部門へ 最適施策の選定 ロイヤル顧客向け デヲ割引パック ⑨ i tV斗L ⑧キラ レ ノ i :ミ I~ 一時 コンテンツ無料 ニ ιミ 畠 安いプランの紹介 ‑解約しそうな顧客の見 極め ( e x 仲のいい友 達が解約) ‑セグメント・顧客価値に 過した施策 ROI 事前評価 ・ ¥ 顧客に最も適したリテンション(継続)施策を実施 16 ω I 〉付金問 お客様に合ったマーケティングドがで、きていますか? 配布できません 顧客に合った広告恩販促はわずか ‑ 4 4 1・ 1 7
~~ 制トややW7l . 7FJJJ;lソー MarketingO p t i m i z a t i o n " 1 1 YESTERDAY TODAY 施策ありきで、 その施策に反応しそうな顧客を探す 顧客のニーズ&期待売上を考慮し、 ニーズと売上を満足させる施策を実施 00織へのお勧めは オーディオプレ ヤー がお買得ですよ! 勝., 実売価格¥1 6,800 回 圃 この力パンです t e b • 購買ニーズ 92% 実売価格 ¥1 5,000 期待売上.¥ 13,800 . . i~. ' i 冷ふ " ¥ 貝 ゾ 1 1 1 売 上 ¥1 5,000 申 売 上 ¥0 ー 18 │ω ー や … 白 山 リ ー MarketingO p t i m i z a t i o n ",...,リテンション最適化 1 1 │ 既存顧客の活性化と成長による利益率向上 顧客育成 スイッチ防止 ‑最適料金プラン ・ロイヤルプログラム ・無料コンテンツ ・プリペイド再契約 │ ‑よ位プランへの移行 ・サービスオプション追加 ・コンテンツ推進 ・高機能端末推進 マーケティング最適化 ‑ 4 4 2・ │ 1 9
I
r
n
昨総会開閉…
MarketingO
p
t
i
m
i
z
a
t
i
o
n
",...,リテンション最適化
1
1
内川ぷ四回一
+
3
F
%
イ ー今置圃』 :
f
J
F
夫叩プ鴻行 慣 i
二宮、行政ト込立
標
急 会 心
どこで?
何を?
誰に?
考慮すべき制約
膨大な組み合わせ
つ
ビジネス上の制約も考慮しつつ、
適切な顧客に、適切なキャンペーンを、
適切なチャネルから打つには?
I~十恥即rr;'l…ー
→
'
.
20
'
"
2
O
l
D
MarketingO
p
t
i
m
i
z
a
t
i
o
n
",...,リテンション最適化
1
1
従来:部門別プランニング
附
J
o
iログラム
現在:全体最適
?
DM
~ 見±引 J
. . rJY
?
ロイヤルプログラム
え
期待反応率 80%
期待効果革3
0,
o
o
o {
aS.
他社のも.
!
, いいからr
闘機能錨末
幽
ぺ僧
6F
事
議
I• ‑
‑
‑
味なし
無桝昨料和コンテ問
M
無料コンテンツ
え
@ 期待反応率 90%
f
期待効果1#
9,
780
プ川ド再契約議
期待反応率 7
河5%
期待効果革36,
000
マーケテイングの ROIIま従来比 4倍
‑443・
2
1
11 付 金 … … ‑ … ~~ MarketingO p t i m i z a t i o n ",...,効果を創出する領域 Jl ①キャンペーン最適化 ーラ顧客 xキャンペーンの割付を全体最適 (売上I R O I最 大 o rコスト最小) ②チャネル最適化 ーラ顧客にアプローチするチャネルを最適化 ーラテレマの場合は架電の曜日・時聞を最適化 ③クーポン最適化 ーラ顧客ごとにクーポンの値引き額やポイント付与を最適化 DM掲載する加盟庖ウーホ。ンを最適化 今(共通ホ。ント等の ) 2 2 ‑444・
SASユ ー ザ ー 全 世 話 人 会 代表世話人 世話人 (氏名 50音順) 大橋繍雄 東京大学 岩崎学 成践大学 小野潔 株式会社三菱東京 UFJ銀 行 北田祐幸 内閣府統計委員会担当室 堺伸也 イーピーエス株式会社 周防節雄 兵庫県立大学 菅波秀規 興和株式会社 八木章 近畿大学 山之内直樹 第一三共株式会社 SASユーザー総会事務局 SASI n s t i t u t eJapan株式会社内 干106 ・6 111 東京都港区六本木 6・10・1六本木ヒルズ森タワー 1 1階 TEL:03‑6434・3702 FAX:03・6434‑3701 E ‑ m a i l :jpnsaswg@sas.com 2ーすー躍霊園 国E 論文集 2010年 7月 12日初版第 1刷発行 発 行 :SASユーザー会 SASI n s t i t u t eJapan株式会社