SASユーザー総会論文集 1999年

>100 Views

April 21, 25

スライド概要

MULTTEST Q&A 浜田知久馬
大学病院の剖検率を低下させる可能性のある医 療評価指標の検討 楊学坤
尺度の最適変換を伴う回帰分析の適用事例 町野正博
[EXSAS] ( 生物実験データ統計解析システム) Version 5.00の紹介 山本典子
がん原性試験の統計解析システム 平野勝也
Correction Log Form管理・作成システムCollage 板東説也
ClintrialのデータをSASで利用する方法の紹介 藤田和也
ブリッジング試験における症例数の設計 吉原素子
多項目検定のマクロの作成 積山功
財務パフォーマンス分析の新しい視点( 2)- SAS/INSIGHT・NNA・EMの効果的活用法として-最新版(非製造業版) 陶山博太
混合正規分布によるVARモデル 甲田恵
多次元株価モデルとリスク管理に関する実証的研究 ― 日米両市場における実証分析を通じて ― 宮村幸夫
株式ポートフォリオ構築のための最適化手法に関 する考察 堀地正浩
金融業界におけるデータマイニングの応用 ~応 用事例:保険解約の防止分析~ 小野潔
バランスドスコアカード業績評価システムの構築 方法 牧野恭
VBとSAS/STATを用いた臨床統計システム ― SASスクリプトレス,Excelへの結果出力 ― 西原健自
PCのSASへの最適化 市川均
SAS システムによるWEB ソリューション Tips, Tricks and Techniques集 大久保英昭
外部DLLルーチン呼び出しについて 鈴木一彦
サーバデータの有効活用 -『汎用RDBMS検索 ツール』の紹介- 前田幸一
SPDS 2.1 のパフォーマンスとチューニング 山本克巳
webAFを用いたJavaアプリケーションの開発 菅野崇
SASシステムとJavaによるクライアント環境の構築 東一成
次期バージョンにおけるSAS/ACCESSソフトウェアの拡張点 今城義高
ビジネスにおけるデータマイニングの利用と実際 - スピード時代に応える俊敏な経営に関するアプローチ - 青柳恭弘
企業経営戦略CRMとは何か -CRMの現状と今後の展望を探る- 岩瀬秀明
流通業におけるデータマイニングの応用 ~リテン ション戦略の強化を目指して~ 緒方維文
Enterprise Minerを用いたクラスアソシエーション ルールの抽出 河合深雪
Brand Quality Control: A New Strategic Brand Building and Management 加藤雄一郎
ネットワークトラブルの実態とその対策について 田久浩志
マルチレベル分析による生活満足度の分析 ― SAS PROC MIXEDを用いて ― 中田知生
データマイニングとサンプルの実例 鈴木薫 (翻訳)
Separate-ranking型ノンパラ多重比較 浜田知久馬
臨床疫学教育におけるSASの役割 縣俊彦
JMPとSASによる生物検定法 高橋行雄
PROC GLM及びPROC IMLを用いた3期3剤クロス オーバーデザイン(直交ラテン方格)の解析 石川靖
SAS/STAT Version 8における拡張点 小野裕亮
製造業におけるSASシステムの活用場面 石井宏司
企業における教育研修の評価と改善 陶山博太
日本プロ野球選手の成功要因の分析 [野手編] 陶山博太
出向者の健康状態 豊島裕子
SAS/PH-ClinicalソフトウェアPH-テンプレート機能のご紹介 松井陽子

profile-image

SAS言語を中心として,解析業務担当者・プログラマなのコミュニティを活性化したいです

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

第 18回 日 本 SASユーザー会総会 および研究発表会 論文集 1999 年 8 月 23 日(月 )~24 日(火)

2.

SASは、株式会社 SASインスティチュートジャパンの登録商標で、す o SASSystem、SASSystemを構成するプロダクト群は、 SASI n s t i t u t eI n c . の登録商標です。 その他、本論文集に記載されている会社名、製品名は、一般にそれぞれ各社の商標または登録商 標です。 本論文集の一部または全部を無断転載することは、著作権法上の例外を除き、禁止されています。 本論文集の肉容を実際に運用した結果の影響については、責任を負いかねます。

3.

目 次 チュートリアル MULTTESTQ&A . , .. . . , . .. . . … ・ ・ ・ … ・ ・ ・ ー ・ ・ … … . . . . 一 . . . . . . … ー ・ ・ 一 . . . . . . . 一 … . . .. . .. . .. . .3 υ 浜田知久馬 (東京大学〉 論文発表 • StudentSession 大学病院の剖検率を低下させる可能性のある医療評価指標の検討………… 2 1 楊 学 坤 ()I!買天堂大学〉 今井喜正 江原義郎 丸 林 葉 子 (/11貢天堂医院〉 尺度の最適変換を伴う回帰分析の適用事例……...・ ・ . . … … … . . . ・ ・..……… 3 7 H 町野正博 H (専修大学〉 風間友太 ‑医薬品開発 [ E X S A S ](生物実験データ統計解析システム)V e r s i o n5 . 0 0の紹介…………… 4 7 山 本 典 子 (有限会社アーム〉 常吉華奈 浜 田 知 久 馬 (東京大学〉 がん原性詰験の統計解析システム……………………………………………… 5 3 平野勝也 田崎武信 (塩野義製薬株式会社〉 C o r r e c t i o nL o gF o r m管理・作成システム r C o / / a g e J …………………………… 6 1 板 東 説 也 (有限会社電悶システムズ〉 安藤永一 阿 部 真 佐 子 (ヘキスト・マリオン・ルセル株式会社〉 石井政徳

4.

C l i n t r i a lのデータを SASで利用する方法の紹介……………...・ ・ . . … … . . . ・ ・ . .7 1 H 藤田和也 笠原智子 H (日本イーライリリ一株式会社〉 ブリッジング試験における症例数の設計……………………………………… 7 9 吉原素子 高橋行雄 (日本ロシユ株式会社) 多項目検定のマクロの作成…...・ ・ . . . . . ・ ・ ‑ … … . . . ・ ・‑…………...・ ・ ‑ ・ … … 8 5 H 積山功 H H H (吉富製薬株式会社〉 4 砂金融・経済 財務パフォーマンス分析の新しい視点 ( 2 ). . ・ ・ . . . . . ・ ・ . . . . . ・ ・ . . . . . ・ ・..……… 1 0 3 ‑ S A S / I N S I G H T ' N N A・EMの効果的活用法としてー最新版(非製造業版) H H H H 陶山博太(有限会社企業行動デザイン研究所/慶慮義塾大学 / C l a y t o nU n i v e r s i t y ) 混合正規分布による VARモデル...・ ・ . . . . . ・ ・ . . . . . ・ ・ . . … . . . ・ ・ . . … … . . . ・ ・ ‑ … 1 1 9 H H H H H 甲 田 恵 (株式会社金融エンジニアリング・グループ〉 角谷督 加藤浩一 多元的株価モデルとリスク管理に関する実証的研究…...・ ・ . . . . . ・ ・..………… 1 2 9 ・・日米両市場における実証分析を通じて… H H (株式会社金融工ンジニフフリング・グループ) 宮村幸夫 株式ポートフォリオ構築のための最適化手法に関する考察…………...・ ・ ‑ … 1 4 9 H 堀地正浩 (大和証券投資信託委託株式会社〉 金融業界におけるデータマイニングの応用...・ ・ . . … . . . ・ ・ . . . . . ・ ・ ‑ … . . . ・ ・ ‑ … 1 5 9 H H H H 応用事例:r 保険解約の防止分析 J‑ 小野潔 (株式会社二ッセイ基礎研究所〉 バランスドスコアカード業績評価システムの構築方法………………………… 1 7 3 牧野恭 (株式会社 S ASインスティチユートジャパン) ‑システム VBとSAS/STATを用いた臨床統計システム…...・ ・ ‑ … . . . ・ ・‑………...・ ・ . .1 8 5 ‑SASスクリプトレス、 E x c e lへの結果出力一 H 西原健自 山本昭一 H H (株式会社フフイ・工ス・イー) PCの SASへの最適化...・ ・‑…………...・ ・ . . … … . . . ・ ・‑……………...・ ・ . .1 9 7 H 市川均 H (株式会社イージーネット〉 11 H H

5.

SASシステムによる WEBソリユーション T i p s,T r i c k sa n dT e c h n i q u e s集 … … … … 2 0 9 漁智一(株式会社 SASインスティチュートジャパン〉 大久保英昭 外部 D L Lルーチン呼び出しについて...・ ・..………………...・ ・ ・ ・..……… 2 2 9 鈴木一彦 (株式会社 SASインスティチュートジャパン) H H H H 検索ツール』の紹介ー…………… 2 3 7 サーバデータの有効活用ー『汎用 RDBMS 前田幸一 (株式会社 SASインスティチュートジャパン〉 SPDS2 . 1 のパフォーマンスとチューニング…………………………………… 2 4 7 (株式会社 SASインスティチュートジャパン〉 山本克巳 • SASシステム新機能 webAFを用いた JAVAアプリケーションの開発……………………...・ ・‑…… 2 5 9 H 宮野崇 根田光 (古泊インフォメーション・テクノロジ一株式会社〉 SASシステムと J a v aによるクライアント環境の構築…………………...・ ・ . . … 2 6 7 H 東一成 (株式会社 SASインスティチュートジャパン〉 AS/ACCESSソフトウェアの拡張点……...・ ・..…… 2 8 7 次期バージョンにおける S 今 城 義 高 (株式会社 SASインスティチユートジャパン〉 H • SASソリューション ビジネスにおけるデータマイニングの利用と実際...・ ・‑……………………… 3 0 5 ースピード時代に応える俊敏な経営に関するアプローチー 青 柳 恭 弘 (株式会社 SASインスティチユートジャパン〉 H 中西みなと 企業経営戦略 r CRMJと は 何 か ー CRMの現状と今後の展望を探る一……… (株式会社 SASインスティチユートジャパン〉 3 1 1 岩瀬芳明 ‑調査・マーケティング 流通業におけるデータマイニングの応用……………………………………… リテンション戦略の強化を目指して 緒 方 維 文 (株式会社工フ・エム・アイ〉 3 2 1 E n t e r p r i s eM i n e rを用いたクラスアソシエーションルールの抽出...・ ・..……… 3 2 9 H j 司 合 深 雪 (株式会社金融エンジニアリング・グループ〉 谷岡日出男 1 1 1

6.

8randQ u a l i t yC o n t r o l :A NewS t r a t e g i c8rand8 u i l d i n gandManagement ・ ・ ・ ・ ・ ・ ・ 3 3 9 (株式会社大広/東京工業大学〉 υ 加藤雄一郎 . . . … ネットワークトラブルの実態とその対策について………...・ ・‑……...・ ・ 田 久 浩 志 (東邦大学〉 吉 川 誠 司 (WEB110) 3 4 3 マルチレベル分析による生活満足度の分析…………………………………… 3 4 9 H H ‑ SASPROCMIXEDを 用 い て ー 中 田 知 生 (北星学園大学〉 . . … . . . ・ ・・・ . . . . . ・ ・ ・ ・‑………… 3 6 1 データマイニングとサンプルの実例'"・ ・ 翻 訳 : 鈴 木 薫 (株式会社 SASインスティチユートジャパン〉 H H H H H H H .統計解析 Separate‑ranking型 ノ ン パ ラ 多 重 比 較 … … … … … … … … … … … … … … … 浜 田 知 久 馬 (東京大学〉 山本典子 (有限会社アーム〉 3 8 3 臨床疫学教育における SASの役割…………...・ ・ . . . . . ・ ・..………………… 鯨 俊 彦 (東京慈恵会医科大学〉 清 水 英1 右 3 9 1 H H 田蝦尚子 裏田和夫 景山茂 鈴木院之 鈴木直樹 須藤正道 川村昇 和田高士 松島雅人 尾立裕三 小松一祐 JMPと SASによる生物検定法……'"・ ・ . . . . . ・ ・..………...・ ・..………...・ ・ . .3 9 5 高 橋 行 雄 (日本ロシュ株式会社〉 H H H H PROCGLM及 び PROCIMLを用いた…...・ ・..…………...・ ・..……………… 4 1 5 H H 3期 3剤クロスオーバーデザイン(直交ラテン方格)の解析 石川請 (ヘキス卜・マリオン・ルセル株式会社〉 SAS/STATVersion8に お け る 拡 張 点 … … … … … … … … … … … … … … … … 小 野 裕 亮 (株式会社 SASインスティチュートジャパン〉 lV 4 2 9

7.

‑品質管理 製造業における SASシステムの活用場面……...・ ・ . . … . . . ・ ・ . . … . . . ・ ・ . . … … 4 5 3 H 石井宏司 H H (株式会社 SASインスティチュートジャパン〉 ‑その他 企業における教育研修の評価と改善…………………………………………… 4 6 1 陶山博末 伊藤洋子 大岡典子 (有限会社企業行動デザイン研究所/慶暦義塾大学 / C l a y t o nU n i v e r s i t y ) (有限会社企業行動デザイン研究所〉 (有限会社企業行動デザイン研究所/湘南国際女子短期大学〉 日本プロ野球選手の成功要因の分析[野手編]…...・ ・ . . . . . ・ ・ . . … . . . ・ ・ . .. . . . . .4 7 1 H 陶山博太 H H (有限会社企業行動デザイン研究所/慶麿義塾大学 / C l a y t o nU n i v e r s i t y ) 出向者の健康状態…………………'"・ ・ . . . . . ・ ・..…………………………… 4 9 7 H 豊島裕子 時 1~彦 H (日本疋ぱこ産業株式会社〉 (東京慈恵会医科大学〉 清水英佑 SASファーマヘルステクノロジーの紹介 S A S / P H ‑ C l i n i c a lソフトウェア PH‑ テンプレート機能のご紹介……………………… 5 0 5 松井陽子 (株式会社 SASイツスティチユートジャパン〉 V

8.

チュートリアル

9.

日本 S A Sユーザー会 (SUG I‑J) MULTTEST Q&A 0 浜町長Il久馬車 本 東京大学医学部薬剤疫学教空 MULTTEST Q&A C h i k u m aH a m a d a U n i v e r s i t yo fT o k y o H o n g o7 ‑ 3 ‑ 1,B u n k y o ‑ k u,T o k y o,1 1 3 要旨 6 . 0 7でリリースされた町L T T E S Tプロシジャの最大の特徴は,様々な検定の多重'性について, r e s a m p li n gによって凋摂した p舶を計算できることである.最近では,このプロシジャが,医薬品開発 の綴々な J . ' dI ( I Iで応Hlされるようになってきたが,その広範な機能を卜分にもe いこなすためのノウハ J統計置の解説を r f l心 ウは,広くは浸透してないように思える.そこで特に府を併合した解析と出 ) に , Q & A形式のチュートリアルを行う.併せて削L T T E S Tプロシジャを利用する仁での,注怠点も 来日介する. キーワード: M U L T T E S Tr e s a m p l i n g 崩を併合した解析対比ログランク検定 ‑3

10.
[beta]
1.はじめに
リリース 6
.
0
7から M
U
L
T
T
E
S
Tプロシジャが, S
A
S
/
S
T
A
Tの正式なプロシジャとして加わった (
S
A
SI
n
s
t
i
t
u
t
e(
19
9
2
),浜田・吉田(19
9
2
),岸本(19
9
2
)
)
. このプロシジャの最大の特徴は,様々な検定の多
主牲について, r
e
s
a
m
p
l
i
n
gによって調整した p耐を計算できることである.長近では医薬品の開発
の掠々な局 1
mで,このプロシジャが応よJ
Iされるようになってきた. M
U
L
T
T
E
S
Tプロシジャは 6
.
1
2で大
幅な拡娠がなされ (
S
A
SI
n
s
t
i
t
u
t
e(
19
9
6
)
), p
(
i
i'Iだけでなく掠々な統計 f
d
:が出 )Jされるようになり,

非常に便利になったが,その機能を卜分に活 J
I
Jするためのノウハウは,

卜分には浸透してないよう

に思える.また M
U
L
T
T
E
S
Tプロシジャの U
UJと
, S
A
Sの他のプロシジャでは,指定の {lh.W力が整
合しない場合もある.そこで,本稿では M
U
L
T
T
E
S
Tプロシジャを効率的に利月]するための注意点を,

Q&Aという形式で示すことにする.
(
,
.M
U
L
T
T
E
S
TF
A
Q
(
F
r
e
q
u
e
n
t
l
yA
s
k
e
dQ
u
e
s
t
i
o
n
s
)

出:者が,様々な人から受けた町L
T
T
E
S
Tに関する質問を参考に,以下の問題を取り上げた.
1
)C
:
r
N
T
R
A
S
T文の係数は足してつになア.ょうに,基i
i
f化しなくてもよいのか?
2) pf
f
(
[だけではなく,検定統計哉は出力できないのか?
3)肘を併合した解析を行うには?
4) w
iを併合した解析における多主性の I制控は?
5) M
U
L
T
T
E
S
Tでログランク検定を行うにはとうしたらよいのか?
の)削L
T
T
E
S
Tの落とし穴とは?
6
‑
1
)生存1
1
寺聞は整数
6
‑
2
)
C
L
A
S
S変数の水準の順序に i
;
i
i
J
2
6
‑
3
)多羽目で r
e
s
a
m
p
l
i
n
gを行う場合は欠測伯に注意

3. C
O
N
T
R
A
S
T文の仕依

(
Q
l
.C
O
N
T
R
A
S
T
文の係数は足して 0になるように,基準イむしなくてもよいのか?)
A

元配置分散分析型のデータ構造を先日定し,

Yjjが第 i
群の j
番目の飢測伯を表すものとする.

このとき 1
制限仮説の下で分散が lになるように基準化した対比統計量(Z)は,次のようになる.

Z=L
:C Yi.
/SQRT{L
:(C 2S 2 / ni
)
}

(
1
)

j

ここで

C
;
Y

j •

nj
S2

:
!
1
iij作の対比の係数 (ZのHl
l
待値を 0にするため L
:C
; =0とする)
:第 ii
1
l
の平均f1f
i (i 1, 2,…, k)
二

:第 ij洋のサンプルサイズ
誤jf分散

L
:
L
:{
Yij‑Yj
.
}
'/L:{nj‑1}

S
A
Sでは削L
T
T
E
S
Tプロシジャ以外でも, G
L
Mプロシジャ等で C
O
N
T
R
A
S
T文を使用することができるが,
G
L
Mプロシジャと町L
T
T
E
S
Tプロシジヤでは, C
O
N
T
R
A
S
T文の仕織が異なる. GLMプロシジャでは対比の
L
Mプロシジャでは, 4
係数は,足しあわせると 0になるように基準化しておく必要がある.例えば G
群で線形仮説を検定する場合, C
O
N
T
R
A
S
T文を次のように指定する.

c
o
n
t
r
a
s
t 対比名'群変数 ‑
3‑
1 13
;
これに対して,町L
T
T
E
S
Tプロシジャでは,対比の係数を基準化する必要がなく,

c
o
n
t
r
a
s
t 対比名,

1234
;

という指定で等価の解析が)可能である. T
E
S
T文で阻A
Nオプション(計量データ)を指定した場合,対
になるように基準化される.すなわち実際の対比の係数は, C 二 C
比の係数は白動的に,足して O
j'4
11.

L :C / kである.例えば先の対比は, M U L T T E S Tプロシジャの内部では,対比の係数の平均 2.5 を引いて, ‑ 1 . 5‑ 0 . 50 . 51 . 5と基準化される. F Tオプション(2伯データについて,比率を F r巴巴皿a j‑ n ‑ T u k巴y変換して解析する)を指定した場合でも,同級に対比の係数は内部的に基準化される. 回A Nオプションが,各J 作の平均値と対比の係数のもリ1を計算するのに対し, C Aオプションは 2M I データを解析するためのもので,この指定では,符併について 2仙の大きい方の水準の(観測度数 一期待度数)と対比の係数の積を足し合わせる.すなわち対比統計量の分子は, L :Cj(O ‑Ej)=L :(CjOj)‑L :(CjEj) ( 2 ) となる.ここで i i:悲しなければならないのは, L :(Oj‑Ej)=Oであり,足して Oになるように 基準化されている点である.このため,対比の係数白身については,足して Oに基準イじしなくても 機わない. C.=L :C / kと置くと L :(Cj ‑C.) (0j ‑Ej )= L :Cj (0j ‑Ej )‑ L :C.(0j ‑Ej )= L :Cj (0j ‑Ei ) であるから,対比の係数を基 i j l iイじしなくても,同じ結果が何られる.このため C AとP E T Oオプション では,対比の係数を基準化しない. 4. 結果の出力 ( Q 2 . p鑑だけではなく,検定統計量は出力できないのか?) M U L T T E S Tプロシジャから自慢出 ) Jされるのは p仙のみであるが, P R O CMULTTEST文の O U T二データ A Sデータセットに,掠々な統 t ij ‑ . [ L i:を出力することが可能 セッ卜名オプションによって,指定した S である .I l¥ ) Jデータセッ卜の内容は,検定の陪類ごとに児なる.ここでは, T E S T文で阻A NとC Aオプ ションを指定した場合の山 ) Jを説明する. PETOオプションを指定した場合の U I 1 Jデータセッ卜につ t { i iで、説明する. いては ,7 夫 l 毒性試験のデータ SD 下 t 1 川電 対照 O m g 9 2 59 1 79 1 29 1 29 4 99 0 89 0 89 8 9 931909 9 2 6 . 0 1 m g 8 9 89 2 59 0 88 7 39 0 89 4 18 9 39 2 09 2 29 3 1 9 11 .9 2 5 . 7 誤差分散 2 0 . 1 s2 二 31 .2 12 IÞnl~t 3 m g 874876 9 1 69 0 88 7 3 807874 9 1 99 5 29 1 6 8 9 1 . 5 3 9 . 8 I 吉 ' ; J l j 註 1 0 m g 8 6 99 1 98 7 48 5 28 3 09 0 69 1 48 9 89 3 39 3 5 8 9 3 . 0 3 5 . 4 m泣 低 生データ 表 1のデータは,あるラットを 平均 mし、た m 性試験の亦 r U l球数データである.ここでは,赤血球の平 均値が直線的に低トするかを,対比によって検討することにする.対比の係数としては, ‑ 3‑1 1 3と1234の 2種類を川いることにする. O N T R A S T文の使用例 プログラム C d a t ar b c ; 二 1t o1 0 ; d og r o u p = lt o4 ; d oi i n p u ty母 ; o u t p u t ;巴n d ; e n d ; c a r d s ; 9 2 59 1 79 1 29 1 29 4 99 0 89 0 89 8 99 3 19 0 9 8 9 89 2 59 0 88 7 39 0 89 4 18 9 39 2 09 2 29 3 1 8 7 48 7 69 1 69 0 88 7 38 0 78 7 49 1 99 5 29 1 6 8 6 99 1 98 7 48 5 28 3 09 0 69 1 48 9 89 3 39 3 5 l t t e s td a t a = r b co u t二 o u t; p r o c皿u 巴s t皿e a n ( y ) ; c l a s s g r o u p ; t c o n t r a s t '1 i n巴a r 1 '‑ 3 113; c o n t r a s t' l i n巴a r 2 ' 1 234 ; d a t ao u t ; s e to u t ; z = ̲ c o n t ̲ / ̲ s e ̲ ; p r o cp r i n td a t a = o u t ; r u n ; , 5一

12.

出力 CONTRAST文の使用例 O B S TEST V A R L A B E L C O N T 2 ト I E A N 阻A N Y Y l i n e a r 1 l i n e a r 2 ‑ 4 7 7 6 ‑ 2 3 8 8 S E RAWP 1 7 6 5 . 4 8 0 . 0 1 0 3 6 3 8 8 2 . 7 4 0 . 0 1 0 3 6 3 Z ‑ 2 . 7 0 5 2 1 ‑ 2 . 7 0 5 2 1 出力データセット OUTには,対比ごとに,変数 CONT ン SEーと RAW̲P(調整しない p値)が出力 される ̲CONT ーが対比統計量の分子, SEがその標準誤差を示している.この 2つの比をとっ たものがZ統計量であるが, MULT 毘 ST では,後述のSTRATA文を用いた解析に対応するため,少 し特殊な対比の定義をし,分子・分母の双方にサンプルサイズ Nで重みを付けている.すなわち C ONT, SEは次のように計算される. CONT 一=NXL (CiX Yi ・ ) SE̲=SQRT{N2XS 2 XLC2 / Ni.)} j 分子は, ( 1 )式の分子にサンプルサイズ Nをかけたものになっている.これに対応するため,分母 1 )式の結果と等! <なる. の方にも Nをかけている.したがって比をとった Z統計量の値自体は, ( 次に対比Lin e a r 1とLin e a r 2の計算例を示す. . L in c a r l (‑ 3‑ 1 13 ) 11 .9 + 1X8 91 .5 +3X893.0)=‑4776 ̲CONT ̲= 4 0 (‑3X9 2 6 . 0一 1X9 ̲SE̲= SQRT{402x31 . 21 2x( 32 / 1 0 +. l2/10+ 12/10+32/ 1 0 ) } =4 0X31 .2 1XJ 三 二 1765. 48 ' L i n c a r 2 ( 1 234 ) ̲CONT̲=40(一1.5X9 2 6 . 0‑0. 5X9 11 .9 + 0 . 5X8 91 .5 +1 .5X8 9 3 . 0 ) 二 一2 388 210+ 1 2! SE SQRT{402X31 .2 12X( l. 5 2/ 1 0 + 0 . 52/ 1 0 + 0. 5/ .5 10 ) } 一二 =40X31 . 21x. f 七 三 ニ 882.74 L i n e a r 2の対比の係数は,一 1 . 5,‑ 0 . 5,0 . 5,1 . 5に基準化され, L i n e a r 1の半分になる.このため は等しくなる. ,̲CONT̲,̲SE も半分になるが, R A W ̲ PとZ 次にエンドポイントが, 2値の場合の出力について説明する.表 2は改善の有無を評価指標とし て , 4群で行われた後期 I I相試験の結果である. このデータについて,改善率が用量相関的に噌加するか, C o c h r a n ‑ A r m i t a g e検定を用いて解析す るプログラム例を次に示す. TEST文で CAオプションを侶定することにより, Cochran‑Armitage検定を実行できる.対比の係 数は CONTRAST文で ‑ 3‑ 1 13を指定する. uppertailedは上側検定を指定するためのオプションで ある.解析結果は,町L T T E S T文の O U T =オプションの指定により,データセット O U Tに出力される. 6

13.

プログラム C o c h r a n ‑ A r 皿i t a g e検定 d a t ap h a s e 2 ; d og r o u p二 1t o4 ; d oyo t o1 ; i n p u tw@ @ ; o u t p u t ; e n d ; e n d ; c a r d s ; 1 62 0 1 62 5 92 7 62 9 二 l t t e s td a t a = p h a s e 2 o u t = o u t p r o c皿u t e s tc a ( y j u p p e r t a i l e d ) ; f r e qw ; c l a s s g r o u p ; c o n t r a s t' l i n e a r '‑ 3‑ 1 13 ; 一) j ̲ s e 一 ; d a t ao u t ; s e to u t ; z = ( ̲ c o n t ̲ ‑ ̲ e x p p r o cp r i n td a t a = o u t ; r u n ; 次に出力データセット O U Tの内容についてノJ ¥す. 出力 C o c h r a n ‑ A r m i t a g e険定 O B S T E S T , V U i LABEL Cuii T E X P S E R A WP Z C A Y l i n e a r 2 9 ‑ 5 . 4 5 9 4 61 2 . 4 9 5 3. 0 0 2 9 0 9 62 . 7 5 7 8 0 統計足は Z 二 (C O N T 一一E X P ̲ ) / ̲ S E ーとして計算される. Z C O N Tは ( 2 )式の巾のL:( C j x Oj, ) ̲ E X PーはL:( C j x Ej ) .に相当する.データセットの ̲ C O N T ここで, ̲ とE X Pは次のように計目されたものである. ̲ C O N T ̲ =L :C jxOj二 一 3x2 0‑1x2 5 +1x2 7 + 3x2 9 = 2 9 E X P L :C j xEj =‑3x24.6‑1> く2 8 . 0 +1x2 4 .6 + 3x2 3 .9=‑5.5 また S Eーは,超幾何分イIに基づ、いて計算された ( ̲ C O N T ̲‑̲ E X P̲)の分散の平方根をとったもので 一二 ある.デフォルトでは組幾何分布が用いられるが, 2項分布に基づいた分散を計算したい場合は, T E S T文で B I N O M I A Lオプションを指定すればよい. 5 .S T R A T A 文による層を併合した解析 (( J3 .層を併合した解析を行うには?) T T E S Tプロシジャは, S T R A T A 文を利用することにより,計量データ及び 2値データについて, 間L 習を併合した解析が可能である.長初に計量データについて解析の内容を説明する. 複数の j 3施設でプラセボと新薬の 2群で臨床試験(1施設当り 8 例の予定で)を行って,仮想、的に表 3の データを得たものとする. B 施設では効果が強いのに対し, C 施設では効果がみられず,施設×薬剤 の交互作用的な傾向がみられる.このような場合,併合の是非については議論もあるが,例示の目 的で,施設を層として併合した効果の推定値と,新薬の効果が有意であるかの検定を,間L T T E S Tプ ロシジャを用いて行ってみよう. 表 3 仮想的な多施設臨床試験データ 新薬 A 施設 施設 B C 施設 平均 1 92 62 1 2 2 2 12 72 01 6 2 1 16211116 1 6 プラセボ 平均 1 92 31 81 6 1 01 6 86 2 11 41 3 1 9 1 0 1 6 プログラム例は次のようになる. S T R A T A文で施設を表す変数 I N Sを指定することによって,層を ‑7‑

14.

併合した解析が可能になる. T T E S Tによる層を併合した解析 プログラム 町 L d a t ad a t a 1 ; d oi n s = 'A '"B '"C '; 1 ; d ot r e a t = O, @ ; o u t p u t ; d oi = lt o4 ; i n p u ty @ e n d ; e n d ; e n d ; c a r d s ; 1 92 621. 1 92 31 81 6 2 12 72 01 6 1 01 6 86 1 62 11 11 6 2 11 41 3. p r o c皿u l t t e s td a t a = d a t a 1o u t二 o u t ; s t r a t ai n s ; c l a s st r e a t ; t e s t町 田 (y); p r o cp r i n td a t a = o u t ; r u n ; 町L T T E S Tプロシジヤでは,各施設ごとに各群の平均値 ( M e a n )と標準偏差 ( S t dD e v )を出力した後 a w ̲pとして,屑を併合した検定の p値が出力される. P = 0 . 0 1 1 0であるので, 5 % 水準で有意な で , R 結果となる. 出力 町 L T T E S Tによる屑を併合した解析 。 C l a s s t a t i s t i c V a r i a b l e S t r a t u m S Y A M e a n 2 2 . 0 0 0 0 1 9 . 0 0 0 0 S t dD e v 3 . 6 0 5 6 2 . 9 4 3 9 N 3 . 0 0 0 0 4 . 0 0 0 0 M e a n B .0 0 0 0 1 0 . 0 0 0 0 21 S t dD e v 4 . 5 4 6 1 4 . 3 2 0 5 N 4 . 0 0 0 0 4 . 0 0 0 0 1 6 . 0 0 0 0 1 6 . 0 0 0 0 C M e a n S t dD e v 4 . 0 8 2 5 4 . 3 5 8 9 N 4 . 0 0 0 0 3 . 0 0 0 0 ̲p R a w C o n t r a s t 0 . 0 1 1 0 T r e n d それでは層を併合した検定とは一体何を行っているのだろうか?町L T T E S Tプロシジャの解析結 果を出力したデータセット O U Tの内容を調べてみよう. T T E S Tで層を併合した解析(出力データセット O U T ) 出力 削 L O B S T E S T V A R M E A N M E A N M E A N M E A N Y 2 3 4 Y Y Y L 姐E L T r e n d T r e n d T r e n d T r e n d S T R A T A C O N T S E N R A WP A ー 1 .5 1 .5 3 3 5 7 B ‑ 5 . 5 1 .4 1 9 78 C .5 3 3 5 7 0 . 0 1 ‑ 5 4 . 5 1 8 . 9 5 9 21 60 . 0 1 1 0 0 6 00

15.
[beta]
このプログラム例では, 2群でかつ C
O
N
T
R
A
S
T文を指定していない,この場合にはデフォルトで対
比の係数は 01
になるが,内部的に群について足して O
になるように基準化されるので,実際には ‑
0
.

50
.
5となる.したがって対比統計量の分子を示す変数̲
C
O
N
T
ー
は
, 2群の平均値の差を半分とした
ものになっている.平均 1
[
f
iの差自体を,変数 ̲
C
O
N
Tーで示したい場合は, C
O
N
T
R
A
S
T文で対比の係数を
し1
と指定すればよい. A
,B
,C
それぞれの肘について,対比統計量の分子と分母が出力された後
に,層を併合した結果が出力される(変数̲
S
T
R
A
T
A
̲
は欠測(.)になる).併合した結果は各層を,次
に示すように 2群を併せたサンプルサイズ (̲N̲)で重み付けたものである.

̲
C
O
N
T二
L
:{
̲
C
O
N
T
̲
X̲
N
̲
}7x(1
.5
)
+
8
x
(5
.
5
)
+7
x
(0
.
0
)ニ ー 5
4
.
5
:̲
S
E
̲
ix ̲
N
̲
i
}ニS
Q
R
T
{5
3
3
5i
xT+1
.4
1
9
7i
x8i+1
.5
3
3
5i
x?
i}=18.96
̲
S
E
̲
=
S
Q
R
T
{L
E C
O
N
T
̲
/
̲
S
E
ーニ (5
4
.
5
)
/
1
8
.
9
6ニー 2
.
8
7
併合した結果における変数Jーは 1
6になっているが,これは併合した検定における誤差の自由度

̲
N
̲
‑
2
}
=
5
+
6
+
5
=
1
6である.
を表している.すなわちL:{
町L
T
T
E
S
Tプロシジヤでは各層のサンプルサイズで重みを付けて,各層の結果を併合するため,サ
ンプルサイズの大きな用の寄与が大きくなる.また併合した効果につい℃は,直接出力されないが,

̲
C
O
N
T
ーを重みの和 (
7
+
8
+
72
2
)で割ることによって,各層の薬剤効果の重み付き平均を求めることが
二

できる.この例では,

̲
C
O
N
T
̲
/L
:N=5
4
.
5
/
2
2ニー 2
.
4
7
7
となり,この仙一を 2惜した ‑
4
.
9
5
5がj
討を併合した平均値の差になる.

L
Mプロシジャを川いて ,J
併を併合した結果と比較してみよう.
さてこの結*を, G
E
L文で施設の効果 (
i
n
s
),薬剤jの主効果 (
t
r
e
a
t
),施設×薬
プログラム例は次のようになる.ト!OD
剤の交互 íA~m (
i
n
s牢t
r
e
a
t
)を指定し,またオプションで S
S
2とS
S
3の平方和の出力を指定する.

L
Mプロシジャによる肘を併介した解析
プログラム G
d
a
t
ad
a
t
a
1
;
',
'
B
',
'
C
',
d
oi
n
sゴ A
d
ot
r
e
a
t二 0
,
1
;
d
oi
=
lt
o4
;
i
n
p
u
ty@
@
;
o
u
t
p
u
t
;
巴n
d
;巴n
d
;巴n
d
;
c
a
r
d
s
;
1
92
621. 1
92
31
81
6
2
12
72
01
6 1
01
6 86
1
62
11
11
6 2
11
41
3.
p
r
o
cg
l
r
nd
a
t
a
=
d
a
t
a
1
;c
l
a
s
si
n
st
r
e
a
t
;
r
e
a
t
/
s
s
2s
s
3
;
r
u
n
;
m
o
d
e
ly
=
i
n
st
r
e
a
ti
n
s牢t
結果は次のようになる.
交互作用については, T
Y
P
EI
IとI
Iの検定結果が一致するが,主効果の検定結果は, 1
7
I
J数がアン

r
e
a
t
(周を併合した薬剤効果に相当)については T
Y
P
EI
IとI
Iの検
バランスのため,一致しない. t
定の p値はそれぞれ 0
.
0
1
0
4と0
.
0
1
5
8となり,これらはいずれも町L
T
T
E
S
Tプロシジャの出力する p値
0
.
0
1
1
0とは一致しない.実はこの 3種類の検定では,各層に与える重みが異なっている.

‑9

16.
[beta]
出力 G
L
Mプロシジャによる崩を併合した解析
D
e
p
e
n
d
e
n
tV
a
r
i
a
b
l
e
:Y
D
F S
皿 o
fS
q
u
a
r
e
s FV
a
l
u
e P
r>F
u
S
o
u
r
c
e
43 0
.
0
1
0
1
5
4.
M
o
d
e
l
3
5
7
.
2
7
2
7
2
7
2
7
1
6
E
r
r
o
r
2
5
8
.
0
0
0
0
0
0
0
0
C
o
r
r
e
c
t
e
dT
o
t
a
l
2
1
6
1
5
.
2
7
2
7
2
7
2
7
R
‑
S
q
u
a
r
e
C
.
V
.
YM
e
a
n
0
.
5
8
0
6
7
4
2
3
.
3
7
1
1
9
1
7
.
1
8
1
8
1
8
2
D
F
T
y
p
eI
IS
S FV
a
l
u
e P
S
o
u
r
c
e
r>F
I
N
S
2
1
2
1
.
9
2
2
0
7
7
9
2
3
.
7
8 0
.
0
4
5
2
T
R
E
A
T
1
3
5
.
7
1
4
2
8
5
7
1
8.
4
2 0
.
0
1
0
4
I
N
S本T
R
E
A
T
2
1
2
1
.
7
1
4
2
8
5
7
1
3
.
7
7 0
.
0
4
5
4
D
F
T
y
p
eI
I
IS
S FV
a
l
u
e P
S
o
u
r
c
e
r>F
2
I
N
S
1
0
7
.
6
3
9
0
9
7
7
4
3
.
3
4 0
.
0
6
1
5
T
R
E
A
T
1
1
7
.
6
0
0
0
0
0
0
0
?29 0
.
0
1
5
8
2
3
.
7
7 0
R
E
A
T
T
N
S本T
l
己
1
.7
1
4
2
8
5
7
1
.
0
4
5<
t
表 3 3続の検定の重みの違い

A B C F統計量
787
8
.
2
6
676
8
.
42
l 1
7
.
2
9

各層の重み

I)MULπ"
'
ES
T
I
I
I十 1
2
2)TYPEI検定
1/(1
/1
1+l!1l2
)
3)TYPEllI積定
各層の効果(‑
3
(
A
)ー1
1
(
B
)O
(C))と重み付き平均

│
1
)川 ( 山 (1
‑
山 山 間

2
) (
6x(
‑
3
)
+
7x(
‑
1
1
)
+
6x(
0
)
)
/
(
6
+
7
+
6
)
=
5
.
0
0
1)
+
1X(
0
)
)
/
(
1+1
+1
)
=
4
.
6
7
3
) (
I
X
(
‑
3
)
+
I
X
(ー1
1
l1
=1l2
のときは 1
)
=
2
)
間L
T
T
E
S
Tプに各層のサンプルサイズで重みを付けるの対し, G
L
MのT
Y
P
EI
I
Iの検定では,各層の重

Y
P
EI
Iの検定は, 2群の平均値の差の分散の逆数に比例した
みを等しく lにとる.これに対し, T
重みを尿周する.分散の大きい層は,推定精度が低いので重みを小さくすることになる.
等分散性を仮定して, 3つの層をプールした誤差分散を V とすると,各層の平均値の差の分散は

A

B

C

Vx(
1/
4
+1
/4
)
Vx(
1/
4
+1
/3
)
l/Vx1
2
/
6
l/Vx1
2
/
7
となる.したがってこの例では各層に1/7
,1
/丸 1
/
7
(丸7,6と等価)の重みを与えることになる.
n1
=
n
jのとき(各群のサンプルサイズが等しい)は, M
U
L
T
T
E
S
TとT
Y
P
EI
Iの検定の結果は同じになる
平均値の差の分散

分散の逆数

Vx(
1/
3
+
1
/
4
)
l/Vx1
2
/
7

が,それ以外のときは微妙に異なる.
このように併合した解析の結果は,プロシジャ間・内で異なるので,注意が必要で、ある.どの併
合方法がよいかについては,議論のあるところであるが,施設当りの例数が等しければ同じ結果に
なるので,あまり大きく食い違うことのないように,施設あたりのサンプルザイズを揃えておくこ
とが推奨される.

T
T
E
S
Tプロシジャの T
E
S
T文で, C
Aオプションを指定し, S
T
目的変数が 2値データの場合には,間L
R
A
T
A文と組み合わせることによって, C
即(
C
o
c
h
r皿 ‑
M
皿 t
e
l
‑
H
a
e
n
s
z
e
l
)流の併合した解析が可能にな

EA
唱

ハU

17.

る.仮想データに基づくプログラム例と出力を次に示す. プログラム町L T T E S Tプロシジャによる C 回流の層の併合 d a t ad a t a 2 ; 二 1t o2 ; d os t r a t a d od r u g = 'C ', ' N '; d oy = Ot o1 ; i n p u tw@ @ ; o u t p u t ; e n d ; e n d ; e n d ; c a r d s ; 1 01 051 5 1 641 01 0 u t ; p r o cm u l t t e s td a t a = d a t a 2o u t二 o c l a s sd r u g ; t e s tc a ( y ) ; f r e qw ; s t r a t as t r a t a ; p r o cp r i n td a t a = o u t ; r u n ; 出 力 旧L T T E S Tプロシジャによる C M H流の脳の併合 C l a s s N Y a r i a b l e S t r a t u m S t a t i s t i c C C o u n t 1 0 . 0 0 1 5 . 0 0 Y N 2 0 . 0 0 2 0 . 0 0 P e r c e n t 5 0 . 0 0 7 5 . 0 0 C o u n t 4 . 0 0 1 0 . 0 0 2 N 2 0 . 0 0 2 0 . 0 0 P e r c e n t 2 0 . 0 0 6 0 . 0 0 C o n t r a s t R a w ̲ p T r e n d O . O I I G O B ST E S T V A R L A B E L S T R A T A C O N T E X P S E R A WP 1 C A Y T r e n d 1 1 5 1 2 . 51 . 5 5 0 4 3 2 C A Y T r e n d 2 1 0 7 . 01 . 5 2 7 5 3 3CA Y T r e n d 2 5 1 9 . 52 . 1 7 6 5 10 . 0 1 1 5 0 5 検定の場合, C O N T R A S T文を指定しない場合のデフォルトの対比の係数は 0,1 であり, 2つの層 C A = 1の観測度数と期待度数が,重み lで足し合わされる. の N群の Y ̲ C O N T 一 :N群の Y 二1 の観測度数 1 5 + 1 0 = 2 5 ̲ E X P ̲ :帰無仮説の下での期待度数 ̲ S T R A T A ̲ = 1 :4 0x( 2 5 / 4 0 )x( 2 0 / 4 0) = 1 2 . 5 ̲ S T R A T A 一二2 : 4 0x( 14 / 4 0 )x( 2 0 / 4 0 ) =7 . 0 1 2 . 5 + 7 . 0二 1 9 . 5 ̲ S E ̲ :S Q R T (1 .5 5 0 4 3i+ 1 .5 2 7 5 31 ) = S Q R T ( 4 . 7 3 7 2 ) = 2 . 1 7 6 5 1 Z = ( ̲ C O N T 二 一E X P ̲ ) /̲ S Eニ( 2 5 ‑ 1 9 . 5 ) / 2 . 1 7 6 5 1 = 2 . 5 2 7 . 5 2 72 = 6 . 3 8 6 x 1 =Z 2 2 この結果は,以下のプログラムを用いて F R E Qプロシジャで,層を併合した解析結果と正確に一致 二 する. プログラム F R E Qプロシジャによる C 間流の層の併合 p r o cf r e qd a t a = d a t a 2 ;w e i g h tw ; 本y 牢d r u g / c m h ;r u n ; t a b l e ss t r a t a ーよ 14

18.

F R E Qプロシジャによる C M H 流の凶の併合 C o c h r a n ‑ M a n t巴l ‑ H a e n s z巴1S t a t i s t i c s( B a s巴do nT a b l巴 S c o r巴s ) o t h e s i s D F V a l u巴 P r o b S t a t i s t i c A l t e r n a t i v巴 H yp 出力 ームワ臼守 U N o n z巴r oC o r r巴1 a t i o n R o wM e叩 S c o r巴sD i f f e r a lA s s o c i a t i o n G e n巴r 6 . 3 8 6 6 . 3 8 6 6 . 3 8 6 0 . 0 1 2 0 . 0 1 2 0 . 0 1 2 6. S T R A T A文を用いた場合の r e s a 皿p li n gの方法 ( Q 4 .層を併合した解析におげる多重性の調整列 5節で示したように, G L Mプロシジャでも層を併合した解析は可能であるが, MULTTESTプロシジ ヤを用いて,解析する利点、は,計量データ, 2値データのいずれにおいても,統一的に層を併合し た解析が可能である点と,特に多群の場合について,多重性の調整を柔 f飲に行うことができる点で ある ( G L Mプロシジヤでも L S 阻A N Sを用いていくつかの多重性の調整法は可能ではあるが). それでは唐を併合した解析における多重性の調整は,とのように行っているのだろうか. S T R A T A 文を用いない場合の r e s a 皿p li n gと比較して説明しよう. 2 4人の患者をプラセボ (P)と新薬群 (N)に1 2人づっ,分ける組み合わせの数を考えてみよう.完 全無作為化の場合,組み合わせの数は C 1 5 1 .2 9 5X 1 0 24 12= ヒなる. しかしながら,実際の臨床研究は彼数の施設で行われることが多く,通常は完全無作為化割付で はなく,施設をブロックとしたブロック割付が行われる.例えば ,A, B, C 3施設に A 施設 (P:4人 , N :4人) と分ける組み合わせの数は B 施設 (P:4人 , N :4人) C 施設 (P:4人 , N :4 人) ( a C . y ' =70=343000 3 となる.この場合,ブロックサイズは 8であり,各施設ごとに, PとNが 4人になるように制約さ れるので,完全無作為化割付の場合より組み合わせの数はかなり少なくなる. 例えば,次に示す パターンはブロック割付では,生じることがないが,完全無作為化割付では,確率は小さいものの 生じる可能性は Oではない. A B PPPPPPPP PPPP N N N N C NNNNNNNN さて, M U L T T E S Tプロシジャでは,生データの r e s a 皿p li n gによって,帰無仮説の下での分布を計算 するが, S T R A T A 文を用いない場合, C L A S S変数の各水準にデータを完全無作為に割付けることによ って,新しい標本を作成する.これに対し, S T R A T A文を用いた場合,指定した層別変数の水準で, T R A T A 文を用いた場合,並べ替え分布の発生方法 ブロック化してデータを割り付ける.このように S が完全無作為化からブロック割付に変わる.また検定統計量の構成方法が異なる.計量データを目 的変数として, T E S T文で阻A Nオプシヨンを用い, S T R A T A文を指定した場合,層ごとに計算した平均 T R A T A文を指定しない場合,層を無視し 値の差の重み付き平均が検定統計量になる.これに対し, S た単純な 2群の平均 ( f {Iの去が検定統計百:になる. ‑12一

19.
[beta]
4 周を併合した 切
W
干
?
f
(

k
ベ
{
併
イ
湾
}
え
検i
定
i
主
̲
:
(
S
訂T
R
臥A
T
目A
あり)

4悦
R べ十伴干え検i定
iζ~(ωSTRATA なし)

、
松
)
昨

検定統計毘

(X~. ‑
X
[
.
)

LWs(Xj,
‑X[)

並べ併え分イi
lの作成

完全 J
m作為イじ
1
.2
9
5
x
1
0
[
;通り

ブロック ;
'
;
J
J
N

例題の組み合わせの数

3
4
3
0
0
0通り

r
e
s
a
m
p
li
n
gの方法は,試験デザインを反映させる必要がある.施設を同としたブロック;刑判ーを行
ったのであれば,解析でも )
¥
'
f
Iを考慮した検定を行うのが望ましい.特に施設問差が大きい場合は,

?
析の方が検出 )
Jが向くなる.ただし,
施設を厨として考慮した W

1つの M当りの例数が小さい場合

Tしない肘が I
L
¥てしまう場合がある.
は,胞を考慮した解析では,結果に寄 i
例えば,反応変数が 2(((データの場合,ある府で

A

A

反応改;ち

政j
q

1
) ;
'
i
U
H
2、;判子 1

A

A

反応改許

c
X1~;;

B
l
S
LF
i
A

B
政j
与

己支持なし

己支持なし

A

の場合, W
i全体が解析に寄りしない. I
C
HにI
共J
J1iして,施設当りの症例数を増やす j
j
[J
t
J
になってい
るが,この背;誌の 1つには,施 t没当りの症例数が少ないと,施:没を考慮した解析を行う際に,この
ように解析に寄与しない施設が山てくるためである.

7.T
E
S
T文の P
E
T
Oオプション
(
Q
S
.l
1
U
L
T
T
E
S
l
'でログランク検定を行ろには,どうしたらよいのか?)
E
S
T文で旧A
Nオプションを指定することにより,計五t
データについ
これまで述べてきたように, T
ての解析, C
Aオプションによって, 2fi!iデータの解析が [IJíì~ で、ある.それでは,計鼠:データ, 2仙
データとともに生物統計.
'
:
tでよく J
I
Jいられる生存[,,'i!I1
¥
データの解析は,どのようにすればよいのだ
ろうか? M
U
L
T
T
E
S
Tプロシジヤでは T
E
S
T文で P
E
T
Oオプションを指定することにより, P
e
t
o
検定を行
うことができる.この検定法は J
l
"臨床の癌原性試験データを解析するために,考案された n
l
;であ
IIlから,特殊な場合にはログランク検定にー
るが,実は,ログランク検定を拡張したという構成原 J

致することがまn
られており,この点を利用して, M
U
L
T
T
E
S
Tプロシジャで生存時間データを検定する

I
F
E
T
E
S
Tプロシジャでも可能で、あるが, M
U
L
T
T
E
S
Tプロシ
ことが可能である.ログランク+9:l定自体は L
ジヤを J
Hし、る場合,ぷ 5のような利点がある.

U
L
T
T
E
S
Tプロシジャでログランク検定を行う利点
表 5M
1
)対比 (
C
O
N
T
R
A
S
T
)を川いた解析が可能(群!日l
比"丸 m
::
:
f
l
l関駅1:の検定 (
T
a
r
o
n
e
検定))
2
)並べ答え分布による i
E
<
<
{
f
!
な p(
r
t
iの計算 (
p
e
r
m
u
t
a
t
i
o
n
ニオプション)
3
)解析結果を S
A
Sデータセットにおとせる.
4
)各時点の期待と観測死亡数が出力することが可能

e
s
a
m
p
li
n
gによる多FfH'I:の調整はできない
注意:r
T
T
E
S
Tプロシジヤを用いて,
次に,町L

G
e
h
a
nのデータを J
[
!いてログランク検定を行うプログラム

例を示す.このデータでは白血病の再発をイベントとし, ~J l
l
i
l病の再発または打切りまでの時間

E
E
K
)を,過を単位として示している.夕、J
!
K
:f
,
f
:(
d
r
u
g
二0
)と薬剤1,下 (
d
r
u
g
=
l
)の
(変数W

2mで,それぞれ

2
1人の患者ーから成り立っている.ログランク検定を行う場合,側休ごとに群,生存 n
!
i
l
i
¥
J,打ち切り
の 3種類の情報が必要である.プログラム例では,それぞれを,変数 D
R
U
G,W
E
E
K,R
E
M
I
S
Sで表してい

41ム

nJ

20.

る. M U L T T E S Tプロシジャの場合は打ち切り変数は,辿続変数でかつ,死亡(イベントあり)は 2,打 ち切り(イベントなし)は Oでコードしなければならない点に注意する必要がある. 1 作分け変数は C L A S S文で指定し, T E S T文で, P E T O (打ち切り変数 /TIMEニ1 1 ; 1 1 1 ¥ 1変数)を指定する. P E R M U T A T I O N =オプシ ヨンは, p仙の計算を l EN ,近一似ではなく,離散的な , ) ( i .ベ伴え分布を利 H Jするための指定である.こ f f の場合, M U L T T E S Tプロシジャの結果は, L I F E T E S Tプロシジャ のオプションを指定しなければ, 2{ E依に‑致する. のログランク検定の結果に i プログラム M U L T T E S Tによるログランク検'よ d a t ag e h a n ; 申; o u t p u t ; e n d ; e n d ; d od r u g = Ot o1 ; d o1 = 1t o2 1 ; i n p u tw e e kr e m i s s申 c a r d s ; 12 12 22 22 32 42 42 52 52 82 82 12 1 22 1 82 82 1 12 1 22 1 52 1 72 2 22 2 32 60 62 62 62 72 90 1 00 1 02 1 10 1 32 1 62 1 70 1 90 2 00 2 22 2 32 2 50 3 20 3 20 3 40 3 50 i t t e s td a t a 二g e h a no u t = o u t ; c l a s sd r u g ; p r o c皿u e e kp e r m u t a t i o n二2 0 ); t e s tp e t o ( r e m i s s / t i m e二 w p r o cp r i n td a t a 二o u t ; r u n ; 車i ;!!ミは次のようになる. M U L T T E S Tプロシジャの山 )J自体は,最終的な pl ( i fのみであるが, U ‑ l , 力 デ 、 ータセットには,死亡 1 " ' [ ‑点ごとにかなり詳細な情報が山力される. 2群しかないのでデフォルトの ,1 になる.したがって第 2併の観測死亡数が̲ C O N T ̲,帰無似説の下での期待死亡 対比の係数は, 0 E X P ー に! J ¥ ) Jされ,また趨幾何分布に基づいて計開された分散の平方組が ̲ S E ーに示されている. 数が̲ 円 小よ ・ M川 口ununununUつd1inu‑‑nunu‑‑nU1inu‑‑1i口d n u v ょ っ 小よ 1ょ 1 i 1 ょ 1 i 1ょ 1ょ 1ょ 1ょ 1i‑i1ょ 1ょ 1ょ 1L1L1i1ょ ‑ υ ' AA 中よ U 一 小よ AA ハU1inLつdFhuρ口円 l n Lつd n且 1iワMηJバヨ FUρ口円 loo‑‑1i1i1L1i1L1 ‑9M ノ HT ι γ 小よ A A F A F A P A P A F A F A F A F A F A F A F A F A F A F A F A P A P A P A ︑ 円 宇 内L一 dn dn dn dn dn dn dn d dn dn d u nd nd nd nd nd nd nd nn nfE υnDρuρuρuρuρuρuρuρupunuρupupupupunupupu HUTL 小 よ 小 よ 小 よ 小 よ 小 よ 小 よ 小 よ 小 よ 小 よ 中A 中 A 中 A 小 よ 小 よ 小 よ 小 よ 小 よ 中 A nu‑ h1 u n入 U U U U U u n入 U u n入 U u n入 un入 U U U U u n入 U Hvpupupupupupupupupupupupupupupupupupu てu 比日比日比日比日比日比日比日比口比 DUDUD 比日比日比日比日比日比口比 ツ ︑ 円 ︑ 円︑ 円︑ 円︑ 円︑ 円 ︑ 円 ︑ ︑ 円︑ 円︑ 円 円︑ 円 Z A凡 M川 H川 H川 H川 M N M N M N M N M N M口 M口 M N H川 H川 M N M N M N M N B 寸 ム 111111111 ﹄ ﹁ 小 よ 小 よ 小 よ 小 よ 小 よ 小 よ 小 よ 小 よ 小 よ 中A 小 よ 中 A 小 よ 小 よ 小 よ 小 よ 小 よ 小 よ ニノ nHunHunHunHupunHun 巴 ロ unHupunHun 巴 わ 巴 ロupun 巴わ巴わ巴 n H U b/ 一 一T 000000000000000000 qu .叩 力TP 一 ppppppppppppppppp 仕 S123456789012 3 4 5 6 7 8 ︑ lE ‑3 33 ss ss ssssssssss Y l i ls ‑ ‑ 山力 M U L T T E S Tによるログランク検定 •M U L T T E S Tプロシジャの出力 C o n t r a s t R a w ̲ p T r e n d 0 . 0 0 0 1 E X P S E R A WP 1 .0 0 0 00 . 6 9 8 4 3• 1 .0 5 0 00 . 6 9 7 1 1 0 . 5 5 2 60 . 4 9 7 2 2. 1 .1 3 5 10 . 6 9 0 8 2. 1 .2 0 0 00 . 6 8 2 5 6. 1 .9 0 9 10 . 8 0 6 7 4. 0 . 5 8 6 20 . 4 9 2 5 1 2 . 2 8 5 70 . 9 3 3 1 4. 0 . 6 5 2 20 . 4 7 6 2 8. 1 . 2 3 8 10 . 6 6 9 3 8. 1 .3 3 3 30 . 6 4 6 7 6 0 . 7 5 0 00 . 4 3 3 0 1 0 . 7 3 3 30 . 4 4 2 2 2. 0 . 7 8 5 70 . 4 1 0 3 3• 0 . 7 6 9 20 . 4 2 1 3 3. 1 .5 5 5 60 . 5 4 9 9 7. 1 .7 1 4 30 . 4 5 1 7 5. 1 9 . 2 5 0 52 . 5 0 1 3 9. 0 0 0 0 6 2 3 4 4 ‑14

21.

各時点ごとの出力の後で,全 H 与点をまとめて集計した結果が,山カされる(O B S ニ1 8 ).総観測死亡数 9に対し,期待死亡数の和は 1 9 . 2 5 0 5であるから,予想されるより薬剤群では死亡が少ないといえる. 検定するためには,捜数の時点を併合した結果について,次のカイ 2乗統計量を計算する. j / 標準誤差 i二(19 . 2 5 0 5 ‑ 9 )' / 2 . 5 0 1 3 9i (観測死亡数一期待死亡数 ) =1 6 .7 9 3 この結果は L I F E T E S Tプロシジャのログランク検定の結果に正舵に一致する.ただし p値は, p e r m u t a t i o n = 2 0を指定したため,カイ 2采分布ではなく, ;l[~ ベ持え分イtî に基づいて計算するので,値が 異なる. p e r m u t a t i o n =オプションを指定しなければ, P 1 1 自も L I F E T E S Tプロシジャと一致する.町L T T E S Tプロシジャの標準誤差し回一)の計算方法が,リリース 6 . 1 2から変更になった.以前は 2項分布 に基づいて標準誤差を計算していたが, 6 . 1 2から超幾何分布に変更になった.この点で以前の解析 結果と,値が微妙に異なる場合があるので注意が必要である.なお同時期に, C Aオプションの C o c h 検定についても,牒準誤差の計算方式が, 2Jti分布から超幾何分布に変更になった. r a n ‑ A r m i t a g e g. 町L T T E S Tプロシジヤ利用上の注意点 ( Q 6 . 限7 L T T E S Tの落とし穴とは?) 7節までで、示してきたように, M U L T T E S Tプロシジャはたいへん便利なプロシジャである.しかし ながら,いくつかの利用 : l の注意点があり,特に町L T T E S Tプロシジヤの出力する p値のみを,鵜呑 みにするのはたいへん危険な場合がある. 8. 1 生存時間は整数 さて G e h a nのデータでは,変数W E E Kは白血病の再発までの期間を,週を単位としてあらわしてい O N T たが,単位を週から月に変更したいと考えたとしよう.このために変数町田を 4で割った変数M Hを新たに D A T Aステップで作成して,町L T T E S Tプロシジャで解析してみよう(ログランク検定は生存 時間の情報のみに基づいた検定なので,順序関係が維持される単調変換を行っても結果は不変であ る).プログラム例は次のようになる. d a t ag e h a n ; s e tg e h a n ; m o n t h = w e e k / 4 ; p r o cm u l t t e s to u t = r e s u l t ; c l a s sd r u g ; t e s tp e t o ( r e m i s s / t i m e = 皿o n t h ) ; r u n ; 実はこのプログラムを実行しても, O U T P U T画面には何も出力されず, L O G画面には次のメッセー ジが残される. E R R O R :T I M E二 variablesmustb ei n t e g e r ‑ v a l u e d . N O T E : エラーのため,このステップの処理を中止しました. T T E S Tプロシジャは 6 . 1 2から仕様が変更になり,奇妙なことではあるが,生存時間 ( t i m e二 実は町L オプションで指定する変数)は整数値でなければならなくなった.このため,整数値ではない観測 値が 1つでも存在すると,間L T T E S Tプロシジャは全く実行されなくなる.ちなみに L I F E T E S Tプロシ ジャでは,生存時間は整数でなくても構わないが,非負でなくてはならない.生存時聞が負の場合 は,その時間変数は欠測扱いとなり,除いて解析が行われる. 8 .2 C L A S S変数の水準の順序に注意 1群あたり 5 0匹のラットを用い, 0,0 . 1,0 . 3,1 .0 m g / k gの 4群て行われた仮想的な癌原性試験 のデータについて,用量相│期的にl J 重蕩先生率 ( Y = l :腫蕩あり, Yニ0 :腫療なし)が増加しているか, C o T T E S TとF R E Qプロシジヤの 2種類のプ c h r a n ‑ A r m i t a g e ( C A )検定によって調べてみよう.ここでは町L FhU 1 ょ

22.

ログラム例を示している.間L T T E S Tプロシジャを用いて, C A 検定を行う β 法は,既に 4節で述べて いる.ここでは C O N T R A S T文で対比の係数として,月]量, 00.1 0.3 1 .0を指定している.また F R E Q プロシジヤでは T A B L E S文の T R E N Dオプションを指定することにより, C A 検定を行うことができる. プログラム C o c h r a n ‑ A r m i t a g e ( C A )検定 d a t ac a ; d og r o u p二 0, 0 . 1, 0 . 3,1 ; d oy = l, O ; i n p u tw@ @ ; o u t p u t ;巴n d ;巴n d ; c a r d s ; 1 04 0 1 53 5 2 03 0 2 52 5 p r o cm u l t t e s td a t a ニc a ; t e s tc a ( y ) ; f r e qw ; c l a s s g r o u p ; c o n t r a s t'linea~ 00.1 0.3 1 ; p r o cf r e qd a t a = c a ; 牢g r o u p / t r e n d ; w e i g h tw ; r u n ; t a b l e sy 実行結果を次に示す. J B力 Cochran‑Armitage(CA)検定 .M U L T T E S Tプロシジャ C A 検定の結果の出力 C o n t r a s t R a w ̲ p 1 i n e a r 0 . 3 4 3 8 . F R E Qプロシジャの出力 S T A T I S T I C SF O RT A B L EO FYB YG R O U P C o c h r a n ‑ A r m i t a g eT r e n dT e s t S t a t i s t i c=‑3.037 P r o b( L e f t ‑ s i d e d ) =0.001 P r o b( T w o ‑ s i d e d ) =斗盟2 S a 皿p l eS i z eニ 200 さて 2つのプロシジャで,結果が全く異なる. M U L T T E S Tプロシジヤの p 値は 0 .3438で,全く有意 でないのに対し, F R E Qプロシジヤでは両側検定の p伯が 0.002で高度に有意になる.データをみる と用量が増加するに伴い,腫鹿発生率の増加がみられ,用量相関的な傾向が認められるが,なぜ, 削L T T E S Tプロシジヤでは, C A 険定の結果が有意にならないのだろうか?実はM U L T T E S Tプロシジヤ の出力の詳細をみると,次のような周辺情報が見られる. 間L T T E S TC O E F F I C I E N T S C o n t r a s t l i n e a r 。 0 . 0 0 0 0 0 C l a s s 0 . 1 0 . 3 0 0 0 0 0 . 1 0 0 0 0 0 . 3 1 . 0 0 0 0 0 間L T T E S TT A B L E S V a r i a b l e S t a t i s t i c Y C o u n t N P e r c e n t 。 1 0 . 0 0 5 0 . 0 0 2 0 . 0 0 C l a s s 2 5 . 0 0 5 0 . 0 0 5 0 . 0 0 ‑16一 0 . 1 1 5 . 0 0 5 0 . 0 0 3 0 . 0 0 0 . 3 2 0 . 0 0 5 0 . 0 0 4 0 . 0 0

23.

C L A S S変数の水準が 0,1 , 0 . 1, 0 . 3と悦び,用 b iの順になっていないことがわかる.対比の係数もこ A検定の結果は有志とはならない.実は C L A S S文におけ の順で割り当てられてしまう.したがって C R O CM U L T T E S T文の O R D E R =オプションによって制御でき,次の 4つのオプション る水準の順序は, P J怠されている. がH O R D E R =オプション D A T A :データセットで出現した順 F R E Q :度数の多い順 F O R M A T T E D:フォーマット I } 闘 I N T E R N A L :内部ハードウエアの定義順 この O R D E R =オプションのデフォルトの設定が,プロシジヤ問で異なっている.例えば,町L T T E S T プロシジャでは F O R M A T T E Dであるが, F R E Qプロシジャでは I N T E R N A Lがデフォルトの指定である.ち L Mプロシジャのデフォルトも F O R 出T T E Dである.水準の順序が意図したものと入れ替わって なみに G L A S S変数が名義変数であれば大きな問題はない.しかし, C O N T R A S T文をよHいる場合のよ いても, C うに,解析に水準問の情報を mいる場合は,水準のI}闘序関係をチェックしておくことが重要である. この例でも, P R O CM U L T T E S TO R D E R = I N T E R N A lという指定を行っておけば, F R E Qプロシジャと同ーの 泊先2が得られる.このような落とし穴を避けるために,カテプリ一変数の水準については,あま h 複雑な偶を与えず(必要であればフォーマットを作成すればよし¥),できたら 1 , 2, 3…のような単純 な値が望ましいだろう.また検定の結果だけではなく, L O G画面を含めた周辺の情報にも関心を払 うようにする必要がある. 8 . 3r e s a 皿p li n gを行う場合は欠測に注意 T E S T文で複数の変数を指定し,かっ変数問で欠測のパターンが異なる場合に, r 巴s a m p li n gによる 多重性の調整を行うときは注意が必要である.仮に, 2つの変数Y 1とY 2について, t r e a t = Oと lの 2群で平均値の差の検定をわい,多項目についての多重性の調'抱のために, r e s a 皿p li n gを行ったと しよう.プログラム例を次に示す. e s a m p li n g プログラム欠測値を含む r 巴s t ; d a t at 1 ; d ot r e at = O, d oi 二 1t o4 ; i n p u ty 1y 2。 唱;output;巴nd;巴nd; c a r d s ; 2 01 0 51 0 .1 0 .1 5 3 02 0 2 02 0 1 52 0 51 0 巴s to u to u tp e r m u t a t i o ns e e d = 4 9 8 9n s a 皿p l e = 2o u t s a 皿p = o u t s ; p r o cm u l t t e s td a t at c l a s st r e a t ; t e s t皿 巴 叩 ( y 1y 2 ) ; p r o cp r i n td a t a = o u t s ; r u n ; 二 二 変数 Y 2については欠測がないが,変数Y 1では, T R E A T ニO 群の 3 , 4 番目の個体で欠測が起きていた. e s a 皿p li n gによって作成した再標本を, O U T S A M P =データセット名オプションを 元データに対して, r 指定することによって,データセット O U T Sに出力している.ここでは例示が目的なので, n s姐 p l巴二 2で , r e s a 皿p li n gの回数を 2回に制限している. 変数 S A M P L E がr e s a m p l i n gの回数を示しており, ̲ C L A S S ̲は再標木における群を示している.変 数y1については欠測パターン(群のサンプルサイズ)が吊データと異なっていることがわかる. 1回 e s a 皿p li n gでは,サンプルサイズが 2群で 4と 2に対し, 2回目では 3と 3になっている.こ 目の r のように r e s a 皿p li n gでは個体を単位として標本抽出を行うので,変数によって欠測パターンが異な ると,再標本では,サンプルサイズが元データと異なってしまう. ヴー

24.

出 )J 出力データセット O U T S O B S S A M P L E 2 3 4 5 6 7 8 9 1 0 1 1 1 2 1 3 1 4 1 5 1 6 2 2 2 2 2 2 2 2 。 。 。 。 C L A S S 。 。 。 。 O B S 7 6 5 Y 1 1 5 2 0 3 0 2 0 5 2 3 4 8 8 6 7 4 5 5 2 0 1 5 2 0 5 2 3 5 3 0 Y 2 2 0 2 0 2 0 1 0 1 0 1 0 1 5 1 0 1 0 2 0 2 0 1 5 1 0 1 0 1 0 2 0 終わりに H U L T T E S Tプロシジャは 1つのプロシジャで広範聞の検定を行うことができ,たいへん便利である が,反田いくつかの落とし穴がある.本稿がM U L T T E S Tの適正使用の一助となれば幸いである. 参考文献 S A SI n s t i t u t cI n c ( 1 9 9 2 ) .S A ST e c h n i c a lR e p o r tP ‑ 2 2 9, C h a n g e sa n dEnh&~ccment , Rclease 6 . 0 7 . S A SI n s t i t u t eI n c . 浜田安[[久馬・古田道弘 ( 1 9 9 2 ) . 日U L T T E S Tプロシジャの紹介. S U G I ‑ J '9 2論文集, 3 5 7 ‑ 3 7 0 岸本淳司 ( 1 9 9 2 ) . 標本再抽出に基づいて多重性調整 p値を求めるプロシジャ削L T T E S T . 計算機統計学, 1 5 7 ‑ 1 6 0 配 n t sf o rR e l e a s e6 . 1 2 . S A SI n s t i t u t eI n c ( 1 9 9 6 ) .S A S / S T A TS o f t w a r e :C h a n g e sa n dE n h a n c e S A SI n s t i t u t eI n c . 永凹端・吉田道広(19 9 7 ) . 統計的多重比較法の基礎.サイエンテイスト社 h < k c / If小乙 ルJyiUi ‑ J ‑ 111f百を U 術教草 rp~-t村 J , 4hi 06

25.

論文発表 StudentSession

26.

日本 S A Sユーザー会 (SUG I‑J) 大学病院の剖検率を低下させる可能性のある医療評価指標の検討 楊 学 坤 1) 今井書正 1) 丸林葉子 : n 江原義郎 : n 1 ) ) " 頁天堂大学医学部病院管理学研究室, 2 )順天堂医院診療録管理室 3 )順天堂大学医学部中央電算機室研究部門 Decliningautopsyr a t ea tu n i v e r s i t yh o s p i t a l si nJapan: Astudyo fmedicalassessmenti n d i c e swhichmayhavei n f l u e n c eoni t sd e c l i n e 1 ) 1 ), Yokol Y l A R UHAYASHI2), YoshiroEHARA: XuekunYANG1),Hisamasa瓜 仏1 l )De p a r t m e n t o fH o s p i t a lA d m i n i s t r a t i o n .J u n t e d oU n i v e r s i t y S c h o o lo fM e d i c i n e .Tokyo.J a p a n 2 ) M e d i c a lR巴c o r dL ib r a r y .JuntendoU n i v e r s i t yH o s p i t a . lT o k y o .J a p a n 3 )Di v i s i o no fComputerS c i e n c e .J u n t 巴n doU n i v e r s i t yS c h o o lo fM e d i c i n e .Tokyo.J a p a n 要旨 大学病院の剖検率低下の原因を探る一方策として, SASシステムを用いて,剖検率を 低下させる可能性のある各種医療評価指標と入院死亡患者の剖検率の年次推移との関連 を解析した。その結果,原因のーっとして,入院死亡患者の高齢化の影響が示唆された。 性差と疾患分類別はあまり影響を及ぼしていなかった。生検の件数, CTとMRIの件数 はこの間急増しており剖検率の推移との聞に高い負の相聞が認められた。 キ ー ワ ー ド : SASシステム,統計解析,音J I検,大学病院 ‑21

27.

1 . 緒言 大学病院にとって死亡患者の病理解剖検査の重要性は議論の余地のない事柄である。 平 成 4年 の 改 定 医 療 法 に よ る 「 特 定 機 能 病 院 」 は 主 と し て 大 学 病 院 本 院 を 視 野 に 入 れ て 制定されたものであり, I 高度の医療を提供する能力」の審査項目として(剖検の状 況)すなわち(年間剖検数と剖検率)の記載が求められた 1)のは当然の成り行きであっ た。一方近年,画像検査や生検などの診断技術と外科手術の長足の進歩によって,わざ わざ剖検を施行しなくても診断の確定する症例の比率が上昇し,これと反比例するよ うに近年,剖検率の低下傾向が明らかとなった。このことは本邦の医学界で大きく問 題 視 さ れ , 対 策 を 含 む 議 論 が な さ れ て い る 2‑6)。実は欧米諸国では本邦よりも早くから 同 様 の 現 象 が 認 識 さ れ , そ の 対 策 も 繰 り 返 し 議 論 さ れ て 来 て い る 7‑1:ll 。 筆 者 ら は 1995年 以 来 「 大 学 病 院 の 剖 検 率 の 推 移 に 関 す る 研 究 」 を 始 め , そ の 結 果 を シリーズとして発表してきたはー l u o まず近年における大学病院の剖検率の推移の実態を知るため,筆者らの所属する順天 堂大学医学部附属J I [貢天堂医院(以下, J I [ 頁天堂大学病院という)と全国の大学病院の 1979年 以 降 の 剖 検 率 を 年 報 か ら 集 計 し た 1'1)。剖検率の低下傾向は 1980年 代 初 め か ら 開 始 し 全 国 的 で か つ 直 線 的 で あ り , 咋 今 の 全 国 大 学 病 院 の 平 均 剖 検 率 は 20%前 半 を 低 迷していることが確認された。 次に剖検率低下の原因を究明するため,筆者らは, J I [貢天堂大学病院の診療科医師と病 理 担 当 医 師 に , 続 い て 日 本 病 院 管 理 学 会 評 議 員 に ア ン ケ ー ト 調 査 を 施 行 し た lG.l川 。 そ I検 率 低 下 の 原 因 と し て , 予 想 通 り 「 画 像 診 断 な ど 診 断 技 術 の 進 歩 」 が 三 者 共 の結果,音J 通 し て l位に挙げられた。 近年の大学病院における平均在院日数の漸減傾向が入院死亡患者の剖検率の低下に影 響を与えているかについて順天堂大学病院の入院死亡患者の平均在院日数を剖検の有 無別に年度ごとに統計検定したが,音J I検 の 有 無 の よ る 差 は 認 め ら れ な か っ た 15。 ) そこで今回筆者らは, SASシ ス テ ム を 用 い て , 剖 検 率 を 低 下 さ せ る 可 能 性 の あ る そ の 他の諸要因 性差・疾患分類・死亡時年齢・生検件数・画像検査件数など定量化の可 能な各種客観的な医療評価指標を, J I [ 頁天堂大学病院の 1979年 以 降 の デ ー タ で , 統 計 学 的に解析を加えた。 2 . 方法 以下の方法で,各種医療評価指標と入院死亡患者数・剖検数・剖検率との関連を検討 し た 。 統 計 解 析 に は SASを用いて, FREQフ ロ シ ジ ャ に よ る ク ロ ス 集 計 と χ2 検定, TIESTプ ロ シ ジ ャ に よ る t検定, REGプロシジャによる回帰分析, GLMプ ロ シ ジ ャ に よる 2元 配 置 分 散 分 析 , そ し て CORRフロシジャによる相関係数の計算を行なった。 ‑22一

28.

2 . 1 性差と剖検率 順天堂大学病院の診療録管理室における「退院患者年報」と「死亡患者一覧」から, 979年から 1995年 ま で 1 7年間にわたり, 入院死亡患者数・剖検数・剖検率の推移を, 1 死 亡 患 者 合 計 と 男 女 別 と を 作 図 し , 剖 検 率 の 性 差 を 検 定 し た (χ2 検定)。 2 . 2 疾患分類と剖検率 順 天 堂 大 学 病 院 の 診 療 録 管 理 室 に お け る 「 死 亡 患 者 一 覧 」 か ら 第 9回 修 正 国 際 疾 病 分 類O nternationalC l a s s i f i c a t i o no fDiseases 9thRevision,ICD‑9) 体 系 に 基 づ く 疾 患 分 類 17) 別の ICD番 号 (3桁 ) を 抽 出 し , 方 法 2 . 1の 剖 検 の 有 無 を 加 え て , 死 亡 患 0位 ま で の 疾 患 分 類 ( 原 発 性 悪 性 新 生 物 , 以 下 ) を 方 法 A と同じく 1 7 者 数 が l位から 1 年間にわたって抽出した。そして各群の死亡患者数と剖検率の年次推移を求め,疾患分 類 別 の 剖 検 率 と 当 該 項 目 を 除 く 全 死 亡 患 者 の 平 均 剖 検 率 と の 差 を 検 定 し た (χ2 検定) 2 . 3 入院死亡患者の死亡時年齢(合計と男女別)と剖検の有無 J I買 天 堂 大 学 病 院 の 診 療 録 管 理 室 に お け る 「 死 亡 患 者 平 均 在 院 日 数 」 か ら , 死 亡 時 年 齢 と剖検の有無を方法2 . 1と同じく 1 7年 間 に わ た っ て 抽 出 し た 。 そ し て 死 亡 患 者 の 平 均 年 齢(合計と男女別)を年度別にフロットし,さらに「剖検有」死亡患者と「剖検無」死 亡患者の平均年齢を年度別にプロットし,それぞれの回帰直線を求めた。さらに男女 別 と 剖 検 の 有 無 に 分 け て 死 亡 時 平 均 年 齢 の 差 を 検 定 し た (t 検定)。また, 1 7年 間 の 死 亡数・音 [J 検 数 ・ 剖 検 率 の 推 移 を 年 齢 階 層 別 に 比 較 表 示 す る た め , 年 度 と し て 1 979年 (最初の年) , 1 981年 ( 剖 検 率 最 高 の 年 ) , 1989年 ( 中 間 の 年 ) , 1995年 ( 最 後 の " ‑ ' 9歳 , 1 0" ‑ ' 3 9歳 , 4 0 " ‑ ' 5 9歳, 6 0 " ‑ ' 7 9歳 , 8 0歳"‑'に 年)を抽出し,年齢階層を 0 分けて作図した。 2. 4 生検の件数と剖検率 順天堂大学病院の臨床検査部における「病理検査月報」より, 1 979年から 1995年 ま での組織診(外科的手術による標本)と細胞診(塗抹標本と吸引標本)の入院・外来の 月別件数から年間合計件数を算出し,組織診と細胞診の検査件数の年次推移をプロッ トした。そして,これらの年次推移と全科平均剖検率の年次推移,さらに全悪性新生物 による死亡患者の剖検率の年次推移との相聞を求めた ( P e a r sonの相関係数) 2 . 5 画像検査の件数と剖検率 順天堂大学病院の放射線部における 1 983年から 1995年 ま で の 「 放 射 線 ・ 画 像 診 断 ・ 放 射 線 治 療 件 数 ( 月 患 者 数 ) J よ り , 全 科 に 及 ぶ 項 目 と し て CT スキャン, MRIを 抽 出 した。 CTは 1 985年より, MRIは 1989年 よ り 算 定 可 能 と な っ た 。 各 々 の 月 別 検 査 件 数 から年間合計件数を算出した。その年次推移を求め,さらに各々の検査件数の年次推移 と全科平均剖検率の年次推移との相聞を求めた ( P e a r sonの相関係数) 4 円 qd

29.

3 . 結果 3 . 1 性差と剖検率 順天堂大学病院の入院死亡患者数・剖検数・剖検率(いずれも男女合計の値)の 1979年から 1995年 ま で の 17年 間 の 年 次 推 移 を 図 lを示す. 17年 間 の 合 計 死 亡 患 者 数 は 7, 701名 で , 男 が 4,822名 , 女 が 2, 879名で,男が女の1.7倍だった。 17年 間 の 合 計 剖 検 数 は 3, 522体 で , 男 が 2, 275体 , 女 が 1, 247体で,男が女の1.8倍だった。 17年 間 , 1981年の 60.3%を ピ ー ク に , 以 後 直 線 的 に 下 降 し , 1995 の 平 均 剖 検 率 は 45.7%で 年 に は 26.3%と最低を記録した。 1 7年 間 の 男 女 別 の 剖 検 率 の 年 次 推 移 を 図 2に示す。 両 者 と も 1980年 代 中 頃 よ り 明 瞭 と な る 同 様 の 低 下 傾 向 を 示 す が , 1 7年 間 の 平 均 剖 検 率 は , 男 が4 7.0% , 女 が 43.1%で , 男 の 方 が 約 4 %高 く , こ の 差 は 統 計 学 的 に 有 意 だ っ た (p<0.0001) 。 3.2 疾 患 分 類 と 剖 検 率 ICD‑9に 基 づ く 疾 患 分 類 で , こ の 17年 間 の 合 計 死 亡 患 者 の 93%を 占 め る 上 位 10種 類 の疾患分類別の死亡数・gJ J 検 数 ・ 剖 検 率 を 表 1に示す。 l位 の 原 発 性 悪 性 新 生 物 に よ る 死 亡 患 者 数 は 4, 417名 で 合 計 死 亡 患 者 の 57%を占め, その年次推移は, 1979年の 212名 ( 合 計 420名中)から漸増し, 1988年 に 300名 ( 合 計 501名中)に達したが,その後はやや低下し 1995年 は270名 ( 合 計 490名中)だった。 剖検数は1, 941体 で 全 剖 検 数 の 55%を 占 め た 。 そ の 剖 検 率 の 年 次 推 移 を 図 3Aに示す。 剖 検 率 は 1981年の 59.7%を ピ ー ク に , 以 後 直 線 的 に 下 降 し , 1995年 に は 24.8%に 下 降したが,その年次推移は全科平均剖検率のそれとほぼ一致し重なり合っていた。 1 7 年 間 の 平 均 剖 検 率 は 43.9%で , 全 科 平 均 剖 検 率 45.7%を 下 回 り , 当 該 項 目 を 除 く 全 科 平 均 剖 検 率 と の 差 は 有 意 だ っ た (p=O.OO1 ) 。 原 発 性 悪 性 新 生 物 は さ ら に 6種 類 に 下 位分類され,多い順に, (1)消化器・腹膜(剖検数 1, 255体) , ( 2 )呼 吸 器 ・ 胸 腔 ( 同 335 体) , ( 3 ) 泌 尿 生 殖 器 ( 同 143体) , ( 4 ) その他, ( 5 )骨・結合組織, ( 6 )口・咽頭,であった。 l位 の 消 化 器 ( 図 3B) と 2位 の 呼 吸 器 ( 図 3C) の 年 次 推 移 を 示 す 。 い ず れ も 当 該 項 目を除く全科剖検率との聞に有意差がなかった。 死 亡 患 者 数 が 524名 ( 全 体 の 6.8%) で , 原 発 性 悪 性 新 生 物 に 次 ぐ 2位 の 循 環 系 疾 患 ( 脳 血 管 疾 患 を 除 く ) は , 死 亡 数 が 1979年の 1 9名から 1995年の 41名へと倍増した。 そ の 剖 検 率 の 年 次 推 移 を 図 3Dに 示 す 。 そ の 剖 検 率 は 1979年の 79.0%か ら , 波 状 を 描 きつつ下降し, 1995年 に は 34.2%となった。しかし 1 7年 間 の 平 均 剖 検 率 は 51 .9%で 全 科 剖 検 率 よ り や や 高 く , 当 該 項 目 を 除 く 全 科 平 均 剖 検 率 と の 差 は 有 意 だ っ た (p= 0.003) 。 全 死 亡 患 者 の 5.8%を占める 3位 の リ ン パ ・ 造 血 組 織 の 悪 性 新 生 物 の 剖 検 率 の 推 移 を 図 3Eに 示 す 。 そ の 剖 検 率 は 1983年の 72.0%をピークに, 1987年 ま で は 5 0% 台を維持したが,以後急降下し, 1995年 に は 34.6%とやや持ち直した。 1 7年 間 の 平 均 2 4

30.

剖 検 率 は 49.0%で , 当 該 項 目 を 除 く 全 科 平 均 剖 検 率 と の 聞 に 有 意 差 が な か っ た 。 全 死 亡 患 者 の 5.8%を占める 4位 の 消 化 系 疾 患 ( 新 生 物 を 除 く ) の 死 亡 患 者 数 は 1979年の 32名から 1995年の 18名へと半減した。音 検 率 は や は り 波 状 を 描 き つ つ 下 降 推 移 し , [ J 1995年は 33.3%で あ っ た 。 し か し 17年 間 の 平 均 剖 検 率 は 51 .4%で , 当 該 項 目 を 除 く 全 科 平 均 剖 検 率 よ り 有 意 に 高 か っ た (p=0.014) 。 全 死 亡 患 者 の 4.0%を占める 5位 の 先 天異常の死亡数はこの 1 7年間で横這いである。その音 検 率 の 推 移 ( 図 3F) は 1992年 [ J まで 50""80%の高い水準を維持していたが, 1993年 以 降 は 30%台に下降している。 17年 間 の 平 均 剖 検 率 は 56.5%で , 全 科 平 均 剖 検 率 を か な り 上 回 っ て お り , 当 該 項 目 を 除 く 全 科 平 均 剖 検 率 よ り 有 意 に 高 か っ た (p=O.OOl) 。 全 死 亡 患 者 の 4.0%を占める 6 位の脳血管疾患の音J [検率はやはり年度ごとの変動が大きいが, 1983年の 83.3%を ピ ー 7年 間 の 平 均 剖 検 率 は 42.5%で クに,以後直線的に下降し, 1995年は 25.0%だった。 1 あ り , 上 位 10種 類 の 疾 患 分 類 別 で 最 も 低 く , 当 該 項 目 を 除 く 全 科 平 均 剖 検 率 よ り 有 意 .044) 。死亡患者数が 7位から 10 位の 4種 類 の 疾 患 分 類 ( 表 l参照) に低かった (p=O については,死亡数がより少なくなるため年度ごとの剖検率の変動がさらに大きくなる が,それらの音 検 率 の 推 移 は す べ て 全 体 の 低 下 傾 向 と 近 似 し て お り , い ず れ も 当 該 項 [ J [検率との聞に有意差がなかった。 目を除く全科平均音J 3.3 入 院 死 亡 患 者 の 死 亡 時 年 齢 ( 合 計 と 男 女 別 ) と 剖 検 の 有 無 順 天 堂 大 学 病 院 の 1979年から 1995年まで 17年 間 の 入 院 死 亡 患 者 の 死 亡 時 平 均 年 齢 を 年 度 ご と に 男 女 別 に プ ロ ッ ト し た ( 図 4) 。 こ の 間 に 入 院 死 亡 患 者 全 体 の 死 亡 時 平 均 年 齢は 53.5歳 (1979年 ) か ら 6 0.0歳 ( 1995年 ) へ と ほ ぼ 直 線 的 に 上 昇 し た 。 男 女 別 に は,男が 54.6歳 ( 1979年 ) か ら 6 2.0歳(1995年 ) へ と , 女 が 52.0歳 ( 1979年 ) か ら 59.1歳 ( 1995年)へと上昇した。 17年 間 を 通 し て の 男 の 平 均 年 齢 は 57.8歳 ( 標 準 偏 差 20.9歳 ) で , 女 の 平 均 年 齢 は 54.5歳 ( 標 準 偏 差 23.2歳 ) で , 男 の 方 が 3.3歳高く, こ の 差 は 有 意 だ っ た (p<O.OOO1 ) 。 男 女 別 の 死 亡 時 年 齢 の 回 帰 直 線 は , 男 の 回 帰 係 数 が 0.348 (p<O.OOOl) に対して女の回帰係数は 0. 498 (p<O.OOOl) で,女の方が高く, 性差は縮小する傾向を示した。 順 天 堂 大 学 病 院 の 1979年から 1995年まで 1 7年 間 の 入 院 死 亡 患 者 の 死 亡 時 平 均 年 齢 を 522名 , そ 年 度 ご と に 剖 検 の 有 無 別 に プ ロ ッ ト し た ( 図 5) 。 剖 検 有 の 死 亡 患 者 数 は 3, の 死 亡 時 平 均 年 齢 は 55.5歳(標準偏差 21 .1歳) ,普J [検 無 の 死 亡 患 者 数 は 4, 179名 , そ の 死 亡 時 平 均 年 齢 は 57.5歳 ( 標 準 偏 差 22.6歳)であり,音 検 有 の 方 が 剖 検 無 よ り 平 均 年 [ J .0歳 低 く , こ の 差 は 有 意 だ っ た (p<O.0001)。 剖 検 有 無 別 の 死 亡 時 年 齢 の 回 帰 直 齢が2 線は i剖 検 有 」 の 回 帰 係 数 が 0 .330 (p<O.OOOl) に 対 し て 「 剖 検 無 」 の 回 帰 係 数 は 0.427 (p<O.OOOl) で,音J [検無の方が高く,苦J [検 の 有 無 に よ る 死 亡 時 年 齢 差 は 拡 大 す る傾向を示した。 nノω Ru

31.

17年 間 か ら 代 表 的 な 4年を抽出し,その死亡数・剖検数・音J I検 率 の 推 移 を 年 齢 階 層 別 に 比 較 表 示 し た も の が 図 6で あ る 。 若 年 層 ( 39歳 以 下 ) の 死 亡 数 の 減 少 と 対 照 的 に 40歳以上)の死亡数の増加が認められ, 60歳以上で明瞭となった。昔J I検 率 の 高年層 ( 低下傾向は若年層で比較的軽度なのに対して高年層で顕著となっており,剖検率は 1995年の 80歳以上が最低値(17.8%) を示した。 3. 4 生検の件数と剖検率 順天堂大学病院の組織診・細胞診の検査件数と全科平均剖検率の年次推移を図 7に示 885件から 1995年の 10, 935件へと直線的に上昇し, す 。 組 織 診 の 件 数 は 1979年の 5, 17年間で1.9倍になった。細胞診の件数は 1979年の 3, 976件から 1995年の 12, 536件 へ と同じく直線的に上昇し, 17年間で 3 . 2倍になった。 組織診・細胞診の検査件数の年次推移と全科平均昔J I検 率 の 年 次 推 移 と の 聞 に 高 い 負 の 相 関 を 認 め た 。 組 織 診 と の 相 関 係 数 r=‑0.910,細胞診との相関係数 r=‑0.871 であっ た。同様に,全悪性新生物(表 l参照)による死亡患者の剖検率の年次推移との聞にも 高 い 負 の 相 聞 を 認 め た 。 組 織 診 と の 相 関 係 数 r= ‑0.866, 細 胞 診 と の 相 関 係 数 r= ‑0.812であった。 3.5 画像検査の件数と剖検率 順天堂大学病院の CT.MRIの検査件数と全科平均剖検率の年次推移を図 8に示す。 CTの件数は 1985年の 9, 952件から 1995年の 23, 033件へと直線的に上昇し, 1 1年 間 で 2.3倍になった。 1989年 か ら は MRIが加わり, CTと MRI の 合 計 件 数 は 1989年の 15, 672件から 1995年の 31, 993件へと急上昇し, 7年間で 2.0倍になった。 CTの検査件数の年次推移と全科平均剖検率のそれとの聞に高い負の相関を認めた。 相関係数 r=‑0.935であった。同様に, CTと MRIの 合 計 件 数 の 年 次 推 移 と 剖 検 率 の そ れとの聞にも高い負の相関を認めた。相関係数 r=‑0.938であった。 4 . 考察 大学病院の剖検率の低下傾向の原因を探る方策として,剖検率を低下させる可能性の ある定量的医療評価項目を列挙し, )IJ貢天堂大学病院の死亡患者を対象とし, 1979年 か ら 1995年までの 17年間を時間軸として,その推移を検討した。 4.1 性差と剖検率(図 2参照) そもそも大学病院の入院死亡患者数の性差の推移自体が剖検率の低下傾向に重大な影 響を与えているとは考え難いが,そこでの死亡患者数と剖検率の性差の推移は本邦社 会 の 性 差 の 動 態 の 一 面 と し て と ら え ら れ よ う 。 こ の 17年 間 を 通 じ て , 男 の 死 亡 患 者 数 は女の1.7倍,男の剖検数は女の1.8倍と,男が女よりも高く,音J I検 率 は 男 が 女 よ り 4 %高く,一貫して男性優位の構造が保たれていることがわかる。これと同様の性差の存 のノ臼 ρ む

32.

在 を 指 摘 し た 報 告 が 本 邦 で な さ れ て い る lN19)0 4.2 疾 患 分 類 と 剖 検 率 ( 表 1,図 3参照) 死亡患者数の疾患分類別推移が剖検率の低下にどのように影響しているか,は興味深 7年間で, ICD‑9の 分 類 体 系 い検討対象である。しかし, 1979年から 1995年 ま で の 1 (3桁 ) で 大 づ か み に 分 け て 見 る か ぎ り , 疾 患 分 類 別 の 剖 検 率 の 推 移 に 大 き な 差 は 認 め ら れ な か っ た 。 す な わ ち , 全 死 亡 患 者 の 約 6割 を 占 め る 原 発 性 悪 性 新 生 物 に よ る 入 院 死亡患者数はこの 1 7年 間 で 微 増 傾 向 に あ る が , 剖 検 率 の 推 移 自 体 は 全 入 院 死 亡 患 者 の 剖検率とほとんど差がなく(やや低いが) ( 図 3A参照) , 原 発 性 悪 性 新 生 物 中 で l位 (その約 2/3) を 占 め る 消 化 器 ・ 腹 膜 の 新 生 物 も や は り 全 入 院 死 亡 患 者 の 剖 検 率 の 推 移 参照)。 と ほ と ん ど 差 が な か っ た ( 図 3B 死亡患者数で見ると,悪性新生物が微増,循環系疾患(脳血管疾患を除く)が倍増, 消化系疾患(新生物を除く)が半減し,その他の疾患分類はほぼ横遣いであるが,剖 検率で見ると,先天異常,循環系疾患(脳血管疾患を除く)と消化系疾患(新生物を除 く)が全科平均よりやや高く,原発性悪性新生物と脳血管疾患がやや低かった。しか し,音IJ検 率 の こ の 17年 間 に わ た る 長 期 低 落 傾 向 は す べ て の 疾 患 分 類 に 共 通 し て 認 め ら れた。 028例 の 同 様 の 報 告 と し て , 猫 協 医 大 病 院 の 1974年から 1993年の 20年間の音IJ検 例 3, . 8% , 心 疾 患 が 4.5%と続き 1H) 検 討 に よ る と , 悪 性 腫 療 が 53.8%, 脳 血 管 障 害 が 5 今 回 わ れ わ れ の 集 計 で は , 原 発 性 悪 性 新 生 物 が 57.3%, 全 悪 性 新 生 物 が 65.1% , 循 環 系 疾 患 ( 脳 血 管 疾 患 を 除 く ) が 6.8%, 脳 血 管 疾 患 が 4.0%, と 微 妙 に 異 な っ て い る 。 悪 性腫虜の全剖検例に対する割合の年次推移については,われわれと同様の増加傾向を指 摘 し た 報 告 が あ る 1910 4.3 入 院 死 亡 患 者 の 死 亡 時 年 齢 と 剖 検 の 有 無 ( 図 4, 5, 6参照) 順天堂大学病院の入院死亡患者の死亡時年齢の推移を性差について検討したところ, 日本国民の平均寿命の性差の推移との相違が明らかになった。日本国民の平均寿命は, 1980年 に 男 73.35歳 , 女 78.76歳だったが, 1995年 に は 男 76.38歳 , 女 82.85歳 と な り,この 16年 間 の 伸 び は 男 が 3.03歳 , 女 が 4.09歳である 20)。 順 天 堂 大 学 病 院 の 入 院 死 亡 患 者 の 死 亡 時 年 齢 を 回 帰 直 線 か ら 読 み 取 る と , 1980年 に 男 55歳 , 女 5 1歳だが, 1995年 に は 男 60歳 , 女 58.5歳 と な り , こ の 16年 間 の 仲 び は 男 が 5歳 , 女 が 7.5歳 で あ る。)I!買天堂大学病院の入院死亡患者の死亡時年齢は国民の平均寿命と異なり男の方が高 いが,死亡時年齢の伸び率は国民の平均寿命の伸びを上回り,しかも女の伸びが男を 上回り,男女差が縮小しており, J I [買 天 堂 大 学 病 院 に お い て 入 院 死 亡 患 者 の 高 齢 化 が 着 実 に進行していることがわかる。 そこで男女差を離れて,剖検の有無別に入院死亡患者の死亡時年齢の推移を調べたと η ー ウ ノ臼

33.

ころ,剖検無の死亡患者の死亡時年齢が剖検有の患者の年齢より有意に高いだけでな く , そ の 上 昇 勾 配 に 差 が あ り , 両 者 の 差 が 拡 大 傾 向 に あ る こ と が わ か っ た (2本 の 回 帰 直 線 の 差 は 1979年 が 0. 4 歳 , 1995年が 2 . 0歳 ) 。 入 院 死 亡 患 者 の 高 齢 化 の 進 行 が 剖 検 率 の低下の原因の一端を担っていることが推測される。大学病院における死亡患者の高齢 化 と 剖 検 率 の 低 下 傾 向 を , 年 齢 階 層 に 分 け て よ り 端 的 に 図 示 し た も の が 図 6である。 80歳以上の患者の死亡数が著増し,音 検率は高齢になるほど低下する傾向が窺われる。 [ J 他方,少子化を反映して死亡数が減少している 0~9 歳の剖検率が比較的高値を維持 していることがわかる。 病院でなく米国 l地域の 1時期(1979, 1980 年)の剖検率を検討した報告によれば, 剖検率は男が女より高く,音[J 検率のピークは 20~29 歳で,加齢とともに低下するとい う 21)。順天堂大学病院の 10~39 歳の剖検率が(死亡数とともに)低く,一見谷間に見 える(図 6参照)のと対照的である。その理由は定かでない。 4.4 生 検 の 件 数 と 剖 検 率 ( 図 7参照) 順 天 堂 大 学 病 院 に お け る 17年 間 の 組 織 診 ・ 細 胞 診 の 件 数 は と も に 顕 著 な 直 線 的 な 増 加 傾 向 を 示 し て お り , そ の 増 加 率 は 組 織 診 が 約 2倍 , 細 胞 診 が 約 3倍 で あ る 。 そ し て この間の全科平均の(さらに全悪性新生物による)剖検率の低下との聞に高い負の相 聞が認められた。 高い負の相関の存在をもって即座にこの問の因果関係を肯定することはできない。わ れ わ れ と 同 様 の 検 討 は 東 海 大 学 病 院 で 1975年から 1993年 ま で な さ れ て お り , 同 様 な 結 果 が 得 ら れ て い る 22)。 異 な る 結 果 と し て , 単 科 で は あ る が 岐 阜 大 学 第 一 内 科 で 1983年 から 1995年まで同様の集計がなされ, この聞に生検の件数が 2倍弱になっているが, 同科のこの間の剖検率は常に 70%以上の驚異的高率が維持されていた則。また,手術・ 生検の施行症例の剖検率がそれらを施行しなかった症例の剖検率より高かったとして, 生検が必ずしも剖検を代替しえないとする報告もあるぺわれわれは生検を施行した死 亡 症 例 で の 剖 検 の 有 無 を 検 討 し て い な い が , 外 科 系 の 剖 検 率 が 内 科 系 よ り 約 5%低いこ とをすでに報告した 1~。 ) 4.5 画 像 検 査 の 件 数 と 剖 検 率 ( 図 8参照) 順 天 堂 大 学 病 院 の 放 射 線 部 か ら の 集 計 に よ れ ば , CTは 1985年から, MRIは 1989年 からの検討が可能だが,入院死亡患者ではこれらの検査がほとんど全員に施行されてい ると推定される。 CTは 1 1年間で 2.3倍 , MRIが 加 わ っ て か ら は CTと 合 わ せ て 7年 間 で 2 . 0倍 の 検 査 件 数 で あ る 。 そ し て こ の 間 の 全 科 平 均 剖 検 率 の 低 下 と の 聞 に 高 い 負 の 相 聞 が認められた。 CT, MRIの 件 数 の 伸 び は , こ の 間 の 単 純 X線 撮 影 の 件 数 が ほ ぼ 横 這 い な の と 対 照 的 で あ り , そ の 絶 対 数 は 生 検 の 件 数 と 比 較 し で も , そ の 約 3倍 に 当 た る 。 い か に 各 診 療 科 n4 n o

34.

が画像検査に大きく依存しているか,窺い知れる。画像 診断"といわれる所以であ る。ちなみに, I J 買天堂大学病院の年間退院患者数は, 1985年 が 1 1, 867名 , 1989年 が 13, 302名 , 1995年 が 16, 945名であった。 4.6 以 上 の ま と め と 一 般 的 な 考 察 順天堂大学病院の入院死亡患者数と剖検率の低下傾向に影響を及ぼす医療評価指標と しては,ひとつには入院死亡患者の高齢化が挙げられよう。性差と疾患分類別はあま り 影 響 を 及 ぼ し て い な い よ う だ 。 高 齢 者 の 音j '検 率 が 低 下 す る 理 由 と し て , 遺 族 の 同 意 が 得 ら れ 難 い と い う よ り は , 医 療 側 の 剖 検 依 頼 へ の 消 極 性 を 指 摘 す る 向 き が あ る 2'1。 ) 生 検 と 画 像 検 査 (CTと MR I)はその件数の急激な伸びの実態を明らかにすることが '検 率 低 下 と の 因 果 関 係 に 関 す る 考 察 は 慎 重 を 要 し , さ ら に き め 細 か な 検 できたが,音j 討 が 必 要 で あ る 。 音j ' 検率の低下傾向に警鐘を鳴らす論文は欧米に多く見られ,剖検率 を高く維持すべき理由として,古今の問に診断技術が進歩しでも,剖検によつて得ら れる悪性新生物などの診断との不一致率がさほど低下しないことが指摘されている 2 幻υ 3 札.2 幻ム 5. ι 2 へ G》 成して剖検{依衣頼時に指導医に立ち会わせるなど,いわゆる改善運動が提唱され一定期 間 内 に 一 定 の 効 果 が 得 ら れ た と い う が 1113L 恒 久 的 な 剖 検 率 向 上 効 果 を も た ら し て い な いのが世界共通の現状である。 剖検(病理解剖)とはいうまでもなく医療行為であるが,生検や手術と異なり患者の 死後に行なわれ,治療ではない。本邦では現在,診療科としての病理科が認められて おらず,音lJ検は診療報酬に算定されず,音j '検 に 対 す る 厚 生 省 か ら の 手 当 て も な い 。 時代の趨勢は易きにそして快適さに付き,大学病院(特定機能病院)といえども,経 営の合理化や独立採算がいわれて久しい。剖検が,修行者に要求されるような無償の 作業であってよいはずがない。切り捨てではなく,剖検の正当な評価による本邦医療制 度上での認知 剖検の経費の保証 が切望される。 5 . 結語 大 学 病 院 の 剖 検 率 低 下 の 原 因 を 探 る 方 策 と し て , SASシステムを用いて, J lI買天堂大 学病院の定量的医療評価指標を客観的統計学的に検討したところ, 1.入院死亡患者の高齢化の影響が示唆された。性差と疾患分類別はあまり影響を及ぼ していなかった。 2 . 生 検 と 画 像 検 査 (CTとMRI ) は そ の 件 数 の 急 激 な 伸 び の 実 態 を 明 ら か に す る こ と ができたが,剖検率低下との因果関係に関しては,さらにきめ細かな検討を必要とする。 剖 検 率 の 維 持 ・ 向 上 の た め に , 音j '検 の 本 邦 医 療 制 度 上 で の 認 知 が 切 望 さ れ る 。 ‑29‑

35.

70% 600 60 500 50 400 40 300 30 200 20 100 10 。 0 79 80 8 1 82 83 84 85 86 87 88 8 9 90 9 1 92 93 94 95年 死亡数亡二コ 剖検数圃圃圃 剖検率ーーー 図 1 順天堂大学病院の剖検率の年次推移 剖検率 7 0 0 ! o 60 50 40 30 20 10 。 1 79 80 8 1 92 93 94 95年 82 83 84 85 86 87 88 89 90 9 男の剖検率。‑ 女の剖検率均一 図2 順天堂大学病院の男女別剖検率の年次推移 剖検率 死亡・剖検数 700 司u ハU

36.

B消化器・腹膜の原発性悪性新生物 A 原発性悪性新生物 C呼吸器・胸腔の原発性悪性新生物 nununununununununu B7654321 90% 7980818283848586878889909192939495 7980818283848586878889909192939495 7980818283848586878889909192939495年 w D循環系疾患(脳血管疾患を除く) トA Eリンパ・造血組織の悪性新生物 F先天異常 90% 80 70 60 50 40 30 20 10 0 79808182838485868788899ω192939495 798081828384858687日呂 田 909192939495 7980818283848586878889909192939495年 剖検率は当該項目のもの(黒丸付き) ,全科平均剖検率(黒丸付かず)を折れ線グラフ 図3 1 ) 国天堂大学病院の疾患分類別剖検率の年次推移

37.

64歳 男の回帰直線 • 60 。 56 52 。 。。。 48 79 80 8 1 82 83 84 85 86 87 88 89 90 9 1 92 93 94 95年 女の死亡時年齢 男の死亡時年齢・ o 図4 J 晴天堂大学病院の入院死亡患者の男女別死亡時年齢の年次推移 62歳「 l ! J 検無の回帰直線 。 。 → 。 58 。。 • • 。 。。 • • • l ! J 検有の回帰直線 ー 50~十 79 80 8 1 82 83 84 85 86 87 88 89 90 9 1 92 93 94 95年 @ J検有の死亡時年齢・ @ J検無の死亡時年齢 o 図5 I J 国天堂大学病院の入院死亡患者の剖検の有無別死亡時年齢の年次推移 ︐u η つd

38.

数 60 ! l i J 検 200 数 50 150 べ 100 40 30 20 50 10 。 。 ‑9 。 10‑39 40‑59 60‑79 死亡数亡‑コ 膏l 検数・・・ 剖検率一・‑ 図6 I J 匝天堂大学病院の死亡数・剖検数・i51 J 検率の年齢階層別年次推移 ζ 10000 50 40 30 20 000 10 o 0 1 n 79 80 8 1 82 83 84 組織診ー+ー 85 86 87 88 89 90 9 1 細胞診ー+ー 92 93 94 95年 剖検率一一一 図7 1 } 匝天堂大学病院の組織診・細胞診の件数と剖検率の年次推移 検査数 A句 ︑ 60 u nu 内 率 ハ unu 自170% 検 剖検率 町 四 7' 250 nU 死 亡 nぺU nぺU

39.

剖 検 率 60% 50 36000 検 査 数 30000 40 24000 30 18000 20 12000 10 6000 。 。 85 86 87 88 CT 検査数ー+ー 89 90 9 1 92 93 CT.MRI検 査 数 ー + ー 94 95年 剖検率 図8 J 晴天堂大学病院の CT.MRIの検査件数と剖検率の年次推移 979年から 1995年までの疾患分類別剖検率 表 1 順天堂大学病院における 1 疾患分類 死亡数 剖検数 l 5 l 1 検率% P値 ( x '検定) ①原発性悪性新生物 4417 1941 4 3 . 9 0.001 ②循環系疾患(脳血管疾患を除く) 524 272 5 1 . 9 0.003* ③リンパ・造血組織の悪性新生物 447 219 4 9 . 0 0.154 ④消化系疾患(新生物を除く) 444 228 5 1. 4 0.014 ⑤先天異常 310 185 5 6 . 5 0 . 0 0 1* ⑥脳血管疾患 306 130 4 2 . 5 0.044* ⑦筋骨格系・結合組織疾患 199 94 4 7 . 2 0.667 ⑧呼吸系疾患(新生物を除く) 195 95 4 8 . 7 0.397 ⑨神経系・感覚器疾患(脳血管疾患を除く) 160 75 4 6 . 9 0.770 ⑪続発性悪性新生物 152 72 47. 4 0.683 ①+③+⑩=全悪性新生物 5016 2232 4 4 . 5 0.003 合計(その他の疾患を含む) 7701 3522 4 5 . 7 合:p<0.05 会 台 合 内 d Aせ

40.

参考文献 1) 厚 生 省 健 政 局 総 務 課 : 1 特 定 機 能 病 院 」 審 査 要 覧 . 1993. 2) 石 河 利 隆 : 日 本 に お け る 剖 検 率 の 低 下 と 胃 癌 症 例 に お け る 剖 検 の 意 義 , 癌 と 化 学 療 法 , 1 6 ( 4 ), 1920‑1924, 1989. 3) 難 波 紘 二 : 剖 検 率 と 医 療 , 医 学 の あ ゆ み , 154(9), 586‑592, 1990. 4) 矢 野 栄 二 , 緒 方 岡I J , 山 岡 和 枝 , 他 : 臨 床 研 修 病 院 の 指 定 基 準 と 音J I検,病院管理, 28(8), 253‑260, 1991 . 5) 斎 藤 建:日本内科学会認定医制度審議会による「剖検所見の内科臨床研修へのフィー 3 ( 8 ), 1169‑1170, 1995. ドパックに関する調査」について,病理と臨床, 1 6) 福 井 次 矢 , 前 川 宗 隆 , 山 本 和 利 , 他 : 内 科 臨 床 に お け る 剖 検 の 有 用 性 『 剖 検 所 見 の 内 科 臨 床 研 修 へ の フ ィ ー ド パ ッ ク に 関 す る 調 査 』 報 告 , 日 本 内 科 学 会 雑 誌 , 85 ( 1 2 ) , 2096‑2105, 1996. 7) RobertsWC:Theautopsy: I tsd eclineandasuggestionfori tarevival . N EnglJMed,299,332‑338,1978. 8) LundbergGD:TheArchiveso fPathologyandLaboratoryMedicineand theautopsy,JAMA,252(3),390‑392,1984. 9) McPheeSJ,BottlesK: Autopsy:Moribunda r to rv i t a lscience?,The AmericanJournalo fMedicine,78:107‑113,1985. 1 0 ) LandefeldCS,ChrenM M,MyersA e ta l :Diagnosticy i e l dofthe ,l N Engl J autopsyi nauniversityh o s p i t a landacommunityhospita ),1249‑1254,1988. Med,318(19 fautopsy: Mortuivivos docuerunt? ("Have 1 1 ) Boers M:Theprospects o the deadtaughtthe l i v i ng ? " ),A mJMed,86, 322‑324,1989. 1 2 ) ClaytonSA,SivakSL:Improvingtheautopsyr atea tauniversity , l A mJMed,92,423‑426,1992. hospita 1 3 )H arrisA,Ismail 1 ,D i l l y S,e ta l :Physicians'attitudestotheautopsy, Journalof RoyalCollegeo fPhysianso fLondon,27(2),116‑118,1993. 1 4 ) 今井喜正,楊 学坤,丸林葉子:大学病院の剖検率の推移に関する研究 I. 年 報 か ら の 集 計 , 病 院 管 理 , 34 ( 2 ), 191‑197, 1997. 1 5 ) 今井喜正,楊 学坤,丸林葉子:大学病院の剖検率の推移に関する研究 I I .1 ) 頁 天 堂 大 学 病 院 で の ア ン ケ ー ト 調 査 と 平 均 在 院 日 数 の 検 討 , 病 院 管 理 , 34 ( 3 ), 283‑292, 1997. 16) 楊 学坤,今井害正:大学病院の剖検率の推移に関する研究日本病院管理学会評 ‑35一

41.

議員へのアンケート調査の報告, [ I ! 買天堂医学, 44 ( 3 ) :305‑312, 1998. 1 7 ) 厚生統計協会(編) :死亡診断書・死産証明書・出生証明書の書き方疾病,傷害 および死因統計分類の概要・分類表,東京,厚生統計協会, 1 979. 1 8 )清 水 健,本間浩一,正和信英,他:濁協大学病院における病理解剖症例の検討 開 院 後 20年間, 3, 028例の解析,濁協医誌, 1 1(1): 9‑20, 1996. 1 9 )藍 揮 茂 雄 , 福 島 微:病理解剖の現状 日本病理剖検輯報データベースから ,病 理と臨床, 1 6(臨時増干I J ):7‑10, 1 998. 2 0 )厚 生 省 : 厚 生 白 書 ( 平 成 10年版) ,東京,ぎょうせい, 369, 1998. 2 1 )AhronheimJC,BernholcAS,ClarkWD:Agetrendsi nautopsyrates Strikingdeclinei nl a t e,l i f e,JAMA,250,1182‑1186,1983. 2 3 )北 井 尚 子 , 霞 堂 直 史 , 前 波 万 里 子 , 他 : 当 院 に お け る 診 療 科 別 に よ る 剖 検 率 の 比較・検討,診療録管理, 8( 1 ) , 36‑40, 1 996. 2 3 )武 藤 泰 敏 , 村 瀬 全 彦 , 森 脇 久 隆 , 他 : 剖 検 か ら み た 内 科 臨 床 岐車大学第一内科学 教室における 1 3年間の総括一,日本醤事新報, 3814:44‑53, 1997. 2 4 )SolomonSA,AdamsKHR:Attitudes ofr e l a t i v e st oautopsieso felderly patients,AgeandAgeing,22,205‑208,1993. 2 5 )GoldmanL,SaysonR,RobbinsS,e ta l :Thevalue o ftheautopsyi n three medicaleras,N EnglJMed,308,1000‑1005,1983. 2 6 )Burton EC,TroxclairDA, NewmanWPr n :Autopsydiagnoses of malignant neoplasms Howoftenare c l i n i c a ldiagnoses incorrect? 14 ),1245‑1248,1998. 2JAMA,280( b ハ qd

42.

日本 S A Sユーザー会 (SUG I‑J) 尺度の最適変換を伴う回帰分析の適用事例 0町野正博 風間友太 専修大学商学部朝野ゼミナール Ana p p l i c a t i o no fr e g r e s s i o na n a l y s i sw i t ho p t i m a ls c a l i n g MasahiroMachinoandYutaKazama Departmento fCommercialScience,SenshuU n i v e r s i t y 要旨 新製品の開発にあたり、属性プロフィールを決定する手法としてコンジョイント分析が産業界で、よく利 のデ、ザイン開発をテーマにコンジョイント分析を実施し、パート 用されている。本研究で、は若者向けの PC ワースファンクション(以下 PWFと略記する)にもとづいてマーケット・セク、メンテーションを行いターゲ、ット を絞り込んでデザイン提案を試みた。本研究はゼミにおける自主調査として行われたものであるが、本 提案のアフ。ローチは産業界の実務においても適用可能であろう。以下コン、ジョイント分析の適用事例を r a n s r e gプロシジャの関係を論じ、調査・マーケティング分野における t r a n s r e g 報告し、 ALSOSとSASの t の意義を指摘する。 キーワード: r a n s r e g 新製品開発、尺度の最適変換、コンジョイント分析、 t 1 .リサーチデザイン 研究目的 現代は情報化社会である。情報のデ、ジタル化とネットワークの高度化により、これからのパソコンはビジ ネスユースだけで、なく一般家庭にも浸透し、生活に密着した 情報家電"になると予想される。そうしたパ ソコンは、今まで、のビジネスユースとは異なる形態を持つ可能 a性がある。そこで、我々はどのようなパソコ ンが若者に選好されるのかを、形、素材、色、柄、価格の 5つの属性に焦点をあてて調査し、デザイン提 案をすることにした。 大学生を調査対象者に選んだ理由は、大学生はパソコンを使う頻度が高く、かっ今後の購入意向も高 し、と想定されるユーザー層だからである。 調査方法 調査対象:専修大学の学生 60サンプル 調査方法:コンセプトカード、を用いた面接調査(注 1 ) 調査期間:1 9 9 9年 3月 l ヴ nJ

43.

分析計画 ①コンセフ。トへの選好)IJ頁序データをコンジョイント分析して PWFを個人別に推定 ②クラスター分析を用いてマーケット・セグメンテーション ③各クラスターを類型化 ④コア・ターゲ、ツトを選定 ⑤順位づけシミュレーションから新モデ、ルを提案 コンセプト・ジェネレーション 表 1 パソコンの属性水準一覧表 属性 第1 水準 第 2水 準 第 3水 準 第 4水 準 色 青 赤 縁 e 黄色 柄 柄無し 素材 スケルトン 迷彩 大理石風 プフスチック アルミ 大理石 クリスタノレ 形 四角 丸型 ド フえもん 球型 価格 15万円 20万円 25万円 30万円 以上の属性水準の総組み合わせからフノレ・プロフィールを作成すると 1024通りになる。これを順位付 ddelman( 1 9 6 2 )の直交配列を用いて 16種類のコンセ けさせることは回答者の負担が大きすぎるので、 A プトに絞り込み、コンセプトカードを作成した O 2 .分析結果 クラスター分析 SAS/STATの transregプロ、ンジャを用いて 60人の PWFを推定した。そして PWFが類似した消 費者をグルーヒ。ンク守した。ライフスタイル・セクマメンテーションとし、う呼び方に対比すれば、我々のセグメン テーションはベネッフィット・セク守メンテーションで、あるといえよう。ウォード法のクラスター分析を用い、相 関比のスクリープロットから判断して全体を4つのクラスターにセグメン卜した。次にクラスターと消費者属 性とのクロス集計により、各クラスターを次のように類型化した。 表 2 クラスターの類型化 クフスタ 類型 概要 特徴 所属人数 ‑No 1 2 3 いわゆる普通の人たち 女性比率が他のクフスターに比べて向い。自 で、パソコン経験もそこ 由になるお金や時聞は平均的。アウトドア派、 Iを占め、今日寺の若 そこある。一般ピープノレ インテリアにこだわるが 6害J 群 (ミドル) 者の多数派のクラスターである。 3 1名 Iで、ピ 分からなし、こと 今までパソコン触った事 パソコンの非所有率も購入意向も約 8害J 一杯! ?キティ ないけど、パソコン買っ ギナーにより構成されている。これまで、パソコ ーちゃんズー ンに縁がなかったクラスターである。 てみょうかな?群 (ピギナー) パソコンの事なら何でも 男性のみのクフスター。いわゆる「オタク」で彼 エレクトリック 聞いてください。パソコ 女がいない人が多いようだ。またパソコンのへ 電脳アキパーズ ンマニアックー..貧乏男子 ピーユーザーである。(約 8害J Iがすでに所有 済み) 学生群(ヘビー) コーヒー噌好は 100% 6 名 庶民派 のほほん ノ ト 沸l ーズ 3 8 6 名

44.

寮暮らし、外国籍の学生が全てこのクラスター に入っていて、環境面で他のクラスターと一線 我が道を行く │個性的人間群(ミドル) I 異端児 I を画す。個人的なこだわりが強い。このクラス 信長 ズ I ターが 2番目に人数が多かった。 SASの f r e qプロシジャの /CHISQオプ、ンョンを用いてクラスターと消費者属性のカイ 2乗検定を行 った。その結果、クラスターと有意に関連する属性は「インドア派かアウトドア派か」、「コーヒ一派か紅茶 派」で、あることが分かった。 コア・ターゲ、ツトの選定 以上の結果から新製品のターゲ ット層を選定した。クラスター 1は、パソコンの経験率が高く市場規模も o t e n t i a l i t y が高しせ判断して新製 大きい。さらにパソコンの購入意向も高いことからこのクラスターが p ない 35百( 1 1 ない 40見 (24人) ある 65百(20 人) nU 一 一 60也 (36人) n u ぺ L 人) ある

45.

図 2 4つのクラスターの PWF 戸ヲちスター 1ロクラスター 2 固クラスター 3 ロクラスター ‑ 6 . 0 0 0 ‑ 4 . 0 0 0 ‑ 2 . 0 0 0 0 . 0 0 0 三重三 同 赤 緑 黄 柄なし スケルトン 迷彩 大理石風 プラスチック アルミ 大理石 クリスタ jレ 四角 丸 ドラえもん 球 15万 20万 25万 30万 ‑40‑ 2 . 0 0 0 4 1 4 . 0 0 0 6 . 0 0 0

46.

シミュレーション 第 1クラスターの PWFの平均値に基づいて、上位 10位までのコンセプトをランキングしたのが表 3であ る 。 表 3 パソコンの上位コンセプト 全体効用値 l位 2位 3位 4位 5位 5 { 立 7位 8位 9 { 立 10位 7 .20 7 . 19 6 .94 6 .93 6 .74 6 .74 6 .62 6.61 6 .48 6.47 色 青 青 青 青 縁 縁 青 三円 全 三 も i f R 緑 柄 スケルトン スケルトン スケルトン スケルトン スケルトン スケルトン スケルトン スケルトン スケルトン スケルトン 素材 プフスチック クリスタノレ プフスチック クリスタノレ プラスチック クリスタノレ プフスチック クリスタ/レ プフスチック クリスタ/レ 汗 三 価格(¥) 丸型 丸型 丸型 丸型 丸型 丸型 球型 球型 丸型 丸型 15万 15万 20万 20万 15万 15万 15万 15万 20万 20万 表 3における第 3位のパソコンは現行商品の imacのプロフィールに酷似している。 1、2位のコンセプト ーズ"には はこれより価格が安いだ、けで、あって、それ以外のプロフィールは類似している。従って、 小泊l lmac ライクなパソコンが好まれる傾向があることがわかった。このクラスターに属する人々は、インテリア にこだわる人が多いことから、パソコンにもデザイン性を求めてしもとしづ類推が許されよう。 そこで、 lmacに対抗する商品として、某大手トイレタリーメーカーが新製品開発のノルムとしている原則 13つ以上違いが言える新製品」を探索すると、第 8位に位置する「青、スケルトン、クリスタル、球型、 1 5 万円」としづ商品に注目される。これは色と素材に特徴があるパソコンで、あるにもかかわらず、総組み合 わせの 1024通りからすれば上位に入っている。以上の検討から我々は若者向けのパソコンとしてター ゲッ卜は ノj、淵ーズ"で、製品は「青色、スケルトン柄、クリスタル素材、球型、 15 万円」とすることを提案す るc 3 .討 論 ALSOS 本研究で用いた t r a n s r e gは、最適尺度化を伴う交互最小 2乗 法 ALSOS( a l t e r n a t i n gl e a s tsquares methodwithoptimals c a l i n g )を実行するプロ、ンジャで、あり、調査・マーケティング、の分野で、重要な意 味を持つ。何故なら、マーケティングササーチではメトリックなデータよりもノンメトリックなデータを分析す Iられ、好きな順位は順序尺度で る方が普通だからである。好きなブランドが何であるかは名義尺度で視J 測られる。「賛成 J1 や や 賛 成 J1 どちらともいえない J1 やや反対 J1 反対」のような評定尺度も順序尺度であ って判断の単位も絶対原点も測定でーきていなし、。 ALSOS はこのようなノンメトリ、ノク変数とメトリック変数 が混在しているときに、それらの変数の線形関係を分析するためにノースカロライナ大学の Youngらを 中心とするグループが提唱してきたデータ解析の思想、である。即ち尺度水準の制約に応じて最適変換 7を施した上で、モデル Fをデータに当てはめるアプローチである。ごく一般的に ALSOS を記述すれ ば、変数群 X Y lこ基づいて、 y'=F yoT y ( Y )とX'=FxoTx(X)というモデル値を構成し、両者の事 ム 唱E A U τ

47.

I ‑ x i lを最小化する。その際、党推定するフエイズとそデノレのパラメータを推定するフェイ 離 Q= Y • 2 LSと呼ばれる。 1 ) 慎序尺度によって測られたデータを名義尺度 ズを交互に反復して収束させることから A にレベノレダ ウンせずに扱える点は A LSOSの長所であるし、評定尺度をメトリックとして扱わないことによ って、アフィン変換よりも条件の緩い単調増加の変換が許容され、モデノレの適合度を高めることがで、きる。 transreg によって実行で、きる分析モデルを整理すると表 4ようになる。今回我々が用いたコンジョイント 分 析 は 、 単 調 変 換 を λイ 、 X を 表 現 す る デ ザ イ ン 行 列 を Dx、パラメータを bとすれば、 〆 =M (Y h X • =Dxbと記述できる。さらに Fを加法モデルでなく距離モデルに設定することで、 MDS の一種である PREFMAPとしウ理想点モデルも解ける。このように transregは幅広い問題に柔軟に対応 できる強力なプロシジャである。しかし、これまで前) I [( 1 9 9 7 )を除けば日本語の成書が無かったために、 ユーザーの間であまり知られていなかったと思われる。 表 4 ALSOSとtransregの対応 伝統的な分析モア、ノレ 林の数量化理論 I類 林の数量化理論 E類 コンジョイント分析 ALSOS MO九< ¥ L S ADDALS MO九< ¥ L S ( 注2 ) 分散分析 正準相関分析 主成分分析 PREFMAP ロジスアイツク回帰分析 MO九< ¥ L S CORALS PRINCIPALS proc t r a n s r e gでの modelスアートメントの記述例 linear(y)=class(xl‑x5 / zero=sum); class(group)=class(xl‑x5 / zero=sum); method=morals outest=utils; model monotone(sampl:)=class(xl‑x5/ zero=sum); linear(y)=class(xl‑x5 / zero=sum); identity(yl‑y20)=linear(xl‑x30); monotone(晶yvar)=linear(晶xvar); identity(yl‑y60)=point(xl‑x2); logit(p)=ident工 ty(xl‑x5); 今後の課題 我々の事例は、コンジョイント分析によって PWFを求めただ、けで、終わるのではなく、次の 2点に特徴があ った。 ① PWFtこもとづいてマーケット・セグ、メンテーションを行った。 ②単に効用値の高し、コンセプトを選択するのではなく、「製品差別化戦略」の視点から、競合品と差別化 で、きるコンセプトの中で、消費者の受容性の高し、コンセプトを探索した。 しかし、①のターゲ、ットの選択論拠、②の探索法のいずれも、方法論が定式化されておらず恋意性を残 している。このヒューリスティック技法の確立は今後の研究課題と言える。 さらに調査研究の進め方については次の問題も指摘できる。 ③今回の調査対象者は規模も範囲も限定的で、あった。より大規模で広範にわたる調査を行えば、また 異なる知見が導かれた可能性がある。 ④今回取り上げた 5つの属性とその水準が、パソコンの新製品のデザイン決定に最も適切なもので、あっ たかは根拠にとぼしい。コンジョイント分析に先立ち、分析属性と水準を設定するための調査を先行す べきであることは従来から指摘されていることである。 4 2一

48.

注 1:本調査の実施分析は発表者 2名の他、専修大学朝野ゼ、ミナールの橋本貴文、吉津一人、柿沼博 幸、岩田高明、和田耕治、中田敏志、林陽子、杉浦瞳、原因太ーによって行われた。 :コンジョイント分析について指定法を記述する。 注2 proc transreg data=a method=morals outest=utils;によって 60人のサンプル別に PWF を 推定しデータとして保存する。 model monotone(sampl:)=class(xl‑x5 / zero=sum); ここで S四 pl:はデータセット内の接頭 辞s amplで、始まる全ての変数を示す。( )内に sampll‑sampl60 と書いても同じである。 xl‑x5 は順に 形、素材、色、柄、価格の 5つの属性を示す o zero=sumは PWFを平均偏差化するとし、う指定である。 参考文献 Addelman, S . ( 1 9 6 2 )Orthogonalm a i n ‑ e f f e c tp l a n sf o rasymmetricalf a c t o r i a le x p e r i m e n t s . T e c h n o m e t r i c s , 4 ,2 1・4 6 . J . D .andGreen, P .E .( 1 9 9 5 ) Psychometric Methodsi nMarketingResearch:Part1 , C a r r o l l, C o n j o i n tAna l y s i s .J ournalof MarketingR e s e a r c h, 32, 3 8 5・391 . deLeeuw, J ., Young, F汎 T .a ndTakane, Y . ( 1 9 7 6 )A d d i t i v es t r u c t u r ei nq u a l i t a t i v ed a t a : Ana l t e r n a t i n gl e a s tsquaresmethodwitho p t i m a ls c a l i n gf e a t u r e s . Psychometrika,41, 47 1 ‑ 5 0 3 . Green, P .E . , Helsen, K .andShandler , B . ( 1 9 8 8 )C o n j o i n ti n t e r n a lv a l i d i t yundera l t e r n a t i v e ournalofConsumerResearch,15, No.3,392・3 9 7 . p r o f i l ep r e s e n t a t i o n .J .andS rinivasan, V .( 1 9 9 0 )C o n j o i n ta n a l y s i si nmarketing:Newdevelopments Green, P .E o u r n a lof A ゐr k e t i n g ,54,October , 3 ‑ withi m p l i c a t i o n sf o rr e s e a r c handp r a c t i c e .J 1 9 . Kruskal, J . B . ( 1 9 6 5 )Analysiso f f a c t o r i a lexperimentsbye s t i m a t i n gmonotone o u r n a loft h eRoyalS t at i s t i c a lS o c i e収 B,27, t r a n s f o r m a t i o n so ft h ed a t a .J 2 5 1 ‑ 2 6 3 . J . H .( 1 9 9 6 )SegmentationandP o s i t i o n i n gf o rS t r a t e g i cA ぬr k e t i n gD e c i s i o n s . Myers, AmericanMarketingA s s o c i a t i o n . r 巴a u l 抗 t , W .D P巴r : a n a l y s i so fno立m metr 匂 d atai n mark 巴t i n gr 巴s 巴a r c h .J ournalofMarketingResearch, 1 7, 1 ‑ 1 3 W i t t i n k, D.R .andCattin, P . ( 1 9 8 9 )Commercialu s eo fc o n j o i n ta n a l y s i s :Anu p d a t e . ︒ ︒4 Journalof Marketing ,5 3, 9 1・9 6 .

49.

Young, F . 朝野照彦(仕1 開 98 1 υ )最近の最適尺度法 ALSOS. マ一ケテインググ~~ .勺リサ一チヤ一, No.22 , 43・5 0 . 朝野県彦 ( 1 9 9 2 )新商品のコンセプトづくり.魅力工学研究フォーラム編「魅力工学」 海文堂出版, 99 ・ 1 3 4 . 朝野照彦( 1 9 9 6 )i 入 門 多 変 量 解 析 の 実 際J 講談社 朝野照彦 ( 1 9 9 7 )C o n j o i n t分析における価格処理の問題.消費者行動研究 Vo I .4, No.2,27・ 41 . 樋口正美,轡田正郷,小植知克 ( 1 9 9 7 )コンジョイント分析を活用した商品企画・開発. 日 本 品 質 管 理 学 会 第 27回年次大会, 27 ・ 3 0 . 片平秀貴(l9 9 1 ) i新しい消費者分析 ‑LOGMAPの理論と応用」東京大学出版会 前川異一 ( 1 9 9 7 )iSASによる多変量データの解析」東京大学出版会 SAST e c h n i c a lReportR‑109J( 1 9 9 6 )コンジョイント分析例題集 .SAS出版局 上田隆穂(19 9 9 )i マ ー ケ テ イ ン グ 価 格 戦 略J 有斐閣 4 4

50.

論文発表 医薬品開発

51.

日本 SASユーザー会 (SUGI‑J) [EXSAS](生物実験データ統計解析システム) V e r s i o n5 . 0 0の紹介 0山本典子事 常吉華奈ホ 浜田知久馬 H '有限会社アームシステム企画部 寧東京大学医学部薬剤疫学教室 [EXSAS]Version5 . 0 0f o rS t a t i s t i c a lA n a l y s i sUsingtheSASSystem N o r i k oYamamoto KanaTs u n e y o s h i SystemP l a n n i n gD i v i s i o n .ArmC o r p o r a t i o n ChikumaHamada Un i v e r s i t yo fTokyo 要旨 生物実験データ統計解析(非臨床試験統計解析)システム [EXSAS]が 5回目のバージョンアップ を迎える。最初のリリースアップから [EXSAS]システムは、多くの統計手法や表などの追加がなさ れ、その短期間における発展は、当システムの開発コンセプトのひとつである「統計手法の追加・修 正などメンテナンスが容易なシステム設計」の効果を示すのものである。システムの成長の経過をま とめるとともに、 Steel検定、 Steel‑Dwass検定、 S h i r l e y ‑ W i l l i a m s検定などが新しく追加される [EXSA S]V e r s i o n5 . 0 0 の機能を紹介する。また、当システムの薬理試験現場等への普及にともない、ます ます高まるバリデーションに関する要望や出力様式への要望への対応について述べる。 キーワード:非臨床試験、 Excel、SeparateRanking多重比較、癌原性試験、例数設計、無作為化割付 Aq ー ワ

52.

1 .開発の経緯と [EXSAS]の概要 非臨床試験に携わる研究者が、簡単に SASシステムによる統計解析を実施できることを目的に [EX SAS]の開発はスタートした。エンドユーザー側の立場から考えると、標準的な表計算ソフトウェアである I M i c r o s o f tE x c el J(以下、 EXCE L)にデータを入力するだけで、 SASでの解析を実施でき、その結果を 柔軟な処理が可能なEXCELの表形式で出力できるシステムは、理想的なシステム形態であり、 [EXSA S ]はそれを実現している。さらに [EXSAS]の特長は、見栄えの良い表形式の出力のために、 EXCEL のテンプレートをあらかじめ用意する必要が無く、罫線生成や書式設定などの煩わしい処理をすべて自 動的に処理できることである c よって、研究者は、容易に報告書などに転用できる表を EXCEL上に作成 でき、作成された表は W indows上で「コピー」や「貼り付け」などで手軽に利用できるため、仕事の効率を 上げるばかりでなく、解析結果などの転記操作(手入力、中間テキストファイルを経由した手動読み込み 等)による人的エラーを回避し、また、転記チェックの膨大な労力を削減することが可能で、ある。 2 .[EXSAS]のシステム改善と手法の追加 ノくージョンアッフ。を含むこれまで、の [EXSAS]システムの成長は、第一に統計手法の追加、第二に出 力様式の追加が挙げられる。ここで、 [EXSAS]の開発コンセプトのひとつである「統計手法の追加・修 正などのメンテナンスが容易なシステム設計」が効果を上げている。統計手法の追加は、 [EXSAS]パー ジョンアッフ。毎の新手法 ([EXSAS]Version5 . 0 0メニュー構成は次々ページを参照)とユーザー定義の ツリー型アルゴ.リズ ムや特殊な統計手法等がある。出力様式に関しては、ツリー型アルゴリズムの詳細出 力{保存用資料}と要約出力{報告書への添付用資料}、また、生データ・解析結果一覧表{保存用資料} と解析結果表{報告書への添付用資料)とし、うように用途別に様々な形態を追加してきた。これらの追加 シートに、使用したデータシート名を同 以外の [EXSAS]の改善点は、解析結果が出力される EXCEL 時出力する機能があげられるが、この機能は入力データと出力結果の整合性を保証するのに大きな役 害リをはたしている。 また、今回のバージョンアップ。で、いくつかの統計手法と機能が追加されるので、次章で紹介する。 3 .[ E X S A S ] V e r s i o n5 . 0 0の追加統計手法と機能 [EXSAS]V e r s i o n5 . 0 0の追加統計手法・機能は、ノンパラ型 ( S e p a r a t eR a n k i n gなど)多重比較、癌 原性試験などの統計手法と、試験を適切にデザインするための Dunn巴t t検定などの例数設計、見逃しの 。エラー算出および無作為化割り付けなどである。 ‑48

53.

1 .ノンパラ型 ( S e p a r a t eR a n k i n gなど)多重比較 2 .癌原性試験 (Peto検定) 3 .例数設計、見逃しの βエラー算出 4 .無作為化割り付け 3 .1 . ノンパラ型 (SeparateRankingなど)多重比較 ノンパラ型 ( S e p a r a t eR a n k i n gなど)多重比較として、 S t e e l検定、 S t e e l ‑ D w a s s検定、白川町 W i l l i a m s検 定 、 Holm( D u n n e t t型)の方法、 Holm(Tukey型)の方法が追加される。 Holmの方法はステップ。ダ ウン型 のB o n f e r r o n i法である。これまでの [EXSAS]で実施される J o i n tR a n k i n g型のノンパラ型多重比較に加 えS e p a r a t e tR a n k i n g型の多重比較が実施可能となる c S e p a r a t eR a n k i n g型の多重比較に関する詳細は、 本論文集(浜田・山本 r S e p a r a t e ‑ r a n k i n g型ノンパラ多重比較 J )で述べている。 3.2. 癌原性試験 (p巴t o検定) 毒性試験では欠かせない癌原性試験の解析が追加される。多臓器にわたり、腫療の有無を確認する 癌原性試験データに対応するため [EXSAS]では、最大 250項目を一括処理することができる。統計手 法としては、 F i s h e r検定と P巴t o検定を実施する。 P e t o検定については群問比較と用量相関性の評価が 可能である。 3.3. 例数設計、見逃しの βエラー算出 検定、 Dunnett検定、 Tukey検定について、実験に必要な 生物実験データの解析によく使用される t 1群例数の算出と、任意の例数における第二種の過誤(日)を算出することができる。実験を組む際に、 統計的な観点から適切な例数を決定することで、実験資源の効率的な利用が可能になる c 3.4. 無作為化割り付け 比較試験の実験では、比較する群聞において未知あるいは既知の背景因子の分布が均質になるよう に割り付ける必要がある。 [EXSAS]では、完全無作為化割り付け(すべての要因に関係なく各群に無 作為に割り付ける)と層別割り付け(ある 1要因で層別して局所的なバランスがとれるように割り付ける)を 実施することができる。 4 9

54.

。 [EXSAS]V e r s i o n5 . 0 0メニュー構成。 1ラメトリック 仇ntRa 凶出1 9 ) ノンパラメトリック ( J ツリー型アルゴリズム パラメトリッウの場合、一元配置分散分析 解析データの表示 p a r a t eRan k i n gなど)多重比較 ノンパラ型(Se S t e e l検定、 S t e e l ‑ D w a s s検定、 S h i r l e y λ V 必j a m s検定、 Holm( D u n n e t t型)の方法、 Holm( T 也e y型)の方法 INSIGH 単測定型 │群間比較 データ要約 用量反応関係 ツリー型アルゴリ 用量反応関係 W i l l i a m sの多重比較 TypeO e n t o n~) TypeM(M TypeH( 浜田型) ED5 0とその信頼区間 ヨンキー検定 最大対比法 (MCM) 解析データの表示 INSIGHT接続 群閲比較 データ要約 用量反応関係 ツリー型アルゴリズム 経時測定型 解析データの表示 2群の解析 用量反応関係 Williamsの多重比較 ED5 0とその信頼区間 ヨンキー検定 重量大対比法 (MCM) 分類データ 順序データ カテゴリ型 分類データ 頗序データ クラスカルーワリス検定 ノンパラ愛多重比較 用量反応関係 多元配置型 癌原性試験 コクラン.アーミテージ検定 Williamsの多重比較 LD50とその信頼区間 ヨンキー検定 二元配置分散分析 三元配置分散分析 ラテン方格法 生物学的同等性試験型 生存時閥解析型 i 解析データの表示 生物学的同等性試験 生存時間解析 カプランーマイヤ一法 ログ・ランク検定 クロスオーバー分散分析 信頼区間出力 信頼区間法による例数設定 試験デザイン │癌原性試験 ( P e ω 検定など) 例数設計、見逃しの βエラー算出 ( t検定、 Dunnett検定、 Tukey検定) 無作為化割り付け 完全無作為化割付、層別割付 Fhu ハU

55.

4 .バリデーションについて [EXSAS]システムの普及に伴い、バリデーションテストに関する記録の重要性がますます高まってい るc これまで ノ〈リデーションテストとしては、システムの稼動テスト、画面に入力された値の解析フ。ロク、、ラム へのヲ│き渡しテスト、解析結果出力値の SASのn atlveフ。ロク、、ラムの出力結果との確認、テストなどを実施 してきたc 現在、出力される値の確認などの基本的なテスト結果の報告書作成は完了し、申請などパリデ? ーション報告書を必要とするユーザーには既に提供を始めている。当然ながらノ〈ージョンアッフ。毎に再 テスト再確認が発生するが、 [EXSAS]のバージョンアップ。とほぼ同時に報告書の提供準備の体制も整 ってきたc また、今後は、広い範囲への普及に伴い、様々なイレギュラーデータ対応のためのバリデーシ ヨン報告書の充実を計る。 5 .幅票の作成 解析結果のみならず生データの出力が必要で、あったり、要約出力に加え、解析処理の様々な統計量 の出力が必要で、あったり、出力の形態には様々な様式が想定される。これまでは、ひとつの統計手法に 対して一つないし 2~3 の出力様式が準備されているが、その他はカスタマイズ、対応で、あった。今後、薬 理試験や毒性試験でそのまま利用できるような出力様式を [EXSAS]の標準装備として追加する。 6 .最後に [EXSAS]は、ユーザーからの声や要望を基に成長をつづ、けてきた。今後も、エンド、ユーザの期待に 応えるべく改善やバージョンアップ。を進めてして。 (参考文献) 1 9 9 7 ):SA S上での統計解析アプリケーションの開発 山本典子、浜田知久馬( [EXSAS] の ・2 36 開発を例にとって一第 16回日本 SASユーザー会総会および、研究発表会論文集、 227 Ea 唱E に u

56.

日本 S A Sユーザー会 (SUG I‑J) がん原性試験の統計解析システム 平野勝也・田崎武信 塩野義製薬株式会社解析センター S t a t i s t i c a lA n a l y s i sSystemf o rC a r c i n o g e n i c i t yStudies K a t s u n a r iH i r a n o,TakenobuT a s a k i h i o n o g i&C O ., LTD. B i o m e t r i cA n a l y s i sD e p t .,S 要旨 がん原性試験で得られる腫虜発見データおよび生存時間データに基づいて催腫虜性を評価 するために我々が立案した統計解析フローを紹介する.そして,このフローに沿った一連の解 析を行うために開発した SASマクロ,そこで必要となる SASデータセット l こついて説明する. キーワード: P e t oe ta しの方法.D i n s ea n dL a g a k o sのロジスティック回帰法, SASマクロ, MULTTESTプロシジャ 1 .催腫揚性を評価するための統計解析フロー がん原性試験の統計解析のために,社内の仲間とともに, SARB‑CDER‑FDA(1995)の製薬企業向 けのガイダンス(ドラフト), P e t oe ta . l( 1 9 8 0 )による WHO勧告,大橋・菅野 ( 1 9 9 0 ),吉村・大橋 ( 1 9 9 2 ), 1 9 9 2 )などを検討した上で,がん原性試験で得られる腫虜発見データおよび生存 中上・森川監訳 ( 時間データに関する統計解析フローを立案した.そのフローは図 1の通りであり,これは浦狩・平野 ( 1 9 9 9 )が日本計量生物学会・応用統計学会 1 9 9 9年度合同年次大会で提示したものと本質的に同じ である.浦狩・平野 ( 1 9 9 9 )では,そのフローの開発経緯,とくに腫蕩発見データの解析法として P e t o e ta . l( 1 9 8 0 )の方法と D i n s ea n dL a g a < lo s ( 1 9 8 3 )のロジスティック回帰法を基本としたことの理由を報告 した.具体的には,腫虜発生の死亡による機会損失を考慮しない解析では催腫蕩性の評価を誤る 危険性があること,そのため P e t oe ta . l( 1 9 8 0 )の方法を選択したこと,しかし,その方法には試験期間 の分割の仕方により解析結果が異なるという欠点のあること,そのため D i n s ea n dL a g a k o s ( 1 9 8 3 )のロ ジスティック回帰法を追加した、と,などを報告した.参考のために,がん原性試験の特徴を付録に KU nJ

57.

要約した. 腫痕発見データ │①観測可能な状況で観測された鵬. I ②すべてが致死的状況で観測された腫項目 │③すべてが偶発的状況で観測された醐目 正のトレンドの検定 P e t oe ta lの 腫 揚 存 在 率 法 / D i n s e ‑ L a g a k o sのロジスティック回帰法 同量死的状況と偶発的状況の両方で観測された醐 偶発的状況で観測された腫蕩 E 致死的状況で観測された腫蕩 用量毎の生存関数 1e i e r 推定値のプロット K a p l a n ‑¥ P e t oe tal.の死亡率法 による統計量 P e t oe ta l .の掴蕩存在率法 による統計量 統計量の結合と有意性の評価 P c t oe ta l .の腫痕存在率法 による統計量 PClOc ta l .の死亡率法 による統計量 統計量の結合と有意性の評価 ( D u n n ‑ S i d a k調整) 生存時間データ(予備または補足解析) │③死亡率の解析 I ⑤生存時間解析 E 対比較検定 対比較検定 Freeman‑Haltonの直接確率計算法 ( D u n n ‑ S i d a k調整) ログランク検定/一般化W i l c o x o n検 定 ( D u n n ‑ S i d a k調整) 図1.腫虜発見データおよび生存時間デ「ータに関する統計解析フロー 本報告では,がん原性試験で得られる腫虜発見データおよび生存時間データの解析を,このフ ローに沿って実施するための SASマクロ,それらのマクロを使用する際に必要な SASデータセット i こ 54

58.

ついて説明する.最後に,それらのマクロの利用法と利用上の注意点を述べる. 2 .開発した SASマ クロ 6つの統計解析フローを実施するために,我々は 12個のマクロを用意した.このうち 4個のマクロは, 各フローを起動させるためのマクロ (FLOWl,FROW234,FLOW5,FLOW6)であり,個々の統計解 析手法を実行するマクロを呼び出し解析結果を出力する.これら4個の起動マクロの構造を表 1 1こ示 す.例えば,マクロ FLOWl は,雌雄別に観測された全種類の腫虜に対して,腫虜発生率曲線の Kaplan‑Meierプロットを作成し,用量に伴う正のトレンドを評価するための Tarone( 1975)のトレンド検 定を行い,無処置対照群との対比較をログ、ランク検定と一般化 Wilcoxon検定で行う. 表1. 6 つの統計解析フローを起動させるためのマクロ F L O W 1 :①観測可能な状況で観測された腫蕩の解析 F L O W 2 3 4 : 加 oSEX=male ,female; ②すべてが致死的状況で観測された腹揚の解析 ③すべてが偶発的状況で、観測された腫蕩の解析 加 oTUMOR =1%to腫蕩の個数; 気KMPLOT( ) ; , 気TARONE( ) ; ④致死的状況と偶発的状況の両方で観測された腫蕩 気LOGWIL( ) ; 加 oSEX=male ,female; の解析 加 oTUMOR =1先t os 重蕩の個数; 九 e n d ; 九 e n d ; 気i f(観測状況=致死的)先 t h e n加。; 気KMPLOT( ) ; F L O W 5 :⑤死亡率の解析 気PETO( ) ; 九 end; 気i f(観測状況=偶発的)先 then刷。; 気DINSE( ) ; 九 doSEXニ male ,f e m a l e ; 九 CATEST( ) ; 気FHTEST( ) ; 九 end ; 九 end; 気PETO( ) ; 気1f(観測状況=両方)先 then蜘 0 ; F L O W 6 :⑥生存時間解析 加 oSEX=male ,female; 気KMPLOT( ) ; 気KMPLOT( ) ; 気PETO( ) ; 九 e n d ; 九 e n d ; 九 e n d ; , 気TARONE( ) ; 気LOGWIL( ) ; 九 end ; 表2 .個々の統計解析手法を実施するマクロの一覧 名称 │ 内容 ADHOCRUN I Adhocr u n訟による試験期間の分割 │使用しているプロシジャ PRINT, SORT PETO ICochran‑Armitageのトレンド検定 I MULTTEST I D i n s巴 andL a g a k o s ( 1 9 8 3 )のロジスティック回帰法 I LOGISTIC I F r 巴e man一H a l t o nの直接確率計算 I FREQ, PRINT IKaplan‑Me陥プロット IGPLOT, LIFETEST I ログランク検定と一般化 W i l c o x o n検定 I LIFETEST, PRINT I P巴t oe ta . i(1980)の方法 I MULTTEST, PRINT TARONE T a r o n e ( !リ7 6 )のトレンド検定 CATEST DINSE FHTEST KMPLOT LOGWIL MULTTEST 残り 8個はフロー内の個々の統計解析手法を実施するマクロである.それらのマクロの一覧(名称, ‑55一

59.

内容,利用しているプロシジャ)を表2に示す.ただし,マクロ ADHOCRUNは表 1と表2の他のいずれ のマクロからも呼び出されていない.この理由については4節で述べる. 3 .必要な SASデータセット 上記マクロを使用して腫虜発見デ、ータおよび生存時間データを解析するためには, 3つの SASデー タセット(基本データセット,生存中に観測した腫壌に関するデータセット,剖検時に観測した腫虜に 関するデータセット)を準備しなければならない r 基本データセット J (こは全動物のデータを入力しな ければならないが, r 剖検時に観測した腫虜に関するデータセット」および「生存中に観測した腫蕩 S‑Excel で入 に関するデータセット」には観測した腫虜のデータだけを入力すればよい.我々は, M 力されたデータを病理研究者から入手し,それらを SASデータセットに変換して解析することにして いる.SASデータセットへの変換では,各項目を所定の名称,フォーマットで、変換しなければならな 1こデータセットの構造, SASデータセットに変換する際の変数名とフォーマット,入力 い.表 3から表 5 例を示す.また,病理研究者との聞でとり決めた入力規則を表 6 (こ示す. 表3 .基本データセット .生存中に観測した腫蕩に関するデータセット 表4 動物 I D I D 文字 l 3 器官コ}ド KlKAN 文字 0 0 7 0 0 3 0 0 7 所見コード SCODE 文字 KCB KCD KCB 臆壌の観測日 DAYO YYMMDDl O . 1 9 9 9 / 0 1 / 0 5 1 9 9 9 / 0 2 / 1 0 1 9 9 9 / 0 1 / 2 2 表5 .剖検時に観測した腫虜に関するデータセット Fhu ハ O

60.

表6 .入力規則 口動物 I Dには,各動物が特定できるような一意な値を入力する. 口雌雄には,雄 i こ[ m a l e J,雌 l こ[ f e m a l e Jを入力する. ロ薬剤l には,無処置対照群を含めス 3種以下の薬剤名を入力する. ロ用量には,各薬剤l の実際の投与量を数値で入力する.無処置対照群には [ o Jを入力する. ロ死亡のタイプには,腫蕩による死亡に [ 1 J,非腫蕩性の死亡に白J ,事故死に [ 3 J,最終屠殺に [ 4 J,中間 屠殺に[司を入力する. 口器官コードには,腫蕩を観測した器官のコードを入力する. 口所見コードには,観測した腫蕩の所見のコードを入力する. ロ腫蕩の観測状況には,偶発的状況で観測されたとき [ I J,致死的状況で観測されたとき [ 2 Jを入力する. 4 .マクロの利用法と利用上の注意点 本節では, 4個の起動マクロ (FLOW1,FLOW234,FLOW5,FLOW6)の利用法を説明する.便宜的 に , 3節で、紹介した基本データセット,生存中に観測した腫壌に関するデータセット,剖検時に観測 i h o n,s e i z o n,b o u k e nと し 、 う SASデータセットに変換され した腫壌に関するデータセットがそれぞれ k c o n t r ol),試験薬 ( n e w ̲ d r u g )の3用 量 群 ( 1 0, 3 0, 9 0 ),陽性対照 ているものとする.また,無処置対照群 ( 群( o l d ̲ d r u g )からなる 5群の試験を想定する. 以下では,無処置対照群と試験薬の 3用量群を対象とした,用量に伴う正のトレンドの評価およ び無処置対照群と試験薬の各用量群との対比較を行うためのマクロの利用法を説明する.最後の s u b ]を指定することにより,無処置対照群と陽性対照群の 2群を比較することも可能である. 引数に [ 4 . 1 マクロ (FLOW1,FLOW5,FLOW6)の利用法 , SAS データセットの名称,無処置対照群と陽性対照群(陽性 マクロ (FLOW1,FLOW5,FLOW6)は こは[.])の名称,正のトレンドを評価するための用量係数(実用量または用量の 対照群がない場合 l T u k e ye ta , . l1 9 8 5 ) )を指定するだけで呼び出すことができる.例えば,次 メタメータあるいはキャリア ( e x a c t ]としづ指定は, T a r o n e ( 1 9 7 5 )のトレンド のように指定するだけで呼び出すことができる.ここに, [ e x a c t ] 検定の p値を正確法でL計算させるための指定で、あり、正規近似法で、 pf直を計算する場合には [ 以外,例えば [ n o r m al]を指定すれはよい. 百F L O W l(k i h o n,s e i z o n,c o n t r o l,o l d ̲ d r u g,01 03 09 0,e x a c t,m a i n ) 先F L O W 5 (k i h o n,c o n t r o l,o l d ̲ d r u g,01 03 09 0,m a i n )・ 先F L O W 6 (k i h o n,c o n t r o l,ο I d ̲ d r u g,01 03 09 0,e x a c t .m a i n ) 4 .2 マクロ FLOW234の利用法と利用上の注意点 P e t oe ta . l( 1 9 8 0 )の腫蕩存在率快を利用するためには、試験期間をしてつかの区間に分割する必要 I 法 A[0‑50,5 1‑80,8 1 がある. SARB‑CDER‑DA(1995)では, 2年間の試験の分割法として,分害J I 法B [0‑52,53‑78,79‑92,9 3一1 0 4,中間屠殺, 1 0 4,中間屠殺,最終屠殺], NTPで提案された分害J 最終屠殺], P e t oe ta l . ( l9 8 0 )の Ad 油 cr u n 法の利用,の 3通りの方法が記載されている.マクロ 5 7一

61.

FLOW234ではいずれの分割法も利用できるが,マクロを指定する前に DATAステップにおいて試 験期間を分割する変数を基本データセットに作成しておく必要がある.例えば,分割法 A を用いる 場合には次のように行う. d a t ak i h o n 1 ;s e tk i h o n; day=DAYE‑DAYS ; i f( d a y< =50*7+6) t h e nblock= 1 ; i f (day> =51*7andday < =80*7+6 ) t h e nblock=2 ; =81*7andday<ニ 104*7+6) t h e nblock=3 ; i f (day> i f (t y p e=5 ) t h e nblock=4 ; i f (t y p e= 4 ) t h e nb l o c k= 5 ; 気FLOW234(k i h o n 1,b o u k e n,c o n t r o l,o l d ̲ d r u g,b l∞k,0 1 03 090,e x a c t,m a i n ) このように,マクロ FLOW234には試験期間を自動的に分割して後続の解析を実行する機能を含め ていない.その理由は, Adhocrun法を指定して Petoe ta l . ( l9 8 0 )の方法を行っても,結果的には試 験期間は分割されず全試験期間をただ一つの区間とした Petoe ta . l( 1 9 8 0 )の腫蕩存在率法(実際に は,生存時間を考慮していない Cochran‑Armitage検定)が行われる可能性がある,またデータを見 ずに試験期間を分割することにより,評価を誤る危険性があるためである.極端な仮想、事例であるが, 表 7のようなときに評価を誤る可能性がある.試験期間を分割しない場合, Freeman一Halton の直接 確率計算法のp値は 0.0122であるが, Petoe ta . l( 1 9 8 0 )の腫虜存在率法(正確法)の p値は 0. 4022と なる. 表7 .極端な仮想、事例 区間 無処置対照群 試験薬投与群 1 。 2 3 50 3 30 合計 3 50 1 3 50 腫蕩存在例 。 剖検例 腫蕩存在例 剖検例 1 0 20 5 .結びに代えて 浦狩・平野 ( 1 9 9 9 )に対する討論で,九州大学の柳 J 1 桑先生より「最終時点の体重と 1 重傷発生率に は正の相聞があるとの報告を聞いているが,体重を考慮した解析は行わないのか」との質問を頂い た.体重の影響を考慮して催腫傷性を評価するためには,体重を共変量とする Dinseand Lagakos ( 1983)のロジスティック回帰法を利用することが考えられるが.そのことの妥当性および現システムへ の組み込みは十分に検討できていない. 種のげっ歯類を用いた長期がん原性試験を実施すること 医薬品毒性試験法ガイドラインでは, 2 とされていたが、 ICHガイダンス「医薬品のがん原性試験を検出するための試験に関するガイダン ス」において, 1種のげっ歯類を用いた長期発がん試験と 1種の短期代替発がん試験(トランスジェ ニックマウス,新生児,二段階発がんそデ、ル)の提出により,発がん性は評価可能であると変更され た.これにより,今後は短期試験で得られる腫蕩発見データも解析することになるであろうが,紹介し 58‑

62.

たマクロがそれらの試験データの解析にそのまま利用で、きるか否かについては疑問である.短期が ん原性試験の統計解析の検討も,今後の課題としたい. 引用文献 D i n s e, D . E .andL a g a k o s, S . W . ( 1 9 8 3 ) .R e g r e s s i o na n a l y s i so ftumourp r e v a l e n c ed a t a .J o u r n a lo f R o y a lS t a t i s t i c a lS o c i e t y, C,3 2,2 3 6 ‑ 2 4 8 . P e t o, R .,P i k e, M.C . , Day, N . E .,Gray, R . G .,Lee, P . N .,P a r i s h, S .,P e t o, J . , R i c h a r d s, S .and , J .( 1 9 8 0 ) .G u i d e l i n c sf o rs i m p l e,s e n s i t i v es i g n i f i c a n c et e s t sf o rc a r c i n o g e n i c Wahrendorf 一t e r mands h o r t ‑ t e r ms c r e e n i n g e f f e c t si nl o n g ‑ t e r ma n i m a le x p e r i m e n t s .Annext o: L o n g a s s a y sf o rc a r c i n o g e n s:ac r i t i c a la p p r a i s a ] .I n t e r n a t i o n a lAgencyf o rR e s e a r c ho nCancer Monographs,S u p p l e m e n t, 之3 1 1 ‑ 4 2 6 . i v i s i o no fB i o m e t r i c s,Centerf o rDrug S t a t i s t i c a lA p p l i c a t i o nandR e s e a r c hBranch(SARB),D d m i n i s t r a t i o n ( F D A ) ( 1 9 9 5 ) .Ons t a t i s t i c a l E v a l u a t i o nandResearch(CDER),FoodandDrugA n a l y s i s,andi n t e r p r e t a t i o no fa n i m a lc a r c i n o g e n i c i t ys t u d i e s ( G u i d a n c ef o r a s p e c t so fd e s i g n,a I n d u s t r γ :D r a f t ) . . E . ( 1 9 7 5 ) .T e s tf o rt r e n di nl i f et a b l ea n a l y s i s .B i o m e t r i k a,62,6 7 9 ‑ 6 8 2 . Tarone,R Tukey, j. W .,C i m i n e r a, j . L .andHeves, ]. F . ( 1 9 8 5 ) .T e s t i n gt h es t a t i sl Ic a lc e r t a i n t yo far e s p o n s et o i n c r e a s i n gd o s e so fad r し6 .B i o m e t r i c s,4 1,295‑301 . 大橋靖雄・菅野純(19 9 0 ) .癌原性試験データ解析の現状と問題.毒性試験のための生物統計シ 4 ‑ 8 3 . ンポジウム予稿集, 5 j 甫狩保貝j l・平野勝也(19 9 9 ) .がん原性試験における統計解析法の検討.日本計量生物学会・応用 5 ‑ 6 0 . 統計学会 1999年度合同年次大会予稿集, 5 中上節夫・森川敏彦監訳(19 9 2 ) .医薬統計学:医薬品開発のための統計学.サイエンティスト社. 1 9 9 2 ).毒性試験データの統計解析.地人書館. 吉村功・大橋靖雄 ( L パベ υ V\~ Y ( ~ ~h : y"'へん@sIいい c y a 〔c j y 付録 がん原性試験の目的は,被験物質 0 )動物で、の催腫虜性を検索することにより,ヒトでの発がんリスク を予知することにある.統計的には,被験物質の用量の増加に伴う腫蕩発生率の増大の有無,より 明確には用量上の正の線形トレンド(以下,正のトレンドと略す)の有無を調べることである.試験の i d d l e,Highの3用量)に媒体 基本的な群構成は,被験物質の数個の用量群(多くの場合に, Low,M . J Iの 対照の 1群を加えたものである.必要に応じて,陽性対照群あるいは無処置対照群を加えたり, l 媒体対照群をおくこともある.対象動物はラットあるいはマウスであり,雌雄別に l群あたり 50匹以上 の動物が供試される.試験期間は実験動物のほぼ全生涯に相当する約 2年間であり,この間薬物が 反復暴露され,腫壌の発生状況が観察される.腫療は発生した器官と組織系とで特定され,被験物 υ ﹁町 円凶U

63.

質に依存するが, 1 試験で数十種類以上の腫虜が観測される場合もある. 腫蕩の発生は,動物の生存中に確認、できる場合もあれば,死亡後あるいは屠殺後の剖検でしか 確認できない場合もある.したがって,観測された腫蕩には発生時点のわかる腫虜もあれば,わから c o n t e x to fo b s e r v a t i o n ) Jの相違として扱われる.実際,一般観 ない腫擦もある.これらは「観測状況 ( 察によって発見される皮膚癌,あるいは触診によって発見される乳腺癌で、は,発生時点がわかる.こ o b s e r v a b l ec o n t e x t )で、観測されるもので、あり,発生率を直接解析 のような腫虜は,観測可能な状況 ( することになる.一方,死亡後または屠殺後の剖検時に初めて観測される腫蕩の発生時点は明らか でない.けれども,剖検時に初めて観測される腫虜は致死的状況 ( f a t a lc o n t e x t )か,偶発的状況 i (n c i d e n t a lc o n t e x t )のいずれかで、観測される致死的状況とは,当該の腫虜がその動物の死亡に (直接的あるいは間接的に)関係していたことを指し,偶発的状況とは,当該の腫擦がその動物の死 亡に(直接的にも間接的にも)関係していなかったことを指す.そして,致死的状況で観測される腫虜 では,腫蕩発生により死亡するまでの時間に関心をおき,時間上の死亡率曲線を解析することにな る他方,偶発的状況で観測される腫虜では,屠殺時にその腫擦が存在していただけであり,存在 率曲線を解析することになる.供試された多数の動物についてみると,同種類の腫療が,ある動物 では致死的状況で観測され,別のある動物では偶発的状況で観測されることも起こり得る.したがっ て,一つのがん原性試験で、発生した多数の腫虜のそれぞ、れについてみると,観測状況によって各 腫蕩は4通り(観測可能な状況で観測された腫虜,すべてが致死的状況で観測された腫蕩,すべて が偶発的状況で観測された腫虜,致死的状況と偶発的状況の両方で観測された腫蕩)に分類でき る. nb n u

64.

日本 S A Sユーザー会 (SUG I‑J) Correction Log Form管理田作成システム 0板東説也事 安藤永一事 r Collag θJ 阿 部 真 佐 子 " 石井政徳事事 '有限会社電助システムズ電脳事業部 車率ヘキスト・マリオン ルセル株式会社生物統計・データマネジメント部 E C o J J a g θ ,」 C o r r e c t i o nLogF o r r nManagementSystem r E ts u y a8andoh ネ E i i c h iAndoh事 MasakoAbe' ネ M a s a n o r iI s h i i事 事DENSUKESYSTEMSC o . . L t d . 事 HoechstM a r i o nR o u s s e lL t d . 要旨 医薬品の臨床試験における症例報告書の修正および変更履歴の管理を行うための方法 のひとつで、ある CorreciotnLog Formを作成・管理するシステムを SASシステムにより開発 した z このシステムは、データチェックフ。ログ、ラムの登録、登録されたプログラムの実行により得 られたクエリーのデータベース化、マニュアノレチェッククエリーの入力、 CLFの発行、 CLFの 状況管理等を行うことができる。 キーワード: データマネージメント、 CLF、SAS/AFソフトウエア 1 . はじめに 医薬品の臨床試験において医師より提出される症例報告書 (CRF)の質を確保するために、 最近では 1試験あたり数百ともいわれるチェックが必要となってきている c これに対応するために、症例報告書のデータをデータベース化して可能な限りコンピュータ によるチェックを行い、治験責任医師または治験分担医師への問合せ(クエリー)をより効率的 に行う努力が図られてきたc また、いわゆる新GCPでは、 CRFの変更履歴を文書により記録することが求められており、 データ修正および変更履歴の記録を効率的に行うための方法のーっとして、 CRFその ものには修正を加えずに、前述のクエリーと CRFの変更履歴の記録の機能を一体化した Correction Log Form(CLF)を用いて修正を行う方法が考え出されるよう l こなったc 今回われわれは、この CLFの作成および管理を行うためのシステム r CollageJ(コラージ ュ)をSASシステムにより開発したので、その概要について報告する c p o

65.

2 . 業務の流れにおける Collageの位置付け Collageは臨床試験データのチェックそのものを行うためのシステムで、はなく、データマネー ジメント担当者が作成したチェックフ。ログ、ラムを実行することにより得られたチェック結果(不正 あるいは疑義事項等に対するクエリー)をデータベース化し、必要に応じて CLFとして出力し たり、出力した CLFを用いて行われた担当医師への問い合わせの状況等を管理するための システムである c Collageによってチェックフ。ログ、ラムを実行すると、症例および項目単位のクエリーが生成さ れ 、 Collageのデータベースに蓄積されるレデータマネージメント担当者は、蓄積された個々 のクエリーごとに必要な対応(ステータス:表 1)を判断して入力する《担当医師への確認が必 要なクエリーについてはシステムから CLFを印刷し、これに対する回答(修正内容、理由等)を 担当医師に記入してもらい、実際のデータ修正等を行う c 対応が完了したクエリーについては、 データマネージメント担当者がそのステータスとして「完了」を入力し、再度確認が必要な場合 には上記の処理を繰り返すように「再発行」を入力する c このようにして、蓄積されているすべ てのクエリーに対する対応が完了するまで、これらの作業を繰り返す(図 1 )。 Collageで、は、チェックフ。ロク、、ラム実行の度に、全例、全項目を対象にしてチェックを行う。こ れにより、チェック時点で、の問題点が必ず検出されるので、例えば、担当医師からの回答や修 正が完了していない場合や、本来修正すべきではない項目を誤って修正してしまっているよう な場合にも、これらを発見することができる しかしながら、この方法では、担当医師に対して G 問い合わせ中でデータがまだ修正されていないような、再度検出される必要のない項目まで もが、チェックフ。ログFラム実行の度{こ繰り返し検出されてしまうとしづ問題がある c これを解決す るために、システムが自動的に「間合中」と判断し、データベースには蓄積されないようにしたc したがって、 Collageを使用することにより、必要なデータ修正を過不足なく適切に行うことが でき、さらに、クエリーが蓄積されているデータベースを参照することによりデータ修正の状況 を把握することもできる c 表 1C o l l a g eにおけるクエリーのステータス 処理内容 スナータス を発行する 行 担当医師に問い合わせの必要があり CLF 発 発 行 不 要 担当医師に問い合わせの必要がなく CLF を発行しない 問 .にコ6. 中 担当医師に対して問い合わせ中である 了 問い合わせおよびそれに対する処理が完了している : n ; 再 発 f I 担当医師に再度問い合わせの必要があり CLFを再発行する { ハhu nL

66.

図 1 Collage!こよる作業の流れ CollageSystemProgram f o rA d m i n i s t r a t o r I Micr 岬 C o l l a g eDatabase Excel97 CollageSystemProgram f o rDMusers SASd a t a s巴t SASd a t a s e t SASd a t a s e t SASd a t a s e t 図 2 Collageのシステム構成 U 内︿ nb

67.

3 . Collageの概要 1)システムの構成および機能 システムフ。ログ ラムはすべて SAS 、ンステム ( R 6 .1 2 )のみにより開発したε また、 CLFを始め P i c r o s o f tE x c e 1 9 7を使用した。 とする各種様式の印刷については、 M 当初は SCL のみによる開発を計画したが、ブρロトタイプのテスト時点で、処理対象となるデ および通常 ータ量によっては想定したパフォーマンスが得られないことが判明したため、 SCL のデータステッフ。フ。ログ子ラムの両方を組み合わせて開発したc SASシステムによって開発を行ったのは、データチェックそのものを SASフロログ ラムにより行 うためであるc また、t=~刷機能に関して Microsoft E x c e lを使用したのは、 DDEおよび OLE 等を介して SAS システムとの親和性が高いことと、可変長等複雑な帳票レイアウトにも容易に 対応できるカ=らであるこ C o l l a g eは、システム管理者が使用するための管理者用サブシステムとデータマネージメン つのモジューノレ、および、 SAS データ ト担当者が使用するための担当者用サブ、システムの 2 )c これら 2つのモジュー セットのみで、構成される専用のデータベースより構成されている(図 2 ルはそれぞれ次のような機能をもっC (1)管理者用サブシステムの主な機能(図 3) ①プロジェクトおよびスタデ、ィ管理 管理等の作業を C o l l a g eの管理下で、行うために、その対象となる デ、ータチェックや CLF 開発品目(プロジェクト)およびその試験(スタデ、イ)を登録する c ②ユーザ管理 C o l l a g eを使用するユーザを登録するーセキュリティの向上のため、登録は試験単位で行 い、その試験についてはここで、登録されたユーザしか本システムによる作業を行えないよ うにした二 ③稼動環境管理 使用するサーバやディレクトリ、プリンタを試験ごとに登録する。 ④作業記録等参照 C o l l a g e で、は、ユーザが行った各種作業の記録やチェックプログラム実行時のログ、を保存 している。これらの作業証跡は、随時、参照ならびに印刷することができる c この時、必要 な個所のみを検索して抽出することも可能である。 dAT b ハ

68.
[beta]
国と之主

冨スタディ出量

且問者出

品生ユーザ剖

."Jプリノタ重良

思ヲー,塩崎

!

見ステタス害賠

口 臨 時 チ エ ク ク ヲ2 タ ラ 峨

目テエフ問ク明白ク開

日マニュアルフェリー入:
r
.
開

I~~何回開同
IC."7

己竺-ch 'd M旦竺~

図 3‑1 システム管理者用メインメニュー

.
c
‑・
r.~;..,,",

!:~;)I.~\

,
;
,
<
,
<g

~.:-.l<",-

ア
て
で1底翠置璽留置冨

~

f
言弓宍E

置箇 箇 幽 . 圃 薗 盟 国 薗 園 田 園 園 田 園 田 園 園 田 園 園 田 園 圃 瞳
三ニ主主主乙ニ与三ニーと
ヨ
ヨ 、

J
i

̲
i
!
i
l
l
j

1

J

.
.
i
!
.
l
副
J

! 町、.,..~'F買代→,;;.- ..こ?川~ ~ー
斗
I
E訳出自竺.:"./匁
出,'‑"句

J

C
;
.
'
),U
:
;
f
. .i~"

"
':;.吋'

A 民J

J

.
O
J

一,立̲j

一」笠!!̲̲j一一一一一」

図 3‑2スタディ登録

d".~A'",.-.'O'.~

一一一一

~~-."':!_'l-:1 官品一

こ主主互士三二二ニエ豆二三E二二三三二三三三三二
p守す一一一一‑
r
τ
.
.
.
.
τ
7
一一一一一三亘L!!出

t

行E":"ëi~--一一一­

f
せ宮古巧T一
一
…
一
一

~一一一一一-rτ7てててナ一一一一一三豆J ..M主」

i~一一一一 fτ云ご一一一一一旦j 止j

L
一一一一一一一一一一一

三J

図 33ユーザ管理

6
5

一一 '07

I

69.

(2)担当者用サブシステムの主な機能(図 4) ①チェックフ。ログラム登録 担当者が作成したチェックプログ、ラムを登録するこ ②チェックフ。ログラム実行 ①で、登録されたチェックフ。ログラムを実行し、得られたチェック結果(クエリー)が新規であ るかを自動的に判断し、新規のクエリーのみを専用のデータベースに蓄積する c なお、実 行時のログはすべて保存される C プログラムにエラーがある場合には、実行時にそのエラ ーを自動的に検出して、その時点で処理を中止し、データベースに誤った情報が蓄積さ れることを回避する ③マニュアルクエリー入力 ブ。ログ?ラムによるチェックで、はかえって非効率になってしまうようなクエリーを直接手入力 する c ここで、入力されたクエリーは、これ以後、チェックフ。ログ、ラム実行により生成されたク エリーと同様に蓄積・管理される。 ④ステータス変更 データベースに蓄積されているクエリーについて、クエリーごとに必要な対応(ステータ ス:表 1)を入力する c ⑤報告書印刷 ④で「発行」および「再発行」が入力されたクエリーを CLFとして印刷する この際、ステー F タスはシステムにより自動的に「間合中」に変更される内また、クエリーごとに、その発行回 数(問い合わせ回数)がシステムにより自動的に計数され、保存される ⑤作業記録等保存・参照 前述のように、 Collageで、は、ユーザが行った各種作業の記録(作業実施日時、作業者 名、作業内容)やチェックフ ロクーラム実行時のロク、を保存している G システム管理者用サブ e システムの場合には、すべての試験についての作業証跡を参照、印刷することができる Iす が、ここでは、ユーザ本人が担当している試験についてのみの作業証跡を参照、印昂J ることができる。 nb nb

70.
[beta]
←一一一一一

止

~_!l_

チェックプログラム手当ヲ

チエフクヲロクラム'"ま

Q

。
司

マニュアルクエりーλ:
J
J

ステータス変吏

。~

&

は
ヂ

1
Iき雲差問劃

作開耳悼嫡

…
J

ム買切照

b
s
さ7

i

己
竺
士
主
主
旦
竺

R;>un.1 i

図4‑1 担当者用メインメニュー

一一一一一一一一
湾当乙一

九

.
.

J一 郎

歯菌幽画面画面樋幽画面通歯固園面画

,
‑
;
:
,
:
"
;

1

月有志高T

! 三三重こ互に士宮官室聖二三革支'"二ヨて
L二工二竺声高""す茶E壱r‑1

「
一
一
一
一

一
一
一

←

←一一一ザ
一
一斗
.
ー
を
f

̲mj

一一一一一一

一一一一一一一一←一一~..OJ

主主i
三巴芝生J ~1R'::'71-::Il'J-3三j

一一三I.̲̲j

』
ー ←

̲
̲
A
宣
車
2
l
l
J

図 4‑2マニュアルクエリー入力

一 一 一 一E

f
f
f
i
‑
‑
討議♂ム;若手4
!
?
之三主主J
J
:
し

│引さ叫出;:,;弘
,
.

fi「[主主..L_~以九三二 mH 弓手
r

i

~"_ ,
̲ '
"‑
‑
'
"
口
金
~哩rー「雪一一
月三千乎戸ニ」議元警玩τ 芹!.J!到三喜一:~

ロ望含宇

'
lJ
t
r
i
<
"
A
!
1
1

迂毛処理:

;│訪山、

F::"r

i
r
二
j
二
旦

戸
主
.
e
.
.
.
.
̲i
長弱者是ずでτん !
!
!
Jr'~ g;i.~

詰1酔 師 郡 明 町
一一一一一一

3

靭・
: .'::ff_~ 哩じ特-

、;.';t'

! 明 日 叫2
]

一
一

i
語
12'

;j~

t~

1~:: :
̲
J~tH ~

二二一三士二ニI

川

一一二!壁一J̲
̲
̲
̲
i
!
I
̲
̲
ー
」

図 4‑3クエリーステータス変更

67

71.
[beta]
一
、

一一一一
v

h

じ
二
一

市石 Cl
'
ln M
L'1D1¥石E芯η

図 44報告書 (
CLF)印刷

一 一 … 一 一 一
……一一~~._"._.~<ー"

て存期待一

一 一 一 一 一 ー 夜 揖f 一 一 一 一 一 一 一 l

一一一青葉関誌一一一

f立志写τ!7τ1= ク:c---------l~

f e>-æ-官ττ古ïl テヱソヲフ口クラ l~""lt

一一一一寸

~一一一一

l

~一一一一一一一

i

Ic ~~号 sú弔 J 九二, .
.
j~..__04~.lτco

I
チェックづ日夕ラ ι実何

O
'
I‑
;
es
t'
i
相 Vを 雪 お

f3:右主一一一ー一一一一

~可Zτ言'FfCすフワト

「主主Zすτす主~ I
ニ
フ

~.J

ノ

住宅;
;
'
o
!
'
!
:
'
!
'司 E

宅史含; ::!'_~i話

一一一一一一一」ー盟主翠i̲]

じ二三亙二コ

一
̲
̲
̲
̲
̲
̲
!
!
I
̲
ー
」
図 45作業記録参照

一一一一一一一~"

.込労ゆq
智世暴明,,‑ ‑
こ ρ 三二一戸一一

.
‑‑

蘭
"o;.

一二一字 三l 宿 直d二二

;
‑
‑ .
̲
‑

晒
'
'
'
'
'
'

" ・ ¥t, Q . J 8 O ) ・ I !
:
'
9
‑
a
‑0
凶 0・
50
データセシト帽K じ制は?お才プザべ-~ヨノ
"支型でこヨ
TA沢 民 者 普 代 t!1039秒を使用しました

・
データセシト割1)::<.10(加 は'"オプザペ‑/ヨ./

間T
(
.

3
8

¥tr<
l
(
)
l
{
Y
}

闘 1
:
W
附T
E ûAT.~ s
t
a
t
",褐", (lOO
晒秒を使用レました

"・ \tr~

~宝3視です

ノヨノ

"支i
lです

泊l
' データセント需領 <9
司
L(JllZn :1"ヲザベーンヨノ

33交政で

0
0
1
' データセ γ ト眠浪托fUP.'ユ'"才プザべ

,.

削T
E 0A1Ast
抗 ̲nt(1022紗を使用しました

・弘,,<mJ

向 。 花 田TAstat̲
川(;1: 07杓を使用しました
附T E.,;iI札叩E' レぺル~を柊了します

,
'
.

H
O
IE
. ~I ぽL∞日レヘ:)1. 1) を続行します
.
1
1
nc'OVHQElω"
。
針:;10,."時々ASTOKSAS
附l
' 制>U
l
庇《レベ
フ?イル O 州促.0守略柑訓El01~"64~CIく"
" 械 ) E1
0
1V
S
l
‑
め
さ lCHH6
抱必ずO<S
AS です

.
,v

"
・
・
<
l J
制・・ハソプーンヨノ
,
.
.
・
・
隠・・チエシク伝票の出内弓データセシト(主自の作成
・・~!~'J・テスト建

。
.
.
.
・
J
.
.
.
4

(
'
u
l
" デーヲセット追加

・

日 " 健 闘1
"φçN~te to
l".
u
l
,
.
. (Iet
副
"叫
保 闘1
0 ç~r 印
お・
凧おむ 1
0 ç~.3' 叫
~I

~.-

・

r
u
l
'
!
!山 n ItyptO")
l
嘘
l
O
tl= 主ルール 10

民
:
1
&1='1
附
J
.
, ‑J
J
.
,
l
D
'
̲
. . ‑1
‑
.
噌
T

一~ー」ー」盟笠_j

一~ー」

図 46チェックプログラム実行ログ、参照

nb

o
o

72.

2 )システムの稼動環境 C o l l a g eは、複数のクライアントおよびファイルサーバ(いずれも WindowsNT4.0) で 構成されるネットワーク上で稼動する(図 5 )。 三笠 当竺 図5C o l l a g eの稼動環境 4 .考察 1 2 .業務の流れにおける C o l l日geの位置付け」の項でも述べたが、チェックプログラムを実 行する都度、全例、全項目を対象にするとし、う方法は、その時点での問題点が必ず検出され るため、データの修正漏れや誤修正を発見することができるとし、うメリットがあるこしヵ、し一方で は、すでに把握されている問題点が繰り返し検出されてしまうとし、うデ、メリットもあるじこの時、新 たに医師への確認が必要であるクエリーと既に問い合わせ中であるクエリーの判別を入手に より行うと、症例数やチェック対象項目が多い場合には、その作業はかなり膨大かつ煩雑なも のになり、それに伴ってチェック漏れ等の誤りも多くなることが考えられる また、チェックプロク、、 Q ラムの実行により問い合わせ事項が的確に検出されても、それを入手により別紙に転記する (例えば、ワードプロセッサーを使用して CLFを作成する等)と、その聞に転記ミス等が入り込 む恐れがある。 今回、このような部分をコンピュータにより処理させることで、少しでも人為的な誤りをなくし、 臨床試験データの修正作業の質を向上させることができたと考えるごただし、 C o l l日geで、使用 されるチェックフ。ログ、ラム自体は人が作成することを前提としているため、肝心な部分に誤りが 入り込む余地が残ってしまう c C o l l日geで1 土、このような誤りが致命的な結果にまで至らないよう にするための安全弁として、例えば前述のように、チェックプログラム実行時のエラーをシステ ‑69

73.

ム的に監視してユーザに注意を促す等の処理を組み込んで、いる。しかし、どのような処理を行 っても人為的な誤りをコンピュータによって完全に排除することは不可能で、あろうつしたがって、 Collageを最大限に活用するためには、あるレベル以上のチェックフ。ログ、ラムを作成で、きる技 量をもった SASフ。ログ、ラマが必要になる C 昨今、「データチェックはコンピュータを使用するが、データマネージメント担当者がプログラ ムを作成することなく、例えば簡単なマウス操作のみで、すべてのデータチェックを行いたい としづ話題を耳にする機会が多い c 確かに、どのような試験でも共通に必要 (あるいは行える)J とされるような定型的なチェックはこのような方法で、行うことがで、きるで、あろう。しかし、臨床試験 データのチェックの場合にはフ。ロトコールご、とにチェック項目が異なることが多く、すべてのチ ェックをコンヒ。ュータにより誤りなく行なおうとするので、あれば、現状では、やはりどうしても何ら かの形でプログラムを作成することが必要になるのではないだろうか。場合によっては、マウス で、クリックしていくよりもプログラムを書いてしまった方が早いカもしれないこあるいは、コンビュ ータを使用するよりも人が目で、チェックしてしまった方が効率が良い場合もあるで、あろうニ Collageで1土、上記のような観点をシステムの仕様に反映させることによって、より現実に即 した、ンステムになったと考える C 70‑

74.

日本 SASユーザー会 (SUGI‑J) C l i n t r i a l のデータを SASで利用する方法の紹介 0藤 田 和 也 笠 原 智 子 日本イーライリリ一株式会社 リリーリサーチラボラトリーズジャパン臨床開発部臨床統計室 U↑i l i z a↑ionofSASs y s↑e mf o rC l i r 汁r i a lda↑G KazuyaF u j i↑ oandTomokoKasahara l i n i c a lDevelopmen , ↑L il l yResearchLabora↑o r i e sJapan Medical針。行副 cs,C 要旨 C l i n t r i a l で入力されたデータを SAS で利用するための方法を紹介する。紹介する方法は、 SAS/AF ソフトウェアで、プログラムを自動生成し、 SAS/SHARE ソフトウェアで、データを管理するも のである。 キーワード: SAS/SHAREソフトウエア.SAS/AFソフトウエア.C l i n t r i a l はじめに 我々は現在 C l i n t r i a l4 .1]にて臨床試験データの管理をしているが、解析等の作業をするためにはそ l i n t r i a lには SASデータに出力する機能があるが、 のデータを SASで利用可能にしなければならない。 C 我々の現状では C l i n t r i a lの l 日バージョン ( 3 . 3 J )用に SAS/AFソフトウェアにて作成していたツールを、 C l i n t r i a l4 .1])用に対応させるほうが良し立判断した c このツールは、 C l i n t r i a l で管理され 新バージョン ( ているデータ構造の情報(メタデータ)を利用して、 SAS データビ、ユーを作成する SAS プログラムを 自動生成するものである。 また、この機会に SAS/SHAREソフトウェアを導入してこの SASデータビューを管理することにした。 ワ t 1i

75.

2 システムの概要 今回紹介する内容は、 l)SAS/AFソフトウェアで作成したアプリケーション、 2)SAS/SHAREソフトウェアでの SASデータピューなどの管理、 である。 C l i n t r i a lと SASの関係を図 lに示す。 l CRF J C l i n ↑r i a l4 . 1JC l i e n ↑ SAS/ShareServer • • • • •••• •• View 図1.システム構成 C l i n↑r i a l 4 . 1 JC l i e n↑ ワ 臼 ワ t

76.

2 . 1 SAS/AFソフトウェアで作成したアプリケーション C l i n t r i a lでは、臨床試験データを保管する構造定義情報(メタデータ)として、 O r a c l eT a b l eに関す r a c l eT a b l eを る内容と、それに対応する SAS名を管理している。そこで、その情報を取り出し O SASデータピューとして参照可能にする SASプログラムを作成するアプリケーションを作成した。 このアプリケーションの作成手順を以下に示す。 • Oracle上での表領域およびユーザーの作成 本アプリケーション用の表領域および管理用のユーザーアカウントを作成した。このアカウン li n t r i a l のメタデータが保管されているテーブルの参照権限を与え、その内容をリー トに、 C r a c l eViewを作成した。この V i e wは SASプログラムを作成するに必 ドオンリーで参照する O 要な情報を効率良く参照できるように構成されている。 ・ メタデータ用 SASデータビューの作成 r a c l eViewを参照する SASデータビューを作成した 0 前述の O ・ SASマクロの作成 メタデータから SASプログラムを作成するマクロを作成した。この SASプログラムは臨床試 耳会データの SASフォーマットおよび SASデータビ、ユーを作成する。 ・ ユーザーインターフェースの作成 SAS/AFソフトウェアにてユーザーインターフェースを作成した。我々は現在、複数の C li n t r i a lサ A S ーバー(開発用、本番用、教育用)を使用している。これらのサーバー名などの環境情報を S データセットとして管理し、 C li n t r i a l サーバーを選択して必要な作業が行えるようにした。 また、本アプリケーションを使用した作業記録(ログ)を S A Sデータセットとして管理するよ うにした。 c 本アプリケーションを使用して行う処理は以下のようになる(図 2参照 ) ① S A S / S 出阻ソフトウェアで管理されているライブラリーからアプリケーションが保存されてい るライブラリーを割り当てる。 ②アプリケーションで対象となる C li n t r i a l サーバーを選択し、該当するメタデータを SASデ ータピ、ユーとして参照可能にする。 ③ メ タ デ ー タ か ら SASプログラムを作成する。(この時、作業記録が履歴として保存される。) A S / S 見ぼE ソフトウェアで管理されているライブラ ④ 作 成 さ れ た SAS プログラムを実行して、 S リーに該当臨床試験データの SASデータビ ユーを作成する。 A S / S出阻ソフトウェアを利用して該当臨床試験データの SAS データビュー ⑤解析者などが、 S を参照して必要な作業を行う。 nJ ηi

77.

Oracle (本番用 Server) C l i n t r i a l4 . 1jS e r v e r用表領域 CT4↑oSAS用 E i 」 i 1 4 表領域 臨床試験 データ 構 View EE ibrary SAS/ShareServerL 用 問 問 ・ ‑発 w e iEM ⑤ View 己:J Program ③ SASClien↑ 図2 .アプリケーションフロー t 4ワ

78.

以下に、いくつかの実際の画面を示す。 起動(メインメニュー) lClintriaJtoSASTools 自 国 国i i J 弱均 c h的i a 1‑S A SM a n匂e m e n tS y s t e m F SelectCT4唱‑8erver ServerDescñption~ ] 1 JESVR叩 CT41 EDUCATION CT41 DEVELOP iConnection strin~: I CT41 PRODUCT i Description: 1 *1Iffl i Server管理 I I LOG 表示 Vi側 作 成 I ForT la t 作成 i 終了 C l i n t r i a lServer 情 報 管 理 画 面 鶴田岡│ E c l i tServerEnviroment 13科尉…~~~þ?,i(…立与i z、三日逗:主主;ミ三 iペ 九 SERVER JESVR09 JESVR09 t C STRING CT41 PRODUCT CT41 EDUCATION C T 4 1 DEVELOP 一 SVR DESC 二i PROD ORCL DEV l 本番用 教育用 開発用 i i ゴ ヱj Description SERVER :Clintrial Server Na~e. C̲STRING :Connection String(SQL*Net V2). =I SVR SID :Oracle SID Na回e. 而lrial Server Description. SVR̲DESC : CIi 田e . SAS SVR :SAS/SHARE Server na . SAS PORT :SAS/SHARE TCP/IP Port na田e SAS̲LIB :SAS/SHARE Library na聞e . ‑ 1 己 三 一 にU ηI

79.
[beta]
LOG    

Create Date1
SQL
*NetV2 Connection stringI
Clintrial Protocol na圃e



MNMN

nunu



AHAA
nHnk
RUDU
AAAA
PL'L



1999‑05‑20 CT41 PRODUCT

E E
︐d
︐E︐d

1999‑05‑20 CT41 PRODUCT

一一
nunununu
1111
1
111
nyPEPEny
‑‑一一

d
一一
一一


E
1d

lL 
E 
E
E ﹁E 
PLn3nun3nu
AADUnDDUnD

1999‑05‑20 C
T
4
1 PRODUCT
1999‑05‑20 CT41 PRODUCT
1999‑05‑20 C
T
4
1 PRODUCT







議‑


g
 "?~~さ
i三二ju九 Iも庁、 13J、 ?毛号、

I>
震
る

FORMA
VIEW
GRANT
VIEW
GRANT

ヱ
「

SASデータピ、ユ一作成画面

G
J
:
Q
i
l
l
1

「五一一m'l示雨戸一

議持~ Create SAS ViewProgram

l
竺空

本番用

JESVR09
CT41 PRODUCT

護翠霊翠璽翠護霊襲

。

警
護
霊

En'
f
Ironment
│Protocol: 11
MEDIKA̲CL
lNIGAL

TRESOLVEREF

iL
ibna鵬 ・ i仁二二コ

1~I:ml;.,.剖・ m(If,1_ーーーーーーーーーーーーーーーーーーー

MEDIKA THESAURUS
:
B
9
E THES JART
B9E THES MEDIS
B9E THES MHWDRUG
B9E JE PllD
B9E JE Pl1D LABRANG

~、 J 、.<:;.. ~1.

告トぽ

CT4Table

r
.UPDATE

rDATA
r ALL

f 〆1

ワt

no

80.

SASフォーマット作成画面 扇面臨1 -はs:a.~説 Prograrn 言 語時議襲撃轟轟轟轟轟轟轟騒 三CTRESOLVEREF MEDIKA CLINICAL MEDIKA THESAURUS B9E THES JART Iii:l ::l園町1畳剖・ ~1 :l ln."一一一一一一一一一一一一一一一一一一一一一 B9E THES MHWDRUG B9E JE P11D B9E JE P11D LABRANG • Selected Protoco Ii ALL 三 持 lProtocol: I 何 百 THESI oEDIS 4f§ し 三L ' L 主主ー 2 . 2 SAS/SHAREソフトウェアでの SASデータビューなどの管理 SAS/SHAREソフトウェアを利用して管理しているサーバーライブ ラリーは 1 . SAS/AFソフトウェアなどで、作成したアプリケーション 2 . コンノぐイノレしたマクロ 3 .C l i n t r i a lで管理されている臨床試験データ (SASデータビューおよび SASフォーマット) などである。 現在、開発用と本番用の 2つの SAS サーバを起動している。開発用は主にプログラマーに公開さ れており、 プログラムやマクロの作成を行う。ここでテストされ動作確認されたものが、本番用に 移され解析者等に公開される。 2 . 3作成上の工夫点 今回 C l i n t r i a lの旧バージョン ( 3 . 3 . ) )用に SAS/AFソフトウェアにて作成していたツーノレを、新ノ〈ージョン ( C l i n t r i a l4 .1])用にバージョンアップしたO 旧バージョンと新ノ〈ージョンの大きな違いは、フ。ラットホーム ( 3 . 3 Jは UNIX、4 . 1Jは WindowsNT)およびメタデータを保存する OracleTableの構造である。 旧バージョンにおいてメタデータを Oracle Viewで参照するようにしていたので、メタデータの違いによ る影響を SAS に与えなかった。このため、マクロおよび SAS/AF ソフトウェアで、作成したアプリケーショ ンを新たなプラットホームで、再コンパイルするだ、けで、済んだ。 ‑77

81.

3 終わりに 今回 C l i n t r i a l のデータを SASデータビューとして利用する方法を紹介した。これは C l i n t r i a l3 . 3 J を効率良く使用するために作成し、 C l i n t r i a l4 .1]用にバージョンアップ。した以下のツールの一つで、あ る 。 • MS‑Accessを使用したツーノレ C l i n t r i a lのメタデータ保管用のテーブルと同様のテーブ、ルを MS‑Access上で作成し、これに入力 することにより仕様書を作成する。この仕様書は日本語および英語で出力可能である。また、 C l i n t r i a l にて実際に仕様書に基づいて作成した内容が仕様と一致しているかどうか比較する機能 を持つ。 • SASを使用したツール 実際に使用した印象は、 1 )データ利用プログラムの作成工程に要する時聞が大幅に短縮された。 2)SASデータビ、ユーを使用することにより入力開始から終了まで SASで容易にアクセスすることが可 能になった。 3)SAS/SHAREソフトウェアを使用することにより、各クライアント PCに O r a c l eを設定することが不要 になり、管理(セキュリティー等)が容易になった。 4 )作業記録がログとして残るので、作業工程の管理が容易になった。 今後は SAS/PH‑Clinical ソフトウェアや C l i n t r i a lR e v i e wを使用するなどして、 SASプログラムやオブジ ェクトの管理を行えるようにしていきたい。 ‑78一

82.

日本 S A Sユーザー会 (SUG I‑J) ブリッジング作試験における症例数の設計 0 吉原素子、高橋行雄 日本ロシュ株式会社医薬開発本部 開発情報管理グループ統計解析担当 S t r a t e g yo fSampleS i z eD e t e r m i n a t i o nf o rB r i d g i n gStudy MotokoYoshihara,YukioTakahashi S t a t i s t i c sPDNB NipponRocheK . K . 要旨 ブリッジングを目的とした試験の結果を用いて既存の外国成績と臨床効果(有効性) の比較を行う場合、民族的要因のうち特に対象とする疾患に由来する既知の共変量に ついて考慮する必要があると考える。本発表では、そのような状況の下での例数設計 方針について検討を行った。 キーワード: 例数設計、ブリッジング試験、ロジスティック回帰、共変量 1 . はじめに ICHの流れの中で、 ICHE5 I 外国臨床データを受け入れる際に考慮すべき民族的 1 日に step5に達した。これを受けて、外国 要因についての指針 J 1) が 1998年 8月 1 臨床データパッケージが存在する場合には、外国データの日本への外挿可能性評価を 目的としたブリッジング試験を行い、新薬の承認申請を行うことが可能となった。外 挿可能性の評価を行う際には、外国データと日本のデータが同様で、あることを示すこ とが目的となるため、ブリッジング試験の例数設計は同等性の観点から行うことにな る。また、外挿可能性の検討を行うにあたっては、民族的要因の臨床効果に及ぼす影 響の大きさを評価し、その結果、民族的要因として説明できる共変量があった場合に は、統計モデ、ルを用いてその共変量により調整を行った上で外国と日本の臨床効果の 比較を行うことが同等性を示す上で不可欠であると考えるニ本報告では、 2 値反応の 場合にロジスティック回帰分析を用いた例数設計方針について検討を行う。 同 ハ ー ワ υ

83.

2 . 外挿可能性評価と民族的要因 外挿可能性の評価を行うにあたり、民族的要因の臨床効果に及ぼす影響の大きさを 検討する必要がある。 1CBE5 ガイドライン 1) の中では、以下の各民族的要因が挙げ られている。ブリッジング試験の計画に際しては、対象とする疾患および用いる薬剤 に応じて民族的要因の影響の受けやすさについて検討する必要があるつ 表内因性及び外因性民族的要因の分類 (ICBE5ガイドライン 1) の補遺 A を参考) 民族的要因分類 民族的要因 遺伝的要因 性別、人種、薬物代謝の遺伝多型、遺伝病 「遺伝的要因 j と 身長、体重、 ADME、レセプターの感受性 「生理的及び病理 内因'性 的要因」の中間 生理的及び 年齢(小児 病理的要因 心血管機能)、疾患 「内因性 j と「外因性 j の中間 高齢者)、内臓機能(肝臓、腎臓、 喫煙、飲酒、食事習慣、ストレス 気候、日光、環境汚染、文化(社会経済的要因、 外因性 環境要因 教育水準、言語、医療習慣、疾病の定義と疾患、 治療法、医薬品服薬遵守の程度)、規制方法/ GCP、臨床試験の実施方法/エンドポイント 3 . 外挿可能性評価方針 経験した事例について、やや抽象的だが以下に示す。 ・反応への影響が大きいことが知られている疾病関連の因子が 2つ存在し、 その分布は日本と外国で異なることが知られている。 ・ エンドポイントは、計量値により客観的に反応の有無として判定可能な指 標である 0 ・他の薬物の治療効果は非常に弱し、と考えられる ・外国では検証的試験が 2つ進行中である。 c 先行する外国の探索的試験データより、共変量として知られる疾病関連因子の影響 を評価したところ、かなり影響が大きいことがわかった。そこで、外挿可能性評価の 際には、ブリッジング試験データと外国の検証的試験データとを併合し、共変量の影 響を調整した上で、試験聞の効果を比較することとした。統計モデ、ルは、反応が l 時点 における 2値データであることより、ロジスティック回帰を用いることとした。 ハ U OO

84.

外挿可能性判定ルール 外挿可能性の評価に際しては、ブリッジング試験データと外国検証的試験データと を併合したデータより以下の図 lのようにロジスティック回帰モデルをあてはめ、あ らかじめ定めた共変量(連続値)の値において、共変量(カテゴリカノレ)別に試験別 の臨床効果とその 95%信頼区間の推定を行う。 共変量(カテゴリカル)の層 100 子 " ‑ .9 5 %信頼区間 臨床効果 〆 外国検証的試験 ( % ) ブリッジンタ試験 〆 。 共変量(連続値) あらかじめ定めた値 図 1:解析方針イメージ図 ( 9 5 %信頼区間は表示のため横にずらした) 次に、試験別臨床効果の推定値およびその 95%信頼区間より、以下のような判定ノレ ールにより外挿可能性の判定を行うことを計画した。 5 %信頼区間パターン 囲内ブリッジング試験推定臨床効果 9 +20% +10% 外国検証的試験 臨床効果推定値 5 弘 一1 5 % × ヨ = Eコ × 。 京ロ 外挿可能性の判定 。 0 0 一可 ②による判定結果 0 0 一可 ①による判定結果 × × ヨ = Eコ 図2 : ブリッジング試験の 9 5 %信頼区間の位置による判定結果の例示 (①および②の判定ル ルは次のページに示した) ‑81

85.

図 2に示したように、以下の 2つの基準を同時に満たした場合に、日本と外国の結 果が同様であると判断し、外国臨床データが日本の患者集団に外挿可能であると判断 することとする。 ① ブリッジング試験の臨床効果の推定値が外国検証的試験の臨床効果の推定 値の -5%~10% の範囲内 ② ブリッジング試験の臨床効果の推定値の 95%信頼区間が外国検証的試験の 臨床効果の推定値の 15%~20% の範囲内 4 . 例数設計方針 ロジスティック回帰の例数設計方針については、いくつかの方法が提案されている叫 が、どの方法も、関心のある共変量(試験の区別のダミー変数)の偏回帰係数が O で あるという帰無仮説について、有意水準 α、検出力 1 ‑sの下で「臨床的に意味をもっ 最小限度の効果」を検出するのに必要とする標本の大きさを算出する方法である。こ れに対し、ブリッジング試験の場合には関心のある共変量について同等であることを 示すことを目的としているため、従来の方法で例数を算出することはできない。そこ で、本報告では高橋による同等性試験の例数設計に関する報告 7) を参考とし、モンテ・ カルロ・シミュレーションにより必要症例数に関する検討を行った。 モンテカル口・シミュレーションの方法: ①反応と共変量の問で、以下の関係が成り立っていることを想定する。 j i+β3 S ;+β2T U i j+ e i j logit(πυ)=1+β , 1 :切片、 1 試験、 j :被験者、勺・各試験の各被験者の反応ありの確率 β 1 :S ;の偏回帰係数、 S ; :試験のダミー変数 んらの偏回帰係数、 T i j 共変量 ( 3水準のカテゴリカノレ変数)のダミー変数 角 ② U i jの偏回帰係数、 U i j 共変量(連続値)の値 日本と外国で共変量の分布が異なる場合を想定し、 SASの DATAステップでそれ i jと U i jについて以下の分布に従う ぞれ RANUNI関数、 R必 JNOR関数を用いて T データを外国検証的試験データの例数分と日本のデータとして想定する例数分発 生させる D ただし、共変量聞には相聞がないことを仮定する。 T i j 3水準の割合がそれぞれれ、 Pi2、 P ; 3であるような分布 U i j 平均的、分散 σ12であるような分布 ③ ②で発生させた共変量のデータに対して、①で仮定したモデルで、 s lニ O とした場 合、すわなち「共変量について調整した場合、試験聞には差がなし汀という帰無 仮説の下でのちを推定し、むの確率で反応の有無のデータを発生させるつただ し、内は確率の定義と l o g i t ( πり)=logtη/(1一円)}より Oく 向 く 1であるため、① で仮定したモデルからちを推定する時に向くOとなった場合には、ち =0.0001、 ‑82

86.

九>1となった場合にはち =0.9999と置き換えることとした。 ④ ③で発生させたデータに①で仮定したロジスティック回帰モデ、ノレを LOGIST1Cプ ロシ、ジャであてはめ、共変量について調整した上での各試験のんとその 95% 信頼 区間を推定する。 ⑤④で推定した結果について、外挿可能性判定ルールに従い判定を行うご ⑤① ⑤ を 独 立 に 1000回繰り返し、外挿可能と判定された割合を算出し、外挿可能 と判定される確率の推定値とする。 5 . おわりに 今後、海外で開発が先行する薬剤の多くは、ブリッジング試験を行った上で、外国 臨床データを日本における承認申請に用いられる臨床データパッケージに含めて申請 することになっていくことが予想される。その中で、開発計画、外挿可能性評価方針、 症例数の設計方針などについて改良が重ねられていくと思われる。 今回の事例についても、外国検証的試験結果が得られた後に、解析方針の再検討を 行う予定にしている。 6 参考文献 1 . 1CHS t e e r i n g Committee,外国臨床データを受け入れる際に考慮、すべき民族的要 tep5,1 1August1998 因についての指針, S 2 . 丹後俊郎、山岡和枝、高木晴良著、「ロジスティック回帰分析 SAS を利用した 7 ‑ 5 1、 1996 統計解析の実際」、朝倉書庖、 4 3 . WhittemoreA .S .,'SampleS i z ef o rL o g i s t i cRegressionWithSmallResponse ft h eAmericanS t a t i s t i c a lA s s o c i a t i o n,76,27‑32,1981 P r o b a b i l i t y ',Journalo 4 . Hsieh,F .Y .' Samples i z et a b l e sf o rl o g i s t i cr e g r e s s i o n ',S t a t i s t i c si nMedicine,8, 795・802,1989 5 . Flack,V F .,Eudey ,T .L . , ' Samples i z ed e t e r m i n a t i o n su s i n gl o g i s t i cr e g r e s s i o n t a t i s t i c si nMedicine,1 2,1079‑1084,1993 withp i l o td a t a ',S 6 . Hsieh,F .Y . , B loch,D.A . , Larsen,M. D.,' ASimpleMethodo fSample S i z e C a l c u l a t i o nf o rLinearandL o g i s t i cR e g r e s s i o n ',1 7,1623‑1634,1998 7 . 高橋行雄、薬物濃度を用いた同等性試験の例数設計、日本 SASユーザー会論文集、 149‑152、 1997 ‑83

87.

日本 S A Sユーザー会 (SUG I‑J) 多項目検定のマクロの作成 積山功 吉富製薬株式会社 開発本部開発業務部解析グループ M a c r of o rT e s t i n gw i t hM u l t i p l eE n d p o i n t s I s a oT s u m i y a m a C l i n i c a lR e s e a r c hD i v i s i o n,Y o s h i t o m iP h a r m a c e u t i c a lI n d u s t r i e s,L td 要旨 D 'B r i e n法 1)による多項目検定のマクロを作成したので、その機能と使用法について紹 介する。 いhi ワ キ 多項目検定、 Q ' B r i e n法 、 M U L T T E S 、 丁 B o n f e r r o n i法 1 . はじめに 臨床試験において治療の有効性を評価する場合、複数の症状の推移を測定するのが普通であ る 。 それらの症状について 2 つの治療の有効性を評価する場合、項目毎に比較を単純に繰り返す と多重性の問題が生じるというのは周知の通りである。多重性の調整方法にもいくつかあり、 SASにおいては、 MULTTESTプロシジャによって、 B o n f e r r o n i涜の調整やリサンプリング による多重性調整済みの P値の算出が可能であるへ 多重性の問題を回避する別のアフローチとして、複数の項目から単一の総合指標を構成した 上で比較を行うことが考えられる。 0 'B r i e n1lは、計量値データから構成される多項目データ について、項目聞の相関構造に基づいて各項目の観測値の(重み付き)和を算出し、その値 について比較を行うというアプローチを提唱した。 今回作成したマクロは、多項目のデータに対して総合指標を算出し、分散分析を行うことを に u oD

88.

目的としている。 本稿では、マクロの機能を紹介する。また、サンプルデータに対する使用例を示すと共に、 MULTTESTプロシジャにより算出される多重性調整済み P値と結果を比較する。 2 . 例題 下記のデータは、健常人女性 581 人について、高血圧の家族歴があるグループ・ ないグループそれぞれにおいて、心疾患のリスク因子の指標とされる下記の 8 項 目の測定を行ったものである(括弧内はプログラム上での変数名を表す)。 測定項目:BodyMassl ndex (BMI ) 、 HbA1c (HBA1C)、収縮期血圧 (SBP)、 拡張期血圧 (DBP)、総コレステロール ( T C )、 トリグリセライド (TG)、 HDL (HDL)、尿酸 (UA)、高血圧の家族歴 (GROUP) 3 . 多項目検定の方法 2 . の例題では観測値が 8次元ベクトルで得られ、比較する群は 2群(高血圧の家 族歴の有り・無し)である。ここで、 μt=(μ i1'μ i 2ラ … ,μ i 8)'を第 i群における母平均 , 2) とする。 ベクトル(i= 1 H ( ) ! ll =μ2 ( 2群問で心疾患のリスク因子指標の平均は等しい) という帰無仮説に対して H1 Hoは偽である という対立仮説の検証を行う場合、多変量分散分析を適用することになるが、これ は GLMプロシジャによって実行可能である叱 それに対し、 O ' B r i e n1)の提唱した方法は、 μ=μ+βiJ (J=( 1 , 1 , . . . , 1 ) ' ) 」一一v‑‑' というモデルを仮定し、 H ' ( ) β1=β コ=0 という帰無仮説に対して、 H¥: H ' ( ) f ま偽である という対立仮説の検証を行うものである。ある群の観測値がすべての項目において ‑86一

89.

一様にもう一方の群より(定量的に自然な意味で)勝る場合に、この検定は検出力 が高い。 4 . 計算の手順 具体的な計算手順は以下の通りである。 ( 1 ) データの標準化を行う。 計量値データから成る多項目データでは、通常は項目聞で単位がまちまちで ある。そこで、無次元の尺度に変換するために、項目毎に下記の手順でデー タの標準化を行う。 1 貢1 各観測値から総平均をひく 手) 1 員 2 群ごとに算出される標本分散を併合して得られる標本分散の平方根 手) で割る ( 2 ) 標本分散共分散行列を算出する 〈 】j Aを 、 ( 1 ) の方法で標準化した、第 i群の j番目のデータにおける第 k項目 の観測値、また niを第 i群のサンプルサイズとし、 Y i j= ( 九 1 ' 1 ' ; 〆 ・' , 1 ' ; j B ) ' h12R とおくとき、標本分散共分散行列 Zは 主=~~件わ(Yij 吋 2(n-1) で与えられる。 ( 3 ) 総合指標を算出する 2 ) で算出した標本分散共分散行列から、 ( 1 ) で標準化した観測値、および ( 一 lYij '土 S i j= J で定義される総合指標を算出する。 ( 4 ) 分散分析を実施する ( 3 ) で算出した Sりについて分散分析を行う。 ワf o o

90.

5 . マクロの説明 今回作成したマクロの、 2 . のサンプルデータに対する適用例を紹介しながら、マ クロの呼び出し方法、出力などを説明する。(詳細は[付録]を参照されたい。) 例えば、 2 . のデータについて、 元の SASデータセット名:samp 出力 SASデータセット名:out 重み係数を含む SASデータセット名:wout オブザーベーションの識別コード名:なし(ブランク) 群の分類を表す変数名:GROUP ( 2 . を参照) 0 'Brien法の適用の対象となる変数の数 :8 の名前:2 . で挙げた 8項目 " とするとき、マクロの呼び出しは、(コンパイル後)以下のように記述する。 % o b r ̲ c a l c ( s a m p, o u t, wout, ,GROUP ,8, BMI, HBAIC,SBP , DBP ,TC, TG,HDL,U A ) ; この例題においては、心疾患のリスク因子の分布が高血圧の家族歴の有無によって 異なるかどうかを評価するのが目的である。心疾患のリスクが高い場合には、 HDL 以外の項目については観測値が大きい値をとり、 HDL では小さい値をとることが 知られている。そこで、項目聞で不等号の向きを一致させるために、元の HDLの 値 に ‑1 を掛けたものを計算に使用(変数名は HDL' のまま)する。このとき のアウトプットは次頁の出力 1の通りである。 8項目を総合した指標について、 GLM プロシジャを用いて群間比較(t検定)を行うと、 p=O.0004 となり、高度に有意 にある。 なお、例題は 2群比較であるが、 3群以上の場合でも対応可能である。また、デフ ォルトでは分散分析のみ出力するが、総合指標を含む SAS データセットを作成で きるので、多重比較や共分散分析も実施可能である。 出力 1 マクロによる出力 O'Srien指標に基づ、くわ噛分析 General Linear Models Procedure Class L e v e l Information Class Levels GROUP Values + ー Number o f observations i n data s e t =5 8 1 ‑88‑

91.

0 'Brien指標に基づ、くわ噛分析 General Linear Models Procedure Dependen! Variable: O B R Source DF Mode1 MeanSquar自 FValue Pr F 5 8 .0 5 0 6 9 6 2 7 5 8 .0 5 0 6 9 6 2 7 1 2 .4 7 O .0 0 0 4 5 7 9 2 6 9 4 .5 9 6 1 4 5 7 5 Correc!ed T o ! a l5 8 0 2 7 5 2 .6 4 6 8 4 2 0 2 Error Source GROUP 4 .6 5 3 8 7 9 3 5 R‑Square C .V . R o o !MSE O B RMean 0 . 0 2 1 0 8 9 ‑ 9 9 9 9 .9 9 2 . 1 5 7 2 8 5 1 8 O .0 0 0 0 0 0 0 0 D F Type 1S S Mean Square u e FV a1 Pr F 5 8 .0 5 0 6 9 6 2 7 5 8 . 0 5 0 6 9 6 2 7 1 2 . 4 7 O .0 0 0 4 Type 11S S Mean Square u e FV a1 Pr F 5 8 .0 5 0 6 9 6 2 7 5 8 . 0 5 0 6 9 6 2 7 1 2 . 4 7 O .0 0 0 4 GROUP Source > Sumo fSquares D F > > 0 'Brien指標に基つ、くわ噛分析 General Linear Models Procedure Leas! Squares Means GROUP OBR LSMEAN + O .5 5 0 6 4 9 3 4 ‑ 0 . 1 8 1 4 4 9 6 7 また、 SASデータセット o utは下記のように、 O ' B r i e n法の計算に使用した変数の 原データに総合指標が付加された内容になっている。 OBR 0.68676 4.23690 また、データセット woutは 、 W= J ' f ‑ l で定義される重み係数(ベクトル)から構成されており、以下のような内容である。 (重み係数の変数名は、原データの変数名と対応している。) Qd o 口

92.

なお、検討する変数が 3つ(例えば HBA1C、TC、HDL)の場合、マクロ呼び出 しは % o b r ̲ c a l c ( s a m p,o u t , w o u t , , GROUP ,3 , HBAIC,TC, H D L ) ; となる。 6 . 問題点と対処法 ( 1 ) 欠測値 今回作成したマクロでは、欠測項目のあるオブザーベーションは計算から除 いている。多変量解析の宿命(?)といえばそれまでだが、検討の対象によ っては欠測が多発することもあり、(妥当な推定値などによる)何らかの補聞 が必要となることも考えられる。 ( 2 ) ノンパラメトリック法 O B ' r i e nl) は、正規性の仮定に依らないノンパラメトリックな多項目検定につ いても提唱している。これは、項目毎に順位をつけ、各オブザーベーション での順位の和について分散分析を行うというものである。論文 1) の中では、 正規性の仮定が明らかに成り立ちそうにない場合、もしくはサンプルサイズ が小さい場合はノンパラメトリックな方法を用いることを薦めている。 ( 3 ) 項目毎、もしくは項目のサブセットにおける群間差の検討 総合指標の意味の解釈は一般に困難であり、総合指標を構成する項目毎の比 較が必要となることが多い。しかしながら、仮に総合指標において有意差が 認 め ら れ た 場 合 に 限 り 1 項目毎の比較を行うという手順を踏んでも、 e x p e r i m e n t a l w i s et y p e 1e r r o rr a t eの制御はで、きない。そのような多重性 の問題に対応するには、以下のような方法がある。詳細は各文献を参照され たい。 MULTTESTプロシジヤを使用して、 B o n f e r r o n i流の調整、もしくはリサ ンプリングによって多重性調整済みの P値を算出するなどの対応をとるヘ (例題でいえば) 8 項目全てに関する帰無仮説、あるいはそのうちの 7 項 目のサブセットに関する帰無仮説、そのうち 6項目のサブセットに関する、、、 というように階層的な帰無仮説族を設定し、 c l o s e dt e s t i n gp r o c e d u r eの考 えを応用して段階的に比較を行うヘ 円切 υ n u

93.

なお、 2 . のデータについて、 MULTTESTプロシジャを用いて B o n f e r r o n i流 の調整、およびリサンプリングによる多重性調整済みの P値の算出を行った結 果(一部抜粋)を記載する。 出力 2 MULTTESTプロシジャによる出力 MULTTEST TABLES Class + Variable St ati sti c B M I Mean 2 0 .2 9 4 7 1 9 .9 8 0 3 S t d Dev 2 .8085 2 .2097 1 4 4 .0000 4 3 7 .0000 N Contrast Raw̲p Bon̲p Perm p Trend O .1682 1 .0000 O .7440 HBA1C Mean 4 .9 2 7 1 4 .8622 S t d Dev O .3568 O .3493 1 4 4 .0000 4 3 7 .0000 N Contrast Raw p B o np Perm̲p Trend O .0552 0.4413 O .3483 SBP Mean 114.5069 1 11 .2792 S t d Dev 1 2 .8 3 0 3 11 .4575 N 1 4 4 .0 0 0 0 437.0000 Contrast Raw p Bon̲p Perm̲p Trend O .0046 O .0369 O .0364 DBP 7 1 .9 6 5 3 Mean 6 9 .6499 S t d Dev 10.4469 8 .9 7 0 3 N 1 4 4 .0 0 0 0 4 3 7 .0000 Contrast Raw p Bon̲p Perm p Trend O .0103 O .0821 O .0793 ‑91

94.

T C M e a n .4 7 2 2 1 91 1 8 2 . 8 2 6 1 S t dD e v 3 3 . 0 3 2 7 3 0 . 8 5 8 6 N 1 4 4 .0 0 0 0 4 3 7 .0 0 0 0 C o n t r a s t R a w ̲ p B o n ̲ p P e r mp T r e n d O .0 0 4 3 O .0 3 4 6 O .0 3 3 9 T G M e a n 7 0 .5 8 3 3 7 1 .0 2 9 7 S t dD e v 3 8 .4 8 3 8 .6 4 0 8 41 N 1 4 4 .0 0 0 0 4 3 7 .0 0 0 0 C o n t r a s t R a w ̲ p B o n ̲ p P e r m ̲ p T r e n d O .9 0 9 6 1 .0 0 0 0 1 .0 0 0 0 HDL M e a n ‑ 6 5 .9 3 7 5 6 6 .3 4 5 5 S t dD e v 1 2 .1 5 1 8 1 2 . 7 4 9 2 N 1 4 4 .0 0 0 0 4 3 7 .0 0 0 0 C o n t r a s t R a w ̲ p B o n ̲ p P er m ̲ p Tr e n d O .7 3 6 3 1 .0 0 0 0 1 .0 0 0 0 U A M e a n 4 .2 0 0 7 4 .0 9 9 5 S t dD e v O .9 0 4 5 0 . 7 7 4 7 1 4 4 .0 0 0 0 4 3 7 .0 0 0 0 R a w ̲ p B o n ̲ p P er m ̲ p O .1 9 3 5 1 .0 0 0 0 O .7 9 1 8 N C o n t r a s t T r e n d 有意水準を両側 5%とすると、 5 . で実施したマクロによる群問比較では群問で有意 差があった ( p = O . 0 0 0 4 ) のに対し、項目毎の比較では、多重性を調整した上で有意 差がある項目は SBP、TCである。 DBPについては、多重性の調整の有無で結論が 異なっている。 7 . 最後に O ' B r i e n法による多項目検定のマクロを作成した。ソースファイルを次項以降に記載 する。マクロの仕様、計算原理等を理解した上で、各自の責任の下に自由に使用し て頂きたい。 92‑

95.

謝辞 末筆ではございますが、本論文の作成にあたり、東京大学医学部薬剤疫学教室 浜田知久馬 助手から数多くの助言を頂戴致しました。ここに感謝の意を表します。 [参考文献] l ) P e t e rC . u ' B r i e n (1984). Procedures f o r Comparing Samples with M u l t i p l e i o m e t r i c s40, 1079‑1087 E n d p o i n t s .B e l e a s e6 . 1 1( 1 9 9 6 ) 2)SAS/STAT⑧Software:ChangesandEnhancementsthroughR 1 9 8 9 ) . SAS による実験データの解析.東京大学 3 )高橋行雄、大橋靖雄、芳賀敏郎 ( 出版会 4 )WalterLehmacher,GernotWassmer,andP e t e rR e i t m e i r( 1 9 9 1 ) . Proceduresf o r τ 'wo ・S ample Comparisons with M u l t i p l e Endpoints ExperimentwiseErrorR a t e .B i o m e t r i 白 47 , 511‑521 C o n t r o l l i n g t h e ﹃U Qd

96.

[付録]マクロのソースファイル / 宇 d ̲ k e y マクロ名: i 宇/ / 本 目的 本/ / キ :オブザーベーションの識別キ一 (通し番号)の生成 /率引数 % e l s e% d o ; % i f& k e y =% t h e n% I e tf i r s t = 5 ; % e l s e% I e t 本/ fi r st = 6 キ/ % e n d : % d oi = 1% t o& n ̲ v a r ; d a t a ー〉オリジナルの S A Sデ タ セ ッ ト 名 字 / / 宇 o u t ‑)識別キーを付加した 宇/ S A Sデータセット名 宇/ e v a l( & i + & f i r s tー 1 ) ); v & i = % s c a n ( & s y s p b u f f, % (デフォル卜はオリジナルの 宇/ % e n d ; データセット名と同じ名前) キ/ % i f& o u t =% t h e n% I e tv a r ̲ o u t = v a r ̲ s e t ; φ&T /'/'/' / 宇 % I e t 白色守守也 AT % m a c r oi d ̲ k e y ( d a t a, o u t ) ; % e l s e% I e tv a r ̲ o u t = & o u t ; % i f& o u tn e% t h e n% d o ; d a t a& o u t ; % e n d ; ーi d % i f& k e y =% t h e n% I e tk e y = % e l s e% d o ; d a t a& d a t a ; % e n d ; d a t a& v a ro u t ; s e t& d a t a ;ー i d ̲=̲ n ̲ ; s e t& d a t a ; k e e p& k e y& c l a s s r u n ; % d oi = 1% t o& nv a r ;& & v & 1% e n d ; ;r u n ; % m e n dv a r ̲ s e l ; % m e n di d ̲ k e y ; / キ マクロ名 /本目的 v a rs e l :特定の変数のみ含む / キ 宇/ /宇目的 : 欠 ; ,1 , 1 1 項目のある / 宇 オブザーベーションを除外する宇/ S A Sデータセットを作成する。キ/ / キ /字引数 n o ̲ m i s s 宇 / 字/ マクロ名 宇/ 宇/ /字引数 字/ / キ d a t a ー 〉 オリジナルのデータセット名字/ / キ d a t a ‑)オリジナルのデータセット名 字/ / キ o u t ‑)指定した変数のみを含む キ/ / 本 o u t キ / -)欠;,~~のない / 宇 S A Sデータセット名 字/ / 本 オブザーベーションから / 本 (デフォル卜は out) キ/ / 宇 構成される S A Sデータセット名字/ / 宇 k e y ‑)オブザーベーションの識別キ一宇/ / キ (デフォル卜は c o m p ̲ ) / 宇 (省略可能) キ/ キ/ 宇/ / キ nv a r‑)変数の数 字/ / 宇 nv a rー 〉 変数の数 宇 / / キ v a r ‑)欠測のチェックの対象となる キ/ / 宇 v a r ‑ ) 変数の指定(複数個指定可) キ/ / 宇 変数名(複数指定可) キ/ % m a c r o % m a c r on o ̲ m i s s ( d a t a,o u t,n ̲ v a r,v a r ) / p a r m b u f f ; v a r ̲ s e l( d a t a,o u t,k e y,c l a s s,n ̲ v a r,v a r ) / p a r m b u % i f & o u t = % t h e n % I e t f i r s t = 3 ; % e l s e % I e t ゐ Y1 内 rs uvd ︐ . vd s @ ゐu n H n一( ゐ Y1 ) ) ‑ ﹁ t p a l+1 f o u 2u (0ゐ楊 v e wa LHM n u p f f u d 内 h. ea nuplv t s waw‑m l ︐一‑ w 匂 し wauhm 凋崎 1lti ‑‑一一@ゐ楊 干 ﹄ ・﹃ s e d ・ u'' ﹁ DIn ‑‑Auwae tρ w 仰 匂 し w .必 ρ 匂しw sρ 一 = 崎 u守 凋 卸為 r ︐ w 匂 し t一 5 f 卸為 tρ 什 th 口 n d 3 U h ゐ 伺 ' ν R nwa ρ u 山= =︒ゐ楊 zw nu‑‑ eawa t u' f5 sd ‑ 一 ; flr‑n f le f z・ fz ︐ ‑94

97.

% i f &out= %then % I e to u t ds= comp s e t v̲out; vv=ss/df; i f̲type̲="ERROR"; e t out̲ds=&out; %else 目l r u n ; data &out̲ds; data n u lI s e t &data;array TMP{&n̲var}; s e tv̲out; c a lIs y m p u t ( 's i g m a ' l ll e f t ( ̲ n ̲ ), 目d oi = l %to&n̲var; TMP{品i } = & & v & i ; % e n d ; v v ) ; blank=nmiss(of TMP1‑TMP&n̲var); r u n ; i f blank=O; /本各変数の標準化本/ drop blank TMP1‑TMP&n̲var;run; % i f &out= 目t h e n %Iet comp=̲std一 ; %mend n om i s s ; %else % I e t comp=&out; / 本 目的 本本本 マクロ名 ︐︐︐︐︐︐︐︐︐︐︐ / 本 z tr a ns :多変量データの標準化 /本号│数 / 本 data ー〉標準化の対象となる 本 / / 本 S A Sデータセット名 本/ / 本 o u t ー 〉 / 本 v a r % d oi = l %to & nv a r ; & & v & i % e n d ; r u n ; d a t a &comp; 標準化された SASデータセット名本/ (デフォルトは st d ) % d oi = l 月t o& nv a r ; s&i=&&sigma&i; class ‑)群を表す分類変数名 本/ / 本 n̲var ー〉標準化の対象となる変数の数 本/ / 本 v a r ー〉標準化の対象となる変数の指定 本 / (複数指定可) s e t &comp; 本 / / 本 / 本 proc standard data=&data out=&comp mean=O; v & i = v&i/sqrt( s & i ) ; 目e n d ; d r o p %do i = l 月t o& nv a r ; s & i % e n d ; 本 / r u n ; 口 %macr proc datasets Iibrary=work n o li s t ; z̲trans(data,o u t,class,n̲var, var)/parmbuff; v ̲ o u t ; /本「プール分散の算出」 r u n ; 本 / % i f &out= %then %Iet first=4;目else %Iet delete %mend z̲trans; fi r st = 5・ 目d oi = l %to &n̲var; % I e t / 本 マクロ名: i mIscr / 本 目的 本 / :0 'B ri e n指標の算出に使用する本/ 本/ e v a l(&i+&first‑1 ) ) ; v&i=%scan(&syspbuff, % / 本 % e n d ; 本 / proc glm data=&data manova outstat=v̲out /本引数 n o p rI口t ; 本 / d a t a ー)(標準化済み ) S A Sデータセット名本/ class &class; / 本 wo u t ‑)重み係数を含む m o d e l % d oi = l 月t o &n̲var; & & v & i % e n d ; / 本 本/ 本 / S A Sデータセット名 class ‑) 群を表す変数名 / 本 n var‑) O'Brien指標の算出に使用する ︐︐︐︐︐ / 本 卒中本 data v o u t ; ( 1M Lプロシジャを使用) ︐ ︐ ︐ ︐ ︐ ︐ ︐ ︐ p = & cI ass/ss3;r u n ; 重み係数を算出する 本 / 同 Fhu nd

98.

/ 本 ‑) O'Brien指 標 の 算 出 に 使 用 す る 本 / 率 / 引数 本/ / 本 X‑ ) データ行列 / 本 返 り 値 :Xの 行 平 均 か ら 成 る 列 ベ ク ト ル 本 / 変数の数 v a r 字率本 / 本 JJJfJf 本/ / 本 / 本 変数名(複数指定可) %macro i m l scr(data,w o u t,class, n ̲ v a r,var)/parmbuff; 算出する s t a r tr ̲ m e a n ( X ) ; % i f &w̲out= %then % I e t first=4;%else % I e t nn=ncol(X);m=X[ ,t]/nn;return ( m ) ; finish r ̲ m e a n ; first=5 /本関数名 :c c s s ( X ) / 本 , 日B ri e n指 標 の 作 成 に 用 い る 変 数 を 表 す 本/ /本目的 / 本 本/ / 本 マクロ変数を生成する % d oi = l %to & n ̲ v a r ; 本/ :行亨] 1Xの列ベクトルの 平均修正平方和を算出する / 本 本/ 本/ /本引数 見l e t 本/ X ‑) デ ー タ 行 列 本/ e v a l(&it&first‑l)); v&i=%scan(&syspbuff, % /本返り値:X の亨] 1ベ ク ト ル の 平 均 修 正 平 方 和 本 / % e n d ; st a r tc ̲ c s s( X ) ; cs=O;nn=ncol( X ) ; m=r̲mean(X); K=nrow(X); /本群の水準名を表すマクロ変数を生成する d oj = lt on n ; 本/ p r o cs o r t data=&data nodupkey out=tmp̲cls; b y c s = c s+ CX[l:K, j]‑m)本(X[l:K, j]‑m); & c l a s s ; end;return ( c s ) ; r u n ; f i n i s hc ̲ c s s ; d a t a n u l lー s e tt m pc l s ; /本関数の定義の終了 s y m p u t ( ' g 'I l l e f t ( n), c a1 1 本/ /本データ行列を作成する trim(&class)); u s e& d a t a ; r u n ; % d oi = l% t o& n g ; 本/ r e a da l l var{ /本群の数をカウン卜する 本/ p r o c means data=tmp c l s n o p r i n t ; 初日 j = l% t o &n̲var; & & v & j %end;} i n t oX & i where(&class="&&g&i"); output out=tmp̲cnt; T & i = ( X & i ); r u n ; n & i = n c o l( T & i ) ; /本各群のサンプルサイズ本/ d a t a n u l l s e tt m pc n t ; Y&i=T&i[l:&n v a r,l : n & i ] ; ) ); c a l ls y m p u t ( 'n g ', trim(̲freqー ss&i=c c s s ( Y & i ) ; r u n ; %end;close & d a t a ; 本 p r o ci m l ; / I M Lプ ロ シ ジ ャ の 使 用 開 始 本/ M L内 で の 関 数 の 定 義 本 / /本各種 I /本関数名 / 本 目的 rm e a n( X ) :行列 Xの行平均(ベクトル)を 本 / t s s = O ; /本群ごとの平均修正平方和の和 本/ nt o t = O ; 本 / 本/ 全体のサンプルサイズ % d oi = l% t o& n g ; 本/ tss=tsstss&i; n̲tot=n̲tottn&i; % e n d ; 9 6

99.

本I df=n̲tot‑&ng;1本(分散共分散行列の)自由度 I 本 標本分散共分散行亨J I 本 I sigma=tssldf; I 本 %macro J J = j( 1,&n̲var); inv̲sig=inv(sigma); w̲out,class,n̲var, var)/parmbuff; score(data, I 本重み係数ベクトル W=JJ判 n v ̲ si g ; 本/ 変数名(複数指定可) キ/ h e n% I e t first=4; % i f &w out= 目t 出e lse %Iet fi r st = 5 ; / 本 A Sデ ー タ セ ッ ト の 作 成 重み係数の S 本/ % d oi = l% t o& nv a r・ create s cf r o mW ; append from W ; QUi t ; 出l e t I キ I M Lプロシジャの終了 本/ d a t a w̲name; ̲ t y p e ̲ = 's c o r e ' v&i=%scan(&syspbuff,出 e v aI 品 (i +品first‑1 ) ) ; r '; 出 e n d ; name =口 b r u n ; p r o cs o r t data=&data; b y &class; r u n ; data s c ; s e ts c : /キ群の数のカウント キ/ % d oi = l %to &n̲var; 品 品v &i=col&i; % e n d ; proc s o r t data=&data nodupkey out=tmp̲grp; b y &class; drop col1‑col&n̲var; r u n ; r u n ; 出i f &w out= 目t h e n% I e t weight=̲wout̲; data n u lI 一 s e tt m p ̲ g r p ; c a l l symput('g'!!left(̲n一 ) , 目e lse % I e t weight=&w̲out; tri m(品cI a ss ) ); data &weight; merge w̲name s c ; r u n ; r u n ; p r o c datasets Iibrary=work n o li s t ; p r o c means data=tmp̲grp noprint; output out=tmp̲ng; delete w̲name s c tmp̲cls t m p ̲ c n t ; r u n ; r u n ; 出m end i m l ̲ s c r ; d a t a n u lI 一 s e tt m p ̲ n g ; r e Qー ) ); c a lIsymput( 'n g ', trim( f / キ マ ク ロ 名 :s c or e / 本 目的 I / 本 本/ /キ群ごとのサンプルサイズ・分散の 本/ 本 / /本自由度の算出 本/ 本/ p r o cf r e Q data=&data noprint; 重み係数を算出する /本号│数 / 本 data ‑) O'Brien指 標 算 出 の 対 象 の 重み係数を含む / 本 (デフォル卜は w̲out) 令︑司 S A Sデ ー タ セ ッ ト 名 +ATψ / 本 町白 wo u tー 〉 r''''F ︐ ︐本 し リ ノ ///'V S A Sデータセット名 / 本 / 本 r u n ; 本 :0 'B ri e n指 標 の 算 出 に 使 用 す る 本 / t a b l e &class/out=count; r u n ; data n u lI s e tc o u n t : ) , c aI I symput( 'n 'I !I e ft( ̲ nー HU ﹁ c l a s s ‑) 群を表す変数名 / 本 nv a r 一)O'Brien指 標 の 算 出 に 使 用 す る キ / 出I etn t 0t = 0 ; 本/ % I e td ft o t = O ; / 本 / 本 変数の数 v a r ‑) O'Brien指 標 の 算 出 に 使 用 す る 本 / 門H / 本 % d oi = l% t o& n g ; 9 7ー trim(count));

100.

% I e t nt o t = % e v a l( & nt o ! + & & n & i ) ; t m p { i,j } = c o v a { i,j } ;i n v e r { i,j } = O ; ‑ 1 ) ; % I e t df&i=%eval( & & n &i e n d ;i n v e r { i,i } = l ; % I e t df̲tot=%eval(&n̲tot‑&ng); e n d : d ok = 1t o% e v a l( & n ̲ v a r ‑1 ); m x = k ; % e n d ; d oi = k t lt o& n ̲ v a r ; 字 / 分散共分散行列(群についてプール)の 宇/ ik }))abs( t m p { m x,k } ) i fa b s( t m p {, /宇算出 宇/ t h e n mx=i ; e n d ; i fm xn ekt h e nd o・ p r o cc o r r data=&data c o v outp=cov n o p r i n t ; d oj = kt o& n ̲ v a r ; swp=tmp{k, j } ; v a r %do i = l %to &n̲var; & & v & 1 % e n d ; t m p { k,j}=tmp{mx,j } ; b y& c l a s s ; t m p { m x,j } = s w p ; r u n ; d a t ac o v ; s e tc o v ;i f̲type̲="COV"; r u n ; e n d ; p r o cs o r t data=cov; b y name; r u n ; d oj = lt o& n ̲ v a r ; swp=inver{k,j } ; p r o c transpose data=cov out=t̲cov; v a r % d oi = l% t o &n̲var; & & v & 1 % e n d ; } ; i n v e r { k,j}=inver{mx,j i d &class; b y n a m e ̲ ; } = s w p ; i n v e r { m x,j r u n ; e n d ; e n d ; d a t at ̲ p o o l ; s e tt ̲ c o v ; d oi = k t lt o& n ̲ v a r ; div=tmp{i,k}/tmp{k,k } ; p o oI= ( % d o i = l% t o% e v a l( & n g ) ; & d f & i & & g & i宇 & d oj = 1t o& n ̲ v a r ; t m p {i ,j } t % e n d ; o)/制 f tot i v宇t m p { k,j } ; = t m p { i,j }一d keep p o o l ; r u n ; i n v e r{ i,j } p r o c transpose data=t̲pool out=pool; v a rp o o l ; =i n v e r{ i,j }一d i v宇inver{k,j } ; end;end;end; r u n ; d ok =直nvartolby‑l; /宇分散共分散行列の逆行列の算出 d oj = lt o& nv a r ; 宇/ i n v er {k ,j}=inver{k,j}/tmp{k,k } ; % I e t size=%eval( & nv a r刈 nv ar ); d a t ap o o l; s e tp o o l ; e n d ; a r r a y cova{&n̲var,&n̲var} coll‑col&size; d oi = k ‑ lt o 1b y‑ 1 ; a r r a y tmp{&n̲var,&n̲var}; d oj = 1t o& n ̲ v a r ; array i n v e r { & nv a r,& nv a r } ; } i n v e r { i,j =inver{i,j } r e t a i n tmpl‑tmp&size 0 ; r e t a i n inverl‑inver&size 0 ; m p{ i,k }; i n v e r { k,j }宇t r e t a i ns w p0 ; retain d i v0 ; end;end;end; d oi = lt o& n ̲ v a r ; d oj = lt o& n ̲ v a r ; keep inverl‑inver&size; 9 8

101.

nH HU ﹁ o u t ̲ ) (デフォルトは w / ヰ 本/ % i f& w ̲ o u t =% t h e n% I e tw e i g h t = w ̲ o u t ; / 本 k e y 〉 ー オブザーベーションの ヰ/ % e l s e% I e tw e i g h t = & wo u t ; / ヰ 識別コード ヰ/ d a t as c ; s e tp o o l ; / 本 (省略可) ヰ/ }i n v e r l ‑ i n v e r & s i z e ; a r r a yi n v e r { 3,3 / 宇 c l a s s‑)群を表す変数名 % d oi = l% t o& nv a r ; / 宇 nv a rー) O ' B r i e n指標の算出に使用する宇/ & & v & i = s u m ( / 本 % d oj = l% t o% e v a l( & nv a r ‑1 ) ; 本 / i n v e r {品i ,& j }; % e n d ;i n v e r { & i,& n ̲ v a r } ) ; ヰ / 本/ 本/ 変数の数 v a r ‑ ) O ' B r i e n指標の算出に使用するヰ/ ヰ/ 変数名(複数指定可) % m a c r oo b r ̲ c a l c ( d a t a,o u t,w ̲ o u t,k e y,c l a s s, % e n d ; k e e p % d oi = l% t o& n ̲ v a r ; & & v & i% e n d ; n ̲ v a r, v a r ) / p a r m b u f f ; r u n ; d a t aw ̲ n a m e ; ̲ t y p e ̲ = 's c o r e '; n a m e ̲ = 'o b r '; / ヰ 0 'B ri e n指標に使用する変数名を表す 本/ r u n ; 本 / グローバルマクロ変数の作成 ヰ/ d a t a& w e i g h t ; m e r g ew ̲ n a m es c ; r u n ; % i f& o u t =% t h e n% d o ; % i f& w ̲ o u t =% t h e n% d o ; 出i f品k e y =% t h e n% I e tf l a g = 4 ; p r o cd a t a s e t sI i b r a r y = w o r kn o li s t ; d e l e t et m p ̲ g r pt m p ̲ n gc o u n tt ̲ c o v % e l s e% I e tf l a g = 5 ; % e n d ; % e l s e% d o ; c o vt ̲ p o oIp o oIw ̲ n a m es c ; % i f& k e y =% t h e n% I e tf l a g = 5 ; % e l s e% I e tf l a g = 6 ; r u n ; % e n d ; % e n d ; % m e n ds c o r e ; % e l s e% d o ; % i f& w ̲ o u t =% t h e n% d o ; / 本 マクロ名:o b rc a l c e y =% t h e n% I e tf l a g = 5 ; %i f品k 本/ % e l s e% I e tf l a g = 6 ; /本目的 : O ' B r i e n指標の算出および / ヰ O ' B r i e n指標に基づく分散分析のヰ/ / ヰ 実施 % e n d ; % e l s e% d o ; 本/ 出i f品k e y =% t h e n% I e tf l a g = 6 ; % e l s e% I e tf l a g = 7 ; / ヰ ( 1M Lプロシジャを使用) 宇/ / 本 引数 ヰ / % e n d ; % e n d ; % d oi = l% t o& n ̲ v a r ; % g l o b a lv v & i ; d a t a ‑)解析対象の S A Sデータセット 本/ / ヰ o u t ー) O ' B r i e n指標の算出に 宇/ / ヰ 使用する変数 本/ v v & i = % s c a n ( & s y s p b u f f, % e v a l品 (i +品fI a g ‑1 ) ); および 0 'B ri e n指標から成る ヰ/ % e n d ; S A Sデータセット名 宇/ (デフォルトは o u tー) ヰ/ / ヰ 0 'B ri e n指標の算出に使用する変数の ヰ/ 本 / w ̲ o u t ー) O ' B r i e n指標の算出のために 宇/ / 宇 リスト(カンマ区切り)を作成する 本 / / 本 算出する重み係数の ヰ/ % g l o b a lv a r ̲ 1i s t ; % l e tv a rー I i s t = & v v l ; / ヰ S A Sデータセット名 ヰ/ %i f品nv a r ) = 2% t h e n% d o ; もA T ‑ A T φ + ︐︐ ︐︐J'''' / 本 出l e t 99‑

102.

0 'Bri e n指 標 を 算 出 す る % d oi = 2 %to & nv a r ; / 本 本/ 出l e tv a r ̲ 1ist=%quote(&var̲1i s t, &&vv&i); p r o c scoredata=std score=&weight out=tmp̲obr; v a r % d oi = l% t o& nv a r ; &&vv&1 % e n d ; %end;%end; r u n ; /本オブザーベーションの識別キーを作成する 宇/ / 宇 宇/ (オリジナルデータにない場合) d a t at m p ̲ o b r ; s e tt m p ̲ o b r ; 出i f &key=%then% d o ; %id̲key(&data, i d ̲ d a t a ) ; 出i f &key= %then % d o ; keep̲id̲o b r ; % e n d ; % e n d ; %else % d o ; keep &key o b r ; % e n d ; r u n ; / 本 O'Brien指 標 の 算 出 に 使 用 す る 変 数 の み を 宇 / /本含む / 宇 S A Sデ ー タ セ ッ ト を 作 成 す る p r o cs o r t data=tmp̲obr; 本/ 出i f &key= %then % d o ; b y i d 宇/ %else % d o ; b y& k e y ; % e n d ; 出i f &key= %then % d o ; r u n ; %var̲sel( i d ̲ d a t a,p a r t,&key,&class, p r o cs o r t data=part; & nv a r,& v a rl i s t ) ; % e n d ; % e n d ; % i f &key= %then % d o ; b y ̲id̲; % e n d ; %else % d o ; %else % d o ; b y& k e y ; % e n d ; % v a r ̲ s e l( & d a t a, p a r t, &key, &class, r u n ; i s t ) ; % e n d ; &n̲var, & v a rー l 出i f &out= %then % I e t result= o u t %else % I e t result=&out; / 本 欠 ; ,1 ! 1を含むオブザーベーションを削除する本/ d a t a &result; merge p a r tt m po b r ; 出n o̲miss(part, comp, &n̲var, & v a rー 1i st ); 出i f &key= %then % d o ; b y ̲id̲; % e n d ; %else % d o ; b y& k e y ; % e n d ; /本変数の標準化を行う r u n ; 本/ % i f &key= %then % d o ; 出z ̲trans(comp, s t d, &class, d a t a &result; s e t &result; drop i d & nv a r, & v a r 1i s t ) ; r u n ; % e n d ; / 本 重み係数の S A Sデ ー タ セ ッ ト の 作 成 本/ 出i f &w̲out= %then % I e t weight=̲wout̲; t i t l e "O'Brien指標に基づく分散分析"・ p r o c glm data=&result ; %else % I e t weight=&w̲out; class & c l a s s ; m o d e l obr=&class; I s m e a n s % i m l scr(std, &weight, &class, & c l a s s ; i t1e ; ru n ; t v a r 1i s t ) ; & nv a r, & / 宇 %score(std,&weight,&class, / 本 &n̲var,& v a r̲ Ii st ); ' ' ' ' J ' ' J ' ' *・'玄.︐玄・ /本または pr 0c dat aset s 1i br ar y = w or k n0 1i st; delete i d ̲ d a t a comp s t dp a r tt m p ̲ o b r ; ; q uit %mend o b rc a l c 100‑

103.

論文発表 金融・経済

104.

日本 SASユーザー会 (SUGI‑J) 民寸零毎ノミフォーーて7 ンコ<::.タミ沖斤呪〉来斤しし、毛見天ミ (2) 一一一 SAS/INSIGHT・ NNA・ EM の効果的活用法として一一一 長麦来斤庖豆 Gド製造業版) 陶山博太 企 菊7 動デザイン研知行/慶藤義塾大学総合政策学部,/ C l a y t o nU n iv e r s it y 代表取締役1 士長・主席研究員/講師 /教授・日本校理事 E 一回 i l : C Y M 01 0 1 6 @ n i f t y . n e . j p A New Viewpoint of Finance Analysis ( 2 ) H i r o t aS u y a 凪, P h .D P r e s i d e n t,T h eR e s e a r c hI n s t i t u t eo fC o r p o r a t eB e h a v i o rD e s i g n E I OU n i v e r s i t y L e c t u r e r, K P r o f e s s o r, C l a y t o nU n i v e r s i t y 己日 要 当研知行ではV 昨 SUGI‑Jにおいて、通産省「わが国の経営分析Jの対象となった製造業 ( 約 1000 社)について、 81 年一 95 年を対象とした 43 の財務指標による分析をおこなっ た。特に館業績の代表である総資産経常幸蝉 (ROA)を決める要因の確定を目的と戸。 今回は恒牒の研究を 81年一 97年までを対象に、非製造業(約 584社)についておこなっ た 。 キーワード: 経営分析、 R O A、S A S / I N S I G H Tソフトウエア、剛A、E n t e r p r i s eM i n e r 一103

105.

しはじめに 企業の財務戦略がこのところ活発化している。 フローなど、 ROE、 EVA、フリーキャッシュ (わが国にとっては)新しい経営目標や価値観がさかんに導入されつつ ある。このなかでも総資産経常利益率(以下 ROAと称する)は最大公約数的な指標 である。欧米の企業の大多数が、 RONOC(正味経営資本利益率)、 ROTC (和訳すると総資本利益率となるが、実際には税引き後営業利益 (NOPAT)を 営業資本(平均)で徐した値)など、この系統の指標を効果的に使用しており、また EVAを発案・提唱しているスターン・スチュワート社も、 ROEには否定的である ものの、 ROAは EVAと相互に関連する大変重要な指標としてとらえている 02〉 昨年('9 8年度)の SUGI‑jにおいて、製造業(通産省統計の 1000社余り) 年 分 の デ ー タ (1981 年一 1995年)を解析し、 の 15 要因を分析した ROA( Xo) を高める J今年は非製造業の 600社について、 198]年 1997年まで の 17年間のデータについて同様の分析をおこなう。 2 . ROAと他の要因の相関分析 本論文シリーズで使用する指標は図表 lに示した。(項目と変数名は全く同じであ る) X8 )、損益分岐点比率 製造業における ROA向上の要因は、売上高経常利益率 ( (X25) 、粗付加価値設備生産性 (X22) などが関係が深いことが予めわかって いる。すなわちこの場合のドライパーは、いかに付加価値を創造できたか(効率より も、結果として実現できたか)につきることがわかった。 非製造業でも事情は同じであろうか、製造業の分析の場合と同様、まず各指標の ROAとの相関関係をみることにする。 可ノ quηtF39 ヮFbnuzQUマtoo nuFhdμhunhuphu A ︒ oDηtoooDマt る xxx iqurD JλququnJ 関 相((( の率率 負担比率 い負率務率当 強費比対債当配 QU 104‑ ば却権権入配本 れ償債債買金資 け価上上本己 連 ヮ 96234893982 深減売売資自 が※※※ 関 ム /LFUnu‑‑FU‑‑nuηtマ t a u τ 標 ﹂ 指 28104837532 い 97888887778 AAAAAAAA 良 F 1J1J1J1J1J1J1J1J1J1j ︑ ノ マ 主 ﹁1469013450 liv‑‑1it‑‑ qLqムqLqムqLqu いx xxxxxx xxxx 小率率性 さ((((((((((︹ は益転産 ※利率回働生 常転産率労 上経回資比値 以本権定率本価 %資債固比資加 0 己上形座己付 7 自売有当自粗 ※資本装備率 労働分配率 付加価値率 ※損益分髄点比率 ※人件費負担率 あ))) 夕 ︑ ︐ ROA(X6)に特に関係が深いのは、次の 16指標である。(相関係数 Ir 1=

106.

%% ))率率 ))%%比))却 %%)))(())務月)%償 ((%%%率率月月債(%())価 率率(((担担((入率(率)%%減 費費率度率負負率率買比)率当%((産 動定子存担費用比比対性月当配(率率資 変固利依負却費権務権動(配本向配保定 高高金金費償融債債債流率金資性分留固 上上入入件価金上入上元庫本己当外内形 売売借借入減純売買売手在資自配社社有 v つ 際 扱 で A 斗品 N N タl 一2 デX 省 の必 業0 産2る 商X す 通ちと う要 じ日'ドい 標を 記準 上標 山山 所 1 0 5 no7EUQunu‑‑ワhquAJDnb7EUQunu‑‑ワhqu nLnLnLnLqundndndndndndqundquAτAτAτAτ / 人 xxxxxxxXXII11111111222222 xxxxxxxxxxxxxxxx Ln38住 民daU l 11 円 円 oonunUTI 円 LηJ8qFhJGU l 円 oDnunu‑‑ 円 Ln38住 民d 円) ))千% ))%)%)回()( )%%・%(%)))()性人性) %・・率(率()回目回率%)産/産﹀% ・率率減率益率回(((転(%生円生)%( 率減減増益利益(率率率回﹀))率(働千備%(率 滅増増(利常利)率転転転産%%%合率労(設(率比 増((益常経常%転回回回資(((適比値率値率値点 (益益利経本経(回権務産定率率率期本価備価配価岐 列高利利純産資高E産債債資固比比比長資加装加分加分 系 上 業 常 期 資 己 上O 資 上 入 卸 形 動 座 定 定 己 付 本 付 働 付 益 時 売 営 経 当 総 自 売R 総 売 買 棚 有 流 当 固 固 自 粗 資 粗 労 粗 損 xxxxxxxxxxxxxxxxxx 経営指標一覧 図表 l

107.

以上のように、相関の強い指標が多く、また系統が大変多岐にわたっていることが わかる。製造業の場合のように、デュポン・システムと付加価値系指標の比較だけで 説明できる状況ではない。 統計的視点を一旦離れ、あえてこれらを経営的な視点で分類すると、以下の 5グル 第 「 ープに区分できる。 1Q)~l}J; ープ: 当座比率 経営体均するもの 自己資本比率 倒産の危険性が少ないことと、ビジネスチャンスに対して、ある程度以上の規模 の投資をタイミングよく迅速に行える余力をさしている。 第 ト 2山 小 船 巧 仰 す る も の 有形固定資産回転率資本装備率減価償却費負担率 一 . ̲ : : : J 底舗や流通システムなどの設備更新を、的確におこなっているか否かの指標であ る。資本装備率が低いほどよいという考え方には賛否両論あるが、そもそも非製造 業のほとんどは、多様な顧客ニーズに応じられるか否かに正否がかかっている。し たがって過度の無人化、装置化は(ナマのお客の顔がみられなくなるので)よい結 果を生まない。すなわち、データマイニングによりニーズを掴むことはできても、 それを実現するには人同士のふれあいが何よりも不可欠なのである。 また有形固定資産回転率の分子は売上(営業収益)であるが、それは投資の効果 実現を示している。(実現の効率は採算関係の指標で判断する) 一切ープ同件商売のロジックに関するもの 売上債権回転率売上債権比率売上債権対買入債務比率 これらの指標は、とりわけ解釈の難しい部分である。いずれも ROAの良否と逆 行しているからである。しかしいずれも強い相関をもっており、勘定系では ROA とこれらの指標は相互に結合しているため、疑似相関とはいいにくい。 これは、むしろ商売のロジックといってよし、かもしれなし、。個別に統計をみて みると、製造業は 15業種、非製造 10業種に区分されているが、業種ごとの振 幅は非製造業の方がはるかに激しい。上記のうち、 2指標の業種ごとの最大値と 最小値を示してみる。(図表 2 ただし平成 8年度データ) 1よ p o nU

108.

図表 2 商売のロジックに関する指標の、業種ごとの最大値と最小値 ! 非製造業 製造業 最小 I 売上債権比率 (月) 最大 最大 1 .6 4 売上債権対 買入債務比率 (%) このように、製品の版売ルートの違い等、限られた条件に左右される製造業と 異なり、さまざまな商売の形態がある非製造業では、最大値と最小値の聞に、時 として 10倍近くの指標の差が存在する。 売上債権比率の最小値と最大値は、それぞれ外食産業業と建設業である。また 売上債権対買入債務比率は、最小が小売業、最大がその他サービス業である。 債権債務に半分工事未収金や前受金等がある建設業など、これらの指標は単に 値の大小ではなく、業種ごとの最適値が存在するようだ。さらに同じ業種でも、 新業態が発生すれば、その最適値は既存の同業他社とは異なってくる可能性が高 し 、 。 いいかえれば、非製造業でこれらの指標を判断するときは、値の善し悪しより、 ROA (成果)とこれらの指標(商売のロジック)が次第に同期してゆくことが、 事業基盤確立への学習過程を表現している。したがって、両者のつながりを検討 する上で、次節でとりあげるニューラルネットワーク・アプリケーション (NNA) の適用が求められる。 「 第 4のグループ 採算面に関するもの一一一一一 l 宇 E付加価値労働生産性 I ;※人件費負担率 i 労働分配率 付加価値率 ※損益分岐点比率 、ずれも負の強い相関をもっ。小さいほど有利な値には※を記した 第 3のグループ同様、解釈が少し難しい部分がある。収益性が高い (ROAが 高い)ことと関連がダイレクトにつけられるのは、損益分岐点比率と人件費負担 率である。それ以外のものについては、考察が必要である。 まず、粗付加価値労働生産性は、付加価値額自体が低ければ高くならない。 i ウ n u ‑ ‑

109.

この点については、付加価値率と同じベクトルによっているので、事業の基盤 が整うにつれて、フランチャイズやアウトソーシング等の形態で、業務プロセス を外部に遺憾することが可能になるためとみられる。(そのほうがむしろ効率的 である。)しかし労働分配率については理屈づけができない。なぜならば、前述 の理由で、外部購入価値が増えて付加価値は低下したのに、さらにそこからの人 件費の配分が減少するというのは不自然だからである。 「 第 5仇 ー プ 問 問 係 す る も の 一 資本金配当率 自己資本配当率 一 二 コ これらは、株価を上昇させるなど、資本市場(証券市場)での評価を上げるた めの政策変数である。実際に評価が上昇すれば、より効果的な資金調達を可能に するが、いったん外部の世界を介するので、これらと ROAの勘定系での直接的 関連はない。つまり疑似相関の可能性も高いが、一方で次期投資の資金源となる 大きな成果の入手が可能なのである。 ROA向上に対するインパクトには両極端 の結論が考えられよう。 3 . 指標グループが ROAに及ぼす効果について どのグループがもっとも ROA向上に寄与するかは、いずれも相関係数が高い のであるから、そのままでは甲乙の比較はできない。そこで相関関係が高かった 指標を前節で分けたグループごとにまとめ、それらを入力層、 ROAを出力層と したニューラルネットワークを組むこととした。 すなわち、各グループごとに学習効率を比較し、 ROAの変動に、もっともス トレートかっスピーデ、ィーに影響を与えるグループはどれかを比較する。 前項の経営的視点から、仮説に順ずるものを設定してみよう。 第 lグループ吟(学習曲績は)スムーズに早く収束する 投資等、経営上の活動を自由におこなえる前提条件、これらが 高水準であれば、経営上の成果があげる政策を、好きな時に迅 速に打つことができ、 ROA向上に即効性がある。 第 2グループ吟収束スムーズであるが、徐々(なだらかな下降 カーブで)に進行する。 経営資源の循環をスムーズであるかを確認する指標である。順調 に推移すれば次第に ROAを押し上げてゆく。 ‑108一

110.

第 3グループ時特徴的な動きとなる。決してスムーズには収束しない 商売のロジックを確立することと、 ROAの動きにはタイムラグ が発生する。両者の関係は不安定である。 第 4グループ時早く収束するが、不安定な動きが若干みられる。 採算に関するものは ROAにダイレクトに影響を与えるか、通常と 逆の考え方をしなければならない付加価値率や、労働分配率のよう な不透明要素があり、これらが揖乱項となる。 第 5グループ時全く収束しないか、迅速に収束するかの両極端である。 証券市場からのフィードパックを成果につなげられるか否かで 収束度合いは異なってくる。 2変量のみの分析では最も判断が つかない。 実際の分析条件は、中間ニューロンを入力層と同じ数だけ配置し、予備 学習回数と最大学習回数を、それぞれ 250固と 50固に設定した。昨年 の製造業における分析の場合と同様、粗付加価値設備生産性と資本装備率 は標準化して使用した。 (他の殆どの指標が%であるのに対し、これらは千円単位である) 4 . 各指標グループの分析結果 分析結果は図表 3から図表 8までに示した。要約すると次の通りである。 1.第 lのグループ(経営体力に関する指標)は仮説どおりの効果 を示した。すなわち 4回固までの反復学習で、ほぼ完全に収束 した。ちなみに残差が、それ自体わずかであるものの、プロッ トに循環性があるのは、まさに他のグループの変量が ROAに 彰響しているからである。今回の分析ではほぼ一貫した傾向と いえる。 2 . 第 2のグループ(投資の巧劣に関する指標)も lと同様、仮説 どおりの学習結果を示した。誤差は斬新的に減少し、 25回目 の反復でほぼ収束した。 3 . 第 3のグループ(商売のロジックに関する指標)では、不規則 な収束がみられた。最初の段階である程度の収束があったもの の 、 40回目の反復学習まで高い誤差を維持しつづけた。 4 . 第 4のグループ(採算面に関するもの)は、各グループ中最も 効果的な学習を示し、仮説で懸念した揖乱的要素はあらわれな かった。このグループが ROA向上に識重要とすると、製造業 での分析と同じことになる。学習曲線も大変よく似ている。 念のため、 ROAとの関係が不透明な指標と、明確な指標との 差異を、個別の学習プロットで比較しておくことにした。 それによると、明確な関係を持つ指標(損益分岐点比率)は、 誤差収束後も継続的にネットワークがシナプス結合を試行錯誤 的にコントロールしていたのに対し、関係がはっきりしない指 標(労働分配率 (ROAに逆行) )では、断片的にしかニュー ロンの結合がトライアルされていないことがわかった。 ‑109

111.

図表 3 第 lのグループ(経営体力に関するもの)を入力層とした 場合の NNA 学習曲績と学習プロット 1SBC 対 反1 夏固鼓 る 白 句 ︑ ︑︑ 13 ︑ ・ aB 白¥¥ ¥¥ ゐ争 包眠︑︑︑︑ M ・ ' . b B︑ ''φB B'‑‑s&s''φb φ &&&' ︑ ︑ ︑ ¥︑ ︑﹄ 1l 2i 1‑ 4‑ it Ii it Bi I‑ t‑ ‑1 ‑1 I l 1 11 11 11 11 11 11 1‑ 1‑ i‑ 1j i1 z1 ‑1 ‑j 11 11 11 11 j i 一 ‑ 一 ‑ 一 ‑ ‑ ‑ ‑ ‑ ‑ 一 ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ 一 ~BC 対度祖国車生 I 度梅田理主 二比三j 旦比」 一 翌 五 」 園田園盟国置1'::,E'="lニニーーーーー士士=~ 白 雪 村 NNOBS き官妥結果 1 E I l b I I l Z I I l . l i オプザベ』多~ " ン 番 号 軍 軍 軍 目 楓4 竃 」五」 守司守予量出直 旦主主」 守曹司謹書畠 二止三J l~ lT T ム ー ム nU

112.

図表 4 第 2のグループ(投資の巧劣に関するもの)を入力層とし た場合の NNA 学習曲線と学習プロット lSBC 対 反1 夏固紋 ~BC 対医祖国理主 j j │ ¥ ¥ ¥ ー1 1 ‑ 1! ‑ 1 1 ‑ , & l~ l D H ID !~ 反復回直立 1 1 1 ; 1 ¥ I 二止三J 旦三三」 1 ë 「扇面五¥附.jp.. l: PL':IT3 :, Þ:SE,:,一一一一一一一一一一一一~1: , : : lX6 対 学雷結果 NNOBS 車 噌 司 車 , u 申 m 事 , 雪 量 事 R 哩 巳2 ' * 。 車 噛 事 8 日 日 l D I I lZ 朱 司R ' * 事 l! l i l ヘルブ i にU lL ヌ「プザペーキ/" ン 番 号 草本軍目掴直 拡大 守司守予温政宜 閉じる│ 坤 哩ー哲司ヨ置聖書畠 ,r l 1 1 1

113.
[beta]
図表 5 第 3のグループ(商売のロジックに関するもの)を入力層
とした場合の NNA
学習曲線と学習プロット
lS
B
C 対反復図書主
~BC 対辰徳田寄生

B

¥一一

‑
l~

u

B

l~

,

H

~

反宝庫回2&t

旦旦」

」ぇ」

二比三j

四回隠│

1
約 RK
.Nf
'
.
l
.
!
l
,
4
らP
L
O
T
:
:
:
.
G
F
:
S
E
G
lX6 対

NNOB~_

事
<
>

卑

学習結果

申

"
<
>

功c

<
>

ち

ち

牢

<
>

骨

*

本

"
守

b

〈
b

c

8

φ

?

53

て
2
包

LB

d

ム

l~

I
I

?

lZ

車

宋

♀

宋

傘

db

GB

見Z

RE

RJ

l
t

l.

l
i

II

lT

ヘルブ

i

ヌ「プザペ '_VQ~ 審号

ヨ ド 草 草 目 掴f
直

拡大

守<:)'0'予園出直

閉じる

守曹司iI!C怠

1よ
1よ

η4

114.

図表 6 事4のグループ(採算面に関するもの)を入力層とした場 百の NNA 学習曲線と学習プロット 一一 iAVERR 対 反 復 凶 獄 、j ふ主 Z 宇 ふ じ ξ ~ 1D IEti‑‑btitiE illillit‑‑ F i‑‑B iF iF iF iF iF iBiiili FFFFFFFFFFFFFFF77F Db bb bb bb bb bb bb bb bb bb bb bb bb bb bb bb bb b b ‑一 e‑‑e‑‑‑‑‑ Dbb bb‑ bb bbbbbDbbbbb 3 5 l~ l Z I I l . 反復回数 1 1 1 : 1 ¥I ニ止乙jj 旦旦」 │ ",1'",'()F:K._NNÞ.5, (~PL()T2.GF!::::EG で τ ず ー でτ ず ー 戸口守 NNOBS ? と 令 2 牽習詰菓 量 ま 時 蹟匝隠i 一 申 望 E 事 事 申 t 1 I 2 主 申 l~ I I ヨ E l~ 市 車 車 申 l t 1• l i lS f プ ザ ペ "̲V‑'Iン審号 草 草 草 目 掴f 直 ?可守予副宣 」ぇ」 守 宅 ? 哩 E主 主 二主三j 1 1 3 申

115.
[beta]
図表 7 個別指標の学習プロット比較
一一採算面に関する指標のうち、会計的に ROA(X6) との関係が
深い指標(損益分岐点比率:X 25) とそうでない指標 (X23)
の違い一一一

l
X6 河 X
2
3
: 学醤結呆

』
唱

昼、ー』

日ー

、

♀~

申車事官

牢

車
市ーま申

q

。 a 同色。

l
!

!
I

I
I

I
I

n

1
1

I
1

i
L

I
1

I
1

司

i
!

i
!

jj

4

i
E

u

1
1

1!1
車 市 草 目 担'
;
1
直

骨骨守予園山直

閉じる

拡大

E 曹司直藍富島

i

ヘルプ i

一竺主!と巴1
1
1
竺三liIIIII竺'*一一一一一一一一一一一一一一一一一一一一‑聖里堕j
lX6対 X25・ 学 官 結 果
,

ー
‑
ー
ー
ー
ー

宣
告

事♀

考

事申

♀

司

u

百由,"0

C
T

自

E
!

噌 辛

牢
申

~

、

S
L
.
.
.
e

B

I
1

I
D

市咽帳

甲

国-~目。

1
I

1!

Ui
草 草 草 自 慢4
直

拡大

守守守予橿血直

閉じる

1
1
4

i

<:r
宅?で, l
I
!
量
富
島

ヘルゴ i

I
!

116.
[beta]
図表 85のグループ(株主対策に関するもの)を入力層とした場
合の NNA学習曲線と学習プロット
lSBC 対反沼田叡

卜~
,

‑
1
0
.~

‑!O.!
‑
1
0
.

‑
1
0
.&
‑
1
0
.f
‑10 自
‑!!.
1
l
O

Z
O

閉じる│

拡大

!o

ヘルブ

i

llllll!II9I川!mIi!!UIωη ら F::~:日
lX6 対

NN08S

申
坤C

~

属国民

学習結果

l
i
!

喧
S

坤屯
申

事

事

車

車

申

暗

宋

骨

申

車

l
i

lS

,
、
ET'E'5
,
.
,
,8
T'

寸
a 22z,
E
守 c >

<
o
l

.
:
:
>
γ
I目 E寸
e

g'
寸
ー
,
8 ,
E,
a
‑
re g o
‑
r

l
O

I
I

u

lt

l.

す プ ザ ペ "'̲VQン 番 号
草 草 草 目 楓4
直

拡大

H

守 司 守 予 皿 直

閉じる

0‑て?宅ヨ置豊富畠

ヘルプ

i

暗

E
l

にU
1よ
1よ

117.

Aす 般 と こ 面 い ル る Oら 一 標 る い て ラ す Rか が 指 す す し 一 定 て点断該在や化ユ策 し視判当存し雑ニを 較うのにがの複︑ト 比 い 否 l性 ル り し ツ とと良第特一よ類セ 業動の︑のロが分略 造活︒そはとトトを戦 製営る︑因ごンツれな ︑経いは原種コセそ雑 は︑てての業ののら複 てがいっそに標略か︑ いるつよ 02 指戦点で おれびにる第分い視点 にら結標い︑いなるた︒ 業じて指てとならみえた 造感つ︑れこでなを加え 製にもはまる造ば動を考 非うを徴含あ製れ活較と ︑よ係特もで社け営比た にる関つの関白な経互れ うあ果立も相︑し︑相ら よで因目る似と定はるえ た富はにな疑る設でよ与 き豊れ上異がべ︑稿にを てがぞ以と係比で本クト み点れれ析関︒に方︒一ン めで視そそ分のる業一だワヒ と ま の ︑ た 務Aあ造るうトの ま 今 上 と ま 財O で製あよツ合 向 る の Rと が る ネ 場 ‑116‑ す6ま 束は回 収プ固 な一 2 速カ1 迅東て ︑収し は︑東 でし収 )だに 標た速 急 指 o るだ後 すうの 関よそ にた︑︒ 策つした 政ま移し 主は推了 株てに終 (あかに プがや全 一説る完 ル仮ゅは グうで習 のいま学 5と目に 第る回で phd phd 1 ) Gベネット:スチュワート E世著、日興リサーチセンター訳 rEVA創造の経営J (東洋経済新報社) 1998年 、 P p 9 9 ‑ 1 0 1 o 2) 陶山「財務パフォーマンス分析の新しい視点一‑S A S / I N S I G H T とN N A の効果的活用法としてー一一 J r 第 17回日本 SAS ユーザー会総会および研究発表会論文集J (日本 SASユーザ 、 ー会/SASインスティチュートヅャパン) 1998年 p p 3 1 3 ‑ 3 2 0。

118.

追記 本論文で使用されたデータセットについて EM (エンタープライズ・マイナー)を使用し て決定木(ツリーベースモデル)によるモデリングを行ってみたご T a r g e t変数はもちろん X6:総資産経常利益率である。それによると下図のような結果 がでた。 X6 (平均 2 . 5 9 ) l 凶 7:在庫到l L J 1 .22ヶ月未満 1 .22ヶ月以ヒ 屋三亙 匿三亙 1 lX20 粗 付 加 価 値 労 働J生 産 叫l l 凶 0 配当性向1 1 ↓ ↓ 57%未 1 l M j E二 豆 ヨ 17593千円未満 17593千円以上 医6 3.04%1 匪二亙亙 57%以上 区6 2.0%1 降一肌一 以一 Z 一 年一 一 f 二り一 ハ 臼 EU﹂ O A M 一円以一 新一%一 一 1人 一 Aせ一 一 1 二 O 一 ︑ 一 同一 2 1i Qd 一 ﹃ 九 一 どのような商売のロジックで行うにせよ商品サーピス遂行力の(仕掛)負担は、製造業 よりむしろナーパスにマネジメントしなければならない。結局 資本循環プロセスをし、か に意識するかが多岐にわたる非製造業の底流に流れる大事な要素のようだ。 一1 1 7

119.

日本 S A Sユーザー会 (SUG I‑J) 混合正規分布による VARモデル 甲田恵 株式会社 加藤浩一 角谷督 金融エンジニアリング グループ, E コンサルタント AS t u d yo fP o s i t i v eK u r t o s i sN o r m a lD i s t r i b u t i o n o fD a i l yS t o c kR e t u r no nVaR MegumiKoda SusumuK a d o y a K o i c h iK a t o C o n s u [ t a n , t F i n a n c i a lE n g i n e e r i n gGroup,I n c 要旨 株式収益率を日次で取り扱う場合、収益率分布はフアツ卜・テイノレとなり、正規分布でリスク捉 えるとリスク量を過小評価するO 解決策としてハル・ホワイトの提案する混合正規分布を用いた VARモデ、ルを開発した。ハノレ・ホワイ卜は、為替レートの変動に適用したが、ここでは、日本株に u l t i v a r i a t e‑GARCHを用いた。 適用した。また、 2次モーメントの予測には、 M hht ワ キ ファット・テイル、 GARCH、SAS 八MLソフトウェア、 NLINフ。ロ、ンジャー 1.はじめに リスク管理のための VARモデル構築にあたって、日次の株到収益率分布が正規分布に比べ てフアツ卜・テイルとなることは重要な問題で、あるO 日次のリスク管理に収益率の正規分布を仮定 することは、予想外のリスクを被る可能性がある。このような背景から、ハノレ・ホワイトの提唱する 混合正規分布を用いた VARモデルを検証した。ハノレ・ホワイ卜は、為替レートへの適用を提唱 したが、ここでは株式市場についても同様に有効であることを示す。 最初に、第2章で日経平均 225種の日次株価収益率分布の形状のファット・テイル現象を示 す。次に、第 3章で混合正規分布をあてはめた場合のパラメーターの推定と予測力の有無を検 証する。第4章で、モンテカルロ法を用いた VARモデルの構築について述べる。株式収益率の 2次モーメントの予測には GARCHモデルを用いた。そして、 VARの推定値を算出し、正規分 布を用いた場合の VARとを比較検証したc 1 1 9

120.

2 . 市場データの分布形状 , t期の株価を S ,とするとき、日次の株式収益率 X を , X =l o g S,‑ l o g S ー ,l で定義する。また、株価の変動をドリフト部分と確率変動部分に分けて dS, = μ, S, +σ, S, w で定義すると、引はドリフト μ rとσ, W, に分けられる。つまり、 V AR計測のための分布形状は σ, W, を調べることとなる。 ここで、は U, として無担保のコール・レートを用いて、 X, 一μrの分布形状を検証した。 以下、本研究の収益率とは、コール・レートに対する超過収益率を指すものとする。 3年 1月から 9 5年末まで 以上の定義によるデータを用いて、分布形状を検証した。期間は 9 等分した度数分布と階級値に正規分布の確率密度関数をあてはめて である。実現収益率を20 描いた分布が、次のグラフである。実際の分布は正規分布に対して急尖形となっているのがわ かる G このような分布では、裾の面積が正規分布に対して大きく、不測のリスクを被る可能性が大 きくなる。 l 9 3年 1月から 9 5年 1 2月) . ‑ ¥350 r ‑ ‑ . . . . . . 分布比較(期間 一一一ず…………,……町一 . . . . . . . . . . . ̲ . . . . . . 1 40 !3 00 ~ ! 一‑‑;;;;布石ふ面画te)1 3 5 ・三空Z 竺 主f 空費堅右目I)̲J 13 0 八 FhunURunu ntnt414IRunU 250 r‑:十l j7‑ i13~乙 lj 120‑

121.

3 . 混合正規分布による分布の近似 2 .より日次の株式収益率は、正規分布から事離していることが確認された。このような分布を 表現するために、ハル・ホワイトの提案する混合正規分布を用しも。混合正規分布とは、 2つの 正規分布を加重、合成したもので、 e rの確率密度関数は g ( er) = r z r1‑p r : ! ‑ ‑exp(一ーよー)+ ~r e x p (一一÷τ) . . J 2 J cuo‑ ‑ ‑ . , 2 u σ2 l 2 J cv σ 2 v "σー ァ 2 . ち となる。ここで、p,u,Vは適切な分布を推定するパラメーターとなる。 また、これらパラメーターは混合正規分布と正規分布の 2次のモーメントが一致するように 決められるから、制約式 pu2 +( 1̲p ) V2 = 1 を満たす必要がある。 ソフトウェアのサブ、/レーチンである NLPQN を用いた。 パラメーターの推定にはIML 目的関数として、混合正規分布の対数尤度関数 rn xp(ーームー) e2 1‑n e2 1 l= yI o g l̲̲̲E:̲e + . : : . . . . ー 乙e x p (‑̲‑ : τ )I 十 I UO ‑ ‑ . ‑ , 2u" σ f v q d σt2I I r‑ 【 を用いて、 l を最大化するようなパラメーター p,u,Vを求めれば良い。 推定されたp,u,Vを用いて、混合正規分布に従うことを仮定した収益率分布と実際の分布、 正規分布を仮定した分布は次のグラフである。推定期間は 93年 1月から 9 5年末までの日次 7 ‑ 1 三 │‑ i ‑ E p, u〆 ) ニ( 0 . 8 3 : 3, 0 . 7 4 4, 1 . 7 9 8 )であった。 推定されたパラメーターは、 ( データである。 豆戸規ケ両日五百日百 ‑ 1 一一一一一ー実現リヲーン度数 (左軸) イ 35 l > ‑ . . / , ~ ‑ o~ , ‑ 一 ー ー 混 合 正 規 分 布 確 率i 30 密度(右軸) I 25 正 規 分 布 確 率 密 度l (右軸) ~ 20 200 150 15 100 10 、 、 50 。 3 5 11 13 。 5 15 17 19 I i η4 1A ‑ A

122.

正規分布より混合正規分布のほうが、実際の分布に近いことがわかる。 次に、推定分布の時系列での安定性を検証する。推定した分布形状が安定していなければ、 VARによる最大損失額の推定に利用できない。ここで、 93年 1月から 95年末での推定パラ 6年 1月から 98年末までの実現値にあてはめた。 メーターを 9 以下のグラフは推定分布と実現分布のグラフである。この場合も君、尖性の特徴をよく捉えた推 定分布となっているのがわかる。 ‑ ‑ ' ‑ 一 ー 斗 一 一 一 一 505050 O J L L J 1 1﹂ ω 2 0L . 一 一一山率度 一一議確密 一一浸布率一 一三分船確↑ 一一ι規持布一 一一一切正何分 一 一)一一現)合度規持一 K1 4i﹂ 一昨一一↓軸 一 ﹁ り 一 h i ﹄IUV 一時一一‑﹂ 一 4 μ一 宮十一夕︑南 ‑ F ‑ 市 工h ¥叶︑ 41 牝何一メ 恒三 中民一完 間=フ従l 期一パげ nU U 一北川 4市川一︽ソ﹄ 社一の戸 分一日一仕丸 31 一作ω 肌 n u n﹁ 一 4 0 L 2 3 4 5 6 7 8 91 01 11 21 31 41 51 61 71 81 92 0 」 4 . VARモデ、ルの構築 4 . 1モンテカルロ法 混合正規分布の累積密度関数 Gは、収益率を z=x‑μ とすると、 G =pN( 土 )+(1‑p)N(L) u σ v σ であらわされる。ここで、 Nは正規分布の累積密度関数である。 この G に対して、区間 [0,1 Jの一様乱数を与えれば、 P,u,V,σが所与のもとで、混合正 規分布に従う収益率Xの乱数を発生させることがで、きる。 プログラムでは、 NLIN フ。ロシジャーを用いてモデル式l こGの式を入れれば、容易に解くこ とができるc 1 2 2一

123.

パラメーター p,U,V,標準偏差の値をマクロ変数 & p、& u、& v、&stdで与えるとき、 1 0 0 0 回の乱数発生フ。ログラムは %do i~l %to 1000; data est; G~ranuni ( 0); run; proc n1in data~est iter~10 noprint outest~est panns x~0.005; mode1 G~&p*probnonn(x/&u/&std)+(l-&p)*probnorm(x/&v/&std); run;quit; data est; set est; i~&i; if _type_~"FINAL" run; proc append out~rand;run;quit; %end; となる。 4.2 GARCHモデル 4 . 1で乱数の発生手順について述べたが、標準偏差を所与として扱った。実際は、この 値も推定することが必要であるこヒストリカル・デー夕、指数平滑化法による推定も考えられる が、ここでは、 GARCH( 1,1 )を用いた。 種の超過リターンが、ホワイト・ノイズとなり、 2次の コール・レートに対する日経平均 225 モーメントに時系列のクラスタリングが見られれば、 GARC卜lモデ、ルが適用で きる。 ホワイト・ノイズ化されているかどうかは、定常・非定常の検定と時系列の相聞を調べれば [とすれば、 良い。定常性の検定は、 t 期の収益率を Z zf=戸 [‑1 +C[ として ‑123

124.

Ho:ρ=1 H1 :ρ<1 を仮説検定する。しかし、ここで ρ=1のt検定を用いることはできない。 なぜなら、 ρの推定値の分散は、 1‑ρ2 V αr ( p )=一 一 一 n となり、 ρニ 1で、分布は点となってしまう。そこで、、 O i c k e ya n dF u l l e r( l9 7 9 )によって与えられ た OFテストを用いることになる。 +f,の両辺から z トIをマイナスして、 Z r = 戸ト 1 , , (ここで d= 1‑ρ) 企z = 0 2 ' ̲ 1+f とする。 Ho:d=O H1 : d<0 を検定すれば、 ρ=1かどうかの検定と同じである。 直は t分布しないがモンテカルロ法で、分布表は与えられる。 このときも、 d OFテストは、 SAS/ETSソフトウェアにより、 %OFTEST品、うマクロ言語として提供されて いる。階差を O !こ指定してテストを行なえば、定常データかどうかの判別が可能である。 時系列の相聞についてもARMA プロシジャにより、自己回帰モデルが利用できるc U n i ‑ v a r i a t eGARCH!こ関してもプロ、ンジャで、処理可能で、あるが、ここでは株式と債券の相 u l t i ‑ v a r i a t eで推定を行なうため、 SAS/IMLソフトウェアを利用した。 聞を考慮し、 M 株式収益率、債券収益率の t期の 2次モーメントを σ :、σ J、共分散を σ, とすると z b 2 ゴ 2 市 ZL町 Ft‑EEE E ‑E E ‑E E ‑EE 守EEEEEEph‑BEBEEEEE﹃4 EEE ril‑‑111111EL ・ ・・ ・・ ・ 123 ααα + ・ ・・ ・ 卸 2 卸 EEEBB‑E E ‑E E ‑EEEBB‑ ﹃ 2d σσσ 123 E E ‑E E ‑‑a'EEEEBEt ﹂ ‑‑Billi‑‑BEE‑ r '・ ・ ・ ・ ・ nynyoμ' + rBilli‑‑lllL ﹃EEa'EEEEEEEEEBEBB‑d 山 FE'ZEgEEE''EEEBEBEE‑‑‑﹄ 町山内町 一 一・ ・ EE'EBEBEE‑‑E E ‑E''EE ﹃ 2db2L σσσ 4tム λ は宝 n J臼

125.

により推定することになる。 E は当期のショックをあらわし、債券・株式共に、コール・レート に対する超過収益率となる。 ここで、パラメーターの数を減少させ、推定される共分散マトリックスが p o s i t i v e ‑ d e f i n i t e となるように、パラメーターを W1= W2= W3 , s 1=s2=s3'α1=α2 =α3 として簡略化した。このことで、推定される共分散マトリックスは s i n g u l a rとnon‑singularの i n g u l a r となるため、パラメータが収束しやすくなる。また、資 和となり、ほとんどの場合に s 以下であることを考えると、行列式はプラスとなることが期待されるため、プロ 産の相闘が 1 グラムでは行列式0以下とならなし、ょう制約を加えた。 SAS/IMLソフトウェアには、オペレーターとして s 戸 市q r、s q r s y mが与えられており、この オペレーターを用いることで下三角行列から平方行列、平方行列から下三角行列への変 換が容易に行なえる。 パラメーターは対数尤度関数を最大化することで、推定することとなる。債券指数として 日経公社債インデ、ツクスを用いた。 120日の目次データを用いて、次の日の分散・共分散を推定したときのグラフが次のグ ラフである。過去 1 2 0日間のヒストリカノレ・データの平均と比べ、実現値に対するの反応が はやいのがわかる。債券と株式の共分散には、実現値にトレンドが見られることから、株式 n i ‑ v a r i a t eモデルより、 M u l t i ‑ v a r i a t eモデルがふさわしいと思われる。 のみの U GARCHに よ る 推 定 株 式 0.002 0.0015 0.001 0.0005 。 Ff, 〆 ぷ ,dpJ J J Jぷぷ dpdf/dp 45PJ4Fぷ c T Y ~宇ぐ宇, dd 争 寸 グ ,O J ~全寸 dsbd宇寸 dS2dd2d全 d'd' nJU Fhu

127.

毛 ﹄ ノ﹄ ノ ノ ﹄ 内 ノ ﹄ 内 今 l E 4 内 J W Enkuaa﹃ nhuFhunud 唱 4 内d nnu W 内 J W l lEnxunxunud 噌E 唱 マqu 屯 n r︐ 町 u 4JwaA 寸 ‑ n n nHunHunHunHunHunHunHunHV 町 町 nHunHunHunHunHunHunHunHU・ lv‑ vmvmvmvmwmwmwmum‑ U nHurunHunHunHunHurunH一 値目川町何叩川 521‑ ︐ マ ﹄ ECONOMICFORCASTS"FORTHEDITION,McGraw‑Hill1998 lEaA 寸FhuaA 寸 内4 J W E qJunkU 唱 nHUrhdnHunHUnHunHUrhdnHU 一 νゐνゐνゐνゐνゐU A U A ν ゐ一 一 円マU q d マlqr dnHVマl a a 斗 司 dqLqLqr dqda 一 ︐ ﹄ 一 nHunHunHun司 HunHunHunH一 u nH一 V 斗 司 ﹄ 斗一 一 nHunHunHunHunHunHunH一 unHV 一 一 一値目幻自叩川 521‑ ィ⁝ タ 88470957 γ 一 lEnJ﹄ ‑ ‑JFaA 寸nHunHunHunhunHV 唱 h u ‑ n u 唱 lEnHV 唱 lEnxu EnJ' F J n lEnHunHUE ‑円 ﹄ n HunHunHunHunHV 唱 ‑00000000一 ︒ ︐J︑ ︑ ‑ ‑127一 ‑レ E 一 ョ イ タ 71413039一 ﹄ ﹄ ノ H V ¥/nHunJ nHun nudnHuaA 寸n 1 ‑‑‑nhU 旬'﹄ n H Ut rhunJιnJι 唱1一 唱l 上向﹄ n HunHunununHU 唱 lnunU 一 二 0000Goo‑ 一/一 向︒︑︑目白一一 ︑一 n u u ン ︑ n u u ン一 ︑ n u u izilia‑i 会白川ねト nHur町 unHur町 unHU τimnU7IEdqL ‑ 戸 一 一 QQQ 分一 規一目見 wmzz 値ア値ド一 大ジ小囲引一一 和 一 最 3 メ1 最範トモ・ 一 一 一値ア値ド一 一大ジ小囲引一一 一 最 3メ1最範トモ一 布一目見出目見一 ¥コ一円 UEunUEunU 四吾川 752一 今後の課題 今回の GARCHモデルでは、パラメーターの制約により、かなり簡素化したモデ、ノレを用い た。より適切なモデ、ノレに改良することが今後の課題となるでLあろう。また、リスク管理モデルとし ても、株価指数ベースでの管理となっており、個別株への適用が今後の課題である。このとき、 信用リスクをモデル内に採り込むことも重要となってくると思われる 適切なリスク・テイクとその管 O 理の重要性から、より精度の高い手法の確立を目指したし吃考えている c 参考文献 [ l J蓑谷千風彦「計量経済学」、多賀出版、 1997 lanWhite 、 Valuea t 阻 止 WhenDaily Changes i n Market [2JJohnH u l l .A o u r n a lo fDERIV ARTVES, Variables a r e not Normally D i s t r i b u t e d "、TheJ VOL .5/NO.3/SPRING1 9 9 8 d r e wW.LO・ A .C r a i gM a c k i n l a y, TheE c o n o m e t r i c so fF i n a n c i a l [3JJohnY .C a m p b e l l .An r i n c e t o nU n i v e r s i t yP re s s1 9 9 7 M a r k e t s ",P .Pindyck・ D a n i e lL .R u b i n f e l d, ECONOMETRICMODELSa n d [ 4 JRobert S

128.

日本 S A Sユーザー会 (SUG I‑J) 多元的株価モデルとリスク管理に関する実証的研究 日米両市場における実証分析を通じて 宮村幸夫 執行役員(金融研究担当) 株式会社 金融エンジニアリング・グループ AnEmpiricalStudyo fMultiDimensionalStockModel i nJapanandU.S.StockMarkets YukioMiyamura O f f i c e rForFinancialEngineering FinancialEngineeringGroupI n c . 要旨 小稿で、は、株式の市場リスク計測という課題に一考察を加えるために、そのリスク源泉の推計とそ れに基づ、く多元的株価モデル(確率過程モデノレ)を考案し、リスク管理としづ観点でのその有用性の 検証を日米両市場において行った。その結果、両市場とも、多元的モデ、ルの有用性をかなり確認 できた。また、日米比較では、日本市場より米国市場で、より有用な結果をも検証できた。 キーワード: 多元的株価モデル、確率過程、リスク管理、コレスキー分解 1 . はじめに 周知のように、我が国の株式市場は最悪な状態から抜け出しつつあるものの、近年の低迷し た経済を反映して、株価も低調な状態を続け、金融機関などの企業の自己資本を圧迫してい る。もともと株価は、様々な要因が複雑に絡み合いながら展開するものであり、経済状態の先 行指標であるとの実証*1もなされており、その推移を予測し得るような指標の探求は、効率的 市場仮説理論と常に相対立し、永遠の難題である。従来、このような市場変動の不確実性は、 実際の市場推移が、その平均的予測値からどの程度軍離してしまうかで、そのおおよそのリス ク度合いが判定されていた。しかし、 1995年 4月 に 、 国 際 決 済 銀 行 (Bank f o rI n t e r n a t i o n a l S e t t l e m e n t s一以下B1Sという)パーゼル委員会が銀行業務における市場リスク規制案として Va lue a tR i s k * 2 (以 下 VARという)なる定量的基準を提案したために、保有期間に応じた統計的 市場変動確率が重視されるようになり、金融機関の市場リスク管理体制の発展と高度化が促さ れたとみられる。このような経緯の後、金融ピックパン時代を迎え、国際的基準で比較されるよう になった我が国の企業経営では、財務戦略上保有せざるを得ない株式などの有価証券の有 ‑129

129.

するリスクを的確に計測し管理することが緊急の課題になって来ているといえるつ Fong&Vasicek[l]によれば、デリパティブ、を含めた有価証券からなる投資ポートフォリオは 11種 類のリスク判に晒さらされており、それらは、単独ではなく、相互に関連し合って生ずるものであ り、その計測と管理のためには、リスク源泉の複合的探求が必要になるとしづ。この手法は、例 えば、株式の市場リスク計測に当たって、これと関連性が強いとみられる金利リスク、為替リスク、 あるいは信用リスク等との相関性を考慮、に入れるように、相関性の高い複数のリスクを用いて計 ARによる定量的管理を念頭においた確率論に 測と管理を行おうとするものであるが、近年、 V よる数理展開とモンテカノレロシミュレーションの膨大なコンピュータ演算により、この手法の精撤 化とその実証を試みようとする研究が注目されている。 そこでソト稿では、リスクの中の特に、株式の市場リスクの計測としづ課題に一考察を加えるた めに、まず、日米両市場それぞれの複合的探求に基づく独自の確率過程株価モデルを考案 する。次に、これらモデ〉レに対しモンテカルロシミュレーションを行い算出できるシナリオが、実 際の市場変動リスクを予測し得るか否かを日米両市場で実証する。なお、この研究は、金融工 学技術が最も先駆しているとみられる米国市場と我が国の市場とで、その技術の実践的有用 性の差異を検証することにもなる。 * 1例えば、河本 r 12Jでは、株価は景気指標である鉱工業生産指数値に 11ヶ月先行して動くことを検証している。 日 VARとは、有価証券あるいはポートフォリオの保有期間中における、一定許容限度を超えるとみられる損失額 o r i o n [ 2 ]参照。 の一定信頼度での最大予測値である。詳細は、 ] *3 市場リスク、為替リスク、オプションリス夕、期限前償還リスク、信用リスク、個別リスク、流動性リスク、運用・実行 リスク、管理リスク、規制リスク、事変リスクの 11種類に区分している。 2 . 多元的株価モデルの理論的展開 株価の推移はマルコフ過程の中で論じられることが多い川が、この確率過程は、将来の 株価は現在の株価水準にのみ依存して決定されるという仮説に基づく考え方である。いわ ば、この仮説は、過去の株価推移は将来の株価水準を予測し得ないとする効率的市場仮説 でいうウィークフォームの考え方を擁立し得るものである。小稿では、株価変動のモデル 化にあたって、マルコフ過程の一つであるウィナ一過程をベースにした多元的アプローチ を行うが、その理論的展開は以下の通りである。 1)一般ウィナ一過程株価モデル まず、ウィナ一過程に従う変数を z、微少時間ム tにおける zの変化をム zとすると、こ の確率過程は①式に示す定義を前提とする。 ムz=ηfムt 一一一一① (ただし、 η は標準正規乱数(平均 0、分散 1の正規分布からのランダム抽出した値。 また、異なる 2つのム tに対する各ム zはそれぞれに独立である。) ハ ペU 1ム ハ U

130.

ここで、①式をより一般化すると②式になる。 dz=ηFdt 一一一一② この②式で示すウィナ一過程 dzは常に平均 0、分散 lの特性を示すものであり、水準が時 間と共に変化する株価モデルとして用いるためには、 ドリフト項 (αXd t )を設定した③式 への展開が必要になる。 ds=αXdt+σ × ηFdt 一一一一③ (ただし、 sは株価であり、微少時間 d tにおける sの変化をむとする。 α、 σは定数。 配当は考慮しない。) さらに、③式の変動幅モデルを変動率モデルに発展させると④式になる。④式における α は期待収益率を、 σはボラティリティを示す。 ds/s=αXdt+σ × ηFdt 一一一一④ 2)多元的株価モデルへの展開 小稿で考案する多元的株価モデルは、前節④式で表す一般ウィナ一過程株価モデルをベ ースとするが、さらに株価変動の要因となるリスクファクター聞の相関性と期待収益率を 考 慮 し た モ デ ル で あ る 。 す な わ ち 、 以 下 で 展 開 す る よ う に 、 ④ 式 の 標 準 正 規 乱 数 ηの代わ りにリスクファクター聞の相関係数を考慮した多次元乱数を用い、また、期待収益率であ るドリフト項には、金利期間構造より推定される短期金利+リスクプレミアムを設定した ものである。 今、リスクファクタ一群 R を⑤式で示す n次元ベクトルとし、 R が n次元の正規分布に 従うとする。 一一一⑤ R =(YI,y2,y3,y4,… ・ ・ " , yn)T (ただし、 Tの記号は転置行列を示す。 σ けとする。 また、 Q を⑥式で示されるように、 R に基づく nXnの共分散行列を { σ 12 σ 12σ13 ・ σIn σ 2 1 σ 22 Q ={ σリ } σ 31σ32 anl an2 一一一一⑥ (ただし、 σりは y iと Y i,の共分散を示す。 y iと Yi.の相関係数を ρりとおくことで、⑥式から⑦式を導ける。 ~131 ~

131.

。 12 ρ12a1a2 ρ13a1a3 ρ21a2a1 a22 ρIna1a 。 32 Q =1ρ 31a3a1 ρ32a3a2 = {ρijai j } 一一一⑦ an2 ρnlana1 求めたいリスクファクター聞の相関性を加味した乱数ベクトル Y は③式で表せる。 Y=Lz (ただし、 L は nXnの下三角行列 { a i j }、zは標準正規乱数とする。) 一一一一⑧ ここで、コレスキー分解により共分散行列 Q は⑨式のように分解できるので、⑦式と⑨ 式より {aij}は⑮式のように表せ、③式の多次元乱数を生成できる。 Q ニ LLT (ただし、 LTは Lの転置行列を示す。 ail=ail/Fall (i=2, 3, … … . . , n) a i i= (ai ̲2 :aik2) O . 5 (j=2, 3, … … . . ,n ) 一一一一一⑨ ⑩ a i j= (aj i ̲2 :aikajk)/ a j j (j く i ,i=2, 3, … ・ ・ , n・ 1 ) したがって、小稿での多元的株価モデルは⑪式で表せる。 ds/s=αXdt+ a XYFdt 一一一一⑪ 3)リスクファクターの特定化 前節で、は多元的株価モデ、ルの理論的構造を述べたが、このモデル考案するうえで、さらに、 株価変動の要因となるリスクファクターを分析し特定するとしづ重要な問題もある。この研究は、 因子分析により株価変動を形成するリスクファクターを推定する手法と、主成分分析により導出 した合成指標も含めた多くの経済指標から、重回帰分析によりそのリスクファクターを特定化し ようとするそれにほぼ大別できる。しかし、前者の手法では、株価変動要因として導出した因子 が、実際にどのような経済指標に合致するものであるかを特定することが難しいため、小稿で、は、 ⑫式で、示すようなモデ、ルを用いた後者のアプローチを採用する。 株 価 収 益 率 二 2 :(Bj X Xj 一一一一⑫ (ただし、 Bj …X ; に対する株価収益率の感応度、 Xj iファクターのエクスホ。ーシ'ャー) … ) + Ej リスクファクターの特定化につながるモデ.ル構築のための説明変数選択では、それをを恋意 的に決定するのではなく、統計的に説明力の高いものを組入れるとしづ客観性を優先する。ま た、説明変数聞の多重共線性を極力排除し統計的信頼度の高いモデル構築処理を行う。そ ~132~

132.

のために、目的変数に対する各説明変数の有意性 (F 値で判断)の )[1頁序に応じて、段階的に 説明変数をモデ〉レに組入れてして逐次選択方式を採用する。この方式の最も大きな利点は、 モデ、/レ構築時のどの段階で、多重共線性が発生したのかを容易に判断でき、その要因となる説 明変数をモデ、/レから排除することが可能になることで、ある。 4) 期待収益率の推定 小稿での多元的株価モデルのドリフト項となる期待収益率には、金利期間構造より算出 されるフォワード・レート水準に定常的なリスクフレミアムを加えた値を用いる。これは、 F a m a [ 4 ] [ 5 ]および拙稿 [ 8 ]で実証しているように、ある時点の金利(スワップレート、短期 金融等)市場に基づく金利期間構造より算出できるフォワードレートは、高い有用性をも って将来金利水準を予測し得るとの理由から、各時点のフォワードレートに株式資産と金 利資産とのリスクプレミアムを加えた値を株価の期待収益率とすることの妥当性はあるは ずとの考え方によるものである判。しかし、実際のリスクプレミアム(株価インデ、ツクス収益率一 短期金利)を算出する判と、日本市場では、市場環境の影響もあり、分析期間において、リスク 資産の方が無リスク資産よりもリターンが低いとしヴモダンポートフォリオ理論とは矛盾した負の 値を示している期間が圧倒的に多い。したがって、小稿のモデノレで、は、米国市場では、各時点 の金利期間構造から算出されたフォワードレートに、このリスクプレミアムを加算して算出する期 待収益率を用いるが、日本市場では、このリスクプレミアムを加算しないものを用いる。 * 1B r e a l e y口O J、C o o t n e r [ l l Jを参照。 *2 フォワードレートを金利の期待値に置く考え方は、 H u l l ‑ W h i t e型モデルのような無裁定型 金利モデルでも採用されているものでもある。 *3 日本市場の月次リスクプレミアムの実績値は、 86/4~9113 :0.85% 、 87/4~92/3 : ー 0 .4 7% 、 88/4~93/3 :・1. 05% 、 一方、米国市場のそれは、 0.56% 、 89/4~94/3 :-0.84% 、 90/4~95/3 : ・ 1 .18%であり、 86/4~9113 :0.74% 、 87/4~92/3 :0 .4 6% 、 89/4~94/3 :0 .4 7% 、 88/4~93/3 : 90/4~95/3 :0 . 3 1%である。 3 . 検証と考察 以下では、まず、小稿で、用いたデータの種類および期間、日米両市場における多元的株価 モデ、ル構築手法および、このモデ、ルの有効性の検証方法を明示する。次に、分析検証結果とそ れに基づく若干の考察を述べる。 1 )使用データと分析期間 株価のリスクファクター候補で、ある変数として、大和総合研究所が提供している経済データを 使用しモデ〉レ構築およひ、検証を行う。この経済データは、表 lに示すように、株価指標、財務 指標、金利指標、商品指標、為替指標、経済指標の 6つのカテゴリーに分けられており、 1986 年 4月から 1996年 3月までの月末値データを使用する。ただし、 TOPIXおよび SP500の株 998年 3月までデータを追加して使用する。 価指数については、モデ、ル検証のために 1 ハ ペυ ハペυ 1i

133.

2)リスクファクター特定のための分析方法 株価のリスクフアクターを特定するために、⑫式に基づく 60ヶ月の期間で、逐次選択方式の 重回帰分析を行う。この 5年間の分析により選出されるリスクファクターを多元的株価モデ、ルに 反映するために、特定されたリスクファクター聞の相関係数を同じく 60ヶ月で計測するつ 3)多元的株価モデ、ルの検証方法 ①モデル 2)で、特定されたリスクファクター聞の相関性を考慮、した⑫式に基づくモデ、ル構築条件を 表 4に示す。 ②シナリオの発生 多元的株価モデノレ構築に用いるリスクファクター聞の相関係数は、シナリオ発生時点から 湖った 60ヶ月間で算出した値を使用した。また、多元的株価モデ、ルに基づくシナリオは、 1000回のモンテカルロ・シミュレーションにより発生させた。 ③モデ、ルの有効性検証 多元的株価モデ、/レの有効性の検証は、モデ、ルが算出する 36ヶ月間の各月の収益率シナ リオ確率分布に対し、実際の各月の株価収益率がその分布範囲に入る否かによって行つ た 。 4)分析結果と若干の考察 表 2は日本市場において分析した株価リスクファクターモデル結果を、表 3は米国市場におけ るそれを示す。モデルに採用した経済変数は、志、意的に決定されたものではなく、前述のした ように、逐次選択方式により、モデルに寄与する統計的説明力の高い (F値の大きさにより判 定)変数を順次段階的に組み入れていった結果で、ある。各表に示す採用序列とは、モデル ' 4 に採用された変数順序を示すものである。日米両市場とも、表 こ示すように構築期間の異な る5つのモデルの各々において採用された説明変数は固定的ではなく、その有意性は時間とと もに大きく変遷しているとみられる。また、日米比較では、相対的に米国市場におけるモデ、ルの 方が、日本市場のそれよりも決定係数が高く、株価インデ、ツクスを説明し得るリスクファクターの 特定がより有用である可能性が高い。 表 5および図 1から図 2は、日米両市場における多元的株価モデルの検証結果示したもの である。各モデルの有効性の検証は、 36ヶ月間、月次ベースで発生させたシナリオの各月時 点の下限 5%と上限 95%の範囲に、実際の株価収益率が入る否かを算出し、非適合率なる指 標で判定している。その結果からみて、日米両市場とも、特に重要なダウンサイドのリスクに関 しては、確率モデルにより当初想定したシナリオをかなり高い精度で確保し得るとみられる。一 方、日米比較としづ観点では、検証期間内では、相対的に米国市場の方が、確率モデ、ルによ るリスク管理の精度は高いように見受けられる。ただ、この期間の市場環境に着目すると、米国 市場では、ほぼ単調増加的に株価が上昇していており、確率モデノレに基づくシナリオ値の最 大の要因であるボラティリティが、日本市場に比較して小さかったことを指摘で、き、結果として、 このようなモデ、/レによる市場リスク範囲推定も適合度が高かったものとも推測できる。 以上のような分析結果から、小稿のおける多元的株価モデ、ルは、一定の信頼度で一定許 容限度を超えるとみられる損失額を算出するために活用することは可能と思われる。しかし、精 134‑

134.

徴f じを求めるために、モデルのドリフト項である期待収益率推定やリスクフアクターの特定化は もちろんのこと、シナリオ発生に最適な分布形状 *1を推定する研究等が揚げられ、さらなる研 究を行う必要がある。 *1 小稿では、モンテカルロ・シミュレーションのシナリオ発生において、標準正規乱数を用いたが、実際の株価 収益率の分布は、対数正規分布を仮定する場合もあり、これ以外にガン 7 分布等も含めた最適は乱数を発生さ せることも考えたい。 4 . むすび 小稿で、は、日米両市場における株式の市場リスク計測とし、う課題に一考察を加えるために、 株価のリスク源泉の複合的探求に基づいて構築した確率過程株価モデルを用いて試行したモ ンテカルロシミュレーションから算出したシナリオが、実際の市場変動リスクを予測し得るか否か を日米両市場で検証した。その結果、日米両市場とも実際の株価推移は、算出したシナリオの 特にダウンサイドのリスクを高い確率で超えており、株価モデルの有用性をある程度確認できた といえる。また、日米両市場における比較では、米国市場の方が、よりそのモデノレの有用性が 高いといえる結果をほぼ示し得た。 一般に、確率過程モデルでは、パラメータで、あるボ、ラティリティやリスクファクター聞の相関性 は過去のデータを基に算出されることが多いが、それ故に、近年におけるロシア危機や円ドノレ 為替の変動にみられるような突然の市場環境の変化に対しては、モデ、/レで、描いたシナリオの前 提が大きく崩れ、リスク管理体制の大幅な修正を余儀なくされることもあるはずである。小稿に おいても、構築した多元的株価モデルのパラメータは、過去のデータを用いており、精撤化を 求めるための将来における課題は多い。特に、確率モデルのドリフト項である期待収益率推定 や予測的な要素も含めたリスクファクターの特定化、さらにはシナリオ発生に最適な分布形状 を有する乱数の研究等が揚げられるが、これらについては今後の研究課題にしたい。 ‑135

135.

(参考文献) [ l ] G i f f o r dFongandO l d r i c hA.Vasiek A M u l t i d i m e n s i o n a lFrameworkf o rR i s kA n a l y s i s ", F i n a n c i a lAnalystsJ o u r n a l,July/August 1997,pp.51~57 [ 2 ] P h i l i p p eJ o r i o n R i s k 2 :Measuringt h eR i s ki nValuea tR i s k , F i n a n c i a lAnalystsJ o u r n a l, November/December1996, pp .4 7~56 [3]EugeneF.Fama E f f i c i e n tC a p i t a lMarkets:I I TheJ o u r n a lo fFinance Vo. lXLVINo5 December1991 pp.1575~1617 [4]EugeneF.Fama TheI n f o r m a t i o ni nt h eTermS t r u c t u r e , J o u r n a lo fF i n a n c i a lEconomics,December1984,pp.529~546 [5]Eugen巴 F.FamaandRobertR . B l i s s Th巴l n f o r m a t i o ni nLong‑MaturityForwardRates , Am巴r i c a nEconomicsRevi巴w,Vo177,No4,S巴ptemb巴r1987,pp.680~692 [6JMcCullochJ.Huston AnEstimateo ft h巴 L i q u i d i t yPr巴 miumぺ J o u r n a lo fP o l i t i c a lEconomy,Vo1 .83,No1,F巴bruary1975,pp.95~119 [ 7 J O l d r i c hA.Vasicek AnE q u i l i b r i u mCharact巴r i z a t i o no ftheTermStructure ヘ J o u r n a lo fF i n a n c i a lEconomics,Vo1 .5,1977,pp.177~188 [ 8 J拙稿「スワップ・レートに基づく金利期間構造とその予測性に関する一考察」 SUG1‑J 98/IDSConferenc巴論文集 pp.251~262 [ 9 J河本潮満「経済指標と業種別株価」投資月報 1989年 6月 pp.6~14 [10JBr巴a l巴y, R.A. AnI n t r o d u c t i o nt oR i s kandR巴t u r nfromCommonStock , 2nd e d .MITPress,Cambridg , 巴 Mass,1 9 8 3 . P.H. Th巴 RandomCharact巴ro fStockMarketP r i c巴S, [llJCootner, MITPr巴s s,Cambridge,Mass,1 9 6 4 . [ 1 2 J B a s l eCommitteeonBankingSup巴r v i s i o n C r e d i tR i s kModeling:CurrentP r a c t i c巴sand , A p r i l1999. A p p l i c a t i o n s 1 3 6

136.

表1 指標区分 株価指標 財務指標 金利指標 商品(インフレ)指標 為替指標 経済指標 株式リスクファクタ 候補ぬユニバース 日本市場 米国市場 S D P A 5 X 0 3 0 0 株株価価指指数 数 T O P 3 I X 0 株株価価指指数 DAX CAC40株 価 指 数 FT100株 価 指 数 HANGSENG株 価 指 数 NYSE上 昇 銘 柄 数 NYSE下 落 銘 柄 数 CAC40株 価 指 数 FT100株 価 指 数 HANGSENG株 価 指 数 東証売買高 東証上昇銘柄数 東証下落銘柄数 EPS JPホ ' ン 卜' ' ' . 7オーマンス IDX WTI原 油 価 格 シカコ.金先価格 CRB指 数 円/ドル為替 円/マ M為替 鉱工業生産指数 完全失業率 マネーサプライ 月給与 ア シ7輸出 欧州輸出 米国輸出 ア シ7輸 入 欧州輸入 米国輸入 貸出残高 機械受注 建設工事受注 法人企業売上高 電力販売量 総合卸売物価指数 消費者物価指数 大型小売庖販売 全国百貨庖売上高 新車登録台数 貿易収支 経常収支 外貨準備 財政収支 1 3 7 EPS USホ . ン ド" . 7オーマンス IDX WTI原 油 価 格 シカコ.金先価格 CRB指 数 円/ドル為替 円/マルク為替 鉱工業生産指数 失業率 製造業労働者数 サービス労働者数 週労働時間 週残業時間 個人所得 消費者信用残 可処分所得 個人消費 小売売上 耐久財売上 非耐久財売上 消費者物価指数 新規住宅着工 貿易収支 経常収支 外貨準備高 財政収支

137.

表 2 株式リスクファクターモテル 日本市場 8 6 ‑ 9 1年モデル 採用説明変数 ア 外 ジ 貨 ア 準 輸 備 入 OAX30株 価 指 数 米国輸出 NRIJP*'ンドハヲォーマンス 1 0 HANGSENG株 価 指 数 円/ドル為替 WTI原 油 価 格 シカゴ金先価格 CRB指 数 EPS 東証売買高 東証下落銘柄数 財政収支 米国輸入 マネーサプライ 鉱工業生産指数 月給与 貸出残高 日本市場 87‑92年モデル 採用説明変数 HA 証 NG 下S 落 EN 銘 G柄株数 価指数 東 NRIJPホ . ン ド , , 7オ 0 ー マ ン ス1 鉱工業生産指数 米国輸出 OAX30 株価指数 0 円/ドル為替 東証売買高 米国輸入 ア シ7輸 入 WTI原 油 価 格 CRB指 数 シカゴ金先価格 外貨準備 EPS 米国輸出 ア シ7輸出 貸出残高 財政収支 採用序列 2 3 4 5 6 7 8 9 1 0 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 採用序列 2 3 4 5 6 7 8 9 1 0 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 ( Iその 1) t 値 β値 0 . 0 7 9 4 2 . 3 9 7 7 3 . 1 4 3 0 0 . 5 2 3 8 2 . 5 6 7 7 0 . 7 7 6 5 1 . 6 0 0 4 0 . 1 5 2 2 0 . 8 8 7 4 1 . 0 9 6 8 1 . 1 0 2 3 4 . 3 5 9 7 3 . 0 6 8 7 1 . 0 0 3 3 2 . 0 2 6 5 0 . 1 6 2 3 1 . 3 9 2 9 1 . 3 4 6 9 1 . 7 7 5 0 0 . 0 0 7 1 0 . 3 9 3 3 0 . 2 9 1 7 ‑ 0 . 0 3 0 1 1 . 4503 0 . 0 5 9 9 0 . 3 2 2 1 ‑ 0 . 0 0 8 7 0 . 1 5 5 7 ‑ 0 . 2 9 2 7 0 . 1 8 7 3 0 . 0 7 7 4 一0 . 1 0 8 0 0 . 5 2 5 9 一0 . 1 0 2 6 0 . 0 2 7 3 0 . 2 2 8 7 0 . 0 1 5 8 0 . 0 8 5 8 t 値 s 1 直 3 . 3 9 0 3 1 . 9 5 3 2 1 . 9 4 8 8 0 . 7 8 9 4 2 . 2 9 8 2 1 . 3 3 0 6 2 . 5 1 4 7 1 . 1 9 2 2 0 . 6 0 0 2 0 . 0 9 5 3 1 . 0 4 4 6 1 . 3 2 2 0 1 . 8 5 3 3 0. 4212 1 . 0 8 2 0 1 . 0 1 8 4 0 . 1 1 9 0 0 . 1 8 2 6 0 . 3 0 6 8 0 . 0 9 4 2 0 . 1 4 8 0 1 . 1 6 8 8 0 . 1 2 4 4 0 . 2 0 7 7 0 . 2 7 2 1 0 . 0 4 4 7 一0 . 0 5 9 2 一0 . 0 4 8 5 一0 . 0 0 5 3 一0 . 2 4 2 8 0 . 2 3 1 1 0 . 3 0 4 1 一0 . 0 2 3 3 0 . 1 2 5 1 一0 . 0 4 8 9 0 . 0 8 6 3 一0 . 0 8 8 0 0 . 1 5 1 0 VIF 決 定 係 数 1 . 7 1 7 9 0 . 7 8 9 9 1 . 9 0 8 2 1 . 5 0 8 4 1 . 4730 2 . 7 2 7 9 1 . 5 7 0 9 2 . 0 1 1 3 1 . 7 0 5 9 1 . 7 6 4 9 1 . 6 2 0 7 1 . 2 3 4 7 1 . 4890 1 . 4682 1 . 5 9 7 4 1 . 3 5 9 5 1 . 5 6 7 1 2 . 1 0 9 0 1 . 7 2 7 2 2 . 0 2 3 7 VIF 決定係数 1 . 9 3 5 1 0 . 7 3 9 2 1 . 47 2 9 . 3 . 3 2 3 3 2 . 1 1 8 3 1 . 4363 2 . 1 2 3 5 1 . 7 9 9 6 . 4088 1 1 . 7 9 4 6 1 . 6 5 6 6 1 . 4493 1 . 7 1 0 7 2 . 0 6 1 9 1 . 6 7 5 4 1 . 7 1 0 7 2 . 0 8 6 2 1 . 9 0 5 3 1 . 5 1 8 2 1 . 9 7 6 4 注) ・採用序列とは、説明変数として採用した財務指標のモデルに対する有意度 (F値) 順序である。 • VIFは多重共線性の判定指標であり、小稿のモデルでは、 4以上の値を有する 財務指標を排除した。 ‑138

138.

表 2 株式リスクファクターモテル I Cその 2) 日本市場 88‑93年 モ デ ル 採用説明変数 ア シ7 0 輸 0株入価 FT1 指数 東証下落銘柄数 米国輸入 東証売買高 欧州輸出 CRB指 数 外貨準備 NRIJPホ . ン 卜' ' ' . 7ォ ーマンス ID WTI原 油 価 格 財政収支 DAX30株 価 指 数 貸出残高 米国輸出 シカコ.金先価格 円/ドル為替 月給与 HANGSENG株 価 指 数 マネーサプライ 採用序列 2 3 4 5 6 7 8 9 10 1 1 12 13 14 15 16 17 18 19 t 1 直 2.2499 0.5183 1.0164 3.1656 1.6790 2.2948 0.3522 0.7275 0.0723 0.2918 1 .3414 0.8434 0.7924 0 . 7 3 5 1 1 . 1903 0.0570 1 .1936 1 .0451 0.1632 β値 0.0018 0.0448 0.1844 0.1226 0.1054 0.0524 一0.0419 0.2306 0.0250 0.1827 ‑0.1122 0.6309 0 . 1 3 8 1 0.7512 0.0918 ‑0.0132 0.3294 0.0155 0.0215 VIF 決定係数 4465 1. 0.6559 1.5666 1.9567 1. 4971 1 . 1417 1 . 7397 4.0077 1.5899 1.6990 1.5252 1.9139 1.8223 2.1177 2.0253 1.9412 1.6087 1.8758 2.0473 1.7689 t 値 β{ 直 0. 4126 2. 4312 0.9497 1.9405 0.1183 3.1790 4883 1. 1.3676 0.8217 0.7329 0.8978 0.8379 0.3043 0 . 5 2 7 1 0.5332 0. 4017 0.2928 0.1866 0.0015 0.0392 0.0608 ‑0.3161 0.1434 0.0288 0.1395 ‑0.1345 1 . 1017 0.1781 一0.0567 0.0383 0 . 8 8 3 1 0.0718 0.1404 0.1056 0 . 1 7 8 1 0.2139 ‑0.0028 0.0004 VIF 決定係数 1 .5601 0.6464I 1.6409 1.9247 1.5435 2.5216 1 .5574 1.6295 1. 4611 1 .9172 1. 4711 1.1913 1.6455 1 . 7921 1.3969 2.3948 1.7773 1.6776 1.6800 1.5844 日本市場 89‑94年 モ ァ ル 採用説明変数 アシア輸入 東証売買高 円/ドル為替 米国輸出 鉱工業生産指数 東証下落銘柄数 WTI原 油 価 格 NRIJPホ . ン ド ハ 。7オーマンス I D FT100株 価 指 数 米国輸入 EPS 貸出残高 マネーサプライ 外貨準備 DAX30株 価 指 数 CRB指 数 財政収支 月給与 シカコ.金先価格 採用序列 2 3 4 5 6 7 8 9 10 1 1 12 13 14 15 16 17 18 1 9 1 3 9

139.

表 2 株式リスクファクターモテル I Cその 3 ) 日本市場 90‑95年モデル 採用説明変数 7売 輸 買 入高 ア 東 シ 証 WTI原油価格 . ン ド ハ 。 フ オ ー マ ン スI D NRIJPホ 米国輸入 CRB指数 円/ドル為替 財政収支 外貨準備 マネーサプライ DAX30 株価指数 米国輸出 鉱工業生産指数 貸出残高 月給与 シカゴ金先価格 東証下落銘柄数 採用序列 2 3 4 5 6 7 8 9 1 0 1 1 1 2 1 3 1 4 1 5 1 6 1 7 t 値 0 . 1 3 6 2 2 . 6 5 5 9 1 . 7346 0 . 2 4 3 0 0 . 5 3 2 4 1 . 42 8 1 0 . 3 2 5 0 0. 46 2 1 4252 0. 0 . 6 1 4 8 0 . 8 0 0 1 1 . 4318 0 . 1 5 8 0 1 . 1886 0. 4675 0 . 0 0 6 9 3. 4800 β値 0 . 0 1 3 1 0 . 0 6 6 4 0 . 1 7 7 8 0 . 0 2 3 7 0 . 2 5 8 5 0 . 5 0 6 9 一0 . 2 3 9 5 0 . 3 5 5 3 0 . 1 3 7 6 0 . 1 4 9 1 0 . 1 4 2 8 0 . 1 1 0 6 ‑ 0 . 0 3 4 7 1 . 3 0 3 6 ‑ 0 . 0 0 7 3 0 . 0 0 1 9 0 . 1 5 6 2 ‑140一 VIF 決定係数 1. 4446 0 . 6 2 5 8 1 . 6 2 8 7 2 . 0 6 5 5 1 . 6 7 0 3 1 . 9 4 9 5 1 .6723 2 . 0 1 3 2 1 . 9 3 6 6 1 . 7 8 6 8 1 . 8 4 8 8 1 . 8 2 6 8 1 . 7 8 0 4 1 .9 6 9 1 1 .6275 1 .6865 1 . 6 9 3 4 1 . 5 7 7 6

140.

表 3 株式リスクファクターモテル I (その 1) 米国市場 86‑91年モプル 採用説明変数 NYSEG 下 SE 落 N銘 G株柄価数指 数 HAN 0 NRIUSホツドハ。フオーマンス 1 可処分所得 シカコ.金先価格 失業率 鉱工業生産指数 非耐久財売上 TOPIX株 価 指 数 円/ドル為替 OAX30株 価 指 数 小売売上 消費者信用残 NYSE上 昇 銘 柄 数 CRB指 数 週残業時間 製造業労働者数 個人所得 個人消費 WTI原 油 価 格 EPS 採用序列 2 3 4 5 6 7 8 9 10 1 1 12 13 14 15 16 17 18 19 20 2 1 t 値 2.1802 2 . 6 7 6 1 0.0032 0.5465 0. 4939 0.9739 0.9428 1.3734 1.8178 0.6310 3.0937 1 . 6 2 0 1 0.2763 1 .3813 0.7120 0. 4772 0.2148 0.0036 0.5574 0.1339 0.9245 β値 ‑0.0747 0.1772 0.0013 0.8503 ‑0.0822 0.2274 1.5327 1.1842 0.1489 0.0882 0.2674 0 . 5 8 8 1 一0.3629 0.0559 ‑0.1474 0.1316 ‑0.5445 0.0694 0. 4848 0 . 0 5 5 2 . 0.0019 1 . 7 7 1 1 2.0544 2.0718 2. 4467 1.7350 2.1353 1.7162 1.7684 4638 1. 1.9607 2.1055 1.9217 2 . 2 1 5 1 1.6522 1 . 7534 2.0562 2.3989 1 . 9 8 8 1 1.5372 1.3583 t 値 1 . 4882 0.8565 4.5093 1.1552 0.0827 1.8937 2.5138 0.8049 0.7337 3. 4579 1.3686 0. 4461 0.0885 0. 4033 0.1495 0.0296 0.0942 1.2115 0.0119 β値 ‑0.0472 0.3534 0.3012 0.2205 0.0128 ‑2.0119 0 . 0 8 1 1 0.9363 0.8636 0.2760 0.1716 一0.0376 0.1685 ‑0.0005 0.0696 0 . 0 0 5 1 0.0178 1.0884 0.0005 VIF 決定係数 1.7767 0.8015 2 . 5 1 5 1 2. 4000 1.7047 2.5634 1.3940 2.1555 2.2103 2.0016 2.0338 1.5739 2. 4504 1.8282 1. 4518 1. 4100 1.5694 1. 4939 1.5205 1.7272 VIF 1 .7203 決定係数 0.7549 米国市場 87‑92年モデル 採用説明変数 NYSE下 落ント銘ハ柄フオ数 ー マンス 1 0 NRIUSホ HANGSENG株 価 指 数 失業率 シカコ.金先価格 可処分所得 NYSE上 昇 銘 柄 数 消費者信用残 鉱工業生産指数 OAX30株 価 指 数 マルク/ドル為替 TOPIX株 価 指 数 製造業労働者数 EPS 小売売上 CRB指 数 週残業時間 個人消費 直2豆 迫 価 格 採用序列 2 3 4 5 6 7 8 9 10 1 1 12 13 14 15 16 17 18 1 9 ‑採用序列とは、説明変数として採用した財務指標のモデルに対する有意度 (F値) 1 I 国序である ・VIFは多重共線性の判定指標であり、小稿のモデルでは、 4以上の値を有する 財務指標を排除した。 1 4 1 0

141.

表 3 株式リスクファクターモテル 米国市場 88‑93年モデル 採用序列 採用説明変数 NRIUSホントハフオーマンス I D WTI原 油 価 格 2 NYSE下 落 銘 柄 数 3 NYSE上 昇 銘 柄 数 4 5 鉱工業生産指数 6 週残業時間 円/ドル為替 7 失業率 8 9 HANGSENG株 価 指 数 1 0 製造業労働者数 1 1 サービス労働者数 1 2 DAX30株 価 指 数 1 3 シカゴ金先価格 個人消費 1 4 非耐久財売上 1 5 CRB指 数 1 6 1 7 耐久財売上 EPS 1 8 個人所得 1 9 TOPIX株 価 指 数 20 マルク/ドル為替 2 1 米国市場 89‑94年モデル 採用説明変数 採用序列 NRIUSホントハフオーマンス I D WTI原 油 価 格 2 NYSE下 落 銘 柄 数 3 NYSE上 昇 銘 柄 数 4 5 シカゴ金先価格 失業率 6 鉱工業生産指数 7 円/ドル為替 8 製造業労働者数 9 1 0 週残業時間 サービス労働者数 1 1 HANGSENG株 価 指 数 1 2 個人消費 1 3 個人所得 1 4 1 5 TOPIX株 価 指 数 CRB指 数 1 6 非耐久財売上 1 7 EPS 1 8 耐久財売上 1 9 消費者信用残 20 円/マルク為替 2 1 DAX30株 価 指 数 22 I (その 2) 1 . 7 2 1 3 0 . 8 8 8 1 3 . 9 0 5 8 2 . 3 7 7 6 0. 4793 0 . 8 5 6 3 0 . 6 2 7 8 1 . 5 8 7 1 1 . 1 9 1 2 1 . 5 2 0 9 0 . 5 1 9 4 1 . 6 7 8 6 1 . 0 4 3 9 0 . 1 6 7 3 0 . 6 2 1 7 1 . 1 0 2 7 0 . 8 5 3 3 0 . 2 0 5 8 49 8 1 0. 0 . 7 7 9 4 0 . 9 8 5 3 β{ 直 0 . 5 9 2 0 ‑ 0 . 0 3 3 9 0 . 0 8 9 2 0 . 0 6 1 8 0. 4225 一0 . 1 3 4 0 0 . 0 9 3 4 0 . 2 3 9 4 0 . 0 7 0 9 2 . 5 6 6 3 1 . 2 1 0 9 0 . 1 2 1 7 ‑ 0 . 1 3 1 8 一0 . 1 2 4 9 ‑ 0 . 3 6 4 0 ‑ 0 . 1 4 8 7 0 . 1 5 4 7 ‑ 0 . 0 0 0 2 0 . 1 8 6 8 0 . 0 4 2 9 0 . 1 1 5 9 VIF 決 定 係 数 . 7 9 1 0 2 . 2 7 1 8 0 1 . 9 4 7 5 1 . 5 8 0 7 2 . 1 8 1 6 2 . 1 1 3 9 1 . 8 9 0 9 2 . 8 1 1 6 1 . 7 0 8 7 1 . 8 0 8 6 2 . 0 2 0 7 2 . 1 9 0 7 1 . 8 2 7 0 2 . 3 4 1 6 1 . 3 5 5 3 1 . 7 0 7 7 4147 1. 1 . 5 9 1 3 . 4783 1 1 . 4412 1 . 6 3 2 9 2 . 3 2 7 5 t 値 β1 直 0 . 8 1 2 3 0 . 6 9 9 3 5 . 1 7 7 9 3 . 1 9 0 3 2 . 5 0 9 2 1 . 6 8 8 9 1 . 1 1 2 9 1 . 3 7 0 0 0 . 3 9 2 1 1 . 5 1 8 8 0 . 0 9 9 2 0 . 5 1 5 8 0 . 6 3 0 9 1 . 7 2 2 7 . 4665 1 1 . 3 0 6 4 1 . 3 6 5 6 0 . 7 6 7 3 0 . 5 5 4 0 4820 0. 0 . 9 4 9 1 1 . 5 5 9 7 0 . 2 6 7 0 0 . 0 2 7 0 一0 . 1 2 8 3 0 . 0 8 3 6 0 . 2 3 8 5 0 . 2 5 3 2 0 . 9 0 4 2 0 . 1 8 6 9 0 . 7 3 3 1 一0 . 2 0 2 4 0 . 2 5 3 8 ‑ 0 . 0 2 3 4 46 5 1 0. 0 . 5 0 6 3 0 . 0 6 6 5 ー0 . 2 1 8 8 0 . 8 0 9 9 0 . 0 0 0 6 0 . 0 9 9 3 0. 4356 0 . 0 9 1 0 0 . 1 0 5 5 VIF 決 定 係 数 2 . 3 7 4 9 0 . 8 2 2 8 2 . 2 4 8 9 2 . 0 2 8 0 2 . 5 4 7 3 1 . 8 3 7 6 1 . 6 9 0 3 2 . 3 3 9 8 4979 2. 2 . 7 1 1 3 1 . 7 7 8 7 2 . 2 6 7 5 1 . 8 4 8 7 1 . 6 0 3 5 1 .7 725 1 . 7 1 2 6 1 . 9 2 2 3 2 . 2 0 7 8 2 . 0 1 0 2 1 . 8 6 9 6 1 . 6 7 1 2 1 . 8 2 7 9 2 . 1 3 9 1 t 値 ‑142

142.

表 3 株式リスクファクターモデル 米国市場 90‑95年モデル 採用説明変数 NRIUSホントハ 7オ ー マ ン ス ID NYSE上昇銘柄数 NYSE下落銘柄数 WTI原油価格 円/ドル為替 鉱工業生産指数 小売売上 週残業時間 製造業労働者数 失業率 可処分所得 シカゴ金先価格 EPS TOPIX株価指数 円/マルク為替 HANGSENG株価指数 サービス労働者数 DAX30株価指数 個人消費 CRB指数 採用序列 2 3 4 5 6 7 8 9 10 1 1 12 13 14 15 16 17 18 19 20 t 値 1 (その 3 ) β値 0.6420 0.1065 0.0998 ‑0.0863 0.2006 4297 1. ‑0.2876 ‑0.1482 2.0815 0 . 0 9 9 1 0.3623 ‑0.1220 0.0007 0.0327 0.0712 0 . 0 2 8 1 0 . 8 3 6 1 ‑0.0261 0 . 1 3 8 1 一0.0143 2.2776 4.9615 4.6975 2. 4909 1.5787 2.0242 0.8648 1.1649 1.1900 0.8070 1 . 3 3 4 1 1 .3961 0.8893 0 . 7 9 6 1 0.7753 0.6830 0.3707 0.3802 0.17048 0.08815 1 4 3 VIF 決定係数 2.0459 0.8359 2.1150 1.5557 2.3084 2.1204 2.3359 1.5094 2 . 0 5 3 1 2.9900 1.8123 1.8943 1.7043 1.5175 1.7450 1.8588 1.9664 2.2003 2.6527 2. 4128 2.1434

143.

表4 多元的株価モデルの構築条件 期待値の算定 シナリオ発生期間 リスクファクターの特定 91/4‑94/3 86/4‑91/3の 5年間で算定 91/3末時点、のスワップレートに6基 ヶ 月 づ 物 く 告 金 ー ム 利 ス ) ト に ラ ク チ ャ ー した変数を使用し、シナリオ発生 から算出したフォワードレート( 期間は変数固定。 86/4‑91/3の 5年間で算定したリスウプレミアムを 加算。 8714‑9213の 5年間で算定 9 2 / 3末時点のスワッ 7レートに ( 6基 ヶ 月 づ 物 く ヲ 金 ームストフクチヤー した変数を使用し、シナリオ発生 から算出したフォワードレート 利)に 期間は変数固定。 87/4‑92/3の 5年間で、算定した')スウプレミアムを 加算。 88/4‑92/3の 5年間で算定 9 3 / 3末時点のスワッ7レートに ( 6 基 ヶ 月 づ 物 く 安 金 一 ム 利 ス ) ト に ラ ク チ ャ ー した変数を使用し、シナリオ発生 から算出したフォワードレート 期間は変数固定。 88/4‑93/3の 5年間で算定したリスウプレミアムを 加算。 89/4‑93/3の 5年間で算定 9 4 / 3末時点のスワップレート i こ基づく 9 ー ム ス ト 7ク チ ヤ ー した変数を使用し、シナリオ発生 から算出したフォワードレート ( 6ヶ月物金利)に 期間は変数固定。 89/4‑94/3の 5年間で算定したリスウプレミアムを 加算。 90/4‑94/3の5年間で算定 9 5 / 3末時点、のスワッ 7レートに基づくヲームストフウチャー した変数を使用し、シナリオ発生 から算出した7オワードレート (6ヶ月物金利)に 期間は変数固定。 90/4‑95/3の5年間で算定したリスウプレミアムを 加算。 92/4‑95/3 93/4‑96/3 94/4‑97/3 95/4‑98/3 1 4 4

144.

l 図 1 日本市場における多元的株価モデルの信頼性(その 1) 日本市場 9114‑94/3 qL414l‑4141qL nuphunuphunURunURunu ‑ / T l r = ←T06lX収益事 ト・一平均 同企ー下限 (5%) 一一一 l 一決ー上限(95%) 日本市場 92/4‑95/3 三瓦ごTOPIX収益率] ‑・一平均 │ ̲.,̲下限(日) → ← 上 限 (95%) 1 鴻 日本市場 93/4‑96/3 20 1 5 1 0 5 0 ‑5 ‑10 ‑15 ‑20 145‑ J

145.

I s l 1 日本市場における多元的株価モデルの信頼性(その 2) 日本市場 94/4‑97/3 q44141 nUFhunu F h u n U R u n U R u n U 一一一 ‑4141qL lil‑‑Illi‑‑L 日本市場 95/4‑98/3 2 0 1 5 10 一 ← TOPIX収益率 。 5 ・ 一‑MRM1 一一一 ‑4141qL FhunURunu ‑ ‑ ‑ . . ‑ 下 限 (5%) ート上限(95%) 146‑

146.

匝2 米国市場における多元的株価モデルの信頼性(その 1) 米国市場 9114‑94/3 2 0 1 5 10 │ー← SP500 収益率 。 5 『・一平均 に JV 一合一下限(5 % ) プ ← 上 限 (95%) ‑10 一1 5 ‑20 米国市場 92/4‑95/3 2 0 1 5 1 0 5 ;一← SP500収益率 l 一・一平均 0 i F h u 一合一下限(日) l づ十よ里竺堕) J ‑10 ‑15 通 ‑ 2 0 米国市場 93/4‑96/3 ィ i11 nUFbnUFO っι ト← SP500収益率 Ii 。 F h u トー一平均 十下限(日) ート上限( 9 5 % ) ‑10 ‑15 ‑ 2 0 ‑147 ← iI

147.

! @ 2 米国市場における多元的株価モデルの信頼性(その 2) 米 国 市 場 94/4‑97/3 2 0 1 5 1 0 FbnUFO ト← SP500収益率│ トー一平均 ト合一下限 (5%) 同 ← 上 限 (95%) ‑10 ‑15 ‑20 米 国 市 場 95/4‑98/3 FhdnURU nUFO ‑‑ 2 0 一 ← SP500収益率 一・一平均 一合一下限 (5幼 ート上限 (95弘 ) ‑10 ‑15 ‑20 1 4 8一

148.

日本 S A Sユーザー会 (SUG I‑J) 株式ポートフォリオ構築のための最適化手法に関する考察 堀地正浩 大和証券投資信託委託株式会社 投資技術開発部 Researchf o rOptimizationmethodf o rStockP o r t f o l i oConstruction H o t c h i,M a s a h i r o D a i w aA s s巴tManag巴m e n tC o .L td . Q u a n t i t a t i v eR e s e a r c hDept . 要旨 株式ポートフォリオ構築にあたって、投資家の効用を最大化させる従前 の手法と、ベンチマークを明示しそれからの草離をコントロールするよ り実践的な最適化手法を比較する。併せて、 SAS/IMLを利用した 例を紹介する。 キーワード:投資リスク、ポートフォリオ選択問題、 SASIIML、NonLinearProgramming 1.はじめに 証券投資において投資可能証券からポートフォリオを構築する際、その投資可能証 券の期待リターンと投資リスクを付与のものとしたとき、投資家のポートフォリオ 選択はいくつかのパラメータを仮定した上で簡単な数式モデル=最適化問題二で表 現できる。投資リスクを軽減し期待リターンを高める投資行動をそのまま数式モデ ルに表現した古典的なポートフォリオ最適化問題は期待リターンの微細な変動に対 して最適化の解が大きく変動し安定性を欠く結果を導く傾向があった。それに対し て、投資ベンチマークを所与のものとし、それからの相対リスク=トラッキングエ ラー=を投資リスクと考えるポートフォリオ構築法は実務応用上有益で二あることが 経験的に知られている。 本稿では両者の特性を数値例で比較すると同時に SAS/IMLのプログラミング例を 紹介する。 1 4 9

149.

2 .数式表現 はじめに、ポートフォリオ選択問題を数式で表現しよう。 n個の投資可能証券に対し、ポートフォリオ組入れ比率ベクトルを X= [Xp X2. , . . , Xn]' とする。ただし Xjは第 I証券への投資比率。 また期待収益率ベクトルを E=[μpμ2.'… , μ.]' リスク行列=分散共分散行列=を σ1 1σ . 1 2. . ~ V= σ 2 1 σ2 2 ~ σn1 σnn とする。 [ A J 古典的なポートフォリオ最適化問題は max{f(x)}=max{XE'‑λX' V X } と表現できる。ここで、 Aはリスク回避度を表現するパラメータ。 [ B J 本稿で提唱する最適化問題は maxt ( x ) }=max{XE}, s u b j eω TE二属工房 V(X‑B)三α ここで B= [bp b 2 • , …, bn]' はベンチマークの組入れ比率ベクトル、 ωはトラッキングリスクの許容値。 A,Bともに 証券を空売りしない条件:X::?:O や 所持金全額を投資する条件:エ Xj 二 1 などは任意に設定可能。 実際の証券投資には l銘柄への集中投資を避ける意味で・単一銘柄への組入れ上限を 設けることが多い、また売買単位を考慮することは実務上重要であるが本稿では議 命しない。 Z ‑150

150.

3 .数値例 投資ユニバースが 4証券の例を考える。リスク(標準偏差と相関係数行列)は以下で あったとしよう。 一 ﹄ 斗 斗一 75014 d一 ヌ0 1 A斗 唱 コo n U 司u 一 一 息00 一 2 7 3 1 0一 ﹄ nOA A 一 343 一 000 一 一 ﹃ 斗 一n L A 1 一 1 hURn641 司uRu‑ nU =UA 一 一 00.0 内 一 一 a 1877 ‑nLnonu‑ nU d n一 一 U 000 一 一 ahuCAU 噌 d B''ISIZEE‑ c ‑︐︐︐ スUFhunon a b d904 ・ ヌ 一 ノ 9809ヱ . 一 一 1‑ 証券名標準偏差(月次)相関係数行列 % 期待リターンは以下の 2パターンを考えた。 UnununU 一 一円 % Tgl'tEats‑334 日 一叫叫 ー % a b c d ‑8494h 一 111a1 一 期待リターン 1 期待リターン 2 一 nb495 一 1α 101 一 一 B 証券名 またベンチマークの証券比率は [ a, b, c , d]=[35%,30%,20%,15%]とした。 0.013、最適化 [AJのパラメータ ω=2.0 さらに最適化 [AJのパラメータ A= とした。これらの数値は実際に観測設定されうると考えられる実現性の高い数値を 仮定している。 結果: 期存1) 51二ンτ百蕩奇顛存1)~ターン 2 の場合 ‑.Jh132HEE‑‑zパh l﹃ ‑M明 八 削 切 パ 川 切 八 A‑1 r ︐ ﹃ 一 o 2 1一 a b G 一 5 3 4 β一 o IT d 最適化 (A] 証券名 A‑2 : ‑ ‑ ‑ ‑ E f u i % : ベクトル A‑1とA‑2の ユークリッド距離 リスク距離 0 . 5 7 0 : 1 . 6 3 0 2 . 1 1 6 7 . 5 1 . 6 2 7 2 . 1 3 B‑l a : 5 8 . 2 % : b : 2 6 . 6 % : C!37%i d ! 1 1 . 5叫 ポートフォリオ分散 6 6 . 6 期待収益率 1 . 6 2 6 トラッキング、リスク 2 . 0 0 B‑2 6 0 . 0 % : 2 8 . 7 % : 4 . 6切i i 6.6出 6 6 . 8 1 . 6 1 7 2 . 0 0 i ︐ 最適化 (B] 寸︐丈 ポートフォリオ分散 期待収益率 トラッキング、リスク MW八 'nMl︾ : 0 . 1 0什 9 . 3叫 C d ﹄内 : 2 4 . 7 % : 4 . 1 % : 1 5 1 ベクトル 8‑1と8‑2の ユークリッド距離 r----õ~05=ri ' i J ヌヲ庫融 ! 0 . 3 3出

151.

4 . 結果の比較 最適化 B 最適化 A 期待収益率の微少変動でポ 変動性は A の半分程度* 解の安定性 一トフォリオが変わる ポートフォリオ分散 ポートフォリオ期待値が増 ポートフォリオ分散にはあ 大するにつれて分散も大き まり変化がない くなる ポ ー ト フ ォ リ オ 期 待 パターン l→ 2になるに従 大きくなるが、最適化 A ほ 収益率 い、大きくなる どではない Aの設定は大変難しい ωの設定は比較的容易 パラメータの設定 直感的解釈が不可能 トラッキングリスクは直感 的解釈が容易 トラッキングリスク 実運用のイメージからする ωの設定値にコントロール と過大 されている 補足説明*解の変動性はパラメータの設定によって微妙に変わる。 5最適化の図解 図1 .最 適 化 [A)の 図 解 2 . 5 そ> 2 . 0 時1.5 ~ 相 イ 当 l t $ :. . I目的関数線 奈川卜 0 . 5 . ‑ 0 . 0 30 40 50 60 7 0 80 90 100 1 1 0 ポートフォリオ分散 最適化 Aでは、期待値.分散の図で説明する。証券の空売りを認めないかつ現金保有 を認めない条件での実行可能領域はドットで示されている領域である。この領域に 向かつて無差別直線を上方より降ろし、最初に接した点が解となる。なおこの無差 別直線の傾きが Aである。 ‑152

152.

•• ‑ ‑ • ・ ・ 一弐♂ • •••• 1 1 ・ ・ •• • ••• •• ••• ︑︑¥︑ 1' 銘 柄 Yの 組 入 れ 比 率 図2 . 最 適 化 (BJ の概念図 ‑ ••• •• ‑‑‑ : 人 ¥ 、 ; : : ; ; ; ; ; •••• • e ‑ 4 . . . . . . . . . . ̲ 実行可能領域 ・ ¥ 、 •• •••• / 線 最適化 Bでは、 2資産の組入れ比率の図を使うとわかりやすい。横軸に証券 Xの組 入れ比率を縦軸に証券 Yの組入れ比率をとる。同心楕円の中心がベンチマーク組入 れ比率であり、これを中心にトラッキングリスクが同等の同心楕円が描かれる、当 然離れれば離れるほどトラッキングリスクが大きくなる。トラッキングリスクが ω の楕円の内側が実行可能領域である。この領域に向かつて(この図の場合は)右上か ら無差別直線を降りし、最初に接した点が解となる。 6 .考察 6 . 1最適化 [8')‑トラッキングエラーと期待リターンとのトレードオフ m a x { h ( x ) }= max{XE一ψ(X‑B)'V(X‑B ) } この最適化は投資家のリスクがトラッキングエラーで規定されるという前提で期待 リターンとのトレードオフを実現しようとするものである。 しかしこの式は、 m a x { h ( x ) }=max{XE ψ(X‑B)'V(X‑B ) } =m ax{XE一ψ(X' I i X‑2X' V B‑B 'f ; 匂)} =max{X'(E‑均 四 )‑c p Xぽ + ψ1 ] 3 '四 } 1 5 3

153.

ここてψ>B'~うB は定数であるから、この最適化手法 [B'] は最適化 [A] と数式モデ ルとしては何ら変わらないことになる。 6 . 21)スクマトリックスの分解 リスク行列は N 行 N 列のポシティブデフィニット行列ある。このマトリックスを 主成分分解し d 個(通常数個~1O数個程度)の主成分を抽出し以下の様に行列を分解 する。 V=FDF'+ . I : 証券投資、特に株式投資の場合主成分で説明される部分 ( l J )のことをファクターリス クと言い、ファクターに対する個別証券の負荷量(丹をファクターエクスポージャ、 また主成分で説明されない部分(1:)をレジデュアルリスクなどど呼ぶことが多い。 このようなリスクモデルは Dや Eの非対角要素(の一宮町をゼロと仮定しいるものが あり最適化の数値解法を容易にする可能性がある。 6 . 3相関行列の要素に 1(完全正相関)や 1(完全負相関)(こ近い数値がある場合 銘 柄 Yの組入れ比率 図3 . 最適化 [BJの概念図 目的関数練 E 銘柄 Xの組入れ比率 図 3は先ほど図 2で説明した最適化 Bで、証券 XとYとの相聞が極めて高くなった 場合をしめしている。同心楕円は潰れ細長くなっている。この様な実行可能領域で 無差別直線の傾きが・ 1に近い場合直線の傾きが微少に変わる (Eから E ' へ変わる〉 と解は大きく変動することがわかる。証券 Xを売却し証券 Yへ乗りかえる投資行動 1 5 4

154.

となる。この売買は超過収益率を上げる目的の上で妨げになることがある。 尤も、無差別直線の傾きが・ 1から離れているならば解の安定性は逆に増すことにな る。投資可能証券の中には相聞が極めて高い関係にある銘柄が存在し得るので、そ れらの銘柄の期待収益率が近似的に等しくなる際には注意が必要である。 6 . 4最適化問題としての A、Bの数学的比較 、 2次関数型の目的関数と線形の制約条件からなるのに対し、最適化 B 最適化 Aは は、線形の目的関数と 2次式の制約条件で規定される。 投資可能証券数が大きくなった場合計算速度の点で最適化 Bが優れていよう。もち ろん O R的に高速解法の工夫はたくさんあろう。 7 . まとめ ポートフォリオ構築の際に投資可能証券の期待収益率と期待リスクが与えらている場 合の最適化の手法について比較をおこなった。証券の期待収益率を推定することは期待 リスクを推定することよりも遥かに困難であり確信を持った収益率の推定値は得にく し、。したがって、多少のブレがあったとしてもポートフォリオを大きく変えない最適化 アプローチが望まれる。本稿の最適化 Bは考察 4 . 3で述べた高い相関の場合注意が要る ものの、実務向けに応用の余地が大きいと思われる。 8 .サンプルプログラム 次のページに本稿の数値例を解く SAS江MLのプログラムとその出力結果を載せた。 NLPQN最適化ルーチンを用いた。 Fhu rhU 1ム

155.
[beta]
/ヰキキキヰヰキキ本キヰキキキキキヰヰ本本本字本キヰキキキキキキキヰ本本キキ本本本キキキキキキキキキキキキキキキ本本本本本本本本本本/

S
a
m
p
l
eP
r
o
g
r
a
m f
o
rN
L
P

本
/
/

キ

キ
//

H
o
t
c
h
i, M
a
s
a
h
ir
o, D
a
i
w
aA
s
s
e
tM
a
n
g
e
m
e
n
t
J
u
l
y2
21
9
9
9//
/

ヰ

キ
///

K
e
yW
o
r
d :I
M
LN
L
P
Q
N

キ
//

/キヰキキキヰキキヰキキヰヰキヰヰヰキキキヰヰヰキヰキキキキキキキヰヰヰヰキキキキヰキヰヰヰキキキキ本ヰヰヰヰキキキキキ本キキヰヰ本/

p
r
o
cI
M
L;
期待値ベクトル
キ/
リスク(標準偏差)ベクトルキ//

相関係数行列

t
d
#
r
o
o・
V
=
s
t
d本 s

ヰ
/

分散共分散行列

‑
X
‑
‑
x
‑
‑
x
‑
︐

マキ
チツ
ン値ラ
ベ入卜

︐

rj'rf' Jr

/本最適化 Aの目的関数

本‑
X
‑
‑
x
‑

︐
︐

レ
︐
EhE

ク値

O
b
j
e
c
tF
u
n
c
t
i
o
nA材 料 料 材 料 林 /

/材料材料本

ヰ
/

ベク

B
w = {0.35 0
.
3
0 0
.
2
00
.
1
5}
l
a
m
b
d
a =0
.
0
1
3;
.
0;
T
E =2

率ス
比リ
クグ
一ン

ヰ
//

ff'rf' Jr

E= {
1
.8
0
1
.4
0
o
.90
1
.
5
0 }
s
t
d
=
{
9
.
3
6
8
.
9
5
9
.
4
2 };
1
0
.
0
6
r
o
o
=
{1
O
.6
2
8
o
.387
o
.667
0
.
4
4
3
O
.6
2
8
0
.
6
1
50
.
3
8
7
0
.
3
4
00
.
4
4
3
1}
0
.
6
6
7
O
.3
4
0
0
.
6
1
5/

s
t
a
r
tF
u
n
c
A
(
x
r
) g
l
o
b
a
l
(
E,V,l
a
m
b
d
a
);
a
m
b
d
aヰ x
r 本 V本 x
r
u
f
=
Eヰxr ‑ I
);
r
e
t
u
r
n
(
uf
f
i
n
i
s
hF
u
n
c
A
O
b
j
e
c
tF
u
n
c
t
i
o
nB料 料 材 料 材 料 /

/材料材料ヰ

E

﹁

︑︐︐︐

(

d
内

n
v

u
﹂

門出

︐
.

‑)

1JF+l
rl︑
HU‑‑

ト﹂

門

内︑d

VAV‑︑
rl
︑
rl x n n D
nD士・rc
F
nnu=
tHUuH
u
干l B﹁
u
r﹁
'hH

+L

﹁
﹁

SFT

ri‑‑‑
a
n ・11
+L

N
o
nL
i
n
e
a
rC
o
n
s
t
r
a
i
n
t (T
r
a
c
k
i
n
gE
r
r
o
r )材料本件/
﹁ト﹂一

︑

W"rl

Tlr
'VA

︑J

ーーキ

nD本

︑HV
f

門同︾ rE

onD

aw
b

rl

︑

VA

);

ト
﹄

Vl‑‑J‑‑
VAHnu

Euc

︑
rl F ︑
rl βu
e
TI
n
t
h 一
+L‑・
x γ

'hH

nuTIE+LIli
‑‑
=Bn
nHnurl

edF+l

+LCd
r
a
n ・‑
+L'll

))
v
w
'nD

/ヰヰヰ料キキ

最適化 Bの目的関数

1}

x
O =B
w;

/本初期値の設定
1
5
6一

rj'rf'rf'r'J

o
u
n
d
a
r
yC
o
n
s
t
r
a
i
n
tキ
/
キ
/ B

‑
x
‑
‑
x
‑
‑
x
‑本

実行時のハ。うメータ 最適化A
実行時のハ。うメータ 最適化 B
パラメータの 10番目に
非線型制約式の数を指定

r

門﹁門

UNUN

。

lLIL

ff'rf'rf'r'J

nHV411411

nHV411411

nHU411411

b
l
c
=
{0

‑
X
‑
‑
x
‑
‑
x
h
‑
X︐

/キキキヰキキキキキキキ本字本キキキキキキキキ N
L
Ps
t
a
r
t ヰヰヰ/
o
p
t
A
=
{ 10 }
;
o
p
t
B
={10 ....... 1 };
キ
/ 1234 567891
0 本
/

156.

/ヰサンプルプログラム続きヰ/ ハ u ' h U ︑︑︐ノ +L A円 n v o VA nHU 門H A円 ハ u u ﹁ ﹁ VA VI AH ハU N114 削 ﹁; 〆ー︑.︐ ・ ' 門 H lLAHX G 円 H n u ! ? A円 Dl ﹁LrA ︐n 削 Nrl x t t ill= I A︐ I・ ・ ‑ a G ﹁﹁ cnvnv /ヰ組入れ比率合計 = 1のチェックヰ/ c a [[N L P Q N ( r c .x r B ."FuncB d B= x r B [ + ] p r i n t xrB ; p ri n t dB ; /ヰ組入れ比率合計 = 1のチェックヰ/ q r t (( x r B ‑ B w )州本 ( X r B ‑ B w )、); TExrB =s p r i n t TExrB ; /ヰ解のトラッキング制約チェックヰ/ qUlt ; /ヰヰヰヰヰヰヰヰヰヰヰヰヰヰヰヰヰヰヰヰヰヰヰヰヰヰヰヰヰヰヰヰヰヰヰヰ e ndo f program ヰヰヰヰヰヰヰ/ 一一一一一一一一ー出力結果一一ー一一一一ー XRA 0 . 5 7 4 7 9 3 40 . 2 1 2 8 7 1 4 0 . 0 3 4 4 8 70 . 1 7 7 8 4 8 2 D A XRB 0 . 5 8 1 9 3 6 60 . 2 6 6 3 4 1 8O .0 3 6 8 2 9 4O .1 1 4 8 9 2 2 D B TEXRB 2 . 0 0 0 0 0 1 9 1 5 7

157.

日本 S A Sユーザー会 (SUG I‑J) 金融業界における データマイニングの応用 司 〆 応 用 事 例 :r 保険解約の防止分析」 、 J 小野 潔 金融研究部門 株式会社ニッセイ基礎研究所 WhatDoesFinanceIndustryExpectfromDataMining ワ Ki y o s h iOno F i n a n c i a lResearchGroup, NLI Res e a r c h I n s t i t u t e 要旨 本稿は、最近の金融業界における適用分野や成功例を紹 介し、金融業界におけるデータマイニングの成功鍵は、「個 人属性と負事例データの収集」と「業務への反映方法」であ ることを述べる。次に応用事例として実務データに基いた、 「保険解約の防止分析」を取上げ、デシジョンツリーによる 分析が有効であることを示す。 データマイニング 負事例データ キーワード: SAS~Enterprise Miner ディシジョンツリー 1 金融業界におけるデータマイニンゲのポイント 1 . 1 . 分析手法 データマイニングは、単純にデータベースを探索するだけでなく、膨大なデータ から一定の法則や隠れたパターンを抽出する分析手法である。日本の金融業界では、 「顧客維持」、「新規顧客獲得」、「顧客選定」、「商品開発」といったワン・トウ・ワ ン・マーケティング(特定顧客へのアプローチ)への利用が期待されている。 データマイニングの分析手法は、①データ同士の相関関係を発見する「相関分析 ( A s s o c i a t i o n )J、②データを意味あるクラスに分類する「分類分析 ( C l a s s i f i c a t i o n )J、 C l u s t e r i n g )J、 ③データを性質の似た複数のグループに分類する「クラスタリング ( ④複数の出来事が時系列的に関係をもっ「順位分析 ( S e q u e n t i a lP a t t e r n s )Jの 4タ イプに分けられる。データマイニングを含めた分析手法を表 1にまとめる。 ‑159

158.

表 1分 析 手 法 と 適 用 例 分析タイプ 相関分析 分析手法 アソシエーションリトル、 ハ寺スケット分析 適用分野 商品の併買パターンの発見 分類分析 ディシ〆ョン・ツト、 ニュ}ラルネットワーク 顧客のセグメント化 クフスタリング分析 クラスター分析、 コホ斗ントネットワーク マーケット分類 順位分析 時系列順位分析 商品購入順序パターン 統計モプ、/レ 伝統型統計分析 判別分析、主成分分析、共分散分析 時系列予測 検証 株価・金利・為替予測 線形回帰、 ARlMAモデル t検定、 F検定、カイ 2乗検定、 AIC モプ、ルの検定 1 . 2 . 金融業界への適用分野 米国では、 1 994年 頃 か ら 流 通 業 や 金 融 業 で デ ー タ マ イ ニ ン グ の 成 功 例 が 報 告 さ れている。日本の金融業界でも、データマイニングの成功例が報告されてきた。 1997年 、 大 手 の ク レ ジ ッ ト ・ カ ー ド 会 社 が 、 ニ ュ ー ラ ル ネ ッ ト ワ ー ク を 利 用 し た米国の不正使用探索ソフトを導入し、リアルタイムのカード不正防止した。同時 期、外資の損害保障会社は、顧客属性と事故率の関係を分析し、リスク細分型自動 車保険の商品開発に成功した。銀行では、ディシジョンツリーを利用した融資審査 モデルが開発され、現在急速に広まってきた。今では、新規の住宅ローンの予備分 析まで分析対象が広がっている。また最近では生命保険会社が、保険解約の防止の ためにディシジョンツリー分析が使われ始めた。 金融業界では、この種の情報を公表しないため、正確な数字を把握できないが、 水面下でデータマイニングがブームになっている。そこで金融業界におけるデータ マ イ ニ ン グ の 適 用 分 野 を 表 2、 表 3にまとめる。 表 2 金融業界で既にデータマイニングが適用された分野(開発中も含む) 適用分野 保険解約の防止 目 的 手法 解 約 さ れ た 契 約 の 属 性 を 把 握 し 、 解 約 予 備 群 を 発 見 ディシγョ ン ・ ツ リ ー し、解約による保有減少を抑制する 円^~料ソゲ コミュニクーション・チャネルの 多様な情報通信メプ、イアの中から、顧客にあったコ ディシγョ ン ・ ツ リ ー 選択 ミュニケーション・チャネルを選択する 円^'判ソゲ リ fル ヒ eンゲ専用カード 個人属性とキャッシングの利用状況からリボ、ルピン ディシ〆ョン・ツリー モ ー シ ョ ン の7 ロ グカードを使いそうな顧客に使用を働きかける トI v 了 ブ シ エ ー シ ョ ン ・1 銀行の商品組合せ 定期預金・トン・公共料金振込等の組合せを分析し、 7ソシエーション・ l ト ル 顧客ニース e の発生タイミングに合せて、商品を提供する 順位分析 ダイレクトメーノレ 加盟!苫と顧客の行動を分析し、ダイレクトメールの 了ソシエーション・/ト1 レ 販売の活用 ヒット率を上げる ン ・ ツ リ ー ディシγョ 住 宅 ロ ー ン の 見 込 住 宅 の 購 入 見 込 み 顧 客 や 住 宅 ロ ー ン の 借 り 替 え 見 込 ディシγョ ン ・ ツ リ ー み客の推定 み顧客を特定し、ダイレクトメールで勧誘する 順位分析 融資審査の推定 個 人 の 住 宅 ロ ー ン や ア パ ー ト ロ ー ン の 融 資 の 可 否 を ディシシさヨン・ツリー 顧客管理分析 顧客の属性から推定し、業務の効率化を計る 証券顧客と営業職員とのトフブルを、証券の売買属 性と顧客属性から事前に予測する 一1 6 0一 ニ ュ ー ロ ン ・ ツ リ ー ディシシ eヨ ニ ュ ー ロ

159.

リスク細分型保険 消費者ローンの 与信審査分析 期限切れカードの 更新会員の選択 カードの不正請求 防止 社債格付け推測 年齢、年間走行距離、地域、使用目的、車の形状か ら、若者でも割安になる自動車保険を開発する 個人属性、勤務先、キャシング履歴から、与信審査 を行う 過去のカード利用歴から「意思確認を行うべき会 員」を絞り込む 購入金額、日付、庖の業種からカードの不正利用を 発見する 格付け機関の発表する格付けと、その企業の財務項 目・指標の関係から、他の杜債の格付けを推測する ディシγョ ン ・ ツ り ー ン ・ ツ リ ー ディシγョ ニ ュ ー ロ ン ・ ツ リ ー ディシγョ ト1 レ 了 ソ シ エ ー シ ョ ン ・l ニ ュ ー ロ クラスグリング ニ ュ ー ロ 表 3 今後データマイニングの適用が見込まれる分野 適用分野 セット商品開発の 活用 優良顧客の選択 目 的 手法 ソ シ エ ー シ ョ ン ・1 ト ル 生保と担保、さりに投信の情報を結合し、営業力を 了 順位分析 契約獲得に結びつける ン ・ ツ リ ー 継続率の良い保険契約を分析して、優良顧客の獲得 ディシγョ ク ラ ス グ リ ン ク ー に重点をおく ン ・ ツ リ ー 保 険 金 ・ 給 付 金 不 過去の不正請求パターンと属性の関係から、不正請 ディシγョ ニ ュ ー ロ 求の被害削減・不正請求の調査費用を削減する 正請求チェック 総合口座への活用 総合口座の顧客を分析し、他銀に複数口座もつ顧客 ディシシーョン・ツリー ク7 スグリング に総合口座へ移行を促す ン ・ ツ リ ー 介 護 保 険 法 に お け 介護のアセスメント項目の分析し、介護ニーズにあ ディシシe ヨ スグリング ク7 る介護ニース守の分析 わせたケアプランを選択する ン ・ ツ リ ー マ ン シ ョ ン 賃 貸 料 マンションの賃貸価格を推定し、将来の資産価値を ディシγョ ニ ュ ー ロ の推定 計算する 1 . 3 . 探索の深さ データマイニングの探索には、「浅い探索」と「深い探索」がある。「浅い探索」 では、専門家の満足するシナリオが最終ゴールになる。初心者でも、マイニング・ ツールを使えば、「浅い探索」は可能である。それに対して「深い探索」では、顧客 のピンポイント・マーケティングが実現でき、しかも専門家が知らないパターンを 発見する可能性もあるが、分析には経験が必要とされる。 分析結果を業務へ反映する場合、「深い探索」の分析結果が、必ずしも「浅い探 索」より優れているとは限らない。例えば、「保険解約の防止」や「カード司会員のマ ーケティング」では、『お客とのコミュニケーション』が重要である。この場合は、 「深い探索」のように極端に顧客を限定するより、やや広範囲の顧客を対象にした 方が業務の目的にかなっている。反対に与信・融資審査の場合、「浅い探索」では審 査が甘くなり大きな損害が発生する。つまり業務データの分析では、「分析結果の精 度」や「探索するレベル」を、業務目的から決定するべきあり、分析技術や結果か ら決定すべきでない。 一1 6 1ー

160.

1 . 4 . KDDプロセスとマイニング・ツール データベースを用いた知識発見は、複数のプロセスから構成される。これを KDD (KnowledgeD i s c o v e r yi nDatabases、データベースからの知識発見)プロセスと s e l e c t i o n ) 、②前処理(pr e p r o c e s s i n g ) 、③変形 いう。 KDD プロセスは、①選択 ( ( t r a n c ef o r m a t i o n )、 ④ デ ー タ マ イ ニ ン グ ( d a t a mining)、 ⑤ 解 釈 ・ 評 価 ( i n t e r p r e t a t i o n/e v a l u a t i o n )、⑥ルール生成の 6プロセスから構成される。これら プロセスを何度も繰り返すことによって、精度の高い知識が得られる。 マイニング・ツールは、 KDD プロセスをそデ ルに実装したものである。マイニ ング・ツールは、 KDDプロセスの②前処理、③変形、④データマイニング、⑤解釈・ 評価を一貫して行う。マイング・ツールは、手間のかかるプロセスを簡単に扱える ため、作業効率は 3 倍 ~5 倍以上になる。しかし残念ながら、現状のマイニング・ ツーノレでは KDD のポイントとなる意志決定機能が未成熟であり、「深い探索」は分 析者の能力に依存する。 1 . 5 . 負事例問題 データマイニングを成功させる条件の一つは、データウェアハウスに必要最小限 の負事例データと属性を取り入れることである。データマイニングには、負事例デ ータが必要不可欠であるが、データベースはもともと正事例のみから成り立つため、 s i t i v es e t )は「実際に 負事例を含めないことが多い。例えば融資審査では、正事例(po 契約に到ったデータ集合」であり、負事例 ( n e g a t i v es e t )は「契約できなかったデー タ集合」である。金融機関では、契約に至らなかったデータをデータベースに蓄積 しないことが多い。 データマイニングの分析では、正事例と負事例の共通属性を対比するため、負事 例が存在しなければ分析できない。また負事例データが存在しでも、属性数が少な ければ、正事例の属性数が豊富でも、分析は負事例の説明属性に限定されるため、 データを生かすことができない。 負事例のデータ蓄積は、データウェアハウスの設計段階から考慮する必要がある。 しかし負事例データの収集には、業務の変更や他部署の協力がなければ、実現でき ないことが多い。このような様々な問題点を洗い出すために、データウェアハウス の開発前に、データマイニングを試験的に導入することは望ましい。 1 . 6 . 個人属性データの不足問題 データマイニングの分析データは、リアノレのオベレーション(業務)データが中 心である。金融機関は、契約時の顧客属性(既婚・独身、年収、勤務会社、病気等) データを多く保有するが、その後更新しないために、データマイニングではほとん ど使えない。結局、金融機関ではデータマイニングで使える顧客属性が、「性別」と 162‑

161.

「年齢 J しかないことが多い。今後は、リアルの個人属性データの入手が、データ マイニングの精度を向上させる上で、最も重要な課題である。 1 . 7 . 説明属性の加工 I 別効率が高い分析結果が得られない。精度を上 業務上のデータ項目のみでは、半J げるには、既存データを加工し、説明属性を追加する必要がある。追加する説明属 ) 0 RMF分析は、購入商品の RMF項目にウエー 性は、 RMF分析を応用する(表 4 トを掛け、その合計値によって顧客をセグメント化するデータベース・マーケティ ングの分析手法である。データマイニングでは、基本項目に保険商品や取引ごとの RMF項目をデータベースに追加する。「深い探索 J では、分析者の経験と試行錯誤 から、さらに説明属性を追加する。 表 4 RMF分析の項目 項目 R ( r e c e n t l y ) F ( f r e q u e n c y ) M(monetary) デ‑ I Jへ 守 } ス ・ 7ーケティング DM 項目の例 契約時点、からどのくらい経過したか? 最近購入しているか? 頻繁に購入しているか? 何種類の保険に加入しているか? 多額の購入しているか? 保障金額の合計はいくらか? 1 . 8 . データクリーニング データウェアハウスを直接探索するとデータベース量が大きすぎるため、データ マイニングでは、データウェアハウスから切り出したデータマート(情報検索用の 小規模データベース)を探索する。このデータマートは、正事例と負事例の共通項 目のデータをアペンドし、商品ごとの RMF項目を追加したデータベースである。 金融機関の業務データベースでは、負事例と正事例が別々のデータベースになっ ていることが多く、しかもデータベース聞には、異音同義・同音異義・有意コード・ 単位相違・欠損値等の問題が存在する。そのため、正事例と負事例のデータベース をアペンドするときに、データの不整合が起こりやすく、データクリーニングが必 要になる。業務データの分析は分析項目数が多いため、データクリーニングに要す る労力が作業時間の 50~70% を占める。 1 . 9 . 業務への適用 業務上でデータマイニングを成功させるのに難しい点は、「精度の高い分析」で はなく、「分析結果を業務へ反映させる方法 Jである。 例えば、保険の解約予備群団に対して有効な対策は、①営業職員の面接対応、② ダイレクトメール、③顧客電話サービス、④キャンベーンが考えられる。どのアプ ローチ(単独または複数の組合せ)が、どのような顧客に有効でかつ、コスト的に 優れているかを計測するために、実験調査をすることが望ましい。効果の測定は、「何 163‑

162.

も顧客へアプローチをしないコントロール・グ、ループ」と「アプローチを試みたグ ノレープ」の差異から分析する。 1 . 1 0 .成功の条件(まとめ) データマイニングの分析対象は、企業の主商品が多い。その分析結果は、業務の 変更や複数の部署に影響を与えることがあるため、経営者のトップの判断が必要と なる。そのため、早い段階から経営者の参加が望ましい。 分析の最初のステップは、分析する対象問題を特定し、業務の本質から「分析結 果の精度」や「探索するレベル」を決定する。金融業界では、負事例データと個人 属性データの不足が発生しやすい。データウェアハウスを設計時に、必要最小限の 負事例と個人属性を取り入れることがポイントになる。また業務データベースでは、 正事例と負事例のデータが別々に蓄積されているため、データの不整合や欠損値が 生じやすく、データクリーニングが必要になる。業務データのみでは、説明属性が 不足するため、商品・契約ごとの RMF項目を付け加える。 マイニング・ツールを用いると、作業効率が大幅に向上するが、最終的には分析 者の能力に依存する。マイニング・ツールの選択基準は分析の種類や操作性だけで なく、データクリニーングの側面からも考える必要がある。 分析者は業務の専門家にわかりやすく、安定的な解を求めることが重要である。 安定的な解を犠牲して、判別効率を上げるためだけに複雑な分析手法を導入しでは ならない。 本格的に業務へ反映する前に、実験的に一部の顧客へ対策を実施し、その分析結 果から顧客ごとの有効なアプローチを特定することが望ましい。 2 . ディシジョンツリー分析 2 . 1 . ディシジョンツリーの特徴 ディシジョンツリー分析は、データのもつ属性を使ってク守ループ分類をする手法 である。分析結果は樹形図で表現できる。ディシジョンツリーでは、ツリーの分岐 の属性順序や闇値を自動的に算出し、分析者の志、意は排除される。ツリーの構造か ら「もし…ならば である」というルールを引き出すことができ、これをルールの 導出と言う。導出されたルールが専門家のシナリオと一致すれば、「浅い分析のゴー ノ レ 」 となる。 2 . 2 . 分割基準値 ディシジョンツリーでは、属性の分割基準値に基いて、分割属性の優先順位が決 まる。分割基準値は、ルールが目的属性値の分布与える影響度合いを数値化したも のである。基準値が小さいほど影響力が大きく、ツリーの最初の分割属性になる。 1 6 4 ←

163.

分割基準には、「↑青報エントロビー値」、 iGINI基準値」、と「カイ 2乗値」があ 、 j個のカテゴリー値をもっ目標属性が存在し、集合 S内に i個 る。データ集合 Sに i ( 8 )個 (i= 1,•, . j) あると仮定する。ルール 番目の値をもっデータがそれぞれ X Rで 81と82に 2分割し、部分集合 81内の i番目の値の分布比率を P i ( 8 i ) = X i ( 8 1 ) / 1 8 11 とすると、各分割基準は以下のように定義できる。 情報エントロピー値 Ent(R)= Ent(x(SI)) 寸 I S 11 十 IS21~ ‑LPi(S)!ogPi(S)一 (一一一之 P, ( S I )! o gP i( S I ) 一一三 Pi(S2)!OgPi(S2)) 守 │SlT1 11Slff G I N I値 i n i ( x ( S I ) ) Gini(R)=G 2 ,1 S I1 十 fT721SlT 十 ニ 1 丸│十 AISlT' h (1‑), P, (S)") ーよー ( 1一 ), P i ( S I ) " )一 ' , ‑ ' : , '(1‑):Pi(S?Y) ム カイ 2乗値 Chi(R)=Chi(x(SI)) 十l S I1 (Pi(SI)‑P, (SI))2+1 S 2 1(Pi(S2)‑P, ( S 2 ) ) 2 ~ ~(~ 2 . 3 . 探索アルゴリズム ディシジョンツリーは、分割基準値が最小となる説明属性を発見し、高い反応属 性順の顧客セグメントのツリーを作成する。 ①判別対象の目標属性(ターゲッ卜)を決定する。 ②すべての説明属性について、分割後の分割基準値を計算する。 ③最小の分割基準値を有する説明属性により、分割を実行する。 ④分割後の集合に対して、②、③を繰り返す。 ⑤アルゴリズムの終了は、分割基準値の利得やカテゴリに含まれるサンプル数 で判断する。 3 . 応用事例:保険解約の防止分析 3 . 1 . 条件 8A8/Ente叩 r i s eMinerを使用して、保険解約の防止分析を試みた。保険解約 者のプロフィールを、判断力の高い属性の組み合わせでグループ分類し、保険解約 予備軍の顧客ノ fターンを発見することが目的になる。 データマートは、目標属性の状況フラグ(継続保有・解約)、説明属性である顧 t c .)、契約属性(保険種類・保障額・保険料・契約日・契 客属性(性別・生年月日 e t c .)、さらに取引属性(取引内容、日付、金額 e t c .)と営業職員属性(担当 約年齢 e 1 6 5一 」

164.

営業職員、勤務年数 e t c .)から開発した。取引属性は配当金や契約変更等の情報で あり、営業職員属性は契約者を担当している営業職員の属性である。 J 頂は、最初に 3営業庖の保険契約の保有データ (6万件、 98 年 9 月末) 開発手! と解約データ (2万件、 5年分)の同じ属性を結合する。次に証券(契約)記番を t c . )、営 キーにして、取引履歴データ(配当金の引出し、特約途中付加の契約変更 e 業職員データの項目を追加する。完成したデータマートは 8万レコード、項目数は 200 個以上(加工データを含む)となった。 訓練・検証別の配分は、ランダム・サンプリングで、訓練データ 50%・検証デー タ 50%の割合とした。第 1段階は、情報エントロピー値が大きい不要な属性を落と し、説明属性の絞り込みを行う。情報エントリピー値が小さいほど、目標属性と関 係が深い。ただ異常に小さい値の属性は、目標属性と同じ属性をもっ可能性がある ため、適切な説明属性か否かを検証する。今回は、第 1段階で 200属性から 35属性 まで絞り込めた。 第 2段階は、絞り込んだ、説明属性をデ、イシジョンツリーで分析する。分割基準値 は、比較の結果、情報エントロビーを採用した。最終モテツレの評価は、単に判別効 率だけでなく、導出ルールが「専門家の顧客プロフィー/レ」を満足できるかどうか が判断基準となった。 3 . 2 . プロセス・フロー・ダイアグラム SAS/EnterpriseMinerは、ノンプログラミングで分析できる。データ属性や 手法・パラメータの選択やデータフローは、図 1の「プロセス・フロー・ダイアグ ラム」で制御する。四角箱がノードと言い、サブノレーチンの役目を果たす。分析作 業は、その役割により 3分割できる(図 1の点線)。左上部は、データ入力・サンプ リングの部分である。右上部は分析手法を比較調査する部分である。下部は商品別 に詳細な分析を行い、その結果を検証する部分である。 左端の[入力データ・ノード]では目標属性の指定し、[サンプリング・ノード] では入力データをサンプリング方法とデータ数を決める。[棒グラフ]と [ lNSIGHTJ のノードは、分布を調べ、異常値や特殊ノ fターンの探索に使用する。 モテツレの構築には、訓練データを使用し、残りの検証データで、モデルの検証を行 う。このデータ分離を[トレーニング・検証分離ノード]が行う。[アセスメント・ ノード]では、複数のモデノレの分析結果を比較し、保険解約の防止に適した分析手 法を決定する。 詳細な分析は、[グ、ルーフ。別ノード]を用いて、商品毎に分析する。ディシジョ ンツリーのパラメータ(分岐数と深さ)を変化と、導出ノレールの変化を調べる。図 中の[分岐 3・分岐 4 のノード]は、ツリーの最大分岐数を意味する。最後にロジス ティック回帰分析から t値を求め、各説明属性の影響度を計測する。 166‑

165.

図 1解約防止分析のプロセス・フロー・ダイアグラム図 3ふ 分 析 結 果 3 . 3 . 1 . 分析手法の選択 ニューラルネットワーク、ロジスティク回帰、ディシジョンツリーの判別効率を 正反応補足曲線で比較する(図 2)。商品 2の正反応補足率は、横軸 30%のとき縦軸 の正反応補足割合が 75%である(図 3の丸印)。この意味は、全契約者の 30%にダ イレクトメールを発送するだけで、解約予備群の 75%へ郵送できることを示してい 図 3 商品別のディシジョンツリー 図 2 分析手法の比較 曲線の種類 曲線の種類(上から) (上から) 理想曲線、決定木、ランダム曲線と回帰と ニュム可ロは、 Z6 J& ・霊竃宮、 j T T L 一~ー~ 園周掴 回 1 " " ' mammm / 」矛' ノ , , : " v /' J ‑ ̲ . 掴 , ー 一 一 一 、 /]t 反v 乙こ ト一一 ゾ' μ 理想曲線、商品 2、商品 l、ランダム曲線 E骨 rーー~一一_' a ト 一 一 ト 一 面b炉 ー~ £ 十 νF / " f 〆 r一 ジ 多 ‑ ‑ F 臼 巴 ty 〆 E 乏 t 0 2 t J 3040 '/ 医コ』副同 . T r . 口陶 =司デ ./ 4ぞ 4' ぷ戸 dグ . ・ U1Q : J D 周 回 lD 100 lOlO<<) 白刷川 却 園 周 圃 個 , 国 1 1 9 也曾 1 1 9 r'ツーJ ト / t=~ r P . ' " ・ " 「ツールー l口 B剛同 ‑167 .T~ 巴1 r ̲ ̲ 2 口E 切断

166.

る。理想曲線(ニ正解率 100%) は、原点とターゲット最大比率[(実際の解約数) J を結んだ直線である。ランダム曲線は 0 %と 100% ‑‑;‑(全データ数) =40% (横軸 ) を結ぶほぽ直線となる。開発モデルの正反応補足曲線は、理想曲線とランダム曲線 の聞に存在しなければならない。 図 2は、ディシジョンツリー分析が最適なことを示している。今回の分析では、 説明属性にカテゴリ属性が多いため、他の手法よりディシジョンツリーがすぐれて いる。図 3は商品別の分析結果であり、商品 2の方が商品 1より予想しやすいこと を示している。 3 . 3 . 2 . パラメータ調整 ディシジョンツリーモデ、ルには複数のパラメータがあり、値によりツリーの構造 が大きく変化する。そこで、 3種類の分割基準(情報エントロピー値、 GINI基準値、 カイ 2乗値)、最大分割数、木の深さなどのパラメータを変化させて、どのような影 響がでるかを調査し、最適なパラメータを決定する。 図 5 収束の葉数 図 4 パラメータによる影響 曲線の種類 曲線の種類(上から) (上から) 検証デー夕、訓練データ 理想曲線、商品 2の分岐 3個と 8個(線が重複)、 商品 Nコ分岐 3個 ンダム 亙描ヨp . 台 、 1 ' 0 0r一γー‑..1量.,., . . . . . . . . 話 ' " " " " 1 / . .ト l' 2 f J ‑ ‑ E , ー " J τ t . a 4 ' タ f i ー t .1 t 1 2 ' : : , r ? . , 2 1 /" 4 : : ; ; f 掴 t . " r ・・ ‑ τ 空三 : 主F A ‑ ‑ ー 4 L 戸 ..トーー一+一ーー→耳鼻十寸 調 ~'''MInI A./ / 。, . , 3D . . s o . . m ・ H // 蝿 100 ・・ " F 守剛司圃・ n 圃 闘 n ̲ I ・・. ・ " .・ " " ・ 1 陶 旨 ・ "... 咽 1 1 富倉位. F 1 iI 1 1 I I I1 1三日 ツ‑JIr‑ 回 S岨 t同 .T 岨 口 T.・~, 口 τv・~, .T.・~4 ここでは、サブツリーの分岐の変化数 (2~ 1O個)と正解率の変化を調べてみ る。分割数やツリーの深さを増やすと、グループが細分化されルールが多くなり、 わかりづらくなる。経験則では、最大分割数は 2個から 7個が人間にとって理解し やすい。図 4では、商品 1と 2に対して分岐数(最大値 8個と 3個)を変化させて いる。結果は、商品ごとに曲線が重なり lつの曲線となっており、分岐の最大値の 変化による精度の差がほとんどない。ただ分岐数を変化させると、ツリーの構造が 大きく変化し、導出ルールも大きく変わる。そこで業務の専門家が最適なルールを 168‑

167.

選択し、最適なツリーを決定する。この作業は、機械的に判断する方法はなく、専 門家との協力作業になる。 3 . 3 . 3 . 収束 デ?イシジョンツリーは、葉数(分岐数)が増えるにつれて、分類が細かくなるの で、正解率は向上するが、ある葉数以上では正解率が収束する。収束枚数が少ない ほど、モデルの構造は柔軟であり、データの変動に対しでも影響を受けづらくなる。 また葉数を多くして分類を細分化すると、訓練データでは誤差が 0に近くなるが、 検証データでは誤差が拡大する可能性ある。この現象は「過剰適合 J と言われる。 一般にモデル開発は、事象を説明する項目(要因)を少なくしながら、高い正解度 を維持することが重要である。 図 5では、訓練・検証データに適用したモデルが共に、 28 枚で収束したことを 示している。この葉数ならば、ツリーの階層は 3層から 4層となり、人間に理解し やすいツリー構造になる。また訓練データと検証データ共にほぼ同じように収束し ており、安定的なモデ ルと言える。 3 . 3 . 4 . 検証結果 モデルの推測結果と実際の保有解約を比較する。モデルの正解は、①モデ、ルが保 有継続と推測し、実際に保有継続になる場合と、②モデ、ルが解約と推測し、実際に 解約となる場合がある。商品 2の解約モデ、ルの正解率は、 86% (=62%+24%) と なり、業務的に満足できる結果が得られた。ただ今回はプロトタイプの分析である ため、採用データ数が全契約 0.3%にすぎず、全契約に対しては統計上、有意でない ことに留意する。 表 5 商品 2の正解率(括弧内の数字は件数) % 実際保有 実際解約 合計 モデル保有 6 2 % ( 8 7 4 4 ) 2 % ( 2 7 0 ) 6 4 % ( 9 0 1 4 ) モデル解約 1 2 % ( 1 6 0 2 ) 24%(3293) 36%(4895) 合計 74%(10346) 26%(3563) 100%(13909) 3 . 3 . 5 . t値 ロジスティク回帰分析は、説明属性の t値を計算できる。図 6は 、 t値の絶対値 が降順に並べた棒グラフである。濃色の棒グラフは正の t値を示し、薄色の棒グラ t豆O ) J、「集金方法の フは負の t値を示す。有意な項目は、「契約時からの経過月 ( t亘O ) J、「保険料がステップ式に値上がりするかどうか(修正払込) 種類(現機関) ( ( t亘O ) J である。業務の専門家が指摘した解約につながる属性のうち、「契約貸付 1 6 9一

168.
[beta]
図 6 t値
~II~

けが有る場合(契貸有無) (t~O)J 、
「倍率(二死亡保障額/満期額) (t~

"
,
.ー
1

100 t ‑
も旬

、

O
)
J、「コンパージョンが過去にあった
場合 (
CV表示) (
tとO
)
Jは
、 t値が

"
'

やや小さいながら抽出された。

"
.ー
ー

"
" 一ー
0<
<
1t ‑
ー

1l~11

.I"~

2
.

a
・

3
.
3
.
6
. プロフィール分析

!
l
.

r
.
1
ir

1

f:J‑f 聖
・E
λ

聖
書温

室
";
; D
H
A
.
・
E

i
l
l
Oライル

プロフィール分析は、ツリーを人
間の言葉に置き換えて知識化する。この作業を自動的に行うこともできるが、不要
なルールも導出されことも多いため、今回は専門家と分析者が共同で分析した。

顧客プロフィール:
経過年数が 1年未満で、
契約時の担当職員が退社したならば解約は多い

.
5年間で、
経過年数が 1年から 2
死 t保障率が低いほど解約は多い
経過年数が 2
.
5年から 4
.
5年間で、
振替貸付があれば解約は多い

.
5年から 7
.
5年間で、
経過年数が 4
5
.
5未満ならば解約は多い
保障倍率が 1
5
.
5以上ならば解約は少ない
保障倍率が 1
.(以下省略)

4
.

参考文献

• Fayyad,U.M., P
i
a
e
t
s
k
y
‑
S
h
a
p
i
r
o,G
.andSmyth,P
.
:FromDataMiningt
oKn
owledeD
i
s
c
o
v
e
r
y
:
AnOverview
,
Advancesi
nKn
owlegeD
i
s
c
o
v
e
r
yandDataMining,p
p
.
1
‑
3
4,AAAl瓜!lITP
r
e
s
s,1
9
9
6
.

・

JosephP
.
B
i
g
u
s, DataMiningwithNeuralNetworks" ,
TheMcGraw‑HillCompan児 島 1
9
9
6
.

‑河野浩之, データベースからの知識発見の現状と動向"、人工知能学会, v
o
1
.
l2No.
4,
pp.
49
7‑504,
1
9
9
7
.
・寺野隆雄、 KDDツールの動向と課題"、人工知能学会, v
o1
.
l2No.
4,
p
p
.
5
2
1
‑
5
2
1,
1
9
9
7
.
・安武史、柴田浩一、 データウェアハウスとデータマイニング"、 F
i
n
a
n
c
i
a
lResearch,p
p
.
1
5
‑
3
1,NEC
総研、 1
9
9
8
.

・矢田勝俊、加藤直樹、羽室行信、 アソシエーションルールを用いた販売促進"、 p
p31‑38、日本ソフト

9
9
9
.
ウェア科学会、 1
・J
.R.キンラン、 Alによるデータ解析"、
・

トッパン、 1
9
9
5
.

クレジット・カードの不正使用を防止する"日経コンビュー夕、 1998年 6月 8日号、 1
9
9
8
.

・丹後俊郎、山岡和枝、高木晴良、 ロジスティク回帰分析"、朝倉書底、 1
9
9
6
.

1
7
0

169.

5 . (資料)保険解約のディシジョンツリー (説明) 0は契約の保有継続、 11 ま解約を意味する。右葉端の四角内の数字意味は、第 2欄が訓練データ に適用した結果、第~置が検証デサに適用した結果で 。 。 T o t a l 一 一 ー ' ー 訓練ずータ 検証データ 訓練データ 検証データ 77.7% 72.8% 208 259 解約(件数) 訓練データ 検証データ 724 692 保有(件数) 訓練データ 検証データ 932 951 全件数 訓練データ 検証データ (見方)解約と保有の割合が極端に偏るほど、グループ分げは成功している。つまり保有が 0%に近くか、 または保有が 100%に近いほど、解約と保有 l ま明確に分けられる。逆に保有 50%、解約 50%な らば、両者が交じり合ってグループ分けができていない。 下半分のツリーは、紙面の都合上、力ッ卜した。 1 7 1

170.

日本 S A Sユーザー会 (SUG I‑J) バランスドスコアカード業績評価システムの構築方法 牧野恭 株式会社 SASインスティチュートジャパン プロフヱツショナルサービス本部コンサルティング部 I m p l e m e n t a t i o nmethodo fBSCmeasurementsystem Y a s u s h iMakino n s t i t u t eJapanL t d . C o n s u l t i n gD e p t .P r o f e s s i o n a lS e r v i c eD i v i s i o n,SASI 要旨 SAS は独自の反復/進化アプローチに基づいて、企業の業績を短期と長期の視点からバ ランス良く評価することによって企業戦略の実現を図るマネージメントシステム =BSC業績評 価システムを効率的に構築する。 キーワード: バランスドスコアカード、反復/進化アプローチ、プロトタイプシステム 1.はじめに バランスドスコアカードはトップの立場から企業の業績を短期的視点と長期的視点のバラン スを取りながら評価することによって、企業戦略の実現を図ることを目的とする戦略的マネージ メントシステムである。本稿ではバランスドスコアカードを情報システム =BSC 業績評価システ ムとして具体化するための SAS の基本的なシステム構築方法=反復/進化アプローチを明 らかにし、 SAS が持っているシステム構築ツールとシステム構築技術の有効性を広く訴えるこ とにしたい。 2ノくランスドスコアカードとは何か 国内市場は総じて事業規模の縮小に向かっているが、戦略的に重要な事業をし、かに守り 育てていくかとしづ課題は、それにも拘わらず、或いはそれ故にこそ企業の死活問題として残 されている。戦略的に重要な事業の業績を短期的な視点からのみ評価することは、将来に向 かつての成長の芽を摘むことになりかねず、かと言って今日の糧を無視することもできない。こ ‑173一

171.

のジレンマを解決する手段として脚光を浴びているのがバランスドスコアカードである。 すなわち、企業の業績を短期的な視点二財務的視点のみならず、長期的な視点=非財務 的な視点と組み合わせ、バランスを取りながら評価することによって、企業戦略の実現を図ると いうアイデアがバランスドスコアカードの基本である。財務的な視点は過去を振り返る視点であ り、タイムラグを伴うフィードパックコントローノレで、ある。これに対して非財務的な視点は将来の 可能性を切り開く視点であり、フィード、フォワードコントロールになる。両者の視点は連鎖的な 因果関係、を媒介にして繋がっており、最終的には財務的な成果をもたらす。 この点を具体的に説明するために Xerox社の事例を取り上げてみよう。同社は 1970年代 の半ばまで、コヒ。ー業界において独占的な地位を占めていた。その当時は、 ①コピー機をリースとし、コピ一枚数に応じて収益をあげていた。 ②コピー機および用紙、トナーとし、った備品からの売上が大部分を占め、かつ成長していた。 ③顧客はコピーコストが高いにもかかわらず、機械の故障率が高いことに不満を抱いていた。 としウ状況であった。 しかし、同社のトップは上記③の不満を解決しようとせず、さらに財務的利益を増加させよう としていた。そこで取られた戦略がリースに代えて買取りの制度を導入することであり、故障し た機械を修理する子会社を設立することで、あった。その結果、 ①修理サービスの需要が高く、親会社の利益の増大に大いに貢献した。 ②顧客は修理中のコピー機のパックアップ用に数台のコヒロ一機を購入せざるを得なくなり、同 社の売上をさらに増大させた。 となり、同社の財務的業績評価指標はこの戦略があたカも成功したような数値を示すことにな った。 ところが、日本や米国の競合他社が安くて故障せず、コピーの質も遜色のない機械を発売 するに及んで、同社の製品は顧客離れを起こし、倒産同然の状態にまで追い込まれた。その 後、同社の新トップは機械品質と顧客サービスの向上に取り組み、 1980年代には驚異的な再 起を成し遂げた。 このように財務的業績評価指標は、タイムラグを伴い、直近の期間における企業行動がもた らした価値の創造/喪失を必ずしも正確に反映していないのである。 それでは、非財務的な視点をどのように取れば良いのであろうか。 Xerox 社の事例からも分 かるように、それは①顧客の視点を中心にして、②社内ビジネスプロセスの視点、及び③学習 と成長の視点を組み合わせたものである。 ①顧客の視点は、顧客を獲得し、顧客の満足度を高めることによって顧客を定着させ、顧客か ら利益を得るための視点である。 ②社内ビジネスプロセスの視点は、 ・イノベーションプロセス=市場を明確にし製品/サービスを開発するプロセス .オペレーションプロセス=製品/サービスを生産し流通させるプロセス ・アフターサービスニ顧客サービス ‑174一

172.

から成る社内プロセスを、顧客ニーズを認識し、充足させることに焦点を合わせて編成していく 視点である。 ③学習と成長の視点は、従業員の満足度を高め、定着を図り、生産性を向上させるための視 点である。 容易に分かるように、顧客を獲得し、満足度を高めるためには、顧客ニーズを認識し、製品/ サービス開発を行い、それを顧客に提供しなければならない。また、そのためには従業員の能 力開発を行い、生産性を向上させる必要がある。すなわち、これら3つの視点は連鎖的な因果 関係によって繋がっており、最終的には顧客からの利益としづ財務的な成果となって現れる。 さらに、財務と非財務を併せた4つの視点は、企業のトップの視点から見たビジョンと戦略の 実現を図るものでなければならない。さもなければ、企業は単なる機械仕掛けの自動人形のよ うなものでしかなく、機械的な因果関係によって動いてはし、るが、環境の変化を認識し、主体 的に対応するとしち能動的な活動を欠くことになる。特に今日のように変化が激しく、不確実性 が急激に増大している状況の下では、トップの理念によって主導され、方向づ、けられたビジョ ンと戦略が不可欠である。こうして、 4つの視点はビジョンと戦略を反映し、その実現を図るもの でなければならないのである。以上を要約すれば、次のように図式化される。 財務的視点 r . , 使用資本利益率 資産利 a h 用度 、 、 (社内ビジネス 惨 納期厳守 導入計画対実績 、 舎 ‑ 学習と成長 従業員満足度 の視点 提案実現度 ‑175一 I J 企日孟 ~.J I ~因果聞係 I

173.

3.BSC業績評価システムの構築方法 BSC業績評価システムの完成した姿は次のようになる(添付のシステム構成図参照)。 ①データウエアハウス ・基幹系データベースにアクセスし、必要なデータを抽出する。 → SAS/ ACCESSt oO r a c l ee t c . ‑データウエアハウスを提供する。 →B aseSAS,SASlW arehouseA d m i n i s t r a t o r .多次元データベースを提供する。 → SAS/MDDBS erver ②ビューワ ・グ、ラフイカルユーザインターフェースを提供する。 1 )クライアント/サーバシステム → SAS/CONNECT ,SAS/EIS ,SAS/ AF,SAS/GRAPHe t c . 2)Webブラウザ →S AS/lntrNet,SAS/SHAREe t c . 機能構成は比較的単純なものであり、それだけを見ればシステム構築にさして困難はないよう にみえる。しかし、本当の困難は BSC 業績評価システムを単に情報システムとして構築する 点にあるのではなく、戦略を実現するマネージメントシステムとして構築する点にある。すなわ ち、業績評価指標の全体系をし、かに作り上げるかに、その成功の鍵がかかっているのである。 そこで、システム構築全体の手順を概観してみよう。 L̲̲ーーーーーーーーーーーーーーーーー‑ I 3 1 I̲ーーー『ーーーーーーーーーーーーーーーーーーーーー 1 7 6一

174.

①評価 ⑤分析/レビューの結果の評価 ②指標の定義 業績評価指標の体系の定義 ③ウエアハウスの構築 業績評価に必要なデータの収集と蓄積 ④ビューワの展開 グラフィカルユーザ、インターフェースの展開 ⑤分析/レビュー ②、③、④の分析とレビュー ①から⑤までの循環的なプロセスは 1回で閉じてしまうのではなく、より完全な業績評価指標の 体系に向かつて反復的に進んで、いく。 SASEuropeではこのようなアプローチを 反復アプロー チ( I t e r a t i v eApproach)"と呼んでいるが、私たちは 反復アプローチ"の中の③、④にも注目し て、費用対効果を考慮、に入れたプロトタイプシステムから本格システムへの 進化アプローチ" を考えている。 その説明に先立って、一連の手順の中で最も重要な②指標の定義について、やや詳しく説 明しておこう。 4 .業績評価指標の定義 業績評価指標を定義するためには、 2つの制約条件を考慮しなければならない。一つは指 標を選ぶ基準であり、他は指標相 Eの因果関係である。バランスド スコアカードがビジョンと戦 略の実現を図るものである以上、指標を選ぶ基準はトップの視点に基づ、くビジョンと戦略であ ることは言を待たない。また、業績評価指標は相1i1 こ因果関係で結ぼれており、お互いに影 響を及ぼし合いながら最終的には4つの指標に要約され、戦略の実現度を測定する尺度とな る 。 したがって、指標を定義するための実際の作業では、戦略と因果関係、に制約されながら、 4 つの抽象的な指標をより具体的で、検証可能な指標に意味翻訳=解明していくことになる。そ の結果、業績評価指標の全体系は抽象的な指標から具体的な指標へ向かつて降りてして階 層構造を成す。ビジョンと戦略の制約は企業内部のキーパーソンや外部のマネージメントコン サノレタントの助言によって具体化され、因果関係の制約は統計・データマイニングの手法によ って明確化される。 指標相 Eの因果関係を明らかにする作業は、 SAS の独壇場で、ある統計・データマイニング、 の手法が活躍する場面である。ここでその一端を紹介しておこう。 ①因果関係と相関関係 厳密な意味では、統計・データマイニング の手法によって指標聞の因果関係を証明すること はできない。指標聞の相関関係、を明らかにすることができるだけである。しかし、実務上は相 ‑ 1 7 7

175.

関関係が高し、ことを知ることができれば、それで十分である。 ② 4つの視点を跨ぐ指標聞の関係 <財務的視点> <顧客の視点> <社内ビジネスプロセスの視点> プロセスのサイクルタイム <学習と成長の視点> としち指標聞の構図を描くことができる。 使用総資本利益率を高めるためには、顧客からの利益を高めなければならない。顧客から の利益は顧客のロイヤリティを確保することによって得られ、そのためには納期を厳守すること が必要である。納期の厳守は社内ビジネスプロセスの質を高め、サイクルタイムを短縮すること によって可能になる。これら2つの要因を支えるのが従業員のスキルアップである。 以上のような因果関係の仮説を検証し、具体的な指標聞の関係として把握するためには、 まず抽象的な表現でしか定義されていない指標を検証可能な指標に置き換える作業が必要 である。例えば、「従業員のスキノレアップ」と「プロセスの質」の関係を取り上げてみよう。ある工 程において、管理図の分析から仕損率が異常に高し、ことが発見されたとしよう。 1 0 . 0 卜一一一一一一一一一一一一一一一一升‑‑‑¥‑‑‑‑‑‑一ー一一一一一一一 UCL 5 . 0 。 5 1 5 10 ‑178 20 群番号

176.

これは「プロセスの質」に関わるマイナス要因であり、「納期厳守」を守るためにも仕損の補修に 費やす時間を削減しなければならない。そこで、仕損率が異常に高い原因を究明し、従業員 のし、かなるスキルに関連しているのかを明らかにする必要がある。実験計画法に基づいた工 程実験や分散分析によって仮説の検証を行い、この異常が設計図に対する余裕の見積もり 方に誤りがあったためであることが判明したとする。直ちに従来の計算方法に検討が加えられ、 現場の温度、湿度等の変化に応じた新たな計算方法が開発される。従業員に新しい計算法 の訓練を実施し、スキルアップを図る O ここで登場した管理図は SAS/QCの SHEWHARTP r o c e d u r e、実験計画法は SAS/QCの FACTEXP r o c e d u r eまたは OPTEXProcedure、分散分析は SAS/STATのGLMProced u r eによって容易に実行で、きる手法である。既にお気づきのように全社的品質管理と密接に連 動しながら、現場状況の変化に応じた余裕の見積もり計算品、う従業員のスキルと仕損率品、 うプロセスの質を表わす指標の相関関係が明らかにされる。バランスドスコアカード、が業務プロ セスの改善を促進するものであることが、お分かりし、ただけるであろう。 社内のビジネスプロセスに留まらず、外部顧客の潜在的な要求に対する統計調査に対して も SASが提供するプロシジャーは有効な働きをする。顧客のロイヤリティはど、のような指標によ って測られるべきか。ロイヤリティは製品の価格、品質、及び納期のいずれと高い相関関係を 持っているのか。これらの関係が明らかにされて始めて業績評価指標の体系が完成に近づい て行くのである。 5 .反復/進化アプローチ バランスドスコアカードは本来、全社的なビ ジョンと戦略を実現するために存在すべきもので あるが、費用対効果の制約を無視することはできない。効果の十分な検証もないままに、流行 を追う掛け声だけでプロジェクトを推し進めた結果、バランスド、スコアカードが提供する業績評 価指標に対する信頼が失われ、結局廃止のやむなきに至ったとしづ事例も数多く報告されて いる。私たちはこの事実を直視し、 小さく始めて、大きな成果を得る"とし、う意味での 進化ア ブローチ"を提唱することにしたい。 すなわち、より完全な業績評価指標の体系を目指して、業績評価指標の定義から始まり、 デ、ータウエアハウスの構築、ビューヲの展開に至る過程を試行錯誤的に反復するとし、うだけで はなく、費用対効果を考慮に入れながら、低コストでシンプルな プロトタイプシステム"の構 築・再構築による検証を反復し、効果が確かめられた上で本格的な BSC業績評価システムを 段階的に導入するとしづ反復/進化アプローチで、ある。 ここで、プロトタイプシステムについて簡単に整理しておこう。プロトタイプシステムは、 ①データマート ・基幹系データベースへのアクセス →S AS/ACCESSt oO r a c l ee t c . 円吋υ 1よ ワt

177.

‑戦略的事業単位の業績評価にのみ必要なデータマートの提供 →B aseSAS ②ビューワ ・グ ラフイカルユーザインターフェース 1 )クライアント/サーバシステム → SAS/CONNECT ,SAS/EIS ,SAS/AF ,SAS/GRAPHe t c . 又は → SAS/CONNECT ,SAS/ACCESSI n t e r f a c et oPCFF(+EXCEL,LOTUS,e t c . ) 2)Webブラウザ →S AS/lntrNet,SAS/SHAREe t c . とし、う構成を取る(添付のシステム構成図参照)。 これが最小限の構成であり、規模を拡張しても基本的に必要不可欠のプロダクトで、構成され ている。したがって、将来においてもそのまま利用でき、費用対効果の制約を十分に満たして いる。 6 .結論 このようにして SASのデータウエアハウス関連ソフトと統計・データマイニングソフトにシステ ム構築技術が組み合わされる事により、ノ〈ランスド スコアカード に代表されるようなビジネスア プリケーションの分野において、他に例を見ない強力な分析力と総合力を持つシステムを作り 上げることができる。 私たちは日本の市場に米国のコンピュータシステムを直輸入するのではなく、日本と米国に おける実務の相違を十分に認識し、日本の市場に適合したシステム構築方法に基づ、いて米 国の優れたコンピュータソフトを導入したいと考えている。その具体的提案が反復/進化アプ ローチである。 SAS が持つ潜在的能力を日本の市場において十分に発揮するためのシステ ム構築方法として、これからもさらに洗練を重ねていきたい。 参考文献 1 )ロパート S .キャプラン、デビッド、 P .ノ一トン、「バランススコアカード」、生産性出版、 1998 2)W.H.インモン他、江原淳他訳、「コーポレート・インフォメーション・ファクトリー」、海文堂、 1999 3 )牧野 恭、離散型シミュレーションとしての行列簿記と目標計画法の結合、第 9回ソフトサイ エンス・ワークショップ講演論文集、 1999 4 )牧野 恭、ニューラノレネットワークによる分類問題の解決、第 7回日本ファジイ学会北信越 支部ファジイシンポジウム講演論文集、 1998 1 8 0

178.

; SAS/ ACCESS サーバ 、 ~ to_Orade;etç~"-' 可 ‑ H ︼ ∞ ‑財務データ ・市場データ .生産データ ・人事データ BaseSAS ①,②: +SAS/CONNECT ③i +SAS/lntrNet +SAS/SHARE :l クライアント ③ ‑統計解析/データマイニング +SAS/STAT /E TS +SAS +E 恥f ‑多次元データ解析 +SAS /M DDB Web Browser GUI: ①SAS/EIS ②EXCELe t c . ③'WebBrowser ① 'SAS/ACCESS I n t e r f a c et oPCFF ,

179.

認 州 民 . . . . : . : . : . : . : . . . : . ; . : . . . . . :.::;'.:;:::'?:'海沿筏託評判......;.::~::::::.;~.~. . ヲ ゥ . . . . . . . . . . . ' . ' . ' . ' . : . . . . . . . : . : . : . : : : : : . . :.;.:-:.:-:.;.;.:.:.;.;.:.:~:­ BS@~ ロドタ;斉捜~ス赤本1 サーバ " ; S A S / A C C E S S t o O r a c l e ' e t e . ' . : B a s eSAS ①,②: +SAS/CONNECT …③: +SAS/I ntrNe t +SAS/SHARE , ' , J H ∞N │ ‑財務データ ・市場データ .生産データ ・人事データ ‑記述統計 e t c . ③「 W E b ‑ Browser GUI: ① SAS/EIS ② EXCELe t c . ③WebBrowser NetworkSystem ① ; 品 斗

180.

論文発表 システム

181.

日本 SASユーザー会 (SUGI‑J) VBと SAS/STATを用いた臨床統計システム ‑ S A Sスクリプトレス Excelへの結果出力一 西原健自、 山本昭一 株式会社アイ・エス・イー Statistical analysis system for c li n i c a l data using VB and SAS/STAT ‑Without SAS script prograrrming 品 direct output to EXCEL‑ Kenji Nishihara, Shoichi Yamamoto International Systems Engineering I n c . 己田 要 SAS スクリプ卜を毎回記述することなく、作表・検定パラメータの指定のみで多様 な臨床統計処理を行う。作表イメージ、 SAS 検定結果、解析結果およびパラメータは EXCELの Workbookで一括管理される。 キーワード: SAS/STAT, EXCEL , VB 1. はじめに これまで、臨床試験に関する集計・解析プログラムは、多様な試験内容から標準化 することは困難であり、各試験毎に組み直していたため下記の問題が発生している c (1)臨床・統計・プログラミングなど専門知識・経験が必要 ( 2 ) プログラムを組む毎に、バリデーションをしなければならない ( 3 ) 時間・労力がかかる これらのことを鑑み多様な試験にも対応でき、プログラミングの必要のない臨床統計 処理システムを開発したので、実例を中心に紹介するご ‑185

182.

2. システムの特長 (1)作表イメージを E XCELで作成することで試験毎の多様な表形式に対応出来る ( 2 ) 解析計画書に従って簡単なパラメータ設定のみで集計・解析が出来る ( 3 ) 検定はすべて S A S / S T A Tを使用する ( 4 ) 実行結果を EXCELに出力することで作表イメージどおりの結果が得られる ( 5 ) SAS/STATの検定結果も EXCELに出力される ( 6 ) パラメータや解析結果を EXCELに一括保存することで集計の確認・訂正が容易 であり再現性が高い 3. システムの概要 SASデータセット等の集計・解析されるデータベースをフラット またはカンマ区切りタイフのデータベースに変換し VB (V i s u a lB a s i c )を用いて集計 を行い、検定が必要な場合は S A S / S T A Tを VBから直接呼び出して検定を行い、実 AS/STATの出力,実行ノ fラメータが VBから直接 EXCELへ出力される c 行結果, S 本システムは、 4. 必要なハードウェアとソフトウェア ( 1 )O S :W i n d o w s 9 5,W i n d o w s 9 8,WindowsNT ( 2 ) Memory:64M以上 ( 3 ) SASv 6 . 1 2( S A S / S T A T ) ( 4 )M S ‑ E x c e 1 9 7 1 8 6一

183.

5 . 実行例 スプラッシュ画面 ! Licensedt oa l lr e g i s t e r e dusers 閥アイ・エス・イ‑ ISESTAT2000 V e r s i o n1 .2 . 0 f o rE . , =c e l97& :. 5 :48v 6 .1 2 i Copyri g h t( C )1999I SE I n t e r n a t i n a lSystemE n g i n e e r i n gI n c .! 、 W a r n i rglhisProgrami sP r o t e c t e dbyc o p y r i g h tl a w ,sod o n ' tcopy メインメニュー 夜間1:I,,~"'.l!l'.TJJ 臨床統計処理システム 心 三三i2l連 c日 TAT2000¥AB123¥AB123.sdf LJ3 C¥STA寸 ' 20 00¥E0157¥EOl57.sdf C時 TAT2∞田 IlPH2¥I l P H 2 . s d f 1 o2 n 1 1 ISESTAT200 ゆ V e r s ; o 1 l 1 .4 . 1 3 forExc e J97& SASv6.12 首 白 I ! ! I 聞 日干 J 箇 ヅ 晩 ーィ~), AB123第 I 何時r;;::,責験単回投与 E0157高血圧圧に対する比厳罰験 1 0 1 0 1 前期第 E相臨床訊験 ょl タ ィ しCop戸 中j P 7 ? ? ? 式会社アイ・ヱス・ィー 圃 システム終了 l n t e m 拍 o n a lS y s t e mEng i n e e r i n g[ n c .TOKYO,JAPAN ‑187‑ . . ‑ l . l c

184.
[beta]
EXCEL表

血圧〈担明間・時E
描期〉、掴拍町曜特

I
1閉比・;(圃括宜主度採用例)‑ 1
乎j!同一後世後沼
30分

投与前
項目

1時間

2時間

4時間

"

酔

n

M
e
a
n
:
:
!
:S
.
D
.

n

Mean土S
.
D
.

n

Mef
l
.n
:
tS
.
D
.

n

Mean:
tS
.
D
.

n

MeMl:
!
:
S.
D
.

n

12.5μg

s

s s

s s

s s

s

S

S

$

I抵 県 期 J 25μg

s

S

S

S

S

S

S

S

S

S

S

出血 H<
l

50μg

$

S

S

S

S

S

S

$

S

S

S

100μg

$

S

S

S

$

S

S

S

S

S

S

血圧

. 包 .

.

.

.

.・

S S

S S

S S

S S

S

[咽結期 J 25μg

S

S

s

S

S

S

$

S

S

国 mH
e
)

50μg

S

S

S

S

S

S

S

S

S

100μg

S

S

S

S

S

S

S

S

S

一元配置分融分析

K
r
u
:kal‑Walhs
12.5μg

血圧

.・.

a

.

g

包 . 包 .

S S

S S

S S

S

S

S

S

S

S

50μg

S

S

S

S

S

S

100μg

S S

一元配置分散分析

K
r
u
:k
a
l
‑
W
a
l
l
i
s
12.5μg

組拍

.

(
l
自J
分)

25μz

一元配置分散分析

,.

K
r
u
:kal‑Wa
l
h
!

c

S S

S S

:

#

,

:
o

•

S S

S

S

S

S

S

S

S

$ S

,

,

S

,.

#

品
一
⁝
長恵国
解訴話果

EXCEL罷

夜婦の星計少イブ

一 生j
i主主J

「骨頚!r!'守 l~目型

1豊後後後後後踏

'A白

話

J ‑ 1 括 明 朗 朗 朗 閉 閉 閉 明 11‑23‑H
1叶

I

o
s'
f
t
li
¥
l
J

~
,町周

一主主J

一主~

tii2

﹄一﹄﹄訓

i 豊後後後後遺出川

MMMMMMM

2 川 渇 8 川前川刊冊剛冊刷冊剛町酢閣
v司

断用期閉明期開明与︐

匡一川河制時諸説副主主制嶋崎探嶋崎嶋崎凶

mM一
ぃ EH泊汁立川泊泊川型氾汀

4 4 7 駅 油 圧 配 圧E E圧EERU酔R E E E E E E E圧俗俗叩曲活協叫畑山抽出

4
4
4
4
4
4
4
4
4
4
1一
7 湘一和い地吋一一111叫咽柵岨一咽一咽一四一咽附岨沼地叫岨咽棚岨帥一四4

則︐.︑白山図画回国盟国国国国間園田園汀回国盟国︻四国閏園一片岡田園園国国国自
トr
14t
eEL
制一血血 EJLF
一民国
2
町一﹂串ヶ︐

謀説明帯思潔哨謂哨課
日 ‑u

バラメ』タ

1
射、回片付

re動+揺罰 「自助+由連
「帽+時r>~

M列

1
8
8
←

185.
[beta]
解析結果

投与前

n

1時 間

'0分

:S
.
D
.
Meani

n

M,,,,土 5
.
0
.

Me
.
e
n士 5
.
0
.

n

2時閉
n

4時間

D
.
Mean主 5.

n

Meant
:S.
D
.

12.5μg

2
1 8
0
.
1
0t
:1
2
.
7
5

2
1 7
9
.
1
1:
1
: 1
2
.5
1

2
17
7
.担 士 1
3
.
6
7

217丘 l
Q:
t1
5
.
1
7

2
1 7
3
.
9
5
:
!
: 1
6
.2
9

[担晴朗J

25μi

2
1 7
5
.
5
1士 11
.8
3

2
1 1
3
.
8
1士 9
.
1
0

2173.田 士 1
0
.
2
9

2
1 7
2
.
1
6
:
!
: 9
.
8
1

2
17
0.
'
l
.8
:
!
: 1
0
.
3
7

』皿H<)

5
0
μi
"

1
8 7
0
.
3
3
:
!
: 11
.8
5

1
8 日.
2
2
:
!
: 1
0
.06

1
86
6
.田 土 1
0
.
8
5

1
8 曲.
O
O
:
!
: 7
.
5
5

1
8日.
2
2t
: 10
.1
8

凹 μg
1

1
8 7
9
.叩:t 1
0
.
1
9

1
8 1
5
.日 士

1
7 75
.5
3
:
!
: 9
.
1
8

1
8 H.33t
: 9
.
1
1

1
8 1
5
.
l
l
:
!
:

血圧

9
.
1
1

0
.
1
2
5
0NS

0
.
0
1団 事

・
O
.田 66・

12.5μg

2
1 1
3
3
.
2
9t
:1
6
.日

2
11
2
9
.
9
0
:
!
: 1
1
.田

21127.
43士 1
8
.
5
5

21120
4
.
.
95士 1
5
.
8
1

211百 .
2
4士

[
J
!
jl
宙開 J

25μg

2
1 1
21
.1
4士 1
5
.
8
3

2
11
2
0
.凹 士 1
4
.
1
7

21118.田 士 1
4
.
0
7

21116.
29士 1
5
.
4
7

2
1
1
!
9
.
5
2
:
!
:

』皿 Hg
)

50μi

1
81
1
5
.
1
1士 1
4
.
8
1

18115.00土 1 J.
2
2

1
8
1
1
2
.
J
J士 1
3
.
5
3

1
8J1
3
.
8
9士 1
3
.
5
9

1
8
t
H
.
l
l
:
!
:

100μg

2
.
0
4
1
81
2
9
.
3
3士 2

1
81
2
0
1
.
6
1士 1
6
.
9
3

1
7
1
2
7
.田 士 1
9
.
6
1

1
81
2
2.
89
:
!
: 1
6
.
5
2

1
8
1
2
5
.
1
1:
!

0.0082..

0.0279.

陪u
sk
a
1‑WI
i
l
l
l
s

血圧

0
.
1
3
3
8NS

・
・

0
.
0
6
4
6NS
2
1 7
9
.
0
0士 1
0
.55

2179.
43土 1
0
.
9
6

2
1 7
7
.
2
4.
:
t 9
.
4
1

0
.
0
0
5
8
2
1

0
.
1
3
1
9NS

80
.33土 9
.
6
8

陪u
sk
a
1‑WI
i
l
l
l
s

12.5μg

O
.田 2J

0
.
0
0
4
5

・
0
.
0
2
3
4・

一元配置分散分斬

踊拍

・
・

0
.
0田 lNS

元配置分散分相

0
.
0
1
5
0

0且 8JNS
0
.
1
0
1
8NS

25μg

2
1 7
5
.田.:t 1
0
.
7
8

2
1 7
6
.
5
7士 9
.
2
1

2
17
6
.
6
7士 11
.2
7

2
1 75.
43t
:
. 10.06

50μg

1
7

1
7 8
2
.
0
6t
:
. I2
.H

1
77
8
.闘 士 11
.2
8

1
7 7
7
.
8
2土

100μg

0
.
2
8.
:
t1
2
.日
1
8 8

1
8 81
.8
3土 1
2
.
0
7

1
78
5
.
2
4.
:
t 15.50

1
8 82
.5
0土 1
6.
'
1
.9

一元配置分目分析

0
.
4
9
7
2NS

臥3
6
5
4NS

0
.
1
9
4
8NS

O
.
目5
5NS

陪 uk
a
1‑WI
i
l
l
l
s

0
.
3
8
7
2NS

0
..6田 N5

0
.
5
0
0
7NS

0.H20NS

(
l
!
l
/
分
〉

78
.1
8士 9
.
6
5

8
.
3
0

SASアウトプット

We;
on

N

2
1
2
1
18
18
一一一一一一ーーーーー

AI
lO
f
1
C
: l
d
S

3
6
1 755189

s
o0952381

O
ll
u
e
FVo
75 5714286
2 570
7u 3333333
79α=
:
re Scores "er
e Used for Tles
A
l
l
e
r
a

ーーーー一一一一一一一一一一ーーーーーー

Wlthl/'l I
tS
140 769627
Prob ) F

o0日 7

ーーーーーーーー一一一一一一一ーーーーーーーーー
2
1
5 02 Frld司 y
. J
un
.
e1
8
. 1999

‑元配置白分散骨折 f
or 8lOCK(1‑2‑1)

営包

~

. Y PROCEDURE
NPAR1WA
1a
lYS1S ofV
a
r
i
:
;
m
c
e for Variable S
"
"
I
P
l
E
Af
Class!fied by Vari司 bleGROUP

GROU?

N

1

2
1
2
1
1
9
1
9

2
3
4
→
ー
ー

Aao
nl
:t
.S
l
.
te
an
518 660155
79 7142957
FValue
73 9095238
4.733
67 2222222
75 6666667
oc
d Scords "er
e Uud for Tles
Aνer;

ーーーーーー一一一一一一一一一一一一ーーー

ーーー一一一一一一一一一一一一一一一ーーーーー

‑元配置白分散分析 for B
lOCK(1‑3‑1)
~PAR1"'AY

v
t
'i
thln t
.S
109.576148

Prob ) F
o 45

∞

ーーーーー一一一一 3

15:02 Frida
.
, JUrte 18. 1999

PROCEDURE

,.SlS of VoOlriomce for V:tIrlabJe SAWPLE
'n♀ J
e
db
,. Var!able CRuUP
Clas$1千l
A.onc WS
399.741674

Withln t
.S
126.104550

Ialue
Fl
3.091

Prob ) F
0.0323

1
8
9

邑4
6

且1
800NS

.
o
0181NS

186.
[beta]
[患者背景]

[症例構成]

一田市じーし刊幅三吾
崎

Tssy ET'''BZAAEgis‑peesE22282τ

.
.
!!..̲

.
'
寛
吉

︐

閉山﹀ハ ( U閉 山 ﹁

EfF
巧I
通1 翠

仁三‑‑コ

土主?回
r

出口目立

可白﹃白コズ出向﹃

i
町
古1:
j
i「
事
l

有吉守『

,
一
.

~.
凶

扇竃

"

.

F冨言一一τ

・
.
~

…
一
~- ,
‑
.
t
宇
訓
竺?
"
Z
1
手記相手P
Z
!
j
:
3
Z
r
ぬ 議l

量

;:Llgjiijj ‑ J 1 f i

:
E
t
u
l
i
時?
:
i
1
1
1
巴
野
:i
三
F
f
j
j
i
l
i
l
t
長1
2

i
:
安 年
J
f
f

岨
ぺ1ニ
2U ;

,
:
:

ζ

∞
﹀
∞O
F
‑号三

[
'~f. [
[
;[
,, ~l
[
'e
:
f
[
!1~ I"~
山 " 岡 山 山 』 ・

~;;:;~:;は。 lF.:::

,
.
̲
ア
ロ
、

hdeum

("

E

"・日目叩
明 。 目 , '('tt".,...

190‑

,
0
1
:

0

:g~: 話

oU:

Y
弘
糊
鵬
ム
糠
喜
滋
議 ~~

187.
[beta]
[臨床検査値の推移]

[有害事象]
~~ーτ百当「ーでま・・・ ~.'.~:Ol も目的~':'.}ど

一
四

五議声

ぶ
ヰ
ー
ー
一
一ιー
ー
ー
ー
.
.
.
.
.
.
'
同組酎:何時トり

g

s
・皇室豆工主主
寄

.
.

・
.

z

E

"
・

g

IUtl

実
現
,
.
'
円

閉山﹀ハ(U閉 山 ﹁

言

J '

s

z

'

…~,!,w,:;_..,

吋ム脂、、

Z旦

‑
'
‑

.
.
l
"
I
:
t

布石~

'.l~"

J弘 、

原 点T
i
‑
‑
m主主ユ:一一一;j'立与1
l

t:
T
2
で
:
了
ゲ
オ
ヨ
ア

勺白﹃白ヨ

i
司 3
i
H自主
j
・

…
一
一
「
一
一
「 rz!:2 巾﹃

ヨ
f
. j
す?
一
;
:
記;
j

"
,
:
o
‑

車

"
品
:
;
w

崎
正
一
一J

E苛

一

芸評

‑
.
1
U
t
・
.
.
.

.
>・
‑

・
冒
.

1
除名

・"
・
"
民
・・
・
・
・
'

1
1
1
:
>
'
1

:;0

E

瓜
コ

.
5333;訓主 i.
.
.

3

修司喧

3

1

:
!
:
.
,
,
'
!
<
;

2

民コ <>

マ
.
匹
《
・ ".1‑4/61

・
"
巴
.

前
.

去三i
H
l
;
主 .'"・..

・
"3

・
:
.
2
2

守街

貧乏>.

・
"
民
民
巴
コ
・

ロ"'."-"~o::.",

3
民
"
・

,,~'!

司

3

3

・

xに3

1
岳也、取引凶r‑

・
"
民

.可電奥.

S 国

.SJ¥'
J

3

'
,
主
"
・

..ll~

, ~ε

」旦」

.
,
.
‑
,
.
.
.
.
)
.
、

.
,

;
;
c
;
‑

.
"

c岬

"
岬ω
,
.
<
(lQr
J

(
'
'
'
'
'
'
c
、
。

,
可T

,
守

1

"
'
;
J
>

τ ,
ニ

'
:
'
;
J
>
'
:
'
;
J
>
@

3

ι
"
.
.
.
.
t
J
O
,
:
'
:
p
"
,
:
.
,
x ・ "
,
.
・
"
.
;
J
>
,
・
句
"
," "ξe
α
,
,
'
:
、
" "':1>p
e
.
o
"
'
:
;
J
>

.
・

02

C'

τ

師

r
J

,
:
,;e

・"・ ,:'';t

"11

,
;
.
:
p

U岬

ヨ
一
﹄
一 34

:
J

e一旦

∞﹀∞︒三万三

一 輯 ー ‑

2

ニ
,
唱
.
,

:.~・
ーニ馬情U弘

何百一以内向山口比山山口出⁝はで︒吋

~_...,:r.

主主主旦ー

・

.刷随

m H
'

叩露。副因

'I ~.il~~I"n

1
'~;:I ~~I o~

一主土j

出
⁝

'
i一 旦J
こ主主J

、
.
.
.
・
"
,
舗
,
.
.
.
.
r
.
.
目
伽
・
』・仰山田
.
・,‑
u
.
.
.
.
.
"
'
.
"
"
.
.
.
‑
'̲'師。""0
<
<
'
0
.
.
.
. £
制
。u
"
。
刷
・
旬
,
.
<
.
.
.
.
問
。
D
> <
,
.
.
。。.
憎

v

h凶 雌

>. , 咽 @ 何
0'"

ヱ
i
d

1
9
1

188.
[beta]
[重症度別有害事象]

[因果関係別有害事象]

・

ヨ‑邑a

5

・

e

♂か

I

̲ ̲ .I

・
R
・
U
"

...tìïíriìíïtS o.l.~'!γ

77
百戸コミ3
手弓事

合戸 e11・J2
e

" 且 隣 ' 嗣 . 育 事 量 貴 司 宮 両 息 詰 喧 岨 宮 町 .

!

..・~r.
同国匹、L

L
a
q
r
ι
z
、
z

世

自
"

噌 畠 時'
.
o

,!

I

プ

問、事・げ
2にE

1"

I

4
1
2

明臥主当f

:
:
:
:
I
I
!
‑
:
:
:
;
‑
ー

司画官

,I S

I

同﹀︿(リ開﹁

'1Ii ,-~.Fi

…

一

g
一

ー
一
一
一
一
一
一
一
一

一
一
一
一
日

五
V

時民情

一

J

--L二ム伯ーケ町二二二二--~~二斗二」

出
.

:
;
;
J
:
i
s

由.
ー竺」

pjfn諮

,
̲
到

三里出

主主出

i
守
口:
i
7
l割
自

2
!
!
.
J

圃

~

」ヱ」

話回目議

flT"
,
T
"o
'L
",

守主忌::w.
τ
回m ・1I"..I't~a !Jl!..;ç ~'l"t:TY:

j ‑ h 守宅主
芯

.~"..

"
,
.

01.口

町 山 nu')

刃
向 MZ
一︻︒三℃三

+
ヱ
・.
w
.
.
.毛、

川 目

I;';~

l d

:
ぇ

一

a
x
r

~ '
:
:
'
:

J2r堺市一,;.~
ふい

L
車事軍軍事

j
ドムー

立
舎町一ぬぷ

‑192‑

闘志事扇面

4

﹄⁝﹄﹄剥

可白﹃印‑コ何同町﹃

ZL4 ま ﹄ ﹄ 出

‑
翌
」

ー竺」

J

問 叫 盲 目

189.
[beta]
[患者背景別有害事象]

[効果判定]
=
.
,

f
i
!
?
;
F
I
l
l
I
i
:
l
Z
鴇

声
〈

崎 日

溝
明
型
事
。 ,

~I

叩一=一 z
・
' z's‑s'・
assis‑‑‑iz‑‑‑‑一'sis

同
揖
歪
開
柄
、n

・

a5
温

孟

1
j
a 4
H
‑
u
叫

'
1
+1 ' 1 刊 r

,
、
"
,
.

[山﹀ハ︻U[山 ﹁

:
I

1
1
1
:
│
:
:
;王

j~
マ 目

318」
i

s

ごn

1

, I'I'

s

仁
LE
4
」

'

弘
?

,
,
'

1
t.
.
t曙 n 7 H;Io
"血恒

,
時

t 可

~

四

宜
:
'
1
1
'
:
‑
.

.
.
.
" II

F

別

'十

2

,
.
,

1

二
選

...J_・~守何?叩-叩

高言忌;宮:TIbT,一一主主:叩暗唱 l-~­

議会主 れもでよ?勺l
三i

r

j

℃印﹃印‑=四月四﹃

i
i
S
;
;
i
ラ冊子曹三
円
事
宵f
自
5
1
包

な恥:公:

:
7
i
E
]
i
露
醤
語
語
語
喜
詰
:
i
i
f
i
j
I
:
i
3
i

冒 ' ! "' ! '

ミ
三
!

?
「
ぷ
清
.

働
一、

一

旦
,
官 . H冒
官
事
.
J
I
'
J
t
f
i例4

電

自
司
"t"
‑区劃

,
.
'

魔者"

"
:
:
0

"
こ
:
1
'
崎
守 じ コ7

,
.
.
1
<

1:1

"
t
2
2

"
<
'

凡量

H

~!

E
3
F
,, EE
3

t
E

tf
E
4
T
e O
0
z m
f
e

.'ll

o
e
2

e
i

0

@

Z

C

< も

~

J

Ui_~

主

ー~

二

有

τ

三

o1o1, e
・
3a3
圃
干
0:0・~' 1 : :;;! 11' ~1
;;1;!1 1i
1:
"::1
・ ' ,τ131U
¥ :"S I !
1
0
o <
n
・
:
虫旦j
'
'
'
'
'
i
I
F
.
!
帽
平
。 0,
) )j , 0.
Oi)
:
I
t
1
1
< I0
I
o
T ,
. .
,
・
.
.
・
'
"
司
'
"
奄 SιcS of::peEt
咽
平
'
・
1
,也
t
Z
,、 、
ー
,
蝿
:
:I "
1
'
両
" I.~酷 "
、 ー
、
?
目

<
)

書 円 "

電車岡田

、
J

,
民
語
" ""'"側‑"
o"""'''.f,
.
,
.
.,
.,
"
崎
.,
.
.
一
.
, v
.
.
.
"
・
‑
目
。
'
.
旬
、
.
,
.
.
・
"
.
:
>
0
.
'
t
o
.
相・
、 ・・
.
"
・
山 ・ 山

. <<伸.伽.:~ k.
肘w
川曾
伊"1001
..11.

1
.
.

∞
﹀
∞ OZHHUFHA

ー
:
0
'
舗

1
9
3

刷i
均..川

叫号"醐町

1
.
.

問 団
"卵白

m
"
,
0
<
<
<
<
>
"
1
‑
'
"
,.
,
同・~..
市"
叩
・山'"̲'tnn,
.
1
0
.
.
.
.
M
.
.
加
鯛 同

・・

配 向 日
掬 問
町 向 山 川 ・ … 目
f

'

̲
̲
柵
.
.
.
"
.
.
.
.

1
.
.
"
.
.
1
.
.
.:0". . ;
・

山 一 円

旧 日 山 , =
月初

'k~I.~

J.~êl

ー

'
l1~I
1
1

明附』闘相定句リ U開制~<;

‑
U

~

。
。
0
i
0,
i
パ,

絃様、 W 緩急ばゆ

i
L

~

~

m

刃 四 回 三 月 OZHhv

"
,
‑

三
日E;2
冨
.
,

μ

t

事蕩百玄 二豆霧雲町

主
1
g4

,
2; ¥
1 ¥
11
:1
t l
位
月
!
ト
望
,
; RI I
1
.
"
I1
2
・
'
"
,I ニー1.'
.;
S 1
.
. I
J与悼
告
, "1 I ! 3: S
1; ・
1.
f
.
"
空

I ~
I 1

11

A

"
1
;
1
1
.

P

J

1 ‑D

同
ー
丹
署

川
.

企
!'l;

官
.'~Cj

L

.
.
.
"

1
1

~.-"

E哩 z

師一

~τ"

~

,,~

...

.
̲
"
,.

1"為晶

190.

MF 常 1 I 日凶" ZMm ω w 一 一 一 ⁝ 一 ⁝ l同トニ fhい﹂一 一 l川開﹂一 ﹂ 一 一 l同 円 いM 一 ﹂ ⁝ 一 見 剛 山 lili‑‑一 i 'LFu い同問﹂ lM伊﹂ 同同問﹂ ﹄‑ M a民 iM円﹂ 1同門L 伺. ﹂ 同 い ﹂ l 鳴tゆ eAluN W l川 │同巴 同作﹂ t i l j i F q m i l [罫相対藩附菌加時糊響l四期] F ‑ E z ‑ ‑ I 側首信望開 z‑ ‑ ‑ z 伊 ‑ M " ︐ "FOM H U A ‑ ‑ z ‑t 園門 ~ > i i 川和 降雪 M ~~I~ E~A ~a [~~! 日N J i j i ! 引 札 耳 下 ょ に 一 ⁝ 一 一 一 o s s a 11 ・ A 1 3 "4 ﹁ ﹁ バ13a'iv 事 ‑ ‑ ‑ ‑ a J司・ 富岡︑︐ . . 事姐 l 2 . ︐ ー 晶泊 川 MR ︐ 日 伊v 、 凶 ・ . . EEEE事 2 ‑E E‑ d望 . ・ 炉停町三︑︐ 慣例nw 也 ︑ ︑ ユ ヨ ‑ h g a 2 242 M 明日 . 0 ̲ ‑ ・ ー凶. . ・ . ‑ ・ " . ・ "陶 ・ ーー ︒?" 3 iizijEi f??「 Eh I it [jiif a 2手 』 ・ , tl‑

191.

6. まとめ 本システムで臨床試験の I,I I,I I I相の解析計画書の 8 0 %から 9 0 %をカバーすることが出 来た。また 1表当たりの所要時間は 10分程度で、あった。 今後 2次加工データの充実をはかりカバー率を 100%に近づけたい。またユーザーインターフ ェース画面の簡素化をはかることによってオベレーションの所要時間の短縮をめざしたい。 7 . 連絡先 電話 03‑3476‑5160 FAX03‑3770‑1505 E ‑ m a i l :j田 島ml .c a t n e t . n e . i o iseOO@pop2.odn.ne.jp 守}ム 円同d RU

192.

日本 S A Sユーザー会 (SUG I‑J) P Cの S A Sへの最適化 市川均 株式会社イージーネット 製薬アプリケーション事業部 Bestcon何g u r a t i o nPCf o rSAS(benchmarkbased) HitoshiIchikawa Pharmaceuticala p p l i c a t i o nD i v . 、 EasyNETI n c . 要旨 構成が自由な P Cについて、 SASの実行に対して最適な環境を検証した。 検証は SASを用いたベンチマークテストにより行った。 結論的として、 DUAL CPU構成は SASにとっては適切とは言えない。 むしろメモリ容量が大きく影響する事が判明した。廉価版 C P Uは性能的には劣るが価 格性能比では有利とも言える。ディスク性能の改善は 10中心の処理に対して有利であ る。これらの試験により、 SAS用 P Cは CPU性能よりメモリおよび 10性能を重視 するほうが有利であることが確認できた。 キーワード: P C、H a r d w a r e、ベンチマーク 1.検証の目的 SASの実行環境の進歩には目覚しいものがある。特に PC (パーソナルコンヒ。ュータ) と呼ばれるものは、性能面、構成面では一昔前のワークステーションを遥かに超える 性能を持つものが多く、かっ極めて安価に、数多くの製品を選択できる状況にある。 この状況を反映し、雑誌等の媒体では盛んに「性能」を前面に押し出した特集を企画 し、われわれに情報提供を行っている。しかし、そのほとんどはハードウェアとして の性能評価に終始し、われわれは直面するアプリケーションの性能について具体的に 言及したものが少ない。 筆者の所属する組織(会社)では、 SASのアプリケーション開発以外に PCのハード ウェアも多く手がけている。この特性を生かすべく SASに特化した P Cのベンチマ ークテストを実施し、 SASに最適な P Cの環境のモデノレを探ることにした。 1 9 7

193.

2 . 検匝の計画 2 ‑ 1 . 検証に使用するプログラム 検証は SASを使用したベンチマークテストにより行うことにした。ベンチマークテ スト内容は以下のステップにより構成される。 Step 内容 目的 1 DATAスアップ Write中心の I O処理 今ファイル作成 2 備考 50万 O b s 4 1変数 (電源 OFF/On) (キャッシュのクリア) DATAスアップ Read中心の I O処理 今ファイルの入力 3 Proc SORT インコア I Oと DiskI O 3ソートキー ‑+データ編集 4 ProcMeans CPU負荷(低負荷) 5 Proc Freq メモリ負荷 6 Proc GLM CPU負荷(両負荷) S tep 1により作成したデータを S tep 2で読み込み、 Step3‑‑‑‑‑6で加工・ 解析する。これは SASの利用者が一般的に使用している状況を模揮する目的である。 また、 S te p 1と S te p 2聞は‑̲e̲P Cを停止(電源を OFFの状態にする)す る。これはディスクキヤツ、ンュを無効にし、純粋な機械としての I0性能を評価する 目的である (10%程度の差が出る)。 生成するオプザベーション数は 50万。変数の数は文字型 1、数値型 20、カテゴリ 値 20の計 4 1変数とした(レコード長は 300前後)。 S tep 3の S O R Tはソートキーに 3変数を指定した。 S tep4の M E A N Sは B Y変 数 に カ テ ゴ リ 変 数 (2値)を指定した。 S t e p 5の FREQはカテゴリ変数 1*連続値変数 20の 20テープ、ノレを頻度分析するものとした。 S t e p 6の G L M はModel として連続値の目的変数を 6個の説明変数(連続値)でカテゴリ値 ( 2 値)毎に回帰式を求めるものとした。 ベンチマークに使用した SASのソースリストを添付資料 1に示す。 また、 SASは I Oと CPU負荷の分離を意図的に行うことが困難な為,純粋に CPU 負荷処理の参考例として東京大学金田研究室がフリーウェアとして公開している円周 Superπ 」を使用し、純粋な CPU性能の評価もあわせて行う。 率計算プログラム f ‑198

194.

2 ‑ 2 . 検証する環境 2 ‑ 2 ‑ 1 . 基準環境 検証する対象の PCとして、純粋に構成の差異を見極める目的でメーカ製の既成 PC は使用せず、部品から組み立てたオリジナルの PC (AT互換機)を使用した。 1 9 9 9年 6月)で最も一般的な構成を模擬する事とし 基準となる構成として、現段階 ( た。この基準構成を基軸に、性能を左右すると思われる要因について構成を変更し、 其の性能面での差異を確認することで、最適環境を模索することとした。 基準構成としては、以下の構成機器を選択した。 項 製 目 CPU メモリ マザーボード ディスク NIC V i d e o ロロ 名 I n t e lP e n t i u m l l l 500附lZ P r i n c e t o nP C 1 0 0( C L 2 )128Mb ECC A S U SP 2 B ‑ F( I n t e l4 4 0 B X ) I B MD T T A ‑ 3 5 1 6 8 0 16GB ( D M A 3 3 ) I n t e lP r o / 1 0 0 p e r t1 2 8( 8 M B ) ATi X 備 考 F S B : 1 0 0 附lZ A T A P I その他:D V D ‑ R o m,F P D.S o u n dC a r d.K B D.M o u s e なお、ベンチマークという側面からは、温度管理が重要な要素となることは既知の通 り(冷却により性能が向上する)である。今回は一般の環境での使用を模擬する目的 から、室温のみを 24C 固定とし、 PCのケースはクローズの状態かっ CPUの冷却 0 は一般市販のヒートシンク+ファンのみとした。また、 CPU以外の直接冷却装置は 用いていない。ネットワークは使用可能状態とした。ただし、 H U Bをスイッチング HUBとすることで、ネットワークトラフィックが雑音とならないようにした。 SASは SASの PC (ワークステーション)版、 V e r s i o n 6 . 1 2を使用した。 OSはすべて W i n d o w s / NT V e r s i o n 4 . 0( S e r v i c eP a c k4 )を使用した。なお、参考値 として基準環境について W i n d o w s98における結果も付記する。 1 9 9

195.

2 ‑ 2 ‑ 2 . 比較対象 評価の為の比較項目としては、 CPU、メモリ、ディスクについて下記のような比較 対象を設定し、評価することとした。 試験名称 C a s e O C a s e l 項目 較対象 備考 基準環境 CPU C a s e 2 C a s e 3 C a s e 4 C a s e 5 C a s e 6 C a s e 7 C a s e 8 C a s e 9 C a s e l 0 C a s e l l C a s e 1 2 C a s e 1 3 比 メモリ プ、イスク OS I n t e lP e n t i u ml l I5 0 0 附1Z DUAL構成 附1Z I n t e lC e l e r o n4 6 6 I n t e lC e l e r o n466~仏 z DUAL構成 I n t e lC e l e r o n5 2 5阻1Z ( F S B 7 5 M h z ) l I5 5 6 附1Z I n t e lP e n t i u ml ( F S B l 1 2阻1Z) ECC無し 64Mb ECC無し 128Mb ECC無し 256Mb ECC無し 384恥1b ECC無し 448Mb DMA66 UW‑SCSI Windows98 l C P U対 2 C P U P e n t i u mv s .C e l e r o n 違反行為 ( C e l e r o nは D U A L保証外) 違反行為(クロックアップ) 違反行為(クロックアップ) SAS動作保証外 上記試験に際し、マザーボードに関しては、其の目的に応じ以下の製品を使い分けた。 目的 製品名 チップセット 通常 ASUS P2B‑F ASUS P2B‑D o‑0 penAX 6BC TypeRVspec I n t e l4 4 0 B X I n t e l4 4 0 B X I n t e l4 4 0 B X DUAL構成 クロックアップ マザーボードの差異による性能差については、基準構成により比較を行った。結果的 にはほぼ同じ結果を示した為,マザーボードの差異に所以する性能差はないものとして 比較・評価を行う。 2 0 0 ‑

196.

3 . 検匝の実施 検証は,弊社 PC研にて実施した。一般居室環境であり、通常の空調環境下で試験を行 った。電源も一般電源を用いた。各ケース間では、念の為 O Sの設定は初期化(再イ ンストール)し、他の試験の影響が出ない様考膚、した。検証結果を以下に示す。 Case W r i t e Read SORT MEANS FREQ GLM P A I 備考 3 9 . 5 0 4 : 3 3 . 0 1 0 : 4 6 . 4 1 1: 2 1 . 2 4 0:57.13 4:14.00 CaseO 2:44.64 1: : 5 4 . 0 1 0 : 4 4 . 8 1 1: Case1 2 : 3 3 . 3 2 2:00.53 4 2 0 . 0 6 0 : 5 9 . 9 2 4:09.00 : 0 2 . 5 9 1 : 5 7 : 2 1 5 : 0 6 : 7 9 0 : 5 2 . 3 7 1: 3 2 . 8 2 1・03.18 5:21.00 Case2 3 : 1 6 . 6 7 0 : 5 0 . 8 1 1: 3 0 . 3 5 1・14.02 5:20.00 Case3 2:51.00 1・52.17 5 0 : 4 4 . 7 4 : 4 0 . 0 6 1 : 4 3 . 3 7 4 : 4 3 . 7 4 1: 1 9 . 7 2 0・54.50 4:59:23 Case4 2 : 2 6 . 5 9 1: 3 0 . 2 8 4 : 2 9 . 5 7 0 : 4 2 . 1 7 1: 1 2 . 7 6 0:51.07 3 Case5 2 : 4 4 . 0 0 : 1 7 . 0 4 0 Case6 2 : 4 3 . 3 2 1: 4 0 . 9 2 5 : 4 7 . 3 5 2・29.95 1: 0 7 . 1 9 4:09.00 1 9・86 0 3 . 7 1 1: : 4 3 . 0 7 0 : 4 6 . 5 4 1: Case7 2・4 4 1: 2 5 4 : 5 7 . 0 0 4:14:00 : 0 0 . 1 9 0 Case8 2・43.44 1: 4 1 . 1 6 4 : 2 5 . 8 9 0 : 4 3 . 3 3 0 : 2 4 . 2 2 4:12.00 : 4 3 : 4 2 1: 41.05 2:18.05 0:09.79 0:43.27 0:16.19 4:19.00 Case9 2 : 4 3 . 3 2 1: 40.56 1:53.87 0:09.02 0:44.44 0:16.68 4:20.00 Case10 2 Case11 1: 41.12 1:18.17 3:53.15 0:15.46 0:42.07 0:35.00 Case12 1: 3 9 . 2 4 1: 4 3 . 9 1 3 : 2 1 . 9 5 0 : 1 6 . 6 4 2 : 5 9 . 2 9 0:37.35 : 0 3 . 5 6 0 : 1 5 . 5 9 1: 0 0 . 5 7 0:49.15 4:18.00 Case13 1: 5 0 . 6 7 2・43.72 5 4 .考察 1 0 0 0 CPUの影響 4 ‑ 1 . . W r i t e ロR e a d 図 SORT 圃 MEAN l ! iFREQ ロGLM CPU 8 0 0 意外な結果となった。 イメージ的には高速化に寄与 すると期待された DUAL化 は SASに対しては足を引っ 張る形を示している。これは、 き 600 I ! m 凶 ー ・ t I ! i 殴1 忌 400 PC/SA Sが 並 列 計 算 等 の 高速化環境に適応していない ことに一因があるように思わ れる。この為, D U A L化に よりメモリの lCPU当たり の使用可能容量の減少という 2 0 0 。 B a s e CPU種別 影響のみを受けて性能が劣化 しているように見受ける。 一2 0 1 P I D O u a l C e l e r o n C e l e r o n P I D 5 5 6 C e l e r o n OUAL 5 2 5

197.

1 0 0 0 10をほとんど使用しない CPUの影響( 2 ) 円周率計算との比較では、 ,・~ ‑ ‑‑. . 8 0 0 SASは浮動小数点演算に弱 / . ̲ ・ ‑ ‑ 4 ' いと言われる Celeronプロセ ッサーでも余り影響を受けて ¥ 、 、 . ‑ ‑ ・ ー ・ 会、、~ 6 0 0 巴 E『 いないようにも見える。 盤 これは、 P e n t i u l l lI I Iから採用 忌4 0 0¥ 劃 された浮動小数点演算強化機 「 十 。 一 構(拡張 S1MD命令)がグラ フィックを中心とした処理に 。 最適化されている上, SA S 自体も余り浮動小数点演算を 使用していない為とも思われ . . . . . ・ . .. . ・ .・..・ . . .. . 出 資 泌 『』 . ・ . . MEAN SORT ‑ ー ・'A‑FREQ ー ‑ ー ド ー GLM CPU種類 ‑Pai B a s e p m D u a lC e l e r o n C e l e r o n p m 5 4 5 C e l e r o n D U A L 5 2 5 る 。 P e n t i u m I I Iと Celeronの比較ででは、 P e n t i u m I I Iの方が l割程度性能が高いように見え る。これは検証に用いたプロセッサの動作周波数が P e n t i u m I I Iが 50 0Mhz に対して Celeronが 466附lZ と 1~J弱低いことも要因に挙げられる。このことは Celeron のク ロックアップ試験 (52 5M h z )によっても実証されている。このクロックでは Pentium E と同等の性能を示しているといえる。 4 ‑ 2 . メモリ 一 一 一 1 0 0 0 一 メモリ容量の影響(1) 右図にメモリ容量が処理 時間に及ぼす影響をまとめ 8 0 0 てみた。 匂 処理に対してはメモリ容量 aua される。また、 1 0 中心の nυnu nunu 多いほうが処理性能が改善 ( 会)E世間崇 全体的にはメモリ容量が はほとんど影響しないとい える。 2 0 0 E C C (エラー誤り訂正機構) 付メモリについては余り効 果が無いといえる。 。64MB 128MB 128MB 256MB 384MB 448MB ( E C C ) ← 2 0 2‑ 事昆

198.

一方、 8 0 0 I0依存で無いと思われ る処理についてはメモリ容量の メモリ容量の影響 ( 2 ) 影響が極めて大きいい。 P r o c G L Mでは 64MBの実行時間 6 0 0 に対し 448MBでは、実に U ︽ 凋句 P r o c S0RTも 1 0 中,心と,思 n u 会)匡密貯忌 3倍の処理性能向上が見られる。 われがちだが、 SASはメモリ を効果的に使いソートを実行し ているものと思われ,メモリ容 2 0 0 量が性能に強く影響している。 。 64MB 128MB 128MB 256MB 384MB 448MB メモリ容量 (ECC) 4 ‑ 3 . ディスク ∞「ーデふーん二一両 1 0 R e a d および Write への好影響が現れて いる。また影響が少ないと思われた P r o c 日∞一一 部への好影響も確認できる。 ・ │ 口 Read i 標準の ATAP1インターフェースの CPU およびメモリ・リソースの負担分が開放 された効果が現れた物と思われる。 SCS1 と DMA66 の比較では、 イ ーi 話 ! I0に関し l Wr 仕e i 尋 6∞ ~ 巴 宙 関 2 梨4 ∞ ては若干、 P r 0 C部に付いては D M A 66が有利といえる。これは、 SASの 2 0 0 IOが SCSI向きでない(細かし、) ことと、使用した I/Fカードの C P U に対する負荷の差が出たものと思われる。 。 Base SCSJ DMA661イプ 一般に、計算主体のユーザにデ ィスク I/Fの与える影響は少ないように思われがちだが、決して無視してはならない要素 であることが確認できる。 なお、今回の試験で使用した HDDは正確には DMA33対応で、 DMA66対応ではない。 の為 DMA66対応デ.イスクの使用により、より性能が向上することが予想される。 ‑203‑ v

199.

5 . まとめ SASに最適な P Cの構成を決定する要素を影響度順に並べると (1)メモリ容量 (2)ディスク性能 (3) CPUクロック (4) CPU個数 といえる。コストを度外視した場合、 P e n t i u m I I Iの Dual構成にメモリを 512MB搭載、 UW‑SCSI構成が最適であること言える。ただし、コストを考慮した場合、 C e l e r o nプロ セッサにメモリを 512MB搭載、 ATAPIディスク搭載モデルで、も遜色無い性能とも 言える。また、 Dual構成は SASを個人のワークステーションとして利用する場合には 余り効果のある投資とは言えない (DUAL構成が真価を発揮するのはサーバで複数ユー ザで同時に SASを使用した場合と考えられる)。 estの構成と B e t t e r構成を設定し、基本構成との差を比較してみた。 これらの結果から、 B その結果を下表に示す。また仕様の詳細を添付資料 3に示す。 n u 凶日川市‑ nU 一nu一nu "‑nU 一nu一nu ‑ 恥 u一 '初出一n nu‑nu 4 一司4 三 V平一 V平一 V平 世間山戸内 J 圃 主同 d‑nu nu 一 ‑3一 5 一 3 一 O 一 一 ト 1 α ) ( ) 上記の結果を右のグラフに示す。 Best&Better ∞ 同一 CPU を使用した場合でも、その他の B 構成により性能的には倍以上の性能が得ら れる(オーバクロックの為,妥当性には欠け ∞ ‑ : : ‑6 るが)。また、 P e n t i u m I I Iと C e l e r o nの 性 き E 能がほぼ同じであることから、価格性能比 高 を考えると C e l e r o nを選択し、多くのメモ 京 400 リに投資するほうが SAS のユーザにとっ ては有効な選択といえるだろう。ただし、 ∞ 2 SAS以外のアプリケーションでの評価は別 の側面を持つ為,あくまでも参考として頂き たいc 。 B a s e 2 0 4 B e t t e r B e s t5 1イプ

200.

6 . 雑感 ‑筆者が 1988年に VAX 八明日上で S A Sのベンチマークを実施した際、 3 0万件の 5, 000, 000 データのソートに 40分程要していた。その際に使用したシステムの価格は¥ 1 くらいで、あったように記憶している。 10年後の現在、同上以上の性能を 3 0万円程度 の費用で入手可能となっている。隔世の感がある。 .ベンチマークに際し、数多くの P Cを構成する部品を比較する機会にも恵まれた。 そのなかで、表記上は同一性能でありながら、不安定な動作を示し実用に耐えないもの、 メーカないしは販売庖のサポートが悪く、使用を断念したものなどもあった。不良動作 を示す部品の共通点は、メーカ名が不明(し、わゆるノーブランド)またはマイナー メーカの廉価販売を特徴とした製品であった。これらの製品は動作が不安定ということ で、不良品として販売側に返品することが困難な場合が多く、結局お蔵入りの場合が 多い。廉価ということのみで購入することを避けるようにお勧めする。 .ベンチマークに際し熱対策の必要性を痛感した。ケースおよび給排気に問題がある場合 が多い。熱源としては CPUが念頭に挙がるが、チップセット、ピデオボード、ディスク の発熱が無視できないレベルにある。 CPUのみの冷却では無く、 PC全体での冷却を 考慮する必要がある。ケースファンを単に追加しでも冷却効率を悪くする場合もあり、 エアフローを考慮、した設計の必要性を痛感した(一流メーカのワークステーションを 名乗る高価な P Cはこの辺が良く出来ている)。 ‑今回はベンチマーク期間に間に合わなかったが、互換チップ (AMD K7 ) との比較 も今後は面白いであろう。また、ディスクに付いては RAIDの試験も企画してみたい。 .クロックアップは効果が大きい。魅力ではあるが、メーカーのサポート外の行為でも ある。販売l 苫でもこれらの行為に対してはサポートをしないことを明言している為、 個人のリスク管理で実施・管理する必要がある。法人での使用は絶対避けるべきである。 さらに、クロックアップは CPUコア電圧の調整を伴い、結果 C P Uの発熱の問題も 大きくクローズアップされる。最悪 CPUの破損・発火の危険性も増大する。 従って、クロックアップ PCを使用することは避けるべきである。もし、行う場合、 豊富な経験を持った個人間の情報交換を通じ、注意深く運用する必要がある。 注意願いたい。 ‑205‑

201.

添 付 資 料 , 試 験 に 使 用 し た SASプログラム data test u g l一J 半t est d a t a .dat" f i1 e" c :半s くくくくくくくくくくここでリブート>>>>>>>>>> do i d = 1to 500000 by 1 n l= substr("ABCDEFGH1 JKLMNOPORSTUVWXYZ " , data t e s t l i nt( r a n u ni( 9 9 9 9 )ホ25.+1),1) substr("ABCDEFGH1 JKLMNOPORSTUVWXYZ " , ︐ ︐ m川 ︐ . ︐ r u n; .. e s t l Proc Sort data = t out = test2 ︐︐ by v l v2 v3 r u n ... proc means data = test2 by v l run , 8 ・・・︐ proc freq data = test2 tab1 e s (v l )ホ( cl‑c20 ) 0 ・・・ r u n Proc GLM data =test2 =1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 U 一‑‑‑‑‑‑一‑‑‑一一一‑‑一‑‑ ︐ ) ) ) ) ) ) ) ) ) ) ) )︐ .) ) ) ) ) ) ) V2‑v20 cl‑c20 内切ザハ ハ ハ ud 内 ud ハ ud ハ ud ハ ud ハ ud 内 切 ザ 内 切 ザ 内 ud 内 ud 内 ud ハ u d ud ハ ud ハ ud ハ ud 内 ud ハ uivn叫 ud ハ U J V ︽ U J V ︽ U J V ︽ U J V 内 切 ザ ハU J V 4・ nuJunuJU 内切4・ 内 ud 内 J V ︽ U J V 内切4・ n叫 ザ ハU U J V 内 ud ハ u i v ハ uivn叫 u i v U J V ︽ 4・ 内 切4・ 内 切4・ 内 切4・ 内 切 ザ ハ u i v ハ uivn叫 4・ 内 ud ハ 4・ n叫 仇 u J d M ︽ " 4︾ ' ︽" 4︾ ' ︽ ︾'︽" ︽ 内 ︽ ︽ ︽ ︽ ︽ ︽ ︽ ))))))))))))))))))) ムγL phdn叫 ザ 内ud 守 内u d 内 ud AHvnuJU 内 ud 内 ︽ ︾'仇 HUHUHUHUHUHUHUHUHUHUHUHUHUHUHUHUHU nH UnH Un nnnnnnnnnnnnnnnn 白 islolilia‑‑lilei‑‑11 nHnHnHnHnHnHnHnHnHnHnHnHnHnHnHnHnHnHnH 内 . " 4 u d M u i d v u . u i d v u d v u i d v n " 4 i d v u i d v u e (uJd.( uJd ( ( (J ((((( (idv( uJd ( ( (idv(uidv( ui ( ( ElIi M悶 AHソ 川 rrrrrrrrrrrrrrrrrrr k aaaaaaaaaaaaaaaaaaa 町民 ・内 J η t a u守 du守 du守 内 正 ワ ﹄ 内 川本本本本事事白旗白旗白旗白ホホホホホホホホホホ J1 J1a 内 J ワ﹄ ∞ D O D O ‑ 1 1 ι ι o∞ o (((((((((((((((((((( r a u守 du守 内 正 ワ ﹄ 内 00.3E0.0.0 l n H‑ ‑ 日 げ+++++++++++++++++++ ・ ・ UVAHVAHVAHVAHVAHVAHVAHVAHVAHV ︽ n U M ︽ UV ︽ UV ︽ UVAHVAHVAHVAHVAHv wpopu‑‑7'QVηt 内 J ︽U 内 J P O 民υ 民υ 1 7 ' Q V 内正内 J n U 内 J 内ノ﹄咽 1 . 内ノ﹄ e l l lg F?le' '11 ︐ ===‑一一‑一一===========‑一一‑‑一 'lηt 内 ワ ﹄ 内 J a u守 p h d 民υ 7 a n 6 n u d ︽U J a u守 p h v p U 7 ' 内 包 ハ uJ ︽U 1 1 vvvvvvvvV4i314178el lηt 1 1 1 ・l ・ ・ uvuvuvuvuvuvuvuvuvuvuv b yv l r u n n t ( (ranuni( 9 9 9 9 ) +.5) ) c2=i n t ( (ranuni( 9 9 9 9 ) +.5) ) c3 =i c 7 =i n t ( (ranuni( 9 9 9 9 ) +.5) 本5) nt( (ranuni( 9 9 9 9 ) +.5 ) ホ 5) c6 =i 9 9 9 9 ) +.5) ホ1 0 ) c9 =int( (ranuni( n t ( (ranuni( 9 9 9 9 ) +.5) ホ1 0 ) c8 =i nt( (ranuni( 9 9 9 9 ) +.5 ) ) c l l =i nt( (ranuni( 9 9 9 9 )+ .5 ) ホ 5) c1 0 =i c13 =i n t ( (ranuni( 9 9 9 9 ) +.5) ) c12 =i n t ( (ranuni( 9 9 9 9 ) +.5 ) ) n t ( (ranuni( 9 9 9 9 ) +.5 ) ) c15 =i n t ( (ranuni( 9 9 9 9 ) +.5) ) c14=i n t ( (ranuni( 9 9 9 9 ) +.5) ホ5) c17 =i n t ( (ranuni(9999) +.5) ホ5) c16 =i c19 =i n t ( (ranuni( 9 9 9 9 )ー + 5) 本1 0 ) n t ( (ranuni( 9 9 9 9 ) +.5) ホ1 0 ) c18 =i nt( (ranuni( 9 9 9 9 ) +.5 )ホ5) c20 = i put n l $1 n 2 $2 end vl‑v20 cl‑c20 r u n ‑206 run Proc datasets n t ( (ranuni( 9 9 9 9 ) +.5) ) c5=i nt( (ranuni( 9 9 9 9 ) +.5 ) ) c4=i V l $ 内ノ︐﹄‑内ノ︐﹄‑内ノ︐﹄‑内ノ︐﹄‑内ノ︐﹄‑内ノ︐﹄‑内ノ︐‑ ﹄n Jι 内ノ︐﹄‑内ノ︐﹄‑内ノ︐‑ ﹄ nJιnJι 内ノ︐﹄‑内ノ︐﹄‑内ノ︐‑ ﹄n Jι 内ノ HnJι 門 ﹂防川撒市白本ホ也ホ苧也ホ苧指本白ホ指本白ホ也ホ苧也ホ苧也ホ苧也ホ苧也ホ苧也ホ苧指本白ホ也ホ苧也ホ苧 Mode1Vl0 =v2 v3 v4 v5 v6 v7 c l =i n t ( (ranuni( 9 9 9 9 ) +.5) ) i n p u t nm $ i nt( r a n u ni( 9 9 9 9 )ホ25.+1), 1 ) 半t est d a t a .dat " i n f il e" c :半sugl‑J n2 =

202.

添付資料 2:試験環境詳細仕様 Case 8ase ' 3 2 4 6 5 Type CPU Pentiumm:Pentiummi C e l e r o n Celeron :CeleroniPentiummi 2 1 T 2 Num , C lock 466 466 525 556 500 500 500 100 100 66 75 112 FSB 100 1 66 +‑ +‑ ← ← ECC INoECC メモリ i Type ← ← ← ← 64 i S i z e ( M B ) 128 令ーー 令ーー HDD Type IDE Name DTTA‑ 351680 : 令ーー ← ← 令ーー +‑ +‑ ← ← ← ← +‑ +‑ ! C a p a c i t y ← ← ← ← ← +‑ RPM ← ← ← 令ーー ← +‑ +‑ I Seek Type ← ← ← 令ーー +‑ HDD (什) ← ← ← ← ← I /F i Name (叶) ← 令ーー ← 令ーー ← ← 令ーー +‑ +‑ +‑ ASUS i マ ザ ー 1M aker P2B平 +‑ 丁 +‑ +‑ Name P2B‑F : P2B心 Chip 440BX ← 令ーー ← ← ← +‑ 0 8 i Name NT4 令ーー +‑ ← +‑ +‑ +‑ 1 1 i 12 : 13 ボード Case I 7 ! 8 P2B‑D : P2B‑F : P2B‑F I P2B‑F 9 ! 10 CPU! 乃 pe IPentiummiPentiummlPentiummIPentiummiPentiumm! P e n t i u mmi Pentiumm Num I , C lock 1 1 500 ← │ ← │ ← ! ← ← ! ← ← ← ← ← ← │ ← FSB I 100 : ← ! ← │ ← メモ 1): Type INoECC : ← ← 1 ← : Size(MB)I 128 HDD ! T : y p e 旧E 256 384 i ← ← i ← i i ECC I 448 1 128 ← ← i ! ← ← 128 128 SCSI I IDE ← │ ← ← ← ! ← ← !DDRS‑i ← Name I DTTA‑ i 3 5 1 6 8 0; 39130 ! l C a p a c i t yI 1 6 . 8 ← ← ! ← l ← 19T31168 400 RPM I 5, ← ← I 9.5 l ← i i ← i ← │ ← HDD Type I ( 吋 ) ← l ← : ← I / F Name I ( 汁 ) ← │ ← ← Seek aker マザー! M ボード! Name IASUS IP2B‑F !Chip I440BX 0 8 ~me 1 NT4 ← , ← ! ← i 7 . 5 ← 9 . 5 DMA66i SCSI‑2 i (吋) U l t r a 6 6 • AHA2940i (汁) ¥A‑OpeniA‑OpenIA‑Open P2B‑D!AX6BC i似 6BC iAX6BC ← │ ← ‑207 5, 400 ! ← P2B‑D ! P2B‑F ← ← ← : 7, 200 i l ←!← ← ! ← 1 ← l ← Win98

203.

添 付 資 料 3 :Better&Best仕棟 Case Base B e t t e r B e s t CPU i Type P e n t i u m i l l C e l e r o n P e n t i u m i l l Num iClock FSB メモリ lType 500 100 ECC 582( 4 6 6 ) 83( 6 6 ) NoECC 584( 5 0 0 ) 117( 1 0 0 ) NoECC 128 IDE IBM DTIA‑351680 16.8BG 400rpm 5, 9.5msec 384 IDE IBM DTIA‑351680 16.8GB 5, 400rpm 9.5msec U l t r aDMA66 PromiseT e c .I n c U l t r a 6 6 A Open 384 SCSI IBM DDRS‑39130 9.13GB 7, 200rpm 7.5msec UW‑SCSI Adaptec AHA2940U2W A‑Open ISize(MB) HDD I Type IM aker Name : Capacity RPM I Seek HDD I Type I I F IMaker IName マザー Maker ボード (叶) (汁) (什) ASUS P2B‑F i似 6BCType‑RV ← Chip 440BX oS IName NT4 価 格 ! (予想) ¥230, 0 0 0 . ‑ 1 司 Name 208‑ 似 6BCT ype‑RV ‑ ー ー ¥2 5 0 . 0 0 0 . ‑ ¥330.000.‑ ‑ ー ー ‑ ー ー

204.

日本 S A Sユーザー会 (SUG I‑J) SASシステムによる WEBソリューション T i p s、Tr i c k sandTechniques集 漁智一 大久保英昭 株式会社 SASインスティチュートジャパン プロフヱツショナルサービス本部コンサルティング部アプリケーション支援グループ WEBS o l u t i o nusingSASSystem ー T i p s, T r i c k sandTechniques TomokazuAsari HideakiOkubo o n s u l t i n gDepartment, A p p l i c a t i o nSupportGroup, C P r o f e s s i o n a lS e r v i c e sD i v i s i o n, SASI n s t i t u t eJapanL t d . 要旨 SAS/lntrNetソフトウェアは、 SASシステム上に蓄積された重要な情報を、誰でもが利用可能な (ワールド、ワイドウェフ、、)を活用し、閲覧・配布・利用することを可能とするプロダク 技術である羽市川T トである。本論文では、 1997年に発表されて以来、既に多くの組織で導入された際の技術,経験 やノウハウをもとに、このソフトウェアをより実践的に利用する為の技術やノウハウを紹介する。 キーワード: SAS/lntrNetソフトウェア Web; HTML 1 . ApplicationServerControl アプリケーションサーバとは、 SAS/l nrNet ソフトウェアで、提供する ~Web アプリケーション』と呼ば れる機能のサービスである『コンピュートサービス』の要素の 1つで、ある。 『コンビュートサービス』の要素は、 ( 1)アプリケーションブ、ローカ: Webブ、ラウザからのリクエストを受け取って転送を行う CGIフ。ロク守ラム c ( 2 ) アプリケーションサーバ リクエストを実行する SASシステムが稼動するサーバ。 ( 3 ) SASアプリケーション: アプリケーションサーバ上で、実行される SASプログラム。 の 3つの要素により構成される。 2 0 9

205.

『コンヒ。ュートサーヒ、 ス」によって実施される処理の流れは、 Webブラウザ.から Webサーバを経由 してアプリケーションサーバに対してリクエストを発行し、 SASアプリケーションが実行した結果を Webブラウザに表示することにより実現される。『コンピュートサービス』の最大の特徴は、 SASシス テムに貯えられたデータウェアハウスやデータマートの情報を SAS 、ンステムがインストールされて いない ThinC l i e n tのコンヒ。ュータからも対話的に活用が可能となることで、ある o 1章では、アプリケーションサーバをより効果的に管理及び利用するための方法を紹介するo L J 竺 笥 WebA p p l i c a t i o n ← 占 1 2 7B r o k e rCGI AppS erver ー回目噌惨 WebServer CP/ lP A押IicationUb 同町 【コンビュートサービスのイメージ】 1 . 1 WindowsNTのサービスへのアプリケーションサ ‑ 1'¥‑ 登録 icrosoft社のリソース アプリケーションサーパは、 WindowsNT環境下にて稼動させる場合、 M キットより提供される SR¥ 冶 NY.EXEを使用して WindowsNTのサービスへ登録することが可能で ある。 WindowsNTのサービスを利用することにより様々なメリットを享受することが可能なので、あ る 。 ( 1 ) よりシームレスに稼動させることが可能 ( 2 ) より簡易に管理することが可能 ( 3 ) より現実的にサーバとしての利用が可能 ‑ 2 1 0

206.
[beta]
【アプリケーションサーパ畳録方法】
l.サービスへの登録を行うコンピュータ上にて、レジストリの登録や確認を行うためのツールで‑
ある『レジストリエデ、イタJ1(標準 :
C¥WINNT
¥R
e
g
e
d
i.
te
x
e
)を起動する。
酒 田E

轟湾問

L
ポストリ申 膚集申

ヨ~:r.由

ヘルフ可)

cs
圃畠園田圃

デ
→

r:も続

・ 」 附 EYC凶 SSES̲ROOT
'
.
:̲jHKEY̲CUJ
'
lHENT̲USEP

‑
ーJH~EY_LOCAL_IolA.CH!NE
・ 」 同 EY国 E田
斗 削 EYCU聞

ENT̲CQNfG

一
J HKfY̲DYN̲DATA

マ
イ
ヱ
川
,
'
,
→

〆

2
.Wマイコンピュータ』→ WHKEYLOCAL MACHINEJ
1
→ WSYSTEMJ
1
→ WC
u
r
r
e
n
t
C
o
n
t
r
o
l
S
e
d
→W
S
e
r
v
i
c
e
sJ1と階層を移動する。

車
.
'

i
1
'
)
'
.
.
.
1'
)
(
8
) ..
.
,
.
;

表示也

J
!
J1
1J:
.
.
t
.
,
,
‑
'
J

ル
、n
ω
二JL~前“← u 一一一

1
1到 噌 掛

・̲jHXEY̲C凶 SSES月 目γ

一
.J I:E

;
主
主
主

唱の 1安定制J

I

H Y̲CUfHlENT̲USEP

̲
‑̲jHKEY̲lOCAl̲I
o
l
A
.CHINを
j
・ 斗 HARDWARf
̲j
夙 ι
'
:
.
.
.
.
.
JSAM

̲]SECUl
'
<
r
T
Y
. ̲jSOFT
¥
I
IAPE
‑ ̲jSYぢγEM

二Jc.
.
.
.
、̲jC細 川 知 ∞ 1
・.̲jC細 川 I
S
.
l叩
'̲jC
.
.
.
.
r
e
c
n
t
C
o
n
t
'
e白,

. 斗 C副 '
0
'
. ̲j E
刷 m
,
.
.
.
.
J
H
.
o
.
.
d
,
.
.

.
.
.
.
.
P
.
o
川

口」翠盟盟

」抽喝,dsk

拐 」 州d

̲jAh・,,.‑
̲jAh・"・M
'
̲
ju
:
:7
!
lu
:
+
; ̲j
̲jA...ay.
̲j・ m o
O"I

,
.
'
".
.

J・
.
.
.
.
,
,
,1
」 如 押

七
」
一
二
二1
・
w ゴ
エJ
マイヱIt'~~勿 HKEY_lOCAL)I4ACH!N EfSYSTE JiIt縦ミn.otCootro lS.tt・s..v;c・5211

一一一一一一一一一一一一

207.
[beta]
3
.~Services.nの階層上で、キーを新規作成(例: SASA
p
p
l
i
c
a
t
i
o
nS
e
r
v
e
r
)し、各情報を設定する。
【設定情報】

名前
DisplayName
E
r
r
o
r
C
o
n
t
r
o
l
I
m
a
g
e
P
a
t
h

プ、ータ

属性
文字列

DWORD値
文字列

ObjectName
S
t
a
r
t
T
y
p
e

文字列

DWORD値
DWORD値

Wヌ出B
J 1
I
I
1
1申 表 示 却 ゆ が 国
.
'
:
.
:
.
JP,
.Vd
二J
I捌

凶何度""

子
、4 …
(
1
10:活覧室r
Jl)

"
,

...:J同血叩
‑
:
.
.
.
J Pcmc'""
・

SASA
p
p
l
i
c
a
t
i
o
nS
e
r
v
e
r
OXOOOOOOOO1(
1
)
C
:
¥NTRESKIT
¥S
r
v
a
n
y
.
e
x
e
L
o
c
a
l
S
y
s
t
e
m
OX000000002(
2
)
16
)
OXOOOOOOO1
0(

凶 C聞 同

N
.
̲

SASAppl
r
:.
.
t閥
、s.‑

I~'l Em:"Conbol

o
.
αxn::o:Jl(t)

s 二l~叫

目白 m ・c. P•仇

ーc ・ NTRE91刊缶、,~,・..'

・̲jP
ro
l
・
cl.dSt吋 .

l
:
i
'
iS
t
.
.
.,

c
.
JP

"
1

.
.
:
.
.
:
.
.
Jpoooer

ヌ
.
.
.
J,
.
)
Jdllp

・
C
.
J
間
以
.
.
.
,

。
e
α
"
"
α
".
)
"
'
α

1_~lC柏崎間

"
lOCllSy.tem"

1~:'~1由

:
O
XII0(16)

r~

」加伽耐

'
,
.
.
Jqv

,
.
.

-ー~
f♀JR o o 同 町
,.斗 R陀 lOCATQF
I
.

ふ
二
江
.
.
.
,s
.
'
.
.
J
・3

‑;:̲j富田mIII!思窪盟国

ー
JEnum

i
.
.
.
JP.'.m~'....

c
.
J
s
.
o
u
.
内
ー
.
.
.
.
.
JSASJcbs
p働 相 ・w

.
2
.
JE,
.
,m

ーJ P., ..m帰宅~.
'
‑
.
.
]S
.
e
u
r
i
t
y

.ー~"'"・...・

~.てご一一」工rl

]1?ーま止主当以長 L∞Al~MÄëHJ

L

4 新規作成されたキー(例:SASA
p
p
l
i
c
a
t
i
o
n Server) に ~Enuml ~Parametersl ~Security.nの 3
つのキーを新規作成し、 ~Parameters.nにパラメータ各情報を設定する。

【設定情報】

名前
AppDirectory
A
p
p
l
i
c
a
t
i
o
n
AppParameters

属↑生

プ、ータ

文字列
文字列

D:¥SAS¥i
n
t
r
n
e
t
D‑¥SAS¥Sas.exe
¥C⑪ n
f
i
g
.
s
a
s
‑
c
o
n
f
i
gD:¥SAS

文字列

‑212一

208.
[beta]
品単品

W H申

g集 申 表 示 、 。 切 六 回

.
.
.
.
JP
.
.
.回 笥
少 ~P...Vd ",

ニハ名前

i

/
!
!
:
1
(
標
語

‑
ー
」
同
"
'
"
町
・
:
.
.
.
J

一,.
う一一
"直の1実~t,以J

o・ 同 日 帥 耐 '

I~A押 D.副叫

.
I
.

{
剖 A押 旬 以 m
.
.
.
JPU
C
;P同 │ 封 A p p
P
.
.
.
.
.
.
.
.
.
I
"
'
.
Pct
t
w
:
:
ゅ

DWSASWSH

..cO'、4 唱 DVSAS ・.~、'"・.-

.̲j同制

.
;
ι

」 問 帽

・~?rOI ・d ・<s川即時・

.tWP"d;'p

ー
‑J, 町 出
ー
」α
H
'
.
.
.
'
"
'
'
:
.
.
.
Jqv

モーJ
"'"
.̲jR剛 山 相
・斗f:lPClOCA下0'
κ乙
̲
jRTcSs

.
.
.
.
.
.
.
Js3
斗 SAST
.
ppl
.
o.h""s . e . 叩 『
一斗'"則 m

1

l
i
I
I
I
!
!
圏

̲j
̲js
.
.
C
U
'lty
• :
̲
!SAS占訓bSp̲̲.

,
̲

.̲j旬噌""',
.
: ̲jScspnl

・
"
S
l

弘二JScS

n

一
.JS."・
1
'.'~SE 同

~..~:二二~I
汚五百ヲ五夜お疋ぷ正前E石市E面広高ぶ..,示ζ不;ws忘高~s二二E品二五'w.

一
一
一
一
一
一
一
一
一
つ

1
.2 ソケットサービス C
S
o
c
k
e
tS
e
r
v
i
c
e
)と起動サービス CLaunchS
e
r
v
i
c
e
)の相違点
アプリケーションサーバは、 Webブラウザからのリクエストを受け取り、それを転送する CGIプログ
ラムから引き渡された各リクエストの処理を実行する。この CGIフ。ロクーラムはアプリケーションブ ロー
の 2つのサービスタイプを利用することが可能
カと呼ばれ、『起動サービス』及び『ソケットサービスJ
である。この 2 つのサービスを理解することにより、簡単にどのタイプのサービスを利用するのが効
果的なのかを判断できる。この 2つのサービスの相違点を説明する。
【セッシヨンの起動】
『ソケットサービス』は、常にセッションが稼動しており、アプリケーションブ、ローカから転送され
る各リクエストは、このセッ、ンョンを再利用し処理を実行する。これに対して『起動サービス』では、
リクエストのたびにセッションが新たに起動され、各々の処理を実行する。
【起動するセッション数】
『ソケットサービス』は、予め幾つのセッションを利用するのかを設定することが可能で、あるが、
『起動サービス』では、起動するセッ、ンョンの数を制限することが不可能で、ある。例として、 1000
人のユーザが Webブ、ラウザからリクエストを発行した場合、 1000ものセッションが起動される。こ
を利用したアプリケーションで、は、スケーリン
れは極端な例であるが、このように『起動サービスJ
グする必要があることが理解できるc
【アプリケーションの実行マシン】
『ソケットサービス』は、ネットワーク上のマ、ンンで、あればど、れでも、アプリケーションサーバとし
て処理を実行することが可能である。このため Webサーバマ、ンンでリソースの使用を制限する必
要があり、別々のマシンにアプリケーションサーバを置く必要がある場合、『ソケットサービス』を
利用する事により柔軟な対応が可能である。これに対して、『起動サービス』では、 Webサーバマ
シンつまりアプリケーションブ、ローカを実行している同一マ、ンン上のアプリケーションサーバのみ

唱Eム

QU

︒
円

で起動が可能である。

209.

【プロセスの処理】 「ソケットサービス』は、特定の 1つのアプリケーションサーバにリクエストが送られ、そのアプリ ケーションサーバが他のプロセスを処理中の場合、そのアプリケーションサーバに送られるリクエ ストは待機状態となる。実質的に、これは同じサーバポートを待つリクエストの待ち行列を形成す るのである。リクエストが多い場合や処理に要する時聞が長い場合、処理待ちをしているリクエス トがタイムアウトになる可能性が発生する。これを解決する方法として、複数サーバを単一の『ソ ケットサーヒずス』と定義する,またはサービスに割り当てるタイムアウト値を大きくすることで対応す るc 「起動サービス』は、リクエストに応じて起動される複数のアプリケーションサーバと考えること ができ、「起動サービス』下では待ち行列を作らない。 (Webサーバ自身が待ち行列を作成する 可能性はある。)また、各リクエストはシーケンシャルにではなくパラレルに処理され、長時間処 理されるリクエストが実行されていたとしても、タイムアウトは発生しないのである c 【処理時間】 アプリケーションサーバーで、実行されるプロク。ラムについて、これが『ソケットサービス』上で、利 用され、なおかっその処理時聞が長い場合、問題となる場合がある c 長時間かかる処理がアプリ ケーションサーバを占有すると、他のユーザが利用することができなる可能性が発生するためで ある。ブローカ設定ファイル ( B r o k e r . c f g )と呼ばれるアプリケーションブ、ローカの定義ファイル上 に設定されたタイムアウトパラメータ ( T i m e o u t )は、単にアプリケーションブ、ローカの処理を終了 し、エラーメッセージを返すだ、けで、あるため、(アプリケーションサーバを中断するもので はないこ とに注意)アプリケーションサーバのセッ、ンョンは処理が完了するまで続行することになり、その 問、待ち行列にあるリクエストを出したユーザはタイムアウトのメッセージを受け取ることになる。 上記の理由により、 2 つのサービスの処理時間に対する特性として、「起動サービス』は長時 間処理されるプログラムに向いており、また「ソケットサービス』は短時間で、終わるプロク、、ラムに向 いていると考えられる。 【管理】 『起動サービス』は、システム管理者にとって非常に管理が容易である。「起動サービス』を一 度セットアップした場合、利用するアプリケーションの再構築が必要になるまで、システム管理者 は作業を行う必要がない。これに対して「ソケットサービス』で、は、システム管理者は、アプリケー ションサーバを正常に稼動し続けることと、プロセスが異常終了した場合の対応を行う作業が必 要である。 214‑

210.

1 . 3 ソケットサービス (Socket品 川 i c e )時における分散処理 ( B r o k e r . c f gの設定) 『ソケットサービス J を利用時にユーザ数が増加した場合、システム管理者はパフォーマンスの改 善を実施する作業が発生する。この対応策として、ネットワークの強化・プロクマラムの改善等が考え られるが、それらの手段を実施しても効果が出ない場合、最終手段として使用するアプリケーション サーノ〈数を追加する必要が発生する サーバを追加する場合、サーバ選択プロセスを定義する必 O 要があり、フごローカ設定ファイル ( B r o k e r . c f g )と呼ばれるアプリケーションフ。ローカの定義ファイル を編集する。ブ、ローカ設定ファイルを編集することによりパフォーマンス調整やサーバ接続フ。ロセス の調整(ロード バランス)を設定することが可能である c 以下にパフォーマンスの改善を目的とした 場合のポイントを説明する。 【複数のサーパ及びポートの使用(ロード1 ¥ランス)】 アプリケーションサーバとして使用する複数のマシン名、または単一マシン上の複数プロセス を表わす TCPIIPポート番号を設定する。 l ! 7 j : Servermachine amachine bmachine cmachine d Port5000‑5002 Servermachine e P o r t50015003 この例では、アプリケーションサーバ machine̲a,b,c ,dに対して 1 2 個のサーノ'‑/ポートの 組み合わせ ( 4サーバと 3ポート)の提供と、アプリケーションサーバ machine̲eに対して 2個の サーノ'‑/ポートの組み合わせ ( 1サーノくと 2ポート)が提供され、合計で 1 4個 (4*3+1勺)の異なる アフoリケーションサーバが提供される。アプリケーションブ、ローカがアプリケーションサーバに接 続するためには、それぞれアプリケーションサーバが起動している必要がある。アプリケーション ブ ローカは実行していないアプリケーションサーバがある場合、そのアプリケーションサーパを利 用しようとする。また、接続状況の診断が必要な場合、 DEBUG値を設定し接続をトレースする ことができる c またポート番号を指定する場合、 5001‑5003のように、ポートの範囲を指定するこ とや、また 1行に複数のポート番号を指定することが可能である。 【タイムアウトの増加】 ServiceTimeoutノぞラメータで、は、アプリケーションサーノくからの応答の待ち時間を秒数で、指 定する。指定した秒数が経過すると、アプリケーションフ、ローカによってエラーメッセージが Web ブラウザに返される。エラーメッセージを頻繁に発生させないようにするには、タイムアウト時間を 長くし、アプリケーションサーバで、の処理が混雑してしも場合にも接続できる機会を増加させるよ うに設定する(デフォルト値は 60 秒)。システム全体のタイムアウト時間を変更する場合、 Timeoutパラメータを変更し、また特定のサービスに対して変更をする場合、 ServiceTimeout パラメータを変更する。 2 1 5

211.

【サ‑/¥ーウェイトの使用】 既に定義されているアプリケーションサーバの範囲から特定のアフ。リケーションサーバに接続 したい場合、各アプリケーションサーバに対してウェイトを指定することにより、特定のアプリケー ションサーバが選択される機会を増加させることが可能である。 アプリケーションサーバとして実行してしもマシンが 2 台ある場合、各マシンのアプリケーショ ンブローカからのリクエストを受け取る機会は 1 / 2の確率である。アプリケーションブ、ローカは定 義済みアプリケーションサーバのうち lつをランダムに選択する c 特定のアプリケーションサーバ e r v e rノ号ラメータで アプリケーショ がリクエストを受け取る機会を増やしたい場合、以下のように S ンサーバにウェイトを割り当てる設定をする。 列 { S e r v e rmachineamachineb可 Or S e r v e rmachine̲amachine̲bmachine̲bmachine̲bmachine̲bmachine̲b この設定により、アプリケーションサーバ m achineaがリクエストを受け取る機会は 1 / 6となり、 アプリケーションサーバ m achine̲bには 5 / 6の機会が与えることになるのである。 【パックアップマシンの指定】 ウェイトにゼロ ( 0 )を設定することにより、指定されたマ、ンン上で、アプリケーションサーバが動作 していない場合のみリクエストを受け取るパックアップマ、ンンを指定することが可能で、ある。 例: S e r v e rmachine amachineb句 一般的に、アプリケーションサーノ<:m achine aが正常に稼動している場合、アプリケーション サーバ m achinebは決してリクエストを受け取らないが、アプリケーションサーノ<:machine aが 処理不能の場合、アプリケーションプ ローカはアプリケーションサーバ m achine̲bに接続しよう とする。(ウェイトが適用されるのはアプリケーションサーバに対してで、あり、アプリケーションサー バ上の個々のポートに対してではない。) ‑ 2 1 6一

212.

2 . SecurityControl 一般的に Webを利用したシステムにおいて、システム管理者が考慮する重要な問題点の 1つ にセキュリティ問題がある。セキュリティ問題については、その対策方法や概念、等、既に様々な形 AS/IntrNetソフトウェアを利用 で発表や論議がされているので省略をさせて頂き、この章では、 S することを前提に、より安全に、より高度なセキュリティを実現するためのヒントを紹介する O 【 POSTの使用 : 1 ' ¥ラメータの送信 (GETと POSTの相違について)】 絶対的に安全で、あると断言することはで、きないが、アプリケーションブ、ローカを呼ひ、出す際、セ キュリティテクニックとして POSTメソッド を使用するとセキュリティが高くなるといわれる。一般的 に Webを利用したシステムでは、そのフロントエンド(ユーザが利用するシステムで提供されるイ ンターフェース)に、 HTMLフォームが利用される。 HTMLフォームを利用することによりユーザ ーは、『リストボックス~, ~チェックボックス 1~ ラジオボタン~,または『テキスト入力フィールトJ等を 利用し、 Webフマラウザ、上から各処理のためのリクエストをすることが可能で、ある。 HTMLフォーム は、ユーザインターフェース(~リストボックス 1~ チェックボックス』等)の提供に加え以下の情報 が提供される c ( 1 ) アプリケーションブローカの保存場所。 FORMタグの ACTION属性で定義される。 (2) 必須情報である ~PROGRAM~ および~SERVICE~ の情報。 アプリケーションサーバ上で処理に使用されるプログ、ラムおよびサービ スの名前。 (3) 処理に必要な ~Name!Valu巴ベア』の情報。 『テキスト入力フィールド』等の任意のフィールド・情報 C HTMLフォームを利用する際、 FORMタグでは、 METHOD属性に値 GETメソッド、または POSTメソッド を指定することが可能で、ある。 METHOD属性とは、 Webブラウザ.から Webサー バに処理のリクエストを送信する際の送信形式を指定するための情報で、ある。 GETメソッド、また は POSTメソッドは、使用される Web ブラウザ、により若干その動作仕様が異なる。これは、 NetscapeNavigatorのようなしてつかの Webブラウザ、では、『更新』ボタンは GETメソッド、と POSTメソッド の両方とも共に動作する。しかし、 I n t e r n e tE x p l o r e rのような他の Webブラウザ、 では、『更新』ボタンによって HTMLフォームの再 POSTは実行されず、 GETメソッドと共にの ニ属性を省略すると、デフォルトで、は GETメソッ み動作する。また、 FORMタクーから METHOD ドが使用される。以下に GETおよび POSTメソッド、とし、う 2つの送信形式についての説明をす る 。 【GETメソッド】 特性として、副作用のない非更新プログラムに対して GETメソッド が有効となる。 GETメ ソ ッ ド 、 を利用する場合、リクエストの処理結果が表示されるページ (Web 画面)を保存(ln t e r n e t Explorer では『お気に入りに追加~, N etscapeNavigatorで、は『ブ、ツクマークを追加』等ので、表 現される)することができる。 GETメソッド の URL長および表示フィールド(In t e r n e tExplorer で、は『アド、レスツールパー 1N etscape Navigatorで、は『場所ツールバー』等)は 256文 字 1024文字の聞に制限される(各 Webフ守ラウザによって異なる)。 217‑

213.
[beta]
例:
く

FORMMETHOD=GETACTION=scripts!
br
o
k
e
r
.
e
x
e
>

く

INPUTTYPE=HIDDENNAME=
̲programv
a
l
u
e
=
m
y
l
i
b
.
m
y
c
a
t
.
m
y
p
r
o
g
.
s
c
l
>

U
s
e
r
i
d
:
INPUTTYPE=TEXTNAME=USERID>
くB
R>

く

P
a
s
s
w
o
r
d
:
く

INPUTTYPE=PASSWORDNAME=PWD>
INPUTTYPE=SUBMITVALUE=SUBMIT>

く

IFORM>

く

宮山 l州 l 計 D日'i1j'BlEimti'l;~時 Page ‑r
'
.
'
1
i
c
r
o
s
Q
f
tI
n
t
e
r
n
e
tE<plore

ファイJ
レ
(
.
E
) 編集室〕

ω お気に入り包〉

ツ』ル①

表示

-i-o戻る・時 T!~ [g

ヘルプ(Jj)

:
e
ij!a検索 L
孟jお気に入り 43 履歴 ι;も?~T J 三
i
1.

http://mγweb.site/scrip恒 I
b
r
o
k
e
r
.
e
x
e
ワ
'
̲
pr
ogram=mγ[ib.mγcat
.mγprog.scJ&USERID=sas&pwd=sasuser

【
POSTメソッド】
特性として、潜在的な副作用をもっオペレーション(データセットへの書き込みなど),こ対して

POSTメソッド が有効となる。 POSTメソッド は、すべてのフォーム変数を、 URLの一部として表示
されることのない標準入力経由で、アプリケーションフ守口ーカに渡す。これは、アプリケーションの
内部動作(フ。ロク。ラム等)を利用者ユーザが見えなくする (URLの表示フィールド 上に表示される
情報(変数,プログラム名等)を非表示)ことを意味し、これにより利用者がプログラムに送る値を
破壊しにくくするのである。また、 Webサーバに書き込まれるログ、情報へのフォームデータの表
示も回避することが可能である。しかし、 GETメソッド、とは違い、利用者はリクエストの処理結果が
表示されるページを保存することは不可能である。
例‑

FORMMETHOD=POSTACTION=scripts!
br
o
k
e
r
.
e
x
e
>
<INPUTTYPE=HIDDENNAME=
一p
戸r
o
巳
gramv
a
l
u
e MYLIB.MYCAT
User
i
ほ
d
:

く

く

く
く

二

INPUTTYPE=TEXTNAME=USERID>
BR>

P
a
s
s
w
o
r
d
:
INPUTTYPE=PASS羽TORDNAME=P羽TD>
くI
NPUTTYPE=SUBMITVALUE=SUBMIT>
く

く

IFORM>

!
i
E
止〈巳関)表向お主主任J
シー仰ぺ型
jω
2
J
宮 hヨ~代山凶山町

↓」戻る ' 暗

<
(
j
主

三
企
;
'
t
, 一盆立検索 之訓」お罰こ札入リ

l
i
アル
F
レ
スωI htt
ゆ
t
p
:
μ
11m
γWe
由b
.
s
i
柁
t
e
凶
/
s
c
r
i
町 附吋

山/刷《惜叩…
e
町r
明吋
exe

218一

履歴

!
ミ
弓
:
)
?~母会?.2J三当近'

.

214.

【安全な Webサーバの使用】 セキュリティリスクの 1つは、 Webブラウザと Webサーバ聞の不ットワークに関わるところで、ある。 安全な Webサーバを使用することより、セキュリティを向上させることが可能となるので、ある。安全 な Webサーバは、 HTTPの安全なソケットを使用する H' I 寸PSプロトコルを使用し、このプロトコ ルは Webブラウザと Webサーバの聞を流れるすべてのデータを暗号化する。これにより Web ブラウザと Webサーバの問で、様々なコンピュータを通り抜けたとしても、権限のないユーザは安 全なノ ξケットデータを解読することが不可能となる c 【 Webサ‑/¥のパスワード認証の使用】 安全な Webサーバで、あっても、安全でない Webサーバで与あってもともにユーザそ認承するた めに、ユーザ名とパスワードを入力させることが可能である。アプリケーションフ、ローカである CGIプログラムでユーザ認証を要求するように、 Webサーバを設定することがで、きる。認承に成 功すれば、 Web サーバはブラウザの認承夕、、イアロクーウインド、ウに入力されたユーザ名を環境変 B r o k e r . c f g )の設定に依存す 数 REMOTEUSERに設定する。これはフずローカ設定ファイル ( るが、アプリケーションブ、ローカは REMOTEUSERを RMTUSERとしづ変数名で、アプリケ ーションサーバに渡し、アプリケーションサーバはその変数をアフ。リケーションサーバ上で、実行さ れるプログラムで利用可能にする c アプリケーションサーパ上で、実行されるフ。ロク守ラムにさらにセキュリティを必要とする場合、セキ ュリテイデータセット(プログラムの開発者によって作成される)のオブ、ザベーションの値をチェック することで認承されたユーザがアプリケーションを使用することができるかどうかを決定することが 可能となり、さらに、 REMOTE̲ADDR(̲RMTADDR変数)を使用することでアクセス権をクラ イアントの I Pアドレスに基づいてチェックすることが可能で、ある。 【アプリケーションサーバ制御ファイルへのアクセスの制限】 アプリケーションサーバの制御ファイルで、ある s r v a u t o . s a s、permdata.sasおよび r e s e t . s a s は、潜在的にセキュリティギャッフ。を引き起こすことリスクを抱えている。セキュリティを維持するた めに、これらのファイルへのアクセスを制限するべきで、ある。具体的には、これらのファイルがある サーノ".;レートデ イレクトリ、ファイル自体またはその両方へのアクセスを制限することが必要であ I御ファイルには SASコード、が含まれおり、アプリケーションサーバが稼働中 るのである c 3つの箭J に実行される c 仮に、無制膿に s r v a u t o . s a sファイルへのアクセスを許すとすれば、誰でもが新 しいアプリケーションライブラリを定義し、どのような処理プログラムでも実行が可能であることに なる。この問題を解決する為には、これらの 3つのファイルを保護すべきで、ある。 【アプリケーションライブ、ラリへのアクセスの制限】 アプリケーションライブFラリへの無制限なアクセスを許可することは大変危険で、ある c 高いセキ ュリティレベルを実現するにためには、アプリケーションライブ、ラリへのアクセスは、アプリケーショ ンを開発することが認められた開発者だけに制限するべきである。 【マクロ変数の&参照の使用を避ける】 SASマクロ変数には処理プロク、ラムで、使用されるデータが含まれており、残念ながら、このデ ータを復元する最も簡単な方法が、最も危険である。極力、次のようなマクロ変数の&参照を使 用しないことが望まれる。 219一

215.

例: c o l o r=" & c o l o r " ; 一般的に、マクロ変数に含まれるデータは、 2種類に分類することができる。 ( 1 ) 記録、問い合せまたは分析を意図した純粋なデータ ( 2 ) 変数名,コードステートメントまたは条件ロジックなど、動的に作成することを意図したコー ドデータ ( 1 )の純粋なデータの場合、値は常にすぐマクロ変数からデータステップ変数へと変化する。 以下の 2つのサンプルはこの方法を示している。 例: c o l o r=" & c o l o r " ; c o l o r=s y m g e t ( ' c o l o r ' ) ; これらの 2 つのステートメントは同じ結果を生むが、後者は前者よりもはるかに安全である。 symgetを使用すると、 SASコード 構文解析メカニズ、ムがマクロ変数の内容を参照することを防 止できるからである。前者の場合、マクロ変数 c o l o rに有効な SASコード、が含まれていたとしても、 & c o l o rの参照は解決され、含まれているコードは実行されるからである。つまり、ユーザがこの データを渡しているため、これはある意味では非常に危険である。また、純粋なデータとしてマク ロの変数値を扱いたいならば、&参照は不要である。 しかし、変数名、コード・ステートメントまたは条件ロジックなど、を動的に作成するために、マクロ 変数の値を使用することが必要な場合、セキュリティギャップに関してのプロクーラムを評価する際 に十分注意する必要がある。不要なキャラクタに関してマクロ変数値をスキャンし、その結果不 要なキャラクタが存在した場合、動的なコードの作成や実行を拒否する仕組みゃより安全に、実 際に使用する前にマクロ変数値が有効値のリストと照会をおこなうことで、チェックする等の方法に より対応をする。どちらの方法でも、埋め込まれたコード、の不正なマクロ解釈を防ぐために、&参 照よりむしろ %SUPERQ機能を使用することが望まれる。以下に、『あるデータセットに含まれる 内容を印刷するプロクcラム』を例として説明をする。 例. p r o cp r i n tdata=&dsname; r u n ; これは、次のプログラムの方がより安全である。 p r o cp r i n tdata=%superq(dsname); r u n ; 2 2 0

216.

次のプログラムはさらに安全である c %macroc h e c k i t ; %if%upcase(%superq(dsname))=SASUSER .CRIME0' 1 %upcase(%superq(dsname))=SASUSER .ORANGES%then%do; p r o cp r i n tdata=%superq(dsname); r u n ; %end; % e l s e%do; 1 *p' 1 i n tane r r o ' 1m essage* 1 %end; %mendc h e c k i t ; % c h e c k i t ; 【 1¥スワード保護されたデータセットの使用】 追加するとよいセキュリティとして、プロク、ラムで、使用するデータセットにパスワード‑をつけること により、データへのアクセスを保護することが可能である。この SASソフトウェアの機能を利用す ると、データセットにパスワード、を害IJ当てさせた場合、データセットにアクセスまたは変更をする際 にパスワード、入力が要求されるので、ある O これはフ。ロク。ラムにデータセットへのパスワード をコー デインク守するか、ユーザに入力させるかを選択することも可能で、ある。注意点としては、パスワー ド をプログラムにコーディング守する場合、ユーザが SASログを Webブラウザに返してパスワード を見ることができないように設定するようにする点である。これを防ぐには、以下のセクションで、説 明しているように、 SCLプログラムを使用するか OPTIONSNOSOURCEを使用することにより 回避する。 【 s cしまたはコンパイルされたマクロコードの使用】 アプリケーションテ、イスパッチャ機能の 1つに、 SASログ表示がある。この機能は、アプリケー ションを開発するときに有用で、ある。しかし、それは運用段階で、潜在的なセキュリティリスクを生み 出す。 .SAS、.SOURCEおよび MACROのプログラムはすべて、サブミッ卜されたステートメント がロク守に表示されるからで、ある。この問題を解決できるプログラムタイプは 2つ存在し、その 1つ C L ( S A S / A Fソフトウェアで矛リ用で、きる SASスクリーン市Jj御言語)であり、その理由の 1っと がS して、 SCLのステートメントはログに表示されないことが挙げられる c SCLの特徴として、他のプログラムタイプを使用してできることは SCLで実現することができる としづ点がある。 また SCLはコンパイルされた言語で、あるとしづ理由から最も安全なフ。ロク、、ラム タイプであり、 SCLで作成したプロク守ラムは、ユーザが SASログを表示しようとしても、プログラム ステートメントを表示することは不可能である。これはもう 1 つの安全なプロク守ラムタイプで あるコ ンパイルされたマクロ (.MACROプロク、ラム)も同様な特徴を持っている。 コンパイルされたマクロについては、注意点として .MACRO エントリを実行するときに MPRINTオフ。ションが設定されていると元のソースが SASログに表示されるとしづ問題点もある s et .s a sファイルに以下のステ が、これはアプリケーションサーバの制御ファイルの 1つで、ある1'e ートメン卜を記述する二とにより解決が可能である。 例: OPTIONSNOMPRINT; ‑221一

217.

SCLが最も安全なプログラムタイプであるとし、うもう 1つの理由は、コンパイルしソースコード、を CLを使用することによりたとえアフ。リケーションサーバマ、ンン上の SASカタログへア 削除した S クセスできたとしても、フ。ロク守ラムステートメントを読むことはで、きないとしづ点である。また、プログ ラムソースを保護するその外の方法については、次のセクション([OP TIONSNOSOURCEの 使用])で説明する c 【 O P T I O N SNOSOURCEの使用】 ASログへのプログラムソースの印刷をコントロールする。 ク、、ローパルオフ。ションは S OPTIONSNOSOURCE; をアプリケーションサーバの制御ファイルの 1つである r e s e t . s a sファイルに記述することによ ASロク1こサブ、ミッ卜された各行をエコーしなし、ように SASソフトウェアに指示することが可 って、 S 能である。また、特定のプログラムでソースを保護する必要がある場合、各々のプログラムの開始 ステートメントに O PTIONSNOSOURCE:を記述することによっても対応が可能となる。しかし、 これはフ。ロク、ラムのデバッグをより難しくなることが予想される e 【 DebugMaskと ServiceDebugMask命令の使用】 アプリケーションデ、イスパッチャには、ディスパッチャ要求の DEBUGフィールドを使用して、 オン/オフが可能なデ、バッグオプ、ンョンがある。これらのし、くつかのオプ、ンョンには、ドキュメント には記述がありませんがテクニカルサポートによって使用されるためにある、セキュリティリスクに ASログ(ソースコードを含んでいる可能性が なるものが存在する。例えば、テ守イスパッチャは、 S ある),アプリケーションサーバが実行されているホスト名およびポート番号,またはブローカにお いて知られているすべてのサービスのリストを表示するオプションを持っている e 安全なデ、イスパッチャ設定を作成する i こは、許可するデ、パック。オプションを決め、オプ、ンョンの )、ステータスメッセージ 合計値をブ、ローカ設定ファイルに設定する。例えば、フィールドエコー(1 ( 2 )、および出力ダンプ(16 )値だけを許可する場合、 DebugMaskを 19( 1+2+16)に設定する。 デフォルトでは、すべてのデバックーオプ、ンョンが許可されていることを注意する必要がある。 222~

218.

3 . Development&Techniques Webアプリケーションはその性質上、クライアント/サーバと比較するとレスポンスや、クライアン ト Webブラウザの種類など、いろいろな面で考慮しなくてはいけない。この章では、 S A S / l n t r n e t ソフトウェアを利用した Webアプリケーション開発における注意点や、効率の良い開発方法を紹介 する。 3 . 1 Webブラウザの相違(自動マクロ変数 lHTUA]の利用) 現在一般的に使用されている Webブラウザは数種類ある。クライアントアプリケーションに Web ブラウザを使用する Webアプリケーションを作成する際は、これらクライアントの Webブラウザのパ ージョンを考慮して作成する必要がある。 以下に、代表的な Webブ ラウザで、あるネットスケーフ。ナビゲータ(以下 NN)とインタネットエクスフ。 E )の相違点とそれに伴う問題点を例に挙げる。 ローラ(以下 I 【 2バイト文字コードの受け渡し】 SASl IntrNetソフトウェアの場合、 Webサーバとアフ。リケーションサーバの情報伝達を行なう CGI(アフ。リケーションデ、イスパッチャ)で‑は文字コート、の変換を行わない。従って 2バイト文字コ ード(主に漢字コード)を Webブラウザと Webサーバの問で、送受信する場合、基本的に送信側で 送った文字コード で、受信側が受け取ることとなる。しかし 2バイト文字コードの受け渡しは、 Web ブラウザの種類の違いによって異なる場合がある。 その例として以下のようなシステム構成を考えてみる。 ア プ リ ケ ー シ ョ ン サ ー バ {EUCコ ー ド ) 雪 国 易 島 クライアント 1 クライアント 2 I E 3 . 0 2使 用 (SJI Sコ ー ド ) N N 3 . 0 2使 用 (SJI Sコ ー ド ) まずクライアント 1、2からサーバへの 2バイト文字の送信を考える。この場合、サーバで、受け取 る文字のコード、はクライアン卜 1、2の場合とも S JISとなる c 従って、この場合の 2つのクライアント による相違は起こらないこととなる。 次にサーバよりクライアント 1、2への 2バイト文字の送信を考える o 2バイト文字は HTMLの FORMデータとして送信する。(以下を参照) ‑223‑

219.

{ 7 i l : く forma c t i o nプ / c g i ‑ b i n l b r o k e r . e x e " > く i n p u tt y p e = " h i d d e n "nameプ v a r 1 "v a l u e = " 2バイト文字"> く i n p u ttype= ubmit"v a l u eプ送信"> く 、 form> ここでクライアント 1、2を比較してみると、受け取った文字コード が異なっている。クライアント 1 では、 EUCで、受け取った文字コード、は EUCのままクライアントにキャッシュされ、ブラウザ上に 表示されるが、クライアント 2では、 EUCで、受け取った文字コードを一度 SJISに変換してからキ I E 4 . x以降では、クライアント側での SJISへの文字 ャッシュされ、ブラウザ上に表示される。(注 : コード、の変換はされない。) 【サポート対象のタグ】 NNとI Eは基本的には HTMLで規定されたタグをサポートしているが、独自のタグが使用で きるなど使用できるタグ、及びタグの仕様に若干の相違点がある。 Webブラウザの種類により、 処理が行われない、または行われた場合でもその結果を正しく表示されない可能性がある。 これらの問題を回避するためには、 Webブラウザの種類を限定することもできるが、それでは Webアプリケーションのメリットの 1 つで、ある『クライアントのアプリケーションを限定しない。 (Web ブラウザがあればよい uが損なわれてしまうことになる。仮に Webブラウザの種類を限定したとし ても、それ以外の Webブラウザを使用した場合に、エラーもしくは警告を表示するようにする必 要がある。そのためには Webブラウザの種類によって処理を分ける必要が出てくる。 一般に Webブラウザの種類の切り分けをする場合、 J a v a S c r i p tを使用することが多いが、こ の場合でも、 Webブ ラウザによってはサポートしている J a v a S c r i p tのバージョンの違いがあるた め、正しく Webブラウザの種類を取得することはできない可能性がある。 SASl In trNetソフトウェアで、は、 W HTUA~としづマクロ変数 (SCL の場合、リスト項目)に Web ブラウザの種類、パージョンが格納され、アプリケーションサーバ上の処理中に参照することがで きる。 (~_HTUA~の値とそれに対応する Web ブラウザの種類、パージョンは以下の表を参照の こと。) 3 . 2 汎用性の向上(自動マクロ変数 lSRVNAME、 URL]の利用) Webアプリケーションに限らず、アプリケーションを作成する上でf汎用性を如何に高めるか」が 考慮する点の 1つとなる。 Webアプリケーションの場合、少なくとも以下の項目について考慮しなく てはならない。 ( 1 ) Webサーバの名前(ドメイン・サーバ名) ( 2 ) 実行する CGIプログラムの保存場所 (URL) ‑224

220.

アプリケーションを作成後の Webサーバの変更や、 CGIプログ ラムの保存場所の変更があった こ、プロク、、ラムを変更することなく、上記の項目を変更、または変更無しでいいようにすること 場合 l がより汎用性を高めることとなる。 SAS/lntrNet ソフトウェアで、は、これらの項目を W_SRVNAME~ と、 LURUとしづマクロ変数 (SCLの場合、リスト項目)を利用することで解決できる。 W_SRVNAME~ には Web サーバのド、メイン・サーバ名が、 W_URU には CGI プログラムの保存 場所が格納される。 h t t p : / / w w w . s a s . c o m / c g i‑b i n l b r o k e r . e x e ?̲program=APPL .WEBAPPL .MENU. 例えば W SCL&_service=default&_debug=O~ の場合、 W SRVNAME~ には Whttp://www.sas.com~ 、 LURL~ にはW/cgi-binlbroker.exe~ が格納されることとなる。 3 . 3 Webフ、ラウザ上への SAS/AFグラフオブジェクトの表示 SAS/lntrNet ソフトウェア上でグラフを表示するアプリケーションを作成する場合、 SAS/GRAPHソフトウェアでフ。ロシジャを使用してグラフを出力する以外に、 SAS/AFソフトウェア にあるグラフオブ、ジェク卜を利用することが可能である。 女吉祥寺サンロード后 渋谷遵玄坂庖 新宿アルヲ庖 赤 I&TB S前厄 池袋サノシャイン后 東京ドーム庖 男吉祥寺サノロード庖福孟孟面 渋谷道玄坂后 r 新宿アルヲ庖 赤坂 T B S前庖 池袋サンンャイン庖』園町一一一一一=:lI F 一一一一一一一一一一 東京ドーム庖 ~O l .ハイク n o α ) ( ) 判 0 ,0 00 ~60α)() ノ 、 ンJ i一万一完よ額 .自転車 交 問 園自動車 口電車 .徒歩 SAS/GRAPHソフトウェアのプロシジャは木目細かい設定をすることができるが、 SAS/AFソフト ウェアのグラフオブ、ジェク卜は簡単な設定で、 3Dグラフ等を描くことができるようになる。 利用方法はまず SAS/AFソフトウェアで FRAMEエントリを作成し、ク。ラフオブFジェク卜を貼り付け る。そしてグラフを表示するプログラム(設定)をした後、以下のプログラムでグラフをクライアントへ 出力する。 2 2 5

221.

( 7 IJ:FRAMEにあるグラフオブジェクトが WR~の場合 /抗女イメージモデ、ルクラスをロード.する H 女 / IMGDATID=i n s t a n c e( loadclass('SASHELP.FSP . IMGDA T .C L A S S ' ) ) ; /抗女グ ラフオブジェクトのスナップ。ショッ卜をイメージモデ/レクラスに取り込む対安/ c a l ln o t i か( ' G R ','̲SNAPSHOT̲',IMGDATID,r c,' u n b o u n d e d ' ) ; /抗女取り込んだイメージを 2 56色に減色する (GIF形式)対安/ c a l lsend( IMGDATID,'̲QUANTIZE̲',2 5 6 ) ; /**女イメージを SASカタログエントリに退避する対安/ c a l lsend(IMGDATID, 二WRITE̲CATALOG̲', 'WOR K .GR .G R ' ) ; c a l lsend(IMGDATID,' ̲ T E R M ̲ ' ) ; / 対 安 GIFファイルをヘッダを GRPHOUTへ出力する H 女 / FID =fopen('̲GRPHOUT',' 0 ' ) ; r c =f p u t ( F I D,' C o n t e n t ‑ t y p e :i m a g e / g i f ) ; r c =f w r i t e ( F I D ) ; r c =f w r i t e ( F I D ) ; r c =f c l o s e ( F I D ) ; /対安イメージ関数を使用して、イメージデータを GRPHOUTへ出力する抗女/ TID i m g i n i t ( O,'NODISPLAY'); PATH lnamemk(5,'WOR K .GR.GR',' f o r m a t = c a t ' ) ; r c =imgop(TID,'READ',PATH); 二 二 f o r m a t = g i f ) ; FILE lnamemk(3,'̲GRPHOUT',' r c =imgop(TID,'WRITE',F I L E ) ; 二 ifTIDne0thenr c=i m g t e r m ( T I D ) ; ρhv nL nL

222.

3 .4 レスポンスの向上 【 f p u t関数と submitステートメントの相違による方法】 SASl IntrNetソフトウェアで SCLを使用して Webアプリケーションを作成する場合、クライア ン卜への出力方法として以下の 2つの方法がある。 ( 1 ) submitステートメントを使用する方法 s u b m i t ; く HTML> く瓜TML> endsubmit; r c二 p r e v i e w (宣1 e ',' ̲WEBOUT'); r c = p r e v i e w ( ' c l e a r ' ) ; ( 2 )f p u t関数を使用する方法 FID=fopen( 二WEBOUT'' ,o ' ) ; FID, く ,HTML>'); r c = f p u t( FID, ' く/ HTML>'); r c = f p u t( r c = f w r i t e ( F I D ) ; 上記の 2つの方法は、結果として同じ HTMLコンテンツを生成することがで、きるが、レスポン スとしづ面で言うと後者の方が優れている。 SCLエントリを使って HTMLコンテンツを出力する 場合、後者の方法で出力するほうがよりレスポンスを向上することができるであろう。 【ユーザーの体感速度】 ユーザは処理をリクエス卜(実際には『実行』等のボタンを押す)してから、処理結果などのペー ジが表示され始めるまでの時聞が長ければ、処理時聞が長いと感じることが多い。しかし処理結 果のすべてが表示されなくとも何らかの表示がなされたなら、何も表示されていない場合に比べ、 ユーザの体感レスポンスは早くなる。 体感速度を向上させるためには、アプリケーションサーバで処理を行なう前にヘッダーやタイ トルを出力してから処理を始めることで、クライアントにはヘッダーやタイトノレが表示されるように なる。 但し、これはあくまでイ本感速度の向上であって、実際の処理時間の短縮になるのではない。 ワ t qL qL

223.

【 J a v a S c r i p tの利用による向上】 アプリケーションを作成する際に、問題となることの 1っとしてエラーチェック処理がある。特に 不特定多数のユーザを対象するアプリケーションの場合なおさらで、ある。ユーザがとりうるすべて のオペレーションを想定しそのオペレーションに応じた処理しなくてはいけない。 Webアプリケーションで、実行後何秒か経って『エラー』とし、うことがしばしばあるがこれではユ ーザ、にとって良いシステムとは到底言えない。またこのように、ユーザが求める結果出力まで、何 度かエラーとなるようで、は全体的なレスホ。ンス(ユーザが結果を得るまでの時間)も悪くなる。 そこでユーザが Webブラウザ上で設定する値は、 J a v a S c r i pを使用してクライアント側でチェ ックしておくことにより、サーバで実行した結果は正しい結果を得ることができるので、結果的に は全体のレスポンスを向上することができる。 228

224.

日本 S A Sユーザー会 (SUG I‑J) 外部 DLLルーチン呼び出しについて 鈴木一彦 ソリューション本部カストマーソリユーション部 キャパシティプランニングセンター 株式会社 SASインスティチユートジャパン Howt oc a l lt h ee x t e r n a lDLLr o u t i n e . K a z u h i k oS u z u k i B u s i n e s sDevelopment& S o l u t i o n sD i v i s i o n SASI n s t i t u t eJapanL td . 要旨 過去に数回 SASシステムから外部 DLLルーチンを呼び出す方法について紹介さ れた事がありますが、最近弊社への問い合わせが多いことから使用例を含め Windows版 SASシステムから MODULE関数を用いて外部 DLLルーチンを呼び出す方法について説明 いたします。 キーワード: SASWINDOWSDLLCALLMODULEFUNCTION , .はじめに 0 オベレーティングシステムの DLL Windows環境における DLL(DynamicLi n k . L i b r a r y )は、プログラム実行時に動的にリンク されるライブラリを意味します。このライブラ リは、サブルーチンや関数などのプログラムの 集合体で、プログラム実行時にメモリー上にロ ードされます。 SASシステムは、この DLLファイノレを動的に リンクし、サブルーチンへ制御を渡すための MODULE関数がリリース 6.10以降から標準 提供されています。 本論文では、 MODULE関数の説明および使 用例を紹介します。 MODULE 関数により呼び出し可能な DLL は右記の通りです。 ‑229 (Windowsシステムの中核 KRNL386.EXE, KRNL286.EXE, KERNEL32.DLL, USER.EXE, USER32.DLL, GDI .EXE, GDI32.DLLなど) 0独自に作成した DLL 0各メーカー提供の DLL SASシステムから DLLを使用することで、 WindowsAPIを利用することができます。 これにより、アプリケーション構築を行う際に SAS システムで実現できないことも可能とな ります。

225.

但し、 DLL を呼び出すため必要な属性テーブ ル等を定義する際には、 C言語などの言語間イ ンターフェースの知識が必要になります。ま た、 Windows API に 関 し て 記 述 さ れ た SDK(Software DevelopmentKit ) 等のドキュ メント類も必要です。 構文 2 .D L Lコールの仕組について n 四 = M O D U L E N (くc n t l >,m o d u l e,a r g 一1 , a r g ‑ 2,.• . a r g ‑ n ) ; ・戻り値がない場合 C A L L M O D U L Eく (c n t l >,m o d u l e,a r g ‑ 1, a r g ‑ 2,.. . a r g ‑ n ) ; ‑戻り値が数値の場合 A Sシステムにおいて、 S A Sプログラム中 Wmdows版 S LLを呼出す場合には、 MODULE関数を用 から外部 D A Sシステムと、呼出す外部 DLL聞との います。また、 S 数属性の定義等は、ファイル参照名 S ASCBTBLで ヲl 割り当てられたファイノレから情報を入手し、ヲ[数の引き 渡しが行われます。 この仕組を図で示すと以下の通りになります。 ・戻り値が文字値の場合 c h a r 二 M O D U L E C (くc n t l >,m o d u l e,a r g ‑ 1, a r g ‑ 2,. . . a r g ‑ n ) ; 差担 c n t l S A Sシステム側のコーデ、イング、 回 e 田 町 S A S C B T B L 属性テープルファイグ; D~; I I R c =皿 o d u l e n ( ' Get Driv e T y p e A ' SASCBTBL属'性 定義テーブル m l n a r g ニ.. m a x a r g = . . . アスタリスク(*)で始まる文字列を指定しま す。アスタリスクの後に続ける文字列には以下 の文字が指定できます。引数 c n t lは省略可能 です。 r M O D U L E x y関数の引数や D L L内の関数に 数の内容を 1 6進数で表示し 渡されたヲ l ます。 このオプションは、不適切な引数や属性 テープ、ルを記述した際の問題発見のた めに用います。 E 詳細なエラーメッセージを表示します。 S x M O D U L E x y関数の複数の引数を D L L内の 関数で一つの構造体のメンバとしたい 場合に、その引数をグループ化するた めの区切り文字として、 xを用いるこ とを指定します。 KERNEL32.DLL UNITGetD r i H UNπ 関数 A m o d u l e UNIT関数 B… 四 η 関数・・・…...・ M O D U L E x yの構文や、属性テーブル等に 関しての簡単な説明を表示します。 H ・‑一……… │ 3 . MODULEx 巧y関数 この関数は、 S A Sプログラム中から外部 D L L内 の関数を呼び出す際に使用します。 呼び出す D L Lファイル名とその中の関数名を指定 します。 例 え ば 、 , 阻R 悶N E 乱L 3 幻2 ,白 G e t 印P r o f 日i l e S 仇t r 吋l n ば と 指定した場合には、 K E R N E L 3 2 . D L L ファイノレ中 のG e t P r o f i l e S t r i n g関数を呼び出します。 D L Lファイル名には大文字小文字の区別があり ませんが、関数名には大文字小文字の区別があ ‑ 2 3 0 ‑

226.

りますのでご注意下さい。また、 SASCBTBL 属 性ファイル中で、 ROUTINE ステートメントの MODULEオプションを記述した場合には、 DLLフ ァイル名の指定は省略可能です。 arg‑l,arg‑2, ...arg‑n 呼び出す関数に渡される引数を記述します。 CALLSEQ=BYVALUE IBYADDR DLL内の関数についての情報(引数や戻り値 の型など)を記述するテキストファイルで、す。 関数に引数を渡す時に、値による呼び出し (call‑by‑valu e )で引き渡すか、アドレスによ る呼び出し (call‑by‑address)で引き渡すかを 指定します。 BYVALUE二値による呼び出し (call‑by‑value)で 引き渡します。 BYADDR= ア ド レ ス に よ る 呼 び 出 し (call‑by‑address)で引き渡します。 構文 STACKORDERニR2L IL2R R O U T I N En a m e M I N A R G ‑ I l li n a r g M A X A R G ‑ I l la x a r g くC A L L S E Q = B Y V A L 四 IB Y A D D R > くS T A C K O R D E R = R 2 L IL 2 R > くS T A C K P O P = C A L L E R IC A L L E D > くA R C HB IT l6 IB I T 3 2 > 削 S P O S E = Y E S IN O > < T < M O D U L E = D L L ‑ n a r n e > く阻T U R N S = S H O R T IU S H O R T IL O N G IU L O N GI くn > > D O U B L E ID B L P T RI C H A R 曳E G S = D X A X > < R E T U R J I 関数の引数をスタックに格納する順番を指 定します。 4 .SASCBTBL属性テーブル R2L ニ一番右側の引数から左側へ向かつて順に スタックに格納します。 L2R=一番左側の引数から右側へ向かつて順に スタックに格納します。 二 STACKPOP=CALLER ICALLED 呼び出された関数から戻る際に、関数を呼び 出した倶J !と呼び出された関数のどちらがスタ ックポインタを更新するかを指定します。 詳細 ROUTINE name CALLER=関数を呼び出した側がスタックポイン タを更新します。 呼び出す DLLファイル中の関数名を記述 します。 CALLED=呼び出された関数がスタックポインタ を更新します。 MINARG=minarg ARCH=BIT16 IBIT32 呼び出す DLL ファイル中の関数に渡される 引数の数の最小値を記述します。 ほとんどの場合、この値は次の maxargの値を 同じとなりますが、関数の引数の数が可変個 の場合には、 maxargと異なる値となります。 DLLの構造(16ピットか 3 2 ピットか)を指定 します。 MAXARG=maxarg TRANSPOSE=YES INO 呼び出す DLL ファイル中の関数に渡される 引数の数の最大値を記述します。 DLLを呼び出す前に行列を転置するかどうかを 指定します。 別Tl6=16ピット構造です。 BIT32=32ピット構造です。 ‑231‑

227.

引数の番号を指定します。 こ の オ プ シ ョ ン は 、 IML プ ロ シ ジ ャ か ら MODULEIや MODULEC,MODULENを用いる場合に のみ有効です。 NUM ICHAR 引数を数値 ( N U M )として扱うか文字 値( C H A R )として扱うかを指定します。 MODULE=DLL‑name INPUT IOUTPUT I 凹 DATE 引数に指定した値(または変数)と DLL内の関数との間での値の受け渡し 方法を指定します。 呼び出す DLL(DynamicLinkLibrary)を指定し ます。 阻T URNS=SHORT IUSHORT ILONG IULONG I DOUBLE IDBLPTR I INPUT 引数に指定された値を DLL内の 関数に渡します。 CHARくn > 関数の戻り値の型を指定します。 OUTPUT引数に指定された変数に DLL内 の関数が値を格納します。 UPDATE 指定できる戻り値の型は次の通りです。 SHORT USHORT LONG ULONG DOUBLE DBLPTR CHARn 符号付き SHORT型整数 符号なし SHORT型整数 符号付き LONG型整数 符号なし LONG型整数 倍精度浮動小数 倍精度浮動小数への ポインタ nバイトの文字列へのポイ ンタ 引数に指定された変数の持つ値を DLL内の 関数に渡し、なおかつ DLL内の関数で、その 変数の値が更新されます。 OUTPUTまたは、 UPDATEを用いる場合には、 引数は変数でなければなりません。 NOTREQD IREQUIRED 引数に必ず値を指定する必要があるか、そう でなし、かを指定します。 RETURNREGS=DXAX このオプションを指定すると、 LONG型 整数を戻り値とする場合に、戻り値をレジスタ DX:AXにセットします。 このオプションは 1 6ピット構造の DLLでのみ 指定できます。 ROUTINEステートメントの後には、 ARGステー トメントを記述します。 NOTREQD 必ず、しも引数を指定する必要はありません。 REQUIRED 必ず引数を指定する必要があります。 BYADDR IBYVALUE 関数に引数を渡す時に、値による呼び出し (call‑by‑valu e )で引き渡すか、アドレスによ る呼び出し (cal1‑by‑address)で引き渡すかを 指定します。 構文 ARG argnum NUM ICHAR くI NPUT IOUTPUT IUPDATE> くN OTREQD IREQUIRED> BYVALUE> <BYADDR I くF DSTAR T> くFOR ¥ 1 A T=format> FDSTART 引数が構造体の先頭のメンバであることを 示します。 FORMAT=format 引数の型を SAS フォーマット形式で指定し ます。 詳細 ARGargnum qd ヮ ヮ

228.

5 . 使用例 5 . 2FindWindowAルーチン 5 . 1GetDriveTypeA ルーチン 説明 説明 ディスクドライブが交換可能 ( F D ドライブ) か、固定(田ドライブ)か、 CD‑ROM ドライブ か 、 RAMディスクか、またはネットワークドラ イブであるかどうかを調べます。 指定されたクラス名とウインドウ名に一致す るウインドウのハンドルを取得します。 構文 r c 二 r n o d u l e n CF i n d W i n d o w A ', c l a s s,w i n d o w ) ; 〈ヲ!数〉 次のどちらか一方の引数を指定する だけで十分です。 構文 r c r n o d u l e n C G e t D r i v e T y p e A ', d r i v e p a t h ) ; 三 〈 ヲl 数〉 drivepath (タイプ:C ) 調べるドライブのルートディレク トリを指定します。 c l a s s (タイプ : C ) クラス名を指定します。 クラス名とはアプリケーションを識別 するため各アプリケーションが所有す る名前のこと。 〈戻り値〉 ドライブの種類を指定する値を返します。 次のいずれかになります。 意味 値 。=ドライブの種類が判断できない 1=ドライブが存在しない 2=ドライブからディスクを抜く ことができる ( F D D ) 3二ドライブ、からディスクを抜く ことができない(田D ) 4三リモート(ネットワーク)ドラ イブ 5= C D ‑ R O M ドライブ 6三臥Mディスク W i n d o w (タイプ : C ) ウインドウ名 (ウインドウのタイトル)を指定します。 〈戻り値〉 関数が正常に終了した場合は、指定された クラス名とウインドウ名を持つワイン ドウのハンドルを返します。それ以外の 場合は、 0を返します。 DATAステップの記述 f i l e n a r n eS A S C B T B L '属性テーブル d a t a n u l l C l a s s=' S A Sa w s ' ; 1 *SASシステムのクラス名 * 1 h w n d= r n o d u l e n C F i n d W i n d o w A ',C l a s s, ) ; p u th w n d 二 ; run, DATAステップの記述 f i l e n a r n es a s c b t b l '属性テーブル d a t a n u l l 1 *C ドライブの種類を調べます * 1 r c r n o d u l e n C G e t D r i v e T y p e A ', ' C : , 干 ); p u tr c二 ; r u n, 5 . 3MessageBoxAルーチン 二 説明 アイコンとプッシュボタンが含まれるメッセ ージボックスを表示します。 実行例 ハードディスクドライブです N O T E :D A T As t a t e m e n tは 0 . 4 4秒を使用しました. n ぺu nノ q u

229.

メッセージボックス内に表示されます。 構文 く戻り値〉 r c = modulenCMessageBoxA',hwnd,msg, title, styl e ); く引数〉 hwnd (タイプ : N ) オーナーウインドウのハンドル msg (タイプ : C ) メッセージボックス内に表示 する文字列 t itle (タイプ : C ) メッセージボックスのタイト ルに表示する文字列 styl e (タイプ : N ) メッセージボックスのスタイル 次¢様なスタイルのメッセージボックスが表示で O K ]ボタンが選択されました。 1=[ 2ニ[キャンセノレ]ボタンが選択されました。 3= [失敗]ボタンが選択されました。 4= [再試行]ボタンが選択されました。 5= [無視]ボタンが選択されました。 6= [はし、]ボタンが選択されました。 7=[いいえ]ボタンが選択されました。 DATAス テ ッ プ の 記 述 きます。 filename SASCBTBL '属性テーブル, 1 ) ボタン Oニメッセージボックスには、 [ O K Jプッシュボ タンが含まれます。 1=メッセージボックスには、 [ O K Jプッシュボ タンと[キャンセル]プッシュボタンが含ま れます。 2=メッセージボックスには、[失敗]、[再試行] [無視]の 3つのプッシュボタンが含まれ ます。 3ニメッセージボックスには、[はい]、[し、いえ] [キャンセル]の 3つのプッシュボタンが含 まれます。 4=メッセージボックスには、[はい]と [いいえ]の 2つのプッシュボタンが含まれ ます。 data null hwnd = modulenCFindWindowA','SAS a w s ',) ; title = 'SASシステムのメッセージボックス'; msgニ'ボタンを選択してください。' style = 2 + 100x + 1 0 x ; r c = modulenCMessageBoxA',hwnd,msg,title, styl e ); put rc=; r u n, 実行例 ハ, '圃鵬 一 欝襲襲 5ニメッセージボックスには、[再試行]プッシュ ボタンと[キャンセル]プッシュボタンが含 まれます。 5 . 4GetDiskFreeSpaceA OOOx =最初のボタンがデフォルトになります。 1 0 0 x = 2番目のボタンがデフォルトになります。 200x 二 3番目のボタンがデフォルトになります。 説明 指定されたディスクに関する情報(空き容量 など)を取得します。 2 )アイコン 構文 rc=modulen('GetDiskFreeSpaceA', drivepath, s e c, byte,empcl,a l l c l ) ; 1 0 x= f S T O P J アイコンがメッセージボックスに 表示されます。 20x =疑問符のアイコンがメッセージボックス内 に表示されます。 30x ニ感嘆符アイコンがメッセージボックスに表 示されます。 4 0 x =円の中に小文字の f i J があるアイコンが 〈号│数〉 d r 甘 e path(タイプ : C ) 調べるドライブのルートデ ィレクトリを指定します。 234‑

230.

6 .SASCBTBL属性テーフル定義例 Sec(タイプ : N ) クラスタ当たりのセクタ数が格納されます 3 使用例で紹介しました阻町EL32の各ルーチン定義 情報を以下に示します。ファイノレ参照名 SASCBTBL で割り当てるテキストファイル中へ保存すること により、各関数呼出しが可能になります。 B y t e (タイプ : N ) セクタ当たりのバイト数が格納されます。 Empcl(タイプ:N) 空きクラスタ数が格納されます。 A ll c l (タイプ :N) * テンポラリパス名を取得します routin巴 G巴tT巴mpPath A minarg 2 クラスタ総数が格納されます。 〈戻り値〉 ; 三 関数が正常に終了した場合は、非ゼロを返しま す。それ以外の場合は、ゼロ ( 0 )を返します。 maxarg=2 stackpop=called o n g ; returns l 二 DATAス テ ッ プ の 記 述 arg 1 input byvalue format=pib4.; format $cstr200; arg 2 updat巴 二 filenameSASCBTBL' 属a性ファイノレ data̲ n u l l ̲ ; ' C : Y ', r c=modulen('GetDiskFr巴巴 SpaceA', *一一ディスクドライブの種類を調べます一一; routine GetDriv巴Typ巴A minarg=l maxarg=l stackpop=called modul巴=KERNEL32 l o n g ; r巴turns u arg 1 input byaddr format=$cstr200; s e c, byte, empcl, a l l c l ) ; 1s e c ; put'クラスタ当たりのセクタ数 = put'セクタ当たりのバイト数 put'空きクラスタ数 put'クラスタ総数 = 'b y t e ; = 'empcl; ゴ a l l c l ; 二 put' ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ 一 一 一 一 一 一 一̲ ̲ 1 . s e c* byte, comma13.); a l l b y t e=p u t ( a l l c l* s e c* byte,comma13.); empbyte=put(empcl* = 'a l l b y t e put'デ、イスク総容量 'ノ〈イト put'ディスク空き容量 *一一ディスクの空き容量などを調べます ; routine G巴tDiskFreeSpaceA minarg=5 maxarg5 stackpop=called module=KERNEL32 r巴turns=ulong; arg 1 char input byaddr format $ c s t r 2 0 0 .; i b 4 .; arg 2 update byaddr format p arg 3 updat巴 byaddr format=pib4.; arg4 update byaddr format=pib4.; arg 5 update byaddr format=pib4.; = 'empbyte 二 'バイト r u n ; 実行例 二 二 N O T E : 変数 SEC は初期設定されていません. N O T E : 変数 BYTE は初期設定されていません. N O T E : 変 数 日 PCL は初期設定されていません. N O T E : 変数 ALLCL は初期設定されていません. * クラス名とウインドウ名と一致するウインド ウのハンドルを取得します一一; クラスタ当たりのセクタ数 =64 セクタ当たりのバイト数 =512 空きクラスタ数 二1 4509 クラスタ総数 =65510 二2 ,1 46,6 3 1,680 1 ¥イト ディスク総容量 ディスク空き容量 =475,430,912 バイト N O T E : DATAstatementは 0.42秒を使用しました. routine FindWindowA minarg=2 maxarg=2 stackpop call巴d 二 modul巴=USER32 r巴turns=long; arg 1char input byaddr qu ぺU n つム

231.

notreqd f o r m a t = $ c s t r 2 0 0 .; a r g2char i n p u tbyaddr notreqd f o r m a t = $ c s t r 2 0 0 .; *一一メッセージボックスを表示します一一; r o u t i n eMessageBoxA minarg4 maxarg=4 stackpop=called module=USER32 r e t u r n s = u l o n g ; a r g 1num i n p u tbyvalue f o r m a t = p i b 4 .; a r g 2c h a ri n p u t byaddr f o r m a t = $ c s t r 2 0 0 .; a r g 3c h a ri n p u t byaddr f o r m a t = $ c s t r 2 0 0 .; a r g4num i n p u tbyvalue f o r m a t = p i b 4 .; 二 7 . おわりに この外部 DLL 呼出し方法を紹介したこと で、これまで SASプログラミングにおいて不可 能と思われた処理の実現性あるいは、業務サブ ルーチンとの連携によりシステム構築におけ る融通性が少しでも増したら幸いです。 今後、 SASシステムは次期リリース予定のパ ージョン 8 において大規模な機能拡張が行わ れます。この部分に関しても是非期待していた だきたいと思います。 8 .参考文献 TSReport 575(英文) P r e l i m i n a r ydocumentationf o rCALLModule 第 2回 SASProgrammer'sworkshop資料 Windows版 SASシステム使用の手引き ‑236

232.

日本 S A Sユーザー会 (SUG I‑J) サ‑/¥‑データの有効活用 ‑ w汎用 RDBMS検索ツール』の紹介‑ 前田幸一 株 式 会 社 SASインスティチユートジャパン プロフエツショナルサーピ、ス本部コンサルティング部 I n t r o d u c t i o nt oQUERYt o o lf o rRDBMSd a t a K o i c h iMaeda C o n s u l t i n gD e p a r t m e n t .P r o f e s s i o n a lS e r v i c eD i v i s i o n SASI n s t i t u t eJapanL t d . 要旨 サーバマシンのデータウェアハウスに蓄えられた大量のデータ。これらのデータを有効に活用する (E x t r a c t,Transform,L o a d )ツーノレとして ための EUC(EndUserComputing)ツーノレ、また簡易な ETL の機能を提供する『汎用 RDBMS検索ツーノレ』について紹介する。 キ ー ワ ー ド : ETL.EUC.RDBMS.データウェアハウス,データマート.SQL.G U I .TOOL 1 . はじめに 意思決定支援、企業戦略策定の情報基地ともいえるデータウェアハウス、データマート。これらの言 葉が定着した昨今、今度はいかに短期間に構築できるか、というところにユーザニーズが高まってき ている。 このような中で、新しい I T ( I n f o r m a t i o nT e c h n o l o g y )として注目を集めているのが IETLツーノレ」であ る 。 IETLJとは E x t r a c t :抽出、 T r a n s f o r m :変換・加工、 Load:ローディング、の頭文字をつなげたもの とされている。すなわち、基幹系システムやその他データソースからデータを抽出し、加工・変換し、 デ、ータウェアハウスやデータマート(データマートの場合は、抽出元はデ、ータウェアハウスとなる場合 がある)にローデイングする機能を指す。 SASインスティチュート社の製品としては、 SAS/WarehouseA d m i n i s t r a t o rソフトウェアが IETLツー ノレ」として位置づけられよう。同ソフトウェアでは、メタデータと呼ばれるデータウェアハウス、データマ ートに格納されるデータの素性を明らかにする情報群を基盤におき、データの抽出→変換・加工→ロ ーデイング、のステップを G U I ( G r a p h i c a lUser I n t e r f a c e )で、操作・管理で、きる機能を提供している。つま ‑237‑

233.

り、これまで、のデータウェアハウス、データマート構築において、最も時聞がかかっていた上述のステ ップを自動生成・処理させることで、作業時間の大幅短縮が可能となり、先に述べたようなユーザニー ズに対応することができる。また、管理面で、の生産性向上も狙ったもので、あるといえる。 ただ、このような大がかりな仕組みではなく、実際のデータ分析者や、部門のデータ管理者が、気軽 に取り扱うことのできるツールに対するニーズも存在しているのではないだろうか。 SASシステムでは、基本機能である BaseSASソフトウェアで、提供される、 SQLQUERYウインドウと いう GUI操作で、サーバマシンに蓄積されたデータを取り扱うことがで、きるツールも用意されているが、 本論文で紹介する『汎用 RDBMS検索ツーノレ』は、 SQLQUERYウインド、ワの操作性や機能を向上さ せ、まさにビジネスユーザや、部門レベルのデータ管理者に向けた、簡易版 fETLツーノレ」として位 置付けられる製品である。 2 . ~汎用 RDBMS 検索ツール』の概要 『汎用 RDBMS検索ツール』は、 SASインスティチュートジャパンが提供する、 SASシステムをベース としたワークグ、ループレベルで、のデータ活用を推進するための日本独自で開発されたスイート製品 H i g hP e r f o n n a n c eD a t a M a r tf o rWorkG r o u p Jにおける、データマートビツレドアップインタフェ である f ース(デ、ータマート構築機能)としても提供される(~汎用 RDBMS 検索ツーノレ』単体で、の契約・利用も 可能)。 『汎用 RDBMS検索ツーノレ』は、 SASシステム本体にアドオンとして導入される、クライアント/サー バ環境の SASシステム上で、稼働するアプリケーションパッケージで、ある。サーバマシンのデ、ータウェ アハウス、データマートに蓄えられたデータベースデータ(現ノ〈ージョンで、は ORACLEデータベース のみに対応)、 SASデータを、クライアントマシンから抽出・加工するための統一された直感的なインタ フェースを提供する。これにより、エンドユーザは、特別なデータ操作についての知識を必要とするこ となく、分析やレポート作成に必要なデータを必要な形に変換し、さらに必要なときに入手することが できる。また、データ管理者は、部門単位の目的別データマート構築に際して、大容量明細データ の抽出・集計・加工作業の負荷を軽減することができる。 図 1 :システム構成イメージ 238一

234.

3 . ~汎用 RDBMS 検索ツール』の機能 本章では、『汎用 R DBMS検索ツーノレ』の持つ特徴的な機能や画面構成を紹介する。 3 . 1 ~汎用 RDBMS 検索ツー j レ』の特徴的機能 E 操作の容易さ 操作のほとんどをマウスによるクリックだけで、直感的に行うことがで、きるインタフェースを提供す る。画面は、タブの選択や、ボタンのクリックで切り替えることができ、必要に応じて、専用のサブ ウインドウが表示される。 iタブによる画面遷移、 盆 UI l え I .計官耳目抱也長停 一 時 一 1 クエリー表示 皿 , . , . " C ..,'"芯~"肝A..)..9Joj 1 01:祖・,,‑倉針金! 6 S 図2 :画面例l(テープ、/レ選択画面、項目選択画面、新規項目作成(値式編集)画面) E データソース選択の簡略化 特別な指定をすることなく、メニュー選択で、データが格納されている場所と種類を選ぶことがで、 きる。サーバマシン上のデータを選択した場合、ユーザ認証の後、自動的にサーバマシンや RDBMSに接続処理が行われる。 タンによるデータソース選択 図3 :画面例 2 ( メインメニュー画面) 2 3 9一

235.

圃 SASデータセット作成 検索結果を SASデータセットとして作成することがで、きる。この時、保存場所としてサーバマシ ンのライブラリ、クライアント PCのライブラリを選択することができ、保存場所としてサーパマシン を指定して実行したときには、検索・ SASデータセット作成処理がバッチ処理で、実行される。 圃バッチ処理による大量データの処理 処理の実行形式を即時実行(サーパマシンと接続したまま)と、パッチ実行(サーバマシンと切り 離し)のどちらかを選択することができる。パッチ実行で、検索処理を行った場合、データ検索を行 っている聞にクライアント PCでは SASシステムを使った他の処理や OAソフトの利用を行うこと ができる。また、クライアント PCを終了させることも可能である。 即時実行では抽出件数を 1 0 0 0件に制限することで、誤指定による大量データ検索といったシ ステムリソースの負荷や、検索結果転送時のネットワーク負荷を軽減している。 図4 :画面倒 3 ( パッチ実行指定画面、パッチ処理結果確認画面) 圃データ抽出レコード数の指定 デ、ータ抽出時におけるレコード 数を指定することがで、きる。そのため、大量のデータに対してテ スト的に少量のレコード数を指定して実行し、結果が希望のものとなるかどうかで、生成した問い合 わせ内容を確認することが可能である。 レコード、数を指定して抽出処理を分割し、レコード分割したデータを作成することで、表計算ソ フトなどの OAソフトへデータを引き渡す際のデータ制限に対応できる。 一一一一←【一一一一一一一.,ー←.‑ 図5 :画面倒 4 ( クエリー表示・実行画面) 240‑

236.
[beta]
•

ORACLE関数の使用
検索対象のデータが ORACLEデータの場合、業務ロジックなど、複雑な計算を伴う処理があら
かじめ登録されている ORACLE関数を利用することで、簡単に新規の計算結果項目を作成す
ることができる。この時、 ORACLE関数に引数として項目や固定値(対象日付など)を指定するだ
けで、目的の ORACLE関数が利用で、きるインタフェースを提供する。

温~.Il

J

'!F玄軍属

'
l s

j
さ

《

」

ーゴニj 函

J

;
←
一
一
一
一
]

、 P"哩型電~t,ι _,既ぬの唖H出η;::::-----~"" "._~,_"': .
.
:
晶
一
一
一
ー
ー
ー
」

つ
一
一
一
一 一一一←一

│誌諸謹'主e
J
7
三
三
L
ミ
j
土
J
冗
f
ふJ
f
ず叫
1
凡
叫
戸
1
凡
叫
凶
L
一
£
戸
且

B m

剛

白

i
控
空
『
十
一

J

れ…包

へ

v

今

)

ι
ぷ
J
手
乎
旦
E
記)
三
ご
互
早
コ
1
v

〆

4『盟主タ'.!!I:L~r町~~J.~・・.."ムャーー一一一-一戸ーー一明村一ー-今日一一一一一「守←ー

図6
:画面例 5(ORACLE関数指定画面)

•

I
F文による新規項目の作成
I
F文によって項目値の判断を行い、その結果で新規に作成する項目の値を設定することがで

きる。「利用金額による顧客のグループ分け」など、条件によるグ、ループ化項目の作成などに利
用することが可能である。

‑抽出条件の保存と再利用
データ抽出設定を保存しておくことにより、次回以降の実行を保存した設定情報を指定するだ
けで行うことができる。この時、必要に応じて抽出項目や、抽出条件式などを各画面から変更す
ることもできる。また、実行時に条件部分を指定する PROMPT機能をあわせて活用することで、
月ごとのデータ抽出処理とし、った定型業務を効率良く行うことがで、きるようになる。
クイック実行機能で、は、表示されるワィザード、画面に従って、対象となるデータソースと保存され
たデータ抽出設定を指定するだけで、更に簡単な手I
}
慣で検索処理を実行させることが可能であ
2
4
1
‑

237.

一 一 る 。 ~ i 醇京1' , 沼寝泊 1 I. . : 障を汚うこと もでき訂. 口五ーミ己 ii I [竺竺士 I 竺子三 図8 :画面倒 7 ( クイック実行ワィザード) 3. 2 ~況用 RDBMS 検索ツール』の画面構成 『汎用 RDBMS検索ツーノレ』は、検索機能・検索結果確認機能で提供される以下の 5つの基本画 面と、それぞ、れの画面のタブ によって切り替えられる 9つの画面(初期表示タブの画面を含む)、サブ ジョイン基準設定 Ji コンスタント値入力 J など)、およびクイッ ワインドワ ( iユーザ 10/ パスワード入力 Ji ク実行機能でのワィザード画面から構成される。 これらの機能は、 SASデ スクトップ環境で、提供される『汎用 RDBMS検索ツーノレ』起動画面から、そ れぞれのアイコンをダ、ブソレクリックすることで、起動することがで、きる。また SASシステム DMS画面のツ ールボ、タンに起動ボタンを登録したり、既存の SAS/AFソフトワェアで作成されたアプリケーションに 組み込むことも可能である。 • i メインメニュー J画面 検索対象となるデータソースを指定する。サーパマシン上のデ、ータソースを指定した場合、ユ ーザ認証を行うために、ユーザ 10/ パスワードを入力するサブ、ワインド、ワが表示される。 .i通常クエリー作成」画面 対象となるテープ、ノレ(データ)や項目、抽出条件などを選択、指定する。「テーブル選択 Ji 項目 抽出条件 Ji 並べ替えJi グループ化抽出条件 Ji クエリー表示」の 6つの画面遷移タブを 選択 Ji 持ち、通常クエリーの作成を行う。 .i新規項目作成」画面 集計関数や演算式、 I F文による場合分け、 ORACLE関数などを使用した、新規に追加する項 目の作成を行う。「値式編集 Ji I F文編集 JiORACLE関数」の 3つの画面遷移タブを持つ画面 2 4 2

238.

である。 • I F I R S T/LAST指定」画面 検索結果のデータに対してブレークキーを指定し、データを並べ替えて指定したブレークキー の最初のレコード、または最後のレコードだけを取り出すことができる。 売上月・支庖ごとの売上金集計データに対して、売上月で、最も売上金額の多かった/少なかっ た支庖を抽出したい場合などで利用できる。 置「検索結果確認」画面 ノ〈ッチ実行した検索結果の確認を行う。ここから、サーバマシン上に作成した SASデータセット の表示やクライアント PCへのダウンロードを行うことができる。 『汎用 RDBMS検索ツーノレ』で、の画面の構成(遷移)は、次のようになる。 l 通常クエリー作成 l d [新規項目作成I 団回 3 を │ i l 峨│ I F文 融 ORAC aE‑B a 一均'一‑均'一 一択二行一 一選二実一 一一一一一一 ︐ 一エ一一エ一 回目︐ 1 j 戸 図9 :画面構成 . 1章の画面例を参照していただきたい。 代表的な画面イメージについては、第 3 2 4 3

239.

4 . 必要なシステム環境 『汎用 RDBMS検索ツーノレ』は、 SAS、シンステムで るアプリケ一シヨンノ号ツケ一ジで、ある。この時、サーバとなるマシンに SASシステムと、 RDBMSが同居 してし活必要はない。 RDBMS ベンダが提供する接続ソフトウェアを使用することにより、 3 階層のクラ イアント/サーバシステムを構成することも可能で、ある。 サーバ環境、クライアント環境で、それぞれ必要となるシステム要件は以下の表を参照していただき たい。 4 . 1 ソフトウェア必要条件 サーバ一環境 シスァム環境 OS(*1 ) • HP‑UX • • • • SASシスァム クライアント環境 OS(*1 ) • Windows95 • WindowsNT SUN4/Solaris2 AIX Tru64UNIX WindowsNT ORACLE(SQL*Net)( * 1 .* 2 .* 3 ) リリース 6 . 1 2以降 • BaseSASソフトウェア • SAS/CONNECTソフトウェア • SAS/ ACCESSソフトウェア リリース 6 . 1 2以降 • BaseSASソフトウェア • SAS/CONNECTソフトウェア • SAS/GRAPHソフトウェア (推奨 :SAS/FSPソフトウェア) 表 1 :ソフトウェア必要条件 (*l)OSおよび RDBMSの対応パージョンは SASシステムに準拠 ( * 2 )現行の『汎用 RDBMS検索ツール V e r s i o nl .OJ l で 、 は 、 0九 久CLE社の RDBMSのみに対応 (*3)SQL*Netソフトウェアは、 SASシステムと O九 ベCLEDBMSが別のマシン上に導入されてい る場合に必要 ※上記の SAS システムプロダクトは必要最低限もので、あり、行いたい処理に応じてその他のプロ ダクトが必要 4 . 2 ハードウェア必要条件 『汎用 RDBMS検索ツーノレ』クライアント環境で、は、下記のシステム条件を満たしていることが必要と なる。また、サーバ環境でのハードウェア必要条件は、同マシン上で動作する SASシステム、および RDBMSに準拠する。 2 4 4

240.

ディスク容量 CD‑ROM 64MB以上 M B (汎用 RDBMS検索ツーjレV e r s i o n 1 . 0関連モジュールのみ) 約2 モニタ X G A ( 1, 0 2 4x7 6 8 )以上 マウス 必須 提供媒体の形式 メモリ容量 表 2:ハードウェア必要条件 i n d o w s版 S A Sシステムリリース 6 . 1 2に準拠 ※上記以外のハードウェア条件は、 W なお、『汎用 RDBMS検索ツーノレ』はサイトライセンス契約となっている。契約を取り交わした l社で の使用に限り、同アプリケーションパッケージが導入されるサーバマシン、クライアントマシン数に制限 S A Sシステムのライセンスは別途必要)。 は設けていない ( 5 . おわりに データ分析において、その 7~8 害IJ の時間は、分析するためのデータを集め、加工するところに費 やされるとしづ。この「データ抽出・加工」の時聞を短縮できれば、ユーザの本来の目的であるデータ 分析に注力できるであろう。また、データ分析を行った結果、別の切り口で、の集計値やデータウェア ハウスの別の項目、あるいは加工した項目が必要になる場合もあるだろう。そのような時に、自在にデ ータを収集で、きるツーノレ、データを操作で、きるツーノレが求められてくる。 データ管理者においても、絶え間なくエンド、ユーザから求められる分析用のデータ準備の手聞を、 ツーノレを使うことにより作業時聞を短縮させたり、エンドユーザが容易に操作で、きるツールをエンド、ユ ーザ自身に与えることで、パックログを軽減させることができるで、あろう。 本論文で紹介した『汎用 RDBMS検索ツール』が、多くのデータ分析者、データ管理者の作業負荷 を軽減し、本来の業務に注力できる一助となれば幸いである。 ※『汎用 RDBMS検索ツーノレ』についてのお問い合わせは、営業担当者、またはコンサルティング 部までお願いいたします。 ※『汎用 RDBMS検索ツーノレ』の著作権は、日本火災海上保険株式会社にあります。また、株式会 A Sインスティチュートジャパンは本ソフトウエアの独占的販売権を有します。 社S ‑ 2 4 5 ‑

241.

日本 S A Sユーザー会 (SUG I‑J) SPDS2.1のパフォーマンスとチューニング、 山本克巳 株式会社 SASインスティチュートジャパン ビジネスサポート部テクニ力ルサポートグループ SPDServer2.1: Tuning and performance K a t s u m i Yamamoto Technical Support Group Business Support Department SAS I n s t i t u t e Japan L td 要旨 SPDS(ScalablePerformanceDataS e r v e r )は 2GBを超える大容量のデータを、 SMP ( S y m m e t r i cP a r a l l e lP r o c e s s i n g ) の技術を用いて複数の CPUを並列に処理することによ り、データの高速処理を可能としている。また、従来の SAS とはデータの構造、ソー トの仕組み、インデ、ツクスの張り方などで全く新しい機能を備え、パフォーマンスを上 げる為には SPDSの仕様に準じたチューニングを行う必要がある。チューニングの方法 には様々なものがあるが、本論文ではインデックス、及びパーティション、スレッドに 焦点を合わせている。 キーワード: SPDS パフォーマンスチューニング、 1 . SDPSの機能概要 現在の SPDS2.1の機能としては、主に次のようなものがある。 (1) SAS SPDSエンジンにより、従来と同じ手順で LIBN 泊四(ライブラリ名)機 能を利用して、ユーザはより高速かつ安全な環境で作業が行える。 (2) SMP (SymmetricP a r a l l e lP r o c e s s i n g ) を利用することにより、並列処理を行 うことで、処理を高速に行える。 (3) 大容量ファイルの作成を可能にし, 2GBを超えたファイルをサポートする。 (4) ビットマップインデ、ツクス、並列クイックソートを利用してデータ処理を高速化 することが出来る。 (5) ACL(Access C o n t r o lL i s t )を利用して、きめ細かいデータアクセス権限を設定す 2 4 7一

242.

ることが可能である。 1 . 1 ネームサ‑/¥ーとデータサ‑/¥‑ SPDS は、ネームサーバーとデータサーバーの 2つの構成によって主に成り立ってい る 。 ネームサーバーとデータナーパーは次のように連携して機能している。 SPDS管理者によって、データをどのように格納するかという情報は、 LIBN 品1:E パ ラメータファイルに LIBNAME ドメイン名と物理パス(ディレクトリ)によって定義 される。データサーバーが起動すると、この情報はネームサーバーに登録される。そし て 、 LIBN 品1:E ステートメントによって SPDSが呼び出されると、クライアント側は ネームサーバーを呼び出し、物理パスへと接続が行われる。物理パスへの接続後、デー タサーバーはクライアントの検索などの処理をスレッドという処理単位に分割し、これ らの複数のスレッドを SMP の機能を持つサーバーのオペレーティングシステムと協調 して並列処理が行われる。 SPDS ネームサーバー LIBNAMEドメインを管理し、クライアントをテ eータサーハー に接続 LIBNAME ステートメントを イ吏って SPDSにアクセス SPDS環境 トーーー一 データサーバー クライアントの LIBNAME エンジンのために サービスを揮供 図 l ネームサーバーとデータサーバーの連携図 ‑ 2 4 8一

243.

1 . 2 SPDSテーブルの物理構成 SPDSは、そのテーブル情報を次の 5つのファイルによって構成される。 (1 ). d p f テーブルデータを格納する。実際のデータは、データサーバーパラメー タファイルに指定されたメガバイト単位のファイルに、分割されて格納 されている。 (2) .mdf メタデータ(列やデータに関するデ、イスクリプタ情報)を格納する。 (3) . i dx セグメント B ツリーインデ、ックスを格納する。 (4) . a u x グローバル Bツリーインデックスを格納する。 (5) . h b x ビットマップインデ、ックスを格納する。 1 . 3 SASシステムと SPDSとの接続 ユーザーがいつも使われている SASの上で、 SPDSのデータにアクセスするためには、 libnameの指定の際に、次の接続例のように指定することによって可能となる。 SASシステムと SPDSとの接続例) libname t e s ts a s s p d s' t m p 's e r v e r = s e r v e r N o d e . p o r t N u m b e r u s e r = ' a n o n y m o u s '; t e s t . . .任意のライブラリ参照名 s a s s p d s… SASSPDSエンジン tmp...LIBNAME ドメイン s e r v e r N o d e . ..ネームサーバーのノード名(ホスト名) portNumber.・ネームサーバーのポート番号 2 . チューニング、 i こ関係する SDPSのパラメータ パフォーマンスに関連する SPDSのパラメータは、次の 4つの方法によって指定する ことが出来る。パラメータによっては、 lつの方法だけしかないものや、複数の方法を 品目パラメータファイルとサーバーパラメータファイル 持つものもある。次の LIBN のパラメータのみ SPDSの起動時にサーバーで設定するパラメータであり、その他のパ ‑249

244.

ラメータはクライアント側で設定するものである。 2 .1 L lBNAMEパラメータファイルとサーバーパラメータファイルのパラメ ータ LIBN 泊四パラメータファイルとサーバーパラメータファイルの初期設定値は、資料 lに示した値が設定されている。 LIBN 品目パラメータファイルでは、データの格納先を LIBN 品目ドメインに対す る物理パスで指定するが、この際 lつのドメインに対して、複数の物理パスを指定する ことが可能である。 lつの 'tmp'ドメインに対して 4つの物理パスを指定する例) libname=tmpp a t h n a m e = / d i s k l l p e r u s e r ̲ t a b l e s ' / d i s k 3 / u s e r d a t a ' ソ d i s k 1 2 / u s e r d a t a ' ソ d i s k1 3 / u s e r d a t a ' ) i n d e x p a t h = ( ' / d i s k 4 / u s e r d a t a ' ' / d i s k 5 / u s e r d a t a ' / ' d i s k1 4 / u s e r d at a ' ソ d i s k 1 5 / u s e r d a t a γ ; roptions ニ"datapat~=('/disk2/userdata' pathnameニ…メタデータの格納先 roptions="'SASユーザーがプログラム中で指定したオプションを上書き指定 datapath=・・・テーフゃルデータの格納先 indexpath=…インテゃツクスの格納先 使用するデータの大きさと、ハードウェアの構成に合わせて物理パスの数のチューニ ングを行う。 データサーバーパラメータファイルでは、スレッドの最大数を指定する MAXWHTHREADS のパラメータがあり、この値をハードウェア構成に合わせてチュ ーニングを行う。 但し、データサーバーパラメータファイルは、 SPDS が起動されるときに読みこまれ るファイルであり、値を変更する場合には SPDSを再起動する必要がある。 2 .2 L lBNAMEオプションのパラメータ LIBN 品佃ステートメントを指定する際に設定するオプションである。 LIBN 品但オ プションには、ネットワーク上を流れるデータを圧縮するかどうかを指定する 250‑

245.

NETCOMP=オプションや、ソートに関係する BYSORT=オフションベ NOSASSORT= オプション勺などがある。これらは、通常の SAS と同じように、 LIBN 品rIE が有効で ある聞は機能する。 1 BYSORT=オ プ シ ョ ン … SPDS が 自 動 的 に 行 う ソ ー ト を 、 行 う か ど う か を 選 択 す る 。 吃 NOSASSORT=オプション… ' Y E S 'を選択すると、 PROCSORTステートメントを実行しないように出来る。 女 2 . 3 マクロ変数のパラメータ SPDSのマクロ変数も、次のように通常の SASと同じように指定する。 マクロ変数の設定例) % l e t MACROVAR=YES; MACROVAR...SPDS関連のマクロ変数名 SPDS関連のマクロ変数は数十種類有り、その機能も SPDSSTAG=*3などのソートに V DEB=*4 な ど の 検 索 時 の WHERE に 関 係 す る も の 、 関 係 す る も の 、 SPDS¥ SPDSDCMP=*5などのディスクへの格納サイズに関係するもの、 SPDSMMAP=*Gなど のメモリーに関係するものなどがある。これらのパラメータを、検索やソート、データ テーブルそのもののチューニングを行うときに用いる。 ゲ SPDSSTAG=.・.PROCSORTや BY処理にて、タグソートを実行するかどうかを選択する。 P SPDSWDEB=...SPDS による WHERE 条 件 の 評 価 内 容 に つ い て 表 示 す る し な い を 選 択 で き る 。 ゲ SPDSDCMP=…テーブルデータを圧縮するかどうかを選択する。 6 * SPDSMMAP=…データの読み込み時 のためのインデックスをメモリーに常駐させるかどうかを選択する。 2 . 4 データサーバーテープ、ルオプションのパラメータ SPDS のデータサーバーテーブルオプションは、テーブルの作成、変更、及びデータ の追加の際に指定する。オプションの数はマクロ変数ほどはないが、 20以上用意され ている。機能としては、データを構成する、各 . d p f ファイルのサイズを決定する PARTSIZE=オプションや、 BITINDEX= 吋などのインデックスに関係するもの、 SORTTYPE=*8などのソートに関係するものなどがある。これらのパラメータも、検索 やソート、データテーブルそのもののチューニングを行うときに用いる。 2 5 1

246.

7 * BITINDEX=…ピットマゥプインデックスを使用するときに指定する。 8 * SORTTYFE=…初期 設定のヒープソートではなく、クイックソートを使用する時に指定する。 3 . パフォーマンスに影響する主なチューニング、ポイント SPDS のパフォーマンスは、先に述べたパラメータの値を変更することによって実行 時間に大きな影響を与える。ここでは、その中でも主な 3つのポイントに絞って説明す る 。 3 . 1 インデックス SPDSは次の 3種類のインテ+ックスを備えている。 (1)グローバル B ツリーインデ、ツクス (2)セグメント Bツリーインテ ックス e (3)ビットマップインデ、ツクス 3 .1 . 1 グn口ーバル Bツリーインデックス このインデックスは、テーブルの全ての行に対してキー値を設定する。このインデ、ツ クスは、ある変数に対して全件を検索しなければならないような、 BY を使った検索や JOIN を使った検索などのときに使用すると、パフォーマンスが向上する。但し、この インデックスはセグメント B ツリーインデ、ックスを作成するときにはデフォルトで作成 されるが、ビットマップインデ、ツクスを作成するときにはデフォルトでは作成されない。 全件を検索しなければならない場合には、このインデックスを作成する。 3 .1 . 2 セグメント Bツリ一インチ、ツクス セグメント B ツリーインデックスは、グローバル Bツリーインデ、ックスを分割し、分割さ れたそれぞれの中でツリーを個別に作成して出来ている。分割するサイズは、データサ ーバテーブルオプションの SEGSIZE=によって指定をすることが可能である。しかし、 初期設定値の 8KB の値を大きくしたとしても、パフォーマンスにはあまり影響を与え ず、逆に数 MBなど大きくしすぎるとパフォーマンスの劣化につながる場合がある。こ のインデックスは、羽司E1E条件での検索時に並列処理を可能とするので、データがソ 2 5 2一

247.

‑卜された状態ではなくランダムに格納されている場合に、効果を発揮する。 3 .1 . 3 ビットマップインテ、ックス SPDS の特徴的な機能でもあるビットマップインデ、ツクスは、従来の BaseSASが持 っている B ツリー型のインテ。ツクスとは構造が全く異なっている。 先ず、ビットマップインデックスは、セグメント B ツリーインデックスのように 羽 司 王ERE条件の検索の陳に並列処理が行えることに加え、セグメント B ツリーインデ ックスが、分割されたそれぞれのツリーがどのような値を保持しているかについて、そ の情報を保持しないのに対し、分割されたそれぞれの範囲においてどのような値が格納 されているかをリストとして保持している。これにより、羽司王ERE条件を実行する際に、 その条件の値に合致しないセグメント(分割されてできた各範囲)はあらかじめ読み飛 ばされるようになる。もし、全セグメントの内 75%未満のセグメントが検索のときの 値を含んでいる状態であるならば (25%以上がセグメントとして読み飛ばされるなら)、 ビットマップインテ+ツクスは効果を発揮する。 また、ビットマップインデ、ツクスは、分割されたそれぞれの範囲のキー列の値を、 ' 0 ' とT のビットを用いて格納している。そのため、値の離散値の種類が増えるとその分イ ンデ、ツクスファイルの大きさも大きくなる。 3 . 2 パーティション SPDS は、データをある M B単位のファイルで、複数の物理パスへ指定することが出 来る。これは、 1GB のデータを 10MBのサイズのファイルで 100個作り、 5つの 物理パスに対して 20個づっ格納できることを意味している。このようにできることか ら、データの大きさや使用方法に応じて、各ファイルの大きさや物理パスの数を調整す ることにより、パフォーマンスに大きな影響を与える。 データのファイルサイズは、データサーバテーブルオプションの PARTSIZE=と、マ クロ変数の SPDSSIZE=によって指定することが可能である。ファイルサイズは、初期 状態で 16MB の大きさに設定されているが、例えば 4GB のデータサイズであれば、 256MB または 512MB の大きさがパフォーマンス上適しており、扱うデータの大きさ に応じて大きくする必要がある。 また、物理パスの数も、ハードウェアの構成に応じて 4、 8、 16など増やしていく ことによりパフォーマンスを上げることができる。 n J μ nJ Ru

248.

3 . 3 スレッド SPDSは、サーバーのオペレーティングシステムが処理する最小単位であるスレッド の数について、設定が可能である。設定が出来る内容は次の 2点である。 (1)スレッドの最大値 SPDSの全ての処理におけるスレッドの最大値を指定 する。この値は、データサーバーパラメータファイル 内の MAXWHTHREADSによって設定する。 ( 2)検索時のスレッド数 WHERE条件で検索する時に使用するスレッド数を指 定する。この値は、マクロ変数 ( SPDSTCNT=)とデ ータサーバテーブルオフションのパラメータ (THREADNUM=) によって設定する。 スレッドの最大値の初期設定は、資料 lに示した値が設定されているが、推奨値とし て、使用するハードウェアの C PU数に応じて次のように変更することをお勧めする。 S o l a r i s 2をお使いの場合、 CPU数の 8倍の値を指定する。 Sをお使いの場合、 CPU数の 2倍の値を指定する。 上記以外の O この MAXWHTHREADSの値は、パフォーマンスに直接影響を与えるため、上記推 奨値の値よりもはるかに大きな値や、逆に小さすぎ、る値はパフォーマンスの劣化を招き、 a s e S A Sよりも遅い実行時間になる場合もある。 通常の B 検索時のスレッド数の初期設定値は、 M A X ¥ ¥ 司T HREADSの値と同じに設定されてお り、推奨値も同じである。テスト使用として、検索内容に応じて値を変更し、パフォー マンスの違いを確認するときに用いるのが望ましい。 4 . おわりに SPDSのチューニングポイントは、使用するデータの内容とその検索方法によって異 なり、一概にこの方法を行えば必ずパフォーマンスが 2 0 %上昇するなどのようなこと は述べられない。しかし、インデックスなどのパフォーマンスに関わる値をチューニン グすることで効果は期待できる。 2 5 4

249.

この論文が S PDSのパフォーマンス向上の一助になればと願う。 参考資料 h t t p : / / w w w . s a s . c o m / s o f t w a r e / c o m p o n e n t s / s p d s . h t m l Fhu t u ︐u n

250.

(資料 1) .LIBNAMEパラメータファイルの初期設定値 libname=tmppathname / t m p ; 二 ‑サーバーパラメータファイルの初期設定値 ・ UNIX版 SORTSIZE=16M; INDEX̲SORTSIZE=16M; BINBUFSIZE=32K; INDEXMAXMEMORY=30M; WORKPATHニ ケ var/tmp"; NOCOREFILE; SEQIOBUFMIN=64K; RANIOBUFMIN=4K; ALLOWMMAP; MMAPL lMIT=1024M; MMAPLOWMEM=10M; MAXWHTHREADS=64; GRPBYROWCACHE ニ1 5 0 ; .WindowsNT版 SORTSIZE ニ8 M; INDEX̲SORTSIZE=8M; BINBUFSIZE=32K; INDEXMAXMEMORY=8M: WORKPATH=C:干TEMP NOCOREFILE: SEQIOBUFMIN=64K; RANIOBUFMIN=4K; NOALLOWMMAP; MAXWHTHREADS=4; GRPBYROWCACHE=150; O ハ η RU ︒

251.

論文発表 SASシステム新機能

252.

日本 S A Sユーザー会 (SUG I‑J) WebAFを用いた JAVAアプリケーションの開発 0菅 野 崇 根田光 古河インフォメーション・テクノロジー株式会社 技術部 D e v e l o p m e n to fJ a v aa p p l i c a t i o nu s i n gwebAF OTakashiKanno H i k a r uNeda SystemT e c h n o l o g yD e p a r t m e n t .FITECC o r p . 要旨 WebAFを利用し SASシステム上での JAVAアプリケーション構築方法を記述する。 A S / l n t r N e tソフトウェア、 JAVA、A p p D e vS t u d i o、 webAFソフトウェア キーワード:S 1 はじめに 当社では 1 998年 7月に SASシステムを利用したデータウェアハウスによる営業支援、ンステム「ジェイ クリック 3 Jを開発した。「ジェイクリック 3 Jはフロントエンド、部分を jAVAで作成し、 S ASシステムとの接 続には SAS/CONNECTD r i v e rf o rjAVAを利用している。開発用ツールを用いずソースはすべて手 書きで開発した。 ppDevS t u d i oに含まれている jAVAアプリケーション開発用ツーノレ webAFソフトウェアを使 今回は A 用した jAVAアプリケーションの作成方法を紹介し、開発効率の比較を行う。 2 ジェイタリック 3の概要 ジェイクリック 3はデ.ータウェアハウス上のデータをオンラインリアノレタイムにユーザが設定した分析方 法で解析するアプリケーションで、ある。設定した分析方法を保存したり、他のユーザとの聞で・共有す るとし、った機能を備えている。 / Sを実現するアプリケーション版と、 Webサーバ上にアプ クライアント側にアプリケーションを置き C ‑ 2 5 9

253.

レットの形で、アプリケーションを置きイントラネットを実現するアプレット版の 2つがある。どちらもデー タサーバは SASシステムを利用し、フロントエンド、のアプリケーションは jAVAで作成されている。デ ータサーバとの交信には SAS/CONNECT Oriver f o rjAVAを利用し、データの送受信は jAVAの RMI(RemoteMethodl n v o c a t i o n )を利用している。 SAS/CONNECTO r i v e rf o rjAVA(パージョン1.3 )は SASシステムに対して命令をサブミットしたり、 Log出力や Output出力を文字列の形で 取得することはで、きたが、 SASデータセットなど、のファイルを 送受信する機能が備わっていなかった。そこで、ファイルの送受信用に RMIサーバを別途用意してそ ちらに担当させている。 JavaOevelopment K i t . .'jAVAの標準の開 クマラフを表示する機能も実装する必要があったが、 jOK( 発ツーノレ)には基本的なグ ラフィックを描画するためのクラスしか用意されておらず、 SAS システムの P Web P u b l i s h i n gT o o l s内の GraphAppletもアプレット専用で あった。そこで 3次元グラフは VRMLで 作成し、 SASシステムの WebP u b l i s h i n gTools内の VRMLViewerで表示させ、 2次元グラフは自作 した。 デザインに関してはボタンや表の位置を座標で指定しているため、微調整のたびにコンパイル→実 行を繰り返さなければならず、後からの部品追加などは面倒な作業で、あった。 3 webAFについて webAFは SASを利用するシンクライアント・アプリケーションを開発するための総合ツール AppOev S t u d i oの中のツールの一つで、 SASシステムにアクセスする lOO%PurejAVAなアプリケーションを 簡単に作成できることを特長としている。 webAFは以下のような機能を有する統合的な jAVA開発ツールである。 • GUIを使った部品配置 ‑ソースエディタ ‑ウィザード‑を使ったイベント処理作成 .デ、パッガ ・各クラス説明を含むオンラインヘルプ .配布用パッケージ作成 サーバとなる SASシステムには以下のプロダクトが必要である。 • SAS/CONNECTソフトウェア • SAS/lntrNetソフトウェア 4 webAFを使ったアプリケーション作成例 ジェイクリック 3の諸機能のうち集計条件設定と、集計結果表示、グラフ機能の簡単作成例を以下に 示す。 以下のようなデータを変数を選択して集計させ、表とク、 ラフにするアプリケーションとする。 今回の webAFは米国でリリースされている英語版パージョン1.0を使用している。 ‑260一

254.

売上データ i s a s u s er .u r i a g 」 巴 m i s巴 … … 販 売 庖 s h i n a… … 製 品 kyaku .....顧客 u r i a g e… … 売 上 金 額 4 . 1 前準備 まずサーバ上に変数選択用の変数マスタを作成する。 data sasuser.m key; length m工se 宇8 shina 宇8 kyaku 宇8; delete; 工u n; これは売上データの項目変数(販売庖、製品、顧客)のみの空のデータセットで、ある。 4 . 2 プロジェクトの作成 次に新規で、プロジェクトを作成する。作成にはウィザードを利用する。 F i l e Jメニューから iN巴 wJ、i P r o j e c t Jと選択する。プロジェクトウィザード(図 1 )が起動する。 1 . i 2 . i P r o j e c tNameJに i s a m p l e Jと入れる。これは何でもよい。 3 . i P r o j e c tTyp巴」は i Appl巴t sa n da p p l i c a t i o n s Jのままにしておく。 4 . i 次へ」ボタンを押す。 5 . i E x巴c u t i o nS t y l巴Jをi A p p l i c a t i o no n l yJに変更。 6 . i 次へ」ボタンを押す。 7 . i 完了」ボタンを押す。 これで s a m p l eプロジェクトが作成される。 図 1 プロジェクトウィザード 夕事イアログ、 4 . 3 部品の配置 次に必要となるコンポーネントをメインフォームに配置する。 2 6 1

255.

必要なコンポーネントは、集計に使う項目変数を選択するための L i s t B o x、集計結果を表示する TableView、グラフを表示する Bar、集計をアプリケーションに指示するための B u t t o nの4つで、ある。 ( 図2 ) 1 . プロジェクトナピゲータ(図 3左)から sampleルl a i n を右クリックして iOpenJを選択してフォー ム画面を表示させる。 2 . コンポーネントパレット(図 3右)の i S e l e c t o rJ を選択。 3 . コンポーネントパレットから ListBoxとButtonをドラッグ'&ド、ロップで・フォーム上に配置。 4 . コンポーネントパレットの iDataV i e w e r s Jを選択。 5 . コンポーネントパレットから T a b l巴V i刊をド、ラックー&ド、ロップで、フォーム上に配置。 6 . 図 2 コンポーネント配置後のフォーム 図 3 プロジェクトナピゲータ(左)とコンポーネントパレット(右) 4 . 4 SASコンポーネントの追加 次にサーバとなる SASシステムと通信するためのコンポーネントをプロジェクトに追加する。 必要なコンポーネントは、 SASシステムとの通信を担当する Conn巴c t i o n、特定のデータセットのデ. ータを扱うための D a t a S e t l n t e r f a 旬、データを集計させるための Summarylnterfaceの3つである。 1 . コンポーネントパレットの iSASJを選択。 2 . コンポーネントパレットから DataS巴t l n t巴r f a c eをフォーム上の L i s t b o x !こド、ラッグ&ド ロップす る 。 3 . iRemot巴 ConnectionJダイアログ(図 4 )が表示されるがそのまま iOKJボ、タンをクリック。 4 . 自動的に Conn巴c t i o nがプロジェクトに追加される。 2 6 2

256.
[beta]
5
. コンポーネン卜パレッ卜から S
u
m
m
a
r
γ
I
n
t
e
r
f
a
c
eをフォーム上の T
a
b
l
e
V
i
e
wにド、ラッグ戸&ド・ロツ
プする。

6
. 追加されたばかりの S
u
m
m
a
r
y
l
n
t
e
r
f
a
c
eをプロジェクトナピゲータからフォーム上の B
a
rにド
ラッグ'&ドロップする。
以上で必要なコンポーネン卜はすべて準備できた。

図4 I
R
e
m
o
t
eC
o
n
n
e
c
t
i
o
n
jダイアログ

4
.
5 プロパティの設定とイベント処理の作成
必要なコンポーネン卜が配置されたら次は各コンポーネン卜のプロパティ設定する。

c
o
n
n
e
c
t
i
o
nのプロパティは初期設定がすで、にローカノレマシンの SASシステムに接続する設定にな
っているので今回はそのままにしておく。
1
. フォーム上のボタンのラベルを変更する。

2
. フォーム上の B
u
t
t
o
nを右クリックし I
P
r
o
p
e
r
t
i
e
s
jを選択する。
3
. 表示されたプロパティシート(図 5)から I
T
e
x
t
jを選択し IOKjに変更する。
これで B
u
t
t
o
nのラベルは OKに変更された。

a
t
a
S
et
In
t
e
r
f
a
s
eの d
a
t
a
S
e
tをI
s
a
s
u
s
er
.m
̲
k
e
yjに変更する。
同様にして D

産型雪空"~"'è.".;I;:.;I' ' ' .' ' -:' ,': ',でプ竺プヲ
"包 O
rlCommJnd

勾
勾
:
.
;
;

‑
J
F
5
?
i
w
J
o
i
m
‑
‑一白点m
h
L
‑一一一一一一一一票
ヨヲ句

.
tompM9r
:
l
Da
s
c
r
l凶 on SAS
,
.
;WT.白 川edbudon
血 , , , 刷 出 品 加h
ed

1
1
1
.
.
.

d・ 叫nTIme

附

'
"
'
凶ad

f
o
c
u
s

~~

~~:

一
一
一

.
J
s
i
長

;
!
r
u
9

一 向b

r
o
l
!
s
e

~1;

“切"円~_~I::J~...._固守山一一"“勾勾町

お

一
一
細川

……

一一
一
一
一
一
一一一一一一一一一一一一一一世
D
i
a
l
o
g
.
P
!
a
昨日
昼
2
3"ferredSr
:
.e

州

d町
、
,
,]
l,
l
'
I
el
QhT口

問 ¥ Jt
u
r酬 圃 幅 削

r
a
st
'
leTo
F
l
t

前
"
司 耐c
a
l
P
o
s
i
t
l
o
n

、
"
出
"5 プロパティシート
‑263

257.

次に B u t t o nをクリックしたときの処理を作成する。 1 . フレームボタン上の B u t t o nを右クリックし i H a n d l eEvent . .. jを選択する。 2 . iNewE v e n tH a n d l e r jダイアログ(図 6左)が表示されたら i V 叶1Ic ht y p eo rh a n d l e rd o you W r i t ey o u rownc o d e jにする。 w a n tt oc r e a t e ?jをi 3 . i l n t e r a c t i o nD e s c r i p t i o n j内の青い文字列をクリックする。 4 . i S e l e c tS o u r c e Component a n dE v e n t jダイアログ(図 6右)が表示されたら i S e l e c tt h e a c t i o n P e r f o r m e d jを選択する。 E v e n t jから i 5 . iOKjボタンを押して i S e l e c tS o u r c eComponentandE v e n t jタ事イアログを閉じる。 6 . i S o u r c e jボタンを押し、ソースを表示させる。 7 . 処理を記述するためのメソッドが用意されるので、 i Add newcode h e r e Jと書かれている行 の下に以下のコード を記述する。 surnmarylnterfacel.setDataSet("sasuser.uriage"); surnmarylnterfacel.setCategoryName(listBoxl.getSelectedItems()[0]); surnmarylnterfacel.setResponseName("uriage"); 以上でプロパティの設定とイベント処理の作成は終了である。 , " 。 弘n 侃t eonntthonl ( l , ) T i lS e l !n J e r l a c e 1 l I MSOl1 。m l l! " lu 9 a r l ・ l i l c t l s u m r n ; u y l n !r ! a b h ! V l e w l 図 6 iNewE v e n tH a n d l e r Jダイアログと i S e l e c tS o u r c eComponentandE v e n t Jダイアログ 4 . 6 コンパイルと実行 一通り完成したらコンパイルする。 1 . i B u i l d Jメニュー(図 7 )から i B u i l dP r o j e c t Jを選択する。 B u i l d Jメニュー 図7 i コンパイルが成功したら次は実行である。 B u i l d Jメニューから i E x e c u t e Jを選択する。 1 . i E x e c u t e Jを選択すると自動的にコンパイルを行ってから実行される。 なお、コンパイノレ前に i サーバとなる SASシステムが Windows上にある場合は実行前にスポーナを起動しておかなけれ ‑264

258.

ばならない。これは S A Sシステムから SAS/CONNECTソフトウェアを使用するときと同じである。 副司王 一一「 ; l M I 時 BarChart K γ幻〈リ L I l :I AGE(Surn) " . , s宮古‑ 17000 ,~., 11000 l 同m I~O .oo ,~., ωm , . 図. ~,・ 4・ ・ c ttJ~一 川 町 01 1 0 2 r..~ 同毘 ぷ語以 図 8 実行結果 実行するとまず左の L i s t b o xに変数が一覧される。その中から一つ選択し、 OKボタンをクリックす ) ると集計結果とそのグラフが表示される。(図 8 5 評価と課題 従来の S AS/CONNECTD r i v e rf o rj AVAを利用する全ソース記述による開発に対する webAFを使 った開発の利点は以下の通りである。 ・手入力で記述しなければならなしヴースの量が圧倒的に少ない A Sサーバとの接続などの部分は自動的に作成される。 基本的な部品の配置や S A Sデータセットといったクラスもあらかじめ用意されており別途作成する必要がな グラフ、 S し 、 。 イベント処理も簡単なものであればソース記述が不要である。 例:ジェイクリック 3の場合、グラフ機能のために記述しなければならなかったソースは約 1 0 00行である。上記の例でも同程度必要である。 webAFの場合は上記の例では 1 0行程度 となる ・データの送受信の処理を容易に作成できる AS/CONNECTD r i v e rf o rj AVAにはデータを容易に送受信する機能がなかった 従来の S A Sシステムの O u t p u t出力を利用する、 jAVAの R M Iを利用するなどの工夫が必 ため、 S 要で、あった。 webAFの場合は S A Sデータセットやサーバ接続のクラスがインターフェースとし、う形で提 供されており、そのまま表やグラフに値を渡せるようになっている。 ‑仕様やデザインの変更が容易に行える デザインの変更は GUIを利用して行える。 部品の追加、移動、削除はマウス操作で、デ.ザインもコンパイル→実行としづ手聞をかけ ずにその場で確認できる。 ソース記述も必要ない。 ‑デノくッグ.がしやすい 実行中の各変数の値などを取得するなどのデ.バッグ 作業は面倒なもので、あるが、ソースレ P 265

259.

ベルデノくッガが付属しているので、幾分作業はしやすくなっている。 一方、問題となりそうな点は以下の通りである。 ・アプリケーション全体のサイズが大きくなる webAFの GUIを使って開発した場合、コンポーネントは webAF独自のクラスが使われるた め、実行時には webAFが用意したパッケージファイルが本体と別に必要になる。 上の例の場合本体は約 47KBであるのに対し、パッケージファイルは約 2144KBになる。 イントラネットで、はブFラウザ側に備わっていないクラスをすべてサーパから転送するので、ア プリケーション全体のサイズは重要で、ある。パッケージファイルをあらかじめブpラウザ側にイ ンストールするとし、う方法もあるがそれで、はイントラネットの特長(シンクライアントモデル)が 生かせない。 • SASシステムとの接続開始を自由に制御できない SASシステムに接続するアプリケーションを webAFで普通に作成した場合、アプリケーショ ン起動時に SASシステムに接続してしまう。必要な時に初めて接続を開始する、とし、う様に はできない。 サーバ・クライアント聞が 1対 1ならばあまり問題にならないが、 1対多になる場合はサーバ の負担増となる。起動直後にサーバとの接続が必要な場合を除き、起動後すぐ接続を切 断する、などの工夫が必要である。 6 まとめ ここまで webAFによる JAVAアプリケーション開発の具体的な方法と、従来の方法との比較を記述し てきたがまとめると以下のようになる。 ・部品配置、 SAS システムとの接続処理、イベント処理の記述などは比較的簡単に行えるの で、アプリケーションを短い開発期間で作成することができる。ただし細かい制御を多用する 場合はその分ソース記述が必要になる。 ・作成されるアプリケーションのサイズは全ソース記述で、作成した場合より大きくなるので、イ ントラネットやアプリケーション配布などサイズが重要になるシステムの場合は使用するコン ポーネントに工夫が必要である。 SASシステムを使ったアプリケーションを JAVAで開発することの利点は、実行で、きるプラットフォー ムが多い、実行環境を低コストで用意できる、イントラネットやインターネットを使ったシステムに向く などが挙げられる。今後 JAVAを使った開発はますます重要度を増してしてものと思われる。 そうし、った中で、従来の SAS/CONNECTD r i v e rf o rJA VAを直接利用するしかない方法と比較すると JAVA開発ツールとしての w巴bAFは十分有用である。 ‑ 2 6 6

260.

日本 S A Sユーザー会 (SUG I‑J) iSASシステムと J a v aによるクライアント環境の構築」 東一成 ソリューション本部ソリューションプランニングセンター 株 式 会 社 SASインスティチュートジャパン I I m p l i m e n t a t i o nf o rtheC i l e n tSystembyu s i n gSASSystemandJ a v a J K a z u n a r iAzuma S o l u t i o nP l a n n n i n gC e n t e r B u s i n e s sDev巴l o p m e n t& S o l u t i o n s 要旨 本 稿 で は SAS の 機 能 と Java の 技 術 を 融 合 さ せ た 新 し い プ ロ ダ ク ト で あ る 、 " [ AppDev StudioJ を利用した Web ブ ラ ウ ザ 上 の 分 析 環 境 の 構 築 に つ い て 紹 介 する。 キ ー ワ ー ド : Web、Java、SAS/lntrNetソフトウェア、 AppDevStudio 第1 章 企業システムとインターネット技術 第1 節はじめに アプリケーション構築や実行環境において、今まで、もっとも重要な要素として、ソフトウェア、 アプリケーションが動作するプラットフォームが上げられる ど、のアプリケーションを購入する 、M a c i n t o s h版 、U n i x版などの指定が必要となってくる 場合もまず Windows版 では、ソフトウェアを利用するユーザの立場から見た時にこのようなプラットフォーム依存に よる利用の姿は正しいのであろうか?あらゆるソフトウェアがどのようなプラットフォームで、も利 用者が意識せずに利用する事はできないのであろうか? O n この点において SASシステムはその設計思想に MVAと MEAを取り入れ、多くのプラット フォームやデータ形式に依存しないソフトウェアの利用環境を提供してきた。 MVAとは M u l t iVenderA r c h i t e c t u r eの略であり、様々なプラットフォームにおいても SAS システムを動作させるものである。 ρb ー ワ o白

261.

そのプラットフォームはメインフレームで怯 MVS、CMS、問、 VOS等 、 UNIX環境では S o l a出 、 HP‑UX、AIX、D i g i t a l UNIX、As I + 、 MIPSABI等 、 PC環境では Windows(NT、3 . 1、95、9 8 ) や Macintosh、OS/2等の多くの環境で動作する。たとえば PC上で作ったプロクeラムを UNIX のサーバで動かす。もしくはメインフレーム環境のダウンサイジングのためにそれまで利用し てきたソフトウェアやデータを簡単にワークステーション環境に移行する事が可能で、ある p ま たプラットフォームをまたがるデータ移動の場合の文字コード変換なと寺も自動的に行われるの MEAとは M u l t i Engine A r c h i t e c t u r eの略であり、多くのデータベースエンジンに対する接 続を可能にする。 MEAを実現しているのが SASでは SAS/ACCESSソフトウェアで=ある 下 に対応しているデータエンジンを列挙する。 0孔'¥CLE 、PC F i l e Formats(dBase、E x c e l, Lotus, CSV, TEXT.... . ) 、 SAP AC's R/3、 SYBASE 、SQLS e r v e r、SYSTEM2000s o f t w a r e、SQL/DS 、ADABAS、CA‑Datacom/DB、 CA/IDMS、 DB2(DB2、DB2/2、DB2/6000)、IMS 一DL/I 、INFORMIX、INCRES、ODBC等 n また、サポートしているネットワークなと1 土 、 TCP/IP、APPC、t e l n e t、DECnet、NETBIOS、 ISP/SPX、HLLAPI、Async等である。 このようにして、最初にあげられているようなプラットフォームやデータエンジンの相違による 混乱は SASシステム内で吸収し、ユーザに対して統合されたシステムの提供を行ってきた。 このようにして多くのユーザは SAS システムを統計解析のソフトウェアだけで、はなく、企業内 の混乱したデータおよびアプリケーションの統合環境として使ってきた そして近年、コンピュータの価格の低下と処理能力の向上、 LAN、WAN、インターネット、イ ントラネットなどの技術の発展により、企業、個人をはじめとして多くのコンヒ。ュータ利用ユー D O ザに対して、新たなコンピュータの利用環境が整ってきた。 第 2節インターネットの発展 今回テーマにあげた Javaはまさに WWW(WolrdWideWeb)の申し子といえる。 インターネットの発展は多くのコンヒ。ュータユーザに対して、多くの「情報の宝」を提供した。 その量は「情報の洪水」といわれるほどである。そこには e ‑ m a i l, f t p, h t t p,など様々な利用方 法が含まれており、中でも HTMLによって記述された Webサイトに含まれる多くの文章や情 報は相互にリンクされ、エンド、ユーザーはマウスのクリック等の簡単な操作だけで情報利用が 可能となった。 そしてこの HTML による記述は大きな特徴があった。エンド、ユーザはそのプラットフォーム に対応した Web ブラウザといわれるソフトウェアさえあれば、どのようなプラットフォームで、作 成された Web サイトで、あってもアクセスする事が可能になったので、あるのそして Mosaic、 Netscape N a v i g a t o r、I n t e r n e tE x p l o r e r等の Webブラウザーが無料で配布され始めた事に より、その利用者数は爆発的に増加したのわかりやすし、インターフェース、テープツレとし、われ る表の作成やフォントサイズの変更による豊富な表現能力、 g i f 、J p e g 等の形式に統一された ク守ラフイツク、により、企業情報、学術的な論文や実験結果、政府の情報、そして個人による 情報発信などが増えるにつれて、その内容や質も多様化してし、ったの 第 3節企業内での「インターネット」環境の活用 このような中で、企業内における活用はどのようになっていったのだろうか?当初は「消費 者とのインタラクティブな対話」、「仮想、ネット上の新しい市場の誕生」等が話題になっていた。 現在では株取号│、企業のサポートデスク、 AMAZON.COM をはじめとする無居舗販売のよう ‑268一

262.

に成功した事例も出てきてが、 Webを商取ヲ l に利用しようとした当初は商品の提供方法、決 済方法、利用ユーザの絶対数の不足等からその発展性は認められていても、「新たな経済 圏の誕生」とまではし、かなかった今 しかしながらインターネットのアーキテクチャや利用方法は、企業内での情報交換、知識共 有、ハード、資産の有効利用の一つの手段として、注目を集め始めた。そこでは企業内にクロー としづ利用形態が誕生した。 ズされた環境で利用されるとしづ事で、「イントラネット J 企業内で利用される情報交換やメールのツールとして利用されてきたのは、グループウェ アと呼ばれるアプリケーションである。しかし、この場合も専用のソフトウェアのインストール、 サーノ〈の設置等で、コストが必ずしも安し立は言い難かった。 そこで、注目を浴びたのがインターネットの方式で、あるロサーバーにインストールされる Web サーノミーやメールサーノくーは無料の製品が多く、クライアントの Webブ、ラウザやメールソフト も無料のものが主流だった また、クライアントのソフトウェアはク、ループウェアのソフトよりも 動作が軽く、高性能なハード、ウェア資源を要求しない。要するに、利用する用途を間違わな ければ、一線を退いた企業内の PCを有効に活用する事が可能となったので、ある。 O だが、やはり企業内における利用としては、ニュースや業務報告、メール等の利用が十分 で、あったとしても、動的なグラフィックの表示や、ビジネスでの利用(グラフや集計表の作成な ど)で、はまだ不十分と言うしかなかった o そのような中で S u nM i c r o s y s t e m s社から従来のコンヒ。ューテインク、、環境を変革するような J a v a Jが発表された。 I 第 4節 J a v aについて W o r J d W i d e W e b は今まで情報発信のためには最適な仕組みであった。そのような中で HTMLのバージョンもあがっていきフォームやイメージマップなと会の新機能が追加されたが、 結局得られる情報まで、の経路が変わっただ、けで、入手可能な内容に関してはあまり変わって いないとも言えた。また Webのデザイナーなと会が動的アニメーションを組み込もうとすると、 サーノくーによるプッシュ機能や、アニメーション GJFとし、った技術が開発されたが、静的なイ メージ以上をサポートできないとし、う中での、ちょっとした技や T J P Sのようなもので、あったn それではこのような中で J a v aはどの様にして誕生したのであろうか? 当初は J a v a言語は様々な家電などで利用されるソフトウェア開発プロジェク卜の一環として 誕生した。 その目標はどのような家電にでも組み込めるように「小さく、高速で、効率よく、広 範囲のハードウェア装置に移植が可能な言語で=あること」で、あった。このような開発目標は、 誕生当初からまさに www経由で配布するための要件を満たしているもので、あったO J a v a言語で作成されたプログラムは、プラットフォームに依存せずに実行できるのが大きな NJXや W i n d o w s, M c i n t o s hなど広く普及している OSだけではなく、 J a v a 特徴である。つまり U をサポートしている情報端末であれば同じプログラムを動作させる事が可能である。 上記のように J a v aには多くの特徴がある。これらの点をまとめてみたい n 円叶U p o n4

263.

‑ 特徴 I プラットフォームからの独立 a v aがもっとも特徴的なところはプラットフォームから独立しているとしづ事である。これ まず J v a はソ は多くのプラットフォーム上で、動かす必要があるので、あれば、最も重要な点である。.Ja ース、バイナリの双方のレベルにおいてプラットフォームから独立している。 J a v aの基本データ型はすべての開発プラットフォームにおいて一貫した大きさを保ってお り、すべての.Ja v a環境に共通した基本クラスライブ ラリを利用する事によって、あるプラットフ オームで作成したコードを移植先のプラットフォームに対応させるために書き換え直す必要 がなくなる。この様な J a v aのプラットフォームの独立性はソースレベルだけで、はなく、バイナリ ファイルもプラットフォーム独立で、あり、ソースコードを際コンパイルする必要なく多くのプラッ トフォーム上で、実行を行う事が可能となっている。 これは J a v aのバイナリファイルがバイトコード と呼ばれる形式で、あるとしづ事が重要である。 図 1 ・1 I Pentium I lバイナリファイル l ソースコード i PowerPC1 4 バイナリファイル I SPARC l I t バイナリファイル l 通常、多くの言語ではソースプログラムをコンパイルすると、その実行プラットフォームに依 存した機械語に変換を行う。それは P e n t i u mや PowerPC、SPARC等で、違ってきており。もし 他のプラットフォームに対応させたければ、またソースファイルを再びコンパイルしなければ ならないっ(図 1‑1参照) しかし J a v aによってプロク守ラムが作成された場合、従来の言語とは違った方法となってく るoJ . a v aの開発環境には、 J a v aコンパイラと J a v aインタプリタとし、う二つの要素が存在する。 J a v aコンパイラはソースコード から機械語コード、を生成を行わず、バイトコード を生成する。ま た 、J a v aプログラムを実行する場合は、インタプリタを起動しバイトコードを実行してして。この インタプリタが各ブラウザなどに組み込まれ J a v aアプレットなどの実行を行ってして。(図 1 ‑ 2 参照) 2 7 0 ‑

264.

図 1 ‑ 日プ 中むン HHC h小 中 町 川 ⁝旧タ⁝⁝子 ドド XXXX̲java a' 一一新 ⁝m ィ ⁝ ⁝ 川 p m H 一日 メ ハ 一 PowerPC J a v aコン J¥イラ J a v aコード 引 川 a‑TU P e nt . ium J a v aコン J¥イラ J a v aインタプリ ‑ 子 、 . ・ . . , . . . . . . . . . . . . . . . . . ・ SPARC J a v aコンノ tイラ h • • ・ . . , . . . . . . . . . . . . . . . . . ・ v aプログラムは特定の このようにバイトコードインタプリタ品、う段階が存在する事により、.Ja システムに限定されず、 J a v aインタプリタがあればどのプラットフォーム、 OSでもプログラムが a v a 実行できるようになるの HTMLファイルがどのプラットフォームで、も読めるのと同じように J に対応したブ、ラウザがあればど、のプラットフォームで、も動作させる事が可能となる しかしなが らこの様なインタプリタ形式の欠点は実行速度であるが、今後は HOTSPOT等の新技術に よってこの様な点も改善されていくと考えられる。 O ‑ 特徴 2 オフ守ジェクト指向 次にオブ、ジェクト指向による効率的な開発環境が挙げられる。 オブ ジェクト指向の方法論に基づいたプログラミング言語である J a v aは、柔軟にモジュー ル化されたプロクーラムを作成したり、作成されたコード の再利用が容易になっている。 J a v aは多くのオブジェクト指向の機能を c + + から引き継し、できている。その基本的な構成 は、基本データ型、入出力処理、その他のユーティリティなどである。これらを提供するクラス が揃っている。今回はオブ ジェクト指向に関してはあまり多くの文字数を割く事ができないが、 まとめるとプログラム全体が、多くの異なる機能的に独立した部品群(オブ ジェクト)によって 作られている。これらのオブ、ジェクト聞におけるメッセージのやり取りによって、処理が実行さ れていくとし、う事である P P p ‑ 特徴 3 シンプルな構造 a v aの設計思想、としては、小さくかっ単純で、あるとし、う事が挙げられる。 次に J 作成されるプロクゃラムのサイズは非常に小さく、ネットワーク上で動作させるのに非常に都 合が良い。 J a v aは c + +の多くの機能を引き継し、でいるが、その中で、も複雑なプロクマラミンクやとなってし まうような、多重継承やポインタ演算機能などが排除されている。また J a v aでは c + +などでメ モリリークの原固となるメモリ管理の命令が存在しない。それは自動ガーベッジ・コレクション 機能が存在しているからである。プログラム内において、参照されなくなったオブ、ジェクトはガ ーベッジ・コレクションに登録され、メモリの空き容量が少なくなると、ガーベッジ・コレクション に登録されている参照されていないオブ、ジェクトを集め、自動的にそのオブ、ジェクトのメモリ 領域が開放される ο このように J a v aではこの様な設計のおかげで、初心者や他の言語を使っていたプロク手ラマ にも学びやすい言語となっているの ‑271‑

265.

‑ その他の特徴 1 . 分散型 ネットワーク経由で、プロクマラムを実行可能 TCP/IP用のライブラリを用意している。 2 . 安定性 コンパイル、及び実行時に厳しいエラーチェックが行われる。 型のチェックやメモリの不正利用など、パク守の原因を早期に検出可能 3 . セキュリテイ コンパイル、実行時に厳しし、チェックが行われるの 4 . マルチスレッド 言語レベルで、のマルチスレッド 機能をサポートしている。 第 5節 開発環境について j a v a 言語のプログラムを作成するためには、 j a v a D e v e l o p e r ' sK i t( jDK)としづ開発環境を 利用する事ができる。これは SunMicrosystems社が配布しており、これにはコンパイラやイン タプリ夕、クラスライブラリなどが含まれている。最新の jDKのバージョンは java2といわれる ノ〈ージョンであり、 Swing等の GUI 環境を構築するための強力なクラスライブラリを備えてい る 。 jDK はコマンド ラインに命令文を入力しなければならなかったり、十分なデ バッグ環境など を提供していなかったが、最近では様々なソフトウェアベンダーより java の開発ツールが 続々と発表されている。 n s t i t u t eI n c .で 、 もj a v aと SASシステムを結ひ、付ける強力なソフトウェ そのような中で、 SAS I アが開発されている。 ‑ 2 7 2

266.

第2 章 S A Sが提供する Webおよび Java開発環境について 第1 飾 S A SとWeb環 境 まず最初に、 S ASが提供する J a v a統合開発環境の話に移る前に、 S A Sシステムがどのよう にして Webアプリケーション環境を提供しているのか見ていきたい SASシステムにおける Web対応を実現するためのソフトウェアとして、挙げられるのが S A S / l n t r N e tソフトウェアで、ある F n この S A S / l n t r N e t'.Jフトウェアは S A Sのデータウェアハウスソリューションの一環として提供 されたもので、 T h i nC l i e n tを利用したデータウェアハウスの活用、 SASシステムの高度な分 析機能を全社で利用、データへのアクセス及び、夕ずウンロード、ツールの提供、多次元データベ ースのビューア、 OLAPなど、の機能を提供する事が可能となっているの S A S / l n t r N e tソフトウェアに装備されている Webパブ、リッシングツールを利用する事により、 SASのアウトプットやデータセット、 PROCT a b u ! a t eプロシジャの出力結果を HTMLテーブ ルとして出力する事がで、きる。また S A Sのグラフなどを G ! Fや J p e gなどに変換するためのグ ラフィックド ライパも装備している。 また Webパブリッシンクマツールとデータサービ、ス、コンピュートサービ、ス等を用いる事により、 ダ?イナミック Webアプリケーションを作成する事が可能となった。 上記の事をまとめると、 S A S / l n t r N e tソフトウェアには以下のような特徴がある。 .T h i n C l i e n tによるデータウェアハウス活用 ーローノミワーマシンの活用と企業全体における情報活用の促進。 a v aアプリケーション・アフ。レットの環境提供 ーノミワーユーザに対する J .S A Sプログラムに専念する事が可能 P 巴r lや C言語などによる C G Iプログラム作成が必要なく、すべて既存の S A S プログ、ラムによって、開発が可能 A Sのスケーラブソレな環境を利用できる ・S ‑W巴bブラウザから、 S A Sの強力なデータ検索や計算能力を使う事が可能 ‑Webブラウザ、から MDDBに対するビューが可能 ・アップグ レード 可能なテクノロジー 一必要に応じてサーバの台数を追加して負荷分散が可能 .データ資産、プログラム資産の活用 一既存の R DBMS等のデー夕、 S A Sプログラム等を活用が可能 ‑Webブラウザから統計解析のロジックを利用する事が可能 A S / l n t r N e tソフトウェアは強力な Webによるソリューションを多くのユーザー 以上のように S に提供してきた。 ~273

267.

第 2節 SASが提供する J a v a開発環境 上記の S A S / l n t r N e t ソフトウェアで、は J a v a の利用環境として、 l J . a v a Component f o r S A S / l n t r N e t Jを提供している、これは SASサーバを利用するための J a v a A P I群であり、パワ ーユーザ向けの Webアプリケーションの開発環境としづ事ができる。この点に関しては、 SAS I n s t i t u t eI n c .とSunM i c r o s y s t e m s社で.IDBC、Jco n n e c tや l O O % P u r e J . a v a、J a v a B e a n sの J a v a ライセンス契約が行われている。 しかしこの J a v aの環境を使し、こなすためには高いスキルを要求されていた。それは A P Iが 提供されてしもだけで、実際の構築はすべてプロク守ラミンク、などが必要だ、ったからで ある o この様な中で SASシステムの中の強力な J a v aソリューションとして I AppDev S t u d i o Jが開 発されたの I AppDev S t u d i o Jは大きな二つのソフトウェアのコンポーネントによって構成されている。一 つは IWebAFJであり、もう一つは IWeb日 S Jである。 以下はそれぞれの特徴について述べていきたい。 ‑274‑

268.

第 3章 WebAF 第1 節 WebAFとは l i e n t ! S e r v e r形式で、あったが、将来的には Web環境にお 近年のソフトウェア開発環境は C l i e n t ! S e r v e r形式が主流となる事も考えられる。 ける C ebAFとは S A Sが提供する J a v aのための統合開発環境であり、 この様な中で開発された W l O O % P u r e J a v aに対応したアプレット、スタンドアローンの J a v aアプリケーション、 J a v a B e a n s、 J a v aクラスを生成する事ができるビ、ジュアルアプリケーションビルダーで、あるハ a v aの開発環境は、.JDBCを利用した DBアクセスであるが、 WebAFを利用す 一般的な J A Sシステムが接続可能な DBなども利用する事が可能となる そして統合された開発 ると S A Sの持つ強 環境により、サーブ、レットで、分析を行うためのサーバを構築する作業が省け、 S ebブラウザから利用する事が可能になるのであ 力なデータ加工能力と、多彩な表現力を W i る 。 利用環境での W eb!AFの特徴は S A Sサーバーの能力を利用するためのリモートア クセスの機能がサポー卜されている。 ( R O C F ) ROCF( R e m o t eO b j e c tC l a s sF a c t o r y )によって、リモートホスト上にあるオブ ジ、エクトに接続 するために自動的生成された J a v aのプロキシから、リモート上の SCLクラスにアクセスする M I, TCP!IP&HTTPT u n n e l i n g Q C O N N E C T ), CORBA,(そし 事が可能となる。それに加えて R て将来的には )DCOM等の複数のプロトコルに対応する予定で、あるわ また J a v aから S A Sシステムへ簡単に利用可能になっており、 SAS!AFオブ、ジェクトやその 他の S A Sのオブジェクトに対する透過的なアクセス、 S A Sデータセットや MDDB、プロシージ ャの強力な計算能力も利用可能となっている。 このように既存のアプリケーションをネットワーク上で、の利用を可能にしている。 P ・ ・ ・ ・ ・ 開発環境としての W ebAFの特徴には以下のような特徴がある。 ビジュアルなド ラッグげ&ド ロップ形式によるアプリケーション作成 JDKに準拠した構築環境 カスタマイズ可能な J a v aのソースファイルの文法に対応したエデ ィ夕、コールスタッ ク、デ、パックeアウトプット、変数の監視等の機能を備えたアプリケーションデ、パッガ を用意。 クラス聞の関系を 覧できるクラスブラウザ 標準的な J a v aクラスの生成、.Ja v a B e a n s準拠のコンポーネント、そしてリモートの S A Sのクラスに対するインターフェースのためのクラスエディタ等 ebAFは備えている。 以上のような特徴を W それではどのような事が可能なのか、実際の画面を見ていきたい。 (画面は開発中のもので、実際にリリースされたものと異なる場合があります。) 275‑

269.

第 2節 WebAFが提供するアプリケーションのタイプ 第 1項 SASデータライブラリーへのアクセス SASによって提供された J a v aクラスライブラリにより可能となる♂ W M INVOICE.EMPDB INVOICE.INVMB INVOICE.MNSALES INVOICE .PLTSALES INVOICE .QTRSALES INVOICE.REGION INVOICE.REGSALES i 滋 第 2工頁多次元データベースへのアクセス 事4 , 385 $ . 4, 385 $ 3, 465, 1 4自 $ 9, 546 414, 285, 3 7, 572 $ 6, 045, 315 $ 7, 319$ 1, 499, 4 5 2 ' $6, $ 4, $ 5, 2 3 1, 78¥ 3 6, 105 H, 839, 999 $ 9, 267 $76 9, 574 $ 自 ,7 2, 223$10, 935 $ 7, 866, 465 $ 9, 907 $ 1, 547, 2 3 3 ; $ 1 $ 5 895, 649 $7, 912 $ 2, 7 自7 , 802事1 4, 629 ~9 , 025 , 793 $ 1自,23 4 $6, 346, 505 $ 4, 395 $5 , 977 , 99 自 ~4 , 471 $ 6, ‑276‑

270.

第 3項 SASコード、のサブ ミット 日 臨; : J r J J J J J J J J 1 1 1 1醐 I N V O I C EQTRSALES J t : ! Y Q I C ; IR E P C R P 議 D procp r i n tdata=INVOICE.MNSALES; ProcP r i n tf o rINVOICE.MNSALES'; t i t l e l、 第 4項 SAS/AFクラスの利用 E 完治時ミヤ....... 均 告 坦 出 聖 堂 堂.... 崩 二Z ヰ円油開叫士一主主主主曲山中四日品子一一ニニI!I二二二二ニニヨ極極極醐園沼圏掴曲瞳瞳錨薗噛圃 My Remote SCL Function Class 問YS 口̲FN CLのSS 09/23/98 問抽、 RY CL のSS l ' lmarize d ata fcr Java Graphics SUl 09/23/98 SU ROCF class toωork with Jのυの CSF 09/23/98 : : V I 竜 門ST 角T Cし の SS ノ98 09/23 問YSQFN SCL MYSClFN.SCl ノ23/98 09 :SUMI SUM" 柏 RY SCL のRY.SCL 09/23/98 TEST SCL TEST.SCL 0 9 / 2 3 /98 TESTSl TESTSUM,SCL I ' I SCL 合T SCL 日CF,SCL 09/23/90 V倫RST CSFR 2 7 7

271.

第 3節 WebAFが提供するアプリケーションデ.ザイン機能 第 1項フレームにコンポーネン卜を D rag&Dropして、アプリケーションの構築が可能 第 2項さらに高度なアプリケーションを構築する場合には、 WebAF の強力なエディタ により J a v aのソースコードを追加可能。 主主議選宰 刷川副 2 出印刷問拍 山 一 町 一 剛 山 川・・・・・ 2 7 8

272.

第4節その他の機能について 第 1項 開 発 環 境 口 2 7 9

273.

‑ プロジェクトナピゲータ プロジェクトナピゲータは、すべてのコンポーネント、ファイル、クラス、およびアプリケーショ ンのリソースを管理する事により開発者をアシスト。 回日園 c o n n e c t i o n l 申園 d a t a Se t ln t e r fa c e 1 申‑盟 d a t a Se t L i s t ln t e r f a c e 1 回一盟 l a b e l l 自国 l i s t B o x l 自国 t a b l e V i e w l ‑ コンポーネントパレット コンポーネントパレットは、ドラッグ&ド、ロップで、きる部品を提供する。 最初のコンポ一ネントい/パξレツトはプロダ.クトに付属するJ a v 刊a B e a 叩n で ユ一ザザ は既存のタブ、にコンポ一ネントを追加する事も可能で、あり札、新しいタブブ、を追加する事も 可能。 a v a B e a nのクラスで、あってもツールパーに追加する事が可能となっている。 またどの J ‑280一

274.
[beta]
‑

アウトプット領域
n
アウトプット領域は、 Compile、Debug、Messages、ComponentLog、Tool Outoput、Find I
F
i
l
e
sのそれぞ、れのタブによって構成されている。

主

?

.
.

、

、

…一一一~~...~ ".................................""............一一一一"''''''''~''''''''.'.'…一一….,.,.......一一一一

‑

環境のカスタマイズ
プロジェクトナビゲー夕、コンポーネントパレット、アウトプットウインドウ、その他のツールパ
ーの位置は、自由に変えることが可能になっている
η

J.
北関心 emoC p
onenb
四百

[
:
;!
!
]i
r
n叫 emo
包 囲 conn岡 田1
回 目 白l
a
Se
l
l
n
l
e
r
f
a
c
e
1

I
f
)国 d
a
l
a
S
e
l
L
副 n
t
e
r
f
a
c
e
1

出国同bel
1
{卦圃

l
i
s
!
8
0
1
<1

出国議総隊語i(j;

2
8
1

275.

第4章 WebEIS 第 1節 WebEISとは WebEISは SASが提供する J a v aを利用したレポーティング&開発環境といえる。 この WebEIS上では J a v aによるコーディングは一切記述する事なく、 Drag&Drop の操作によって、 S AS/EISのようなグ ラフとレポートが連携するアプリケーションを構築する事 が可能である。また構築されたレポートを簡単に J a r F i l eなどに書き出す事ができるため、す ぐにレポーテイングを行える J a v aアプレッ卜となる。 SAS のデータセットや MDDB に簡単にアクセスし、コード レスで、レポート設計を行えるが、 エンド、ユーザーはアプリケーションを構築しているとしづ感覚は全くない。 WebEIS によって構築されたレポートは、まさに WebOLAP と言えるもので、簡単な操作で MDDBのテーブルをスライス&ダイス、ドリルダウン、リーチスルー、 E x c e l へのデータの書き 出し、統計量や行と列の項目の再設定などが Webブラウザ上で行える。 それでは実際に WebEISの画面を利用して、 MDDBにアクセス可能なレポーティング環境 を構築してして。 (画面は開発中のもので、実際にリリースされたものと異なる場合があります。) ‑282‑

276.

第 2節 WebEISによるクライアント環境の構築 操作はオブジェクトが格納されているツールパーから、レポートを行うためのオ ブジェクトを右側のスペースに Drag&Dropを行い、レポートの設計を行う。 今回は「テキスト」、「多次元テープル」、 fPieChartJ、fSegmentBar Chartj の 4つを利用した。 SUMofFURNITUREActualSales M D D Bに対する検索の結果、多次元テーブルやグラフに、結果が格納される。 ‑ 2 8 3一

277.

SUMofFURNITUREActualS.I8s また構築されたレポートを、指定されたブラウザソフトに渡して、データサーパ a v aアプレットが起動する。 に接続を行った後、 J 起動された画面には W e b E I Sで設計を行った画面がそのまま表示されている。 ブラウザ上では、 S A S / E I S ソフトウェアと同じようにテーブルのドリルダウン、 リーチスルー、展開、回転、サブセット等が行える。 しかし、 S A S / E I S と違うところは、図でもわかるように展開を維持したまま回転 を行っている。 ‑ 2 8 4

278.

特定のセルに対してリーチスルーを行い、詳細データを表示させることが可能で ある。またリーチスルーが行えるのは、多次元表のセルに対してだけではなく、 グラフからも可能である。 また表示されている詳細データをそのまま E x c e l( C S V形式)のシートに保存す ることも可能である。 上図では行に P u r o d u c t L i n eという階層情報が入っていたが、それを T i m eという 軸に変更し、再検索を行ったところである。検索が終了すると行の軸に新たに T i r n eの階層が現れて、多次元表とグラフのほうに反映されている。 285一

279.

第 5章 ま と め ここまで見てきた通り、本稿で、はエンド、ユーザーにとって、プラットフォーム依存型の開発環 境に疑問を提示し、それに対する SASシステムの MVAとMEAの設計思想を説明した。 そうした中で、新たな技術として発展してきたインターネットの技術が、 SASシステムと同じよ うにプラットフォームから独立した環境として、企業システムにどのように取り込まれ、発展して きたかを見てきた。また同時にその限界と、 Javaによる新たな発展性をについて考えてきたの この中で Javaの説明について多くの字数を割し、てきたが、今後の Javaの発展を考えると AppDev S t u d i o Jを理解するためにも必 無視できない事であり、また SAS よりリリースされる i 要な内容であった。 また現在リリースされている SAS/lntrNet ソフトウェアでもダイナミックなアプリケーションを 作成する事が可能であり、現在も数多くのユーザが Webブラウザ経由で SASシステムが搭 h i n C l i e n t及 び Webブラウザから利用し、 載する強力なデータエンジンと、統計解析機能を T 企業内の情報系システム及びデータウェアハウスを最大限に活用している。 これに加え、今後リリースされる Java2の Swingや HotSpotと 、 AppDev S t u d i oの持つ強力 な統合開発環境が提供されれば、より多くのエンドユーザ、がこの恩恵を受ける事がで、きるで、 あろう。 アメリカの SASユーザ一事例の発表で、は、アメリカのフロリダ、地区をマーケットとした顧客数 300万人の医療保険会社である B l u eC r o s sB l u eS h i e l dでは、顧客サービスの向上とクレー ム処理の状況や保険の請求額を把握するシステムを SAS/AFソフトウェアと SAS/EISソフト ウェアを利用して、クライアント/サーバ環境を構築しているの最初は 1 0ユーザからスタートし 0ユーザに増やし、秋には Web/AFと Web/EISで、構築したアプリケーション たが、その後 5 を用いて、 1 0 0 0人で禾Ij用する予定となっている。データ容量は約 100GBとなっている。 1000 人の利用規模になれば、一台 台に OLAPツールをインストールした場合とのコストの差は 歴然となる。 SAS システムと J a v aシステムを用いたシステム構築の最大の目的は導入コストの削減とも 言う事ができるが、それは導入時だけではなく、維持・運用においてもその目的は十分に発 揮され TCO削減と既存資産の有効利用にもつながると確信している。 今回は WebAFでは概略的に「何ができるのか ?Jを中心に進め、 WebEISは実際に Java によるレポーティング環境の構築から、パッケージ化まで‑を行った。 今後はデータウェアハウスとそれを利用する環境として、インターネット、イントラネットを利 用する形態がますます増えてくると思われる。そのような中で SAS システムは高速なデータ 検索・加工能力と正確な統計解析処理、加えて強力なデータマイニングのプロダクト、そして SAS/lntrNetソフトウェアと AppDevS t u d i oを利用した i l n t e l l i g e n tC l i e n t Jを実現する強力な 意思決定支援のための情報系システムを構築する事が可能になるであろう。 ‑286一

280.

日本 S A Sユーザー会 (SUG I‑J) 次期パージョンにおける SAS/ACCESSソフトウェアの拡張点 今城義高 ソリユーション本部 ソリユーションプランニングセンター (株) SASインスティチユートジャパン ChangesandEnhancementsωSAS/ACCESSS o f t w a r e Y o s h i t a k aImaki S o l u t i o nP l a n n i n gC e n t e r o l u t i o n s, SASI n s t i t u t eJapan,L t d . B u s i n e s sDevelopment& S 要旨 次期メジャーパージョンでは、 SAS/ACCESS ソフトウェアの大幅な機能拡張が行われる。これによ り、より容易にかつ効率的にデータベースにアクセスできるようになる。また、ロングネームサポー トなどによりデータベースのカラム名をそのまま SASの中で扱えるようになるため、親和性も高まり、 より透過的にデータベースにアクセスできるようになる。ここではその拡張機能について説明する。 キーワード: ACCESSDBMSSQLDBLOADDataWarehouse l.概要 次期パージョンではあらたな機能として「ダイナミック DBMSエンジン」が加わる。 l ibnameステ ートメントに各種 DBMS毎に用意されたエンジン名を指定することで、ダイレクトにデータベースサ ーパに接続できるため、従来の SASデータライブラリと同様に扱うことができる。これにより、 ACCESS ディスクリプタや ACCESS ビューを作成、定義することなく、 DBMS のテーブルの一覧、読込み、 更新、削除、およびテーブル作成が可能となる。「ダイナミック DBMSエンジン」は、 DB2,ORACLE, SYBASE,INFORMIX,ODBC, INGRESに提供される予定である。 2文 また、 SASシステムのロングネームサポートにより、 DBMSのテーブル名、カラム名を最大 3 字までそのままの名前で取り込める。よりデータベースとの親和性が高まるため、 Warehouse 構築の 際のデザイン設計においてより作業が単純イじされる。 パフォーマンスの改善も行われる。 SQLビュー経由での DBMSテーブルの更新、 DBMSのインデ ックス、ロッキング、コンカレンシ機能の制御、 ACCESS プロシジャによるディスクリプタの更新な ー 287

281.

とがあげられる。 SAS/ACCESSソフトウェア IMS でサポートしているダイナミック DATAステップインタフェース もパージョン 6との互換性を保ちながら SASロングネームサポートなどの拡張が行われる。 なお、パージョン 6で提供されている ACCESSプロシジャ、 DBLOADプロシジャ、 SQLパススル ー機能、アクセスおよびビューディスクリプタは次期パージョンにおいても互換性を保証する。 INGRES などほとんどの 以上、述べた拡張機能は、 DB2.0RACLE.SYBASE.INFORMIX.ODBC. DBMSに提供され、またプラットフォームについても、 Windows95,WindowsNT ,O S/2,AIX,HP‑UX, S o l a r i sおよび MVSに提供される。 2. ダイナミック DBMSエンジン 従来のように事前に ACCESSディスクリプタや ACCESSビューを作成、定義することなく、 DBMS のテーブルの一覧、読込み、更新、削除、およびテーブル作成が可能となる。 2 . 1データベースへの接続方法 libnameステートメントに各種 DBMS毎に用意されたエンジン名と接続に必要な各種パラメータ(デ ータベースサーバ名、ユーザ名、パスワードなど)を指定して、 submit することにより、データベー スに接続できる。 ORACLEの例を下記に示す。 l i b n a m ed b l i bo r a c l e! J Sf>r = s p o . t tn日 間 woro= . t i ! "f>r岬 町 円= o r l l S同 , 複数の DBMSに対して接続したい場合は、同様に l ibnameステートメントを発行すればよい。 2. 2 データベース情報のリステイング libnameステートメントを発行した後は、従来の SASデータライブラリと同僚に、ライブラリ参照 b l i b で接続されたデータベース内のテープル、ビュー情報を取得することができる。ここでは 名 d DATASETSプロシジャを用いた例を示す。 p r o cd a t a s e t sl i b = d b l i b ;r u n ; DATASETSプロシジャの出力 L i b r e : f DBLIB Eng~e: ORACLE P h y s i c a lName: o r a s r v U s e r / S c h e m a : s c o t t #1 Name Memtype 1 DEPT DATA 2 EMPLOYEES DATA 一2 88‑

282.

3 INVENTORY DATA 4 SALES DATA 同様に SASSQLディクショナリーテーブルを用いるこも可能である。 p r o cs q l ; ぬn ary.members s e l e c tmemnamefromd i c t wherelibname= DBLIB"; Mp .mh p .rN < lm ρ DEPT EMPLOYEES INVENTORY SALES 特定のテーブル内のカラム情報を取得する場合は次の指定をする。 p r o cs q l ; o r m a t s e l e c tname,f fromd i c . t i o n a r y . c o l u m n s wherelibname= DBLIB" and menmame= 官 MPLOYEES"; 2. 3 DBMSテーブルの読み込み PRINTプロシジャによる読み込み例を示す。 p r o cp r i n tda . t a = d b l i b . d e p t ;r u n ; PRINTプロシジャの出力 l ' v I E DNA LOC Obs DEPTNO 1 1 0 ACCOUNTING NEWYORK 2 20 RESEARCH DALLAS 3 3 0 SALES CHICAGO 4 40 OPERATIONS BOSTON 2 8 9

283.

上記の例でもわかるように、割り当てたライブラリ参照名とテーブル名を指定するだけで、従来の SASデータセットとまったく同じ記述でデータベースのテーブルをアクセスすることができる。 CONTENTSプロシジャの出力例も添付しておく。 p r o cc o n t e n t sd a t a = d b l i b . d e p t ;r u n ; 1 CONTENTSプロシジ主の出 1 DataS e tName: DBLIB.DEPT Member乃p e : DATA E n g i n e : ORACLE n f o r m a t V a r i a b l e Ty p e Len Format I L a b e l DEPTNO Num 8 3 . 3 . DEPTNO DNAME Char 1 4 $ 1 4 . $ 1 4 . DNAME LOC 1 3 $ 1 3 . $ 1 3 . LOC Char 2. 4 DBMSテーブルの更新 ダイナミック DBMS エンジンは、データベースの更新もできる。下記プログラムは、テープル名 DEPTの中のカラム名 DEPTNO の値が 1 0の行すべてについて、カラム名 LOC の値を N a s h i v i l l e に更新する処理を、 SQLプロシジャで記述した例である。 p r o cs q l ; u p d a t ed b l i b . d e p ts e tl o c = " N a s h i v i l l e " whered e p t n o=1 0 ; 2. 5 DBMSテーブルの作成 これも基本的には従来どおり新しい SASデータセットを作成するイメージと同じである。既存のテ ーブルを読み込み、ある条件でサブセットした行を新しいテーブルとして格納する例を示す。ここで は DATAステップを用いて NYDEPTという新しいテーブルを作成している。 d a t ad b l i b . n y̲ d e p t ; s e td b l i b . d e p t ( k e e p = d n a m ed e p t n o ) ; wherel o c= NEWYORK"; r u n ; もうひとつサンプルを付け加えておく。既存の SASデータセットを DBMS テーブルとして格納す ‑290

284.

るのだが、その際に変数名のリネームも同時に行う例である。もちろん DATAステップでの処理も可 能であろう。 p r o cs q l ; c r e a t et a b l ed b l i b . a p r ̲ s a l e sa s a s u s e r . s a l e s(rename ( s l = s a l e s l ) ) ; s e l e c t*froms 二 2. 6 DBMSテーブルの削除 SASデータセットと同様な記述で削除も可能である。 SQLプロシジャと DATASETSプロシジャの 例を示す。 p r o cs q l ; d r o pd b l i b . n e w s a l e s ;q u i t ; p r o cd a t a s e t sl i b = d b l i bn o l i s t ; d e l e t en e w s a l e s ;r u n ;q u i t ; 2. 7 SASエクスプローラからのアクセス これまですべてプログラムを用いて説明してきたが、一度ライブラリを割り当ててしまえば、 SAS デスクトップ環境の SASエクスプローラ画面からテーブルー覧、内容確認、検索、削除などが行える。 ibnameステートメントの発行 要するに従来の SASデータライブラリと同様な操作ができる。また、 l のかわりに、現行リリースのライブラリ参照ダイアログ画面の中のライブラリ割当ダイアログ画面か らもマウス操作で DBMSへの接続が可能で、ある。 SAS起動時の自動割当チェックボックスも同様に機 能する。 3. SASと DBMS聞のオブジェクト名の変換について 3 . 1 一般的な変換規則 次期パージョンの SAS システムではメンバ名(データセット名)と変数名の長さが 3 2文字まで拡 張される。文字として、 A・Z, a仏 0 ‑ 9、および下線が使用可能である。 日本語版にいては、日本語 文字の使用も可能とする方向で検討中である。 DBMS も含め一般的にオブジェクト名(テーブル名、 werc a s e )、大文字 ( u p p e rc a s e )、混合 (mixedc a s e )などのルー カラム名)の命名においては、小文字(lo ルを持っているので、今回の機能拡張により、より忠実に DBMSのオブジェクト名を SAS の中で利 用することができる。現行パージョンにおいては 8文字という制限による切り捨てが発生するために、 名前の再定義が必要だからである。 ‑ 2 9 1

285.

ダイナミック DBMSエンジンは、カラム名を SAS変数名に変換する際、デフォルトによりすべて の英文字を大文字に変換する。 SASデータセットを DB2にロードする例を以下に示す。 l i b n a m em y l i bdb2s s i d = u s e r 1 ; d a t am y l i b . p h o n e ̲ n u m b e r s ; i n p u thome̲phone$work̲phone$ ; c a r d s ; 3 4 5 ‑ 3 4 5 65 5 5 ‑ 4 0 4 0 1 1 1・3 3 3 32 2 2 ‑ 4 4 4 4 CONTENTSプロシジャの出力 DataS e tName: MYLIB.PHONE̲NUMBERS MemberT yp e : DATA E n g i n e : DB2 乃 pe Len HOMEPHONE Char 8 WORKPHONE Char 8 V a r i a b l e # 2 。 。 P o s L a b e l HOMEPHONE WORKPHONE そ こ で 、 こ れ ら の デ フ ォ ル ト 変 換 を 抑 止 す る た め に 、 例 え ば DB2 エ ン ジ ン に は 、 PRESERVE̲TAB̲NAJdES (テーブル名用)、 PRESERVE̲COL̲NAMES(カラム名用)の 2つのオプシ ヨンが用意されている。下記に使用例を示す。 DATA ステップで作成されたデータセット名および変 数名がそのまま DB2のテーブル名、カラム名として使用されているところを確認いただきたし、 libnamem y l i bdb2s s i d = u s e r 1 ; p r e s e r v e ̲ t a b ̲ n a m e s = y e s ; p r e s e l v e ̲ c ol ̲ names=yes; d a t amylib.PhoneNumbers; i n p u tHomePhone事WorkPhone$ ; c a r d s ; 3 4 5 ‑ 3 4 5 65 5 5 ‑ 4 0 4 0 1 1 1 ‑ 3 3 3 32 2 2 ‑ 4 4 4 4 CONTENTSプロシジャの出力 ← 2 9 2

286.

DataSetName: MYLIB.PhoneNumbers MemberT y p e : DATA E n g i n e : DB2 # V a r i a b l e Type Len 1 HomePhone Char 8 2 WorkPhone Char 8 。 。 Pos Label HomePhone WorkPhone 3. 2 ブランクを含むオブジェクト名 ほとんどの DBMSではブランクを含むテーブル名やカラム名をサポートしている。次期パージョン では、前述したネーミングルールに加えてこれらの特殊文字もサポートする。 SQL プロシジヤを用い て、新たにテーブルを作成する例を示す。この時、 SAS システムが正しくオブジェクト名を認識する よう項目名をダブルクォーテーションで囲むことに加え、 SQL プロシジャステートメントオプション qoute=ansi を指定する。 の d ρu' nuρu' 氷川 咽'印刷い 加 mm NKMO EU Mm り aubu 一 ・'勺 ‑ m h d ‑ ・ ‑ v v s b " 1' i ) ) " 円 r lu " av nt pu Fmmwνm し・別心 比巴 unu 以 M d ω d qaC 廿 C dtfUr u ‑ FUρ 巾 M.MM. 5fdEd tk ︑円︑ d ︐ ρ U J I︑ ︐ CU1 ー r ︼ p r o cs q ld q u o t e = a n s i ; c r e a t eviews a s u s巴r . d b2vicwas s e l巴c t MyColumn"a smycol fromm y l i b . " T a b l巴 Name"; q u i t ; p r o cc o n t e n t sd a t aニ s a s u s e r . d b2vi e w ; r u n ; CONTENTSプロシジャの出力 DataS e tNam巴 SASUSER .DB2 VlEW Member乃 p e : VlEW V a r i a b l e s : E n g i n e : # SQLVIEW V a r i a b l e τ ' yp e Len P o s ‑293‑ L a b e l

287.

mycol Num 8 。 MvColumn 4. SQLビューへの libnameステートメントの組み込み 前述したように、 libnameステートメントにより DBMSへ接続した後は、 SQLプロシジャなどを使 って自由にアクセスすることができることは理解していただけたと思うが、さらに libname ステート メントの発行処理そのものを SQLビューの中に組み込むことができる。記述方法は下記のとおり。 P3 ρU a v ︑ m ‑ w QU OU v L u s a s w o u ‑ V 川 町 ErHou q は S ρ‑UVA o rc p s e l e c tdnamef r o md b l i b . d e p t u s i n gl i b n a m ed b l i bo d b cu s e r = s c o . t tpw= . t i g e rd a t a s r c = o r s r v ; SQLビュー作成後は、 SQLビュー sasuser.myview をアクセスするだけで、自動的に DBMSに接 続し、処理終了後は自動的に DBMS との接続を切る。利用者側は SQL ビューの名前だけを覚えてお けばよいことになる。 次に異なる 2つの DBMSのテーブル同士をジョインした SQL ビューを作成する例も示す。プログ ラムを見ていただければ理解できるであろう。 p r o cs q l ; c r e a t ev i e ws a s u s e r . m y v i e wa s s e l e c tdname f r o mo d b l i b . d e p tt 1 ,o r a l i b . d e p t 2: 1 2 wheret 1 .d e p t n o=t 2 . d e p t n o u s i n g l i b n a m eo d b l i bo d b cu s e r = s c o t . tp w = t i g e rd a t a s r c = o r s r v, l i b n a m eo r a l i bo r a c l euser=myidpw=mypwpa . t h = o r a s r v ; 5. SQLビューによる DBMSデータの更新 パージョン 6では SQL ビューは READONLYであり更新はできない。次期パージョンでは SQL ビューを用いてテープワレの基礎的な更新が行えるようになる。ただし、次の場合には更新できない。 ‑作成された SQLビューは lつの DBMSテーブルあるいはビューを基本としているものに限 られる。複数のテーブルやヒ、ユーを用いている場合には更新できない。 .SQL ノtススルー機能を用いている SQL ビューは更新できない。 ‑294‑

288.

記述方法は次のとおりである。 p r o cs q l ; c r e a t eviews a s u s e r . m y v i e wa s y l i b . u e p t s e l e c t*fromm u s i n glibnamem y l i bo u b cu s e r = s c o t tp w = t i g e ru a t a s r c = o r s r v ; p r o cs q l ; updates a s u s e r . m y v i e w s e t1 ∞="Nashville"whereueptno=10; 6. パフォーマンスの改善 6. 1 テーブルジョインにおけるパフォーマンス SQLパススルー機能を用いない限り、 2つ以上のテーブルのジョイン処理はすべて SQL プロシジ ャ内で行われる。つまり、それぞれの DBMSテーブルすべての行を SAS システムに取り込んだ後に SAS システムの中でジョイン処理が行われる。したがって、テーブルサイズが大きい場合などには、 DBMSと SASシステム聞のデータ転送に多くの時間を必要とする。これがネットワークを介している 場合であればなおさらである。解決策は DBMS側でできる処理は可能な限り DBMS側で行わせるこ とである。次期パージョンでは、指定された DBMSテーブルが同ーのデータベースサーバ内にあると 認識した場合(つまりライブラリが同ーの場合)、ジョイン処理をすべて DBMS側に渡す。 DBMS側 でジョイン処理が行われ、その結果のみが SASシステムに戻されるため、パフォーマンスの向上が期 待できる。 p r o cs q l ; .d eptno,dnamefrom s e l e c tt a bl u b l i b .t a b l e1t a b1 , d b l i b . t a b l e 2t a b 2 .d eptno=t a b 2 . d e p t n o wheret a bl u s i n glibnamed b l i bo r a c l eu s e r = s c o t tp a s s w o r d = t i g e rp a t h = o r a s r v ; 6. 2 大きい DBMSテーブルと小さい SASデータセットのジョイン よく出くわす処理に、比較的少量な SASデータセットにマッチする情報を大規模な DBMSテープ ルから取り出してくることがある。今までの方法だと DBMSテーブル上のすべての行を SAS システ ムに取り込む必要があるために、かなりの時間を必要とした。 ‑295‑

289.

これを解決するために、次期パージョンでは SQLプロシジャおよび DATAステップにおいて DBKEY オプションが追加される。 DBKEY オプションを指定することにより、最適イじされたWhe r e 句が DBMSサーバに渡される。以下にプログラム例を示す。 l i b n a m ed b l i bo r a c l eu s e r = s c o t tp w = t i g e r ; p r o cs q l ; .d e p t n o,1 ∞from s e l e c tt a bl d b l i b .t a b l el ( d b k e y = d e p t n o )t a b l,s a s u s e r . s a s d st a b 2 .d e p t n o=t a b 2 . d e p t n o ; wheret a bl この例では DBKEY オプションに d e p t n o を指定している。 SAS システムは SAS データセット s a s u s e r . s a s d s の 変 数 名 deptno の値を読み取り、内部的に wheredeptno = deptnoの値のような where句を生成し、 DBMSサーバに渡す。これにより SAS データセットに存在する deptno を持つ 行のみが渡ってくるため、不要なデータ抽出および転送のための時聞が短縮できる。 DBMS には内部 的に次のような SQLが発行されることになる。 s e l e c td e p t n o, 1 ∞ 仕omt a b l e l whered e p t n o=: h o s t v a r i a b l e ; e p t n oの値がセットされる。これを SASデータセットの : h o s t v a r i ab l e には SASデータセットの d オブザべーション数だけ発行されることになる。したがって、すべてのケースにおいてパフォーマン スが改善されるわけではなく、経験上、 SAS のトランザクションが比較的少量の場合に効果が期待で きると思われる。 DBKEYオプションは DATAステップにおいても使用できる。 SETステートメントの KEY=オプシ ヨンとあわせて指定する。 d a t as a s u s e r . n e w ; s e ts a s u s e r . k e y v a l u e s ; s e td b l i b . m y t a b l e ( d b k e y = d e p t n o )k e y = d b k e y ; r u n ; A S / A C C E S Sソフトウェアでは DBINDEX=YES,DBINDEX=NO, DBKEYオプションに加えて、 S DBINDEXニ < i n d e xname> オプションの指定により、インデックス情報を与えることもできる。イン デックスが設定されていることを知っている場合には DBINDEX=YES を、さらにインデックス名が わかっている場合には、 DBINDEX=にインデックス名を指定することができる。 7. DBMS接続のための制御オプション ‑296

290.

DBMS へ接続する際は、多くのリソースを必要とするためオーバヘッドがともなう。次期パージョ ンの SAS/ACCESS エンジンは、これらのオーパヘッドを軽減するために、接続処理のタイミングを 制御できる。また、 1つの DBMS接続を複数のライブラリ問で共用することも制御できる。 デフォルトでは DBMSへの接続処理は、 libnameステートメントを発行する度に行われる。 1つの ライブラリに対して複数のデータ読み込み要求があった場合には、読み込み専用の接続として共用す る。しかし、同ーのライブラリを参照しながら DBMSの更新を行った場合には、更新用の新しい接続 が確立され、以後、更新処理はすべて新しい接続を用いて行われる。 したがって、 DBMSサーバに対して複数のライブラリを割り当て、かっ DBMS テーブルの更新を 行わない場合には、オプションの指定により接続を最適化できる。 CONNECTION オプションは、 DBMS へ単一の READ‑ONLYの接続として共用するためのライブラリ定義を制御する。記述方法は 下記のとおり。 l i b n a m ed b l i b ldb2a u t h i d = u s e r l c o n n e c t i o n = g l o b a l r e a da c c e s s = r e a d o n l y ; l i b n a m ed b l i b 2db2a u t h i d = u s e r l c o n n e c t i o n = g l o b a la c c e s s = r e a d o n l y ; 一方、 DBMS への接続のタイミングを遅らせることもできる。通常、 libname ステートメントが発 行された時点で DBMSへの接続は確立されるが、 DEFERオプションを加えることにより、 DBMSへ の接続は行われず、その後、ライブラリをアクセスした時にはじめて DBMSへの接続が行われる。 l i b n a m ed b l i b1db2a u t h i c l = u s e r1d e f e r = y e s ; SAS自動実行ファイル AUTOEXEC.SASなどで、 libnameステートメントの定義を行う場合、起動 ニYES オプションを指定すること 直後にそのライブラリをアクセスすることがない場合には、 DEFER により、 SASの起動自体のスピードをアップすることができる。 7 . ロッキングおよびコンカレンシ制御について 次期パージョンの SAS/ACCESSエンジンでは、 DBMSエンジンオプションを用いて SASプログラ ,page およびテーブルロックなどを制御できる。例えば ORACLE エンジンには、 ムから row READLOCK̲TYPE UPDATELOCK̲TYPE 、 READISOLATIONLEVEL UPDATE̲ISOLATION̲LEVEL、 LOCKWAIT オプションが提供される。デフォルトでは ORACLE エンジンはテーブルから row を読み取る際、テーブルロックは行わないが、ロッキングオプションを 使ってロックすることができる。たとえば、データを読み込む際に他のプロセスからのテーブル更新 297‑

291.

を防ぎたい場合には、 READLOCKTYFEオプションを指定する。 p r o cs o r td a t a = d b l i b . d b t a b l e ( r e a d l o c k ̲ t y p e = t a b l e ) o u t = s a s u s e r . m y t a b l e ;b ym y c o l ; この例ではソート実行中に他のプロセスによって更新がかからないように、テーブルのシェアリン グを禁止している。ロッキングオプションは libname ステートメントでも指定可能である。下記の例 では ORACLEのテーブルは rowレベルでロックされる。 l i b n a m ed b l i bo r a c l eu s e r = s c o t tpassword t i g e rp a t h = o r a slVupda . t e l o c k ̲ t y p e = r o w ; 二 8. ダイナミックプロンプトオプション 次期パージョンでは DBMSサーバ接続の際のユーザ名、パスワードなどのパラメータを接続時に動 的に指定することができるようになる。 libname ステートメント中に DBPROMPT=YES オプション を指定することにより、入力用プロンプトが表示される。従来のようにあらかじめ ACCESSディスク リプタや SQLビューの中に埋め込む必要がないため、より汎用性が高まる。 l i b n a m el i b1o r a c l edbprompt=yesd e f e r=no ; 9. SQLパススルー機能への影響 次期パージョンではオブジェクト名(テーブル名、カラム名)の 3 2文字サポートが行われる。した がってパージョン 6で作成されたプログラムを実行した場合、 i3. SAS と DBMS聞のオブジェクト 名の変換について」の項で述べたように、 8文字を越えるカラム名を参照していた場合、基本的に大文 字に変換されそのままの名前で SAS変数名に変換される。つまり 8文字で切り捨てる動作が働かない。 このため、パージョン 6と同じ変換規則を適用させるには必ず次のオプションの指定が必要で、ある。 o p t i o n svalidvarname=v6 ; 1O. ラインモードによるディスクリプタの更新 次期パージョンではラインモードにて ACCESSプロシジャを使って、既存のビューディスクリプタ を更新することができる。次の例は ORACLEに対するビューディスクリプタのパスワードおよびパス 名を変更するものである。 p r o ca c c e s sd b m s = o r a c l e ; ‑298

292.

m o d i f ys a s u s e r . o r t a b l e . v i e w ; orapw=mme path="NEW̲SERVER"; r u n ; 11.パージョン 6との E換性 次期パージョンでは ACCESSプロシジャと DBLOADプロシジャのフルスクリーンモードを除いて は、完全なる E換性を提供する。既存のすべてのプログラム、ビューディスクリプ夕、 SQL ビューな どはそのまま利用できる。 ACCESS プロシジャと DBLOAD プロシジャのフルスクリーンモードは次 期パージョンでは廃止されるので注意されたい。 12. IMSのための DATAステップインタフェース 従来の機能に加えて、 SASシステム自体のロングネームサポートにより、変数名が 32文字まで拡張 される。プログラムサンプルを示す。 d a t as a s u s e r . c u s t l i s t ; i n f i l ea c c t s a md l is t a t u s = s tp c b n o = 2 ; ∞̲sec̲number$charll i n p u t@ls i n p u t@12customer̲name$ c h a r 4 0 . ; h e nd o ; i fs tne t p u t ̲ a l l ̲ ;a b o r t ; e n d ; r u n ; p r o cp r i n td a t a = s a s u s e r . c u s t l i s t ; varcustomer̲name; ' ; t i t l e' C u s t o m e rL i st r u n ; 13. DBMSの"SCOPE"および"SCHEMA"の指定 libname ステートメントでは必要に応じて DBMS の"SCOPE"あるいは "SCHEMA"をライブラリオ プションとして指定することができる。 DB2 では AUTHORIZEID、 LOCATON、 ORACLE では SCHEMA、DBLINKと言われるものである。 ORACLEに対して SCHEMAを定義する例である。 ‑299

293.

l i b n a m ed b l i bo r a c l eu s e r = s c o t tp a s s w o r d = t i g e rschema ニo u r g r o u p ; 14. DBMS接続/切断 EXITの提供 l ibnameステートメントのライブラリオプションに DBMS接続直後に実行したい DBMSコマンド あるいはストアードプロシジャの定義ができる。記述方法は次のとおり。 l i b n a m ed b l i bo r a c l eu s e r = s c o t tp a s s w o r d = t i g e rdbinitcmd="EXECMY̲PROCEDURE"; l ibname ステートメントが発行されると DBMS への接続が完了後、ストアードプロシジャ MY ̲FROCEDUE が実行される。ストアードプロシジャおよびコマンド実行はし巾当なるデータを返す ことはしない。コマンド実行が失敗した場合、 DBMSへの接続が失敗した場合は、 SAS ログにエラー メッセージが表示されるとともに、 SASマクロ変数 SYSDBRC、SYSDBMSGにエラーコード、エラ ーメッセージがそれぞれセットされる。 15. 文字変数の 32KBサポート 次期パージョンでは SASの文字変数の格納可能な長さが 3 2, 768バイトまで拡張される(現行は 200 バイト ) 0 SAS/ACCESSエンジンでもこれに準じ、最大 3 2, 768バイトの文字変数の取り込み、書き 込みが可能となる。 16. SYSDBRC 、SYSDBMSGマクロ変数 次期パージョンでは 2つのグローパルシステムマクロ変数がサポートされる。 SYSDBRC および SYSDBMSGであり、直前に実行された SAS/ACCESS エンジンステートメントの実行結果が格納さ れる。 SYSDBRCには DBMSからのリターンコード、 SYSDBMSGには DBMSからのエラーメッセ "、SYSDBMSGにはブランクがセットさ ージが格納される。正常終了の場合には SYSDBRCには 0 れる。 、SQLXMSG もそのままサポートされる。ただし、これ パージョン 6で提供されている SQLXRC らのマクロ変数は SQLパススルー機能を使用する時のみ有効であることに注意されたい。 下記に ORACLE接続時にユーザ名、パスワードを間違えた場合の SYSDBRC、SYSRCMSGの値 を参照した例を示す。 l i b n a m ed b l i bo r a c l eu s e r = b a dp a s s w o r d = w r o n g ; %put& s y s d b r c ; . 1 0 1 7 3 0 0一

294.

%put&sysdbmsg; ORACLE:ORA‑OlO1 7 :i n v a l i d u s e r n a m e / p a s s w o r d ;l o g o nd e n i e d 17.おわりに 次期パージョンの SAS/ACCESSソフトウェアは DBMS との親和性がより高まり、さらに柔軟にデ ータベースへのアクセスができるようになることを理解いただけたと思う。 SAS で DataWarehouse を構築する際により時間を短縮することができるであろう。次期パージョンの SAS システムが早く皆 様にリリースされることを願ってやまない。 参考文献:SUGI23P a p e r :V e r s i o n7Enhancementst oSAS/ACCESSS o f t w a r e, V i n oGona,SASI n s t i t u t eI n c .,Cary , NC JanaVanWyk,SASI n s t i t u t eI n c .,Cary , NC 3 0 1

295.

論文発表 SASソリユーション

296.

日本 S A Sユーザー会 (SUG I‑J) ビジネスにおけるデータマイニングの利用と実際 スピード時代に応える俊敏な経営に関するアプローチー 青柳恭弘*中西みなと料 *マーケテイング部材コンサルテイング部 株式会社 SASインスティチュートジャパン DataMiningusingareaandp a r t i c u l a rstudybySASEnterpriseMiner Responsetoa g i l emanagementandapproach n s t i t u t eJapanL t d . YasuhiroAoyagi,MarketingDepartment,SASI n s t i t u t eJapanL t d . MinatoNakanishi,ConsultingDepartment,SASI 要旨 激動の経済環境にある現在、各組織の戦略には「グローバル&スピード」が要求されている。本稿 では、この要請に『情報に主眼を置いて』応える情報技術として注目されるデータマイニングの利用と 実際を事例を交えて報告する。 キーワード EnterpriseMinerソフトウェア 1.はじめに 激動の環境にある現在、各組織の戦略は『グローパル&スピード』に集約されてきている。企業形 態と経済モデルが大きく変化する中、企業・組織=個人のそれぞれにおいて俊敏な変化と柔軟な対応 が出来るビジネス・モデルが要求され、それに伴う基盤技術や情報技術の構築が急務と考えられてき ている。 情報化戦略の大きな基盤のひとつとして、分散して集積されたデータを統合化して利用するコンセ プト!こ基づ、くデータウェアハウスの構築およひ.大容量データから価値ある情報を見つけて活用すること を目的とするデータマイニングの試みが、多くの企業において行われ始めている。 ntrane . tExtranet等のネットワーク・コンピューティング、技術に 最近では Webを中心とする Internet,1 より、地域・時間・人物属性を超えた要因の連携が可能となり、新しい情報化戦略ビジネスも日々創造 されてきている。 本稿では、最近の情報化戦略のひとつであるデータマイニングの利用と実際について、事例を交え ながら報告する。 h 戸 u ηべU ハHU

297.

2 .何故データウェアハウスが必要なのか 近年のコンビュータ技術の発達に伴い、我々を取り巻くデータや情報は年々増加の一途を辿ってい る。情報のコンビュータ化が始まった 1960年頃から約 40年を迎える今日の企業のビジネスマンにお いては、毎年 1%ずつ情報処理の増加がなされているとも言われ、入手したデータに基づ、く事実把握 や判断根拠としてデータを利用する必要性が求められてきている。 しかし、データをそのまま眺めてみても生データのままから事実の把握やビジネスチャンスにつなが る判断根拠を導くことはできない。データに対して適切な分析を施して『データが示す情報』を導き出し、 導出した情報に基づ、いて次の戦術・戦略でのアクションを決める意思決定を行う必要性が、生存競争 の激しいビジネス社会において求められてきていることは事実と言えよう。 膨大なデータを如何に情報化して利用するかについての情報基盤の仕組みの再編成に、米国や欧 州の先進情報化企業は大きな成功の要因があると考えてビジネスチャンスを見出した。意思決定に 必要な条件とは何であるかを研究して、最新のデータから導いた情報に基づいて迅速な意思決定を 行いたいユーザーからのアドホックな要求に対し適切な回答を与える情報基盤の仕組みとして、デー タウェアハウスを考案したので、ある。 テ、ータウェアハウスとは、『分散したデータから価値ある情報を取得して快適な情報化戦略を行うた めの仕組み。』なのである。 図1 :データウェアハウスのあるビジネスフロー 図2 :データウェアハウスのないビジネスフロー 3 . データマイニングとは テ、ータマイニングは、大容量データから価値ある情報をスピーチ、ィかつ正確なアウトプットとして導き 出すためのメソドロジーある。ビジネス界で、の競争に打ち勝つためのキーとして、最近では顧客データ の有効活用を目的とするデータマイニングが注目を集めている。 データマイニングを、『データに曙されたビジネスに役立つ未知のパターンを発見・検証するために、 大容量のデータを探索・モデル化するプロセスである。』と SAS社では定義している。 SAS社のデータ マイニング用ツール Enterprise Minerソフトウェアでは、データマイニングのプロセスを SEMMA(セマ) という 5段階に分けている。 3 ‑ 1 .SEMMAプロセスとは SEMMA プロセスとは、 S(Sample)・ E ( E x p l o r e )・ M(Modify)・ M(Mode ・ ) l A(Assess)の頭文字を取ったも のである。膨大なデータに対して適切に SEMMA プロセスを施して反復することにより、データが示す パターンを導き出し価値ある情報を抽出する。 • Sample(サンプリング) 読み込んだ大容量データを解析に適したサイズや形状にするために、サンプリングやデータ分割を 行うフヱーズで、ある ・ 0 E x p l o r e(探索) 306

298.

・ データの傾向や特長を把握するために、探索的にデータ解析を行うフェーズ、で、ある 0 Modify(加工) 解析に適した変数に加工するために、変数選択や欠損値の補間などの変数加工を行うフェーズ、で、 ある。 Model(モデル) 予測精度の高いモデルを作成するために、回帰分析・決定木・ニューラルネットワークなどのモデリ ンク、を行うフェーズで ある。ユーザー定義モデルにより、その他の分析モデルも実装できる。 • • Assess(評価) 構築したモデルについて、モデルの精度評価やスコアリングを行うフェーズ、で、ある。 r ・ ・ ・ ・ ・ ・ ・ ・ ・ 1 . 長現官間 サ νブ')ングするか'ヲ : r . 周 胃 恒 司 ・ ・ ・ ・ .. ・ . 日 開 r . . 冨 置 司 ・ ・ ・ ・ .. ・ . I ピν、アルi ヒ E 受賞'l!')平岩 国 凸 Il散の レコード白温 m グループ化'サプt!ソ Ht E 品開隠匿 に今命 . . . . . . . 吋ラル ネコトヲーク 民 同 司 二 回 司E ツソーモチル銃計鍛析 ・・・ ・ ‑ E E 隣系 ~l 予訊 ョ ・ ・ ・ ・ ・E ラトー与を聖断ずるか勺 断f こf . . ; 主目 S 撃はあるか。 図4 :SEMMAプロセスのフロー 図3 : データマイニングのプロセスフロー 3 ‑ 2 . データマイニングの解析手法 E n t e r p r i s eMinerソフトウェアで、は、データマイニングの解析手法として以下の手法を実装している .アソシエーション パスケット分析とも呼ばれ、項目(商品など)聞の組み合わせ確率の高い項目を取得する。並買分 析やクロスセリングなどに適用することが多い。 ・クラスター分析 多数のデータを少数のクラスターにまとめる次元縮約を行う代表的な手法。説明変数のみでセグメ ントを作成したい場合に有効である。 0 ・決定木 目的変数を説明変数のある基準値に基づいてツリー構造的に分割することにより、効率よく目的変 数のセグメントを行いルールを作成する手法。セグメントルールは解釈しやすく、顧客の属性分析や要 因分析などに適用することが多い。 ・回帰分析 予測手法として代表的な線形/口ジスティック回帰分析の手法。変数選択の機能もあり、基本的か っ精度よいモデリングが可能である。 .ニューラルネットワーク ニューラルネットワークの学習アルゴリズ、ムによりモテリングを行う手法。変数の因果関係が明確で ない場合や非線形モデリングの場合に適用することが多い。 t ヴ n u qu

299.

z ‑ ト 日 間 ロ ク 什一望静子 品五 ( 1 : l ご1 / ‑ i : 型 ニ1 ニ j 図5 :E n t e r p r i s eMinerソフトウェアの解析画面 竺 と ン ゴ 同 図6 :決定木の結果画面 4 . データマイニングの実際例 データマイニングは、金融・流通・通信を中心とする多業界で、急速に導入され始めている。主に、ビ ジネスの収益に直結する『顧客』に注目した分析を目的とする場合が多い。 4 ‑1.業界別の利用目的 業界別のデータマイニングの利用目的は、主に以下のとおりである 0 ・金融 ・顧客の属性分析や行動パターン分析による優良顧客の特長抽出。 .カードの不正利用パターンの発見。 ・企業の財務分析および格付け分析。 など。 。流通 ・購買雇歴から次に購入しそうな商品を顧客に勧めるためのターゲ、ツトマーケテイング。 ‑ある商品と一緒によく購入される商品を特定して売り上げを伸ばすための並買分析および セリング分析。 など クロス 0 ・通信 ・他社製品へ流動(ブランドスイッチング)しやすい顧客を特定する流動化分析 .解約やクレームの要因分析。 ‑テレマーケティング、分析。 0 など。 e l a t i o n Management)など、時代の要 上記以外にも、ワンツーワンマーケティング・ CRM(CustomerR 請と関連したデータマイニングを利用する新たなビジネスも創造されてきている。 米国や欧州ではインターネットやマルチメテ、ィア等のコンシューマ一向けのトレンドと併合して、大量 な顧客ひとりひとりの顧客満足度を高いレベルで、充足することを目的とする顧客志向型の新しい情報 ビジネスも始まりつつある。経営戦略の側面においても、顧客を製品に合わせる製品重視型から製品 を顧客に合わせる顧客重視型へ、市場シェアの獲得重視型から顧客シェアの獲得重視型へ、新規顧 客の獲得のみを重視した経営から既存顧客の維持をより重視する経営への転換が求められるパラダ イムシフトが起き始めているとも言えよう。 308‑

300.

4 ‑ 2 . データマイニングの実際例 データマイニングの取り組みは欧米の金融・流通・通信業界を中心に活発で、あり、具体的なビジネ スでの利用による成功例も出てきている。日本においても、 1999 年は『データマイニング元年』と日経 BP社が位置付けるように、少しずつ良い実践例が生み出されている。 .プルテ ンシャル社(米国・金融業) プルデンシャル社は、 1875 年に設立された世界で最も大きなファイナンシャルサーピ、スの会社であ り 、4 , 0 0 0万人の顧客を保持する米国フォーチユン 5 0 0社のうち 18位にランクされるグ、口一バル企業 である。その中で、ももっとも有力なプルデンシャル保険は、変化する金融投資に対するスピード化と投 資の最適化を行うばかりでなく、顧客のニーズをより深く理解するためにデータマイニング、のアプロー チを統合的に行うツールとして EnterpriseMi円erソフトウエアを選択した。 当ツールを利用することにより、プルデ、ンシャル保険は大量かつ分散したデータに最適な分析を行 って、顧客のニーズを迅速に把握して効果的なアクションを導き出すことに成功した。さらに、今まで見 えなかった顧客関係を発見することがで、き、既存顧客の維持・アップセリング クロスセリングの向上お よび新規顧客の獲得を、今まで より低い予算でより大きな効果をもたらすことに成功した。 .マークス&スペンサ一社(英国:流通業) 1憶 7 0 0 0万ポンドの利益を計上するまでの高収益企業に マークス&スペンサ一社は、 1998年に 1 成長した英国の大手流通業の 1つである。買収による成長に加えて、ダイレクトメールやカタログ・ショ ッピング、による顧客戦略において、 Enterprise Miner ソフトウェアによる戦略の策定を行った。庖舗販 売を促進する目的で、蓄積された 5 0 0 万人の顧客データベースを利用して、庖舗への集客強化から特 定商品の販売促進を如何に向上させるかが今後のビジネスの拡大と高収益の鍵とみなし、商品ごと に顧客セグ、メンテーションを行い適切な顧客へダイレクトメールカタロク、を迅速に発送して多くの効果 B あるレスポンスを得ることに成功した。 5 . まとめ 以上のように、変化する市場や顧客ニーズをデータマイニングにより迅速かつ的確に捉えて有意義 なアクションに繋げるビジネス・アプローチが行えるが、以下の 3要素をバランスさせる三とにより効果 あるマイニングを実現できる。 .適切に収集・統合化された質の良いデータ ・加工・分析手法を豊富に持つ分析ツー j。 レ .ビジネスにおける問題解決の策定を支援するコンサルティング。 データマイニングを組織的なビジネス・アプローチに活かす三とにより、企業における問題解決およ びナレッジの集積に繋がることを期待する。 0 参考文献 r SAS Data M i n i n g White PaperJ 、SAS I n s t i t u t e Ic、1998 円 「デ、ータウェア/¥ウスがビジネスを変える」、日経 BP、1996 本稿は、(社)日本品質管理学会中部支部第 6 2回研究発表会で論文発表を行ったものである。 ‑309

301.

日本 SASユーザー会 (SUGI‑J) 企業経営戦略 i CRMJ とは何か CRMの現状と今後の展望を探る‑ 岩瀬秀明 副社長プロフェッショナルサービス担当 株式会社 S ASインスティチュートジャパン C o r p o r a t eS t r a t e g y CRM" QU ρu nし v ‑1 yi ιEU ρu‑ d nb ︐ 4L 川阻叩 u ほ n n u oa vAιEU 臼 凶 YE' Oe P ト邑︑︑ IP J .唱よ λ ﹁ ﹂E ι n 門 b S 砧 北 β .U t 11+ ヨ F ι u nし 泊川町 U 凶 一珂苅♂ A U 引 刊 p A F l u A ‑可 ︒ V 要旨 CRM C C u s t o m e rR e l a t i o n s h i pManagement) についての注目が高まっている。現在の CRMは、「顧客関連 D羽司 C D a t aWareHouse) 構築及び顧客データの収集・分析とその 活用」と認知されている様子である。 CRM成功事例を研究すると、企業戦略の再定義や 業務革新など顧客分析を超える大きな視野で実践されている。本稿では、 CRM確立の足 跡と今後の展望を提示し CRMの一層の発展に寄与したい。 キーワード: CRM、D羽司、データベース、データマイニング 1 . ダイレクトマーケティングから CRMへ 多くのコンサルタント、ソフトウェア、ハードウェアベンダーが CRMを提唱している。 多くの企業で「顧客重視」政策実現の第一歩として D羽司構築に着手、または検討が進ん でいる。まさに CRM全盛時代と言って良い。ここでは、 CRM構築を効果的に進めるた め意識するべき rCRMの本質」を振り返り、 CRM三文字に包含される多くの背景を改め て確認したい。 60~70 年代、既存の製造・物流・小売ルートに対するアンチテーゼとして、マーケテ ィングの一手法として「ダイレクトマーケティング(製造直販)Jが提唱された。主要な ダイレクトメール)の発送、物流コスト削減などであ 課題は、顧客リストの特定、 DM C った。多くの通販会社が設立され、メーカ一直販の検討が始まるなど広く浸透した。技術 的には大型コンビュータやデータベースの普及が、産業基盤としては顧客データベース周 辺事業の普及が背景にあった。顧客を良く知る重要性については、地域密着型商庖(酒屋、 米屋など)の常識として顧客の個別ニーズに即した食品・日用雑貨が届けられるなど直感 ム 唱E ー﹄品 ο η

302.

的に認知・実現されていた。 80年代に入ると、データベース技術の進化により DBM (DataBaseMarketing) とし て顧客セグメンテーション、クロスセル・アップセルなど新たなマーケティングの枠組み T構築 ( S I:SystemI n t e g r a t i o n ) が可能となり、分析対 が整備された。複雑大規模な I 象顧客がある特定部門・特定事業から複数部門へと広がった。結果的に単なる顧客リスト 作成管理の段階から、優良顧客判別のための統計解析手法が工夫された。表計算や統計解 D e c i s i o n τ' re e )、数理モデル化に 析ツールなどが広く利用されるようになった。決定木 ( よるデータ探索など AI (人工知能)研究やニューラルネットワーク研究から現在のデータ マイニングの基礎技術が発展したのがこの時期と言って良い。「顧客重視」の事業プロセ スを構築することがエクセレントカンパニーとなるために不可欠な条件であることが、直 感的な実務家の認識から経営理論の常識として定着した。 90年代に入ると、 CS (顧客満足度)を測定することが経営者に幅広く認識されるよう arketing)(3) になり、より一層「顧客指向」へと関心が高まった。 OTOM (OneToOneM )として顧客個別のニーズに対応する必要性が提唱され、単なる顧客マーケティングの (4 C l i e nt /S e r v e r ) 一手法ではなく経営戦略手法として認識され始めた。技術的には、 C/S ( やネットワーク技術の普及によってメインフレーム時代のデータ管理に関する各種制約か ¥ ¥ 喧やデータマート (5、 ) CIF ら解放された。複雑なデータベース管理が実用化され、 D ( C o r p o r a t eI n f o r m a t i o nF a c t o r y ) の概念(6) が提唱された。実務的には CTI技術などコ ールセンターの普及やデータマイニング手法の確立(7)、マイニング・ツールの登場により、 顧客データが精力的に収集・分析されるに至った。 そして、 90年後半以降、平成不況の深刻化とともに本業回帰・顧客重視の経営が浸透 し、ナレッジマネジメント (8)と称して社内外のベストプラクティスを学びナレッジ(知 恵)を社内にシステム化することに関心が高まった。ここに来て、上記の各種経営手法、 T技術、データ収集分析・マイニングなどの成果が CRMの三文字に 飛躍的発展を遂げた I 統合され、先進企業の事業成功事例が CRM事例として幅広く紹介されるようになった。 D ¥ ¥ 司構築&データマイニング」だけのことではな 以上、振り返って見たように決して i いことを再認識すべきである。 2 . CRM構築適用例 CRM構築に熱心なのは、通信、金融、航空運輸、流通小売など単なるマスではない比 較的固定化された大量の顧客を対象に商品サービスを提供する業界である。過去の IT整 備によって大量の業務・顧客データが蓄積されており、これらのデータの分析から業務改 善効果を得ることが大きな関心である。以下業界毎に代表的な適用例を整理した。(表 1) ← 312‑

303.

( 表 1) CRM適用事例 業界 通信 分析フ二一タ 顧客情報 通話明細 料金情報 事故情報 リ エ7 特性 顧客情報 金融 商品利用実績 信用・督促情報 解約者属性 カード購買履歴 流通小売 POS情 報 POS情 報 顧客. 顧客カード情報 通販利用情報 Web利用実績 分析項目 顧客セグメンテーション 利用増・解約モデ v ) TV 顧客収益性・ L 不良顧客セグメンテーション 地域別如ス集計 顧客セグメンテーション 購買顧客モヂ v ) 特定 督促予測モデル作成 ) 特定 解約者モテ.v 顧客噌好特性 ) 化 並買分析、購買モヂ v 顧客セグメンテーション ) 化 購買行動モデ v 優良顧客特定 購買特性把握 業務適用例 キャンへ.ーン企画、 サービス開発 優良顧客維持・解約防止政策 料金策定・シミュレーション、収益最大化 不良顧客の特定 ) 策定 地域別サービス・料金7'7 キャンへ。ーン企画、 商品開発 D M返信率向上 督促率低減、与信承認率向上 解約防止キャンへ.ーン実施 加盟屈との共同販促・ D M 商品構成の最適化、棚割最適化 地域・商圏特性に応じた庖舗運営 優良会員囲い込み、キャンへ。ーン実施 D M返信率向上、通販カタログ最適化 顧客特性別 D M発送、キャンへ。ーン案内 3 . CRM実現のための DWH構築のあり方 さて、現在の CRM に対する認識と構築のプロセスを振り返ってみよう。 CRM 導 入 の T ) の顧客関連データ・業務トランザ 第一歩は、未だにメインフレーム(業務系、勘定系 I クションデータを「取り合えず」サーバー環境に移す D羽 喧 構 築 だ と 認 識 さ れ て い る よ う に見受けられる。投資に積極的な企業では、さらにコールセンター設立、キャンペーン管 S a l e sF o r c eAutomation) ツール導入など、まずデータ収集・利用環境を整えて 理 、 SFA ( から「集まった」データを利用して分析・マイニングを始めるという流れではなかろうか。 CRM及びデータ・マイニングに関するコンサルテイングサービスを提供してきた SAS 社の国内外での経験と CRM発展の経緯から判断すると、上記のアプローチは必ずしも適 切なものではない。 (1)業務系・勘定系大量データを DWHに移す前に分析・結果活用方法を設計・試行す ベし。 思い通りの分析結果を得るためには、分析手法の工夫以前に、利用データの選択、 加工が最重要であることは案外見過ごされがちな、しかし CRM実現の中核となる データマイニング成功に向けて最も重要な知見である。 (8) デ ー タ マ イ ニ ン グ ・ コ ンサルティングの現場において、時間の過半はデータの選択加工(サンプルデータ 作成、変数作成・変換、モデル推定の繰返し)に充てられる。多くの場合、クライ 噌﹃ム ηd qu

304.

アント側に分析の仮説や仮説検証プロセスに対する理解、整合の取れたデータは存 在しない。仮説・モデル化・検証手段を意識して、何度も分析プロトタイプを繰り返 V¥喧設計を始めるべきである。 し、実務での利用イメージが固まった段階で D (2) データは「集まる」ものではなく、分析仮説・検証の意識を持って「集める」もの。 手元に自然に集まるデータを基にして検討を進めても当たり前の結果しか得られ ないことが多い。寧ろ、プロジェクト編成時にデータ解析の専門家を交え事業企画、 業務運営、営業、マーケなどの部門横断的なチームを作るべきである。そのチーム が、現在利用可能データを参考に分析の仮説を立て、仮説検証のプロセスを計画す る。その検証過程で必要なデータを作成する工夫を行い、必要データを意識して「集 T部門よりも、顧客といつも接して める」のである。データを物理的に取り扱う I いるコールセンターのオペレータの方が顧客データに関する深い知見を持っている 可能性は高い。現場部門の知見は必ずしも既存データの分析的アプローチから産ま れるものとは限らない、 CRM実現に不可欠な要素であることを確認しておく。 (3) DWH構築の際には、会社の意思決定プロセス(データ収集・分析・判断)を整理す べし。これは DWH構築前の課題である。分析・経営意思決定の利用方法を明確に した上で設計をしないと、 DV¥喧は高価な単なるデータ貯蔵庫になりかねない。 Inmon氏の最新著作 r C o r p o r a t eI n f o r m a t i o nF a c t o r y J (3) ( C I F ) で提唱されてい p e r a t i o n a lDataS t o r e ) ②経営意思決定 るのは、①業務データ蓄積場所 (ODS:O 支援のための事業部門別業務データサマリーや履歴情報など経営情報データ分析用 DWH、③不特定・大量・アドホックなデータ探索のための分析環境 (EXWH: E x p l o r e WareHouse) とを分けて構築するアプローチである。また、大量の業務データを全 て高価なハードディスクに蓄積するより、安価な磁気テープや光学ディスクを利用 して仮想的なディスクを実現する技術 (NLS:NearL i n eS t o r a g e ) が推奨されて V¥喧は利用方法を予め定め必要となるデータの種類・量・システ いる。このように D ム要件などを設計した上で構築するものである。 (1) ( 2) (3) で見たように n取りあえず J r 集まった」データで「後から」分析』 的アプローチではなく、まず ~CRM 意思決定の仕組みと分析仮説・検証のプロセス設計』 を行うことが現在の日本の CRM構築現場の課題ではなかろうか。 CRM構築プロジェク トが DWH構築 =IT部門主導で行われている限り、経営戦略意思決定や分析設計など「ユ ーザーの仕事:フェーズ 2J と片付けられてしまうのも当然の帰結である。 314

305.

4 . 今後の展望一企業戦略と事業変革の方法論へ 日本の CRM実現事例は、①既存顧客データの分析・マイニングによる②分析精度向上 と③その結果を利用した業務効率化、と要約されるのではないか。従来から見れば画期的 な成果ではあるものの CRM本来の意義を考えると部分的な成功にとどまっていると言え る。残念ながら、まだ D~喧が十分企業の事業戦略上重要な意思決定支援システムとして 機能していないことが原因である。以下、顧客デー夕、分析、業務改善の視点から今後の 展望を提示する。 ①顧客データに関して:既存のものを「活用する」のみならず、新たな顧客データ体系 を「作り出す」余地があるはず。 CRMの進化に応じて顧客との関係を積極的に見直 し、データ項目とその収集・更新方法を変えることができる。例えば、最初から何百、 何千の顧客属性を用意しなくとも、使う当ての明確な限定された属性のみで顧客デー Tアーキテクチャを採用すれば良い。 タベースを構築し、必要に応じて発展性のある I 後は試行錯誤で改訂しながら完成度を高める方が合理的である。一時期注目された大 CIFなどは今後データ項目の活用度に応じた見直しがなされ、顧客データはダ 規模 M イナミックな変貌を遂げるはずである。 ②分析に関して:単なる「精度向上」にとどまらず、外部データや従来利用しなかった 内部データを導引し、新機軸での顧客セグメンテーションや、解約先行指標、不良顧 客識別ルールなどを「作り出す」余地があるはず。極端な、しかし現実的な話しとし て、大規模 D羽喧など作らなくとも、超優良顧客 20人を手作業で選び出し、一流の オペレータに全員と話す機会を作るだけでも随分顧客への理解が深まるものである。 その 20名中 5名を集め、(豪華な)お弁当とお礼程度の日当を用意して徹底した製 品・サービスの利用動機や不満足屈に関する討議を行う(フォーカスグループインタ ビュー)と、新たなサービスや商品開発アフローチの提案が産まれる可能性は高い。 その仮説検証のシステム化という視点で CRM構築を考えれば、既存データのみに頼 る D~在1 より経済的かつ実用的な CRM が実現するであろう。 ③業務効率化:例を挙げると DM返信率向上、与信承認、精度向上、顧客解約率低下など。 対象業務の範囲に応じて業務フローの変更などを伴う場合が多いが、まだ「一部改善」 の域を出ない場合が多い。寧ろ、上記の新たな顧客データと新基軸分析を駆使した結 果を取り入れ、事業戦略の再定義と業務・組織変革などを検討する余地がある。例え ば、米国大手銀行では、 CRMプロジェクトの結果既存 V I P顧客専任部隊を数千人規 I P顧客とのコミュニケーションを別組織へ移した。ある米国小売チェ 模で再配置、 V ーンでは、 VIP顧客を庖頭で識別できるよう顧客カードを工夫し、普通客とは全く別 の接客オペレーションを導入した。今後、事業戦略の意思決定を伴う ことは間違いない。 ‑315 CRMが増える

306.

ことは間違いない。 CRM大合唱は、残念ながら IDWH構築&データマイニングのみ」に着目され本質的な 事業変革の枠組み論議に至っていない。最近の CRM論を見ていると、バリュー経営、ア ウトソーシング、 SCM、少数取締役会・執行役員制導入等一連の新企業統治論などと同様、 形から入って本質的な企業変革が実現される前に部分的な改善のみで妙に納得されてしま う傾向があるように思えてならない。結局は「大山鳴動鼠 (DV¥喧)一匹」とならないよ う、投資に見合う CRM実現を願ってやまない。 なお本稿は、コンビュータ・エージ社発行の「コンピユートピア J7月号の記事を再編 集したものです。 参考文献 (1) CRMの本質を解明する、 SASI n s t i t u t eJapan岩瀬、金融財政事情 99年 2月 (2) TheFoundationofWisdom:AStudyo f t h eF i n a n c i a lImpactofDataWarehousing, IDCS p e c i a lReport/Whi t ePaper ,P reparedf o rSASI n s t i t u t eI n c .,1996) oOne (3) TheOnet oOneFuture,DonPeppers&MarthaRogers,1995 (邦訳:IOnet マーケティング」ダイヤモンド社、 9 5年) (4) Ente叩 r i s eOnet oOne,DonPeppers& MarthaRogers,1997 (邦訳: IOnet oOne 企業戦略」ダイヤモンド社、 97年) (5) B u i l d i n gt h eDataWarehouse,W .H.Inmon,1996 (邦訳:r データウェアハウス 構築編」インターナショナルトムソンパブリッシングジャパン、 97年) (6) C o r p o r a t eI n f o r m a t i o nF a c t o r y ,W .H.Inmon,ClaudiaImhoff ,RyanS osa,1998 (邦訳: I コーポレート・インフォメーション・ファクトリー」海文堂、 9 9年) (7) DataMiningTechniques,MichaelJ . A .Berry&GordonL i n o f f ,1 997 (邦訳準備中) (8) TheKn owledgeC r e a t i n gCompany ,I k u j i r oNonakaandHirotakaTakeuchi,1995 (邦訳: I 知識創造企業」東洋経済、 96年) (9) 膨大なデータに経営戦略を語らせる「データマイニング」の実像、 SAS I n s t i t u t e Japan奥山、日経情報ストラテジー 97年 8月 ‑316

307.

J 二一、,白 一 句 山 一 ー ーι 一回限り、定型のデータ分析ではなく.. 継続した分析・テスト・顧客コンタクトの蓄積 業務デ」タ I 原民壬:tI J ' Jl ' ・J l I I [ ・顧客満足度 ・顧客解約 .ROI管理指標 分析サマリー ー ・│ ωH4 ‑コールセンター 司・運営効率評価 ・顧客獲得実績 重複排除 社外データ ‑キャンへ。ーン効率 .応答率実績 必要に応じて ライフ レ スタイJ ・マーケット リサーチ .顧客 * 1O p e r a t i o n a lD a t aS t o r e * 2E x p l o r eD a t aWarehouse 勺 D ataMart ‑セグメンテーション .利益率 ・クロスセル可能性 .行動予測モデル化 .Web分析 置キャンペーン効果 F,・チャネル効率 ベ 『j・応答内容分析 ‑サービス評価 ・顧客満足度 .例外処理 業 州 国 占 RU 齢 ふ ‑ ‑ 一 一 一 一 E C R Mサイクル

308.

論文発表 調査・マーケティング

309.

日本 S A Sユーザー会 (SUG I‑J) 流通業におけるデータマイニングの応用 リテンション戦略の強化を目指して 緒方維文 株式会社エフ・エム・アイ 代表取締役 ( e ‑ m a i l )k ‑ og ‑ a t a @ f m i ‑ d b m . c o m Thea p p l i c a t i o no fd a t am i n i n gi nt h er e t a i l e r ‑Witht h ea i mo fs t r e n g t h e n i n go fr e t e n t i o nstrategy‑ K o r e f u m iOgata P r e s i d e n t F u t u r eM a r k e t i n gI n s t i t u t e,I n c . 要旨 今注目されているデータマイニングの一例として、通信販売におけるデシジョンツリー 分析をとりあげながらリテンション戦略の強化について述べる。 キーワード:セグ、メンテーション 1 . はじめに いまデータマイニングに多くの関心が寄せられている。大手コンピュータ企業に勤務 する知人によれば「データマイニングの紹介セミナーを開催すればほとんど満席にな る」という。蓄積された大量のデータをマーケティング政策に生かしたい、より合理的な 視点で長引く不況に対処したい、とし、った企業ニーズがみてとれる。 そのようなセミナーをしてつか筆者も聴講してみた。それらの共通点をあげれば、大量 データから事業利益に貢献する顧客や商品を掘り出すことができ、少ない経費で多くの 利益を得ることが可能だとし、うことである。 デfータマイニング、を用いれば投資効率を向上させることが確かに可能であろう。しかし、 投資効率の追求に傾倒すればリテン、ンョン(顧客維持)に影響し、リテン、ンョンに傾倒す れば投資効率が低下するとしづ二律背反の関係にある。その解決策のひとつとして筆 ム 噌E ワu qu

310.

者は「リテン、ンョンと投資効率の極大化を同時に実現する二段階標的化モデ、ル」を先に 発表した。 で、はデータマイニングは先の 2段階標的化モデルを凌駕で、きるだ、ろうか、それを検証 しつつ、データマイニング、手法の適切な応用方途を模索することを本論の目的とする。 なお、ここで用しもデータは通信販売の実データであり、機密保持の関係上、実数値 や単位、商品名などを秘匿させていただくことを容赦願いたい。 2 . 二段階標的化モデルの概要 2 . 1 ニ段階標的化モデルの意図 顧客の減衰は不可避である。図 2‑1に示すように経年的に確実に減少する。 ヒューズの主張と比べるとこの企業はリテンション(顧客維持)についてかなりの努力を していることがわかる。 l 年以上購買のない顧客に対してはプロモーション対象から除 外するところが多いなかで、休眠客を掘り起こそうとかなり努力してきたのである。それが 一方で、は投資効率の低下にもつながっていた。 全てのマーケターが知っているように顧客は一様ではない。プロモーションに対して高 反応を示す客層もいれば低反応の客層もいる。企業とのリレーションシッフ。が強い客層 もいれば弱い客層もいる。このような観点から客層をしてっかに区分する、すなわち顧 客セグ、メンテーションを行って、それぞれにふさわしいマーケティング、政策を導入して目 的を達成しようとしている。 では顧客セグ、メンテーションにはどのような方法が効果的なのか、自社に最もふさわし く、より高い投資効率が得られるように常に研究しているのである。その伝統的な手法が RFM理論で、あった。 ( 図 2‑1) 既存顧客の減衰 i ー+ー葺通信底売企業 ‑ ‑ ‑ x… ヒ ュ ー ズ の 主 彊 l 1 α珂 9叫 8時 7 0¥ 60¥ 50¥ 40 30¥ ‑ .‑ ' x .ー 20¥ . ・ ・ ・ ・‑ x ‑ ̲ ̲ ー ・ ・ ‑ ‑ 1 0¥ " ' 新規彊得時 1年 世 2年 世 3年櫨 4童手聾 5年櫨 qd q o q o

311.

RFM 理論を応用してこの企業でも独自のセグメンテーションを行ってきた。その詳細 についてはすでに発表のとおり、最新購買時点 ( R )と購買回数 ( F )の2つの要因による マトリックスで、セク守メントするもので、あった。 しかし、長年の努力も限界に達していた。さまざまな研究を重ねた結果、いくら努力し でも一次元の尺度適用には限界があることを痛感したのである。 それまで、の手法で、リテン、ンョンの強化に傾倒すれば効率低下をもたらし、投資効率の 極大化に傾倒すればリテン、ンョンが疎かになる。この二律背反の関係を意識しながら最 適なバランスをとるために考案したのが二段階標的化モデ、ルで、あった。 2 .2 二段階標的化モデルのポイント 二段階標的化の第 1段階目は従来の RFマトリックスによるセグメントで、あり、第 2段階 目に過去の購買商品タイプによるセグメントを導入した。 RFマトリックスによるセグメントは実務的に使いやすく、また相応の効果が確信されて きた。とりわけ、一定水準以上の投資効率が得られるセグメントでは他の手法を導入す る必要性を全く感じていなかった。問題は投資効率の低いセグメントであり、そこに第二 段階目の過去の購買商品タイプを適用するものであり、その実務的な流れは図 2‑2に 示す手順である。 ( 図2 ‑ 2 ) RF マトリックスによる顧客セグメントでの 第 1段階目の標的化 過去の分析結果から損益分岐点をヲリアできそうなセグメントを想定して 標的化 草 子スト・マーケティングの実施 第 2段階目の標的化対象となる顧客のなかから、無作為!こ 1‑3万人 程度を抽出してテスト・マ ケティング(骸当顧客数によってテスト人数 を判断) 商品タイプによる顧客セグメントでの 第 2段階目の標的化基準の検討 ①テスト・マ ケティングのデ 告から、過去の購買商品とリスポンス 性向の関連を分析して商品世イプを析出 ②その商品世イプで顧客をセグメントして力告ログ効率を分析評価 2段階標的化モデルによる損益分析試算 ① 第 2段階目の揮的化対象の全顧客を上位の商品世イプによってセグ メント再編成 ②子スト・マ ケティングのリスポンス性向を適用して損益分析を試算 豆 本格的マーケティングの実施 ①損益分析の鼠算結果を判断して第 2段階目の栂的化 ②本格的マーケティング 従来の経験貝Ijから、 RFマトリックスによるセク守メントで損益分岐点をクリアするセグメン トの想定は比較的容易であり、これらに対してはいち早くマーケテイング活動を展開す るのが得策である。 二段階目が大きなポイントである。過去の購買商品タイプとし、っても無数にあり、どの 商品タイフ。が次回のフ。ロモーションへの反応が高いかを予想するのは難しく、ふたをあ けてみなければわからないのである。 qu nL qu

312.

そこで、第二段階標的化の対象者については、サンプリングによるテストマーケ ティングを行い、その結果を分析した上で本格的なマーケティング対象者を選定す るのである。 テストマーケティング結果は、あらかじめ用意した数多くの購買商品タイプのど れが高反応に貢献しているかといった観点で分析して、貢献度の高い商品タイプの 購買経験者を即座にカウントするとともに、本格的マーケティング展開の損益試算 を行った上で対象者を決定するのである。 したがって、ここで取り上げる商品タイプはかなり多いが、高反応への貢献度の降順に 選定するのは容易であり、実務遂行上の難易度も低い。加えて、どの商品タイプと今回 のどの商品タイプの結びつきが強いなどマーチャンダ、イジング、面で、の具体的な検証を 伴うことカ冶ら極めて実務的であると言えよう。 ちなみに、上記の手続きによる二段階標的化モデ、ルの適用成果は次図のようにかなり 高い。 ( 図 2・3 ) 2段階標的化モデルの効果 30 20 10 。 一10 ‑20 購買客数 売上高 帥ログ効率 純利益 3 . データマイニング応用の考え方 では、今話題のデータマイニング手法はどのように適用で、きるだ、ろうか。代表的な手法 として、デシジョンツリー、ニューラルネットワーク、アソシエーションなどがあるが、ここで は顧客セグ、メンテーションを強く意識して、それに最も適していると考えられるデシジョン ツリーを用いることにする。 周知のように、いくつかの説明変数で、目的変数に対する判別ツリーを自動的に行うこ ‑ 3 2 4

313.

とができるものである。反面、自動的に判別するが故にどのようなモデ、ルを考えるのか、 またどのようなデータセットで、モデル開発を行うのか、細部におけるノウハウが必要だ、と も言われている。 そこで次の手順で進むこととした。 ①モデル開発 ②モデ、ルのルールを適用した顧客セグ、メンテーション ③同セグ、メンテーション効果の検証 モデル開発に際しては、分析対象をどのように考えるか、説明変数と目的変数をどの ように考えるか、データセットをどのように考えるか、としづ 3つの観点を検討した。 分析対象については、 RFセグメントで損益分岐点に満たなしものを対象とする。それ は、先の二段階標的化モデルの手順で、示したよう l 、 こ RFセグメントで、損益分岐点クリア が容易に想定できるものはいちはやく活動した方が実務的な合理性があり、損益分岐 点を下回るセグメントこそが改善を求められるカミらである。 目的変数についてはリスポンスの有無を、説明変数についてはプロモーション毎の特 集テーマを中心としながら、社会属性の追加を試みることにする。商品タイプを用いるこ とも考えられるが、これはあまりにも数が多すぎて分析進行に難点があることからプ尾モ ーション単位とした。 さらに、分析対象のデータセットについては、より良い判別基準を得るために、あえて レスポンス数と非レスポンスを半々に構成することにした。 4 . デシジョンツリーの適用 モデルは 3通り開発した。いずれも直近の特定フ。ロモーションのレスポンスの有無を目 的変数とする。 1番目のモデルは、過去のフ。ロモーション単位のレスポンスの有無(合計 28種)を説 明変数とする。 2番目のモデ、ルは、これに年齢、職業などの社会属性を加えたものである。 3番目のモデルは、 RFM3項目をさらに 2番目の変数に加えたものである。 そして、各モデ、/レ構築に用いたアルゴ、リズムは CHAIDで、ある O 各モデルの誤分類率をみると、 l番目が 43.8%、二番目が 42.1%、そして3番目が 41 .6%としづ結果で、あった G υ 戸川 9u q o

314.

5 . デシジョンツリーによる効果 残りの顧客(モデル開発に用いなかった顧客)のデータに、各モデ、ルによって得られ た判別ノレールを適用して、対象顧客全員のクラシフィケーションを行い、これをセグメン トとする。 3通りの新しいセグメント単位で目的の特定フ。ロモーションにおける投資効率計算を行 って比較評価する。 その結果は次表に示すとおりである。 同表は、 RFセグメントで損益分岐点に満たない顧客を、デシジョンツリーにうよる判別 ノレールを適用した場合に一定水準以上の投資効率が期待で、きる割合を示している。 これで明らかなように、デ¥ンジョンツリーによる顧客セグ、メンテーションは、過去に購買 した商品タイフ。による 2段階標的化モデルと比較してリテンション効果の面では劣位に ある。 ( 表 5・1 ) セグメント効果の比較 顧客数 受注客数 受注額 モデル 1 8 . 8 % 1 4 . 1 % 1 4 . 3 % モデル 2 1 2 . 3切 1 9 . 3 % 1 9 . 7 % モデル 3 1 1 . 8 % 1 9 . 0 % 2 0 . 5 % 2段階標的化モデル 53. 4 % 3 6 . 0 % 3 2 . 7 % (再セグメントによる抱出対象者の割合) 6 . おわりに 以上の分析では、先の二段階標的化モデ、ノレを上回る効果は実現で、きなかった。その 原因はいくつか考えられるが、デシ、ジョンツリーのモデル構築に求めることがで、きょう。 それは、二段階標的化モデルの場合は具体的に細かい商品タイプまで掘り下げてい るのに対して、デシジョンツリーでは使用変数の適性値を考慮してフ。ロモーション単位 に集約せざるを得なかったことがあげられる。もちろん、細かい商品タイプまで掘り下げ てデ¥ンジョンツリー分析を行うのは理論的には可能であるが、それはあまりにも煩雑で 長時間を要することになろう。 では、もっと精度を追求することが果たして可能であろうか。ひとつの可能性は、細か い商品タイプを説明変数としてとりあげるのではなく、アソシエーションによって購買商 品の集約を行った上で、デ、シジョンツリーの説明変数に用いることであろう。 できるだけ早い機会にこの課題に挑み、データマイニング、のより効果的な方途を模索 円ノ臼 ハペ U ハ り

315.

してみたい。 (参考文献、資料) ① 江尻弘 ( 1 9 9 6 ) ,最新データベース・マーケティング」中央経済社 ② 江尻弘 ( 1 9 9 7 ) ,事例分析データベース・マーケティング」中央経済社 ③ 荒川圭基 ( 1 9 9 7 ) ,好循環を生み出すデータベース・マーケティング」メディア総合研究所 ④ ルディー和子 ( 1 9 8 5 ) ,実践ダイレクト・マーケティング」ビジネス社 ⑤ 小川孔翰他 ( 1 9 9 3 ) 'POSとマーケティング戦略」有斐閣 ⑥ 緒方維文 ( 1 9 9 7 ) ,リテンションと投資効率の極大化を同時に実現する 2段階標的化モデル」日本消 費者行動研究学会発表論文 1 9 9 9 ),戦略的データベース・マーケティング」ダイヤモンド社 ⑦ロプ・ジャクソン十ポール・ワン ( qru ワt ηJ

316.
[beta]
日本 S A Sユーザー会 (SUG I‑J)
E
n
t
e
r
p
r
i
s
eMi
nerを用いたクラスアソシエーションルールの抽出
作
!
凋1
1
I
H児女

O河 fTJ
正雪帥

r
ま式会社(手掛:エンジニアリング・グループ
数J1J)研究部
大大コンサルタント
4

MiningClassAss
o
c
i
a
t
i
o
nRuleswithE
n
t
e
r
p
r
i
s
eMi
ner

I
l
i
d
(
'
oT
n
n
i
o
k
n
* I
f
'
l
i¥'ll
k
iK
n
¥
¥
'
n
i
、
ト1
1<11川 口 II;;n~inppring G
r
o
u
pI
n
e
f
l
l
a
l
h刊 l
J:l1
i
c
a
lEn~i11PPr in~ [
)
"
p
l
六六{、 o
n
s
u
l
t日n
l

女大

,

大

要 旨
IEnt
川
引
P
附
付
η
川
r
'
p
l
η'
1
1
)
川
とS
八S のプ口グラムを科組l
みあわせるき可中
j
打}により作成されたデデ、一夕セツ卜を t
凸
〉
斗r
o
詐
gram E
訂
刊
d
i
t
(r 上
1
一
で
)
j
加
I
1
!
げ川
,

川

"

川
)
汀

工
1:する守事1
により、

1)ルールの結論部をIi
'
i
l定させたクラスアソシエーションを j
1
1
1
1
1¥

2)多民性データのアソシエーション分析

3)累積佐伝!主の計算
i
を行うことが r
1iiEになった。

キーワード:

アソシエーション I~nt('!"p!"i;.;(' M
i
n
e
!
"ソフトウエア

B日開 S八S ソフトウェア

1.はじめに
近年隙々なデータマインニングツールが f
b
'
己され、これらを川いて説でも千軒にマインニンゲが
可能になった。しかし、たとえ),J
iじデータで、│司じツールで、さらに l
i
i
Jじハラメータで分析を i
J
ったとしても、その後のデータサフセッ卜の刀法によっては、全く)'~なる結果が現れることにな

る。本 J
1
1では S八S t
lのマインニングハヅケージ、 I
E
n
t
p
r
p
r
i
s
p MinprJ を )IJ い、,)~( i
IIJíj~ なクラ
スアソシエーションルールの羽 11"1\ をî'1~

;
'
iする。

2. 相関ルールの定義
J
MIi:もっとも主1れわたってし、るアソシエーシヨンルールの i
,
f
i
J
J
Ii
l:といえば、/、スケット分 1
・
J
Iであ
るc これは、 I
I
!
' 八日 nd B t
h
(川

(~J (
4
火L、は八かっ H二 >C) と表則されるがこれを別の, i
、
し

!
i
t人した刷%はじをjI時人する飾本カミ I市し、」となる。
方で表記すると「八と Bをl
C
o
n
d
i
t
i
o
n
) ;,くはた辺市(1
ρ
!
'
tI
l
a
n
d 仙 dド)と 1子び、
説は条件部 (

1
!
'
八 andB
' の

c
' を結論t;i
l(
C
!)
]
w
l
u
s
i
o
n
)

m

又はイ i
.
i
L
l
i
' (
I
{
i
g
h
tI
l
n
n
dS
i
d
(・)と1I'fぶ。またこれらの八, '
I
L'
Cを 、 ア イ テ ム (i
t
'
(III)と1
1
子び
条件 i~il& び結論却ののア f テム数は ì P.数にも阪放にもなる。

例えば I1:} f)~[JI のうち、紙おむつとミルクを |141 人した胤九:の 30% は[, i111与にビールを!仙人してお

‑329‑

317.
[beta]
り、この 3つを│斗 H
寺に購入した顧客は全体の 2 %である。」というルールが完成した場合、この 3

n
f
i
d
当
【n
c
p
) と呼び、 2 %を支持度 (Su]
l
]
lo
rt.)と呼ぶ。なお、この支持度はデ
0 %を確信度(じ o
ータの件数・内~によってはパーセンテージではなく件数で表記する事も可能である。確信度 I~

はS
u
p
p
o
r
t
(八かっ H かつ C)‑
;
‑
.
S
u
p
p
o
r
t(
Aかっ 1
1
) と計算される。
午
例)対象件数: 1000i

うち紙おむつとミルクを同時に!l荷入した顧符今 1
0
0
0X 2% (支持度) =20{
'
!
:
うちなおかつビールを!l日入した顧客今 20午
{ X:lO% (確信度) =G件

Sup]
lO
r
l
(紙おむつかっミルク)二 2011000二三%
SU]
l
]
Jo
r
l( 紙 お む つ か っ ミ ル ク か つ ヒ ー ル )
=
1
;
1
1l
)O
O=O.G%
R ニ O.G%/2
'
)
{
,
=
:
)
(
J
'
y
.
,

このような規則は、直接の悶栄関係ではなく、 2 つ以上のアイテム聞の関連として珂併する必要
があるが、信頼できる関連を特定する事により、ビジネスー仁の意志決定を下す時に役に立つ。

3. アソシエーションルール作成に当たっての問題点と目標
アソシエーション分析を行うにあたっては、目標を以下のように定めることがある。

1
. ["""ー定のサポート Lの、どの購入バターンが一・罫佐信度が高いのか」に基づくルール抽出を
付つ。

2. [
" C
' という目的商品を購入するパターン」に基づくルールお!1IL¥を行う。
1.が前項で述べたバスケット分析とよばれるものである。アソシエーションルールを打!
l
i
.
Uす
るアルコリズムは、比較的 I
i
t純なこのバスケット分析からスター卜しているため、分析ツールの
巾には「アソシエーション機能」の I~I に、このバスケット分析しカミサオ;ー卜していないものもあ
るため注意が必要である。

2. は「係々な購入バターンのなかからじという '
L
i
jI~I'I をI!借入しやすいルールを tllJ I'llする」の類
のものである。 AB U じ で C を固定させ、じに至るまでの後々な条件部の q
Jで C に長る可能性
@
jにお!1It¥していく }
j法である。
の高い条件部を、{i'{f{信!主の高い )

. にフォーカスをあて、先に延べた確信度をルール別だけではなく、全サンプル対
今回は特に 2
象者の累積確信度までをカバーできるプログラムを桁介する。累積を算出する事により、抽出し
たルール集同が

m集同に対して効率的であるか所かがわl別できる。

4. データの準備
ここに三緩知、の似!心的なデータを準備する。
一つは顧符のI!待人向 j'JTd,lt 郎、もうーつは、制符のJrr~性である。今や、小売山、百貨 I~i 、カード業

界、カーディーラーなど、開々な業界で願手干の屈 ド
t
のデータを者析している。今阿のプログラム
2

はこの間入向 ii,Jd;~

mと初!川hI¥
'
t
'
l
ーをあわせたアソシエーションルールの作成である。今 [
n
jは 例と

J
iにおいて、
して、ある小売 !
│「どのような並買行動・属性の顧客がハイネケンビールを購入する確率が高いのかI
J
に当てはまるルールを:111
1
1
11'してみる。
n
u
qd
qu

318.
[beta]
データ 1:k
W符I!詩人商品トランザクションデータ

. 1)
以卜のレイアウ卜のトランザクションデータが糸約されている。([主[4
([~14.

1)

CUSTOME TIME PRODUCT
llhering
1Icorned b
2
1
0
l
i
v
e
s
31ham
31turkey
llbourbon
3
1
i
c
ecrea
2
41baguette
4I
soda
2
2
2
1hering
2
31cracker
41heineken
2
2
l
l
o
l
i
v
e
s
2
1Icorned b
3
llavocado
3
1Icracker
3
1I
artichok
3
21heineken
3
41ham
3
21turkey
31sardines
3
l
l
o
l
i
v
e
s
4
4
llbourbon
4
41coke
4
21turkey
4
1l
i
c
e crea

jr:から JI~'jに雇11 得孫 iJ 、!肘入 [111 数、購入商品である。
I
時人向 !
?
1
1に閲しては、実務[:.で川いるデータではコード f
じされて

いる引が多く、このように物 I
I
1
1
1
1名で入 )
Jされているケースは側め

'
u
ll
'
lは数値 f
じされてい
てまれであると考える。よって、全ての物 i
ると凡なし、

uのデータセットは、 S八S によってフォーマット消

衣服いたい。
みである事を (j
このように Enlprpri!'p Minl'l'でアソシエーションを行う場合は、
データが縦系列に恨んでいる事が第一条件である。もし、データ
が、横系列に並んでいるのであれば、 S八S の trans]川 町 プ ロ シ ジ
ャ等を用い、縦横の行列を変換させる必要がある。

J
JJ
i
r
¥
'
t
'
]
:
情
報
データ 2.:顧符初 H
次のレイアウトで刷得同性データが部約されている。

変数名 CU!'tOllWI
" k
i
(
i容識別(ユニークな変数)
1
1日IgU

既柄・未婚識 ~J iJ

Seil)('tu

,
t
'
t
別

Sumai

f
tJ
i
F
i

KodolllO

子供の数

N('ndai

年代

(
1
χ14. 1) と l記
雇1
符肘ドJ:データの変数

Cust(川1(イが !D となり、それぞれが牟致するキ一

変数である。なお、データ変換の百5
[
合 L、この 2附ぢ!のデータセッ卜の変数は IDを除き全て文字
室主主である必盟がある。数的変数や述続変数は、予め文字変数に変換するか、カテコリー化させ
U1¥JlJの新たなデータセットを作成する。
てから、アソシエーションルール:I1I

5
. 結 論 部 (Conc
!u討 ion) の決定とデータ変換
~R で)illべた通り、「ルールの車内諭却を問主させて、私titiit を 15l く条件,';iíilllll ¥l するために、まずこ

の結論 (
¥
i
iを定める。今 [
1
1
1は Illpin(
、
七
百 n を!
I
持入する」が結論部である

5. 1 手順
①データの1]1
から、 1
1的アイテムを J、?っ副符を打 1
[
1
1
¥。この場 0
11ドl川
、 kpn !
I
時人隠!然のある刷得に
て、開'f'I:データと !
!
l
!
?人向 1
1
1
1トランザクションヂータを打 I
U
[
¥する。
フラグを ι
'
[
:
J
戊されている h
i
'
t
'
l
:データを l
!
l
A入 '
r
l
j
ii
l
'
lトランザクションデータのIf;に変除、全てを「ア
②償系列で(
r
l
j
i1
'
[
[
'
1h
1
>J信データとセッ卜する。
イテム」として持たせ、!!何人 '

③②のデータを卜:川{叩い lïSド Mi 山、 r を川いてアソシエーションゾミ行、ルールを(',・ IJ~ する。
④ 11J!? 人,行、 JI:II日人行のデータをセソ卜し、とのオフザベーション(的!(~)が③で作成されたとの

3
3
1

319.
[beta]
ルールに所属するかを定義

r
i

⑤③と④のデータを斤]いて、 <
<
r
t言率の高いルール 1
)
闘に並べ傍え。
⑥件数をカウントし、累積倣iI言率を算

n
¥、テーブル fじする。

以下、順を追って説明する。

1.5ASのデータステップをI[Jい、「データ1.顧客購入商!日トランザクションデータ」の 11
から、
l
I
e
i
n
c
、
kenを 購 入 し た 顧 容 の C
u
s
t
o
n
1
l
'r#を抽出する。同時に購入履歴の印としてフラグを立て
る。念のため変数

C
u
s
t
o
皿
巴r
'を N
o
d
u
p
k
e
yでソートし重政する l
D(
C
u
s
t
o
皿e
r
) を削除しておく。

2. 属 性 を ア ソ シ エ ー シ ョ ン デ ー タ の ア イ テ ム と し て 用 い る た め 、 デ ー タ の 変 換 を 行 う 。 こ の 作
業に入る前に属性分析データには分析したい変数のみを「文字変数」として入力しておく必要が

1
'や '
0:2'等のデータはそのアイテムが「存在する」とみなし、欠目や Oは ア イ テ ム が

ある。

「存在しない」とみなす。次に全ての初期属性を C
ustomer ごとに縦方向に持たせるデータ形式

.1
) 形式のデータを持たせることが可能になる。
に変換させる。この工科で(悶 5
(
図5
. 1
) 初期属性データをアイテムとして持たせた例
T
E
M
C
U
S
T
O
M
E
RI
実際の 5
ASデータセットには右の形式で
配偶者あり
男性
住居‑その他
子供なし
年齢 6
0代
2 配偶者あり
2 男性
2 住居・持家
2 子供なし
2 年代4
0代
5 配偶者あり
5 男f
生
5 住居公団
5 子供なし
5 年代4
0代

データが入力されている。この形式にデ
ータを変換するには隙々な万法があるが、

1コ ー ド 」 を 繋 げ て ア イ
今問は「変数名 1
じさせた。
テム f

IIAICUJ は 「 町 山 行 の 千f
例えば変数 r

!
!
!
Uを怠 I
床し、その後の, :
2' は「独身」
を、

1'は「配 II~.~干あり」をそれぞれ怠

味する。アイテム f
じさせる事に
よって、 I
I
A
Jc
;U:2は「独身」、 I
I
A
I
(
;
U
l
は「配偶者あり」を意味する 1
'
1
'
日M を
作成したことになる。

この変換のためのプロシジャは以トの通りである。

n
i

1
*雇 ヰ
初
!
日1
,
百
円
(
1
)7 イ子ム化
(符系列のデ タに変 1
"
,
,
) 士j
dHtaron.zok_heik(l mIH'p~ 日 =yp叶
l
e
n巨t
hi
l
<m$
1
f
iY
.
l
r
n
alTIl'益出8
O
ll.z
o
!,
u
:
‑
;
(
'
jh
い1
1
1いk刊L 1*<==~'I,r. n デ予 P と h(.Înl , 1刊日以入背の r ,・t1 ~t 川n<・I" J
m円 山 ゐ γ

r Jl ~J が入った,,:..';1をマ

l凡("l1 ~l()mer

i
fIl ~='l" 1
士<=ご 11
日 l、川 l l!fõt 入 1i.~JM の .11,る ('ll~lom('1 の y、とりだすり

の1
・
raya
l
l{
*
lh バ i~ tI同 il 即 tU..1Wlld :t i: 1*<=二利 1
1
1
1 る初ItJl1ilI'内の変れ名をすべて)li1
1
;
π
/

doi
=1t
od
i
m
(
"
I
I
)
i
r1I1:
i
:川
(
"
'
(
ド
)I
h
(
'
1
1(
河
川t
I
l
ll!l'.I.':'<三=ゼ [
]
f
t
!
i、)~4n(J)jg {
i、7 イテム{じしないり
。
l
ぶ"
d
υ
1
* ( )内には 7 イ干ム化した〈ないコードを入灯台/
ー

n

y

︑
︐

ド仰の新たなアイ子ムコー ド伯作 IN土/

3
3

1

!4

︽

4
1
1
1︾

︽

L3

1

3
t

1

︑
︐

'
o
m
p
l山 ベ h川
山 IITIPllall:i:l: 1*<==変 t
U
'
,
+ー
コ
1い m二 (
oUlpUI
いn
d
l
'
l
1d

1
'
1
l1
・山)1'1
d<ll
日 =n
川目d
¥
.
̲
h
(
.
i
:
I
)'y C
l
l
:
‑
;
!
O
l
l
ll'r
T
U
l
l
p
l
'
O
(

‑332

ジ吋

320.
[beta]
3. (
[
2
<
'
[4. 1
) と(凶 5. 1
)のデータセットから、 !
!
p
i
n
p
k
(
'
nを購入した刷得のデータのみ取

.
w

l
!
p
i
n
p
k
p
nI
!
湾
人 J J常あり刷、特」の分析データが完成する。
し縦にセッ卜する。これで i
6. EntNpri間 M
i
n
(
)
rを用いた分析

Jし、る。この作成されたデータに入っている顧告は全て
分析にはここまでで作成されたデータを H
i
l
!
p
i
n
f
、
如
、 n l"\~ 入履照あり」である。よって別れるルール全てが結論部 =l!pinpkpn になると考
える。 E
nl川 p
'
l
i
s
(
'M
i
n
p
!
' の(;1̲i川方法についてはマニュアル・ヘルプなどを参照されたい。なお、
民小サホー卜 ('I 数はユーザーが 1~1 1
1
1に定義できるようになっている。(デフォル卜はサンプルド十数

Jが、サンプルに対しとの位の割合を占めるのかに
のら%)作成するルールの結論部を実行した集トl
よって、このサポー卜を独自に定める必要がある。この剖合が極めて小さい時はサホー卜 (
'
I
二数も
小さく設定する。

6. 1手!
J
慎
1.このデータセットには変数は 2開類しか存 !
Eしない o Ent円 ])nSE Minc
可上で、 cuslomぃrを
ミ

,
i
d
'、 i
t
p
mを t
a
r
g
p
t
' と設定する。
2. Entpr]
lr
i
Rい M
i
f
l
l
)
!
" のワークスペースでアソシエーシヨンを実行する。

3
. ルールはデータベースのJjlで対象 ITEMが q
t独及び利l
台せによって先生する回数の頻度を
算出する '
]
1によって発見される。この

l
1
>1

町 出 お

m
:
u
¥は

o
c d
礼l
aニx
x
x
:
/

のプロシジャで計算される。これは民終的なルールを導き 1
1
¥す過f'iのなかで、民も初期に行われ
る処理であり、 E2 もシンプルな l~ で!と ntp l']lrI"(、 Min ぃ r のデータライブラリに保存される。(閃 4.

1)この H
与の保作名は r
1
1
0
J
ド
'
JJ
に付けられるため、後からユニークな名前に者きかえる事を踏める。
、 !
u
、
c
a
l
lする引によって ProgramE
d
i
t
o
r
又、プロシジャは、ワークスペース内での作業の終 f後
ープロシジャで

ι怠) l
'
:
nt
ぃr
p
r
i
s
t
' M
inげでは、まずメタデータ作成後、分析作業に移行するので、単独で以トの
プロシジャを実行しでも無効である。必ず、ワークスペース内で一度実行させてから以ドの作業

l
u
川t
l
lにより H
子
ひ
(
1
[1'した八時o
(・プロシジヤ

いλ出 (I(・IX'
II
(
)
N士/
I
2

:
)
(
;

ptin日メ1l()c[Pelllll!l

f)

,

Prot' .
.
¥
点
、
'
"
・ dmdl){川=1'ES'I・ I'.IJ~I Ullqn q
daln二 TEST̲llII~l Il Hq(; , q
υut 二 ~H:-;U:-; (l r .l )U Il (
1<111
="
()ulpul from])J'(
)
(
'
λ 出()(.")
i
t
{
'
l
n
s
=
i:l*A.出力デサセット・ライアデJ
名を変更した り
c
u
:
‑
:
:
t
O!
T
I
ぃr
('[討'1'('
:
‑
¥
E
l
i

日
H

¥0

1
1

1m町、 11
1
'1
'
:
.
¥
1

:'UI1

らi
i1
1の i
l
(
、
m二 7 の後に討lIjJjJ川 l=nを桁うじするとサボー卜の {
'
I数が指定 IIJ能。米指定の場介、ァ
フォル卜{[I'(の「サンプルのら'Y.
'
J の{
'
I数が 1
'
1則的に t世定される。

qJ

ηd

q
o

321.
[beta]
(
関 6. 1
) 作成されたデータセットの例(一部)。

上記フロシジヤでの s
a
s
u
s
p
r,hun のデ

I
T
E
M
5
I
T
E
M
3
I
T
E
M
4
I
T
E
M
2
S
E
TS
I
ZC
O
U
NI
T
E
M
1
O
D
O
M
O
O
O
a
q
u
e
t
t
ea
v
o
c
a
d
o a
r
t
i
c
h
o
kSUMAI7 K
5
3
4b
O
D
O
M
O
O
O
a
g
u
e
t
t
ea
v
o
c
a
d
o a
r
t
i
c
h
o
kS
U
M
A
I
1 K
5
3
4b
A
I
G
U
1
5
3
4s
v
o
c
a
d
o KODOMOOOH
c
r
a
c
k
e
r a
o
d
a
O
D
O
M
O
O
O
a
g
u
e
t
t
eS
E
I
B
E
T
U
3N
E
N
D
A
I
2
0K
U
M
A
I
7 S
3
4b
5
A
I
G
U
1
a
g
u
e
t
t
eS
U
M
A
I
7 N
5
3
4b
E
N
D
A
I
2
0K
O
D
O
M
O
O
OH
A
I
G
U
1
5
E
N
D
A
I
2
0K
O
D
O
M
O
O
OH
b
o
u
r
b
o
n N
3
4s
o
d
a
a
g
u
e
t
t
eS
A
I
G
U
1
5
e
r
i
n
q b
E
I
B
E
T
U
1N
E
N
D
A
I
3
0H
3
4 h
A
I
G
U
1
S
E
I
B
E
T
U
3N
E
N
D
A
I
3
0K
O
D
O
M
O
O
OH
5
3
4s
o
d
a
A
I
G
U
1
v
o
c
a
d
o a
r
t
i
c
h
o
kSUMAI
7 H
5
3
4 h
e
r
i
n
g a
A
I
G
U
1
5
3
4a
v
o
c
a
d
o S
U
M
AI
7 NENDAI30KODOMOOOH

ータセットである。附人商品と

:
1が耐力含まれている。(大
属
‑
t
'

I!l論上、こ
文字が属性)なお、 J
のデータセットの右端に、全て
のオブザベーションで

i
l
l
(
、
i
n
p
k
c
、
nJ が 入 っ て い る 事
を認識しておく必要がある。

6
. 2ルールの書き出し
(
[
曳1
'6
. 1
) で完成したルールのデータセットをllJいて、一つずつルールを書き出す。この(図

6
. 1) を例に、以ードスタイルのコードを自動的に書き出すようにマクロの設定を行う。
l
fh
a
!
!lIP
1
l
t=
"
1
'anda
・、0<・
ado='l 日 間 1artIehol
¥
=
'l
'HndsumaI=';'and]
.
;
:
o
d
o!TIo
=
'
O
(
)
"t
h
P
l
lohs=1
'U叶 t
e
=
"
]
'andHYOt引 do二 l
'andar
.
t
i
l
'h
υk=''andぉUln<l】 ='1'Hndkodomり ='00'thpnoh日 二 2:
'fhal

'
t出パ la=1'andυnwl
:
;pr=l
'andH
V
ο口 μ
1
0
=
"1
':mdkndomo:::'OO'andhail
!u=i"thel
1 ob
日̲"

I
l
IH
1
!
!
t
H
.
‑
'
t
tぃ
=
'
,

<
1
と
、U
I
T
I
t
l
l二 I and丸 汁 l
H
>
t
u
=
:
l:
lndI
1v
!
H
!
n
i
=
"
2
<
)
"Hndkod
川n
υ
=
'
O
(
)
'th刊 1obs=.1

:
1
1
1

実際のデータは iì'~ ,[IiJtft も文字変数によってコード{じされている。例えば hagu(‘ IIp

n
出入者は変数

Lてであり、 avo仁 川 !
o1
1/
1
1
入荷は変数名 (
)
:
3
0 にフラグがある。(実際、 SAS
名
(
)
.
l
(
)
に 1のフラグが t

,

の変数れは加一文'{:11
が数fI"
iということはありえないので、

(
)
:
3
0
' という名前になる。)このプ

ロセスでは変数名が多数となり、場介によっては S八Sで設定されている尾大指定変数の数を紹え
る場台もありうるので注意が必要である。また、データボリュームによってはコンビューターの
資源に泌響が山ることもある。

作成され何る変数の数二

(
2

属
酎

予
め
、
干
和
利
リJ
川する変数リストを作成し、データセットに収めておく。このデータセットを)iJい、以
下の数値、怖をマクロ定義しておく。
F記プロシジャのマクロ変数 &
n
o
b
s はルール数(オブザベーシヨンの数)、

%
&
v は::fi オフザベーシヨンに立場した変数名、
%
&
&
vは数(Ji[名変数(今l
副は1
1
持人物)の接頭語、(ノ;
‑
1
1
1
1は二') +第 nオ ブ ザ
2場した交数名
べーシヨンに 1
止
m
a
x
vは干I
J
IIlしたノt変放の数をそれぞれ指す。
dnl日 父 入 X
'ïl ,・ 1・引い mpYI い m Jl~出 1.,':/* 書き出しファイルを指定士/

tyyy: /
*
E
n
l
p
!
'
!
)I
'I
S
(
':
¥
l
i
n円 に よ っ て 作 成 さ れ た ル ル の デ タセットり
l
I
l
THyilum :'~l i
tt>!TI
1
(,))巴 Ihυ1、
,j
.
o
l附 &nO!l、対 1i
lいlTI¥出 :
!
O nlup¥¥.:¥.示日
川 1
‑
;
'
1
)
υ
b
s:
勺υ
l恒
I
'U
I'
i
f
'i
!
̲
t
!
1
li
二 1t
l> d
im(I!いml
i
f
i
t川 nn:=" t
l
l
¥
'
n江川け日I1n
1、
,111ミ=
1
1
¥・
1
1
3
;
1
1
i
l叩 1
)
:
‑
‑
11
"1
i
l
;
'I11'¥. I1
)i
n(
'
(
)
''
1
' ';~'
・
¥
;
''
1
;
''~. '
W
'
!l
'
)I
全購入物独立変数全て頭

同

、

,
コ ,
"

文字力、数値で入っているため ア ル フ ア ヘ ッ ト 大 文 字 小 文 字 で の 区 分 な と 、 ル ー ル テ ー タ セ ッ ト の
I
IJ
.
‑E
i
:
;1
:ア 雲 圭 1
色云ろ,0
、事f1{;&':!' *

,
げ

3
3
4一

322.
[beta]
theni
.
t
emx=刊 H
n
p
r
c
:
‑
;ぷ('ー曾 Ilitemx) /サ基頭語として, ,を利用。り
i
fi<dim(ilem)thp!
ld
o
%
【1
0i
=1%to&ma日
i
fi
n
d
e
x
(
i
t
p
I
T
I
x('omI Jl'(~:-;ド("&&、 &i"))=1 t
hl'n<
!
"
value=eOm!lfpss(:,,;u
l
)
s
tr
(
i
t('mx.l(~n l! t h("&&γ&i")+l))
u
e
=
'1 thpl1、日 l
uい=
'
1
'
i
f、日 l
l
l
t"
&
&
、&
i
=
'
"
γ,,1
1
1
C+
(
‑
1
)'
"
川1d"'
(
5
ifitem:i+nne" t
h利 1p
d日 put"&&v&i='"、
・"
I
l
l" +
(‑1)" q
川

%end
e
l
s
edo
%uoi
=
l%い &mHX"
il・ l 山 lex(itf~mx.( 川 TI])re出("&&、 &i"))=1

thend"

value=co lTI}lrp同 (subst l' (it 円nx.l('n~t h
("&&v&i")+l
)
)

i
f"江 l
u
e
=
''thいn、日 l
u
e
=
'
l
'
&
&
、 &l="'γ"Iue+卜 1
)'
"
'
'
在
p
l
l
t"
e
n
c
l
%end
endend

、

l
'a
l
l name(obs{n},xxx)
put"then"xxx "
:
:
:
:
'l
'
run;
%mend
%x

6
. 3 ルールの読み込み
l
‑
!pinpken購入者・未購入者間わず、全サンプルデータをJljいる。個人属性データと購入物トラン
ザクションデータを Tranf
‑
;p
o関 し た も の を マ ー ジ し 、 上 記 プ ロ シ ジ ヤ で 作 成 し た ル ー ル フ ァ イ ル
を読み込む。この際、必ず、購入のあるなしを意味するフラグ変数を入れておく事が必要である。

n
c
'c
:半t
e
m
p半t
e
m
p
2
.s
a
s
',"で読み込みが可能である:
'
y
'
,i

3
司
京
拘
f
f
(

そめ他
その他
持軍

持1<
拘1<
'
;
:
(
e'
i
!
!

そのi
J
l

持r.

持1<
ζ回i..~宮

その他

年一日目切岨回目白印初刊日初羽羽田羽

住居

持1<

平・一∞∞∞∞凹叩叩叩別凹叩凹一山町叩凹

来

婚一一崎将婚符婚婚婚婚婚婚婚婚婚婚婚婚
1Rf
一 既 既 岐 問M 1 1 1 既 岐 既 1 1 1
m
R‑
EI
F

呼山し後のデータセット作成例:

l
m旺 │ 弧1 I
臨│附│悶
t

1

1

1

c
,

1

n

1

句!日間鰯 1
00'>開│

1

n

n

1

n

1

n

1
1

n
n

1

その!也
ぞ
r
J
;
。
也

1
1

n
n

1

n

1

c
,

1
1

I

1

n

左 iJ'ら1目;こ、伽l人肢H
'
!
:、トランザク、ンョンデーータ(購入のあるなし)、ノレ』リレ適 け‑
f
j怖 いl
出 1 )あるなし

6
.4 累積件数のす~II',
先にも述べたが、アソシエーションルールにはルールに 'T~ 彼しているオフザベーションがいくつ

かあり、実務として川かすには、「県たして全体の f1u;IPJが反応するのか」をも I切れする必斐がある。

l
p純に飾的庄の向し、 nールをいくつか選ぶ、という }ji
Lで は そ れ が 全 体 の fllJ'X,
をI
l
iめるのか、を
Ru
qd

qu

323.
[beta]
判断するのは l
材難であり、業務に活かすにはもう一手間かけたいところである。 DISlon T
r
p
pの
僚に、必ずしも、

1オブザベーションは 1つのルールに納まるというわけではなく、 1オブザベ

ーションがいくつものルール内に作花する可能性があるのがアソシエーションである。例えれば、
ルール 1に!訂版しているオブザベーション全件がルール 2にも所属しているが、全(!j:対象で検索
するとルール之の件数が用え、確信度が減少するという事態もありうるからである。
全てのオブザべーションがとこのルールにあてはまるのかを見傾め、ルール 1からルール n
までの累積依信度をここで算出してみる o
Fル

ルの書き出し吋

o
p
t
l川 日 山 田 our円・ 2
【 lata れ ppl~.:

s
e
t 購 入 履 歴 な し 顧 客 の デ タセット
購入履歴ありのデータセット (
1
1
1
=川 1
)
・
i
n1thenh
e
i
l
刊
f
=
γ I
*
h
"
i
n
e1
は購入履歴ありなしフラグり
i
l
l
メe
heine r
=
'
n
'
%im.
・1
・
干 h、
mpY
temp2.sas'
f
l
l
n
;

。

F累積 fHγi
dataヌzz
日e
tapply
I
>
¥
"h
eine f!1(バ s
o
r
t
l
.
d
l目 。
arrayobs:*~ o
arrayf
l
'
(
j勺
: 5f
l
'ql
‑
f
r
q
n
n
n
i
fl
i
r
s
l
.hpilH~ ft
hcndo
doi
=It
od
i
m
(
f
r
q
)
:
f
r
q:
i
}
=
O
pnd:

/会Iln
nlこはル

ルの件数を入れる【吋

市
}
ー
doi
=
1t
odim(り l
f
r
q
l
i
:
+
(
)!
Js
:
J
i

i
fla~t .hei lH~_r I
h
0
1
1output
ke句) heine̲
"
tf
r
ql
‑
f
r
q
n
n
n

Fここも nl1n
lこはルールの件数を入れる

t

企/

proetranspo同 datH=summary(\\"here=(h(_~ine_f='n')) out.二日Immary2

,
'
a
r 11mC l
・
l
1

l
'
I

run
l.
I
)
u
n
:
1
datnf
OI
l
T
I
PJ
'
ピeぉ刈おlISC1
・
bun日ummary2・
《 川1
二 《 りu
nt/kυ11+円 )
l
l
nt
)
i
f只 c
l 示i
'
l
.p
=
.t
hpl1 d
(
̲
.
l
e
lp

rUl
1

n
4

3

︐
︑
4

高一

開
一1

:

A叫一

羽目一:

1
1
3
2

刈吋一

同
一1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

2
1

1

ここで完成したデータセッ卜の‑例。

ハhu

qd
qd

324.
[beta]
それぞれのじ uslomθr が fllJ係長1
以降のルールに所属しているかがフラクによって判明する。 ]W!J
.
:tonH'r は以 l
i
f
t]W! n までフラグカ$.".v.つ。こ 1
1はh
J主冬的に巣1i
H会員の数
にフラゲが立っている C u,

を判断するためである。

6
. 5 テープル佑

REqを河川する引によ
これまでの過科で作成したデータセッ卜のそれぞれのルールに該当する F
<
l
r
i
f
三位が高いのかが '
1
:1
]7]1)可能である。iJ.!に、
って、どのルールが <

トータルで見た場合、「第 N 需

1-1 までの)~ールを適川する l j;により、巣 h'l 6{r・ i三度は X'Y.,である」といった結論も算出する 'Ji がで

きる。ここで、累積倣信!主を算 1
1
1する必裂がある。

'l
I
:
x
)
I
'
,i
件数(この場合!k inl'kl'n !!PJ入行)
ルール N までの崇 h
累h
'
i依 f
'
i
H主=

ルール N までの累積該当件数

r
1
的行

J
聞にルール lからルール N まで'
i
i
l
l促した場合、
この作業により「確信度の高いルールから I

1
¥す事が可能である。
動を起こす確率は XX%である。」という結論を 1
柱
主t
'
l(
i
'
{
(
(
三
度
を
f
.
l
:1¥した例(故 f
i
lJ
f
1[
1はコード化された!日i
人物↑M[n

,
・
?
ー

.

,
;
竺
門
外

r
3
r
t
:
‑
:r

社
ぞ Tと
ず

ー

I
S
O
1
:
:
:
0
1U
'
:
1
I
I
4
1KODOMOJO
110
1
0
0
:
'
1KODOMω ー
l~O
20
3
1
0
0
18
0
130
4
1SEIBETL
t
l
110
100
1SEI8ETUl KODOMOJO
1
1
0
きεl
B
ETL
t
l
20
130
:
:
qsur 1
7
SEI8ETUI
1
3
0
4
1~ODOMOJ
130
1
3
0
'
:
;
1
=
1
1
"
"‑
‑
‑
'
1 I1
<000r.
1
0
)
0
J
.
r
ι
t円

:
t
r‑
:
r
r
5

f
T
,
1
)

Ik

~当者

!
t
e
m
!

白

日

,:

20'
l

ラ
ρ

ち

1
0
0
1
3
0

一一一寸+ーー

・Fヒ‑

一
川

・

‑
lDorI
C

日ロt‑

,
t
=
芸 コ

~4

æ

8
8J '--7'~:1IJ

"

Q‑

ち

,
'
¥

3
:
:
3

包
.
;
, 曽
掛
ち
、
、
,
、
一 明
之
(
>
ち
ぷ4
1
( 9ì.94~
・ラ*07~~4'宅

7
.
!
j
41
j
340 9
3
4
1 ,~'75\
3
4
1 97.5~,1j
41 978
)
4
1 9i
.65

宅
ち
、

勺

毛
主l

,:

.
)
.
9
可

一
r

,
C
i‑9
E
Z
3
〉公判
Bヨ

4

65
64
47

,
:
1
)

I
I
J

、
;
:
̲
;

宅 3:::三
字
、
D
4
¥ 3::
望
日
。
、
,
'
3コ
3
吉
田
、
灯 87~

9
0

~摘

H
‑
:I"'I'!k.‑
:
n
E量~麿
電
量λ者
C
3
11
0
0
o
.
01
J
i
152
1
5
:
: 9~;::~,'J
152
IS3 99.3~,1!i
~'4";
242
担 7
先
:
)
.
4
志
望
.
.
:
0
'
:
'
古
324
;
1 信 43~
32!
324
324
nー
327

件雪量

2

α
‑
ω

‑UH‑‑M

・
‑

二ぽ二 KTP‑H

一
一一回一
ー
附
一D m一官一日

己 一 DEE‑‑員

J‑EJ‑dzιU圃民︑一︑ ed

一

3
0 1HAI日J
I
4
INENDAr
5
I'
"
E
I
B
E
T
t
o 1KODOMDlO1H~.IGリ1
3
INE
l
'
IDACO 1
1
3
0
1
3
ISEIBETUI 1
J
I
1
8
0
1
と0
4
I .
E
I
8
E
T
U
I 1KODOr
首
[
0
)
0
3
IN8'
l
Dl
.[
:
01
20
3
1包 EIBET
l
.
GI
1$0
4
IS
U
r
i
払1
7 1NEND~~O
3
IS
U
"
'
'
'
.
1
7 I
130
コ
Isur
,
"17 IS
E
I
E
:
ET
l
.
C

,
'
!i申
己Iii梨
、

・

ち

品
,

・,

雪型補
~当者

a 曽a
¥

20

20
1
0
0

ち
,
;
H~ n~k'! 門

件君主
輸入者
;
;
t
官E
聖
S
JI100DO警
53
1
(
1
1
)
~~9
白
l'1
0
1
9
3
1
1S
1
1
631¥
lHi
1
1
4 9~28'!
対
~::2刊
57
rr
54 沼
:
:
:1
31
J
4
ラ3
1 9
:
:
:1
51
j
究ζ 9 )1
1~
53
1
1
1
0
1
0
:
:
: 復 1
5
0
49
50
4
:
:
:I 97V
(
;
¥
49

,
白

t
(
1I '~.!羽
4
4
1
.
t
i
.
?
喧

!
:
G

リ~~,
4
ι

58

4
74
1
:1 !;::~:7
1

7・~(l

i4
54

・

,‑ U

,
‑o

ち
ぢ
(
1

引g::.Bラ'

ま'355~

~'IJ斗

504
504

・
白
ちs
ち4
む
足
、 白
..;.ç.
む .n~
ち
1
.
14
百
台
.;t::24~
ち
04
阜
1
)4
5
5
! !
;
0
2
2宅

J

,
,

55t ヨ
1
.
4円
5~.2
9
1::.:O~
叫
552 91 .3 0~
5
5
2
ζ 9
1 0
'
)
)
;
319
)
.
:
:
:
1
.
.
'~' .•'
ヨ
555 '
)
)
.
8
1
Z1 B
'
;
'
H
:
n
勺

l

、

3
.宅

~,~, ~,

、
、官官
、

宅
宅

i

卜段のルールまで i
t
l
lJil!すると崇 h
'
l(
i
'
{
刊
1[
‑
j泣
はつ()約 J
%。

7
. 最後に
以上、

、
州 fvlinドr を]IJt、たクラスアソシエーシヨンの h
iLをi
苅ijl.に述べてきたが、このジ

Entprpl'i

八
白
山
川
・ iiltion !{1I!ドといった分析千法もある。
ャンルには他に品、<jll('ntiil!!'allドrn やじ)'('!i(・

5
均
{
ド
刊
川
、
刈
川
{
什1
1
I
以
I
l
刊
'
汁
叶
川
n
1
刊tli
泊
川
}
け
! !
刊
》
う
;
川
汁
I
山
什
1t
(
刊
汁
'rn ま
は
( 車九
J
i
i
一3
3
7

325.
[beta]
論を導き [
1
¥す手法であり、例えば、「パーソナルコンビュータを購入した顧客の 25%,
は
、

quilY I
n
d円
内にプリンターを購入する」、I"E

」ヶ月以

Fund をホートフォリオに組み込んでいる顧客の

1
)
)
%
,
は I~ド以内に InlprnalionaJ Fund をも保有する」といった事例である。

また、

I
1的行動ま

‑
%
1
.
在するルール附築の手法も考えられている。
での順序や同数なども .
C
y
(・J
i
cA
s
s
o
c
i
a
l
i
o
nl
{
u
J
pは
、 一定 W
J
11
¥
l1
i
}
.に同じ行動を繰り返すパターンのルールを探索していく
方法であり、こちらについても研究が進められているようである。
今回は最も単純な組み合わせからのルールを探索する事を日的とした。しかし、定義された結論
部だけから条件部が構成されるのか、それとももっと概念的に七位の「川か」を則定すればより
引般になるのではないかという「概念ハイアラーキ」の抽出を含んだ議論もある。
ルールが l

参考文献

S
r
i
k
a
n
tR
.andVu(~. and八
宮r
awalR

lD8i

Minin区A
!
‑
:
s
o
e
i
a
t
i
o
nRuJesw
i
t
hIt8me
o
n
s
t
r
a
i
n
t
s

ln T
hu'd1
n
t
e
r
n
a
t
i
o
n
a
JConferenceonKnowJedgeDiscovery& Data1
I
.
J
i
n
i
n
g

(
j
i
‑i
:
3

.
l12N
o
.t
j
喜連川(愛 188i 「データマイニングにおける相関ルール抽出技法」人工知能学会誌 Vo
ら1
:
j
.
5
2
0

q
l林:、j
i
.l
m
m 「くくデータマイニング>> ~大別模データからの宝出し ~J I
J科 技 述 多 変 量 併
析シンポジウム予稿集

谷 同 日 山 手j l~m8

1"アソシエーションルール羽 I
J
U
Iプログラムの試作 J S
U
C
J
.
.
) '88 第 li同日本

2
S八Sユーザー界総会および研究発表会論文集 550:
MizukiY
.l~)~)D Dalaminin宮 Exampln;inBusinοH臼 An'a

1
n15111SYmpoSi
1
l
l
1
1Data1
11iningand

KnowJedgeDisCOV
eI
:
I
'i
nData5
c
i
e
n
c
e 18:3-18~)
SAS I
n吋 i
l
u
1
8,
Japan I
D
D
i

ASA只 I
n
s
l
i
t
u
l
(
、WhilpPappr:FindingSoJuli
o
n10 I
)a
l
aMining

Sridhal
'J
{
.Sar山 中 I'M 八 v
iS
.1888(
)
nI
h
l
、discovpry(
)
fI
n
lい 川 市 1
1
1
1日 Pallpl'r11r1八おおり{・!日 l
i
υ
nRuJps

n

Procぞe
d
i
n
g
soft
h
e21th AJ1n
l
l
a
J1
n
t
e
r
n
a
t
i
o
n
a
J Conference on VelTLal'geData Base

:~()H.:3í:)

‑338
326.

日本 S A Sユーザー会 (SUG I‑J) BrandQ u a l i t yC o n t r o l : A NewS t r a t e g i cBrandB u i l d i n gandManagement Y u ‑ i c h i r oKATO MarketingD i v i s i o n M CS o l u t i o nTeam DaikoA d v e r t i s i n gI n c . Departmento fV a l u eandD e c i s i o nS c i e n c e TokyoI n s t i t u t eo fT e c h n o l o g y 要旨 ブランドマーケティングにおける最適なブランド価値設計を実現するために 開発された BrandQ uality C o n t r o lシステムについて述べる.本システムの価 値設計手法は,認知科学的見地に基づいて構築されており, SAS システムによ って実装されている. 本論文では,従来型のブランド管理システムの限界について触れた後,ブラン ド価値開発上の着眼点および本システムの具体的設計手続きについて述べる. キーワード: BrandManagement , C o g n i t i v eS c i e n c e, S c i e n t i f i cS o l u t i o n I n t r o d u c t i o n S i n c et h ebookmanagi 刀gb rande q u i t y w r i t t e nbyD.AAakerwaspublished i n 1991,t h e r e have beenv a r i o u sd i s c u s s i o n s concerned withbrands. In Japan,manymarketersa r eusingt h eterm product"t otheterm brand て whilesomeproblemshavebeens t i l lremained(Kobayashi,1 9 9 6 ) .F i r s to fa l l, t h e r ei sal a c ko ft h e o r e t i c a lconsensusamongmarketersandr e s e a r c h e r son s . Second, given t h i sl a c ko f t h er o l e and nature o f what brand" i understandinghow brand"worksi nconsumers'behavior ,t h e r eremainsthe q u e s t i o no fhowbrandr e s e a r c hshoulda s s e s spowero fbrand.Furthermore, marketersandbrandmanagersmusthavebeenwonderinghowtheyshould d i s t i n g u i s h brand"from productて Definingwhatt h ef u n c t i o no fbrandvaluesi s,wewouldl i k et oproposea measurementprocedureo fbrandv a l u e sbasedonthec o g n i t i v es c i e n c e . ‑339一

327.

E f f e c to fbrandv a l u e sonconsumerb e h a v i o r We d e f i n ethatbrandworkst od e c1 'e asea1 0 a di naconsume1"sd e c i s i o n ‑ makingp1'o c e s s .Thati s,whenthebrandva1uesa r esystemizedandf i ti n t oa consumer's g o a 1 / p 1 a n know1edge s t r u c t u r ea s s o c i a t e d with the product category ,i twou1dminimizet h etimei ttakesf o rhim/herd e c i s i o nt obuythe brandbecauseh e / s h ia1readyknowsthatt h eb1'andi sva1uab1ef o rhim/he1'. Ontheothe1'hand,i ft h ebrandva1uei snotsystemized,i twou1dtake10nge1' timef o1' him/hert od e c i d ewhichb1'andi ss u i t a b 1 ea tthep o i n to fpu1'c h a s e . a t e g o r i e s,consumers' purchase behavio1' i n many Except some p1'oduct c o c c a s i o n si sturnedoutt obenon‑p1anningb a s i s . L i m i t a t i o no fc u r r e n tmanagementm e t h o d o l o g i e s Incu1'rentb1'andmanagementpa1'adigm,numbe1 'o fmethodo1ogiestendt o i e r a r c h i c a 1va1ues t r u c t u r e .Theymentionthatthe p o s t u 1 a t et h a tb1'andhash f u n c t i o n a 1 va1ues o ft h e brand a r ep o s i t i o n e da t the base 1 a y e1' as the whi1eemotiona1anda f f e c t i v eva1uesa r ep o s i t i o n e da tthe fundamenta11eve1, a y e1's as the pe1'c e p t i o n1 e v el . However,what t h i s brand va1ue uppe1' 1 s t1'ucture work f o r ? Where does t h i s brand va1ue s t r u c t u r ee x i s ti n consumer's memory? Does t h i ss t1'ucture a1ways a p p 1 i e st oa l lo f the consumers'decision‑makingp r o c e s sa tthep o i n tofpurchasebehavior? h e r ea r etwot y p e so fmemory:10ng‑termmemoryand Inc o g n i t i v es c i e n c e,t 9 9 5 ) .Abovementionedmethodo10giesf o c u son1y workingmemory(Takano,1 a J u eI nconsumer云J o n g ‑ t e r mmemo ξy ,becauset heymeasu1'ej u s t onbrandv whatconsumersknowaboutthebrand.Inana c t u a 1s i t u a t i o n,consumers 1 'om 1 0 n g ‑ t e1'm a c t i v a t e on1y t h e necessary know1edge t o evoke a brand f memoryt owo1'kingmemory ,b ecauset h eamountofprocessedi n f o1'mationa t onetimei s1 i m i t e d .Weneedt omeasurewhichbrandva1uesa r ea c t i v a t e di n h i s / h e1' working memo1'y,by f o c u s i n g on brand v a J u e snot I nJ o n g ‑ t e r m nworkIngmemory. memorybutI ~easurementprocedure To i n v e s t i g a t e b1'and v a 1 u e si nc o n s u m e r ' sb e h a v i o r, we p1'o p o s ea measu1'ementp r o c e d u r ea sf o l l o w s : Phase.lMeasurementofconsumers'goa J/ pJanknowJedgestructures F i r s to fa l l,wei d e n t i f yc o n s u m e r s 'g o a 1 / p 1 a nknow1edges t r u c t u r ea s s o c i a t e d 1 e si n witht h ep r o d u c tc a t e g o r y .Thisknow1edges t r u c t u r ep 1 a y simportant1'o ti s c o n s u m e r s 'i n f o r m a t i o np r o c e s s i n ga se v a 1 u a t i v ec r i t e r i o n( T a j i k a,1994);i c o n s i s t e do f' ' subg oaJsて Weg 1 'a sphoweach ' ' subgoarw orksi nd e c i s i o n ‑ makingp r o c e s so fpu1'c h a s eb e h a v i o r .( S e eF i g .1 ) Phase.2ExtractaprobJemt obesoJvedaboutthebrand Wehavetwoa n a 1 y s i s e si nt h i sp h a s e :macroa n a 1 y s i sandmicroa n a 1 y s i s .I n macroa n a 1 y s i s,wei n v e s t i g a t et h epowero ft h ebrandbymeasuringt h e a d j u s t a b i l i t yo ft h e brand toward a c o n s u m e r ' sg o a 1 / p 1 a n know1edge s t r u c t u r ei ns c o r e s .S i n c et h ea d j u s t a b i 1 i t ys c o r e s a1'emeasuredn o to n 1 y ‑340

328.

towardt h ewholeg o a ls t1'uctu1'ebuta l s otowa1'deacho ft h e s esubg o a l s,t h e brand power i si n v e s t i g a t e di nd e t a i l s . Such an i n v e s t i g a t i o n makes i t oc l a1'i かthesuperiority01'i n f e1'i o r i t yo ft h ebrandcompared p o s s i b l ef o1' ust withc o m p e t i t o rb r a n d s . Att h esametime,wed e s c1'i b eeachbrandv a l u ea s"brandsemantIcnetwork na n a l y s i so fm i c r ope1's p e c t i v e .Thes t1'ongi d e n t i t yo ft h ebrand s t r u c t u r e "i oc a l l e d' c hunkてi nt h ebrand i salwayscomposedo ft h ec l o s e dl i n k a g eu n i t,s semantic networks t r u c t u r e( S e eF i g .2 ) . Ouri n t e n t i o ni st ov e r i か the e x i s t e n c eo ft h e brand i d e n t i t y through t h i s b1'and semantic network x t r a c taproblemo ft h ebrand s t r u c t u r e .Basedonabovetwoa n a l y s i s e s,wee t obes o l v e d . F i g .1Consumer'sg o a l / p l a nknowledges t r u c t u r e 8 7 6 5 4 9 3 2 す/ ‑341 Hv pげ﹁﹁﹁vpvrvrr?に' ト ングーまり GKJINDCAB 一 ι1 hJ 指通りのよ l 一フ一フ一フ一フ‑フ一フ‑フ‑フ‑フ 洗髪が面倒じゃない ンンンンンンンンン 1AOunununununununu F i g .2Abrandsemanticnetwork Brand2 Brand1 ブブブブブブブブブ nunynuoonynynU14AU 099877766 袖 一フ一フ一フ一フ一フ一フ一フ一フ一フ一フ一フ一フ一フ一フ一フ一フ ωω拐 ⁝ ⁝ 間 ⁝ω 側一山肌鳩山内⁝ MMm 札V 全引ンンンンンンンンンンンンンンンン一 ABCDEFGHIJKLMNOP 1 ド ドドドド.トドドドドドド.トドドド 〆 ︒ ・且今︐ B 3 a司 ・3 唱a ↓ブブブブブブブブブブブブブブブブ 7iiizir‑‑; K 2 1 i ・ 11234567891111111 い イa a . 0 0 ↑ ー E冨弓;~ì 己ヨ 。 1

329.

Phase.3DesIgnIngbrandI d e n t i t y Wehavet h r e es t r a t e g i e st os o l v et h eprob1ema sf o l l o w s . Eacho ft h e s e s t r a t e g i e si st od e s i g nt h ebrandv a 1 u e : 1 .T oa d j u s ti ts ot h a ti tf i t si n t ot h ec o n s u m e r s 'g o a 1 / p 1 a n know1edge s t r u c t u r ea s s o c i a t e dwitht h ep r o d u c tc a t e g o r y . 今c o n s u m e r s 'g o a 1 / p 1 a nknow1edges t r u c t u r e ss ot h a tt h ebrand 2 .Tomodi s u p e r i o r i t y / i n f e r i o r i t yi nac e r t a i n segment a 1 s oc h a n g e s . The b r a n d ' s e x i s t i n gc h a r a c t e r i s t i c swou1dbecomemore a c c e p t a b 1 et ot h e consumers, w h i 1 eo t h e rc o m p e t i t o r swou1d1 0 s et h e i rp1'e s e n c ei nt h a tsegment. 'newg o a 1 / p 1 a nknow1edges t r u c t u1'e :byc r e a t i n ga 3 .Toc r e a t econsume1's 'know1edges t r u c t u r e,t h eb1'andwou1dt a k e newv a 1 u esegmenti nconsume1's i t s dominance i nt h i s new s e g m e n t . I no t h e1' wo1'd s,t h e brand wou1d 1 'e p1'e s e n tt h es t e r e o t y p eo ft h i ss e g m e n t . a t i v es t1'a t e g i e sa r ee v a 1 u a t e dt os e 1 e c tt h eb e s ts u i t a b 1 eonet o Thesea 1 t e1'n putt h emarketingp1ani n t oe f f e c t . F u r t h e rd e v e l o p m e n t Toencou1'aget h epartne1's h i p withourc l i e n t s,i ti s necessa1'y f o1' ust o d e v e 1 0 pmethodo1ogiest os o l v emorec o m p 1 i c a t e dandd i f f i c u 1 tp1'ob1emsby 1 'a mewo1'ksa smentioneda b o v e . improvingt h ef F i1's t,a p p 1 i c a t i o no f乍o r p o r a t e "b1'andva1uesmustbetakeni n t oa c c o u n t . u n c t i o n,which Oneo ft h ec o n t r i b u t i o n so fsuchv a 1 u e si st h eendo1'sementf a s e saconsume1"spe1'c e i v e dr i s kf o rh i s / h e1' having01' usingt h eb1'a n d . dec1'e Ont h eo t h e1' hand,乍o r p o r a t e " v a 1 u e smayo b s t1'u c th i s / h e1' decision‑making p1'o c e s so fpurchasebehavio1' i nsomeo c c a s i o n s,a so f t e nseeni nt h ec a s eo f f o o dp1'o d u c t smadebychemica1manufacture1's . Optimizationo ft h eb1'andf o r m a t i o n si sananothers u b j e c t .Mosto ft h e fb1'andsi nonep1'oductc a t e g o1'y ,ande acho f c 1 i e n t shaveac e r t a i nnumbe1' o t h e s ebrandshasi t sowno b j e c t i v e sand1'o 1 e s . r p o r at e "v a 1ues,howcanwec o n s t1'u c t,a s s e s s,andmanage Conside1'ing 乍o formations o f brand v a 1 u e s ?I ti s extreme1y important t od e v e 1 0 pa f 1 'a mewo1'kandamethodo1ogyt h a tp r o v i d et h es o l u t i o n st ot h e s es u b j e c t ss o t h a tt h esupe1'i o r i t ya g a i n s tc o m p e t i t o r swou1dbeevenmorer e a l i s t i c . R e f e r e n c e s Aake, ' 1 D .A .(1991), "ManagingBrandEquit y , "TheFreePress. ,K . L .( 1 9 9 8 ),S t r a t e gI cBrandManagement , "P r e n t i c eH a l l . K e l l e r Kobayashi,T .( 1 9 9 6 ), "SemanticA n a 1 y s i so fBrand:Approachest oA d v e r t i s ‑ i n gS t1'a t e g y , "Y o s h i d aHideoM台m o r i a JFoundationResearchP a p e r . Takano, Y .( 1 9 9 5 ),Memor y , "Un i v e r s i t yo fTokyoP r e s s . 1 9 9 4 ),I n t r o d u c t i o nt oC o g n i t i v ePsychoJog y , "ScienceP r e s s . T a j i k a,H.( ‑342

330.

日本 S A Sユーザー会 (SUG I‑J) ネットワークトラブルの実態とその対策について 田久浩志* 吉川誠司** 牢東邦大学医学部病院管理学研究室 料 WEB110 A n a l y s i so fn e tworkt r o u b l eandhowt op r o t e c ty o u r s e l f TakyuHiroshi* 牢 Yoshikawa S e i j i * * Departmentofhospitaladministration,SchoolofMedicine, TohoUniversity 牢 WebmasterofWEB110 要 旨 ネ ッ ト ワ ー ク ト ラ ブ ル の 相 談 を す る WEBで行われているアンケート調査を解析した。ト ラブル経験の有無、および実際に受けたトラフルと回答者の関係を検討した。その結果、インター ネットを始めた初期では有料サイトからの脱会ができない例が多く、年数が経験するにつれて迷惑 メールの件数が多くなった。年齢、性別に関係なくインターネット経験に被害が存在したため、入 学、入社、入会の各時点でネットワークトラフルの啓蒙活動を行うことを提案した。 キーワード: JMP4.0beta4,WindowsSAS6.12,ネットワークトラブル 1.はじめに インターネットの普及につれて、有料サイトからの退会、迷惑メール(スパムメール)、クレジツ トカードの不正使用などのネットワーク上のトラブルが頻繁に発生している。しかし、どのような 時に被害にあうのか、性別年齢などと被害者の関係は何かといった解析はほとんど報告されていな かった。 B11 0 の協力を得て、ネットワー 今回、ネットワーク上のトラブルの相談にのるホームページ WE クトラブルの被害者の実態を解析し、トラブル回避に関する検討を行ったので報告する。 2 .対 象 と 方 法 WEBll0 とはカード詐欺、ネットストーカーの調査、アダルトサイト解約などの相談にのる組織 で、ホームページ C http://www.webll0.com)でその活動を公開している。近年、本組織はネット N ‑ B i l l )を追跡し、その活動はテレビの特別番組(ザ・スクープ)で ワーク上での大規模な詐欺事件 C も紹介された。このホームページでは、ネットワークトラブルに関するアンケート調査を行い、図 3 4 3

331.

lに示す項目のデータの収集を行っている。今回、 99/2/2から 99/6/9の期間に回答した 2870人 のデータを解析対象とした。 図 1アンケート項目(一部) 被害経験の有無 被害の種類 対処方法 公的機関への相談 相談した機関 年齢 性別 住所 職業 パソコンの o s ネットへの接続方法 アンケートの回答は、図 2のような形式の電子メールで w ebmaster に送られ OutlookExpress のメールファイルとして記録される。 ailExpVer2.7 まず¥このメールファイルを、メールファイルの分割・変換・移行を行うツール M を用いて漢字コードを統一し lメール lファイルに変換した。 ysytem6 . 1 2 を用いて、各ファイルから必要な項目を取り出し、デー 次に、 Windows版 SASS . 0b e t a4に取り込み解析を行った。 タセットを作成した。最後に SASデータセットを JMP4 今回は、被害の有無、性別、年齢、トラブルの種類、インターネットの経験(インターネット歴) の各項目に限定して解析を行った。 図2 アンケート回答の例 ・ ・ ・ T o :webmaster@web110.com From: @......jp C o n t e n t ‑ T r a n s f e r ‑ E n c o d i n g :7 b i t C o n t e n t ‑ T y p e :t e x t / p l a i n ; 8日(土)2 3時 37分 DATE=1 9 9 9年 05月 0 HOST= * .......j ) c o m p a t i b l e ;MS 剖I E 4 . ふ 5 伝 ;M ac̲PowerPC) AGENT=Mozilla/4.0( . . @ . . ・ name=0口 xx email= 年齢 =30~39 . j p 性別=女 居 住 地 =. . . 磯 種 =. .. パソコンの OS=MAC インターネットへの主な接続方法=モデム パ ソ コ ン 使 用 歴 = 1年以内 イ ン タ ー ネ ッ ト 歴 = 1年以内 インターネット上での被害の有無=ある トラブルの種類=アダルトサイトの退会 トラブルの種類=その他 トラブルは解決しましたか=未解決 トラブル発生時は公的機関へ相談しましたか=相談していない ‑344‑

332.

3 .結 果 有効回答 2 761名中、"トラフルの経験あり"が 1173人( 4 2 . 2 8 % )、"トラブルの経験なし"が 1588 人( 5 7 . 5 2 % )であった。年齢、性別とトラブルの有無による χ2乗検定を行ったが、有意差はみられな かった。しかし、インターネット歴とトラフルの有無では危険率 0.1% で有意差があり、インターネ ットを始めて一年以内の者にトラフルを経験した者が多かった。 トラブルの種類は有料サイトからの退会、カードの不正使用、スパムメール、コンビュータウイ ルスでトラブル全体の 92.85%を占めていた。そこで、これら 4種類に限定して解析を行った。そ の結果、解析対象者は 897人となった。 トラブルの内容と性別の関係を見ると、男性では有料サイトからの退会が多くあり、女性では有 料サイトからの退会が少ないためスパムメールの占める割り合いが高くなった(図 3)。年齢別にト ラブルの種類を見たが、 トラブルの内容の特別な偏りはみられなかった(図 4)。 インターネット歴と 4種類のトラブルの関係を見ると、インターネットを経験してすぐの時に、 有料サイトからの退会に関するトラブルが多く存在した(図 5)。また、インターネット歴が一年以 なのに、 4年以上の経験では 44%にもなった。一方、インターネット歴 内だとスパムメールは 19% に関係なく、ウイルスの被害は 10‑15% 、カードの不正使用は 17‑24% 存在した。 図 3 性別とトラブルの種類 図 4 年齢とトラブルの種類 「泊二二: 1 スパムメ』ル SEX 図 5 インターネットの経験とトラブルの種類 B 0‑1年 1‑2年 2 ‑ : ‑ ‑ 3年 4年以よ 別E T ‑345 一つ一一一一一一....".一一一一 一一一一一一一

333.

4 .考 察 4 . 1 回答者の属性について 今回の解析対象者、つまり W EBll0を閲覧するものは、検索エンジンで、カード詐欺、ネットス トーカー調査、アダルトサイト解約などのキーワードを検索した者が多い。また、解析期間中に、百f のネットワーク詐欺の特別番組で本組織が紹介されたため、その日のアクセスは極端に培加した。 従って、今回、解析対象とした母集団はネットワークトラフルに対して、関心が高い集団と考えら れる。 しかし、アンケート解析の結果では、 トラブルの経験者と未経験者がほぼ同数存在し、年齢、性 別に特別な片よりが見られなかった。またインターネットの経験が短いものに、 トラブルが多く見 られた。これらは、ネットワークトラブルへの関心に依存せず、性別、年齢に関係なくインターネ ットを使い始めた初期に、ネットワークトラフルの被害に遭い易いと解釈できる。 4 . 2 有料サイトからの脱会 有料サイト(アダルトサイト)からの退会ができないトラブルは多く存在した。これは、好奇心 によりカード決済で入会をしたはいいが、英語の記載が不得意で退会方法がわからない、どこのホ ームページで申し込んだか忘れてしまった、などで退会ができなくなり延々と利用代金が決済され る場合である。この種のトラブルは、本人が納得して利用する限りではトラブルといえない。従っ て、利用するからにはそのサイトの利用条件を十分考慮した上で利用し、自分の責任で退会するな どの自己管理が必要である。しかし英語が不得意で、有料サイトの退会を自分で行うのが不可能な EBll0で行っているような解約代行サービスを利用するのも一つの方策と言えよう。 場合は、 W 4 . 3 スパムメール スパムメールの被害経験がインターネット歴の当初は 1 9%だったのが、 4年後では 44%と増加す るのは自分のアドレス番号を公表する機会が増えるため当然と言える。従って、スパムメールの対 策を根本的に行うには、自分のアドレスを非公開にすることくらいしか考えられない。しかし、ア ンケートの中の「対処法J の部分を詳細に読むと、安易な懸賞ホームページへの応募、実名での掲 示板への書きこみ、などの記述が見られた。自分のアドレスがどこに流れ、どのように利用される か判らない現状を考えると、アドレスの自己管理は厳重に行うべきであると言えよう。 4 . 4 コンビュータウイルス ウイルスの被害は常に 1 0 ‑ 1 5 %存在した。インターネット歴が長くなれば、それだけウイルスの被 害を受ける割合が高くなるとも考えられるが、ウイルス被害はインターネット歴の長短に関係なく 存在した。この理由は定かではないがウイルス対抗ソフトを保有していても、新種のウイルスに対 してその定義ファイルの更新を怠れば被害にあうとも解釈できる。いずれにしろ、ウイルスは注意 深い対応で防御できるものであるから、パソコンを使い始めた段階で、正しい防御方法を設定して おくべきである。 ‑346一

334.

4 . 5 カードの不正使用 カードの不正使用は常に 17‑25% 存在した。従来のカードの不正使用は、インターネットでカー ドにより代金決済を行うときに、そのカード番号がもれたなどの理由が多かった。しかし、現在は N ‑ B i l l事件などのように、インターネットを使ったことがない者も詐欺の被害者となりうる。従っ て、電子メールでカード番号を送らないなどの対応はもちろんであるが、常に不審なカード請求に 注意するなどの対応が必要である。 4 . 6ネットワークトラブルからの防衛 今回の解析により、有料サイトの退会に関するトラブルが、インターネットを始めた初期に顕著 に生じる傾向が明らかになった。この手のサイトは、 3d aysf r e eなどとうたう場合が多いが、自分 で退会しなければ自動的に継続して課金されてしまうのである。従って、英語に弱ければ安易に英 語の有料サイトに加入しない、などの配慮が必要である。 インターネットの経験が長くなるとスパムメールの被害が多くなる傾向も明らかになった。今後、 高校や大学の教育課程、あるいは企業や家庭においてインターネットを利用する機会はますます増 加する。しかし、インターネットは誰でも情報を発信できるが、いつ発信した情報を悪用されるか 分からない。従って、大学の情報教育の一環、あるいは個人の自己表現の一手段としてのホームペ ージを作成では、個人を特定できるような情報(住所、本名)は掲示しない、安易にメールアドレ スを公開しない、ホームページでアドレスを安易に入力しない、などの教育が必要である。 上記の事項を考慮すると、高校や大学等への入学時、会社への入社時、プロパイダーへの入会時、 の 3N (入会)の各時点で、ネットワークトラブル防止に関する教育あるいは啓蒙活動を行うのが効 果的と考えられる。そうすれば、自己責任で安全にネットワークを楽しむ機会も増えると言えよう。 5 .まとめ インターネットのトラフルに関する 2 761名分の電子メールのアンケー卜結果、を WindowsSAS System6 . 1 2と JMP4.0を用いて解析を行った。 その結果、インターネットの経験が短い時に、有料サイトからの退会ができないトラブルが多く、 経験が長くなるとスパムメールが多くなる傾向が明らかになった。 そこで、 3N (入学、入社、入会)の各時点でインターネットトラフルに関する啓蒙活動を行 うべきであることを提案した。 e t a 4は製品版でないため、画面表示等が製品版と異なる可能性 補足:本論文中で使用した JMP4.0b があります。 ‑347

335.

日本 S A Sユーザー会 (SUG I‑J) マルチレベル分析による生活満足度の分析‑ S A SP R O CM I X E Dを用いて‑ 中田知生 北星学園大学社会福祉学部 AnA n a l y s i so fL i f eS a t i s f a c t i o nt h r o u g hM u l t i l e v e lA n a l y s i su s i n gSASPROCMIXED TomooNakata F a c u l t yo fS o c i a lWelfare,HokuseiGakuenU n i v e r s i t y tnakata@hokusei.ac.j 要旨 マルチレベル分析は混合線形モデルを応用した階層構造データを分析するための解析方法で ある。本論では、共分散分析や回帰分析との差異を明らかにしながら、 SAS PROC MIXED を用い たマルチレベル分析の例を示す。 キーワード: SAS PROC MIXED、マルチレベル分析、ランダム係数モデル、生活満足度 1 . はじめに 近年、新しい線形モデルとして混合線形モデルが注目されている。混合線形モデルとは、固 定効果とランダム効果を同時に持ち合わせ、それらの効果を同時に推定するモデルを総称して . ,1 9 9 6 ; 岸本, 1 9 9 6 )。 そのように呼ぶ (Littell et a1 マルチレベル分析は、社会調査デー夕、またはより一般的な社会科学におけるデータに特有 な階層構造データを分析するための多変量解析手法である。この分析は、前述の混合線形モデ ルを応用したものである。欧米においては、このマルチレベル分析をもっぱら扱うアプリケー ションソフトもいくつか開発されているが、 SASにおける混合線形モデルを扱うプロシジャであ る PROCMIXEDにおいても簡単に分析することができる。 本論においては、 1995 年に実施された SSM(現代日本の社会階層に関する全国調査研究)デー タを用い、各都道府県における個人の生活満足度がどのような要因で決定するかというデータ を分析しながら、マルチレベル分析とその SASPROC MIXEDによるフログラミングを解説する。 ‑ 3 4 9

336.

2 . 階層構造データとその分析方法 社会科学のデータにおける多くは、階層構造の形式を有している。 本論における従属変数である個人の生活満足度に影響を与える収入は個人のレベルに関わる 要因である。しかし、個人の生活満足度を説明するのはその個人レベルの変数だけであるとは 限らない。個人はさまざまな集団に属している。その個人が帰属する集団についての変数もま た個人の生活満足度を説明し得る変数である。たとえば、ある個人の居住地域の環境とか、所 属する会社の業績などがその例である。そのような個人が属する集団はよりマクロなレベルの 集合的要因である C c o n t e x tC 背景)的要因とも呼ばれる)。このようにデータには、さまざまな レベルが存在する。 このようなデータにおけるレベルの存在を前提とした分析を行う際に、どのような分析方法 が考えられるであろうか。たとえば、回帰分析モデルにおいては、従属変数である個人の特性 に対して、さまざまなレベルの独立変数がどのくらい影響を及ぼすかというモデルを構築し、 検証されてきた。そのなかで、異なるレベルの変数も同等に扱われて、それらの各独立変数は 無相関であるという仮定がおかれている。そのため、独立変数における上位レベルの変数と下 位レベルの変数との関連がどのようになっているかはわからない。 しかし、個人の生活満足度は、居住地域のような集合的要因とは独立ではないと仮定するこ ともできる。また、他の独立変数も集合的要因と独立ではないという仮定ももちろん可能であ る。すわなち、居住地域にもばらつきが存在し、個人の生活満足度を規定する独立変数や、そ の従属変数にも影響を及ぼすということである。たとえば、個人の特性のうち、出身地によっ て説明される部分を「県民性」などというものがしばしば挙げられる。また、各都道府県の生 活環境や収入の差異などがその都道府県民の考え方を規定しているということもあり得る。こ のような上位の集団に下位の各個人が入れ子状となったデータの構造は「階層構造」とか、 I n e s t e d構造」などと呼ばれる。 また一方、実験計画法的な分析、すなわち分散分析や共分散分析においては、各集合的要因 の従属変数への効果はわかるが、個人レベルの要因が従属変数とどのように関連しているかは わからない。 このような回帰分析も共分散分析によっても分析することができない、集合的レベルの要因 の効果も、また、個人レベルの要因も両方検証することができる分析がマルチレベル分析であ る 。 現在、欧米においては、マルチレベル分析は、教育社会学の領域において多く用いられる。 そのテキストにおいて、良く用いられる例は、学校やクラスにおける個人の数学の成績や麻薬 防止キャンペーンの効果への効果である。特に、前者は良い例として頻出されている。従属変 数としての個人の数学の得点は、個人レベルの変数である社会経済的地位、家庭における勉強 時間、集団レベル変数である学校の種類(公立高校か、私立高校か)、人種、対学生比で見た教 員数などが、どのような効果をもたらすかという分析が盛んに行われている。また、個人のデ ‑ 3 5 0一

337.

ータの反復された測定値 ( r e p e a t e dm e a s u r e m e n t ) も、階層構造のデータである。反復測定デ ータにおいては、ある個人というマクロなレベルにおいて、複数の時点のミクロなレベルの測 定値が存在する。 マルチレベル分析においては、各集団レベルに「入れ子」になった状態で、各要因の強さや モデルのフィットを検証する。このようなより複雑、かつ現実に近いモテ守ルを検証するために、 マルチレベル分析は非常に有用であることは明らかである。 3 . マルチレベル分析の概要 3 .1マルチレベル分析の定義 マルチレベル分析とは、単一の分析手法を指す言葉ではなく、 さまざまな定義が存在する。 広義には、 このような階層構造データを分析するため、既存のさまざまな分析手法を応用した ものや、 より単純なランダム効果モデル(または、 ランタ寺ム効果を伴った一元配置の共分散分 析)をも指す場合がある。前者の例、たとえば、非線形回帰、クロス集計表の独立性の検定、 イベントヒストリー分析、 因 子 分 析 、 構 造 方 程 式 モ デ ル な ど へ の 応 用 に つ い て は 、 G o l d s t e i n ( 1 9 9 5 )を参照できる。一方、狭義には「ランダム係数モデル ( r a n d o mc o e f f i c i e n tm o d e l ; R Cモデルと略される場合もある)J分析を指す。 本論においては、 もっぱら、 ランダム係数モデルを扱うこととする。 3 .2ランダム係数モデルの考え方 A 図 1は 、 マルチレベル分析の例と A して頻出する図である。 A と B とい A 生活満 A , A A A ムイ都蹄鼎 L / ,戸~ , A う 2つの都道府県における世帯収入 A と個人の生活満足度を表している。 度 図中の 2本の直線は、 それぞれの都 己 道府県における、個人の世帯収入の ‑LJ‑4 斗ヤ面 生活満足度に対する回帰直線をイメ ージさせたものである。 i 世帯収入 通常の、 いわゆる通常の回帰分析 図 1 マルチレベル分析のイメージ であれば、都道府県という要因は考 えない。図中に都道府県という集団 レベルの要因を考えずに、図中の Aや Bで示した都道府県の区別を付けずに、それらをまとめ て 1本の直線を推定するだけである。しかし、 この図の例は、明らかに、 ふつうの回帰分析で は分析できず、集団の要因を考慮する必要があることを示している。マルチレベル分析は、 〒 」 ー のように各集団のレベルのデータからそれぞれ回帰方程式を推定し、それらの回帰方程式を l 本にまとめた回帰直線を引く、 というイメージで捉えることができる。 Fhu 1i qu

338.

それらのイメージを実現させるもっとも単純な方法では、各集団ごとの回帰方程式を推定し、 その後にそれぞれのパラメータと切片をふたたび回帰分析によりそれぞれの推定値を算出し、 1本の回帰方程式にまとめることである。すなわち、本論の例に沿って述べると、各都道府県 ごとの世帯収入の生活満足度への回帰分析を行い、そのパラメータによって、総合的な回帰直 線を求める考え方である。このような 2段階の回帰分析により階層構造データをまとめる考え r e f ta n dd eL e e u w ( 1 9 9 8 )は、変動係数モデルと呼ぶ。 方を保有するモデルを K ランダム係数モデルは、変動係数モデルでは 2段階の推定を行うのに対して、各文脈ごとの パラメータを個別に計算することは行わない。したがって、変動係数モデルの「洗練された」 モデルということができる。 ランダム係数モデルは、以下の式(1)によって表すことができる。 ︑.︐ r l 〆︐ ︑︑ ~ij 包j + / z ̲jxij +ε l j ここで、 jは各集団を表し、 iは個人である。 y は集団 jの中の個人 iの反応変数の値であ る 。 xは個人レベルの説明変数である。 aはランダムな切片。 bはランダムな傾きである。こ のような表記法はマルチレベル分析でも一部で用いられるのものであるが、ランダムな係数を、 下線を引いて表す。なお、この表記法は、Kra f ta n dd eL e e u w ( 1 9 9 8 )に依拠している。他の基 本的なテキスト、たとえば B r y ka n dR a u d e n b u s h ( 1 9 9 2 )などでは、この表記法は用いられていな い 。 εは撹乱項であり、平均は Oであり、分散は σ2の正規分布に従う。 ランダム係数モデルの特徴は、係数(すなわち、線形モデルにおける傾きと切片の両方)が、 主効果(固定された部分)とその周りに存在する分散(ランタムな部分)として推定されるこ 2 a )、 ( 2 b )として表すことができる。 とである。これは、 ( γ ' : : ! . i ‑'00' ' : : ! . O J +u ( 2 α ) / z ̲j =Y I O十笠 lj ( 2 b ) ここで、 γはそれぞれ係数と切片の主効果である。これらの式におけるランダムな部分、すな わち uで表される部分は、それぞれ正規分布し、その期待値はゼロであると仮定される。 そして、それらのランダムな部分は、これらの分散と共分散を τを用いると、その分散=共分 3 )のように表記することができる。この分散が有意にゼロでないということは、それ 散行列は ( らの切片と係数に対応した相対的にマクロの集団レベルのばらつきは存在しないと解釈するこ とできる。 ‑ 3 5 2

339.

¥161111ノ UDI d ︒ ︒ u‑77 川 (DI JFJ M‑77 ︐ nuτt /21111¥ u 一 U一 一 一 T ( 3 ) また、本論における例ではデータの構造が 2段階(学校という集団レベルと、個人レベル) であるが、論理的にはそれ以上の階層のモデル化も可能である。他のソフトウェアでは、この A Sでは 2段階 階層構造データの階層を 5段階まで設定することができるものもある。しかし、 S までの設定しか不可能であると思われる。 4. 分析 4 .1データの構成と使用する変数 本論においては、 S A Sによるマルチレベル分析の例を、 S S M (社会階層と社会移動に関する全国 調査)データにおける都道府県別に見た生活満足度の差異がどのようになっているかを検証しな がら説明する。 まず、集団レベルのデータは、各都道府県ごとに構成させるべきところであるが、都道府県 によってはオブザベーション数が少ないところが存在する。この集団の数と各集団内のオブザ ベーションの数は、マルチレベル分析における検出力の問題としてしばしば議論される(たと えば、 K r a f ta n dd eL e e u w ( 1 9 9 8 ), 5.4節などを参照のこと)。あまり明確な基準は存在しない が、本論では、各都道府県の最低のオブザベーション数として 17を目安にした。したがって、た とえば、サンプル数が少ない石川県と福井県、奈良県と和歌山県、鳥取県と島根県、佐賀県と 長崎県のデータをひとつの地区としてあわせた。したがって、都道府県レベルの集団はりであ る 。 使用する変数は、まず従属変数としての「生活満足度」である。これは、「あなたは生活全般 1.満足している、 2 . について満足していますか、それとも不満ですか.Jという設問に対して、 1 どちらかといえば満足している、 3 .どちらともいえない、 4 .どちらかといえば不満である、 5 . 不満である」という選択肢で答えるものである。独立変数には、自然対数表示の世帯年収、各 都道府県の 1世帯あたり所得を用いる。ただし、これは 1 9 9 3年度のものである。また、前述の ように 2つの県をあわせてひとつの地域と見なした県は、その平均値を取った。 4 .2マルチレベル分析のプログラミング P R O CM I X E D を用いたフログラムミングは、 S i n g e r( 1 9 9 9 )、L it t e l le ta1 .( 1 9 9 6 )、また、岸 本( 1 9 9 6 )などを参照できる。以下は、 4 .3 ①の n u l lモデルのプログラミングである。 この例では、まず、 I T I K U ̲ I D J という変数には、都道府県の通し番号がふられている。これ は上位のレベルの集団を識別するための変数である。また生活満足度は、 I L I F E S A TJという変 phu nd η o 数名をつけた。

340.

①②③④ PROC MIXED COVTEST NOCLPRINT; CLASS TIKU ID; MODEL LIFESAT = / SOLUTION ; RANDOM INT / SUB=TIKU ID ; RUN; ①PROCMIXEDのオプションである I C O V T E S T J は、式 ( 3 )で示した分散=共分散行列の推定値の 検定をさせる。 I N O C L P R I N T Jは 、 C L A S Sステートメントで指定した変数の情報をアウトプットに L A S Sステートメントで指定した変数の数が多ければ、 おいて印刷しないことを命じている。 C v ' ‑ れを指定しないと、すべてのカテコリー名がアウトフットの最初の部分に印刷されてしまう。 ②C L A S Sステートメントにおいて、階層構造データの上位レベルの集団を識別する変数を指定 する。 ここでは、 I T I K U ̲ I D J という変数に、各都道府県の番号をふっている。 ① REML Estimation Iteration History Iteration Eva1uations Object工ve 寸 ム q 4 1ム 寸 ム 寸 ム nU1ム q4qd4a 1723.8918941 1714.1037500 1713.7406474 1713.7211195 1713.7210425 Criterion 0.00037315 0.00002190 0.00000009 0.00000000 Convergence criter工a met. ② Covariance Parameter Estimates (REML) Cov Parm Subject Estimate Std Error INTERCEPT TIKU ID Residua1 0.01538167 0.71467695 0.00773924 0.02034439 Z 1 .99 35.13 Pr > I ZI 0.0469 0.0001 ③ Mode1 Fitt工ng Information for LIFESAT Description Va1ue Observat工ons 2523.000 ‑3174.42 Res Log Like1ihood Akaike's Information Cr工terion ‑3176.42 Schwarz's Bayesian Criterion 3182.26 6348.847 ‑2 Res Log Like1ihood ④ Solution for Fixed Effects Effect INTERCEPT t Pr > I t l Estimate Std Error DF 2.93066113 0.02688677 40 109.00 0.0001 Aq にd qu

341.

③M O D E Lステートメントでは、従属変数と、固定効果変数を指定する。また、オプションの I S O L U T I O N J は、固定効果変数の推定値を印刷させる。 A N D O Mステートメントにおいては、ランダム効果変数を指定する。ランダム係数モデルに ④R おいては、切片はランダムなものとして指定するが、この切片は、 I I N T J、または 1 1N T E R C E P TJ と記述する。他にランダムに指定すべき変数があれば、ここに並べるて記述する。 S U B =では、 上位レベルの変数を指定する。 マルチレベル分析のアウトフットにおいては、まず、このモデルのパラメータを推定するた めのイタレーションの回数とそれぞれにおける基準値が記載される(①)。 ②は共分散の推定値である。この部分は、後述するように、上記の式 ( 3 )に対応する部分であり、 マルチレベル分析においては、ひとつの核となる部分である。ここでは、都道府県平均値聞の . 0 1 5、都道府県の内での個人生活満足度の分散が O .7 1 5であることが示され 生活満足度分散が 0 ている。前者は、都道府県において平均生活満足度が異なっているかどうか、後者は都道府県 の中で個人の生活満足度にばらつきがあるかどうかを検定するための数値である。他の同様の 指標として、階級内分散 (intra‑class correlation)というものがあるが、これについては、後 述する。 ③の部分は、モデルの当てはめの良さを比較するための情報である。そのための統計量とし I Cなどがあるが、本論では、 てA 2倍された対数尤度を用いる。 ④は、固定効果の推定されたパラメータとその検定である。ここでの 2.93 は、都道府県にお ける平均生活満足度の推定値である。 また、 M O D E Lステートメントにおける従属変数や、また個人レベルの従属変数をランダム化 することとにより、プログラムにおけるオプションが必要となる。たとえば、以下はモデル 2 のプログラムである。 M O D E Lステートメント(③)の I = J の右側に独立変数として、世帯収入 が加えられている。また、そのステートメントのオフションに I D D F M = B W J が加えられているが、 これは、固定効果の検定のための自由度の計算に「級間/級内 (between/within)J 法を用いらせ るためのものである。 CLASS TIKU ID; MODEL LIFESAT = INCOME / SOLUTION DDFM=BW; ①②③④ PROC MIXED COVTEST NOCLPRINT; RANDOM INTERCEPT / SUB=TIKU ID ; RUN; また、以下は、モデル 3のプログラムである。ここでは、世帯収入をランダム変数として指 定するために、 R A N D O Mステートメント(④)に収入の変数(ここでは I I N C O M E J ) が加えられて いる。また、加えられたオフションである I T Y P E = 四 ;Jは、傾き、および切片の分散と傾きと 切片の共分散の推定値を算出させるオプションである。 phu phu qu

342.

① ② ③ ④ PROC MIXED COVTEST NOCLPRINT; CLASS TIKU ID; MODEL LIFESAT = INCOME / SOLUTION DDFM=BW; 阻 NDOM INTERCEPT INCOME/ SUB=TIKU ID TYPE=UN; RUN; また、上記のモデル 3のプログラムによるアウトプットの共分散の推定とその検定の部分は 以下のとおりである。 Covariance Parameter Estimates (REML) Cov Parm Subject Estimate Std Error Z [ Z Pr > [ UN( 1, 1) TIKU ID 1.74349620 2.57628978 0.68 0.4986 ① UN(2, l ) TIKU ID 0.10182350 0.16195381 UN(2, 2) Res工dual TIKU ID 0.00592604 0.62428547 0.01018686 0.01989965 一0.63 0.58 .37 31 0.5607 ③ 0.0001 0.5295 ② この結果は、本論の 3.2 節で示した式 (3)に対応したそれぞれの推定値である。すなわち、 i (j j = ( 1 7 4 : I D これらは分散=共分散行列において、以下のように配置される。 また、すべての分散、または共分散の値は帰無仮説を棄却していないが、アウトプットの結 果を解釈すると、まず、①の部分からは、各都道府県において平均生活満足度に差異はない、 ②からは都道府県の持つ生活満足度の効果は、都道府県の平均生活満足度によって異ならない、 最後に③からは、都道府県の持つ生活満足度への効果のばらつきは存在しない、というように解釈 することができるでだろう。 4 .3分析の実際 前節において、アウトフットの解釈についても触れてしまったので、本節においては、モデ ルの選択に焦点を当てて述べることとする。 ① nullモデル まず、マルチレベル分析を行う際には、 null モデルから分析を行う。 null モデルとは、上記 のプログラムのうち、固定効果変数がなく、かつランダム効果変数が切片のみのものである。 なぜこのような分析から始めるかを説明すると、マルチレベル分析では、モデル全体のフィッ トも統計量から明らかになる。したがって、基準となるモデルとして null モデルの統計量を算 出し、そこからどのくらいモデルのフィットが向上したかで、最終的なモデルの選択を行うか 356

343.

表1 表 2 モデル 2 川 1 1 モデル パラメータ レベル 2分散 レベル 1分散 階級内相関 対数尤度 推定値 O .0 1 5 O .7 1 5 O .0 2 1 6 3 4 8 . 8 4 7 標準誤差 O .0 0 8 O .0 2 0 パラメタ レベル 2分散 レベル 1分散 階級内相関 対数尤度 推定値 O .0 0 7 O .6 2 7 O .0 1 1 4 8 8 6 . 7 6 8 標準誤差 O .0 0 5 O .0 2 0 らである。 n u l l モデルにおけるパラメータの推定は、以下のとおりである。なお、各パラメータの後ろ にある括弧内の数値は標準誤差である。 生活満足度 = 2 .9 3( 0 .0 3 ) また、分析結果は、 K r a f ta n dd eL e e u w ( 1 9 9 8 )の記述に依拠すれば、表 1のとおりとなる。 . 9 3であり、標準誤差は . o03である。表における階級内分散は、上位 このモデルの切片は 2 レベルの集団にいる個人がどれだけ「似ているか」を示す指標である。この階級内分散は、 SAS によって算出されるものではないが、上位レベルの分散/(上位レベルの分散+下位レベルの分 散)によって算出することができる。 一方、上位レベルの分散も有意水準 O .0 5で有意となっている(パラメータ推定値が 0 . 0 1 5、 .0 0 3 )。すなわち、 n u l lモデルを見る限り、各都道府県聞の生活満足度に差異がある 標準偏差 O といえるということである。 ②モデル 2 世帯収入 続いて、上記の n u l lモデルへ独立変数として、世帯収入を投入する。パラメータは以下のよ うに推定される。 .9 3( 0 .4 4 )‑ 0 .4 5X世帯収入 ( 0 .0 3 ) 生活満足度= 9 モデルのフィットは、表 1と表 2における ‑2倍された対数尤度の値の差異を見る。 n u l l モデ ルと比較すると、 1 4 6 2 . 0 7 9 の ‑ 2倍された対数尤度の減少が見られる ( 6 3 4 8 . 8 4 7 ‑ 4 8 8 6 . 7 6 8 )。 独立変数がひとつ投入されたので、モデルの自由度は 1だけ減少したことになっている。この 場合、自由度 1に対する ‑ 2倍された対数尤度の差異が 1 4 6 2 .0 7 9 というのは有意なモデルの改 善であるといえる。 ただし、一方で、モデルが改善した場合の説明されない分散が減少するはずなので、 n u l lモ デルと比較した際の切片の値も減少するはずであるが、ここでは減少していない ( n u l l モデル の2 . 9 3に比して 9 . 9 3 と増加している)。表 2を見ると、レベル 2における分散が n u l lモデル においては有意であったのに、新しい独立変数を投入したことにより、有意ではなくなってい る 。 FHU ワt nd

344.

③モデル 3 世帯収入(世帯収入ランダム) 次に、この世帯収入という変数をランダム化してみる。このような独立変数をランダムにし てモデルのフッティングを見る理由は、「世帯収入の効果が各都道府県において異なる」という 仮説を検証するためである。もしかすると、本論における例としては考えにくいものかもしれ ないが、たとえば、集団内における収入の差異が小さい集団と大きな集団ではそのような仮説 も成立し得るかもしれない。このモデルの推定されたパラメータの値は以下のとおりである。 .8 7( 0 .4 8 )‑ 0 .4 4X世帯収入 ( 0 .0 3 ) 生活満足度二 9 表 3では、新しいパラメータが推定されている。傾きの分散と傾きと切片の共分散である。 これは世帯収入と生活満足度の関係において都道府県聞に差があるかどうかを判定するもので ある。しかし、ここでは、傾きの分散が有意ではないために、この仮説は採択されない。また、 ‑2倍された対数尤度を見たときのモデルの改善も、 4886.768‑4880.903=5.865で、前述したよ うに 2つのパラメータが新しく推定されているため自由度は 2だけ減少しているので、有意に 改善されているということはできない。 ここでは、例として個人レベルの変数をランダム変数化した。このようにランダム効果と固 1 9 9 6 ) 定効果に分けることが、混合線形モデルの特徴である。これらの効果の定義において、岸本 ( も述べているように、これらは「厳密に区別できるものではなく、解析者が推論するときの関 p . 1 7 9 ) J ものである。特に、さまざまなランダム係数モデルを検証して 心によって仮定される ( r a f t いる際、その変数をランダム化すべきかどうかという問題が常に生じる。これらについて、 K a n dd eL e e u w ( 1 9 9 8 )は、これらのランダム変数にするべきか否かは、その検証すべき仮説に依 存する問題であると、繰り返し述べている。 ④モデル 4 世帯収入+県平均収入(世帯収入ランダム) 最後に、上位レベルの変数であるが、各都道府県の世帯平均収入という変数をモデルに投入 する。マルチレベル分析においては、このように個人レベルの変数だけではなく、集団レベル の変数も独立変数として投入することができる。もちろん、集団レベルの変数は、ランダム変 表 3 モデル 3 レベル 2 推定値 パラメータ 1 .7 4 3 切片分散 O .0 0 6 傾き分散 ‑ 0 .1 0 2 傾きと切片共分散 レベ jレ1 推定値 パラメータ O .6 2 4 分散 対数尤度 4 8 8 0 . 9 0 3 標準誤差 2 .5 7 6 O .0 1 0 O .1 6 2 標準誤差 O .0 2 0 表 4 モデル 4 レベル 2 パラメータ 推定値 切片分散 2 .0 1 5 1 7 .7 2 6 傾き分散 ‑ 2 7 .5 9 3 傾きと切片共分散 レベル 1 推定値 パラメータ 5 3 .2 9 5 分散 対数尤度 3 5 8一 3 6 3 5 .5 6 2 標準誤差 2 .5 8 6 6 .2 6 0 1 0 .5 6 6 標準誤差 3 .4 6 6

345.

数として指定することはできない。 この都道府県の世帯平均収入の回りに、個人という下位レベルのデータが分布しているので、 少々おかしいかもしれないが、前述したような都道府県内における収入のばらつきのような指 標がなかったので、これで代用することにする。論理的には、都道府県における世帯平均収入 が高いところでは、その分散は大きくなるはずである。推定されたパラメータは以下のとおり で、他の結果は表 4に示した。 生活満足度二 9 .4 4( 0 .8 7 )‑ 0 .4 5x世帯収入 ( 0 .0 3 )+ 0 .0 6x県平均収入 ( 0 .1 0 ) モデルのフィットは、モデル 3との差異が 1 2 4 5 . 3 4 1( 4 8 8 0 .9 0 3 ‑ 3 6 3 5 .5 6 2 )と大きく改善してい る。もっとも適切なモデルをこれまでの中から選択するとすると、このモデルになるであろう。 5 . 結語 本論においては、都道府県を集団レベルと見なした際の個人の生活満足度の分析を行った。 結果としては、それほど特筆にあたるものとは思えないが、他の分析手法では解明することの できないデータの構造を把握することはできた。 筆者が P R O CM I X E Dによってマルチレベル分析を行って、問題があると思われる点について最 後に触れたい。第 1は、マルチレベル分析に適したデータというものがあるかもしれないとい うことである。たとえば、今回の都道府県ごとの生活満足度の分析における帰結は、社会学的 な分析としては取るに足りないものであった。では、どのようなデータがこの分析に適してい るのであろうか。前述したように、マルチレベル分析の例として頻出するのは、学校ごとの数 学得点のばらつきの例である。この例と、本論における例の差異は、集団がはっきりと分かれ ていて、その特徴もはっきりしている(たとえば、学校の例では、学校の特徴として、公立学 校か否か、カトリック系学校か否か、学校の学生/教員比などが用いられている)。このように、 より興味深い結果を出そうとするのであれば、データも分析に適しているかどうかを考えるべ きであるかもしれない。 第 2に、マルチレベル分析は、ハードウェアへの負荷が非常に高い(ょうである)。特に、ラ ンダム変数の数を増やした場合、パラメータ推定のための計算時聞が長くなり、パソコンのメ モリー量が足りなければ、途中で計算が止まるようなことも筆者は経験した。 このような困難や、また、ランダム効果と固定効果などのモデルの複雑さとあいまってマル チレベル分析は初心者にとっては、少々とっつきにくい分析方法であるかもしれない。 しかし、本論においては、マルチレベル分析により、探索的に、これまで共分散分析や回帰 分析によって分析されてきたデータの構造を明らかにして、その分析結果の原因を明らかにし てきた。また、分析前における適切な仮説の構築と、より分析に適したデータを見つけだすこ とによりこの分析手法は一層、威力を発揮するのではないかと考える。 ‑ 3 5 9

346.

【参考文献】 以下の文献リストには、本論において引用したものと、一般的なマルチレベル分析のための文献、ネッ ト上のリソースなどを掲載した。なお、特に、 K r a f ta n dd eL e e u w ( 1 9 9 8 )は、基本的なこの手法の考え方 や、この分析手法の他のソフトウェアなどの情報が記載されてあり一読をお勧めする。 ∞ Bryk, A . S .andS.WRaudenbush, 1992, 昂古 ' e 町 e ̲ ' r a r c h i 回 c 7 沼 ' a a 1 ι Li 冶 n 加 1 e a υ r ‑ ゾ 1 λ w M ゐ o出 d ' , e ι l ' s :A p p 1 i c 凶 at 白 1 仰 0 O L ' n s 却 a ndDat ω aAn 羽a ̲ か J v 山 s . ♂ 1 F ' s Methods ,NewburyPark ,CA:S a g e . H., 1987, M u 1 t i 1 e v e 1Mode1si nE d u c a t i o n a 1andS o c i a 1Research,1ρndon:G r i f f i n . G o l d s t e i n, H., 1995, M u 1 t i 1 e v e 1S t a t i s t i c a 1Mode1s ,2ndE d i t i o n,1ρndon:EdwardAr n o r d . G o l d s t e i n, 岸本淳司、 1 9 9 6、r P R O CMIXED 入門」、 ~SUGトj' 96/I D SC o n f e r e n c e論文集』、 p . 1 7 9 ‑ 1 97 . Kra f t , L, J . d eLeeuw , andR .vanderLeeden,1994, "Reviewo fF i v eM u l t i l e v e lAn a l y s i sPrograms: BMDP・5V ,GENMOD,HLM,ML3, VARCLヘTheAmericanS t a t i s t i c i a n,VoL48, No, 4 .p . 3 2 4 ‑ 3 3 5 . Kra f t, L, andJ . d eLeeuw ,1998, l n t r o d u c i n gM u 1 t i 1 e v e 1Modeling ,L ondon:S a g e . f t, 1995, " Q u e s t i o n i n gM u l t i l e v e lModels",J ourna1ofE d u c a t i o n a 1andB e h a v i o r a 1 d eLeeuwandLKra , VoL20,No.2,P . 1 7 1 ‑ 1 8 9 . S t a t i s t i c s d eLeeuwandLKra f t , ? , "Softwaref o rM u l t i l e v e l A n a l y s i s ",( h t t p : / / w w w . s t a t . u c l a . e d u / ‑ d e l e e u w / ‑ s o f t w a r e . p d fからダウンロードできる。) L i t t e l l, R .C .,G .A .M i l l i k e n, WWStroup, andR .D.Wolfinger ,1996,SASSystemf o rProcMixed ,Cary , NC:SASI n s t i t u t eI n c . . Longford, N . T ., 1993, RandomC o e f f i c i e n tMode1 ,O x f o r d :OxfordU n i v e r s i t yP r e s s . S i n g e r , J . D ., 1999,"UsingSASPROCMIXEDt of i tM u l t i l e v e lModels, H i e r a r c h i c a lModels, and I n d i v i d u a lGrowthModelsヘ(ht t p : / /hu gse1 . h a r v a r d . e du/‑ f a c u l t y/ s i n g e r /からダウンロードでき る。). Verbeke,G .,andG.Molenberghs(edsふ1 9 9 7,LinearMixedMode1si nP r a c t i c e :ASASO r i e n t e d NewY o r k :S p r i n g e r . Approach, 【その他】 マルチレベル分析に関するメーリングリストが存在する。すべてが S A SP R O CM I X E D によるマルチレベ ル分析の話題であるわけではないし(他のソフトウェアの話題も存在する)、また、さまざまな領域の研 究者がやりとりをしているために、すべてが各研究者の関連領域に関連する話題であるわけではない。し かし、その中で、 S A Sの話題は割合多く、最近では、 P R O CM I X E Dのパグらしきものの話題(アウトプット における共分散の推定値とその検定を出す部分で、その数値が小さくなると、 . rJ と出ることがある。) なども出てきて、興味深い話に触れることができる。 メーリングリストの詳細については、 h t t p : / / w w w . m a i l b a s e . a c . u k / l i s t s / m u l t i l e v e l /を参照のこと。 9 9 5年 S S M研究会よりデータ使用の許可を得た。) (なお、本論を執筆するにあたり、 1 ‑360‑

347.

日本 S A Sユーザー会 (SUG I‑J) データマイニングとサンプルの実例 鈴木薫(翻訳) 株式会社 SASインスティチュートジャパン マーケティンゲ部 PSMグループ D a t aM i n i n ga n dt e hC a s ef o rS a m p l i n g KaoruSuzuki( t r a n s l a t i o n ) PSMgroupMarketingDepartmen t .SASInstituteJapanL td. , 要旨 本論文では、ビジネスインテリジェンスサイクルの一部としてのデータマイニング、 を検討しながら、サンプリングが大容量データベースの加工をするのに統計学的 に正しい手法であることを議論する。 キーワード:データマイニング、サンプル データマイニングとビジネスインテリジェンスサイクル 1995 年 、 SAS インスティチュー卜は SAS システムに基づ、いた、データマイニングソリューショ ンのリサーチ、展開、テストをはじめた。 1998年に ENTERPRISE MINERソフトウェアのリリー スにつながったその研究は、私たちにとても重要なことを教えてくれた。 1つ目は、データマイ ニングはそれ自体がビジネスインテリジェンスという大規模なプロセスの中に組み込まれてい なければならないプロセスであるということ。図 1はデータマイニンク、、のビジネスインテリジェン スサイクルの中での役割を示している。 データマイニングと企業のデータウェアハウスとピ、ジネスレポーテインク、、システムを結合させる T ことで、下記のような企業のさらに大規模なゴールを支える 1 方で、テクノロジーと既存の I 基盤を適合させることができる。 ‑ : 16 1

348.

一 一 一 一 一 一 一 一 一 一 一 一 一 . I d e n l i 旬 6 齢@ ビジネス上の問題を認識する テ、ータを情報へと変換する 情報を利用する 結果を評価する O a l aI n l o I n l o r m a l i o n 4 態 … 日 r.e m a l i a n 図上データマイニングのプロセスとビジネスインテリジェンスサイクル SEMMAモデル SAS インステイチユートは、データマイニングを大量のデータの中に存在する、価値のある情 報と複雑な関連性を明らかにするプロセスであると定義している。データマイニングは相互作 用のあるプロセスである。つまり 1セットの問題に答えることが、もっと興味深くさらに具体的な 問題につながる。プロセスがワーキングモデルを提供するために、 SAS インスティチユートは さらにデータマイニングを 5 つの段階に分けていて、それはそれぞれの頭文字を取って、 SEMMAという略語で示されている。 ) , Explore 統計学的に表されるデータのサンプルで始まる SEMMAモデルは、 SampleCサンプ jレ (探索), ModifyC加工・変換), ModelCモ テ 、 jレ 化 ) , AccessC評価)を表しているのだが、ビジネスア ナリストにとって、探索的な統計と視覚化のテクニックの適用、最も有意な予測値の選択、変 換、結果を予測し、モテ、ルの正確さを立証するための変数のモデル化が簡単になる。下記が SEMMAモ テ 、 jレのそれぞれのステップの概要である。 1もしくは 2つのデータテーブル 1を作ることによってデータをサンプリングする ・ 理解とアイディアを得るために予測できる関連性、予測できない傾向、異例を検出しな がらデータを探索する。 ・ モデル選出のプロセスに焦点を合わせるために変数を作成、選出、変換しながらデー タを加工する ・ ソフトウェアが、理想的な結果を予測するデータの組み合わせを自動的に検索しなが らデータをモデル化する データマイニングのプロセスからの結果の有効性と信頼性を評価しながらデータを評 価する SEMMA はそれ自体が循環するサイクルである。内部のステップは必要に応じて繰り返し行 われる。図 2 はデータマイニング プロジェクトで、の作業を示し、それらの作業を SEMMAモデ R l データとデータセットは同義語である。 362‑

349.

ルの 5つのステージで表している。 SEMMAモデ jレに続くプロジェクトは、何百万に上るレコー ド2の中で変化し、ビジネスがデータマイニング、における下記の目標を達成することを可能に する。 顧客を同じような購買パターンのグ、ループに正確に分類する 顧客の関係管理の概略を書く ・ダイレクトメール戦略において反応率を劇的に上げる 最も利益性のある顧客とその根底にある理由を識別する • なぜ顧客が競争相手に取られてしまうのか(抵抗力低下、 チヤーン分析)を理解する • Modi句 購買パターン、支払、反応率を影響している要素を明確に する Model 最も売り上げにつながる顧客にマーケテイング活動を行うこ とで利益を上げる ・最も売り上げにつながらない顧客を取り除き、コストを下げ る 要求に応じないパターンを見つける 図 2:SEMMAモデルの段階 「大容量データベース」とは 最も利益につながる顧客をとその利益の根底にある理由を識別するパターンをデータの中か ら見つけ出すソリユーションは、大量のデータを加工できなくてはならない。しかしながら「大 容量」を定義するのはとても難しい。というのは「大容量のデータベース」はそれを可能にして )シャ語で怪物を いるテクノロジーの変化と同じ速さで変化しているからである。たとえば、ギ 1 意味する「テラ」は、 1テラバイトのデータを持つデータベースの識別に通常使われている。多 くの統計学者は 10万レコードあるデータベースを大容量とみなすであろう。しかし、クレジット カードのトランザクションとそれに伴う人口統計データなどの、 1テラバイト以上のデータが詰 め込まれたデータウエアハウスは珍しくない。 1テラバイトあるデータの通常の統計的分析で さえコストと時聞がかかる。おそらく、近い将来ベタバイトといったもっと大きなデータを扱う必 要が出てくるであろう。 では、データがこのように大容量になってしまったらどうすればいいのだろうか。答えは一見 やさしそうに見える ・ データベース全体を加工する そのサンプルだけを加工する レコードとはデータの各行のことをいう。レコードの同義語は、オフ、ザベーション、ケース、イベントを 含む。行とは、データの情造で、データが水平に並べられたものをいう。 2 qd qu ρ o

350.

のどちらかである。 サンプリングの統計学的妥当性 統計学とは応用数学の分科で、研究者が関連性を発見したり、関連性を理解する方法を探 すことを可能にするものである。最近の統計ではサンプリングを頻繁に利用している。分析者 は通常、最初のモデルを試したり、データの探索を行ったり、更なる分析が必要かどうかを決 定するためにサンプリングテクニックを使っている。統計学的なサンプリング法を使ったデータ マイニング技術は、大容量データベースの中から、価値のある情報と複雑な関連性を見出す。 さもなくばその関連性は企業のデータウェアハウスに隠されていたであろう。 サンプルの妥当性を決定づけるサイズと質 テ、ータマイニングで、予測モデルの構築にサンプルデータが使われ、それはその後、データベ ース全体の予測を立てるのに使われる。そのため、サンプルの妥当性、すなわちサンプルが データベース全体を表しているかどうかは非常に重要である。 サンプルがデータベース全体を表しているかどうかは、 2つの特徴によって決定づ けるられる サンプルのサイズと質である。サンプルサイズの重要性は比較的簡単に理解できる。しか しながら、サンプルの質の重要性を理解することは、もう少し複雑である。なぜなら、あるビジ ネス問題にとって良質のサンプルは、別の問題にとっては良質のサンプルで、ないかもしれな いからである。 サンプルサイズはどのように妥当性に作用するのか サンプルサイズが大きくなるにつれて、データベース全体のパターンをより明瞭に反映してい なければいけない。 1 つのデータベースのサンプルを表すグラフを比べてみると、サンプルが どのようにデータベースのパターンやアウトラインを反映しているかどうかがすぐにわかる。 たとえば、図 3は顧客の収入レベルをグラフで表している。グラフ A はデータベース全体を表 していて、ほとんどの顧客が中間レベルに位置していることが分かる。両極端をみると、レコ ード、が減ってし、く。データベースの 30%のサンプルを表すグラフ Bは、閉じ全体のパターンま たは形を表す。統計学者はこのパターンをデータの分布と呼んで、いる。 364‑

351.

Cu呈t o m c r sI wI n c o mじ L c v c l日 s :1 . 0p巴r c e n t O ι ﹂ ・伺H d J h M‑ ‑ 1J ‑ ‑ ‑ I ‑ ‑ ‑ l l i l i ‑ I l EH LI Uh ‑ 川 ‑ ‑ OH一 刷 I ι n ー I l U川 3n i〆 に "・ 図 3 :サンプリングサイズが妥当性をどう影響するか サンプルのサイズを拡大するのであれば、データベースの分布は引き続き受け継がれる。極 端に言えば、データベース全体を読め l ま、最も大きな総合的サンプルが入手できる。つまり、 データベース自体である。当然のことながら、分布は同じで、サンプル上で予測できることは データベース全体 3にとっても真実である。 サンプルの質はどのように妥当性に作用するのか 統計学的サンプリングテクニックの文脈からしづと、質とはビジネスの問題を解決するのに必 要なデータベースの特徴をサンプルがつかんでいるかどうかである。実際にサンプルは十分 にデータを理想的に表しているであろうか?最高品質のサンプルはデータベースの完全なミ ニチュアで、ある。つまり個々の変数の分布と変数聞の関連性を維持している。もう 1 方では、 最低品質のサンプルは代表的ではない、またはある方向に偏っていて使い物にならない。実 際には、少なくともデータベースの象徴となるように偏りのないサンプルでなければならない。 しかし、どのように偏りのないサンプルを形成できるのだろうか?データマイニングプロジェク 卜のような統計分析で使われるサンプルがデータベース全体を象徴していることを確かめら れるのだろうか。答えは、データベースからレコードを選ぶ方法にある。サンプル選択法は与 えられたレコードがサンプルに含まれる確率を決定づ、ける。偏りのないサンプルを形成するに は、立証された量を表すことので、きる選択法(信頼で、きる統計が得られる)に基づ、いた方法で なければならない。単純なサンプリング方法を用いると、個々のレコードが選ばれる確率は同 じになる。 ランダム:良質なサンプルへの鍵 ランダムの概念と、偏りのないサンプルの形成でそれが演じる役 l ま統計分析の基礎で、あるテ 3 サンプルサイズについての詳しい情報は、「データマイニングにおける最も優れた実践としてのサン プリングサンプルサイズの決定」を参照。 ρhu ﹃U RU

352.

クニックに見られる。そのテクニックとは、単純なランダムサンプリングである。ここで言う「単 純」は、もっと単純な形でデータベースから選ばれたレコードを意味する、つまりレコードがサ ンプリング以前に前加工やグループ化がされていない状態である。 ここでいうランダムとはこの文脈では「無計画」や「気まぐれ」を意味するものではない。ランダ ムとは、選択方法に偏りがないことである。データベースの個々のレコード、が、サンプルとして こ選択さ 選ばれる確率は等しい。ランダムサンプリングはデータベースの中の全てのレコードl れる等しいチャンスを与え、その結果十分な量のサンプルはデータベース全体のパターンを 表すことを確実にしている。たとえば、 1万レコードからなる顧客データベースから単純ランダ ムサンプルを生成する場合、 1から 1万レコード、全部に数字を割り当てる選択法を使い、その 選択法によってランダムに数字を選ぶことができる。 ランダムサンプルはデータの分布を表す ランダムにデータベースからレコードを選んで、十分な量のサンプルを得れば、サンプルは全 体としてデータベースの特徴を表す。図 3で見たように、サンプルサイズ、が大きくなるにつれて サンプルの分布はデータベース全体の分布を反映する。図 3では、データは相称的なつり鐘 型の分布をしている。これは一般的で、よく理解されているタイプの形で、正規分布と呼ばれ ている。 全てのデータが正規分布になるとは限らない。データベースがグラフで、表されたものを見ると、 たびたびデータが 1方向に歪んでいるのが分かる。たとえば図 3で、もしほとんどの顧客の収 入レベルが比較的低いとしたら、分布は右に歪むであろう。もしデータがランダムにサンプル されていたら、サンプルサイズが大きくなるにつれてサンプルの分布はデータベース全体の 分布を反映するであろう。 たとえば、全国規模の洋服チェーン庖の、 1万レコード、からなる顧客データベースがあるとす る。そのチェーン庖はチームの口ゴ入りのスポーツウェアーを専門に扱っている。その専門性 のために、レコードの 3分の 2はそういったスタイルが好きな 8歳から 28歳のレコードであ る 。 図 4はデータベースとサンプルの分布を表している。 ‑366‑

353.

、 ぐl o ! h iJ 1 l !S l o r CC u s l υ 1 1 1(;fS lyAgピ(ir o l l p c D l l t i l h a . ' c S m l lJ lI む d t ﹂ ︑ l Lly HA J iHA 14 ‑5 nul 角 i 拘 ︑ ︑ ご ︑ 4 ~,~. .:~、 1. ,"" 1l I L i l t 10 ︑ ﹃LU 山川川川川山山山州︐ H ‑︑唱ゐ i ︑ .= ︑ HA A ︑ ︑ ︑ EL川 川 川 川 川 川 川 川 ︑ ャ .bHn仏 川 川 川 川 川 川 川 ・‑ l 11川川川 1Hl j ‑ 1 14 i 1 : 0 m c │︑ l l│l │ u ,,~心 (;rnup、 図 4・サンプルがデータの分布をどのように明らかにするか 予測できるとおり、データベースからランダムにレコードを選ぶと、 8 歳から 28 歳の顧客のレ コードを得る確率は、ほかのレコードを得る確率より大きい。それは単純に、 8歳から 28歳の 顧客の方が多いからである。おそらく、その年齢層のレコードをはじめの数回は得ないかもし れないが、レコードが選択されていくにしたがって、サンプルの 3分の 2がその年齢層になる であろう 40 ランダムサンプルの裏の理論を、もっと複雑なデータマイニングのシナリオまで 拡彊すれば、 ランダムサンプルは探索、分析、そして SEMMAモデルのほかのステップの基盤になっている ことが分かる。たとえば、 ・8歳から 28歳の顧客のうち、 59%が男性 • 23%が少なくともジャケットとスポーツ関連誌を購入している 現金で買い物をしている とすれば、十分なサイズのサンプルは二れらの傾向を表すと予測できるであろう。 ランダムサンプルはデータのほかの特徴を表す データの分布はサンプルデータによって表される特徴であるだけではない。確率法に基づい た数学的公式をサンプルに適用すれば、平均値、中央値、最瀕値といった要約統計量を求 めることもできる。つけ加えると、信頼レベルに基づいた標準偏差といったデータの広がりや ぱらつきなどの測定値を求めるために、ほかの公式を適用することもできる。 簡単に言うと、標準偏差とは、データの平均値からの平均距離である。信頼レベルとは平均 確率法は、一部無限にランダムサンプリングをおこなうという考え方に基づいている。 Haysは" I nThe 4 LongRun"(1981.p p .22‑25)の節でこの理由をうまく説明している。 ワ t nhu nぺU

354.

値から標準偏差の定められた数の中にあるレコードの割合で、ある。正規分布では、データベ ース中のレコード全部の約 68%が平均値から前後 1標準偏差の範囲に入るであろう。レコー ド全部の約 95%が平均値から前後 2標準偏差の範囲に入るで、あろう (Hays1981,p.209)。 要約すると、データベースがあり、レコードを得るのにランダムサンプリング、を使うと、レコード の選択が増えていくにつれて、ある時点で、サンプルはデータベースそのものの分布を表す であろう。つけ加えると、確率の法則に基づいた数学的公式を適用することによって、データ ベース全体の特徴を決定づけることができる。これらのサンプリング、テクニックとその基礎に なっている原理は、特定の適用に関係なく全ての母集団についても同じである。サイコロを転 がしても、見えないようにして容器から赤か自のおはじきを取り出しても、データマイニングプ ロジェクトで、使うサンプルデータを作成するために 1年分の顧客トランザクションデータからラ ンダムにレコードを選ぶのも同じである50 サンプリングが使われるべきでない場合 サンプリングは調査、ビジネス、社会政策などのあらゆる分野で、役に立っているが、サンプリ ングが使われるべきでない分野がいくつかある。たとえば、下記のような条件のとき、サンプ リングは使われるべきでない。 ・ 正確な金額の明細が求められている場合。たとえば財産/負債保有を追跡するシス テムでは、個々の口座とトランザクションを処理する必要があるで、あろう。 母集団全体が使われなければならない時。たとえば、アメリカの憲法には実際のアメリ 力の人口列挙がなされなければならないとある ( A r t i c l e 1, S e c t i o n 2, Paragraph 3 )。 ・ 継続的な監視が必要な処理。たとえば深刻な病状の患者のため、精密な製造過程、 空港での悪天候。 全てのレコードを吟味しなければならない詞査で。たとえば、例外を発見してその報告 書を発行するという保険の要求のための監視。 サンプリングの神話 サンプリングの科学的な背景があるにもかかわらず、多くの人々はサンプリングの妥当性に いまだに疑問を感じている。サンプリングの信頼性の無さの例として有名なのは、新聞の 1948年の大統領選の結果予測記事で、 Chicago D a i l yT r i b u n e紙が IDeweyは Trumanをや ぷる」とし巧報告をするのに投票者のサンプルを使ったことで、ある。もちろん、 Truman は選挙 5 サンプリングに使用されるテクニックは確率の研究から発展した。確率法はギャンブルの研究から発 展した。特に、サイコロの目が出る確率の観察によって確率の数学を公式化した、 17世紀の数学者、 B l a i s eP a s c a lとP i e r r ed eF e r m a tの研究が主である。 ‑368

355.

で勝ち、「専門家」が間違っていたことを証明した。 Truman が勝手J Iを祝福する席で、 iDewey は Truman をやぷる」というヘッド、ラインを高く掲げながら笑っている写真が何百万人もの人に見 られ、そのイメージはいまだ続いている。しかし、サンプリングの何がいけないのだろうか。 その問題には二つの要素がある。第 1 に 、 1948 年の時点では、選挙でのサンプリング使用 の科学はまだ未発達で、あった。すべての投票者に、世論調査を受ける等しいチャンスを与え ていたであろうランダムサンプリング、をせず に、その当時の世論調査員は、アメリ力の人口統 計の性質だと仮定したものに投票者ををマッチさせようとしたサンプルを生成した。このテクニ ックで、世論調査員はアメリカの人口統計を基調査対象を選び、結果を歪ませた。(Gladstone 1998) サンプルデータの質に影響を与えた 2つ目の過ちはタイミングである。特に、 Dewey/Truman の予測の基になった調査は選挙日の 2週間前まで続いた。 1940年代の政治の変わり易さを 考えると、その 2週間は Deweyから Trumanへの投票者の大々的な変化には十分で、あった (McCullough1992,p . 7 1 4 )。 1948 年の選挙問題が今で、も語られているにもかかわらず、サンプリングの妥当性の神話は 続いている。データマイニングなどのビジネスインテリジェンス技術にサンプルが適用できる かどうかを評価する場合、人々はたびたび下記のような懸念を持つ サンプリングは重要な情報を見逃してしまう ・ サンプリングは難しい まいらない 十分なハードウェア資源があればサンプリング1 神話 1:サンプリングは重要な情報を見逃してしまう サンプリングは重要な情報を見逃してしまうという考えは、データにはたいてい外れ値が含ま れるという事実から来ている。データベースからランダムにサンフルを抽出し、モデルを作成 し、データベースをスコア 6する、といったメールキャンペーンを考えてみよう o もしデータベース が他の誰よりもはるかに多くの額を使う特別な顧客を含むとすれば、サンプルに特別な顧客 を含むかどうかがモテ、ルのスコア能力に影響を与える。 もし特別な顧客のレコ ドが含まれていれば、モデルはメ ルキャンペーンの反応率予測に 6スコアリングはアウトプットを計算するためにモデルを新しいデータに適応するプロセスのことである。 たとえば、カタログメールキャンペーンの結果予測を求めるデータマイニングのプロジェクトで、は、デー タベースのスコアによって、カタログ受取人の誰が、どの商品を、どのくらい購入するかを予測すること ができる。 ‑369

356.

とても楽観的であるに違いない。逆に、そのレコードが含まれていなければモデルはほとんど の顧客についてもっと現実的な予測を生むで、あろうが、特別な顧客のスコアは顧客の真の重 要性を反映していないであろう。 実際に、サンプルを抽出することを除いては、データマイニングで最も興味深い適用分野は 予測モデルを立てることなので、サンプルをしないと重要な情報は見過ごされてしまう。まれ なサンプリングはイベントと非イベント 7を見分けられるモデルを展開するために、質的に向上 されたモデルか、重み付きモデルを必要とする。たとえば、クレジットカードの不正使用の予 測をする際、不正の起こる割合は 2%ほど低いかもしれない。しかしながら、その割合は何百 万ドルもの損害を表すものかもしれない。従って、時間と資源の投資の真の利益は、不正処 理を効果的に特徴づけるる予測モデルを展開し、企業が高額の損失のいくつかを避ける手 助けをすることである。 モデルを構築するにあたり、数多くの複雑なモデル化の方法がある。これらの方法の決定的 な論争点はどのモデルを使うかということである。サンプル?質的に向上されたサンプル?デ ータベース全体?もしデータベースの単純ランダムサンプリングが使われれば、おそらくまれ なイベント(不正トランザクション)の少ししかサンプルに含まれないであろう。モデルの展開に 使われたサンプルに不正トランザクションが含まれていなかったとすれば、結果としてで、きた モデルはどのトランザクションが不正で、どれが違うかを特徴づ、けるる事がで、きない。 8こ使われて、輿昧のあるイベントが極まれであれば、結果 データベース全体がモデルの学習 1 としてで、きたモデルは、どのトランザクションが不正でどれがそうでないかを特徴づけるる事 ができない。モデルは 99.95%のケースを正確に分類するであろうが、 0.05%のまれなケース は不正確に分類される。 また、データベース全体がモデルの学習に使われて、興味のあるイベントがまれでない場合、 適切に処理されているように見えるかもしれない。実際に、オーバーフィッティングかもしれ ない。オーバーフイツテイングされたモデルは、データの基盤をなす傾向にだけ処理されるの ではなく、不運なことに、この特定のデータベースの特定のパターンとして処理される。モデル はこの特定のデータベースを的確に予測するかもしれないが、新しいトランザクション(現在 データベースにないもの)を正確に分類できないかもしれない。モデルの展開にデータベース 生物測定学ではケースコントロールサンプリング、計量経済学ではチョイスーベースサンプリングとし ても知られている。生物測定学と計量経済学においてのサンプリング使用についての詳しい情報は、 ManskiandMcFadden,( 1 9 8 1 ), と BreslowandDay(1980)を参照。 7 8モデルの学習とは、最適なパラメーター値を計算する数学的プロセスのことである。たとえば、直線は スロープパラメーターとインターセプト 1¥ラメーターの 2つによって決定付けられる。線型モデルはこれ らのパラメータ 値が計算されるにつれて学習される。 ワ t ハU qu

357.

全体を使うことの深刻な問題は、モデルの予測能力をテスト、洗練するレコードが残らないこ とである。 対照的に、もし質の良いサンプルがモデルの構築に使われれば、まれな不正処理はさらに大 きな割合でサンプルに含まれ、まれで、ない不正トランザクションはもっと少ない割合で、サンプ ルに含まれる。結果としてできたサンプルは、不正ケースを含む割合がデータベース全体で の割合より大きくなる。結果としてできたモデ、ルは不正ケースにもっと敏感で、あり、従って不正 処理の特徴づけが得意である。さらに、モデルでデータベースの残りのレコードをテスト、洗 練させることができる。モデルが完全に構築されると、新しいトランザクションデータで、テストで、 きる。 サンプリングに対する別の関心は、テクニックが不適当に適用されているのではないかという ことである。問題は、もしテクニックが不適当にデータマイニングプロジェクトに適用されるとビ ジネス問題の解決に必要な重要な情報は見落とされ、その結果サンプルから削られることで ある。全ての関連のある情報が含まれていることを確かにするために、ビジネス分析者は解 決されるべきビジネス問題と同様、データを知らなければならない。説明のためにもう 1度例 のメーリングキャンペーンを考えてみよう。もし単純ランダムサンプルを使うのであれば、地域 といった重要な情報は省かれてしまうかもしれない。カタログをいつ、どこに送付するかのタイ こ防寒グッズ、と冬の衣服を載せる ミンク の聞に強い相互作用がありえる。もしもそのカタログ1 のであれば、全国のデータベースの単純ランダムサンプルはふさわしくない。地域のランダム サンプリングをするか、最南の地域を除いて送付する方が良い結果を生むかもしれない。 神話 2 :サンプリングはむずかしい 大容量データベースのサイズと他の特徴のため、サンプリング、は難しすぎるとたびたび論じら れている。たとえば、どの変数が重要で大容量データに何の相互作用が表われているかを完 全に理解できる者はいないという意見もある。 現代のソフトウェア技術を使わないのであれば、この議論には価値がある。しかしながら近代 の統計学的サンプリングテクニックを可能にするためにデザインされたソフトウェアは、ビジネ ス分析者がデータマイニングの過程でサンプリング、テクニツクを最も効果的に最適な時間で 適用することを可能にしながら大容量データを理解することをサポートすることができる。たと えば、簡単に使えて、パワフルなグラフイカルユーザーインターフェース (GUI)は、データの視 覚化と探索をグ、ラフイカルに行えるようにする。十分に確立された複雑な統計的手)1聞を基に 築かれた GUI は、開業者がサンプリング、と分析テクニックをすばやく適用し、必要に応じて評 価と調整することを可能にする。 '14 ワI ﹃U

358.

神話 3 :十分なハードウェア資源があればサンプリングはいらない も う 1つのサンプリングにおける一般的な誤りは、十分なハード、ウェア資源があればサンプリ ングは要らないということである。この信念は、テクノロジーが近年進歩してきているという事 実に一部は基づいている。特に、ディスクスペースとメモリーは、過去に比べて十分なほど手 に入り易くなった。しかしながら、下記のような技術的制限が残る。 ネットワークの太さ スループット ・ メモリ管理 CPUのロードバランス 必要な資源という点から見ると、データマイニングは競争の利益のための情報を発見するた めのデータの選択、探索、そしてモデル化の過程である。 !¥ードウェア資源に関連したサンプリングの神話は、並列処理はデータマイニングに必要で あるという考えである。実際に、 ζ の神話は、並列処理は大容量データのマイニングする際の 問題の万能薬であると述べている。並列処理がデータ処理のスピードを上げることができると しても、データマイニング、プロジェクトに並列処理を単に適用することは、データマイニングは 全くの技術的難問で、はないという事実を無視することになる。代わりに、ハードウェアと、ノフト ウェアの制限に伴い、「データマイニング」で、知られる大きなデータ処理は、原動力として論理 的なビジネス中心の挑戦である。ビジネスという点から見ると、企業の持つビジネスのゴール をサポートする方法のため、データマイニングは正当な投資である。つまり、状態のいい ROI を提供すると予測されている。 一般的なサンプリングタイプ 一般的にデータマイニングプロジェクトで、使われるサンプリングのタイプは下記を含む。 単純ランダムサンプリング 個々のデータレコード、にサンプルに含まれる等しいチャンスがある。 ん番目レコードサンプリング 1 0 0 個ごとといったように何個ごとかのレコードがサンプルに含まれる。このタイプのサン プリングはシステマティックサンプリングとも呼ばれている。構造化されたデータで は、構 造の 1部だけが取り出されるであろう。 先頭川面サンプリング はじめの N個固までのレコードがサンプルに含まれる。もしデータベースレコード、がランダ ワω ワ1 qu

359.

ムに並んでいたら、このタイプのサンプリングはランダムサンプルを生成する。もしデータ ベースレコードがある 1 ] 目序で、並んで、いれば、構造の 1部だけが取り出されるであろう。 クラスターサンプリング データベースレコードの個々のクラスターがサンプルに含まれる等しいチャンスがある。 個々のクラスターは似ているレコードで形成されている。たとえば、クラスターは同 1顧 客 に関連した全てのレコード、たとえば異なる時間の購入、である可能性がある。 層化サンプリング 個々の層の中で、全てのレコードはサンプルに含まれる等しいチャンスがある。層を通し て、レコード、が一般的にサンプルに含まれる確率は等しくない。 層化サンプリングは、サンプルの中の母集団の層の割合を保つために行われる。一般 的に、カテゴリカル変数は層を定義するために使われる。たとえば、性別や既婚/未婚は 層を定義するために使われるカテゴリカル変数である。しかしながら、郵便番号のように レベルの多すぎる変数を層化するのは何千というレベルになるため、避けるべきである。 サンプルサイズの決定 あるテ ータのサンプルに適したサイズを決定するために、統計学者は数学的公式 9を進化さ せてきた。公式は下記のような問題を投げかけることによって、研究者が最適なサンプルサ イズを選ぶのを助けるためにテ、ザインされた。 ターゲットとなる変数は何か ・どの変数がモデルにあるべきか ・モデルの機能上の形式は何か(線型、関連する条件のある線型、非線型、など) 結果の認められる正確さのレベルは何か もしこれらの質問に対する答えが分かっていれば、サンプリング理論は求められるサンプル サイズへの比較的優れた答えを出せるで、あろう。三れらの質問への回答に対する自信が低 いほど、さらに SEMMAモデルを通してのデータ探索と相 E作用に集中するであろう。 最適なサンプルサイズを決定するために使われる統計的公式の詳細は、複雑であり、素人 が理解するのは難しいかもしれないが、考えなければならない要因を概括することはできる。 それらは、 9 サンプルサイズを決定するための公式を含む資料は、 Cochran(1997,pp.72的と Snedecorand Cochran(1989,pp.52‑5 3,438‑440)を参照。 ηI 司U q u

360.

‑ データの複雑さ . モデルの複雑さ モテ、ルへのデータの当てはまりのよさ データの複雑さを理解するための第 1歩は、どの変数をモデル化するかを決めることである。 もし目的変数が 2 値変数ではなく、連続変数(購入金額のような)であるなら、モデルの展開 はまったく異なったものになる。明確な分析では、研究者はおそらく事前に予測を立て、また その予測に自信を持つであろう。 知りたいことよって、外れ値がもっとも有益なレコードかそうで、ないかが決まる。最悪の場合で も、予測データマイニングを行う際には、何が目的変数であるかをある程度わかっているべき である。もし、目的変数が、希な事例とよく起こる事例で構成されている場合には、それを階 層化することができる。重複レコード、があれば、クラスターサンプリングを行うこともできる。構 造変数と外れ値を見極めるために、データを十分に探索するべきである。顧客の性別や地域 といった、ある分類を使ってサンプルを層状することも重要かもしれない。不正発見のような ビジネス問題にとって、外れ値は非常に有益であり、サンプルに含まれるべきである。しかし、 他の一般的な問題にとっては、外れ値がそれほど有益でない場合もある。 ほとんどのデータに複雑さのレベルが存在するが、多くのビジネスモデルは比較的簡単なモ テ、ルを使って効果的に提言することができる。意図的にモデルの複雑さを制限することが必 要な場合もある。たとえば、調整装置ではパラメータの理解を容易にするために、モデルのパ ラメータが必要以上に複雑にならないようにする必要があることもある 100 モデルの複雑さ モデルの複雑さは、簡単なものからとても複雑 11なものまである。回帰、決定木、ニューラルネ ットワークのようなモデルは、簡単で直感的なデザインのものから、複雑で難解なデザインに まで及ぶ。線形回帰モデルは、多くの変数が、目的変数と線形的な相聞のあることもある。そ のような変数は、予測したいパラメータと関連がある。パラメータを予測するためには、十分な 10モデリングは " Ockham'sRazor"とし、う、イギリスの論理学者と哲学者である W i l l i a mo fOckham(circa o1349)が展開した金言を適応することによって利益を得る。それは「物は必要なときを除いては、 1285t 掛けるべきで、はない J(Gribbon1996,p.299)というものである。 1 1 単純回帰モデルには、 Y=a+bXというアウトプット変数に線状に関連したインプット変数がある。複 雑な回帰モデルは、多くの変数、相互作用する項、多項式インプット変数を含む。隠された層のない単 純ニューラルネットワークは、回帰モデルに相当する。複雑なニューラルネットワークは、インプット変数 の非線型変換、変換の隠された層、複雑な目的関数を含む。単純決定木は、末端のノードにたどり着 く前に数個のデータの枝しかない。複雑な決定木は、末端のノード、にたどり着くまでにたくさんの層があ る 。 ‑374‑

361.

数のレコードが含まれていなければならない。 図 5 適したモデル用の平面プロットの例回帰分析、決定木、ニューラルネットワーク 決定木分析とクラスター分析は、データを類似レコードの集合に分ける反復処理である。 ニューラルネットワークは、非線形的でより多くのパラメータを予測に必要とするため、さらに 複雑である。一般的に、モデルにパラメーターが多く含まれているほど、多くのレコードが必要 となる 12。 モデルへのデータのふさわしさ 異なるタイプのデータには、異なる統計的モデルがふさわしい。たとえば、ビジネス問題が、 顧客の購買をどれだけ予測できるかであるとする。この問題は、幅広い通貨型の値を含む、 連続的な目的変数を必要とするだろう。線形回帰モデルは、顧客購買を正確に予測するかも しれない。特に、目的変数が入力変数に線形的に関連しているときがそうである。もし入力変 数が目的変数と非線形的な関連がある場合には、ニューラルネットワークあるいは決定木の ほうがより正確に予測できるであろう。もしデータに多くの欠損値があれば、決定木が 1番正 確な予測をするであろう。 いくつかのモデリング問題に対しては、データサンプルの探索をすれば、より簡単に答えるこ とができる。たとえば、入力変数が目的変数と線形関係があるか?データについての知識 が得られれば、 SEMMA モデルのいくつかのステップを繰り返すのに役立つだろう。データを 理解すればするほど、サンプルはモデル化に役立つであろう。 一般的なサンプリング戦略 いくつかのサンプリング戦略は、もともと決まりきったもので、あり、一般的なガイドラインとして ニューラルネ、ントワークについての詳しい情報は、 Sarle1997を参照。 1 2 I 円 ベU n RU

362.

使用することができる。たとえば、目的変数だけが分かっている場合には、探索目的で最初 のサンプリングを行う。もしこのサンプルが良いものであれば、このサンプルの分析結果はデ ータベース全体についても閉じことが言えるということになる。もしデータ探索で、変数のレベ ル聞に異なる応答率があれば、変数は層化サンプリングのための層生成に使用で、きる o レコードの構造もサンプリング戦略に影響するかもしれない。たとえば、データの構造が広け れば、より多くの変数の層別化、モデルに含まれるかどうか、対話に含まれるかどうかなどを 考えなければならない。幸運なことに、いくつかのデータマイニングアルゴリズ、ム (CHAID や ステップワイズ回帰など)は、自動的に変数を削ったり選択したりしてくれる。 反対に、データ構造が深い場合、サンプルサイズが大きくなればなるほど、より多くのパター ンと詳細情報が見えてくることがある。 1年間の売上げパターンを考えてみる。レコードを少量 しか選択しなければ、おそらく期ごとのパターンしかわからないであろう。たとえば、冬期の売 上げのピークや、夏期の売上げスランプについての情報が得られないということである。サン プルのレコード数がもっと多ければ、月毎、週毎、可能であれば 1日の中でのパターンもわか る。一般的なサンプリング戦略として、重要な変数を探し当てるために、はじめは比較的広い サンプルをとり、それから関連性をモデル化するために深いサンプルをとることが役立つで、あ ろ う 。 学習用、評価用、テスト用にサンプルデータを使用する 特に有益なサンプリング実践は、下記のような目的別に 3 つの小さなデータに分割すること である ・ 学習 ・ 評価 . テスト 学習データは、モデルの学習に使用する。つまり、モデルのパラメータを予測することで、ある。 評価データは、最適なモデルを調整、選択するために使用する。言い換えれば、ある基準に 基づいて最高の基準値のモデルが選ばれる。たとえば、最小二乗推定値はよく使用される基 準である。テストデータは、選ばれたモデルの性能をテストするために使用する。最適なモデ ルが選!まれて、テストされた後で、データベース全体のスコアに使用する ζ とができる o サンプル中の個々のレコードは、この 3 つのデータのいずれかにしか表れない。サンプルデ ータを分割する場合、ここでも単純ランダムサンプリングテクニックを使用したいかもしれない し、層化サンプリングが適しているかもしれない。したがって、まず第 1に 5テラバイトデータ ベースからレコードの 1部をランダムに選ぶ。一般的には、モデルが単純であるほど、小さい O り ワ t ρ0

363.

サンプルサイズが求められ、複雑であるほど大きなサンプルサイズが求められる。第二に、 サンプルを分割するために再びランダムサンプリングを用いる。学習 40%、評価 30%、テス ト 30% の割合にする。 小さいデータのサンプリング 小さいデータのサンプリングは、特に注意しなければならないことがある。たとえば、データが まれであれば、単純ランダムサンプリングテクニックは不適切で、あり、複雑なサンプリングテク ニックが必要とされる。しかし、データマイニングプロジェクトで、は、データの不足は問題では ない。加えて、交差妥当性は、分割サンプル評価より適した場合がある。交差妥当性では、 データはあらゆる方法で分割され、新しいモデルは個々の結果として出たデータ用に学習さ れる。たとえば、 k 個の方法でデータが分割されれば、 kとおりのモデルが学習される。個々 の学習の繰り返しに対して、異なるテ、ータのサブセットが残される。この残されたサブセットは、 ホールドサンプルと呼ばれることがある。ホールドアウトサンプルは、誤差水準計算などの妥 当性の検証に使われることがある。 最後になるが、小さなデ、ータを使用する時には、ブートストラップ法が適しているかもしれない。 ブ ートストラップとは、データのサブサンプルを繰り返し分析する方法である。サブサンプルは、 それぞれサンプル全体からランダムに選ばれたサンプルである。 377

364.

参考文献 American S t a t i s t i c a lA s s o c i a t i o n,B l u e Ribbon Panel on the Census,(1996 September). Reportoft h eP r e s t d e n t 'sB / u eR t b ‑ b o n Pane/ on t h e C e n s u s . Retrieved September 8, 1998 from the World Wide Web: http://www.amstat.org/census.html Breslow,N . E .andW.Day,( 1 9 8 0 ),S t a t i s t i c a /Methodsi nCancerRes θa r c h .V o/ume 1一 刀7θ A n a / y s i 旨o fCase‑Contro/S t u d i e s , L y o n :IARCS c i e n t i f i cP u b l i c a t i o nN o .3 2 . Cochran,W i l l i a mG .,( 1 9 7 7 ),S a m p / i n gT e c h n i q u e s ,NewY o r k :JohnW i l e y& Sons,I n c . E l d e r,JohnF .,I VandD a r y lPregibon,( 1 9 9 6 ),Advancesi nKnowledgeDiscoverγ&DataM i n i n g, AS t a t i s t i c a lPerspectiveonKDD." 1 9 9 8 ), E r r o rNamingCampaignWinner , " NPR O n l i n e,MorningE d i t i o n, Gladstone,Brooke,( November3,1998, RetrievedNovember6,1998fromtheWorldWideWeb: http://www.npr.org/programs/morning/archives/1998/981103.me.html Greenhouse,L i n d a,( 1 9 9 8 ), H i g h Courtt o HearAppeal o fCensus R u l i n g,"刀7 eNew Y o r k 刀meso nt h eWeb ,(September1 1 ), R e t r i e v e dv i as i t e search on census" September 1 1, 1998 from the World Wide Web: http://www.nytimes.com 1 9 9 6 ),C ompaniont ot h eCosmos ,NewY o r k :L i t t l e,BrownandCompany. Gribbon,John,( Hays,W i l l i a mL .,(1981 ) , S t a t i s t i c s ,NewYor k :CBSC o l l e g eP u b l i s h i n g . n f o r m a t i o n Access To o l s : 1998 Worldwide I n t e r n a t i o n a l Data Corporation,(1998 June), I MarketsAndTrends, "IDC#15932,V olume:1 . Manski, C .F . and D a n i e l McFadden,( 1 9 81 ) , S t r u c t u r a /A n a / y s 必 o fd i s c r e t ed a t a w肋 , A p p / i c a t i o n s ,C ambridge,Mass:MITP r e s s . 1 9 9 2 ),T ruman ,NewY o r k :Simon&S c h u s t e r . McCullough,David,( 9 ), DataM i n i n gtheSASDataWarehouse, "A p p / i c a t i o nD e / i v e r y METAGroup,(1997August1 ,F i l e#594. S t r a t e g i e s .,( 1 9 9 6 ),Howt o刀7 1 n kAboutS t a t i 注t i c s ,F i 代hE d i t i o n,NewY o r k :W.H.Freeman P h i l l i p s,JohnL andCompany. i l l i a mJ .E .,( 1 9 9 7 ),D ataM t n t n gUs わ' gSASE n t e r p r i s eMtnerS o f t w a r e .Cary,North Potts,W C a r o l i n a :SASI n s t i t u t eI n c . R i p l e y, B. o . , ( 1 9 9 6 ), Pattem R e c o g n i t i o n and N e u r a / Networks ,C ambridge: Cambridge U n i v e r s i t yPress 1 9 9 8 ),A F i r s tCourset nP r o b a b i / i t y ,F i f t hE d i t i o n,UpperSaddleR i v e r ,New Ross,Sheldon,( J e r s e y :P r e n t i c e ‑ H a l l,I n c . ‑378一

365.

S a e r n d a l,C a r l ‑ E r i k, Bengt Swensson,and Jan Wretman,( 1 9 9 2 ), Mode/A s s i s t e dSurvey o r k :SpringerVerlag. S a m p / i n gNewY . S .,e d .( 1 9 9 7 ), N e u r a /Networkι 4Q ,p e r i o d i cp o s t i n gt ot h e Usenet newsgroup S a r l e,W c o m p . a i . n e u r a l ‑ n e t s,URL: f t p : / /代 p.sas.com/pub/neuraI /FAQ.html ,G eorge W. and W i l l i a mG . Cochran,( 1 9 8 9 ),S t a t i s t i c a /Methods ,E i g h t hE d i t i o n, Snedecor Ames,l o w a : ThelowaS t a t eU n i v e r s i t yP r e s s . 1 9 9 2 ),S t a t i s t i c a /A b s t r a c toft h eU n i t e dS t a t e s ,1 12th e d i t i o n, U.SBureauo fthe Census,( Washington,DC. ta l,( 1 9 9 8 ),C i v i lA c t i o nN o . U . S .Houseo fRepresentativesv .U . S .Departmento fCommerce,e ThreeJudge 98‑0456( p i n i o nf i l e dAugust24,1998byC i r c u i tJudgeDouglasH .Ginsburg, C o u r t )(RCL,DHG,RMU),O andD i s t r i c tCourt JudgesRoyceC .LamberthandRicardoM .U r b i n a h r i s t o p h e randTeresaB l a x t o n,( 1 9 9 8 ),D ataM . 庁7 i n gS o / u t i o n s :MethodsandT o o / s Westphal,C f o r S o / v i n g プ ' dP rob/ems ,JohnW i l e yandS o n s . Rea/‑Wor nHU ワ t qu

366.

推薦図書 DataMining Berry,MichaelJ .A .andGordonL i n o f f ,( 1 9 9 7 ),DataM i n i n gTechniques,NewY o r k :JohnWiley & Sons.I n c . SASI n s t i t u t eI n c .,( 1 9 9 7 ),SASI n s t i t u t eWhitePaper ,B usinessI n t e l l i g e n c eSystemsandData M i n i n g, Cary,NC:SASI n s t i t u t eI n c SASI n s t i t u t eI n c .,( 1 9 9 8 ),SASI n s t i t u t eWhitePaper,F i n d i n gtheS o l u t i o ntoDataM i n i n g :A Mapo ftheFeaturesand n s t i t u t eI n c . Componentso fSASE n t e r p r i s eMiner™ Software,Cary,NC:SASI SASI n s t i t u t eI n c .,( 1 9 9 8 ),SASI n s t i t u t eWhitePaper ,FromDatat oBusinessAdvantage:Data M i n i n g,TheSEMMA MethodologyandtheSAS@System,Cary,NC:SASI n s t i t u t巴 I n c . i t i nIndurkhya,( 1 9 9 8 ),P r e d i c t i v eDataM i n i n g :A P r a c t i c a lGuide,San Weiss,SholomM.andN Francisco,C a l i f o r n i a : n c . MorganKaufmannP u b l i s h e r s,I DataWarehousing .,( 1 9 9 3 ),B u i l d i n gtheDataWarehouse,NewY o r k :JohnW i l e y& Sons,I n c . Inmon,W.H 1 9 9 5 ),SASI n s t i t u t eWhitePaper ,B u i l d i n gaSASDataWarehouse,Cary, SASI n s t i t u t eI n c .,( NC:SASI n s t i t u t eI n c . 1 9 9 8 ),SAS I n s t i t u t e White Paper,SAS I n s t i t u t e ' s Rapid Warehousing SAS I n s t i t u t eI n c .,( Methodology, Cary,NC:SASI n s t i t u t eI n c . 1 9 9 8 ), Data War巴housing Concepts, Technologies, Implementations, and Singh, Harry, ( Management ,Upp 巴 rS addle ,NewJ e r s e y :P r e n t i c e一H a l l,l n c River Statistics i l l i a mL .(1981 ) , S t a t i s t i c s .NewY o r k :H o l t,R i n巴h a r tandWinston. Hays,W H i l d e b r a n d,DavidK .andR .LymanOtt,(1996),BasicS t a t i s t i c a lI d e a sf o rManagers,NewY o r k : DuxburyP r e s s . Mendenhall, W i l l i a m and Richard L . Scheaffer, ( 1 9 7 3 ), Mathematical S t a t i s t i c s w i t h A p p l i c a t i o n s .NorthS c i t u a t e,Massachusetts P h i l l i p s,JohnL .,( 1 9 9 6 ),Howt oThinkAboutS t a t i s t i c s,F i代hE d i t i o n,NewY o r k :W.H.Freeman andCompany. ‑380

367.

論文発表 統計解析

368.
[beta]
日本 S A Sユーザー会 (SUG I‑J)

S
e
p
a
r
a
t
e
‑
r
a
n
k
i
n
g型ノンパラ多重比較
0 浜川知l
久山本
本

山本 g
l
Jf
‑料

‑*京大学 1
;
&
"戸市北削疫学教辛

料イ f
限会主 1
・アーム

'
p
a
r
a
tθ‑
r
a
n
k
I
n
gN
o
n
p
a
r
a
m
θt
r
I
cl
1
u
l
t
i
p
lθ C
o
m
p
a
r
I
s
o
n

S
θ

C
h
i
k
u
m
aH
a
m
a
d
a
U
n
i
v
e
r
s
i
t
yo
fT
o
k
y
o
H
o
n
g
o7
‑
3
‑
1,B
u
n
k
y
o
‑
k
u,T
o
k
y
o,1
1
3

要旨
医薬データでは J
I
:i
F
.
則a
l
‑
{
式データあるいはカテコリカルデータ(2ú!i や JI~j序カテコリカル)を反
応変数として,多 1
1
‑
'
(
:問の比較を行う場合が多く,これらの問題に対応するため,被々な多点比較法

A
Sでは依然,プロシジャレベルで,ノンパ
のノンパラメトリック版が開発されてきた.しかし, S

u
;
:
tdれていない.本杭』どは, SASの PROBMC関数を川いて, separa
ラメトリックな多市比較法は n
.
n
k
i
n
g
'
̲lj'!のノンパラメトリックな多 .
H比1
'
出よ, S
t
e
e
l検定, S
t
e
e
l
‑
D
w
a
s
s検定, S
h
i
r
l
e
y
‑
W
i
l
l
i
a
t
e
‑
r2
皿s
検定を,実行するマクロを作成したので紹介する.

hht

ワ

キ

S
t
e
e
l検 定 S
t
e
e
l
‑
D
w
a
s
s検 定 S
h
i
r
l
e
y
‑
W
i
l
l
i
a
m
s検 定 P
R
O
B
M
C関数 N
P
A
R
1
W
A
Y

‑
3
8
3

369.

1.はじめに 近年,医学・生物学の分野では,検定の多重性の問題に対する認識が広まってきた.同じデータに繰 り返し検定を適用すると,個々の検定の有意水準が制御されていても,全体で誤って有意と判断する確 率はかなりの大きさになる.この問題に対処するため,一つのデータに適用する一群の検定全体を,改 めてーつの手法とみなし,その全体での第一種の過誤を,有志水準以下に制御する方法が多重比較であ る. SASでは,一元配置分散分析型のデータについて,正規分布を前提にしてパラメトリックな多重 u k e y,D u n n e t t z . 去などの 1 3 比t肢を行う場合には, GLMプロシジャが利用できる.このプロシジャでは T 種類、の多重比較を実行することが可能である ( S A SI n s t i t u t eI n c . ( 1 9 9 2 a ) ) .並べ替え検定に基づい U L T T E S Tプロシジャ( S A SI n s t i t u t eI n c . ( 1 9 9 2 b ),浜 たノンパラメトリックな多重比較については, M 田・吉田(19 9 2 ),岸本(19 9 2 ) ) で可能であるが,よく用いられる順位データに基づいたノンパラメトリ ックな多重比較を実行するプロシジャは,現在のところ SASには存在しない.しかしながら 6 . 0 7でリ リースされた P R O B M C関 数 ( S A SI n s t i t u t eI n c . ( 1 9 9 2 b ),吉田・浜田(19 9 2 ) ) を用いれば,伊j ' 数がアン u k e y型と D u n バランスな場合を含めて,多重比較の p値を求めることができる.ノンパラメトリックな T E' lt t型の多重比較(両側検定)を実行するマクロとしては,況に s e p a r a t e ‑ r a n k i n g型の方法として 吉 田・浜田 ( 1 9 9 2 ),j o i n t ‑ r a n k i n g型の方法として,浜田・岸本(19 9 5)が報告されているが,リリース 6 . 1 2 のN P A R 1 W A Yプロシジャの拡張で,ウイルコクソン検定の結果が S A Sデータセットに落とすことが可能に なったため,ノンパラの s e p a r a t e ‑ r a n k i n g型の多重比較法がより簡単に実行可能になった. N P A R 1 W A Y プロシジャと P R O B M C関数を組み合わせた, s e p a r a t e ‑ r むl k i n g型の D u n n e t tとT u k e y法のマクロを示すとと もに, ノンパラの s e p a r a t e ‑ rむl k i n g型の W i l l i a m s法である, S h i r e y ‑ W i 1 1 i a 皿s 法のマクロを紹介する. 2 . ノンパラメトリックな多重比較法の原理 u n n e t t,T u k e y,W i 1 1 i a m s !こ対応する, 3種類のノンパラメトリックな 代表的な多(l!;比較法である, D 多重比較法 ( s e p a r a t e ‑ r a n k i n g )のマクロを作成した. 用途 対照群との比較 すべての群間の対比較 単調性を前提に対照群との比較 パラメトリック ノンパラメトリック(マクロ名) D u n n e t t T u k e y W i1 1i a m s S t e e 1 ( S T E E L ) S t e e 1 ‑ D w a s s ( S T E E L ̲ D ) S h i r 1 e y ‑ W i 1 1 i a m s ( S ̲ W I L L ) ‑パラ・ノンパラの違い パラ・ノンパラの多重比較法の追いを簡単に説明する. 次のような一元配置分散分析型のデータを想定する. ,X 1 2, ...X l n l 第 l群 X 11 第 i群 X il 第 g群 X g l,X g Z , X i~ , ・・・ X ini , ...X g n g 最初に,パラメトリック多重比較について定式化する. 全部で g群あり,第 i群,第 j個体の観測されるデータを X ij とする.このとき独立性,等分 散t l,正規性を前提に,第 a群と第 b群をパラメトリックに比較するときの検定統計量 tabは(1) 式のようになる.ここで X a . ' Xb. は,それぞれ a群 , は各群のサンプルサイズである. ‑384‑ b群の平均値である.また na., nb.

370.
[beta]
)
l
(

Xb.‑Xa

tab=
{s'(l/nb+l/r
い) }0
.
:
'

s
'二L:L: (Xij‑Xi') '/DF
D F =L
: (ni‑1)
t叫を自由度 D Fの多重比較の数表の臨界伯と比較することによって,検定を行うことができる.

これに対して s
e
p
a
r
a
t
e r
a
n
k
i
n
g型のノンパラメトリック多重比較の方法は,次のように定式化で
きる.
a{
f
(
:
とb
.
昨の比較の場合,

2つの群を一緒にして, 1,2,
…
, n,
+ n,までの順位をつけ,これを

ri
jとおく.
第 a群 rd,rs!:, ...r
l
n
l
第 bi詳
r~l , rt~ , ..• r
b
n
b

af
,
下
と b群を比較するときの検定統計量 Zabは次のようになる.
rb. ‑ r
"

(
2
)

Zub

{s二 (1/nb+1/r
し) }U
.
:
.
h
二{L:(r.j) }/n.
:(rbj) }/nb
rb.={L
r 二
{L:(r.;) +L: (rb;) }/{n.+n.}
s'={L
:(r,
j‑r..) ,十三 (r'j‑r..) '
} /{n.+nb‑l}
rb はそれぞれ a
i
非
, b併の平均順位である. Zu bを白 [
1
1度無限大の多重比較の

ここで r

は

数表の臨界慣と比較することによって,検定を行うことができる.
まとめると,パラと比べてノンパラでは,次の 3点の違いがある.
1)比較する 2群ごとにデータを一緒にして,順位に変換する.
2) s
' を府内分散をプールしたものから, a,
b, 2
1
1
干の全分散に置き換える.
3) t~ 山度を無限大にする. (検定統計量を正規近似する)
この場合 Z山統計量は, W
i
l
c
o
x
o
n
検定(述続修正ーなし)の検定統計量にー虫する.この性質を利用
して,マクロ S
T
E
E
LとS
T
E
E
L
̲
Dでは, N
P
A
R
1
W
A
Yプロシジヤを利用して,

z
統計量を最初に計算し, P
R
O

B
M
C関数を用いて p値を求めている.
なおノンパラメトリック多重比較のもう一方の流儀である j
o
i
n
tr
a
n
k
i
n
g
では, 1
) , 2) の操
作を比較する 2群毎で行うものではなく,全群を一緒にして行う(浜田・岸本 (
1
9
9
5
)
)
. また本稿の
ノンパラメトリック多重比較のマクロでは,検定統計量の分布を漸近的に正規近似するため,ある
程度の標本の大きさが必要であり,この条件にあてはまらない場合は,並べ替え分布に基づいた検
定の方がより適切である.

.S
h
i
r
l
e
yとS
h
i
r
l
e
y
‑
W
i
l
l
i
a
m
sの検定
W
i
l
l
i
a
m
s
検定の特徴として次の点が上げられる.
1)どの用量から対照群に比べて有意に変化しているかを明らかにできる.
2)対立仮説として用量反応関係に単調性を仮定する.

3)多重性を 考慮して第 1極の過誤が制御できる.
4) 卜降手順であり,用最の高い l
洋から対照群との比較を行い,有志差がでなくなった用量で終了
ι

する.

385

371.
[beta]
W
i
1
1
i
a
m
s法は正規分イ1
(
'と等分散性を仮定した方法であるが,これを分布形を仮定しないノンパラ
h
i
r
1
e
y
(
j
o
i
n
t
‑
r
a
n
k
i
n
g
)とS
h
i
r
1
e
y
‑
W
i
1
1
i
a
皿s
(
s
e
p
a
r
a
t
e
‑
r
a
n
k
i
n
g
)の
メトリック版に拡張したのが, S
u
n
n
e
t
t型あるいは T
u
k
e
y型のノンパラメトリック手法と同綴に,順位変換したデータ
検定である. D
h
i
r
1
e
y法が全群 (
g
R
干)を一緒に順位付けするのに対し, S
h
i
r
1
e
y
‑
W
i
1
1
i祖 S法で、は,毘ー
に基づくが, S

:
f
'
で順位付けするが,最高Hl量群と対照群で,有窓差がある場合には,最高用量群を除いた
初は全R
(
g
‑
l
)併で順位付けをし直して, (
g
‑
l
)群と対照群の比較を行う.ここでも有意差がある場合には (
g
‑
1
)群も除いて,順位を付け直す.このように有意な間は,逐次的に上の用量群を除いて,

r
e
‑
r
a
n
k
i
n
gしながら比較するのが, S
h
i
r
l
e
y
‑
W
i
1
1
i祖 S法である. W
i1
1i
祖 S法と同様に,群間で単
調性が成り立たない場合は,平均順位について併合平均を計算して,対照群との比較を行う.

.PROBMC関数
PROBMC関数は,多重比 i鮫のための,掠々な統計量の累積分布やパーセント点を計算するこ
とができる.

d~PROBMC 民吹の書式
v
a
1
u
e
=
p
r
o
b
m
c
(
s
t
r
i
n
g,
c,
p
r
u
b,
d
f,
k,
<
p
a
r
a
皿e
t
e
r
s
>
);
j¥i)か%点
v
a
1
u
e :計算の結果:{確率(pf
s
t
r
i
n
g :多重比較のタイプの指定
"
D
U
N
N
E
T
T
1
":片側 D
u
n
n
e
t
t
"
D
U
N
N
E
T
T
2
":n
f
M
J
!
l
l
D
u
n
n
e
t
t
検定
"
W
I
L
L
I
A
M
S
" :W
i
1
1
i
a
m
s
"
R
A
N
G
E
" スチユーデントイじ範凶 (
T
u
k
e
y
)
"貼剖O
D
" :最大絶対仙
c
検定統計量の値の指定
p
r
o
b :ド側縮率の指定
cとp
r
o
bのどちらか一方のみを指定,指定しない方は欠測(. )とする.
d
f
:分散統計量の白 t
l
!度の指定,自由度無限大のときは欠測値(.)
k
:群の数 s
t
r
i
n
gが
"
D
U
N
N
E
T
T1
ぺ"DUNNETT2"と WILLI必1
S
":g
‑
l
"
R
A
N
G
E
""
M
A
X
M
O
D
"
:g
p
a
r
a
皿e
t
e
r
s:D
u
n
n
e
t
t型で例数が異なる場合に指定
3. マクロとその仕儲
3種類のマクロ, S
T
E
E
L
(
S
t
e
e
1検定), S
T
E
E
L
̲
D
(
S
t
e
e
1
‑
D
w
a
s
s検定), S
̲
W
I
L
L
(
S
h
i
r
1
e
y
‑
W
i
1
1
i祖 S検
定)を作成した.いずれも一元配置型データ構造を想定している.マクロ変数として,解析対象 S
A
S
データセット (
d
a
t
a
),反応変数 (
Y
:数値変数),群分け変数 (
G
R
O
U
P
:数値変数(1から述続した整数
g
),有意水準 (
a
)を指定する. S
t
e
e
1検定と S
t
e
e
1
‑
D
w
a
s
s検定は両側検
値)),対照群を含めた群の数 (
h
i
r
l
e
y
‑
W
i
1
1
i
a
皿s
検定は本質的に片側検定で、あるため,検定の方向 (
t
a
i
1
:
1
(上側) 2
定を行うが, S
(下側))を指定する.
T
E
E
L
(データセット名 :
T
E
S
T
1)には,永田・吉田 (
1
9
9
7
)の表 5
.
1
0,S
T
E
E
L
̲
D
(データ
例題として, S
セット名 :
T
E
S
T
2
)には表5
.
7,S
̲
W
I
L
L
(データセット名 :
T
E
S
T
3
)には,表 5
.
1
2のデータを適用した.有
意水準はいずれも問 (
a
=
0
.
0
5
)を指定している. S
̲
W
I
L
Lでは t
a
i
1
=
1を指定することにより,上側検定
l)を行っている.
(単調培吻]

‑386
372.
[beta]
S
t
e
e
l検定のマクロ
百
五t
at
e
s
t
l
;
J
p
二1
toJ;
d
og
r
ol
司oj
=
=
1t
o1
Q
l
@
;
o
u
t
p
u
t
;
i
n
p
u
ty @
e
n
d
;
e
n
d
;
‑
c
a
r
d
s
:
5
05
5
‑
6
56
36
06
86
96
05
24
9
8
08
67
46
67
98
17
06
26
07
2
4
24
85
86
36
25
56
36
05
34
5
%
m
a
c
r
oS
T
E
E
L
:
d
a
t
aw
i
l
:
s
e
t
‑
&
d
a
t
a
:
;
d
oi
2士i
1tLtQ.~g
d
oi
1マl

~ãif~com~~e~~~i1rri~J~

.
i
f&
g
r
o
I
J
T
=
lt
l
i
e
n
'
o
u
t
t
u
t
;
i
f&
g
r
o
u
p
=
i
2t
h
e
no
u
t
p
u
t
;

野
良b
3 2 d ; h M L i lmpriM S 品
匂
知
g
引
附
r
yp
a
i
r
"U
.i
2・Q
u
t
p
u
to
u
t
=
o
v
t;
出

叫 、

四 回r
yaatâ~&ðäta;var~y;cïä部品group;outP.ut o
u
t二nn
=
n
;
p
r
o
cs
二 no
u
t二 n"
‑
p
r
e
f
i
x
=
n
;
v
a
r
‑
n
;
i
e
l&
g
r
o
u
r
;
o
r
o
ct
r
a
n
s
p
o
s
e
̲
d
a
t
a
u乱t
an;setn
;
d
f二.,

日
花

11r?Z1niigh?l[??21 (
f
W
f
;
(
?
!
J
I
?
?
j
;叩 d
;
二・
d
a
t
ao
u
t
;
s
e
to
u
t
;
d
f
d
a
t
a 認
淵
腎
町r
弓
i
包
L
也
b
V
V
W
J
4
f
O
仔
1
?
了
子
1
ム
I
匂p
ゴ
二r
=
‑
p
r
百
砧
b
m
一
引
;J d
山u
n
n
e
吋t
t
ザ
?
',
油
a
b
s
吋
!z
)',1,'~白f , 品
匂
g一l
,
O
ぱfr
凶2
一T
品
匂
g
);
d
dZc
=
P
r
I
、
o
b
m
日
CI
子
勺
血
d
山
帥
u
町
m
叩
町
n
e
t
t
2
',
~,
1
一h
b
a2
J
a
f:
品g
一î~ o
f
'r2一一一 r品g)
p
'r
o
c.
p
r
i
nt
'ðätaよoür;"'vär~ pair~ irntz
~p2~wn >
i
:
k
w
.d
p
'a
z
c
;r
u
n
;
'
k
m
e
n
a:
%1~t_9áta=test1; 目 let g
=
3
;見l
e
ta
=
0
.
0
5
;見l
e
tg
r
o
u
p二 g
r
o
u
p
;見l
e
ty
二y
;
%
S
T
E
E
L
;

:
1
;
;
F
H
:

S
t
e
e
l
‑
D
w
a
s
s検定のマクロ
d
a
t
at
e
s
t
2
;
O
.
4
;
d
ogroIJP~l. t
司oJ
二 1t
o1
1
l
~nput y@
@
;
o
u
t
p
u
t
;
e
n
a
:
e
n
a、
c
a
r
d
s
:
6
.
97
:
58
.
58
.
48
.
18
.
78
.
98
.
27
.
87
.
36
.
8
9
.
69
.
49
.
58
.
59
.
49
.
98
.
78
.
17
.
88
.
8.
5
.
76
.
46
.
87
.
87
.
67
.
07
.
77
.
56
.
85
.
9.
7
.
68
.
78
.
58
.
59
.
09
.
29
.
38
.
07
.
27
.
97
.
8

叩

LD
;
1
m
a
c
r
o
a
t
aw
i
l
;
s
e
t
‑
&
d
a
t
a
;
o &g~do , i?〒 ilH t
o&
g
;
d
o i1~1 t
:
9i
r=compf~~s (
,
i1
11
i
2
);
P
.if-&grouþ~i1 t
h
e
n
'
o
u
t
t
u
t
;
i
f&
g
r
o
u
p二 i
2t
h
e
no
u
t
p
u
t
;
ハ
.
.
.
.
.
.
.
r
.
.

"
.
.
.
.
.
.
.
.
.
.
.
・

p
r
o
cs
o
r
t
.
d
a
t
a
=
w
i
l
;郎
、Ahir;
g
r
o
u
p
;
v
a
r&
y
;
t
r
o
c ppar1~ay.~i!çoxo~-d~tá二~il ~oprint;class &
u
t‑
;
b
y
.
p
a
i
r
"i
1
.i
2
;
o
u
t
p
u
to
u
t二 o
d
a
t
ao
u
t
:
s
e
to
u
t
:
z
=
s
a
r
t
(k
w)
:
d
f
=
.
:
tp~r一戸百五m9J"ra~g~' , aþs!z松本*~~~ー, df, &g);

ぷ
I
弘
m
m
O
C
;
1
帥 仙 山t?川 判 刊f糾
叫
/
i
包
蜘
?end;

ニt
e
s
t
2
;見l
e
tg
二4
;見l
e
ta
=
0
.
0
5
;目l
e
tg
r
o
u
p二 g
r
o
u
p
;目l
e
ty
=
y
;
e
td
a
t
a
S
T
E
E
L
̲
D
;

‑
3
8
7

373.

守 臼 ︒ ︒ ザ ︿ 舟可 免 凶 ム み 舟 . ︐. ︐. ︐. ︐ 一 一︑ ︑︐ ︐︐ J曜 ︑︑ jE =FE414 .︐一‑Tiu‑J1i 一‑ ‑ 'T 't 内d u ‑ ‑ u ・ 可 4 d 一・'一・1 i ・ 1 i 4 ・3 +t しt 一+ ・し 1E iU ・司4 ‑Hu‑J1 O ‑ s s e 4L・'一︑1r‑ ︑‑ y︐︐︐1 l j z1 町 ・ 1 J t i t i Q U o a 一 ・F 1b J‑4 a ふ l ・' m ' 一.︐皿一' ・ J J ・ ' 5 ‑ ︑ l E 一 f i ‑ ‑ 4 1 4 n n u u‑ 一叩一一;i 叫以 141ι一︑︐/〆tk1J 1JFAnu ‑om‑ti Fn Am mm 山= 山一I?nuJt ︑ r l ︑ ・F 3A ‑且 F也 口︑ 一/ L一 一 'KJJa‑‑at 民 nuvAnu g ; 一 { ︑ ︑ 1 m m t e ‑eoanu‑nu‑‑J ・ ' 一 一 一 一 S 1 9 b / l λ U 一 n ・ 1 J 1 i ︑ 1i 41FW'm 一・'aE4 1 一 本 ' ‑ 4 i 4 i c ・ ' e r u m 山 山 ︐ / ・ 可 i vhy+ll→.︐ヮ白nv ;︐ ed sg ;e n ‑‑ l‑ i+ a/ ‑n ‑u 4‑ J︑ I / W U i ︐d y t ・ 1 4 1 J f i ; e n a r ; g a l ‑ ‑ t s O { ( i 5 p m 1 i e ι L u n u a F A n ‑ n u b h 二 4 L1m lm ︑山 .本 w・v ・ ' 一 乙 V n F A n ‑ ‑ 7 ; ︐ ︑ 'm 皿J mu 'b 一一 a‑ +i し・ 二 1 i sh aU 一4 ︑L / m J uf ‑d ‑1 Jn 1 i = + し u y p n ; / ‑ z J + n 二 v l /本:︑fliz p F n y h u ρ u n u F h H H U ‑ y d j ρ ' ・ 1 i n n u 仙 ︑ F ︑ ︐ / 一 n u n u eA + し' ; e ; 一 C o a ‑ ‑‑一 九tJ ・u2 lu‑ e e気 e ‑I ‑ 1. w u R ' K ; m : f i z m ' 一 ・ l ・ 11 d・ i‑ L U L u m n4711i;a er g o on ‑r ‑= /x te nn =‑ n‑ w1 ‑i n一 u/ ‑t ‑l l+ i ﹄ i︑O+し+し:7J・l''E 1 i SJu‑‑41・1ρI本・﹄+し : n ・ d x ・ ' ; 1 i I l ‑ ‑ 十 九 d ' ︐ d e t L弘K ︑ ︑I l l ・ ‑ ‑ 1 1 j ρ I ' 一 一 釦 1 i q L e r v ・ llngtpam nI uI wn n‑ n‑ nt = ' h u ; a n t e + し n u ︑ / n a n s f k n 1 i a a ︐ I I l ︐ d a r 町 幻幻初出口t叩司)何肘;sdz匂n配巨mhiHh 批 門 主 u m れ m ' a e o r n ; ; D A Y ‑ n / t y ‑ ‑ ・ J + t ・ J 一 一 一 一 一 一 n ・n 'T 1/ iZ s oi oq ‑u ‑q 1 L し g F a r t n e ' b l a m a ︐ ︑ / ・ 1 1 / / 1 4 1 u 'e m= Y 1 4 9b u+ a v n a u Fm b1 ;s e ‑ ‑d J mU ft '9 : ' ;n t tF 也b gea v o e; aa r y re tr ・ J I ‑九 ‑J H 二 ︐ dI ︐ die ‑ ‑ J i L日a g 4 L o o n U F O A吐 S ・ 1 4 n e n e m 4 L a p ‑ ‑ J a a s ‑ ‑ ︐ ︑ 1 n n m r t p t s y u e L U 2 3 1 2 一 一 e k t a m t t = g 二 S V O ︐ d r ; U i ‑ ‑ 1 i e l a a ‑ ‑ J 本 本 m s p g ; i t ‑ ‑ J U g n e u u + L a r a r n u f i s ‑ ‑ J u r z a m 4 L a : f i n U O A 町 nu‑‑1in oeく p a as D; Am p p p U 4 L4 uL yn J u a n U‑ J‑ uJ i: 3 1 1 一 ・n J+ Un u a a ‑ ‑ ・ 一 一 一 一 a r4 ; ワ U 9 u q y u = u t + し O S o ' b a ; n : f i a s ・ J R I ノ ・ J ; ・ ' V Z 1l 4a lU o4 sL ‑3 ' n n t 也 t ]一 一; 1・ il ご o n o u u ; e v d a g s ‑J ミ n・J/tee‑‑(llvuJi‑‑n二 b E o s ‑d1iutr u m H m凶 MPyukhpmp μ町川叩mu即時トぱ寸0司Jmnn‑. グ 一 ﹁刀 m.旧日叩昭訂下SSH ∞ g 一Poabonnoazane0・'oonm‑s・'E干しkil‑‑11/YF?ihu'whimann γ 町山 fu︐ammstehhFWFPe阻止Ujm410a・しμHJ1一竹山口bh凹tdftM阻吋hh叩;伊h 町 一 叫 刊 日 目 mu 4439即抗.日抗抗SF白山昭te抗m抗am‑‑L山・七匂h.﹁‑LmKLL2凹ト日加配弔問skttd伊回目 お一同 d d' kt 1 i= tn u ︐d Fr 食‑ 一; : 命0 ︑: qU 9 Th i‑ ‑ ︐一 dF 匂︐ d 匂︐ d o g0 '1 ・a i nl ‑t ‑i O To ‑g ‑a e ss ta ga 4 2 o a 一i 一u 一 nd a c t s = h i m e a3 ‑e Ut 二 1 K' (k Of i 3 l・ il t r eo e' nb a o tnas; s一 1 55 2 7 ・1 a aa ・ ' U 二 一 e e ・ '・ S 7 十 11fut=ntnnofA&PFavus‑二srt 一 o y 2 1 2 1 L 二 t o t t r k o p e s d s n ・ ' n O ( d c j o n f ・ ' n n ・ ' g r 血 二 一 p t ・ ' s e e las m v H一toyL1ietaa;ynepo‑‑oayvdons‑JI‑‑・14dn‑Id‑‑nn︐dtutmワ u i =n sa yn yb gg U一;tt78751isddyrateyp・'perrc1a二n二n二n(= c1 b r .二 ︐yve 1 3 1 u 1 3 3 4 w a ・ う M o a ‑ r u k t s n s m a 企 y y E c ‑ ‑ o e ‑ ‑ 4 r f ‑ ‑ o = f p z f ・ ' a i t P 1 ・ 21 I ‑e ‑山 一 一 旦は F寸即;8090SτUF吋出r凹rhH一叩rmrmmmwmmLK一id 山J lcziwwiむ吋凹uswS吋‑m u; 主民∞i i M ; 3 2 3 0 一 由 時 m m m m m 凶 凶 日 廿 刊 廿 m m m h u u 凹 一 山 叩 出 叩 出 印 m u n d汀汀mv; 白日 一 e u argode・s﹃3G220241F3一Ct一一adslc c c a e c a a 一 c a c c E t w h 一 A d r a 一 t o o o t o o t t 一 o t O G e e ‑ h ‑ a o n a 3 ︐d ec ‑‑ 9U 9u ワ ?6&2'6mm本一︐adoJrurprpaprJruapap‑︐rdaJrUr本mPlJsu p n u ' m Sq ' g 町 ' ‑388‑

374.
[beta]
5. マクロの実行料L~ と lllJJ の併説
マクロ STEEL を適 m したが;県は,次のようになる.変数PAIR によって,比較を 1 Í"う ~r下の対をぶし

ている. Dunnett 型の比 i鮫なので,対照府(1~作)と 2~n , 3
m
:を検定している.変数Z
は(
2
)式によって
求めた Z 統 I-~I. E
I
1で、ある.変数P
̲
K
Wは 多 肝t
'
tを調整しないウイルコクソン検定の P
(
I(lで、ある.また P
2
̲

W
I
Lは,辿続修 1
:を行ったウイルコクソン検定の p伯である.これらの l
U
J
Jは
, N
P
A
R
1
W
A
Yプロシジヤ
の結果を S
A
Sデータセットに /
I
¥
)
Jしたものである.変数D
Pは P
R
O
B
M
C
!
込]数で,¥1.算した S
t
e
e
l検定の p
値である. D
Z
Cは有志水準 αの S
t
e
e
l検定の棄却l
限界 M
lで、ある.ここで、は a
=
0
.
0
5を指定すること
により, l
[
h
j
{
J
l
[
J5% の棄剥J[IL~ 抗L1ðti2.21210 がぶぶされる. P
A
I
R1
2のZは 2
.
9
5
2
5
7で,この 1
1
'
(は D
Z
Cよ
1
り大きいので, 5
%
水準て、有志で、ある. P
1
1
(
'
は0
.
0
0
6
1
0となる.
T
E
E
Lの実行結果
マクロ S
O
B
S
1
2

P
A
I
R
1
乙
1
3

1
1
1
1

1
2
2
3

2

2
.
9
5
2
5
7
1
.1
7
5
6
7

P
2W
I
L
0
.
0
0
3
5
6
0
.
2
5
5
2
3

PK
W
0
.
0
0
3
1
5
0
.
2
3
9
7
2

D
P
0
.
0
0
6
1
0
0
.
3
9
2
8
2

D
Z
C
2
.
2
1
2
1
0
2
.
2
1
2
1
0

マクロ STEEL_D を実行した車lj~ は次のようになる. 4
1
作なので, 1
可能な 6
)
1
重りの対比較の結果が表
示される.変数 Z
,P
2
̲
W
I
L,P
̲
K
Wについては,マクロ S
T
E
E
Lと
[
,l
t
慌である. T
PとT
Z
Cはそれぞれ,
S
t
e
e
l
‑
D
w
a
s
s
検定の P
(
I立と 1
[
j
.
1
J
!
l
l
α の葉1;
1
1
限界仙である. a
ニ0
.
0
5を指定したので, 5
%
J
,
¥
(
(
2
.
5
6
9
0
3
)が
T
Z
Cにぷされ, 1-2 , 2-3 , 3-4~作の比 11安については, Z
統計 h
l
:がT
Z
CをL[Iるので,脱水準でイ fjなになる.
それぞれの p 仰は, 0
.
0
3
6
9
6,0
.
0
0
1
0
3,0
.
0
0
3
9
8となる.

T
E
E
LD
の尖行結果
マクロ S
O
B
S

P
A
I
R

1
1

1~

2
3
4
5

1
3
1
4
2
3
2
4
3
4

2
2
3

1
2
2
3
4
3
4
4

Z
2
.
6
8
0
2
3
2
.
5
4
0
0
0
1
.
2
8
2
6
4
3
.
7
4
6
0
8
2
.
0
4
6
7
8
3
.
3
8
4
4
6

P
2W
I
L
U
.
0
0
8
1
7
0
.
0
1
2
2
5
0
.
2
1
1
3
9
0
.
0
0
0
2
1
0
.
0
4
4
2
7
0
.
0
0
0
8
1

PK
W
0
.
0
0
7
3
6
0
.
0
1
1
0
9
0
.
1
9
9
6
2
0
.
0
0
0
1
8
0
.
0
4
0
6
8
0
.
0
0
0
7
1

T
P
0
.
0
3
6
9
6
0
.
0
5
3
9
8
0
.
5
7
4
0
1
0
.
0
0
1
0
3
0
.
1
7
0
9
7
0
.
0
0
3
9
8

T
Z
C
2
.
5
6
9
0
3
2
.
5
6
9
0
3
2
.
5
6
9
0
3
2
.
5
6
9
0
3
2
.
5
6
9
0
3
2
.
5
6
9
0
3

マクロ S_WILL を実行した車i~!.+ミは次のようになる. t
a
i
l
=
lを指定したので,上側検定を実行する.
変数 S
T
A
G
Eが順位付けの範初l
を表している. 4
は4M
全体で, 3 は 1-3~作まで, 2
は1
‑
2群でj順位を付け
ている.変数 C
O
N
T
R
O
Lには対照昨 (
1
1
打)の平均順位が示されている. S
T
A
G
Eによって,順位付けの範
囲が異なるので,対照1if:の平均順位も見なる.変数M
E
A
Nには,変数 G
で
、
ノJ
¥された併の平均 )
I
[
)位が示

されている.各ステージごとに,各1
作の平均 )
I
a
i位を計算すると

i
作2
~作 3
群4
2
1
0
.
7
0
8 1
4
.
2
9
2
3
1
5
.
3
7
5 21
.1
6
7 1
8
.
9
5
8
4
1
8
.
3
7
5 2
5
.
6
6
7 2
3
.
0
8
3 3
0
.
8
7
5
となる.ステージ 4では, 1
洋4の平均順位が長も高いので, A
D
J
M
E
A
N
(調整平均)と M
E
A
N
(1
1
1
*
日
t<
1均)
ステージ

群1

主

が等しくなる.ステージ 3では, ~作 3 より昨 2 の方が平均順位が小さく,逆転が起きているので,
A
D
J
M
E
A
Nとして,昨 2と昨 30)平均 )
l
u
l
{
¥
'
Lをサンプルサイズで {fみ付けた併合平均 (
2
0
.
0
6
2
5
=
(1
2x2
1
.
1
6
7
+
1
2x1
8
.
9
5
8
)
/(
12
+
1
2
)
)を計開ーする.このように, S
h
i
r
l
e
y
‑
W
i
l
l
i
a
m
s
検定で、は, 1ì~. ,WM~1ニが hX: り )1/
たない場合には,併合平均を計算して,対 lW
j
'
(
:
の
平
均)
I
[
i
u
i
:と比較する.この例では t
a
i
l
=
lを指定し
たので,単調JlYI)J11になるように平均順位を;泣き換えている.変数Z
が対!日1作との比"攻の Z
統計 h
t,W
P,

‑
3
8
9
‑

375.

W Z CはP R O B M C関数で求めた p他と布志水準 αの棄却限界仙である.ただし, ド降子 I J 闘の検定である Pは通常の p値と同慌の解釈ができないことに注意する必要がある.下降手順であるので, ので, W 統計量は 2 . 1 8 9 9 0で,これは W Z C ( 1 . 7 3 8 9 9 )より大きいので ( W P = 0 . 0 1 6 6 ステージ 4から検定する. z ̲ W I L Lでは有意であったステージに 6 ),第 4群の母平均は有意に対照群より高いといえる.マクロ S T A Rに・牢・を表記する.ステージ 4が有意だったので,次にステージ 3の検定を行う.今度 は,変数 S (1 .0 9 1 7 9 )がW Z C (1 .7 1 6 1 9 )を越えなし、 ( W P = 0 . 1 6 3 8 5 )ので有意とならない.第 3群の母平均は有 は , Z 意に対照群とは異ならない.ステージ 3で、有意にならないので,閉手順の原理に従えば,ステージ 2の検定は行われない.マクロ S ̲ W I L Lではすべてのステージの検定結果が出力されるが,前のステ ージが有志でない場合は,参考の結果である. Pが α未満だったとしても, 強調すべきは,ステージ 4で有意でなければ,仮にステージ 2や 3でW I L Lでは有意性を示す牢印表示はさ 高次のステージが有意でないため,有意とはならず,マクロ SW れない. I L Lの実行結果 マクロ SW T A G E C Q N T R O L G M E A N A D J M E A N Z W P W Z C S T A R O B S S 4 . 2 9 1 7 1 4 . 2 9 1 7 1 .2 4 3 4 7 0 . 1 0 6 8 5 1 2 1 0 . 7 0 8 3 2 1 . 6 4 4 8 5 3 1 5 . 3 7 5 0 3 1 8 . 9 5 8 3 2 0 . 0 6 2 5 1 .0 9 1 7 9 0 . 1 6 3 8 5 1 .7 1 6 1 9 2 0 . 8 7 5 0 2 . 1 8 9 9 0 0 . 0 1 6 6 6 1 . 7 3 8 9 9 本 3 4 1 8 . 3 7 5 0 4 3 0 . 8 7 5 0 3 終わりに S t e e l,S t e e l ‑ D w a s s,S h i r e y ‑ W i l l i a 皿s 検定の 3障類のマクロを作成した.これらの手法の原理, M,プログラムの仕様を珂解した上で,このプログラムを S A S ユーザー全体の財産として, : i l i i i J l J 場1 自由に使っていただきたいと思う.ただし著者が想定している状況以外で,使用される吋能性もあ るので,このプログラムおよびその出力の解釈は,各ユーザーの責任において行ってほしい.また, ;::::;;暗号謬得許丘警努事寄託話出品諜出E i である. E X S A Sのパージョン 5では, S t e e1 ,Stee トDwass , ~Shirey-Wil1ia皿S の 3 手法が新たに利用 可能になったが,これらは木マクロに基づいたものである. 参考文献 S A SI n s t i t u t eI n c ( 1 9 9 2 a ) .S A S / S T A TU s e r ' sG u i d eV e r s i o n6F o u r t hE d i t i o nV o l u m e1 . S A SI n s t i t u t eI n c . C h a n g e sa n dE n h a n c e m e n t, S A SI n s t i t u t eI n c ( 1 9 9 2 b ) .S A ST e c h n i c a lR e p o r tP ‑ 2 2 9, R e l e a s e6 . 0 7 . S A SI n s t i t u t eI n c . 浜田知久馬・吉田道弘 ( 1 9 9 2 ) .M U L T T E S Tプロシジヤの紹介. S U G I ‑ J '9 2論文集, 3 5 7 ‑ 3 7 0 岸本淳司(19 9 2 ).標本再抽出に基づいて多重性調整 p値を求めるプロシジャ町L T T E S T . 計算機統計学, 1 5 7 ‑ 1 6 0 吉田道弘・浜田知久馬(19 9 2 ) .P R O B M C関数による多重比較法. S U G I ‑ J ' 9 2論文集, 3 7ト 3 8 8 永田端・吉田道弘 ( 1 9 9 7 ) . 統計的多重比較法の基礎.サイエンテイスト社 浜田知久馬・岸本淳司(19 9 5 ) . SASによるノンパラメトリック多重比較.計算機統計学, 8 ‑ 1, 7 7 ‑ 8 3 ‑ 3 9 0

376.

日本 S A Sユーザー会 (SUG I‑J) 臨 床 疫 学 教 育 に お け る SASの 役 割 軒、俊彦、清水英佑、田嶋尚子、裏田和夫、景山茂、鈴木院之、鈴木直樹、須藤正 道、川村昇、和田高士、松島雅人、尾立裕三、小松一祐(東京慈恵会医科大学〉 T h eR o l e so fSASi nE d u c a t i o no fC l i n i c a lE p i d e m i o l o g y . A g a t aT,S h i m i z uH,T a j i m aN,U r a t a, K KageyamaS,S u z u k iH,S u z u k iN,SudohM, Ka wamuraN,WadaT,MatsushimaM,O d a t eY a n dKomatuK TheJ ik e iU n i v e r s i t yS c h o o lo fM e d i c i n e . 要 旨 東 京 慈 恵 会 医 科 大 学 で は 19 9 8年 よ り 、 臨 床 疫 学 教 育 の コ ー ス を 2, 3, 4年 生 を 対 象 に 実 施 し て い る 。 特 に 2年生ではすべての授業時間, 3年 生 で は ほ ぼ 半 分 の 授 業 時 間 を 生 物 統 計 学 教 育 と SASの演習に費やしており、 4年 生 で も 、 文 献 の 批 判 的 吟 味 を 行 う 際 に は 、 計 算 に SAS の 使 え る 環 境 を 提 供 し て い る 。 今 回 は 教 育 プ ロ グ ラ ム の 提 示 と 共に、学生の授業前後の反応について報告する。 a s e d m e d i c i n e )の 遂 行 に 必 要 な 基 本 医 こ の 教 育 の 一 般 目 標 は 根 拠 に 基 づ く 医 療 (Evidence・b 学 統 計 学 の 知 識 を 深 め る 。 統 計 パ ッ ケ ー ジ SAS、 医 療 情 報 学 、 医 学 に お け る イ ン タ ー ネ ッ ト 活 用 を 理 解 す る 。 根 拠 に 基 づ く 医 療 (Evid四 回 目 b a s e d m e d i c i n e )の 考 え 方 と プ ロ セ ス と そ の 実践に必要な臨床疫学の基本概念と疫学的手法を用いた研究計画の立て方と解析法を理解 す る で あ る 。 学 生 の 反 応 に つ い て は 統 計 ノ fッケージ SAS が 充 分 使 用 で き る よ う に な っ た :授業前: 2% → 授 業 後 : 2 1%へと増加した。 キーワード: EBM (Evidence‑BasedMedicin巴 〉 、 SAS、 医 学 統 計 学 、 疫 学 的 手 法 【はじめに】 Evidence‑Based Medicine (E BM) は 、 直 感 ゃ あ や ふ や な 経 験 に 頼 ら ず 、 科 学 的なエヴィデンス(根拠)に基づいて、最適な診断、治療を実践するための方法論として 1 9 9 3年 カ ナ ダ の マ ク マ ス タ ー 大 学 E v i d e n c e ‑ B a s e dM e d i c i n e Working Groupの 活 動 に 始 ま り 発 展 し て き た 。 日 本 で も 1996年 に 内 科 学 会 で 黒 川 会 頭 が 講 演 に 用 い 俄 然 注 目 を 浴 び る よ う になった。 EBMと は 学 問 研 究 に 重 点 を 置 い た 臨 床 疫 学 を 個 々 の 患 者 の 臨 床 場 面 で の 問 題 を 解 決 す る 手 法 と し て 再 構 成 し た 概 念 と 考 え ら れ る 。 日 本 医 学 教 育 学 会 で も 、 EBMの仮 想 教 育 7。同会うムが公表され、自治医大、産業医大、慈恵医大などでは E B M教 育 が 始 ま っ て い る 。 慈 恵 医 大 で も 1年 間 の コ ン ビ ュ ー タ ー リ テ ラ シ 一 教 育 と 、 3年 間 の 臨 床 疫 学 教 育 7 "口 7 "5 ムが公表・実施されている。今回はこのプログラムの概要を紹介すると共に、その 中での SASの 役 割 に つ い て 検 討 し た の で 報 告 す る 。 【教育プログラムの提示】臨床疫学のコ ス は 各 学 年 で 以 下 の よ う な 一 般 目 標 、 行 動 目 標 を持ち、授業実習内容は表に示すとうりである。 (2年 生 〉 ユ ニ ッ ト 名 : 医 学 統 計 学 I演 習 コ ス名:臨床疫学 I 一 般 目 標 (G10) EBM( E v i d e n c e ‑ b a s e dm e d i c i n巴〉の遂行に必要な基本医学統計学 SASの知識を深める。 行 動 目 標 (SB0) 1. 基 本 医 学 統 計 学 の 理 解 と 実 践 関 連 6項目 3 9 1

377.

(3年 生 ) ユ ニ ッ ト 名 : 医 学 統 計 学 日 演 習 コ ス名:臨床疫学 H 一 般 目 標 (G 10) 1. EBM(Evidence‑based medicine)の 実 践 た め 基 本 医 学 統 計 学 SASの知識を更に深める。 2. 高 度 に 進 歩 し た 情 報 化 社 会 に あ っ て 、 医 療 情 報 学 を 理 解 す る 。 3. 医 学 に お け る イ ン タ ー ネ ッ ト の 位 置 づ け と 有 用 性 を 理 解 す る 。 行 動 目 標 (SB0) 1の 関 連 7項目、 2の関連 9項目、 3の 関 連 3項目 (4年 生 ) ユ ニ ッ ト 名 EBM(Evidence‑BasedMedicine) コース名:臨床疫学皿 一 般 目 標 (G 10) 1. EBM( E v i d e n c e ‑ b a s e dm e d i c i n e )の考え方とプロセスを理解する。 2. EBM(Evidence‑BasedM e d i c i n e )の 実 践 に 必 要 な 臨 床 疫 学 の 基 本 概 念 を 理 解 す る 。 3. 将 来 科 学 的 な 臨 床 研 究 が 行 え る よ う 、 疫 学 的 手 法 、 研 究 計 画 立 案 、 解 析 法 を 理 解 す る 。 行 動 目 標 (SB0) lの 関 連 5項目、 2の 関 連 7項目、 3の 関 連 4項目 表l. 2年:ユニット名:医学統計学 I演習 月日 曜 時間 肩書 講義内容 所属 内科学第 3 臨床疫学の概念 1 6月 1 4日 月 9 : 0 0~ 9 : 2 0 教授 ー ー ー ー ・ ・ ー ー . . . . . . . . . . .ー ー ー . . . ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ・ ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ・ ・ ー ー ー ・ ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ・ ー ー B‑標本分布(正規から超幾何まで〉 9 : 2 0~ 1 2 : 1 0 助教授 数学 ー ー ・ ・ ・ ・ ・ 骨 ‑ ‑ ‑ ー ー ー ー ー ー ー ー ー ー ー ー ・ ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー 圃 ー ー ー ‑ ‑ ‑ ‑ ‑ 圃 ー ー ー ー ー ̲ . ・ ー ー ‑ ‑ ‑ ‑ ‑ ・ ・ ー ー ー ・ ・ ー ー ー ー ー ー ー ー ー ) 助教授 環 境 保 健 医 学 A ‑標本分布・記述統計 (SAS1 内科学第 3 助手 A ‑標本分布(正規から超幾何まで〉 : 0 0~ 1 2 : 1 0 助教授 数学 6月 2 1日 月 9 ー ー ー ー ー ー ー ー ・ ー ー ・ ・ ー ー ー 骨 骨 " ・ ー ー 骨 骨 骨 ・ ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ‑ ・ ・ ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー 助教授 環境保健医学 B‑標本分布・記述統計 (SASl) 内科学第 3 助手 6月 2 8日 月 9 : 0 0~ 1 2 : 1 0 講 師 一生・宇宙医学 B 検定 1 (基礎知識、推定、検定概論) 助教授 環境保健医学 ‑ ・ ・ ー ー ・ ・ ・ ・ " ー ー ー ー ー ー ー ー ー ー ・ ‑ ‑ ‑ ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー 助教授 環 境 保 健 医 学 A ‑検定 1 (SAS2) 講 師 二生・宇宙医学 助 手 内科学第 3 7月 5日 月 9 : 0 0~ 1 2 : 1 0 講 師 一生・宇宙医学 A‑検定 1 (基礎知識、推定、検定概論) 助教授 環境保健医学 ー ー ー ー ー ー ー ー ー ー ー ‑ ‑ ー ー ー ー ー ・ ー ー ー ー ー ー ー ー ー ー ー ー ・ ー ー ー ー ー ー ー ・ ・ ー ー ー ー 岨 ー ー ・ ー ー ー ー ー ー ・ 世 幽 ・ ・ ー ー ・ ー ー ー ・ ー ー ・・ ・ 助教授 環 境 保 健 医 学 B‑検定 1 (SAS2) 講 師 二生・宇宙医学 助 手 内科学第 3 4 7月 1 2日 月 9 : 0 0~ 1 2 : 1 0 講 師 一生・宇宙医学 B 検定 2 (度数・比率・平均値・代表値〉 助教授 環境保健医学 ー ー ー ー ー ー ー ー ー ー ー ー ー ー ・ 骨 ー ・ ー ー ー ー ー ー ・ ・ ー ー ー 帽 ・ ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー 助教授 環 境 保 健 医 学 A ‑検定 2 (SAS3) 講 師 二生・宇宙医学 助 手 内科学第 3 7月 1 9日 月 9 : 0 0~ 1 2 : 1 0 講 師 二生・宇宙医学 A‑検定 2 (度数・比率・平均値・代表値) 助教授 環境保健医学 ー ー ー ー ー ー ー ー ー ー ‑ ー ー ー ー ー ー ・ ・ ・ ‑ ‑ ‑ ‑ ‑ ‑ ‑ー 咽 ・ ー ー ・ ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ・ ー ー ・ ー ー ー ー ー 助教授 環 境 保 健 医 学 B‑検定 2 (SAS3) 講 師 二生・宇宙医学 助 手 内科学第 3 9月 6日 月 9 : 0 0~ 1 2 : 1 0 教授 内科学第 3 ‑ 3 9 2一 総括的評価

378.
[beta]
2
. 3:ユニット名:医学統計学 E演習
曜
月日
時間
肩書
41
5日 本 1
3
:
0
0~ 1
4
:
3
0 教授

講義内容
臨床疫争の概念 2

所属

環
内
科
物
境
学
治
保
薩
第
療
医
学
3苧
ー
ー
・
・
ー
ー
ー
ー
ー
ー
ー
ー
‑
‑
‑
‑
ー
ー
ー
‑
・
,助
助
教
教
授 薬
雇医苧学統研計究学そ百の議必要許性
め
重
要
珪
ー
ー
ー
ー
ー
ー
ー
ー
ー
ー
ー
噂
ー
ー
ー

1
4
:
4
0~ 1
6
:
1
0
422日 木 1
3
:
0
0~ 1
6
:
1
0
56日

木 1
3
:
0
0~ 1
6
:
1
0

l

s
‑

健
噴
康
ー
医
保
学
提
セ
‑
医
ン
タ
ー亨 1
B
5
7二ー長相ー定関吉と回ーーー帰ーでに お
i
¥
‑
け
s
‑
‑
,
,
f
る
検
y
‑
定
‑
高
講
差
主
要
師ー環
助手

健
菅
康
医
原
学
薩
セ
医
ン
ト芋 B
A
‑二
‑
ー
相
長
定
関
‑
と
3
‑
‑
回
‑
ー
帰
・
て
に
s
‑
お
i
¥
‑
け
S
‑
‑
4
る
了
検
ー
定
ー
ー
・
ー
ー
ー
ー
ー
ー
ー
句
ー
ー
ー
ー
扇講‑薮師
喪 環
助手

3日 木 1
51
3
:
0
0

内科学第 3

1
6
:
1
0

内科学第 3
一生・宇宙医学 B 対応多標本の検定

扇
講
助
ー
教
薮
師
授
喪 環
環
環
境
漂
保
健
薩
医
医
苧
学ー
.

x二ー多変重解肝 T
s
‑
‑
x
‑
S
‑
‑
s
T
‑
‑
‑
‑
二生・宇宙医学
内科学第 3
520日 木 1
一生・宇宙医学 A ‑対応多標本の検定
3
:
0
0 1
6
:
1
0
助講教授
師 環境保健医学
8
‑二ー多変董解析ー (
s
‑
A
‑
‑
S
‑
‑
sTー"ーーーーーー"
東薩医苧ーー ‑
E
五ー薮喪 環 瑳1
講 師 二生・宇宙医学
助 手 内科学第 31
527日 │
6
:
1
0 教授
B‑GHN巴t,インターわト入門、応用
3
:
0
0 1
環
内
科
境
学
保
第
健
医
3学
助教授
医学情情報報E
U
P
扇講翠師
ー
喪ー
医苧
巧:一 x二ーデじをシデ二ージ 3ン
‑
主 任 医学情報セけー
63日 木 1
3
:
0
0~ 1
6
:
1
0 教 授 内科学第 3
A‑GHN巴1.インタわト入門、応用
助教授 環境保健医学
医学情報報五セi
9
‑
扇講教師
ー
喪ー
医苧清
'
i
f一 ‑
8
‑二ーデじをシデニヲ 3 /
主 任 医学情報‑
ri
9
‑
6月 1
0日 木 1
3
:
0
0~ 1
6
:
1
0
医
有
学
情
苧
報
濡
セ
ー
ンE
ー
‑
タ‑
‑
‑1
薮
助
教
ー
ー
"
授
度
ー 丙
B
7ご‑情踊京報麗検索
苧研究ーど~{;下f/Tï-ーーーーーーーーーー.
助教授 環境保健医学
講 師 医学情報セント
助 手 内科学第 3
6月 1
7日 │
3
:
0
0~ 1
6
:
1
0 助教授 丙
木 1
i
9
ー
‑
ー 官
判
学
苧
'
育
報
ー
第
セ
ー
百
薮ーーー度ー 医
Aご
情
鴎Z
報震度検苧
索研究ーと 1
‑
;下i
完了ーーーー
助教授 環境保健医学
講 師 医学情報セン小
624日 │
3
:
0
0 1
6
:
1
0 薮
木 1
助
ー
教
ー
ー
要
授ー丙
研
‑
ー
ー
ー l
局
利
次
元
苧
画
ー
第
像E
B
Z
Jご医酷涼用夜画像芋情萌ー究報ー処ど17
P
l
コ
f
/
T
i
‑司
ー
ー
ー
ー
ー
ー
ー
講師
助手

助教授
講師
助手

環境保健医学
医学情報セント
内科学第 3

71日 │
3
:
0
0~ 1
6
:
1
0 薮
木 1
助
ー
教
一
授
度
目 丙
局
有
次
元
ー
学
画
.
第
像
ー3
研
‑
ー
ー
ー 百
A四
ご
‑
医
酷
深
用
度
画
像
李
情
前
ー
究
報
ー
処
ど1
理
‑
y
p
l
=
i
v
‑
F
3
‑ー
ー
"
ー
ー
ー
ー
ー
ー
ー
ー
助教授
講師
助手
7月 8日 木 13:00~ 16:10 助教授
7月 15日 i
3
:
0
0~ 1
6
:
1
0 助教授
木 1
7月 22日 │
3
:
0
0~ 1
6
:
1
0 教授
木 1
助教授
講師
3
:
0
0~ 1
6
:
1
0 教授
1
0月 28日 │
ヌ
ド 1

環境保健医学
医学情報センタ
内科学第 3
局次元画像研 医用画像情報処理 2
医学情報 r
‑i
9
‑ 本学情報シスァムの現状と将来
レポート作成
内
科
境
学
保第 3
環
健医学
医学情報センター
内科学第 3
総括的評価
3
9
3

379.

表3 . 4年 : ユ ニ ッ ト 名 : EBMCEvidence‑BasedMedicine) 月日 肩書 1 6 : 1 0 教授 助手 所属 内科学第 3 講義内容 EBM総 論 バイアスと交絡、 予後のシナリオと文献配布 木 1 3 : 0 0~ 1 6 : 1 0 助手 内科学第 3 A‑リスクと予後 予後の文献の批判的吟味 診断のシナリオと文献配布 曜 時間 1 1月 2 5日 木 1 4 : 4 0 12月 2 日 i jJ薮要‑ー医苧官報毛~-f 一 正芳[牟百官報検素司ー‑ インターネット情報検索 12月 8日 7 J く1 3 : 0 0~ 1 6 : 1 0 助手 内科学第 3 A‑ 診断の文献の批判的吟味 ‑ー ‑ B 助 手 .丙芋}苧第 3 ‑リスクと予後 予後の文献の批判的吟味 診断のシナリオと文献配布 12月 1 5日 7 3 : 0 0~ 1 6 : 1 0 助手 . 1 <1 総合内科 助 手 ー内科苧嘉吉ーー・ A‑正常値、検査の精度 診断の文献の批判的吟味 治療のシナリオと文献配布 話:諺断‑ o j支献め百王朝商問:保ーーーーーーーーーーーーーー・・ 内科学第 3 A‑治療の文献の批判的吟味 : 議 否 丙 秤 ー ー ー ー ー ー ー B‑正常値、検査の精度 助手 診断の文献の批判的吟味 治療のシナリオと文献配布 3 : 0 0~ 1 6 : 1 0 助手 1 2月 22日 7 . 1 <1 1月 12日 7 J く1 3 : 0 0~ 1 6 : 1 0 助 教 授 │薬物治療学 A‑臨療床試の験 文 治 献の批判的吟味 百 五 ー ー ー 芋 ー 丙科苧第三‑‑‑ 正?百操:あ支献めー批判前時保ーーーーーーー・ 1月 20日 │ 3 : 0 0~ 1 6 : 1 0 │助教授 木 1 医学情報センター A‑ 効 イ 率 ン タ 的 情 ー 報 ネ検 索 ッ卜情報検索 助 教 授 業鴨志蚕芋ーーーー 話:臨尿~議ーー--治療の文献の批判的吟味 1月 27日 l 3 : 0 0~ 1 6 : 1 0 教授 木 1 内科学第 3 総括的評価 【SAS の 役 割 と 学 生 の 反 応 】 EBM 実 践 に は 統 計 学 的 素 養 が 不 可 欠 で あ る が 、 実 際 の 統 計 値 の 算 出 に 関 し て は 世 界 的 に 見 て も SAS の 評 価 が 最 も 高 く 、 費 用 は や や 高 額 で あ る が 、 導 入 し SAS 教 育 を 実 践 す る こ と と し た 。 学 生 の 授 業 前 後 の 反 応 は 統 計 ノ fッ ケ ー ジ SASが 使 え る は 授 業 前 : 2% → 授 業 後 : 2 1% と 増 加 し た 。 具 体 的 に は t検 定 が で き る よ う に な っ た : 授 業 前 : 5 %→ 授 業 後 : 3 1%へと、 F検 定 が で き る よ う に な っ た : 授 業 前 : 4 % → 授 業 後 : 2 5 %へと、 X 2検 定 が で き る よ う に な っ た : 授 業 前 : 5 %→ 授 業 後 : 2 7 % へ と 、 分 散 分 析 が で き る よ う に な っ た : 授 業 前 : 2% → 授 業 後 : 14% へ と 増 加 し た 。 い ず れ も 出 来 る よ う に な っ た が 、 5‑ 10倍 増 加 し て い る が 、 半 数 以 上 の も の が 充 分 使 い こ なせないと言っており、短期間での習得は難しいと考えられる。 【まとめ】 SAS の 役 割 は EBM・ 臨 床 疫 学 を 推 進 す る 上 で は 重 要 で あ る が 、 短 期 間 で の 習 得は困難であり、学部学生への教育は、あくまでも動機付けと考え、大学院、医局単位で の教育も重要であろう。また、教育の方法論もより改善して行く必要があろう。 【文献】 1)鯨俊彦編. E BM : 臨 床 医 学 研 究 の 方 法 論 . 東 京 : 中 外 医 学 社 . 1 9 9 8 . 2) 牒俊彦編, 基 本 医 学 統 計 学 ・ E B M、 医 学 研 究 へ の 応 用 , 中 外 医 学 杜 , 1 9 9 9 . EBMの た め の 新 GCPと 臨 床 研 究 , 中 外 医 学 社 , 1 9 9 9 . 3) 鯨俊彦編, 3 9 1一

380.

日本 S A Sユーザー会 (SUG I‑J) JMPとSASによる生物検定法 高橋行雄 日本ロシュ株式会社 医薬開発本部 B i o l o g i c a lAssayu s i n gJMPandSAS YukioTakahashi PharmaDevelopmentNipponRocheK . K . 要旨 生物検定法は、線形モデルによる解析に基盤とし、逆推定、および、その信頼区間 を算出することを特徴とする応用統計学の一つの分野として発展した。最近では、標 準薬と試験薬の逆推定値を利用した効力比を求めることが少なくなったのであろうか、 応用事例に遭遇することがほとんどなくなった。その反面、多くの薬理試験で、有意 差検定が多用され、その中には明らかな誤用も散見するようになった。それらを正す ためには、実験データを統計モデ、ルで、示した上で解析のストラテジーを示すことが有 益で、本質的に統計モテ、ノレに基盤を置く生物検定法の再導入が薬理関係者に適してい ると考えた。逆推定の機能、結果のグラフ表示などに優れている。九在P は、生物検定 法入門のための統計パッケージとして最適であり、典型的な生物検定法の課題に対し て解析事例を示した。なお、 PROCMIEXDによる結果も併記した。 キーワード:SAS/JMP、生物検定法、逆推定、 PROCMIXED、 PROCPROBIT、混合モデノレ 1 .はじめに H u b e r tら ( 1 9 8 8 )は 、 「生物検定法 ( B i o l o g i c a IA s s a y ) は、生物を用いて未知の化合物の生物 活性を、既知の化合物の生物活性に対して相対的に比較するために体系化された応用統計学の一 つの分野として位置づけられてきた」と述べている。最も代表的な生物検定法の課題は、間接法 による小動物の 50 パーセント致死量の推定、いわゆるプロピット法である。これは、三値反応 に対する 回帰分析"を行い、さらに Y の X に対する逆推定、および、その 9 5 パーセント信 頼区間を求めるといった他の応用統計の分野では、まれな課題を中心的に取り扱っていた。さら に 、 50パーセント致死量の応用として、未知化合物の薬理活性を、既知の化合物の薬理活性と比 較した相対力価、および、その 95%信頼区間の計算法も定式化されてきた。ただし、これらの方 ‑395‑

381.

法を適用するためには、クリアーな直線的な用量反応が出ることを前提としている。それがため に、自らの応用範囲を狭めてしまったといえる。 最近の薬理試験における統計的手法の利用は、反応に対して実験誤差が相対的に大きくなって いることも一因であろうか、明らかな直線的な反応が前提となる古典的な生物検定法よりも、既 知の化合物のある用量の反応と、未知化合物のいくつかの用量における反応を直接比較すること が増え、多重比較などの有意差検定が多用されるようになってきた。 従来の生物検定法が主に前提としていた i nv i v oでの実験は、実験計画法でいう l元あるいは 2 元配置繰し返しありの完全ランダム実験と見なして差し支えない実験であった。しかし、最近 i n v i t r oの実験は、実験方法、あるいは装置の改良などにより実験が短時間で行えるようになったの であろうか、複数の実験誤差が生じる分割実験が行われるようになってきた。しかしながら、こ のことに気づかずに、完全ランダム実験としての解析を行い、生物的には差があると結論しなが ら、統計的には差がないとの矛盾する結論を見聞きするようになった。このような場合に、実験 手順を考慮、した分割実験モデルを前提とした解析を行うことにより、統計的にも明らかな差があ ると結論され、生物学的な判断と一致することも、しばしば経験する。 i t ) 、非平行性 (Lacko fP a r a l l e ‑ 生物検定法で導入された、直線の当てはまりの欠如 (LackofF l i s m ) は、ややもすると他の応用統計の分野では軽視されがちな問題であるが、用量反応関係を 論ずるために欠かせないキーワードであり、分割実験モデルを適用した場合でも考慮、しなければ MPおよび SASによる解析例を示す。 ならない大切な問題である。これらの点に注意しつつ J 2 . 生物検定法の典型例 表 lに生物検定法の古典 F i n n e y( 19 7 1 ) に号 l 用された Grewalの実験データを示す。この実験は、 標準薬 Mo中 h i n eを対象として、 3種類の鎮痛薬の投与後に、マウスの尾への電気ショック反応を e t h i d i n eは 5用量、他は 3用量に対して l薬剤あたり約 300匹のマウスが 観察したものである。 P 用いられている。 ASでは、 PROCPROBITで対応で 文献では、プロピット法による解析事例が示されている。 S きるが、逆推定を取り扱えるのは l群の場合に限定されているので、この例のように多群の場合 Pでは、非線形の問題として扱えないこともないが、逆推定には対応してい は適用できない。品1 ない。 歴史的には、反応の出現率を変換する方式は、プロビット変換よりむしろロジット変換による 方式が応用統計の分野で発展してきた。これは、ロジスティック回帰分析といわれており、 S AS では、 PROCL O G I S T I C、PROCCATMODが代表的なプロシジャである。 JMPでは、 2値でも計 ‑ 3 9 6

382.

量値でも、 F i t Y by X" 、 F i t Model" により GUI (グラフイカノレ・ユーザ・インターフェイ ス)に統合され、反応変数の性質により解析方法が自動的に選択されるようになっている。加え て、生物検定法で常用される逆推定、および、その 95%信頼区間の計算は、 SAS では標準的に n v e r s eP r e d i c t i o n の問題として対応している。それゆえ、生物検 は求められないが、 JMP では、 I 定法のための統計ノ fッケージとして JMPが適しているといえる。 表1.マウスの電気刺激反応による Morphineに対する 3種の鎮痛剤の反応 p r o b i t # Log(Dose) n r p 0 . 1 8 1 0 3 1 9 0 . 1 8 4 . 1 0 Dl: M o r p h i n e 48 1 2 0 5 3 0. 44 0. 4 . 8 5 0 . 7 8 1 2 3 8 3 45 0 . 6 7 5. 1 4 D2:Amidone 0 . 1 8 60 0 . 2 3 4 . 2 7 0. 48 1 1 0 5 4 49 4 . 9 8 0. 0 . 7 8 1 0 0 8 1 0 . 8 1 5 . 8 8 Phenadoxone ‑ 0 . 1 2 3 1 D3・ 90 0 . 3 4 4 . 6 0 0 . 1 8 5 4 45 8 0 0 . 6 7 5. 48 90 80 0 . 8 8 0. 6 . 2 2 0 . 7 0 1 3 D 4 : P e t h i d i n e 60 0 . 2 1 4 . 2 2 0 . 8 8 27 0 . 3 1 4 . 5 3 8 5 1 .00 60 32 5 . 0 8 0 . 5 3 1 .1 8 5 5 90 0 . 6 1 5 . 2 8 44 1 . 30 60 0 . 7 3 5 . 6 2 Drug #:p r o b i t= 5+n o r m a l q u a t i l e ( p ), 料 :l o g i t= I n ( p /( 1‑ p ) ) . l o g i t # # ‑ 1 .48 ‑ 0 . 2 3 0 . 7 2 ‑ 1 .1 8 0 . 0 3 1 .4 5 ‑ 0 . 6 4 0 . 7 3 2 . 0 7 ‑ 1 .28 ‑ 0 . 7 6 0 . 1 3 45 0. 1 .0 1 明 19 7 1 ) F i n n e y( F i n n e y がプロピット法により求めた相対力価を、表 2 に示す。ロジット法による場合でも ED50 の推定値は、ほとんど一致することが知られている。つぎに、乃t l P による追試の過程およ び結果を示そう。 表 2 Finneyによる相対力価の推定値 Drug Dl:Morphine D2:Amidone D3:Phenadoxone D 4 : P e t h i d i n e 図 lは 、 JMPの ED50の効力比 95%信頼区間 1 . 2 4 8 3 . 5 5 4 0 . 3 3 3 1 .535, 1 .024 43 1, 2 . 8 9 4 4. 40 1, 0 . 2 7 7 0. F i tY byX" によって、作図したものであり、 l o g it =O が 50%有効量、いわゆ る ED50であり、図の左の D3:Phenadoxoneが少ない用量で他剤と同じ効果を示しており力価が高 い薬剤であることが確認される。 3 9 7

383.

B i v a r i a t el o g i tByLogX r ‑ ‑ ‑ ‑ ‑ 3 . 0 / 2 . 0 1 . 0 I " 5 , ; 0 ! 0 ‑ 1 . 0 ‑ 2 . 0 J 1 ' ) o i ) 1 1I . 5 LogX 図 l 品 1P4β4による l o g i tについての 4種の鎮痛薬の効果 口:P h e n a d o x o n e、0:Amidone、+:M o r p h i n e、 x:P e t h i d i n e JMPパージョン 3でも同様な結果が得られる 解析は、次のような手順で行う。 1 ) それぞれの薬剤に回帰直線を当てはめて良し、かを、当てはまりの欠知で評価する 2 ) それぞれの回帰直線が平行かを、非平行性で評価する 3 ) 4種の薬剤の 50%有効量、図 lのグラフで l o g i t= 0 の場合の用量を逆推定する 4 ) 標準薬とした Morphineとの差および 95%信頼区間を求める 5 ) 標準薬に対する効力比を求める 図 lを見たときに、 Morphineのイ噴きが他の 3剤に比べて少し寝ているようである。統計的に問題 とすべきなのか否かの予備検定が必要である。私自身、 JMP での解析は経験が浅いので、その結 果の妥当性に不安がある。そこで、先に PROCCATMODでの解析を行い、次に JMPの結果を示 すことにする。 生物検定法でいう、平行性の欠如は、一般の線形モデ、/レでは、薬剤群と用量の交E作用に一致 する。交五作用は、各薬剤群に平行な直線を当てはめた場合と、各群それぞれに直線を当てはめ たときの場合の尤度比であり、これにより平行線の当てはめの妥当性を評価できる。 SASプログラム 1 . PROCMIXED 交五作用モデル PROC catmod data=D01 ; direct LogX; mode1 Y 10 = Drug LogX Drug*LogX ; weight Freq; run ; ‑398‑

384.

出力 lから、投与量と薬剤の交互作用は、 P=0.643 であり、異なる直線の当てはめは妥当ではな いことが統計的に示される。 当てはまりの欠如(残差項)は、各薬剤群ごとに直線以外の成分、 いいかえると、 2 次以上の曲線の当てはめが示唆されるのかの指標であるが、 自由度 6 に対して カイ 2乗値が 2.54なので、 その可能性は全くなく、直線が当てはまっていると見なして差し支え ないことが示されている。 出力 1 . PROCCATMODによる交互作用 M A X I M U M ‑ L I K E L I H O O DA N A L Y S I S ‑ O F ‑ V A R I A N C ET A B L E D F Chi‑Square Source 4lqd4lqdRU I N T E R C E P T D R U G L O G X L O G X * D R U G L I K E L I H O O DR A T I O P r o b 1 0 8 . 8 3 7 6 .3 6 1 8 4 . 4 6 1 . 7 1 2 .5 4 O .0 000 O .0 000 O .0 000 0 . 6 3 4 3一一〉平行性の欠如 0.8644 ‑‑‑>当てはまりの欠如(残差) SASブ。ログラムの modelステートメントから交互作用 Drug日 ogX を除いたモデルが、 主効果モ デノレ(平行線の当てはめ) となり、出力 2に結果を示す。 出力 2. PROCCATMODによる平行線の当てはめ A N A L Y S I SO FM A X I M U M ‑ L I K E L I H O O DE S T I M A T E S E f f e c t P a r a m e t e r E s t i m a t e 4lnJιqd 凋斗 I N T E R C E P T D R U G p h υ L O G X S t a n d a r d E r r o r ‑2.1103 ‑0.1750 0.2170 2 . 0 6 8 5 4 . 0 6 1 6 0.1742 0.1150 0 . 1 0 6 6 O .1 7 6 6 O .2 9 7 3 C h i一 S q u a r e P r o b 1 4 6 . 7 5 O .0 000 3 .5 6 0.0592 2 .7 0 0.1005 .0 000 1 4 2 . 8 2 O .0 000 1 8 6 . 6 8 O PROC CATMOD のデザイン行列は、対比型なので、それぞれの薬剤のロジスティック回帰直 線は、次のように計算できる。 表3 . 4種の鎮痛薬のロジスティック回帰係数 切片 DIボ1 0 r p h i n e ‑2.1103 D2:Amidon巳 2 . 1 1 0 3 D3Ph巳nadoxon巳 ‑2.1103 D 4 : P e t h i d i n e 傾き 0.1750 =‑2.2853 4.0616 =‑ 1 .8933 4.0616 +2.0685 =‑0.0418 4.0616 2 . 1 1 0 3‑(‑0.1750+0.2170+2.0685) =‑4.2208 4.0616 +0.2170 PROC LOGISTIC でも、 4 種の薬剤の対して適当なダミー変数を作ることにより同様のロジステ 399

385.
[beta]
イツク回帰が行える。しかしながら、 l
o
g
it
=O の場合横軸の投与量、 ED50 を求める逆推定の問題
は
、 PROC PROBIT以外のプロシジャでは含まれていない。また PROC PROBITでの逆推定は、
単回帰のみに限定されており、 2群以上の場合に、それぞれの群に対する逆推定は行えない。

JMPは
、 Macintoshの GUIによる統計ノ fッケージとして開発されて、次いで Windowsでも使え

るようになった。 JMP には、逆推定が標準機能として提供されているので、この機能を用いた結
:Morphine の ED50
果を示す。下の図は、 JMP のパージョン 4 のβ版を用いた結果である。 D1

.
)
は 0.5626(0.5046,0
.
6
2
2
2
) と計算されている。
(95%c
.l

油
,
.
. DOE 命
、
.
"
"
・
ー.pn T,∞Is

5le g
d
l
t T

6
'
x
.
l
J
.
毘

?
!
:
!
:
i
.
.
.
.
.

~nd町巨e!p

j 白口語函争晶玉亘[t,1 lll~
一石瓦 +i 石ZE玉7百高石間t of五in叩 '
̲
1
6 ゴ7

凶

bset

_",斗旦!~09.不 (Yん

忙 でolumns1
(
[3Drug

回 LoaX

ーロ国│
ニJ
I

‑NominalL
O
Q
i
s
t
i
cF
i
tf
o
rY 10

•

b主立~
.
.
. Paf<lmeterEstimafes

1!

.
40

01

831

712:A midone

11

4E
汁

812:A midone I

oi

1川

912:A midone

口一一竺!

Term

Estimate StdError Ch向 uare Prob>C 1

l
n
f
e陀 '
p
l
Drugj
1:Morphine]
DrugI2:A midone]
DrugI3:PhenadoxoneI
LogX

E璽量璽璽

• E
f
f
e
c
tWaldTests

I

‑2.1102248
‑0.1750301
0.21701614
2.0
茂M6400
4αヨ
147553

0.1741975
0
.
1四三支;SJ
0.1150312
0.1754643
0.2972634

ii」 1JFEkf一一一!

I
1一
一一一一̲j!ーヱ"‑‑.Jf
耳石二アー¥

じ立国己Z
f
:
:
:
:
j
t
!一」竺~\LO匹

i

Nest

i
j

I

ーヱ主主ヱJ

1

iE
OnL
B
u
t
t
o
r
aUp

72Z22二ヨ主亙~i1

重竺ヰ!C>;Jエウス河』ラーU.ftkhvI~川

l
i

1

;
:

原‑
l』 EZ122EJ
p
u
k
‑
‑

146.75
2.
7
0
356
138.97
186.67

町

Mod..1

f
f
l
"M町 田 出 向

Clickandenlervaluesf
o
rresponseProbabihty
CJ
ickandc
l
e
a
rtheQneX youwanl1
0p
r
e
d
i
c
t
R"n

!H,
!
p !

│閣 MIcro叫 四 回 ,.
.
1守 山

f;NUM

│

!~/園冨割愛国.,

図2
. JMPの F
i
tModel" によるロジスティック回帰
0は反応ありを 0、反応なしを l
、としている。 DRUGに対して対
解析用の変数 Y 1
比型のデザイン行列が生成され、パラメータの推定値は、 PROCCATMOD と同じに
なる。小数点 4 桁で一致しないのは計算精度の問題である。逆推定は、生成されて
、 Y としては
いるデザイン行列に即して指定する。ここでは、パラメータとしてし 0,0 を
出現率 0
.
5すなわち l
o
g
i
t
=
Oを与えている。
、 D1:Morphineである。標準薬 S と他の薬剤との差の推定値を求めてみ
この実験の標準薬 S は
よう。 JMPの逆推定では、現在のところ切片を 0 と置く機能がないために、計算上、若干の工夫
が必要である。薬剤番号に対応したダミー変数を図 3のように作り、切片なしのモデ、ノレで解き、
薬剤聞の差の推定を行う。

‑400一

386.
[beta]
PE

聞 出 直

t

~

ー 田 園 田 開 岡 田 園 田 回 開

日 陸 国t
i T
片岡

OOE d/l時四聖母h T
o
o
J
s 出町

Z櫓 w '
f
[
l
f
1d
o
.
.
.
.
. 出 p

白 D r;;ii;届§晶画Ia!
s ill~ つわ図引 f"!.h

選翠率一一…町

P f>+

iI4争FinneβT6.1̲T((p104) ゴi

・
・

l
"
.四 月 市 ・ 田 園 田 明 E E E 血S!Qa̲11F‑1町・ ・
E

E

・ ・E ・ ・E ・ ・E ・

̲̲1ロIxl

i
1

、~ M
odelSpec c
a
i
i
o
n

ー‑PickRoleVariables
:
‑
S
e
l
e
c
tColumns

国Orug

│
固 LogX
!
日 Y0
1

y

i
l
て10

Rem
旦

‑
一
一
一
‑
,
.
‑
"
.
:
苫
!

!
1
2
J
f

主旦」己三三三

!
回n
1 MRP

二E F
ァー

!
i己
記

I
!

回目:問 H

J

F
r
eロ

I
I
f
T
eロ

~……而ー蚕豆

Add
ゆ 4 PTH
MRP
Cross ーJ102‑馴 D

一一一一一~!D1

ー

Nesl

1103 PHN

ーでnア
ー
一
一てi
lLogX
η
a
c
r
o
s
~I!

叶.u

Degr
At
t
r
i
b
u
t
e
s
.
.
.
.
1
i

I

1

同!

FNoJ
n
t
e
r
c
e

…

二ζニ二二二二ご一F昨的幻 ngPe onali
批'
Y
一
一
一
一
「
て
.
‑
A
c
加
t
l
:
ω
o
n
一←一「

逗出i
川

目 間悶

N
一
m i
n

l

門

8
1
p

I¥

i
‑
‑
=
=
竺竺‑三」

Onl
Buu
onL
恥

皇竺21 通 I~7.Jll--7肌吋SιI~争 JMP ‑Finney3一
司
.
'
̲
‑II1M

甲 山

f
tW~d

IIII~町田代 011田川h 也笠

図3
. 九1
Pによる薬剤のダミー変数
01 MRPは
、 Morphineのとき l
、それ以外は 0、02 AMOは Amidoneのとき l
、そ
れ以外は 0、以下同じ。
C
o
n
s
t
r
u
c
tModelE正
f
e
c
t
s
" の 2番目に 01:
M
o
r
p
h
i
n
eが来るよ
うにして NoI
n
t
町 田p
t
" をオンにする。

図 4 に解析結果を示す。推定値

E
s
t
i
m
a
t
e
" にそれぞれの薬剤の切片が直接求められ、表 3 に

: Morphineと D2: Amidoneの
示したの切片の計算値の結果と一致していることが確認できる。 D1
.
0
9
6
5(
0
.
0
0
9
5,0
.
1
8
7
0
)、 D1
: Morphine と D3:
差、および、その 95% 信 頼 区 聞 は 、 常 用 対 数 で 0
Phenadoxoneの差、および、その 95% 信頼区聞は、常用対数で 0
.
5
5
2
4(
0.
4620,0
.
6
4
8
7
) が得られ

る
。
n
t
i
l
o
gを計算すればよい。
効力比にするためには、薬剤聞の投与量の差は対数となっているので a

0
0
.
5
5
2
4=
3
.
5
7となる。その 95%の信頼
表 4 に結果に示すように、 D1に対する D3の効力比は、 1
区間は、 (
2
.
9
0,4.
45
)となる c 。結果が完全に一致しないのは、プロピット法とロジット法による
変換の問題、あるいは計算誤差のどちらかであるが、この程度であれば、計算後の範囲なので、
ほぼ同じ結果として差し支えないと判断する。

4
0
1一

387.
[beta]
~回調-

Dh 岳 山 工a
b
l
e
s DOE 合、''Yn

島r
a
p
h T
,田1< '
.
!
β
e
r y
'
i
ef'l

~II"吋。"

ー亘己

!:ie~ロ

j白 O !;;i;凪畠品Itlei
!
;
jI
s
fe.Iつわ園令;杓 o P.
P+
'
n
υ
l
l③ F伽mnne哨ρ̲T6市 に
1̲T( 明
1
ω
問
口
勾
4)
こ
ゴJ
I
(
P
白

問

l掴珊鴨~・E・・E・・E・-・圃圃圃圃圃圃圃圃圃圃圃圃圃・・圃圃圃圃EてT吉T宝1

:
沼
滋
幽
怒
欄
鈴
糊
畿
翻
錘
鞘
職
誕

J
I
;伊 .
‑NominalLoq陪
1
s
引
出凶
山
i
l
批
l
cF
i
江
lf
f
,
orY 1
口

.
.
. ~Model S
p
e
c
i
f
i
c
a
t
i
o
n

矧肺刷 に

.
‑
‑
S
e
l
e
c
tColumns‑.r‑PickRo!eV
a
r
i
a
b
l
e
s一
一
一
一
一 一
「

~Ii目白 on 同針。円

際 「 ;!‑UR‑‑j土丘三」
固印刷

1
七二一ご三て?で?一!

¥ft/̲:̲1
.
・

.
.
. ParameterEstimales

̲:̲ごと斗三二二一一一;
I
,
f
r
e
q

F..q

o

Bv

1
1

一一‑1

一一ーム一一~

Add
I04 PT
r
i
‑ー一一一一一一一一一I 01 MRP

I

1

u

5

千
.

日1
4
6
1
王
宝5
4

0
.
2
9
7
2
6
3
4

16714
41
3
4.
日
百7
2
008
16
.
6
7

I

∞

0
.
5
0 m羽

s
e

許可川

L滋:ト

Help

x

:立孟並立瓦;蓋石

a
v

j

叩

「
ー
プ
←
セ

0
.
3
2
54
7
0
.
1
9
71
3
白 羽3
耳渇5

川 . "l
n
v
e
r
s
eP
r
e
d
i
c
t
i
o
n

HN

ι

.
(
]
0
4
1
7
5国
406147553

砂 E吊 c
lWaldTesls

i一」三:̲̲i
J03宅

一一一一一一一一一一一一

4回 3
2
(
沼7

Log
X

}一一三ros三̲̲j'02一 州D

i
:
4
号j
i
L

4
.
2
2
0
6
7
窃
2
.
2
8
5
2
5
4
9

04 PTH
0
1 MRP
02AMO
03 PHN

I

,ConstructModelEffects

@04 PT
r
i

s
t
i
m
a
t
eS
t
dE
r
r
o
rC
h
i
S
q
u
a
r
eP
r
o
b
>
C
h
i
S
q
Term E

I

.
.
.I
n
v
e
r
s
eP
r
e
d
i
c
t
l
o
n

,

0
.500(1工日3

│
XVaJues

Jγ& H簿 議 議 総 繰 .
ー 九 ‑ 〓 S事!!iI長罷Z¥起こ t液 E

一‑五三..議繋̲ 1
三

:川町

mmm

団0
3 PHN

1

'と止旦!:LJ
明田

日Y一
日1
!
日Y1
口
i
固f
問
ι回 0
1 MRP

│

ConvergedbyO
b
j
e
c
l
T
V
e
砂 川 山 Mod
凶丁目1

万騒い沼

ょl
「一「一罰百「ー
はノ函S 明 輩 出 品

M 9
(
B
4
4
z
44YO
:
l'xl.
1I

Onl臥.rtt
OrtUp

重竺立I
K
争JMP‑Fit.
吋.
1

l
!
;
F即 時 時 肋 d

I 圃 ~ioro副 Office :
"
1
‑
ト
!
Jd守 山

i

図4
. JMPによる逆推定値の差の推定、および、その 95%信頼区間
I
n
v
e
r
s
eP
r
e
d
i
c
t
i
o
n
"の X V
a
l
u
e
s
" の l番目は N0 I
n
t
e
r
c
e
p
t
"がオン、
C
o
n
s
t
r
u
c
t
:
M
o
r
p
h
i
n
eが対応す
ModelE
f
f
e
c
t
s
" の指定順なので D4PTHに対応し、 2番目には D1
る。従って、 XV
a
l
u
e
sの(011 0) は
、 D1
:
M
o
r
p
h
i
n
eと D2:Amidoneの差、(010
:
M
o
r
p
h
i
n
eと D3:
P
h
e
n
a
d
o
x
o
n
eの差の推定となる。
1)は、 D1

表4
. 効力比の推定

薬剤

l
o
g
X
:ED50(95%c
l
)

logX の差 (95%c
l
)

効 力 比 (95%c
l
)

D1
:Morphine

0
.
5
6
2
7(0
.
5
0
4
60
.
6
2
2
2
)

基準

基準

D2:Amidone

0.
46
6
1(0.
39920
.
5
3
1
1
)

0
.
0
9
6
5(0.0095,
0
.
1
8
7
1
)

1
.22(
1
.021
.
54
)

D3Phenadoxone

0
.
0
7
9
5
)
0
.
0
1
0
3(
‑
0
.
0
6
3
30
.
5
5
2
4(0.
46200
.
6
4
8
7
)

3
.
5
7(
2
.
9
04.
45
)

D
4
:
P
e
t
h
i
d
i
n
e

1
.0392(0.9834,l
.0
9
5
5
)

‑
0.
4765崎
(0
.
5
5
7
1,
‑
0.
3949)

0.
33(
3
.
6
10.
40
)

3
. 計量値に対する逆推定
SASの計量値に対する回帰分析は、 PROCREG、PROCGLM、 PROCMIXED、PROCNL到 な

ど多彩であるが、生物検定法が要求する逆推定に対応できるプ口、ンジャは存在しない。どうして
も求めたい場合は、それぞれの回帰直線の推定値と 95%信頼区間を、それが存在する範囲の投与
量 X を細分化して SASデータセットを追加し、予測値の出力機能、 OUTPUTオプションなどを
使用すれば可能である。その結果は膨大になるので、その出力ファイルから必要なものだけ拾い
402
388.

出してくるといった SAS プログラム 2 に示すようなアルゴリズムを用いた方法により対応でき る 。 他方、 JMP では、計量値の解析についても逆推定が標準的な機能としてサポートされている。 その機能を紹介しよう。事例として、 Hubert ら(1988) のラットに対する降圧薬の研究を取り上 げる。 アンジオテンシン Iをラットの大腿静脈に注入すると、血圧上昇が起きる。降圧薬は、これを 阻害し血圧を下げる。したがって、血圧上昇が少ないほど降圧効果があると判断する。 表5 . アンジオテンシン I注入後の血圧上昇 Drug Dose( m g l k g ) データ S 1 0 48 (mmHg) 49 52 5 3 34 50 58 48 46 56 30 50 37 36 39 34 36 4 1 40 30 40 100 26 20 2 5 26 27 24 28 25 22 2 3 11 1 8 1 6 1 4 1 3 20 1 4 1 2 1 6 1 5 44 48 48 56 47 56 3 3 5 39 42 5 2 4 1 44 300 T 1 0 23 32 3 3 48 3 3 28 30 1 0 1 9 1 9 27 2 1 1 6 100 6 5 20 1 7 1 5 9 解析の目的は、標準的な薬物 Sに対する試験薬物 Tの相対力価と、その 95%信頼区間を求める ことである。 JMP で解析するためには、データがすべて行方向に展開していなければならない。 表 5のような形式データのままでは対処できない。この形式のデータを、行方向に展開する機能 が T a b l e s " メニューの S a t c kC o l u m n s . . . " コマンドである。これは、列方向に展開している l 行分のデータを、 Iカラムの行方向に展開する(この逆は データを概観するためには、図 5に示すように S p l i tC o l u m n s . . . " コマンドである)。 F i tY byX" の機能を使うと良い。この図か ら、降圧剤を増やすと血圧の上昇が小さくなり、 Sおよび T がほぼ平行で、あることがわかる。ほ ぼ平行であることを統計的にみるのは、投与量と薬剤聞の交互作用が無いことを示せば良い。生 le l i s m、非平 物検定法では、前節の 2値データでも示したが、この交互作用のことを LackofParaI 行性、または平行性の欠如と言っている。 JMPでは、 F i tModel" によって解析できる。この結 果を出力 3に示す。 非平行性の P 値は 0.0624 ときわどい値となっている。 LackofF i t から自由度が 5、F 値が 0 . 6 8 4 8、P 値が 0 . 6 3 6 7 であることから、直線の当てはまりは問題ないことがわかる。これらのこ とと、 LogX の P値が極めて小さいことを総合して、交互作用は量的であり、 S と T に平行線を 当てはめて逆推定を行うことは問題ないと判断する。 4 0 3

389.

BivariateY ByLogX 70 60 50 > ‑40 30 20 1 0 。。 0 . 5 . 5 ー 1 . 0 1 . 5 2 . 0 2 . 5 LogX 図5 . S薬と T薬の降圧効果 ムLi n e a rF i tDrug=S X L inearF i tDrug=T Y =7 2 . 9 5 7‑2 3 . 6 7 3LogX Y =5 0 . 7 3 4‑1 9 . 8 1 6LogX 出力 3 . 品1 Pによる非平行性の検討と LackofFitの解析 Response: Y Summary 0干 Fit RSquare RSquare Adj Root Mean Square Error Mean 0干 Response Observations ( o r Sum W g t s ) Source Lack 0干 Fit Pure Error T o t a l Error DF 5 6 1 6 6 Term Intercept Drug[ S ‑T ] LogX Drug[ S ‑T ]*LogX 0.8738 0.868064 5 .288258 31.5 70 Lack 0干 Fit Sum 0干 Squares 98.1012 1747.6333 1845.7345 Mean Square 19.6202 2 8 .6497 Parameter Estimates Estimate Std Error 61 .845744 1 .608317 11 .1 1 1 2 4 1 1 .608317 1.017583 一21 .74444 ‑ 1 .928588 1.017583 JMPで生成されるデザイン行列は、 S T ・ ー l のような対比なっているので、逆推定には、この値を用いる。 404一 t Ratio 38.45 6 . 9 1 21 .37 一 1 .90 F Ratio O .6848 Prob>F O .6367 Prob>ltl く. 0 0 0 1 く. 0 0 0 1 く. 0 0 0 1 O .0624

390.

出力 4.JMPによる降圧効果が 40、 30、および 20mmHgの場合の逆推定 Response: Y Parameter Estimates Estimate Std Error t Ratio 60.861602 1.55135 39.23 O .756594 8 .407206 1 1 . 1 1 1.031884 一21.55163 一20.89 Term Intercept T ] Orug[Sー LogX Y 4 0 .000000 3 0 .000000 2 0 .000000 Prob>ltl く0 0 0 1 く0 0 0 1 く0 0 0 1 1 *S薬の逆推定 * 1 Inverse Prediction Predicted LogX Lower Limit Upper Limit 1.35807889 1.26720455 1.44193909 1.90254559 1 .82208101 1 .74315611 2 .38639295 2.28608312 2 .19586683 1‑Alpha O .9500 X Values ワ Inverse Prediction 1 *T薬の逆推定 * 1 Y Predicted LogX Lower Limit Upper Limit 0.47423915 O .67392117 O .57788662 4 0 .000000 1.04188873 O .95067469 1 .13404370 3 0 .000000 1 .40647751 1 .61479896 1.50589085 2 0 .000000 1‑Alpha O .9500 X Values ワ 1822 結果を表 6に整理する。 30mmHgの効果を得るために S薬は、 10 . = 66 . 4mg /kgを必要とし、 1 T薬では 101 .04 = 11 .0mg /kg と少量であることが示されている。 表6 . S薬と T薬の逆推定、差の逆推定 T薬 S薬 降圧効果 Y 差の逆推定 (S‑T) dose(95%c l ) dose(95%c 1 ) dose(95%c l ) 40mmHg 1 . 358( 1 .267, 1 .441) 474,0.673) 0.577( 0. 0 . 7 8 1(0.659,0 . 9 0 2 ) 30 1 .822( 1 . 743, 1 .902) 1 .041(0.950,1 .134) 0 . 7 8 1(0.659,0 . 9 0 2 ) 20 2. 386) 2.286( 2 . 1 9 5, 1 . 505( 1 .406, 1 .614) 0 . 7 8 1(0.659,0.902) 差の 95%信頼区間は、計量値の場合 JMP では、切片を除くモデ、ルを指定しでも、 l が強制的に含 められ、計算不能であり、 PROCMIXEDにより計算した。 出力 5 . PROCMIXED による S薬の 30mmHg、S薬と T薬の差の逆推定と 95%信頼区間 LOGX 0 10 2 0.65934 1‑1 O .78020 1‑1 0.90165 1‑ 1 Y PREO SEPREO L95 U95 2.6046 1.3049 ‑0.0000 5 . 2 0 9 1 0.0002 1 . 3 0 2 1 ‑2.5992 2.5989 ‑2.6176 1.3114 ‑5.2351 ‑0.0001 PREO L95 U95 2.60478 0.00019 5.20937 0.00005 ‑2.59903 2.59913 ‑2.61740 ‑5.23489 0.00009 .65934となる。同織に、差 L95 と L95 の符号が変化したときの LOGX が 95%信頼区間の下限 O .78020 は X 軸に平行な差の推定値となる の推定値 Y の符号が変化したときの O ‑405一

391.

SASプログラム 2 . :PROCMIXEDによる逆推定 Title 'Hubelt 7D.sas Y.Takahashi 1999‑6‑15' data D01 ; Drug $ Dose Y No LogX ; input D1 = 0 ; D2= 0 if Drug = 'S' then D1 = 1 ; if Drug = 'T' then D2 = 1 ; datalines ; S 10 48 1 1 S 10 49 2 1 T 100 9 6 2 data D02 ; D1 = 1 ; D2 =‑1 ; do LogX = 0.60000 to 0.95000 by 0.00001 output end; data D03 set D01 D02 run ; proc mixed data=D03 ; model Y = D1 D2 logX / solution predicted noint make 'predicted' out=PRD03 noprint ; id DRUG NO LOGX D1 D2 ; run ; data D04 set PRD03 retain PRED L95 U95 if (PRED^=. ) and (PRED* PRED < 0 ) then output ; if (L95 ^= ) and (L95 * L95 if (U95 ^= . ) and (U95 * U95 PRED = PRED < 0 ) then output < 0 ) then output ; ; L95 = L95 ; U95 = U95 ; proc print data=D04 run i ‑406‑

392.

4 . 複数の誤差を伴う生物検定法 医薬安全性研究会 77 回 定 例 会 (1999) で取り上げられた In‑vIlro 薬効薬理試験における実験計 画並びに統計解析の事例「ヒ卜白血球の LPS 刺激における D 薬のサイトカイン産生抑制作用」 が複数の誤差を伴う生物検定法の例である c 表 7 にデータを示す。課題の提示者は、 「グラフか ら 、 D 薬について濃度依存的なヒ卜の白血球からのサイトカイン産生抑制作用が認められた。し かし、 LPS対照群と D 薬の各濃度群聞との Dunne口型あるいは Williams型検定では、いずれの群 聞にも、統計的有意差が認められなかった」と結論し、 「本試験における適切な統計解析法はな にか、本実験において、計画段階での不備があったとすれば、本来、どう計画するのが適切であ ったかっ」との質問をしている。 実験は、第 1日目に A 氏の分離した白血球を、 Iつのプレート上(例えば 96 ウェノレ)で、 LPS を無添加(うの 3つのウェノレ(くぼみ)、 LPS添加(+)を 1 5 ウェノレに、その内 1 2 ウエノレに D 薬の 4用量をそれぞれ 3つのウェルに添加し、全体で 1 8個のウェルの中で産生されたサイトカ インを一括測定した。第 2 日目に B 氏、第 3 日目に C 氏の白血球について実験が行われた。 表 7 サイトカイン産生抑制 G 2 3 4 。 。 。 。 。 。 DOSE 0 . 1 0 . 1 0 . 1 0 . 3 0 . 3 0 . 3 5 6 3 3 3 ( pg /mL) SBJ A B C A B C A B C A B C A B C A B C LPS + + + + + + + + + + + + + + + YI 2 7 . 3 6 6. 4 1 4. 4 1 4 1 0 . 0 8 9 0 8 . 6 2 8 2 . 8 1 0 7 6 . 9 6 6 1 7 . 3 8 0 . 5 6 8 0 . 9 3 3 1 6 . 1 22. 4 8 21 .5 1 8 3 8 . 9 9 . 6 1 7 0 . 5 8 9 0 . 3 11 .0 Y2 4 24. 8 0 . 6 1 8 . 3 1260. 4 7361 . 1 2 8 2 . 2 1 1 3 2 . 6 5 8 6 6 . 2 6 5 . 9 9 0 3 . 7 2451 .0 1 4. 4 6 3 7 . 5 1 2 7 4 . 3 5 . 8 1 3 2 . 1 7 0 9 . 7 7 . 2 Y3 2 2 . 5 4 6 . 2 1 9 . 9 1 3 2 5 . 3 6 7 3 5 . 0 233. 4 9 6 0 . 0 5 9 1 9 . 6 6 4 . 8 9 6 6 . 1 3 7 0 0 . 7 1 8 . 8 6 5 3 . 9 1 2 2 7 . 5 8 . 6 2 1 2 . 7 . 1 1 2 01 4 . 9 この薬理試験において検証したいこと何であろうか。その目的に合致した統計解析はどのよな ものであろうか。幾つかの統計解析の考え方、それに対する問題点を示そう 3 表 7の結果だけを見ただけでは、 6群 x3人 x 3測 定 =54個のデータが完全ランダムである のか、あるいは、ランダム化が制約された分割実験となっているの判断できない。実験手順から、 A さん、 B さん、および C さん日l にデータを並べ替えてみるとよい。その中で、ランダム化がさ r れていることに注意が向くであろう。言い換えると、 6群 x 3 ! J j ' 定 =1 8個のデータの中でラン ‑407

393.

ダム化が行われている。その 1 8 個のデータ聞には、個体ごとの本質的な血液学的な反応差のみ ならず、様々な実験操作に伴う誤差が複合して入り、それらは、この実験データからは、特定で きないのである。 次に、 l群当たり 3個のデータについて考えてみよう。各ウェルに注入する順番、測定の順番 など幾つかのランダム化が制約されているかもしれない。ただし、 A さん、 B さん、 2 人のデー タでは、異なる用量間で同程度の大きさのデータが存在しているので、それらのランダム化の制 8個のデータは、完全にランダム化されていると 約が無視できると判断される。言い換えると、 1 見なして差し支えない。 以下に 5つの解析事例を示す。同じ実験データで、あっても、まったく異なる結果が得られる。 正解とは言わないまでも、解析事例 4による用量反応の解析と解析事例 5に示した第 2群 (LPS 添加)を基準としたサイトカインの産生抑制が発現する用量の推定が、この実験の解析方法とし て妥当と考える。 解析事例1. 54個のデータが完全ランダム化されたとした l元配置分散分析 方法: 6群間で Tukeyの多重比較を行う。 model l o g ( Y )= Group; 問題点:個体間と個体内の誤差で検定しているので有意差が出難い 比較の基準群が不明瞭、生物学的な判定基準がない 群聞の分散が明らかに異なるので l元配置分散分析の適用は不適当 結果:群 l に対して群 2のみが有意 個体ごとの用量反応関係は、統計解析を行わずとも明らかにある。 OnewayAnalysiso fLogYGroupedByGROUP l500 4 . 0 0 l300 〉 1 ロ3 13 2 . 0 0 1 . 0 0 0 . 0 ー :: 0 . 02 : + : 0 . 03 : + : 0 . 14 : + : 0 . 35 : + : 1 . 06 : + : 3 . 0 A I IP a i r s 1 T u k e y ‑ K r a m e r 0 . 0 5 GROUP 図6 . 各個人ごとの散布図および T u l 壬e yの多重比較 408

394.

解析 2 .各個体別に求めた 3個のデータの平均値に対する用量反応性の検討 方法:LPS添加 5群に対して回帰分析 model log(Y)̲mean=Oose; 問題点:各個体の対応関係を無視していることになり、 1 5 人分のデータと見なしたと同 じである。 結果:用量反応が有意でない (P=0.1138) B i v a r i a t eMean(LogY)ByMean(LnX) 5.0i 4 . 0 + ち ) 3 . 0 0 . ̲ ‑ ‑ ‑ ‑ ‑ ‑ . . . 之 v ー 」 ‑ . . . . . . 九 、 、、 c 伺 さ2.0 、 、 + 0‑ 1 ‑ 3 4 ‑ 2 i J U 引﹂ I 1.0 ‑ 1 0 Mean(LnX) 図7 . 個体の平均値の散布図 L inearF i t Mean(LogY)=2.2883542‑0.2512466Mean(LnX) この回帰直線は、それぞれ独立な測定結果とみなした場合に相当する。回帰直線の 95% 信頼区聞が共に水平となっているので、回帰が有意でないことがわかる。 . 混合モデルを前提に LPS無添加群を基準とした群問の比較 解析 3 方法:個体と群を固定効果、個体と群の交互作用を変量効果とした混合モデル 同一個体内の 3回の測定は、繰返し測定誤差と見なす ny u oγ1 G・ は P EU ニベド hG ︑︐ノハレ 同百川 'knb Y ・ 戸 (3E EO JUJu lm mm on 問題点 MMm 群 1 (LPS無添加群)に対して各群との比較を Ounnett行う 実験の目的は、 LPS 添加に措抗する D 薬の量を、統計的に差が無くなる用量を もって同定しようとする解析方法となる。 3 例程度では、検出力が低く、統計 的に差が無いことの強調は困難である 結果 群 l に対して群 5 (0薬1.0nM群)より Ounnett法で有意差が出なくなる 409‑

395.

出力 6 . PROCMIXEDによるダネットの多重比較 GROUP GROUP 2:+:0.0 1・ :0.0 3・ +:0.1 1 一 : :0.0 : ・O .0 4:+:0.3 1 5 : + :1 .0 1一 : :0.0 6・ + ・ 3.0 1: ‑ : 0 .0 Diff巴r巴nc巴 1 .6665246 1 .4086180 1 .0829562 O .8205668 0.5401066 Diff巴rences of L巴ast Squares Means Std Error DF t P r >I t l Adjustm巴nt 0.3161088 1 0 5.27 0.0004 Dunn巴tt‑Hsu 0.3161088 1 0 4.46 0.0012 Dunn巴tt‑Hsu 0.3161088 1 0 3.43 0.0065 Dunn巴tt‑Hsu 0.3161088 10 2.60 0.0267 Dunn巴tt‑Hsu 1 .7 1 0.1183 Dunn巴tt‑Hsu 0.3161088 1 0 Adj P 0.0015 0.0049 0.0247 0.0943 O .3557 解析 4 . 個体ごとの用量反応の検討 方法:個体ごとに回帰直線を同時に当てはめ用量反応関係を検討 model log(Y)= Subject Subject*LnDOSE/noint 問題点:そもそも実験の目的は何か。この範囲の用量で直線的な用量反応があるか調べ ることなのか。あるいは、各個体聞の反応の平行性を調べたいのか、はっきり しない。 結果 それぞれの被験者の用量反応、直線の傾きは、ー 0.174、 ‑0.219、および ‑0.379 とすべて有意である。図 8 にサイトカイン量の常用対数を取った散布図に個人 ごとにあてはめた回帰直線と、その 95%信頼区間を表示した。 出力 7 . PROCMIXEDによる回帰係数の推定と 95%信頼区間 Eff巴ct SBJ SBJ SBJ SBJ A B C LNDOSEホSBJ A LNDOSEホSBJ B LNDOSEホSBJ C Estimat巴 2 .626000 3 .199796 1.039265 一0.174419 一0.219583 0.359737 Solution for Fix巴d Eff巴cts Std Error DF t P r >I t l Alpha 0.051631 O .0 0 0 1 0.05 39 5 0 .8 6 O .0 0 0 1 O .05 0.051631 39 61 .97 0.051631 0.0001 O .05 39 20.13 0.026126 0.026126 0.026126 6 .68 39 ‑ 39 ‑8.40 39 ‑13.77 0.0001 O .0 0 0 1 O .0 0 0 1 O .05 O .05 O .05 Low巴r 2.5216 3 .0954 O .9348 Upp巴r 2.7304 3.3042 1 .1437 ‑ 0 .2273 一0.1216 一0.2724 ‑ 0 .1667 ‑0.4126 一O .3069 一般的に、個体差の大きい実験では、同一個体内で処理聞の比較を行うのが鉄則である。この 実験では、 3 人の被験者の白血球を使用しており、比較すべき全ての処理が一被験者の中で行わ れている。このように観点から、用量反応関係を含む結果の生物学的な解釈は、個人間の誤差を 考慮すべき課題と、個人内の誤差で この問題は、実験計画法でいうところの分割実験になっている。結果の一般化可能性という観 点からは、被験者を固定効果と見なすか変量効果と見なすかの問題となる。固定効果と見なす場 合は、この実験の 3人での実験の再現性を考えることに対応し、変量効果とすることは、他の被 験者の場合にも当てはめられる結論を言いたいときに必要である。 410一

396.

B i v a r i a t eLogYByLnX 5 ﹀︒︒﹂ 0 ‑ 3 . 5 ・2 .5 句 1 . 5 ・0 .5 . 5 1 . 5 LnX : ・ 図8 . 個体ごとの回帰直線とその 95%信頼区間 L inearF i tSSJ= A +:L inearF i tSSJ= B x :L i n e a rF i tSSJ=C LogY= 2.6260004‑0.1744194LnX LogY= 3.1997964‑0.2195832LnX LogY=1.0392657‑0.3597373LnX 解析 5 . 第 2群 (LPS添加)を基準として、サイトカインの産生抑制が発現する用量 方法:用量群を固定効果、被験者を変量効果、被験者と用量群の交互作用を変量効果と した線形混合モデ、ルによる解析をおこなう model logY= Group; random S u b j e c t Subject*Group; 問題点 統計的な有意差検定のみで判定するのは例数が少ないので、抑制する用量を大 き目に判定しがちになる。平均値、および、その 95%信頼区間をみながら、過 少評価・過大評価をしないようにする必要がある。 結果 第 4群 (D薬 0 . 3 nM) より LSD法により有意差 (P=0.0209) が出る。ただし、 被験者間の変動が大きいために、固定用量でのサイトカイン産生抑制の平均値 . 0nM群の場合、 の 95%信頼区間は、最高用量の 3 1 0 . 0 . 3 7 3 5 ~ 1 0 と非常に広いことに注意を要する。 ‑411‑

397.

出力 8 . PROCMIXEDに よ る 個 体 を 変 量 効 果 と し た モ デ ル Covariance Parameter Estimates ( R E M L ) Cov Parm SBJ GROUP*SBJ Residual Estimate 1.03155794 0.05945078 0.00781063 1 *個体聞の誤差分散 * 1 1 *群聞の差の検定のための誤差分散 * 1 1 *個体内の誤差分散 * 1 Tests of Fixed Effects Source GROUP NDF 4 DDF Type IIIF Pr >F 8 9.77 0.0036 Least Squares Means Effect GROUP GROUP 2:+:0.0 GROUP 3:+:0.1 GROUP 4・+:0.3 GROUP 5 : + :1 .0 GROUP 6:+:3.0 LSMEAN 3.1430298 2.8851232 2.5594614 2 .2970720 2.0166118 Std Error DF 0.6037693 2.19 0.6037693 2.19 0.6037693 2.19 0.6037693 2.19 0.6037693 2.19 t l Alpha t Pr >I 5.21 0.0287 0.05 4 .78 O .0342 O .05 4 .24 O .0436 0.05 3 .80 0.0541 O .05 3 .34 O .0697 O .05 Lower O .7529 0.4950 0.1694 ‑ 0 .0930 一O .3735 Upper 5.5331 5.2752 4 .9496 4 .6872 4 .4067 Lower ‑0.7269 ‑ 1 .0526 ‑1.3150 ‑1.5954 Upper 0.2111 ‑ 0 .1145 ‑0.3769 ‑0.6574 Differences of Least Squares Means GROUP GROUP 3:+:0.1 2:+:0.0 4:+:0.3 2:+:0.0 .0 2 :+ :O .0 5・ + :1 6:+:3.0 2:+:0.0 Difference ‑0.2579065 O .5835684 O .8459578 ‑1.1264180 Std Error 0.2033950 0.2033950 O .2033950 0.2033950 DF 8 8 8 8 t Pr >I t l Alpha 0.2405 0.05 0.0209 O .05 ‑4.16 0.0032 0.05 ‑5.54 0.0005 0.05 一 1 .27 一2 .87 Tests of Fixed Effects: NDF は分子の自由度、 DDF は分母の自由度、これから群聞の検定は、 GROUP*SBJで行われていることがわかる。 Least Squares Means 群 の SE は 、 3 種 の 誤 差 分 散 を 合 成 そ の 自 由 度 2.19 は 、 S a t t e r t h w a i t e の自 由度の調整法を用いている。このために 95%信頼区聞は、非常に広くなっている。ここに示され ている t検定は、群の平均値に対するもので、全く意味がない。 Differences of Least Squares Means:第 2 群との差であり、この場合の Std Error は 、 2 つの誤差分 散 GROUP*SBJと Residualの分散を合成したものである。 5 .JMPによる混合モデルの解析 前 節 に 示 し た 混 合 モ デ ル は 、 パ ー ジ ョ ン 3 の JMP に は 含 ま れ て い な い 。 現 在 開 発 中 の パ ー ジ ョン 4か ら 利 用 で き そ う で あ る 。 以 下 に 、 前 節 の 解 析 事 例 5の 出 力 に β4版の出力とを対比する。 ‑412‑

398.
[beta]
E温幽轟轟晶画圃幽圏直幽面画面~・・・・・・・・・・・・・・・・・・・・・・4且起
因 E
i
l
e 岳.
d
i
t I
a
b
l
e
s DOE 8
.
n
a
l
y
z
e ~ra 凶了。 oJs .
!
J
s
町 百 四 百n
d
町 且e
l
p ニ 盗i
三l
iB 白昼届 ~X 喧主砲~ I]~? ~司令 i 杓 ,"" pp+ 出陣An:

包 G

因 SBJ
固 DOSE

I
9LPS
回 GROUP
回L
nX

I
9Y
固 LogY
回R

r~Fitting P
e
r
s
o
n
a
l
i
t
y
‑
ー←←一一一一一一一「ー‑
A
c
t
i
o
n
‑
一一一一一「

。 …
ー

C'>.~____

日長記民広立江古h
i平
:
r
0
.
o
̲i
J
!I
@
i

l
e
t
h
o
d
: EML(R

h時

d
e

n
d
e
d
]田

Q

M
e
l
p

I1

~

NUMγ一 ‑
「 一 r ‑ ‑
i
"

図9
.品1pによる固定効果とランダム効果の指定
ML,および REMLによる解析が、新しいパージョンで追加された。

I金ll~I:Iõ [Fit M
.
.
.剖
国 Eile

帥工"ab!es

贋回霞1
1
∞E

畠~.加金刑丁目 ls

日何回酬世嗣出lp

j白 口 画 面 畠 品 も 包 囲 I
nr
;?わ固判f'I.!rP jJ +]
iI
4
Y
A
nz77̲ono̲T

4到三j

ヨ
!

マニ主~三与2工
.
.
.Who
l
eM
o
d
e
l
トA山 a
lb
yP目 d
凶 dP
l
o
l

.Summaryo
fF
i
t

I

.
A
r
l
a
l
y
s
i
so
f
V
a
r
i
a
n
c
e
トp
a
聞 蜘E
s
t
i
m
a
l
e
s

J
I

I
I
I

"'REMLV
a
r
i
a
n
c
eC
o
m
p
o
n
e
n
lE
s
l
i
m
a
l
e
s

RandomE
f
f
e
c
t VarR
a
t
i
o VarComponent S
t
dE
r
r
o
r 95%Lower 95%Upper P
c
tof
T
o
t
a
l
1
3
2目 白1
S
B
J&Ra
n
d
o
m
SB
.
.
r
GROUP&Ra
n
d
o
m
7
.
6
1
1
4
9
7
4
R
e
s
i
d
u
a
l
T
o
l
a
l
‑
2L
o
g
U
k
e
l
i
h
o
o
d= ‑
2
5
]
9
4
9
1
E
f
f
e
c
lT
e
s
l
s

4
6
4
1
1田 1

1
.0
7
7
2
3
3
9

日お9
3
1
1
6

日
.
白9
4
5
0
9

日目4
9
2
0
1

0
.
0
2
4
3
9
7
3

5
4
.
2
9
7
日目
02
刃4
8
2
7

0日0
7
B
1
0
7
1
.
0
9
B
7
2
5
7

9
3
.
B
7
日
5
.
41
1
0
.
71
1
1
0
0田
口

・

Source
S
B
J&Ra
n
d
o
m
GROUP
n
d
o
m
S
B
JGROUP&Ra
含

Nparm DF DFDen Sumo
fSquares FR
a
t
i
o Prob>F
3
1
.Z氾4
0
0
0
8
3
.
1
1
7
0
αJ01Shrunk
〈

1
5

4

日

日

3
0

6
1
0羽田9
.
4
2
6
9
9
日5
1

9]654
2
2
.
8
3
7
3

口町四
〈

αl
OlS
h
r
u
n
k

T
e
s
l
so
nR
a
n
d
o
me
f
f
e
c
l
sr
e
f
e
r1
0s
h
r
u
n
k
e
np
r
e
d
i
c
l
o
r
sr
a
l
h
e
r
I
h
a
nI
r
a
d
r
t
i
o
n
a
le
s
l
i
m
a
l
e
s
.
トR
e
s
i
d叫 b
yP
r
e
d
i
c
l
e
dP
l
o
l

I

J

4
Ma
:
rk
e
r
s

ょj

11‑阿 1 4

図1
0
. 品?による混合モデ、ノレの分散成分、および分散分析表
VA RComponentは
、 PROCMIXEDの分散成分、1.03155,0.05945,0.00781 に一致している。
分散分析表の GROUPの F 値 9.7654も一致している

413‑

399.

同岨圃幽面白ーーーーーーーーーーーーーーーー・・ー出よU ~ E i [ e f . 1 d iを Iables DOE 8 ̲ n a [ y z e ~raph T o o l s 出 e r y' i 叩 迎i ndow 且e l p HO l;á;届畠品~ el s l I]~? 計四 φ| 杓,b P . p+ ュ 担j 三j I序 百 万: 2 7 ムi . . . ~ GROUP "'LeastSquaresMeansTable Level LeastSqMean 2 : + :口口 3十日 1 4 :ギ口 3 + :1 . 0 5・ 6 : + : 3 . 0 StdError Mean 3.1430299 0.60374349 2日目 51233 0.60374349 2.5594614 0.60374349 2.297072 口 口 60374349 2.0166118 0.60374349 I . . . . LSMeansP l o t 3.14303 2 .自白 512 2.55946 2.29707 2.01661 g >3.50‑ 1 I I T T I ‑1 r ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ . . . . . . . : 22.50‑ 1 I r ‑ ー ー → ー ‑ ‑ ‑ 1 II ~ ‑ 1 1 I I r ー‑+ I ち 1.50 1 I II Q) ,. ‑ 一 一 J 口 50. . . . 1 ~ l 2 :+ : 0 . 0 4 :+ : 0 . 3 6 :+ : 3 .口 3 : + : 0 . 1 5 : + : 1 . 0 GROUP 宵‑ erencesS司udent ' st . . LSMeansDi Alpha=口口 50 Q=2.04226 LSMean[ j ] Mean[i]‑MeanU ]2:+口口 3:+口 1 4:+0.3 5 : + : 1 . 0 6:+ヨ口 StdErrD i f LowerCLD i f UpperCLD i f 2:+口口 3辛口 1 0 1 0 . 2 5 7 9 1口583570.845961.12642 2 口34 0 . 2 口34 0.2034 口2034 0 1 0. .1681日0.43 口57口711白3 ロー口 15750 010.673290.998951.26134 1.5418 口 一 2579 ロロ 32566口588050.86851 口2034 日 日 2034 0 口34 0.2034 .2 ‑ nf i 7 ヌ7 司 nl‑ 円 nR 月7n 1 7 フf i 7n A'i ヨ 1 ' 1 ~ r一「一何百 ~d OnLBuHonup 図 11.群の LSMEAN、 LSD法 に よ る 差 の 推 定 と 信 頼 区 間 L e a s tSqMeanと S t dE r r o rは 、 PROCMlXEDの LSMEANと S t dE r r o rに一致して t dE汀 Difは一致しているが、信頼区間は一致しない。品。は小さ目 いる。差の S になっている。これは、誤差の自由度を、個体内の誤差分散の自由度 30 を用いて いるからである。自由度が大きい場合には、大きな問題とならないが、この例の ような少数例の場合に問題である。 PROCMlXED の初期のリリースも同じ問題が あったので、解決されることを期待したい。 文献 d F i n n e y, J .D .( 1 9 7 1 ), P r o b i ta n a l y s i s3r e d ., Cambridge, London. H u b e r t ,J .J .,B i h i d a r ,M.R .,P e a c e,K .E .( 1 9 8 8 ),Assessmento fP h a r m a c o l o g i c a lA c t i v i t y .i nB i o p h a r m a c e u t i c a l S t a t i s t i c s f o rDrugD e v e l o p m e n t( 8 3 ‑ 1 4 8 ), De はe r . 中上節夫、森川敏彦監訳 ( 1 9 9 2 ) 医薬統計学、サイエンテイス卜社. 小里子秀樹、山田俊介 ( 1 9 9 9 ) 、I nv i 廿o 薬効薬理試験における実験計画並びに統計解析、医薬安全性研究会 7 7固定例会資料(19 9 9 ) . 414一

400.

日本 S A Sユーザー会 (SUG I‑J) PROCGLM及び PROCIMLを用いた 3期 3剤クロスオ ‑ 1 ' ¥ーデザイン(直交ラテン方格)の解析 石川靖 生物統計・データマネージメント部生物統計グループ ヘキスト・マリオン・ルセル株式会社 A n a l y s i so ft h r e e ‑ w a yc o m p l e t ec r o s s o v e rd e s i g n w i t hP R O CG L Ma n dP R O CI M L Y A S U S H II S H I K A W A o e c h s tM a r i o nR o u s s e lL t d . B i o m e t r i c sG r o u p, U 要旨 W i1 1i a m s は処理の直接効果と持ち越し効果を分離して推定するために 3期 3剤クロスオ ーバーデザイン(直交ラテン方格)を提案した。 P R O CG L Mと P R O CI M L を用いてこのデザ インで、解析を行ったので紹介する。 キーワード. 3期 3剤クロスオーバーデザイン(直交ラテン方格)、分散分析、 処理の直接効果、持ち越し効果 1. はじめに 臨床試験において、観測値の被験者間のバラツキ(変動)が被験者内のバラツキ(変動) より大きいことが予想される場合、クロスオーバー法を用いて被験者内比較を行うことに より感度よく薬剤の影響を検出することが考えられる。クロスオーバー法では持ち越し効 果の存在が懸念されるため、休薬期間を設けることが一般的であるが、休薬期間を十分に 長くとることが実施上困難な場合がある。そこで、処理の直接効果と 1次の持ち越し効果 を分離してそれぞれの効果が推定可能なデザインが、 W i1 1i a m s により 3期 3剤クロスオ ーバーデザイン(直交ラテン方格)として考案された。 3期 3剤クロスオーバーデザイン(直交ラテン方絡)の解析の事例として、以 Fの試験 を考えてみた。 「 薬 剤 I j Cは、薬剤Ij A及び薬剤 Bより、薬効が優れている。」ことを確認することとした。 415‑

401.

事前情報から、観測値の被験者間のバラツキ(変動)が被験者内のバラツキ(変動)よ り大きいことが予想され、十分な休薬期間を設けることが実施上困難であったため、試験 デザインとして、 3期 3剤クロスオーバーデザイン(直交ラテン方格)を採用することと した。なお、被験者数は 1 8名とする。 R O CG L Mと P R O CI M L を用いて、各処理の直接効果を推定し、薬剤間比較を 本例題を、 P 行う場合を考える。 2 . 3期 3剤クロスオーバーテ、ザ、イン(直交ラテン方格)とモデル 2つの 3x3ラテン方格(シーケンス 1"'3、シーケンス 4"'6) から成る 3期 3剤ク ロスオーバーデザイン(直交ラテン方格)とこのデザインに対応するモデルを以下に示す。 1[薬剤 A J、 r2[薬剤 B J、 τ 3[薬剤 C J 処理(薬剤)が施されている期間中に直接効果 τ を生じる他に、その次の期間にも、それぞれの l次の持ち越し効果 ρ l、 ρ 2、 ρ 3を生じる。 どの処理(薬剤)も他の処理(薬剤)の後に同じ回数(2回)施されている。例えば、 薬 剤 I j Bは、[薬剤 A→ 薬 剤 B Jが 2回、[薬剤 C→ 薬 剤 B ]が 2団施されている。この性 質を持つデザインは、 l次の持ち越し効果について釣り合っているといわれる。 3期 3剤クロスオーバーデザイン(直交ラテン方格) 日 第 3期 第 2期 第 l期 I ~I 薬剤 ~3+P21~ I 薬剤UA 薬剤 B r 2 + P 1→ 1 +r1 → μ+α1 +72 + τ 2 + ρ 1 ; 日 → │ μ+α1+7 I~I μ+α1+73+r3 + ρ 2 薬剤 B +r2 → μ+α2+72 +r3 + ρ 2 → μ+α2+73+rl +ρ3 ; 日 → │ μ+α2+71 I~I 薬剤 C μ + α 3+71+r3 → μ+α3+72+rl + ρ 3 → μ+α3+73+r2 + ρ 1 園 田 → │ I~I 薬剤 Arl+P31~1 薬剤 A 薬剤 C 3 + P 11 r +72 + τ 3 + ρ l → 1μ+α4+73 +r2 + ρ 3 +r1 → μ+α4 ; 日 → │ μ+α4+71 I~I 薬剤 B μ + α 5+71 + τ 2 ;日→│ ~ I~I 薬剤 A r 1 + P 2 1→ ~ 1μ+α5+73+r3+ρ1 rl → μ+α5 +72+ + ρ 2 薬剤 B r 2 + 3 1→ ~ 1μ+α6+73+τ1+ρ2 → μ+α6 +72+ τ2 +ρ3 ~[日→| μ+α6+71+r3 I~I 薬剤 C P ‑ 4 1 6 ‑

402.

モデル =μ+αt+βパi) +Y k + τ f州 Yijk i = , 12 , . . . ,6 j= , 12 ,3 +P川 一l ) + E t l k k = l,2 ,3 第 iシーケンス内の第 j被験者の第 k時期に観測された値 Yijk μ 全平均 α I 第 iシーケンス効果(母数効果) β j ( i ) 第 iシーケンス内の第 j被験者の効果(変量効果)で、 Y 第 k時期の効果(母数効果) τf(i,k) 第 iシーケンスの第 k時期に投与された処理の直接効果(母数効果) Pf 第 iシーケンスの第 k ‑ [時期に投与された処理の 1次の持ち越し効果 (母数効果) eijk 誤差で、互いに独立に(平均 0、標準偏差 UE) の正規分布に従う 互いに独立に(平均 0、標準偏差 a ) の正規分布に従う s k ( i , k‑1) 但し、 β j(i)と eijkは独立であると仮定する。 制約条件: 2αt=o、 Z Y K = o、 k ' I f= 0 f( j ,k ‑j)は第 lシーケンスの第 k ‑ [時期に行った処理を表わし 0 ,1 ,2 ,3のいずれかの値をとる。 ‑417‑ 2 P s = 0、 P o=0 ( P。は第 1期)

403.

3 . 3期 3剤クロスオーバーデザイン(直交ラテン方格)の解析 3 . 1 各処理の直接効果の推定 3 .1 .1 PROCGLMを用いた方法 8名に投与することにより、以下の観測 薬剤 A、薬剤 B及び薬剤 Cそれぞれを被験者 1 値が得られた。 DatadOl; 1次の持ち越し効果の シーケンス被験者処理(薬剤) 期 1次の持ち越し効果 ダミー変数 I n p u t sequence s u b j e c t t r e a t p e r i o d c a r r y c1c 2 C a r d s : 。 。 tr e at(1)・薬剤 A x 3期 tr e a t( 2 ) 薬剤~ B 2 . 0 7 . 0 nunu‑‑ 〆﹄ nUTi‑1l 内〆﹄内 J ι n 11 1 u守 a u守 a u守 a 被験者 1 8名/期 v a l u e ; 2 . 9 1 0 o 1 。 観 ;.i.~ 値 1 .9 7 . 0 0 . 0 5 4 t r e a t ( 3 ) : 薬剤J IC P R O CG L Mの c l a s sステートメントに分類変数 s e Q u e n c es u b j e c tt r e a tp e r i o dc a r r y を指定し、 m o d e lステートメントに説明変数 s e Q u e n c es u b j e c t ( s e Q u e n c e )t r e a tp e r i o dc a r r y を指定すると、最初に S A Sが作成するデザイン行列の中で、 p e r i o d及び c a r r yに対応する 部分は下記のようになる。 p e r i o dに対応するダミー変数 p e r i o d c a r r yに対応するダミー変数 。。 。 。 。。 P l P 2 。 P 3 c a r r y ‑ 4 1 8 。。。 。 。。 。。 。 。。。 L l L 2 L 3 L 4

404.

P 3の列と L 4の列は基準セル ( P R O CG L Mでの制約条件 :y3= 0、 ρ 3 = 0 ) となるためデザイ ン行列から除かれる。また、 c a r r y( 1期)は p e r i o d( 1期)と交絡しているため、 P lの lの列もデザイン行列から除かれ、 c a r r y (1期)と p e r i o d ( l期)の効果は推定さ 列と L れない。 m o d e lステートメントで s o l u t i o nオプションを指定すると各処理の直接効果は推定 できるが、 1 s m e a n sステートメントで t r e a t を指定すると N o n ‑ e s t " と表示され、薬剤 R O CG L M[ p r o g r a m J )。 間比較も行われない(表 1 P なお、 .章で示した制約条件 そこで、 2 2ρ54、 ρ。 =0 ρ (。は第 1期)に対応するダミー変 数 ( c l、 c 2 ) を作成し、このダミー変数 みる。 ( c1、 c 2 ) を用いて各処理の直接効果を推定して 。 。。 。 。 c a r r y c 1 c 2 3 l a s sステートメントに分類変数 P R O CG L Mの c s e q u e n c es u b j e c tt r e a t p e r i o d m o d e lステートメントに説明変数 s e q u e n c es u b j e c t ( s e q u e n c e )t r e a tp e r i o dc lc 2 を指定し、 を指定し、 1 s m e a n sステートメント(表 1 P R O CG L M[ P r o g r a m ] )に t r e a t を指定すると、各処理の直接効果が推定される。結果を表 3P R O CG L M [各処理の直接効果 の推定及び D u n n e t tの多重比較]に示す。 なお、ダミー変数 ( c1、c 2 )を P R O CG L Mの c l a s sステートメントに指定すると、 p e r i o dの P lの列がデザイン行列から削除されてしまう。 このダミー変数 ( c !、c 2 ) を用いて 1次の持ち越し効果の有意性を検討するためには、任 意の独立な 2つの対比に対して検定を行えばよい。例えば、対比係数ベクトルを(1, ! ) と ( 2, 1 ) とし、 c o n t r a s tステートメントで、 c o n t r a s t c a r r y o v e rE f f e c t ' c l1 c 2, 1 c l2 c 2 1/ e ; と指定する。これは、 4 1 9

405.

帰 無 仮 説 : ρ=ρ2二 ρ3=0 (1xρ1 +1 xρ2=0 かつ 2Xρ1 t 1 xρ2二 o) 対 立 仮 説 : ρl、 ρ1、 ρ3のどれかが異なる とし、帰無仮説の下で F 検定を行うことに対応している(表 1 P R O CG L M[ P r o g r a r n J )。 また、被験者効果を変量効果とするには、 r a n d o r nステートメントで、 s u b j e c t ( s e Q u e n c e ) を指定すればよい。 分散分析の結果を、表 2( P R O CG L M [分散分析の結果])に示した。 Y P E1では各処理の直接効果と l次の持ち越し効果が分離されていないが、 T y p eI なお、 T ( I I I)では各処理の直接効果と l次の持ち越し効果が分離されている。 表 1P R O CG L M[ P r o g r a m J く 1次の持ち越し効果として、 carry (値:0、1、2、3 ) を用いた場合〉 p r o c glm data=dOl; c l a s s sequence subject t r e a t period c a r r y ; m o d e l value = sequence s u b j e c t (sequence) t r e a t period carry / s s ls s 2s s 3 ; random subject(sequence); t e s t h=sequence e=subject(sequence) I s m e a n s t r e a t r u n ;q uit ; ' ) / pdiff=control('薬剤 C /h t y p e = 1e t y p e = l ; adjust=dunnett; く 1次の持ち越し効果として、ダミー変数 ( c1 、c2) を用いた場合〉 p r o c glm data=dOl; c l a s s sequence subject t r e a tp e r i o d ; m o d e l value = sequence subject(sequence) t r e a t period c lc 2 / s s ls s 2s s 3e le 2e 3s o l u t i o n ; contrast carryover E f f e c t ' c l1 c 2 1 .c l2 c 2 1/ e ; random subject( s e q u e n c e ) ; t e s t h=sequence e=subject(sequence) ' ) I s m e a n s t r e a t / pdiff=control('薬剤 C /h t y p e = 1e t y p e = l ; adjust=dunnett; estimate '薬剤J IAv s 薬剤J IC ' t r e at 1 0‑ 1 /e ; estimate '薬剤J I Bv s 薬剤J IC ' t r e a t r u n ;q ui t ; 0 1‑ 1 /e ; 420‑

406.

表2 P R O CG L M [分散分析の結果] く 1次の持ち越し効果として、 carry (値:0 、1、2、3 ) を用いた場合〉 O e p e n d e n tV a r i a b l e :V A L U E S u m0 1S q u a r e s S o u r c e M e a nS q u a r e FV O F a l u e M o d e1 3 7 5 . 8 9 7 7 7 7 7 8 1 6 . 3 4 3 3 8 1 6 4 2 3 9 . 7 6 Err or 3 0 5 0 . 2 2 2 2 2 2 2 2 1 .6 7 4 0 7 4 0 7 C o r r e c t e dT o t a l 4 2 6 .1 2 0 0 0 0 0 0 5 3 P r> F 0 . 0 0 0 1 R ‑ S q u a r e 0 . 8 8 2 1 4 1 C .V . 3 5 . 6 1 0 8 3 R o otM S E 1 .2 9 3 8 6 0 1 4 S o u r c e S E Q U E N C E S U B JE C T( S E Q U E N C E ) T R E A T P E R1 0 0 C A R R Y O F T y p e 1S S 1 9 . 1 1 1 1 1 1 1 1 3 6 . 2 2 2 2 2 2 2 2 3 0 6 . 1 2 0 0 0 0 0 0 8 . 1 1 1 1 1 1 1 1 6 . 3 3 3 3 3 3 3 3 M e a nS q u a r e 3 . 8 2 2 2 2 2 2 2 3 . 0 1 8 5 1 8 5 2 1 5 3 . 0 6 0 0 0 0 0 0 4 . 0 5 5 5 5 5 5 6 3 . 1 6 6 6 6 6 6 7 FV a l u e 2 . 2 8 1 .8 0 91 .4 3 2 . 4 2 1 .8 9 F P r> 0 . 0 7 1 5 0 . 0 9 3 6 0 . 0 0 0 1 o .1058 o .1684 S o ur c e S E Q U E N C E S U B J E C T( S E Q U E N C E ) T R E A T P E R1 0 0 C A R R Y O F T y p e1 1 ( 1 1 1 )S S 1 5 . 6 4 4 4 4 4 4 4 3 6 . 2 2 2 2 2 2 2 2 2 1 3 . 6 0 2 6 6 6 6 7 1 . 36 1 1 1 1 1 1 6 . 3 3 3 3 3 3 3 3 M e a nS q u a r e 3 . 1 2 8 8 8 8 8 9 3 . 0 1 8 5 1 8 5 2 1 0 6 . 8 0 1 3 3 3 3 3 1 .3 6 1 1 1 1 1 1 3 . 1 6 6 6 6 6 6 7 FV a l u e 1 .8 7 1 .8 0 6 3 . 8 0 0 . 8 1 1 .8 9 F P r> 0 . 1 2 9 6 0 . 0 9 3 6 0 . 0 0 0 1 0 . 3 7 4 4 O .1 6 8 4 O e p e n d e n tV a r i a b l e :V A L U E T e s t s0 1H y p o t h e s e su s i n gt h eT y p e 1M Sl o rS U B J E C T ( S E Q U E N C E )a sa ne r r o rt e r m T y p e 1S S S our c e M e a nS q u a r e O F S E Q U E N C E 1 9 . 1 1 1 1 1 1 1 1 3 . 8 2 2 2 2 2 2 2 FV a l u e 1 .2 7 P r> F 0 . 3 3 9 7 FV a l u e 9 . 7 6 F P r> 0 . 0 0 0 1 1 2 2 1 2 R RM e a n 3 . 6 3 3 3 3 3 3 3 く 1次の持ち越し効果として、ダミー変数 (cl、c2) を用いた場合〉 O e p e n d e n tV a r i a b l e :V A L U E S o u r c e O F M o d e l 2 3 Er r or 3 0 C o r r e c t e dT o t a l 5 3 S u m0 1S q u a r e s 3 7 5 . 8 9 7 7 7 7 7 8 5 0 . 2 2 2 2 2 2 2 2 4 2 6 .1 2 0 0 0 0 0 0 M e a nS q u a r e 1 6 . 3 4 3 3 8 1 6 4 1 .6 7 4 0 7 4 0 7 R ‑ S q u a r e 0 . 8 8 2 1 4 1 C .V . 3 5 . 6 1 0 8 3 R o otM S E 1 .2 9 3 8 6 0 1 4 S our c e S E Q U E N C E S U B J E C T( S E Q U E N C E ) T R E A T P E R1 0 0 C I C 2 O F T y p e 1S S 1 9 .1 1 1 1 1 1 1 1 3 6 . 2 2 2 2 2 2 2 2 3 0 6 .1 2 0 0 0 0 0 0 8 .1 1 1 1 1 1 1 1 6 . 2 5 0 0 0 0 0 0 0 . 0 8 3 3 3 3 3 3 M e a nS q u a r e 3 . 8 2 2 2 2 2 2 2 3 . 0 1 8 5 1 8 5 2 1 5 3 . 0 6 0 0 0 0 0 0 4 . 0 5 5 5 5 5 5 6 6 . 2 5 0 0 0 0 0 0 0 . 0 8 3 3 3 3 3 3 FV a l u e 2 . 2 8 1 . 80 .4 3 91 2 . 4 2 3 . 7 3 0 . 0 5 P r> F 0 . 0 7 1 5 0 . 0 9 3 6 0 . 0 0 0 1 O .1 0 5 8 0 . 0 6 2 8 0 . 8 2 5 0 S our c e S E Q U E N C E S U B J E C T( S E Q U E N C E ) T R E A T P E R1 0 0 C I C 2 O F T y p e1 1 ( 1 1 1 )S S 1 5 . 6 4 4 4 4 4 4 4 3 6 . 2 2 2 2 2 2 2 2 2 1 3 . 6 0 2 6 6 6 6 7 8 .1 1 1 1 1 1 1 1 4 . 0 8 3 3 3 3 3 3 0 . 0 8 3 3 3 3 3 3 M e a nS q u a r e 3 . 1 2 8 8 8 8 8 9 3 . 0 1 8 5 1 8 5 2 1 0 6 . 8 0 1 3 3 3 3 3 5 5 5 5 5 5 6 40 4 . 0 8 3 3 3 3 3 3 0 . 0 8 3 3 3 3 3 3 FV a l u e 1 .8 7 1 .8 0 6 3 . 8 0 2 . 4 2 2 . 4 4 0 . 0 5 F P r> O .1 2 9 6 0 . 0 9 3 6 0 . 0 0 0 1 O .1 0 5 8 O .1 2 8 8 0 . 8 2 5 0 1 2 1 2 2 ‑ 4 2 1 目 VALUE M e a n 3 . 6 3 3 3 3 3 3 3

407.

P r LSMEAN LSMEAN=CONTROL 2.09444444 0.0001 2.02777778 0.0001 6.77777778 ‑422‑ JU 薬剤 A 薬剤 B 薬剤J IC >ITI HO: VALUE l?f TREAT F ド Least Squares Means Adjustment for multiple comparisons: Dunnett‑Hsu 内 表3 P R O CG L M [各処理の直接効果の推定及び D u n n e t tの多重比較] P r F 0.1684 ﹁炉 E T y p e IExpected M e a n SQuare Var(Error) +3Var(SUBJECT(SEQUENCE)) +Q(SEQUENCE, C l, C 2 ) V a r ( E r r o r ) +3Var(SUBJECT(SEQUENCE)) V a r ( E r r o r ) +Q(TREAT, C l, C 2 ) ( P E R I O D ) V a r ( E r r o r ) +Q ( C l, C 2 ) V a r ( E r r o r ) +Q V a r ( E r r o r ) +Q ( C 2 ) Type I I( 1I1 ) Expected Mean SQuare . 7 6 Var(SUBJECT(SEQUENCE)) +Q ( S E Q U E N C E ) V a r ( E r r o r ) +2 V ar( Er r or ) +3V ar( S U B J E C T( S E Q U E N C E ) ) V a r ( E r r o r ) +Q(TREAT ) V a r ( E r r o r ) +Q ( P E R I O D ) V a r ( E r r o r ) +Q ( C l ) V a r ( E r r o r ) +Q ( C 2 ) > F Value 1 . 89 e2 7 U a1 F M e2 ﹄ m rヲ ﹁a2 e u 2 t q 2 r5 22 0 n B r a ‑ r ee M3 n a s a 内 ﹁ )E 'uu N rE HU nH rE F Fa M m FaFa'l ︑・ ・ ︑ ︒ ︐p? ul l' ll ‑ ‑ ヒ・ l J e1 0υnV14 U Y1 ︑ Fu?ll ・ r 19 0 f 71 e p V4 門 4 e L n t F5 E ED HHU H Ti A1 Ls es e ls uvu be 内 け at h l r l u a p uu・ ‑u n t nf e oE c d ne sN cE e t r u pe so uE Q e ︑ hHU?lI Fu ︑ F u Source SEQUENCE S U B JE C T( S E Q U E N C E ) TREAT P E RI O D C l C 2 Source SEQUENCE SUBJECT( S E Q U E N C E ) TREAT P E RI O D C l C 2 Mean SQuare 3.16666667 9 ︑ ︐ ノ 句3 r n r‑ U Contrast S S 6.33333333 u v D F 2 Contrast Carryover E f f e c t

408.

3.1.2 PROC1 Mしを用いた方法 母数効果のみの線形モデルは、以下のように表される。 y=Xs+ ε y 観測値の縦ベクトル X デザイン行列 β 未知の母数効果のパラメータベクトル ε 誤差ベクトル E(ε)= 0、V a r( ε )= σ 2 I a2 は分散 、 d e s i g n関数を用いてそれぞれの要因に対するダミー変数を作成する デザイン行列 Xは ことにより作成される。 n o r r n a le q u a t i o n )は 正規方程式 ( ( X‑X )b = X‑y と書くことができる。この方程式を解くために、 x‑ xの一般化逆行列 [X‑xの一般化逆 行列は、 G i n v関数を用いて計算]を両辺の左からかけると正規方程式の解 b =( X‑X ) ‑X‑y が得られる。また、各処理の最小二乗平均 L S M E A N は、ベクトル L を適当に定めることに より、 L b によって推定される。 R O CI M Lを用いて処理の直接効果を推定することを試みる。 このモデルに対し、 P ‑423‑

409.

① 3期 3剤クロスオーバーデザイン (直交ラテン方格)に対応するデザイン行列 Xと 観測値の縦ベクトル y を作成する。 ︑ / 一 Jl一 J ア 一 ザ 一 一 一 ﹀ べ 一 タ 一‑ ロ 一 日 オ一庁 一 ス一 6 力ノ﹁卜 期一タ削 剤一ツ 3一 セ 日 } ア s /く︑ 3二 叫 (直交ラテン方格)に対応するデザイン行列X s u b i e c t 被験者 1 8名/期 ↓ ↓ tr e at p e r i o d 3 3 seqE seq5 seq4 seq3 5eq2 5eq1 全平均 U uuuuuuuuuuuuuuuuuu bbbbbbbbbbbbbbbbbb 111222333444555666 123123123123123123 t t 2 3 > p p p 12 3 1100000100000000000000000100100 1100000100000000000000000010010 1100000100000000000000000001001 ( 0は観測値の縦ベクトルの要素) 111111000000000000000000000 処理の直接効果の制約条件 : τ 汁τ汁 τ, = 0 ( 0は観測値の縦ベクトルの要素) 000000000000000000000000111 ,, 00 10 01 x 3期 =5 4 シーケンス効果の制約条件:白 t +臼汁白,+臼,+as +四 ,= 0 :Yt+Y +y = O 1 u b je ct , tr e at , peri o d ) (For sequence, s (For全平均 U ) く 3 期 3~J クロスオーバーデザイン(直交ラテン方格)に対応するデザイン行列 x 時期の効果の制約条件 0 x 3期 ニ 54・ PROC IML/design 関数 PROC I M L / J 関数 被験者 1 8名/期 c1 c 2 o0 0 o0 0 ( 0は観測値の縦ベクトルの要素) 000000000000000000000000000 DODODO tpnutpnutpnutpnutpnutpTl 和日和 0 和日和日和 D 素 O 要︒要 D 要 0 要 ︒ 要 ︒ 要 ︒ のののののの ルルレルルレ ク 0夕日夕日夕日夕日夕 1 ベベベベベベ 縦︒縦︒縦︒縦︒縦︒縦 1 の 0 の 0 の日の 0 の 1 の 0 値値値値値値 測 ︒ 測 ︒ 測 ︒ 測 ︒ 測 1 測︒ 観D観O観0観O観 1観D はははははは ODODODD10000 ODD100 000100 001000 4 0 4 0 寸 1 4 0 4吋0 司 O MOHOMIHOMOHo ︒μ nμnμnμομnμ ふ ・1+tnHUI?nU ふt n︾ ふtnHV tnHV ふ1 1 202120202020 0μnμnμnμnμομ 汁0汁1J'O汁0汁0汁o 100000 nμT﹄ nμnunμnunμnunuFnunμnu +ITl 仲+lnu 仲+lnu 仲+lnu 仲+lnu 仲+anu 仲 条条条条条条 約 0約 D約 0約 D約 0 約日 制制制制制創 効効効効効効 の︒の︒の︒の︒の︒の︒ 果 ︒ 果 ︒ 果 D果︒果︒果︒ 験験験験験験 の︒の︒の︒の︒の︒の︒ 者︒者︒者︒者︒者︒者︒ nuvnHunHuvnHunHuv 被︒被︒被︒被︒被︒被︒ o0 0 o0 0 o0 0 o0 0 o0 0 o0 0 観測値の縦ベクトル y‑=[2.9,20 ,7 . 0, … … , ].9,7 . 0,O .0 ,……, 0 ,0 ,0 ,0 ,0 ,0 ,0 ,0 ,O J 下線部:それぞれの効果の制約条件に対応する値 ‑424一

410.
[beta]
② このデザイン行列 Xと観測値の縦ベクトル yを用いて、正規方程式の解 bを得る。
b ‑=[
μ
(全平均)
,αl'α23456

(
第l
シーケンス効果)
(
第l
シーケンス内
,s1
(
4
)
's2
(
4
)
's3
(
4
)
's1
(
5
)
's2
(
5
)
's3
(
5
)
's1
(
6
)
's2
(
6
)
's3
(日)
の第 J
被験者の効果)
,τ
l
'て 23
(
第l
シーケンスの第 k
時期に投与された処理の直接効果)
,111213
(
第k時期の効果)
,ρl'ρ2J ‑
(
第i
シーケンスの第k
‑
[時期に投与された処理の 1次の持ち越し効果)
、 ρ3= ρ
1‑P2
より推定される。
但し、 ρ3は
,s1
(
1
)
's2
(1)' s3
(
1
)
's1
(
2
),s2
(
2
)
's3
(
2
)
's1
(
3
),s2
(
3
)
's3
(
3
)

b
ニ[
3
.
6
3
3
3
3
3
3
,‑
0
.
1
1
1
1
1
1,‑
0
.5
8
3
3
3
3,‑
0
.0
8
3
3
3
3,‑
0
.6
3
8
8
8
9,O
.5
5
5
5
5
5
6,O
.8
6
1
1
1
1
10
.
2
2
2
2
2
2
2,‑
0
.
1
1
1
1
1
1,‑
0
.
1
1
1
1
1
11
.4
4
4
4
4
4
4ー
,1
.
5
5
5
5
5
60
.
1
1
1
1
1
1
1,‑
0
.2
2
2
2
2
2,‑
0
.2
2
2
2
2
20
.
4
4
4
4
4
4
4
,‑
0
.
3
3
3
3
3
3,O
.3
3
3
3
3
3
3,‑
5
.4
6
E
‑
1
4,‑
0
.7
7
7
7
7
8,‑
1
.1
1
1
1
1
11
.8
8
8
8
8
8
9,‑
0
.3
3
3
3
3
3,‑
0
.6
6
6
6
6
71
ー
,1
.
5
3
8
8
8
9,
ー
1
.6
0
5
5
5
63
.1
4
4
4
4
4
40
.
5
,
‑
0
.
0
5
5
5
5
6,‑
0
.
4
4
4
4
4
40
.
5
8
3
3
3
3
3,O
.0
8
3
3
3
3
3
J

上記に示した正規方程式の解 b
は
、

2
α
i 6
r
=
0,

k=
02
.章で示した制約条件

~-r; =0, ~ρs 二 0

ρ。=0 ρ
(。は第 1期)

を満たしており、また、 ρ
l及び、 ρ2 (1次の持ち越し効果)の推定値は、
ステートメントで、

P
R
O
CG
L
Mのm
o
d
e
l

s
o
l
u
t
i
o
nオ プ シ ョ ン ( 正 規 方 程 式 の 解 b
が出力される)を指定して得

られた結果 (ρ1:0
.583333333、 ρ2:0
.
0
8
3
3
3
3
3
3
3
) と一致する。

③

各処理の最小三乗平均 L
S
M
E
A
Nは、ベクトル Lを表 4に示したように定義すると L
bに
よって、

薬剤 A :
2.09444444 (=μ+τ1)
薬剤 B :2.02777778 (=μ+τ2)
薬剤 C ;
6.77777778 (=μ+τ3)
と推定される。これらの結果は、 P
R
O
CG
L
Mを用いて推定された各処理の直接効果(表 3P
R
O
C

G
L
M [各処理の直接効果の推定及び D
u
n
n
et
tの多重比較])と一致する。
表 4 各処理のベクトル L
ヰヰヰ

t
r
e
at(
1
) 薬剤JA 料 宇

L
=
{
1
8
村本

111 111 11111111111 1

t
r
e
at(
2
) 薬剤JB 科卒

L
=
{
1
8
料宇

333 333

333 333

111 111111 111111 111

t
r
e
at(
3
) 薬剤JC 村 本

L
=
{
1
8

333333

11 111 11111111111114251
8 00

66 6

o0}!18;

o18 0

666

o0}!18;

o0 18

666

o0}!18;

411.

3 .2 薬 剤 間 比 較 3 .2 . 1 PROCGLMを用いた方法 1.章に記したように「薬剤 Cは、薬剤 A及び薬剤Ij Bより、薬効が優れている。」こと を確認するために、 用いて、 P R O CG L Mの l s m e a n sステートメント(表 1P R O CG L M[ P r o g r a m J )を D u n n et tの多重比較(コントロール:薬剤 C ) を行った。結果を表 3に示す。 3 .1 .1節で示した表 3 P R O CG L M [各処理の直接効果の推定及び D u n n e t tの多重比較] L e a s tS Q u a r e sM e a n s A d j u s t m e n tl o rm u l t i p l ec o m p a r i s o n s :D u n n e t t ‑ H s u T IH O T R E A T V A L U E P r>I L S M E A N L S M E A N = C O N T R O L 薬剤 A 薬剤 B 薬剤 C 参考として、 0 . 0 0 0 1 0 . 0 0 0 1 2 . 0 9 4 4 4 4 4 4 2 . 0 2 7 7 7 7 7 8 6 . 7 7 7 7 7 7 7 8 e s t i m a t eステートメント(表 1P R O CG L M[ P r o g r a m J ) を用いて、薬剤 C をコントロールとして、薬剤聞の比較[検定の多重性を行わない]を行った。結果を表 5 に示す。 表 5 薬剤間比較[検定の多重性を行わない] P a r a m e t e r E s ti m a t e Tl o rH O : P a r a m e t e r = O P r>I T I S t dE r r o r0 1 E s t i m a t e 薬剤 A v s 薬剤 C 薬剤 Bv s 薬剤 C 4 . 6 8 3 3 3 3 3 3 ‑ 4 . 7 5 0 0 0 0 0 0 ‑ 9 . 7 1 9 . 8 5 0 . 0 0 0 1 0 . 0 0 0 1 0 . 4 8 2 1 9 3 2 1 0 . 4 8 2 1 9 3 2 1 3 .2 . 2 PROClMLを用いた方法 3 .し 2 節で得られた 3期 3剤クロスオーバーデザイン(直交ラテン方格)に対応する デザイン行列 x "と 正規方程式の解 b ' を用いて、薬剤問比較を試みる。 3 .1 . 2節で示したように、各処理の最小二乗平均 L S M E A Nは、ベクトル Lを適当に定め てL bによって推定される。また、その誤差分散は V( L b ) L( X‑X )L‑0 2より推定される。 ニ そこで、表 6に示したベクトル Lを用いて、薬剤 Aと薬剤 Cとの差の点推定値及びその 誤差を推定すると、 4 . 6 8 3 3 3 3及 び O . 4 8 2 1 9 3 2 1 (L(X'X)L' 02の平方根 =. JO.1388889x1 .6 7 4 0 7 4 0 7) 426一

412.

であった。同様に、薬剤 Bと薬剤 Cとの差の点推定値及びその誤差を推定すると、 ‑ 4 .7 5及 び 0 . 4 8 2 1 9 3 2 1であった。 これらの結果は、 P R O CG L Mの結果(表 5 薬剤問の比較[検定の多重性を行わない])と 一致する。 p r o b m c 関数の引数としてこれらの推定値と誤差の自由度 ( 3 0 ) を与え、 D u n n et tの 多 重 t2Jを行ったところ、 P R O CG L Mの結果(表 3 P R O CG L M [各処理の直接効果の推定及 比 較t び D u n n et tの多重比較])と一致する。 注2 ) P値= 1 ‑ p r o b r n c ( d u n n e t t 2 ",a b s (薬剤聞の差の点推定値/薬剤聞の差の誤差の推定値),.,3 0,2 ) 表 6 薬剤間比較のベクトル L 村本 t r e a t (1)ー t r e at ( 3 ):薬剤 Aの薬剤 C I こ対する差林宇 L = { O 000000 000000000000000000180‑18000 0 0 } / 1 8 ; 材 宇 t r e a t ( 2 )‑t r e a t ( 3 ):薬剤 Bの薬剤 C Iこ対する差料宇 L = {0 000000 000000000000000000 01 8‑ 1 8 000 00} / 1 8 ; 4 . おわりに 3期 3剤クロスオーバーデザイン(直交ラテン方格)に対し、 1次の持ち越し効果の 0( ρ 。は第 1期)に対応するダミー変数 ( c 1 制 約 条 件 2ρ5=o ρ。= ω を作成し l s m e a n sステートメントを用いることにより各処理の直接効果を推定し、薬剤間比較を簡 単に行うことができた。 P R O CI M Lを用いて、各処理の直接効果を推定し、薬剤間比較を試みたところ、 P R O CG L M を用いて得られた結果と P R O CI M Lを用いて得られた結果とは一致した。 5 . 参考文献 1 )W i l l i a m s,E . J.‑ E x p e r i m e n t a lD e s i g n sB a l a n c e dF o rT h eE s t i m a t i o nO fR e s i d u a l u s t . ].S c i .R e s .A 2 :1 4 9 ‑ 1 6 7 ( 1 9 4 8 ) . E f f e c t sO fT r e a t m e n t s .A 2) J O S E P HL .F L E I S S .T h eD e s i g na n dA n a l y s i so fC l i n i c a lE x p e r i m c n t s .J O H NW I L E Y 品S O N S1 9 8 6 .2 8 1 ‑ 2 8 9 . 3) W . G . C O C H R A N, G .M .C O X, t r a n s l a t o r田 口 玄 一 松 本 洋 . 新 版 実 験 計 画 法 1 . 丸 善株式会社 1 5 0 ‑ 1 5 4 ‑427‑

413.

4) D . B . O w e n, F o u n d i n g E d i l o r1 9 7 2 ‑ 1 9 9 , 1W . R .S c h u c a n y C o o r d i n a l i n g E d i l or .R . D E S I G N A N DA N A L Y S I SO FB I O A V A I L A B I L I T YA N DB I O E Q U I V A L E N C ES T U D I E S .M A R C E LD E K K E R, I N C . 1 9 9 2,2 9 5 ‑ 3 0 6 5 )S A S / S T A T ソフトウエア:ユーザーズガイド F i r s lE d i l i o n,株式会社サスインステイ チュートジャパン 6 ) 高橋行雄、大橋靖雄、芳賀敏郎、 S A Sによる実験データの解析、東大出版会 ‑ 4 2 8

414.

日本 S A Sユーザー会 (SUG I‑J) SASjSTAT(R)V e r s i o n 8における拡張点 小野裕亮 テクニカルサポート (株)SASインスティチュートジャパン Enhancementsf o rSASjSTAT(R)V e r s i o n 8 YusukeOno T e c h n i c a lSupportjSASI n s t i t u t eJapan 要旨 V e r s i o n 8において、 SAS/STATプロダクトに新しく追加される予定のプロシジャを簡単に e r s i o n 8より、 PLS回帰、調査データの計画および角開示ノンパラメトリック回 紹介する。 V e r s i o n 8における 帰、非線形ー一般化混合モデルなどがサポートされるようになる。初めに、 V 拡張点を概観した後に、各プロシジャについて簡単に紹介する。 ドト・ ワ キ V e r s i o n 8, PLS, SURVEY, VARIOGRAM, KRIG2D, KDE, TPSPLINE, LOESS, NLMIXED 1 Version8統計機能の概略 1 .1 新しく追加されるプロシジャ V e r s i o n 8の SASjSTAT(R)においては、下記のフ。ロシジ、ヤが新たに追加される予定で、 ある。これらのなかで、 PLS, VARIOGRAM, KRIDG2Dプロシジャは、 V e r s i o n 6 では制面版として使える。 • PLS回帰等を実行するための PLSプロシジヤ ・調査データの計画および解析を行うためのプロシジャ ‑ SURVEYSELECTプロシジャ ー SURVEYMEANSプロシジヤ 429‑

415.

‑SURVEYREGプロシジャ • 2次元データ(石主の埋蔵量/海の汚染など)を解析するためのプロシジャ ‑VARIOGRAMプロシジャ KRIDG2Dフロシジャ S e m i v a r i o g r a mの計算 K r i d g i n g ・ノンパラメトリックな手法を行うプロシジャの追加 ‑KDEプロシジャ 1次元・ 2次元のガウス型カーネル関数による密度推定 ‑LOESSプロシジャ局所回帰(Io c a lr e g r e s s i o n ) TPSPLINEプロシジャ薄板スプライン回帰 ( t h i n ‑p a l a t es p l i n er e g r e s ‑ s i o n ) .非線形混合モデル、一般化混合モデルを推定するための NLMIXEDプロシジャ 1 .2 既存プロシジャに対する拡張 既存のプロシジャに対しても、様々な機能が追加される。拡張点の一部を列挙する。 • GENMODプロシジャにおける機能拡張 一連結関数として累積ロジ、ットが追加。 一相関ではなく、オッズ、比に基づ、いたモデル ( A l t e r n a t i n gL o g i s t i cM o d e l )の 推定が追加。 ‑ GEE推定の結果に対して、対比 ( c o n t r a s t )などが指定できるように。 NPARIWAYプロシジャにおいて、データ値に基づく検定が追加。また 、乱数シミュレーションによる、並び替え検定が追加。 • UNIVARIATEプロシジャにおける幾つかの拡張 一平均および分散に関して、トリムした ( t r i m m e d )統計量や、ウィンザー化 した ( W i n s o r i z e d )統計量 一絶対平均偏差 (MeanA b s o l u t eD e v i a n c e )や G i n iの平均差 パーセント点に対する信頼区間 • REG, GLM, TTESTプロシジャなどにおいて、パラメータ推定値の信頼区間 が出力できるようになる。 ‑430‑

416.

1 .3 統計手法以外の拡張 統計手法の機能以外にも、幾つかの拡張がなされる。 • G UIを備えたアプリケーション C A n a l y s tA p p l i c a t i o n ) • OutputD e l i v e r ySystem(ODS) A n a l y s tA p p l i c a t i o nは、基本的な統計処理やグラフ作成をマウス操作で行うための アプリケーションである。 ODS機能は、解析結果を SASデータセット・ HTMLファイ ル等に出力する機能である。今までの SASでは、データセットへ出力できる情報が制 限されていた。そのため、データセットに出力できない情報を、 PROCPRINTTO を用いる等の不必要な「技」を覚えなければいけなかった。 ODS機能によって、すべ てのプリント出力される内容が、 SASデータセットや HTML形式のファイルなど に変換できるようになるので、今までの苦労が軽減されるはずである。 これから先の章では、プロダクト版・評価版として新しく追加される予定のプロシ ジャについて簡単に紹介していく。 2 PLSプロシジャ PLSプロシジャは、現パージ、ョン ( V e r s i o n 6 . 1 2 )において評価版にプロシジャであ る 。 V e r i s o n 8( V e r s i o n 7 )より正式なプロシジャになる。オプションの追加やオプシヨ ン名の変更があるが、基本機能は V e r s i o n 6 . 1 2と同じである。 PLSプロシジャは、次の 3分析をサポートしている。 • PLS回帰 .主成分回帰 ‑次元縮小回帰 ( r e d u c e d阻 止 r e g r e s s i o n ) これらの 3種の分析は、説明変数聞の相聞が高い時や、オブ、ザ、ベーションよりも 説明変数の数が多い時など、通常の回帰分析では対処できない場合に使用されている 分析である。これらの分析は、予測変数からなる行列 Xの次元を縮小して応答変数の 予測値を求めることで共通している。しかし、 3種の分析毎に次元を縮小する時の基 準が異なる。 上記 3つの分析の他に、 PLS法から派生した方法である SIMPLS法も PLSプロ シジャではサポートされている。 PLSプロシジャでは、何次元までの成分を求めるかを判断するために、テスト用 c r o s sv a l i d a t i o n )によって、 PRESS統計量を計算する機能 デー夕、もしくは交差検証 ( がサポートされている。 ‑431‑

417.

2 . 1 PLS回帰の概略 (標準化された)予測変数の η xk行列を X、(標準化された)応答変数の η xl 行列を Y とする。 nは標本数、 kおよび lは、それぞれ説明変数および応答変数の数を 表す。 PLS回帰を行う場合、元の値をそのまま用いるのではなく、変動の大きさを 揃えるために、平均 O分散 1に標準化したものが使われることが多い ( PLSプロシ ジャのデフォルトも、平均 O分散 1に標準化する) PLS回帰の第 1成分では、予 測変数の線形結合 tと応答変数の線形結合 U との聞の共分散を最大にするものが抽出 される(この共分散を最大とする線形結合は、 X'Yを特異値分解した結果をもとに計 算することができる)。 0 t l =XWl Ul =Yql 求められた t l, Ulは、「スコア J もしくは iPLSスコア」なと、と呼ばれている。 Pl, qlは、スコアを求めるための重み係数である。予測値は、予測変数の PLSスコ lに対する最小 2乗法によって求められる。 アt 文二t l( t it l ) ‑ l t iX す =t l ( t it l ) ‑ l t iY t lから予測値文およびYを求めるための係数 ( t it l )一l t iXおよび、 ( t it l ) ‑ l t iYは 、 負荷量 ( l o a d i n g )と呼ばれている。 なお、解を 1意にするためには適当な制約を係 数もしくはスコアに課さなければいけないが、 PLSプロシジャでは、 X の負荷量 ( t it l )一l t iXおよび、 Y の重み係数の大きさが lになるように設定している。 2次元 Y1に対して同じ処理を行うことによって求 日以降のスコアは、次式の残差行列 bfX 1, められていく。 X1 =X ‑X Y1 = Y ‑ Y 3次元目以降の行列忙対しても、同じ計算手1 ) 聞を適用していくことにより、各次元 のスコア、重み係数、負荷量が求められる。 2 . 2 主成分回帰、次元縮小回帰 PLSプロシジャでは、 PLS回帰の他に主成分回帰、次元縮小回帰を実行すること ができる。主成分回帰は、行列 Xに対する主成分分析のスコアを説明変数として回帰 分析を行う分析である。 PLS回帰と異なり、スコアを求める時に Yの変動を考慮し ていない。また、次元縮小回帰は複数の応答変数に対する予測値の分散を合計した値 が最大になるような係数を求める手法である。この手法は応答変数が 1つの場合には 通常の回帰分析と同じである。 PLS回帰は、予測変数 Xだけに基づいて次元を減少さ せる主成分回帰と、応答の説明される変動を最大化させる次元縮小回帰との中間に位 置するモデルだと言える。 いずれの分析も、最大次元までの全スコアを用いて求められた予測値は、回帰分析 のものと同じになる。 ‑432一

418.

2 . 3 解析例 PLS回帰の応用例として、計量化学におけるスペクトル測定における較正( c a l i ‑ b r a t i o n )がある。周波数毎に測定された光度によって、混合物に含まれている各物質 の含有量を予測することを考えてみよう。この時、スペクトル測定の結果から、より 正確な方法で測定された含有量を応答変数として予測式をたてる時に、通常の回帰分 析では予測精度が悪くなりやすい。このような測定データは、サンプル数に比べて説 明変数が多くなり、かつ、周波数毎の測定値は相関が高いからである。 次に示す データは、アミノ酸、チロシン、トリプトファンの各濃度が既知であるサンプルに対 して、適当な周波数から 3 3点だけを選択して、スペクトル測定された結果(一部)で ある (Umetrics1995)。このデータは、 PLSフロシジャの例題集のなかで引用されて いる。 da 七a f luor5; 七 nO BSNAM $ fi‑f30 TOT̲LOG TYR̲LOG TRY̲LOG @; inpu da 七a lines; 1 43七rp6 ‑5.91450 ‑5.91821 ‑6.90776 ‑5.42843 ‑4.11659 ‑5.10275 ‑4.65963 ‑4.35053 ‑4.02295 ‑3.84905 ‑3.63439 ‑3.63439 ‑3.57199 ‑3.51325 ‑3.63439 ‑3.57199 ‑3.77226 ‑3.77226 ‑3.84436 ‑3.93223 ‑4.01738 ‑4.02295 ‑4.11659 ‑4.22673 ‑4.49184 ‑4.65963 ‑4.85491 ‑5.42843 ‑5.10275 ‑5.42843 ‑6 ‑8 ‑6 2 59mix6 ‑5.90345 ‑5.90345 ‑5.90345 ‑5.08159 ‑4.21313 5.08321 ‑4.83836 ‑4.63873 ‑4.47414 ‑4.21313 ‑4.00085 ‑4.09835 ‑4.00085 ‑4.00085 ‑3.90704 ‑4.00085 ‑4.09835 ‑4.09835 ‑4.20639 ‑4.09835 ‑4.21313 ‑4.21313 ‑4.33514 4.47414 ‑4.63873 ‑4.83836 ‑4.83710 ‑5.08482 ‑5.41037 ‑5.41037 ‑6 ‑7 ‑6.04576 3 51mix6 ‑5.90712 ‑5.90712 ‑5.41485 ‑4.84343 ‑4.21313 ‑4.84343 ‑4.84343 ‑4.48295 ‑4.34281 ‑4.00633 ‑4.00633 ‑3.91202 ‑3.83044 ‑3.83044 ‑3.75502 ‑3.91202 ‑4.00633 ‑4.00085 ‑4.21313 ‑4.21313 ‑4.33514 ‑4.48295 ‑4.48295 ‑4.64183 ‑4.84089 ‑5.08806 ‑5.08806 ‑5.41485 ‑5.41485 ‑5.41485 ‑6 ‑6.60206 ‑6.12494 .省略. データにおける予測変数間の相関は非常に高い。相関行列に対する固有値を求めて みると(主成分分析の結果)、第 1主成分だけ 77%もの寄与率がある。 ‑433一

419.

Eigenvalue Difference Proportion Cumulative PRIN1 23.3474 17.2028 0.778248 0.77825 PRIN2 6.1446 5.8436 0.204820 0.98307 PRIN3 0.3010 0.2102 0.010034 0.99310 PRIN4 0.0908 0.0601 0.003027 0.99613 PRIN5 0.0307 0.0009 0.001025 0.99715 PRIN6 0.0298 0.0102 0.000995 0.99815 次に示す表は、 PLS回帰・主成分回帰・次元縮小回帰の各次元のスコアが、応答 変数・予測変数の変動に対して占める割合(累積寄与率)である。これらの寄与率お よび累積寄与率は、 Version8より追加された VARSSオプションによって算出される。 なお、次元縮小回帰における因子の最大次元は、応答変数からなる行列 Y のランク である。この例では 3応答変数なので、 RRRの列では 3次元までしか計算されてい ない。 予測変数側 (次元) PLS PCR R R R 1 77.68 77.82 59.00 2 98.31 98.31 93.17 94.89 3 99.31 99.31 4 99.56 99.61 5 99.69 99.72 6 99.78 99.81 応答変数側 (次元) PLS PCR RRR 一一一一一一一一一一一一一一一一一一一一一一ー一一一一一一一一一一一一一一一一一一一一一一一一一一ーー一一一一一一一一一一一一一一一一一一 1 47.80 47.10 52.96 2 86.77 86.72 92.35 3 93.66 93.42 99.99 4 94.08 5 95.14 97.15 6 97 14 95.20 94.16 PLS回帰の特徴は、予測変数、応答変数の両方の変動を説明してくれるスコア を算出することにある。上記の表は、 PLS回帰の特徴を良く表している。 PLSス コアによる累積寄与率は、次元縮小回帰のものに比べると、応答変数側では小さいが ‑434

420.

、予測変数に対しては高いことが分かる。また、主成分スコアに比べると(この例で は僅かばかりであるが)亡の関係が逆になっていることが分かる。 2 . 4 次元数の設定 予測の精度を測る方法としては、回帰分析と同様、 PRESS(PredictedR E s i d u a l Sumo fS q u a r e s )が考えられている。 PRESS統計量は、モデルを推定するデータと、 残差 2乗和を計算するデータとが分けられて計算される。通常の残差 2乗和は、次元 数を大きくすると必ず、小さくなるが、モデルを推定するセットと、モデルを検証する セットとが分割されているので、 PRESSは次元数を増加させても(説明変数の数を 増やしても)必ずしも減少しない。 モデルを推定するための学習用データと残差 2乗和を計算するためのテスト用 データとを分離する方法には、大きく分けると 2種類ある。 lつは、学習用データは モデルの推定しか用いず、テスト用データは残差 2乗和の計算にしか用いない方法で ある(この方法は、テストサンプル法などと呼ばれている)もう lつの方法は、推定 用とテスト用データを何回か入替えることによって計算を行う方法(交差検証法)で ある。 PLSプロシジャでは、いずれの方法もサポートされており、 PRESS統計量が 最小になる次元数を選択することができる。 次元選択における他の機能として、 CVTESTオプションによって、最小となった PRESS統計量と有意かどうかをシミュ ーレーションによって求める機能 ( v a nd e rV o e tの検定)が実行できる。この検定は、 最小の PRESS統計量と、モれより低い次元の PRESS統計量との聞に統計的に有意な 差があるかどうかを確認するためのものである。 CVTESTオフ。ションを指定した場 合には、 PRESSが最小となっている次元ではなく、統計的な有意差がない次元までを 用いて予測式が算出される。 以下のプログラムは、 PLS法の各次元における PRESS統計量を求めるものである。 PRESS統計量の求め方は、 CV=オプションで変更することができる。 fCV=ONEJ という指定では、交差検証法で lオブザベーションずつテスト用データにした結果が 算出される。 5 1‑ 1 0 ・ P A ︑ 1‑ d ee +U+U み ‑ ‑h a . ︐ . ︐ isR 'wmd n x o=FD sto shu eσbyL r 1 ・ r σbe= ewa Rxt a std up& 3+LM1‑ yLu p P&5 ‑‑c ・工︑d r toPA eo ts0 varss c v = o n e ; model TOT̲LOGTYR̲LOGTRY̲LOG=F1‑F30 / solution; output out=out1 pred=p1 p2p3xscore=t yscore=u; r u n ; 上記のプログラムを実行すると、次ページに示すように PRESSが最小となるのは 6次元までのスコアを用いた時であることが示される(実際に出力されているのは、 ‑435‑

421.

"RootMeanPRESS"である。これは、 PRESSを平均して平方根をとった値である)。 C Vオフ。ションを指定した場合、自動的に PRESS統計量が最小となる次元まで、の 負荷量、スコア、重みしか出力されなくなる。また、選択された次元まで、のスコアを用 いて予測値が計算される。 予測値をデータセットに出力したい場合には OUTPUT ステートメントを用いる。 PRED=オプションによって指定された 3変数 Pl, P2, P3 に出力される。 OUTPUTステートメントの XSCORE=, YSCORE=オプションでは、各次元の スコアが出力される。また、 ODSステートメントによって重み係数、負荷量もデータ セットに出力することができる。解析結果に対して影響度が強いサンプルを検出した り、予測に対して不必要な変数を見付けるために、これらの出力データセットからグ ラフを作成することができる。 交差検証法の結果 Cross Validation for the Number of Ex tracted Factors Number of Root Extracted Mean Factors PRESS 。 1 .03125 1 0.770246 2 0.409372 3 0.299544 4 0.284256 5 0.256015 6 0.235699 7 0.264033 8 0.298347 9 0.287596 10 0.286626 1 1 0.296019 12 0.282958 1 3 0.367941 14 0.454779 1 5 0.538659 M i n i m u r u root mean PRESS Minimizing number of fac七ors ‑436 0.2357 6

422.

3 SURVEYSELECT, SURVEYMEANS, SURVEYREG プロシジャ "SURVEY"で声合まる 3種のプロシジャ CSURVEYSELECT, SURVEYMEANS, SUR‑ VEYREGプロシジャ)は、調査データの計画・解析を行うためのプロシジャである。 3 . 1 SURVEYSELECTプロシジャ SURVEYSELECTプロシジャは、様々な方法に基づき、 SASデータセットから 標本を抽出するためのプロシジャである。標本抽出に使われる手法を大まかに分類す ると、 ‑等確率抽出法 ( e q u a lp r o b a b i l i t ys a m p l i n g ) ・確率比例抽出法 ( P rゆ a b i l i t yP r o p o r t i o n a lt oS i z e:PPSと略される) ‑多段階抽出法 のように分けることができる。等確率抽出は、あるデータもしくは層内の抽出単位が等 s i z e ) J に比 しい確率で抽出する方法である。確率比例抽出法は、抽出確率を「サイズ ( 例させて抽出するものである。多段階抽出法では、 2段階、 3段階に分けて抽出を行う 方法である。前 2つの抽出方法は、 SURVEYSELECTフロシジャを l回、呼出しただ けで実行されるが、多段階抽出法を実行するには、その段階数だけ SURVEYSELECT プロシジャを実行しなければいけない。 STATSオフションによって抽出確率を、 JTPROBオプションによって同時抽出確率をデータセットに出力することができる。 以下に、 SURVEYSELECTプロシジャがサポートしている抽出方法を述べる。 3 .1 .1 等確率抽出法 SURVEYSELECTプロシジャでは、等確率抽出法として次の方法を選択すること ができる。英語名のなかで大文字に書かれた部分は、 METHOD=オプションに指定 する時の名前である。 S i m p l eRan domS a m p l i n gw i t h o u tr e p l a c e m e n t ) ‑非復元ー単純無作為抽出 ( .系統的抽出 (SYStem:J‑t i crandoms a m p l i n g ) ・逐次的無作為抽出 ( S E Q u e n t i a lrandoms a m p l i n g ) ‑復元ー単純無作為抽出 ( U n r e s t i c t e dRa ndomS a m p l i n g(SRSw i t hr e p l a c e m e n t ) ) . (比例割当に基づく層化抽出法) とのなかで、逐次的無作為抽出法 (METHOD=SEQ)は、「ゾーン」から均等数だ けオブザベーションが選択されるようにするための抽出法である。例えば、母集団の 大きさが 1 0 0 0のものから 1 0 0を抽出する場合には、データセットのある箇所から数え ‑437‑

423.

て 、 1番目から 10番目で 1標本、 11番目から 20番目で 1標本、 21番目から 3 0番目で 1標本、、、というように抽出を行っていく。系統的抽出法と異なり等間隔で 選択される訳ではなく、また、単純無作為抽出と異なりデータのある部分から固まっ て抽出されることがない。との方法を用いることにより、系統的な誤差を削除しなが らも、意味のあるデータの並びゃ連続変数を考慮した抽出を行うことができる。 STRATAステートメントに層別変数が指定されている場合には、層化抽出が行 われる。抽出確率を 1つだけ設定した場合には、比例割当に基づく抽出が行われる。 この方法では、データセット中の層 hにおけるオブザベーション数を Nh、抽出確率を Tとした場合、層 hからは NhX r数だけの標本を抽出される(ただし、 NhX rが整数 にならない場合、 SURVEYREGプロシジャは、もっとも近い整数が使われる。また 、各層から選択される最小および最大のサンプル数も設定するととができる)。 層別変数を設定した際に、比例割当ではなく、各層毎に抽出確率を変更することも 可能である。また、同様に、抽出確率ではなくサンプル数を設定することもできる。 3 .1 .2 確率比例抽出法 日本全国から選挙区を人口に比例した割合で抽出を行いたい時、ある地域の病院を 規模に比例した割合で抽出を行いたい時など、抽出確率をサイズ ( e x .人口数、病院の 規模)によって変更したい時がある。 SURVEYSELECTプロシジャでは、 SIZEステ ートメントを用いることにより、このような確率比例抽出を行うことができる。 ‑非復元ー確率比例抽出法 ( Hanurav‑ V i j a y a n法:P r o p a b i l i i t yP r o p o r t i o n a lt oS i z e w i t h o u tr e p l a c e m e n t ) ‑非復元ー確率比例抽出法 ( S a m p f o r d法:SAMPFORD) .逐次的ー確率比例抽出法 (PPSS E Q u e n t i a ls a m p l n g ) ・系統的ー確率比例抽出法 (PPSSYStematics a m p l i n g ) ・復元"確率比例抽出法 (PPSs a m p l i n gWithR e p l a c e m e n t ) なお、各層から 2標本だけを非復元ー確率比例抽出する場合には、 Brewer法と Murthy 法を選択できる。 3 . 2 SURVEYMEANS, SURVEYREGプロシジャ SURVEYMEANS, SURVEYREGプロシジャは、層化抽出やクラスター抽出法で 得られたデータの解析を行うためのプロシジャである。名前が示すように、それぞれ 要約統計量および回帰分析を実行するためのものである。 両プロシジャとも、パラメータの標準誤差は、 1次の項までのテイラー展開を行っ た近似値から求めている。他にも、ブートストラッフやジャックナイフ法で求める方法 も考えられているが、現在のところ V e r s i o n 9 (以降)でサポートされていく予定になっ ている。 ‑438‑

424.

SURVEYMEANS, SURVEYREGフロシジャの文法は、 MEANS, REGプロシジャ とほとんど同じである。主な違いは、クラスターの変数を指定するための CLUSTER ステートメント、層別変数を指定するための STRATAステートメントが用意されて いる。また、 SURVEYREGフロシジャのほうでは、 CLASSステートメントや CON‑ TRAST , ESTIMATEステートメントが用意されており、推定されたパラメータと分 散共分散行列に基づき、分析者が興味のある線形仮説の検定を実行することができる。 SURVEYMEANSプロシジャでは、平均を求めるのと同じ計算手順によって、名 義変数における各水準の割合に対する推定も行うことができる。 3 . 3 プログラム例 例 1と例 2では、 SURVEYMEANS/SURVEYREGプロシジャのおおまかなイメー ジを掴むために、クラスター抽出・層別抽出の機能を紹介する。その時、既存のプロ シジャである MIXEDのプログラム例との対比を行った。例 3では、有限母集団から の層化抽出標本に対する回帰分析の例を示した。 3 . 3 . 1 例 1 ‑クラスター抽出 (与 i 毛(!~tI,) SURVEYMEANSプロシジャの CLUSTERステートメントに指定された変数は、 第 1次抽出単位 ( P r i m a r yS a m p l i n gU n i t s )を含む変数とみなされる。標準誤差や信頼 区間を計算する時には、この第 1次抽出単位聞の変動(分散)が考慮されて計算が行 われる。 SURVEYMEANSプロシジャのクラスタ抽出に対する信頼区間は、 MIXED プロシジャのものと近い値になる。次に示すデータステッフでは、無限母集団からの 抽出を想定して乱数によづて変数 Yを生成している。データの構成は、 4クラスター でクラスターの大きさがすべて 5標本になっている o da 七a C LUSTER; ; do CLUS=l 七o 4 G=r担 nor(12345); ; do S=l 七o 5 Y=G+r臼 nor(12345); ou 七p u 七; 色 nd; end; run; 下記のプログラムにて、 MIXEDフロシジャが実行される。クラスターの変数 CLUS を変量効果に指定している。 ‑439

425.

proc mixed da 七a =CLUSTER; class CLUS; model Y= /solu 七i on c l ; random CLUS; run; MIXEDプロシジャの結果は、下記のようになる。 Solution for Fixed Effec七S S七andard t l Es七imate Error DF t Value Pr > I Effect Intercep七 ー 0.08162 0.5066 3 ‑0.16 0.8822 Lower Upper ‑1.6937 1.5305 F し︾ 1‑ 姐 E e AA 44 AA mi n u 司 + u q s m 阻; ev‑ P 4 r cu ov ‑ ‑aa 上記と同じ結果が、 SURVEYMEANSプロシジャによって得ることができる。次の SURVEYMEANSプロシジャでは、 CLUSTERステートメントに、その効果を指定し ている。また~ MEANSプロシジャによって第 1次抽出単位(クラスター)の変動を 無視して計算した時の信頼区間も算出した。 run; 七a =DATA1; proc surveymeans da cluster CLUS; var Y ; r u n ; ‑440‑

426.

The MEANS Procedure v d e aQd .14 守ム wh DRu uu 臼 門V 一0.0816169 vw qu ST .l v d 守 ム a h 且 Mea Upper 95% CL for Mea 且 CL for Mea 且 一0.5933641 0.4301303 The SURVEYREG Procedure S七d Error Lower 95% Upper 95% Mea 且 of Mean CL for Mea 且 CL for Mea 且 20 ‑0.081617 0.506570 ‑1.693750 1 .530516 Variable N y SURVEYMEANSプロシジャの信頼区間や標準誤差は、 MIXEDプロシジャと同 じ値になっている(アンバランスのときにはこれら 2つのプロシジャは互いに異なった 結果になる) SURVEYMEANSフロシジャや MIXEDフロシジャの結果を、 MEANS プロシジャと比較すると平均に対する推定値自体は同じだが、その標準誤差が大きく 異なっていることが分かる。この例における MEANSフロシジャの結果は、標準誤差 を小さめに推定してしまっている。 0 3.3.2 例 2 ‑層化抽出法 STRATAステートメントを指定すると、層化抽出法で得られたデータに対する解 析を行うことができる。先程のクラスター抽出では、第 1次抽出単位聞の変動を考慮、 して標準誤差や信頼区間が計算されたが、こんどは層の効果を考慮して推定が行われ る。ここでも、無限母集団から当確率抽出されたサンプルに関する解析を、 MIXED プロシジャと見比べながら実行してみよう。 次のデータは、無限母集団から比例割当で層化抽出されたことを想定したものであ る(どの標本も、当確率で抽出されている)。 ‑441‑

427.

da 七ada 七a 1 ; 七 s tra 七ay @@; inpu 4 Qd Eu ロU 円4 • qu 54 円4 q U qU4ム 4qu 845 寸ム円 円4 q u 4 円4 q U 4ム 円4 4ム 円 4 q U EUEU 4ム 円 4 q u 4ム 941 cards; 次の M医 EDプロシジャでは、グループ毎(層毎)に平均および分散が異なるモデ ルを仮定している。また、 LSMEANSステートメントにて、各グループの母平均の推 定値を、各標本数で重み付けて平均している。 proc mixed data=data1; class strata; model y=s七rata/solution; repeated /groUp=5~rata; estimate " T E S T ' . intercept 1 2 l ; strata3 4 5 /divisor=12 c run; MIXEDプロシジャと同様の結果が、下記の SURVEYREGプロシジャによって得 られる。 LISTオプションは、各層毎の標本数および抽出確率を表示させるためのオ プションである。 proc surveymeans data=data1; s 七r ata strata /list; var y ; r u n ; 結果は下記のように出力される。 ‑442

428.

The SURVEYMEANS Procedure Data Summary Number o f Strata Number o f Observations 3 1 2 Stratum Information Stratum Index 1 2 3 七a stra 1 2 3 N Obs 3 4 5 Variable y y y N 3 4 5 Statis七i c s Variable N y 1 2 Me回 Std Error o f Mean Lower 95% CL for Mean Upper 95% CL for Mean 4.808333 1.109685 2.298052 7.318615 3 . 3 . 3 例 3 ‑有限母集団からの層化抽出標本に対する回帰分析 上記の 2例は、無限母集団からの抽出を想定しており、また、等しい確率で選択さ れた標本を仮定していた。この例では、有限母集団から層化抽出された標本をもとに 回帰分析を行う例を示す。 B, C, D を層別にして各部 データセット COMPANYは、ある会社において、部署 A, 2名に対して年齢および年収が測 署から 3名ずつ抽出した結果である。抽出された計 1 B:20%, C:30%, D:10%である。 定された。各部署における抽出率は、 A:10%, このように抽出率が層毎に異なる場合、抽出率が含まれたデータセットを予め用意 する必要がある。 2番目のデータステップでは、 抽出率をもっデータセット DSGN を作成している(実行結果は省略)。 ‑443一

429.

data COMPANY; input SECT$ AGE INCOME@@; LINCOME=log(INCOME); cards; A 48 450 A 34 381 A 21 360 B 23 472 B 31 700 B 45 708 C 39 520 C 44 540 C 35 750 D 29 420 D ヌ1 390 D 32 380 data DSGN; input SECT$ ̲RATE̲; cards; 4ム 内 4 q U 4 ム unu 円 unununU ハ AAEU proc surveyreg data=SASJAPAN r=DSGN; class SECT; strata SECT /list; model LINCOME=AGE SECT AGE*SECT; run; 4 VARIOGRA 乱1 , KRIDG2Dプロシジャ VARl OGRAM, KRlDG2Dプロシジャは、 2次元データを分析する時に使われる s e m i v a r i o g r a r n、k r i d i n gをサポートしている。これらのプロシジャも、 P L Sプロシ ジャと同様、 Version6においても評価版のプロシジャとして使用することができる。 これらのプロシジャに関しては、既に以下のテクニカルレポートが出版されている」 SASjSTATT e c h n i c a lRepo 比 S p a t i a lP r e d i c t i o nUsingSASSystem ここでの説明は省略する。 5 KDEプロシジャ KDEプロシジャは、 1次元もしくは 2次元上のカーネル密度推定 ( K e r n e lDensity Estimation)を行うためのフロシジヤである。 1変量の密度推定は次の式に従って行 われる。 j (吋 = 立 山 一 Xi) ‑444一

430.

Xi ( i=1, 2γ.., η )は観測値を表している。 ψhはカーネル関数と呼ばれているもの である。 ψhの部分には様々な関数が使えるが、 KDEプロシジ、ヤではカーネル関数ψh として下記のガウスが使われる。 山)二」 ex p ‑毛 ) v 2 : 主‑h‑ ‑ ‑ .( ¥ 2 h : b a n d w i d t h )と呼ばれているパラメータで、あり、この設定に ここで、 hはバンド幅 ( よって推定結果は異なってくる。分析者自身が指定するととも可能であるが、 AMISE (漸近平均積分 2乗誤差)を最小にするという基準と照らし合わせて幾つかの方法が 考え出されている。 KDEプロシジャでは、次の 4方法がサポートされている。 • S h e a t h e r ‑ Jo n e sのプラグイン法 ・正規基準法 (METHOD ニS J P I :S h e a t h e r ‑ J o n e sPlugI n ) (METHOD=SNR:S i m p l eNormalR e f e r e n c e ) • S i l i v e r m a nの経験則洛 (METHOD=SRT:S i l v e r m a n ' sr u l eo fthumb) ‑過平滑化法 (METHOD=OS:Oversmoothed) l変量の場合、 S h e a t h e r ‑ J o n e s法がデフォルトで適用される。 2番目の正規基準法 は、正規分布にしたがっているものとして hを計算している。 2次元の場合には正規 基準法 (METHOD=SNR)がデフオ jレトになる。 KDEプロシジャでは、その他にも次 の機能がサポートされている。 ‑推定された密度関数に基づき分位点や範囲を求める機能 ・ビンを用いる方法。特にデータ数が多くなった時に有効。 6 TPSPLINEプロシジャ 6 . 1 TPSPLINEプロシジャの概略 TPSPLINEは、薄板スプライン回帰 ( t h i n ‑ p a l a t es p l i n er e g r e s s i o n )を実行するため のプロシジ、ヤで、ある。スプライン回帰は、局所回帰 (LOESS)と同様、「ノンパラメト リックな回帰」に分類される手法である。スプライン回帰における目的関数はな最小 2乗基準に滑らかさを表す「罰則(ペナルティ ) J を付けたものになっている。 TPSPLINEプロシジャで扱えるのは、下記に示す"セミパラメトリッグ'なモデル である。 Y i=f ( X i )+Z i β+白 通常の回帰分析と異なるのは、 f ( X i )という滑らかな関数が想定されていることで ( 勾)という関数のため、このモデルに対して最小 2乗推定を行うと、すべて ある。 f の点を通るようになってしまう。罰則付き最小 2乗基準は、次式のような形をとる。 ‑445‑

431.

川)=活(約一 j ( ね)‑Z i s ) 2+入 ゐ(1) 通常の最小 2乗基準と異なるのは、入 h( f )という罰則(ペナルティ)が付けられて s r n o o t h i n gp a r a r n e t e r )と呼ばれている。こ いることである。入は、平滑化パラメータ ( は滑らかになっていくが、推定に用いているデー の値を大きくすればするほど関数 f タへの適合は悪くなっていく。 薄板スプラインでは、 12次までの偏微分を 2乗して、それを積分した値」という 罰則を設けている。例えば、 Xl,ぬという 2変数からなる薄板スプラインは、次のよう な罰則となる。 ( 0 0 (00θ2 j, 2 θ2 j θ2 j 2 川 ρ ( げ 閃 円 F) ド =jI I 卜 ( トT 寸l~ + 2 斗 [ 卜 一 一 「 討 f 叫 + [ ト 一 「 す 寸 4 f 戸 2 り 仰 切 ) d x仰 一∞ j一∞ 8Xf .‑ ' 8 X 1 8 x 2 J .' 8 x t なお、 TPSPLINEプロシジャにおいて、罰則項における微分の次数は M =オプショ ンで変更できる(デフォルトは 2)。 6 . 2 誤差分散の計算 誤差分散は、従来の回帰分析における枠組みを拡張して推定される。次のように、 実測値 (y )から予測値(:0)を求める行列を A(入)とする。 A(入 ) は 、 Aが入の関数となっ ていることを表している。 。 =A (入)y この行列 Aを、回帰分析のハット行列と同じように扱えば、モデルの自由度をかα田 ( A (入)) r a c e ( A (入 ))と考えることができる。誤差分散σ2の推定値は、 、誤差の自由度を η t コ 残差 2乗和 σー n‑t rαc e ( A (入 )) J と見なすことができる。この推定値は、予測値の信頼区間を求める時にも使われる。 6 . 3 GCVの出力 TPSPLINEプロシジヤでは、 GCV(G e n e r a l i z e dC r o s sV a l i d a t i o n )によって平滑化 パラメータを選択することができる。何も指定しなければ、 GCVの値が最小となる ような平滑化パラメータ入の値が自動的に選択される。 LAMBDA=や LOGNLAMBDA=オプションにて複数の平滑化パラメータを指定 o glQη ( ×入)が‑ 3 すると各平滑化パラメータに対応した GCVが算出される。次表は、 l から 4までの GCVを求めたものである。 ‑ 4 4 6一

432.

GCV function GCV ユog10(n*L阻 bda) ‑3.000000 1 .804128 ‑2.000000 1 .659474 。 ‑1.000000 1.367628 1.235703 1.093632* 1.000000 2.000000 1.103973 3.000000 1.766940 4.000000 2.150682 CVva ユue. Note: * indicates minimum G n so c ‑ ‑ sm 臼 it +νa ‑ ュ ・1 +LM+LM a s +LMr qu vda ︑J 1 ム ー uム m ・ aa dn mH be 4 L W vI ︼﹃白 mp&qM qMO a q M nu+LMAU 1 440 ・ gos T * n1 ム n‑la rkhu me ‑os R 1.567488 0.320276 59.942119 7 LOESSプロシジャ LOESSプロシジャは、局所回帰 ( l o c a lr e g r e s s i o n )を行うためのプロシジャである。 局所回帰は、前述の薄板スプラインと同じ「ノンパラメトリック回帰」に分類される 手法である。 Version6においても局所回帰は SASjINSIGHT(R)プロダクトでサポートされてい るが、グラフ上に推定した曲線を描くことしかできない。曲線上の値をデータセット に保存したり、その信頼区間を求めたりすることができなかった。 SASjINSIGHT(R) プロダクトでは、説明変数が l変数の場合しか実行できない。 Version8における LOESSプロシジャでは次のような機能を持ち合わせている。 ‑複数の予測変数を用いた解析が可能。 .信頼区間の計算 ・反復重み付き法を実行することによるロバストな推定。 .別のデータに対して、スコアを付けることができる ‑447

433.

8 NL乱1IXEDプロシジャ NLMIXEDプロシジャは、変量効果をもっ非線形モデルや一般化線形モデルを推定 するプロシジャである。 現パージョンにおいては、これらのモデルを推定するためのサンプルマクロとして 、%NLINMIXおよび%GLIMMIXが提供されているが、これらのマクロとは異なっ た推定方法が採用されている。両マクロは、 M医 EDプロシジャと、非線形モデルも しくは一般化線形モデルとの推定を交互に行うことにより、推定値を求めていたが、 NLMIXEDプロシジャで は、対数(周辺)尤度関数(尤度関数の変量効果部分を積分し た関数の対数をとったもの)の近似値を直接、最大化するアルゴリズムをとっている。 また、 CALISプロシジャなどと同様、 SAS/ORプロダクトの NLPプロシジャ で採用されている非線形最適化のルーチンが使えるようになっている(マニュアルの 多くが、非線形最適化ルーチンに関するオプションに割かれている)。 5 8 . 1 サポー卜されている推定方法 非線形一般化混合モデルでは、次に示す関数 最大にすることを目的としている。 u 周辺分布の対数をとった関数J )を ニ会吋山川i)q州 I I ここで、 ω が応答変数、 Xiが説明変数で両方とも観測される値である。叫が変量効 果を表す変数で、ゆとごとが推定するべき固定パラメータである。変量効果に対する積 分が混じっているため、この周辺尤度関数を最大化することは難しい。 実にいろいろな近似方法が唱えられているが、 NLMIXEDプロシジャで、サポートす る予定の方法は以下の通りである。 • METHOD=FIRO(変量効果 =0の周りでテイラー展開して近似) • METHOD=GAUSSA d d a p t i v eG a u s s i a nQ u a d r a t u r e (デフォ jレト) • METHOD=HARDY(変量効果が 1つの時にしか使えない) • METHOD=ISAMP( a d a p t i v ei m p o r t a n c es a m p l i n g ) 8.2 モデルの指定方法 非線形混合モデルと一般化混合モデルについてのプログラム例を下記に示す。 8 . 2 . 1 例 1 :非線形モデル Y i j=[ ( b l+u i l ) / ( l十 e x p [一( d i j‑b 2 ) / b 3 ] ) ]+巴り ‑448‑

434.

Y i jは第 iブロックにおける j 番目の応答、 di jは対応している説明変数を表している。 b1, b b 3は固定効果である。 Uilは変量効果であり N(O, σu2)に従っていると仮定する。 2, 誤差句も N ( O, ae2)に従っていると仮定する。 このモデルは、次のように指定を行う。 proc nlmixed data=tree; parms bl=190 b2=700 b3=350 s2u=1000 s2e=60; num = bl+ul; ex = exp(ー (d‑b2)/b3); den = 1 + exi model y ‑ normal(num/den, s2e); s2u) subject=tree; random ul ‑normal(O, run; 8.2.2 例 2 :2値データに対するロジスティックー正規モデル log(JL)=Fo+仰 j+Ui 1‑ P ij u d f ' 変量効果に従っており、 N(O, σe2)と表す。他の sO, slは固定パラメータ。 proc nlmixed data=infection; parms betaO=一1betal=l s2u=2; eta = betaO + betal*t + u ; expeta = exp(eta); p = expeta/(l+expeta); p); model x ‑binomial(n, s2u) subject=clinic; random u ‑normal(O, predict eta out=eta; estimate 'l/betal' l/betal; run; ‑449‑

435.

終わりに 注意 現在の段階ではV e r s i o n 8は開発中であり、ここで記載した内容が変更される可能 性があります。 参考資料がダウンロードできるホームページ V e r s i o n 8( V e r s i o n 7 )において追加される各フロシジャのドキュメントの D r a f t (PDF形式のファイル)が、米国 SASI n s t i t u t e社の下記URLよりダウンロードでき ます。これらの PDF形式のファイルを見るためには、 Adobe社の A c r o b a t ( r )Reader が必要ですo ( ( f ' http:// また、下記の URLに米国 SUGIで開発者が作成した論文がアップされています。 ② 同: / / ω ω saω mjm仰 的m ψゆ 24.html ‑450

436.

論文発表 品質管理

437.

日本 S A Sユーザー会 (SUG I‑J) 製造業における SASシステムの活用場面 石井宏司 株式会社 SASインスティチュートジャパン プロフエツショナルサービス本部コンサルティング、部 Theadvancedu t i l i z a t i o nsceneso ft h eSASsystemf o rm a n u f a c t u r i n gi n d u s t r i e s H i r o s h iI s h i i ,P r o f e s s i o n a lS e r v i c eD i v i s i o n C o n s u l t i n gDepartment SASI n s t i t u t eJapanL td . 要旨 製造業において SASシステムは、管理図のようなグ、ラフ化や帳票作成といった機能で、の 従来型基幹業務支援での利用以外に、最近で、はデータウェアハウス/データマイニング関連 フ。ロダクトの情報系活用も始まってきている。 SASシステムの活用場面を事例に沿って紹介する。 キーワード:ファクトリーデータウェアハウス,データマイニング, SAS/lntrNet, 1 . はじめに SASインスティチュートジャパンにおいてコンサルティング、サーヒ守スが開始されてから、 今年で既に 3年目となった。筆者はその一員として、主に製造業ユーザからの案件を担当する機会を何回か持た せてもらった。これらのユーザの製造品目は電気・電子製品、金属製品、食料品等さまざまだが、そ れらの事例を元に差し障りない範囲で、他製品製造業でもすぐに応用可能な用途について、 SAS シ ステムのサーバ系プロダクトを中心に説明する形で紹介する。 2 . 新世代の SASシステム利用 日本における SASシステムユーザの業種は、米国ほか世界各国と同様、多岐にわたるが、その 1 / 3 を占める製造業ユーザにおいて、これまで主に SASの使用法といえば、 ‑453‑

438.

a .研究開発での実験計画・分散分析などの統計解析 b .菅理図などのグラフィクス作成 C.メインフレーム/オープン系聞のデータ交換などミドルウェア的用途 などが主な用途であるとしづイメージが強かったように思う。 .の用途の事実上の業界標準となっているせしもあり、 特に医薬品製造業においては、 a SASシステムを統計的検定で、しか使っていないユーザもわずかではあるが存在すると聞く。 しかしながら、 SASシステムは、営業支援系で既に実証されているように、データウェアハウス構築や デ?ータマイニング、のようなビジネスインテリジェンスツールとして活用することにより、企業にとって柔軟 で効率の良いファクトリーデータウェアハウス環境を実現で、きる唯一のソフトウェアとして TCO削減に 。 貢献し得る (SASは高くない!) 日本においてデータウェアハウジングの広まりは、やはり、大容量データを擁する通信業、金融業、 流通業などが先駆者で、あったが、既に SASシステムを利用していた製造業ユーザの中には、ほぽ同 時期に、 SASシステムのもつデータウェアハウス向きの特性 (MVA、MEAコンセプト、強力なデータハ ンドリング能力、高速な集計性能など)に注目し、データウェアハウジング、/ビジネスインテロジェンス 分野へ着手、活用している例がしてつかあり、加えて新規ユーザにも積極的にファクト!J‑データウェ アハウスへ取り組むユーザが増えた結果、われわれコンサルティング.サービス部、 SASパートナーグ P ノレープ各社、あるいは咋年から動き始めた SAS アライアンスパートナーなど、の支援のもと、次々と本 格稼動を開始しているのが、まさにファクトリーデータウェアハウスなので、ある。 コンサノレティングサービスの性格上、機密保持のため残念ながら企業名やデータの実際の内容につ いては詳細を報告できないが、古くからのユーザにとってはあまりなじみのないであろう、ここ2、3年 ューションを実装する新プロダクトに関連付けて紹介する。 ほどで!J!Jースされた、エンタープライズソ U 1・SAS/lntrNetソフトウェアによる情報共有/ペーパーレス化 2.E n t e r p r i s e M i n e rソフトウェアによるデ、ータマイニングp 3 .SAS/WarehouseAdministratorソフトウェアによるデータウェアハウス管理 以下、それぞれのプロダクト概要とともに説明する。 3 .SAS/lntrNetソフトウェア SAS/lntrNetソフトウェア l ま [Webパブ、リッシング] ‑HTML変換ユーティリティ (%DS2HTM、%OUT2HTM、%TAB2HTMマクロなど) ‑SAS/GRAPHソフトウェアグ、ラフィックドライノ‑<:(IMGGIF、IMGJPGなど) ‑SAS/AFソフトウェアデ、ータテープ〉レウィジェット HTML生成メソッド(実験版) OutputD巴l i v e r ySystem(V7より:日本では未リリース) とし、った静的な HTMLコンテンツ生成機能と、 ‑ 4 5 4一

439.

[ダイナミック Webアプリケーション] データサービス • htmSQL(HTML中に SQLを記述し、ブラウザ表示時に動的に照会結果を埋め込むサービス) • ODBCドライバ (Windowsクライアントからのサーバデータアクセスインタフェース) • jDBCドライバ(JVMからのサーパデータアクセスインタフェース) ーアプリケーションディスパッチング • SAS言語プログラミング(グラフや帳票作成 SASプログラムの出力を Webブラウザへ送る) •A p p D e v S t u d i o (近日リリース)( Ja v a B e a nベースの開発環境) とし、った多くのリアノレタイム処理を提供する。 効果的な利用例としては、 • SAS/QCソフトウェア、 SAS/GRAPHソフトウェアを用いた、対話的傾向管理グラフ作成 .次レベルへのリンクを埋め込みながら帳票を生成するド、リノレダウン集計表 ・業務モデ、ルに合わせた論理順序で、検索で、き、結果を表計算ソフトで表示できるデータダウンロード などがある。 これらは共通してクライアントメンテナンスが基本的に不要である。 ‑対話的傾向管理グラフ作成 たとえば、製品種別、工程別、ロット別とし、った層別に、製造技術者や生産管理者が各自ブラウザ 上で自由に閲覧できるしくみである。 SAS/G九 ベ PH の柔軟性を生かしてカスタマイズ、されたグラフも 同様に配信できるため、企業独自の特徴把握方法を低コストで広く実装可能である。 ‑ドリルダウン集計表 S A S / l n t r N e tのサンフ。/レとして添付されている X p l o r eアプリケーションや MDDBビューワなどをそ のまま、またはカスタマイズして用いたり、階層をその場で指定し作表するなどの利用が可能である。 ‑データダウンロード 失敗するデータウェアハウス利用の典型的な例として「汎用すぎてかえって使いづらし、」ツールを提 供してしまう、とし、うパターンがある。 Web ブラウザで広く公開するような情報、言い換えると、あらゆる 利用者レベルに対しでも提供される情報で、は、利用者の技術レベルはできるだけ低い方に合わせる 方が無難であり、これを慎重に決定しないと、この失敗パターンに陥る恐れがある。 その意味で、ここでは、 汎用ではない 検索抽出機能をお勧めしたい。わかりづらし、かも知れない M H j 慎序がブラウザ上で が、データを特定する際に、業務の流れに沿ったある階層が存在する場合このl 再現されることによって、自社の業務を把握していれば誰でもツールの教育を特に必要とせずにデ? ータが取得できるようになるのである。 i g h もちろん、汎用検索用途には、手前味噌ではあるが当コンサルティング部が販売する H P e r f o r m a n c eD a t aM a r tf o rWorkGroupが対応する。 ‑455一

440.

4 . EnterpriseMinerソフトウェア E n t e r p r i s e M i n e rソフトウェアは、昨年、満を持して登場したデ、ータマイニング、環境で、ある。 従来の統計解析 SAS オプションと一線を面す特徴として、高度なノンプログ、ラミンク。操作性を実現し ている点が上げられる。また、サンプリング、データクリーニング、結果評価などを含む SEMMA プロ セスをパッケージ化したソリューション型プロダクトである。 SEMMAプロセスとは、 S a m p l i n g . . .データが持つ傾向を損なわず、処理時間を大幅に節約し、多面的反復評価を支援する E x p l o r e…ヒューリスティックな発見支援とデータ視覚化により、大まかな傾向を探る Modif シ …得られた知見に基づき、必要なクリーニングを行う Model …モデノレを特定し、統計量やパラメタを算出する Assess …得られた結果を評価する の5つのステップからなり、 E n t e r p r i s e ν l i n e rソフトウェアで、は、さらに細かい 20 以上の機能をそれぞ れのカテゴリごとにアイコンで提供し、ユーザは必要に応じてそれぞ、れを組み合わせ、データに適し たマイニング フロセスをマウス操作た、けで F 3 デ、ータマイニング、もまたデ、ータウェアハウスと同様、大容量データを擁する流通業や金融業での利用 が先達で、あったが、その代表的な応用例である「不良(または優良)顧客判別」は、そのまま製造業の 「不良品判別」に転用可能な技術であることは容易に想像いただけよう。 効果的な利用例としては、 ‑不良発生要因とその構造の発見 .精度向上による製造コスト適正化 などがある。 ‑不良発生要因の発見 半導体デバイスなど多くのプロセスを経る製品では、数百におよぶ製造プロセス情報を、 人間の 試行錯誤ではなく、機械による半自動での発見型アプローチをとることができ、早急な歩留まり向上 対策を取ることができる。 ‑精度向上によるコスト削減 プロセス数は多くなくても、 1ロットあたりの製造コストが莫大な重厚長大産業の製品などでは、デー タマイニング、技術を用いることにより、製品特性の推定精度を上げ、途中プロセスで、の補正処理を適 性化することにより、ロスや過剰補正コストを削減することがで、きる。 ‑このほか、検査工程で、の複数の不良モード、の相互関係をバスケット分析にかけ、同時発生する不良 に共通する要因を探る、などの応用も可能である。 ‑ 4 5 6一

441.

5 . SAS/WarehouseAdministratorソフトウェア SAS/WarehouseAdministratorソフトウェアは先に述べた S A S / [ n t r N e tソフトウェアや E n t e r p r i s巴Miner ソフトウェアで、利用するためのデータウェアハウステープ、ルを作り出すための、ソースコード、ロードプ ロセス、実行ホストやスケジューノレ情報にれらをメタデータと呼ぶ)の管理環境である。 こし、って蓄積・転送効率重視のコード化が著しく、測定機 製造現場から収集されるデータは一般的 l や検査器によってそのフォーマットや単位系も異なっていたりと、とにかく生のデータに関して最初か ら情報系の利用目的どおりの形式で得られているケースの方がまだまだ少ないのではないだろうか。 こうし、った場合、単純な照会言語による連結から、コードの統一、条件分岐、統計的要約等の比較的 複雑な加工ロジックまで、さまざまな加工プロセスを経て、分析・レポート用データが作られることになる。 データ取得先、データ背景説明の様な備忘録など、必要なデータ形式が増えれば管理が煩雑化す る。これを体系的に管理するのが SAS/WarehouseAdministratorなのである。 効果的な利用例としては ‑データ加工のわずかな修正を伴う再実行 ・メタデータ AP[を用いたサブ、ジェクト検索 .管理環境カスタマイズ P などがある。 ‑データ加工のわずかな修正を伴う再実行 たとえば、データ加工製造工程情報と検査結果情報を連結して作成されたデータを用いて分析の 結果、次の段階でこれに最終性能特性情報を追加して分析する、とし、った場合にも、元の連結加 工プログラムが体系的に呼び出せ、再利用できる 0 .サブ SASν/Wa 訂r 凶 eh o u s e A d m i n i s t 廿r a 飢t 町 orソフトウエアで、は、サブジェクト別編成と呼ばれる、ピジ、ネスモデソレを 反映させやすい管理体系を実現しているため、業務上概念で、のデータグループ定義や、業務用語 で の検索などに対応可能となっている。 SASデータセットの基本属性についてはもちろん、それ 以外の付加情報についても、「検査関連サブ、ジェクト中の"温度 m を見出しに含む変数を持つデータ セット名をすべて」とし、ったメタデータ検索が可能で、ある ・このほか、 SAS/WarehouseAdministrator にはアドインを追加できたり、ある程度のカスタマイズ機 能が備わっているため、管理者がデータの内容をチェックするような場合にも、保存されているマシ ンの違いを意識せずに、統一した操作で閲覧、検索、レポーティング、などが出来、 HTML出力も可 能である。 ‑457

442.

6 . おわりに 今回、実は当初予定していた事例の発表が、諸般の事情により難しくなってしまったため、やや1 愛 昧な表現を使用するなど、臨場感に欠ける内容となってしまい、また、結果としてプロダクトの紹介のウ ェイトが高くなってしまい、宣伝色が強くなってしまった点をお詫びしなければならない。 が、国内で、実際にデータウェアハウスの概念を取り入れた情報系デ、ータを使って、 Web アプリケー ションやデータマイニング を行っている製造業ユーザが既に両手を超すほど、存在しており、それらの P ユーザで、は非常に効率的にアプリケーションライフサイクノレが回っている、とし、う事を付け加えておく。 以上 ‑ 4 5 8一

443.

論文発表 その他

444.

日本 S A Sユーザー会 (SUG I‑J) 五主主主主にま計二テる孝食事害想干イ彦の寄手イ面と己た幸喜 陶山博太 ※ l 伊藤洋子 ※ 2 大岡典子 ※ 3 ※ l 企業行動デザイン研究所(社長)/慶臆義塾大学(講師 ) / C l a y t o nU n i v e r s i t y (教授) ※ 2 企業行動デザイン研究所(主任研究員) ※ 3 企業行動デザイン研究所(主任研究員)/湘南国際女子短期大学(講師) Factor Analysis for Business Training H i r o t a S u y a m a※1 Y o k o1 t o※2 N o r i k oO o k a※3 ※IR E S E a r c hi I l S ti t l l t E o fC o r p o r a t pB E h a v i o rD E a lE I I / i ( E 1 0 1 1 1 1 1 V / C l a N O I lU nl V ※2R e s e a r c hI n s t i t u t eo fC o r p o r a t eB e h a v i o rD e a i g n ※3R e s e a r c hI n s t i t u t eo fC o r p o r a t eB e h a v i o rD e a i g n / S h o n a nK o k u s a iW o m e n 's J u n i o rC O l l e g e 要旨 従来より、企業教育のプレビ、ユーはかならずしも高いレベルでおこなわれては いなかった。本稿では、当研究所で実施している統計解析による教育研修評価 について述べ、当該作業に関する今後のスタンダードとして提案する。 hh﹄ ワ キ SAS/STAT 因 子 分 析 企 業 研 修 潜 在 ニ ー ズ 分 析 ‑ 4 6 1

445.

1.問題の所在と分析の概要 教育研修は、人的資源のパワーアップと、メンバーへのモチベーションという両面で企業に とり大変重要なトピックである。これは今も昔も変わらない。ただし、研修を担当する講師が 自動的に権威をもって迎えらた以前と異なり、コンペチターの増加等による価格競争の激化に くわえ、内製化の動きもある。 それにもかかわらず、顧客の研修にたいするプレビ、ューや教育団体自身の仕事の自己評価の しかたは、いぜんとして客観的な分析によらない当事者だけの官能的判断によっている事が甚 何教室か同時並行で運営してい だ多い。極論すると「この講師はー…ーを板書しなかった J r る中で、教室聞で 30分程度の進行上の時間差があった」といった低レベルの内容のクレーム が発生することもある。たいへん寂しいことである。 しかも、これは決して小規模企業だけのできごとではなし、。いわゆる巨大企業でもしばしば 起こっているのである。 このような不毛の一番の被害者は、もちろん研修の参加者である。経営の方向性にも準拠し 、参加者の潜在的興味を刺激できるアセスメントが必要である。当研究所では、 SASシステ ムで行われる基本的な技法である「因子分析」がこの建設的な研修評価に大変効果を発揮する ことをっきとめ、業務に活用している。以下ではその概要を述べることにする。 2 . 因子分析の効用 我々がある一つの対象物の調査及び分析をするとき、通常の考え方としてまず l変量の特性 を理解し、次に 2つの変量聞の関係を吟味した上で、その対象物の特性を表現した多変量の検 討に入るのが基本的な手)1債である。 そこで問題となるのが、全体の見通しをいかにして確保するかである。 標本数より小さい数であればいくらでも投入できる変量そのものの性格と、事象そのものの 複雑さから、使用される変量はいきおい多くなりがちである。そうすると、いかに多くを扱え るかよりも、その関係を見通しょく整理して情報を引き出すための技術が必要となる。 その代表的方法が、因子分析である。因子分析は、図表 lのような分析表で多くの変量の裏 側にひそむ共通要因をとりだすことで、そこにひそむ重要な要素をさぐろうとするものである。 すなわち、事象全体に支配的な影響を及ぼす共通要因を特定する場合は因子分析(図表上段) によって因子の全体に占める影響力(寄与率)を把握し、単に決め手となる共通要因をいくつ ‑462一

446.

図表 l 因子分析と主成分分析 一2 5 ‑ 一向山一 寄累 率砧 与 quqd 一%%一 一 nunu一 変数N 変数 N ‑463

447.

か抽出するだけであれば、主成分分析を用いるのである。 企業の教育研修は、し、かなるコンテンツにしても、学習項目が複数あり、それがはたしてゆ く目的は定式的に一応決まっている。たとえば経営分析の研修という場合には、まず参加者が 財務の事をよく知らないという前提で、決算書の項目説明やそれを作成する簿記の知識を簡単 に扱い、そのあと代表的な手法である収益性(資本利益率に関すること)、安全性(資金繰り や在庫・売掛金などの管理)、生産性(付加価値)の基本部分を学習いただくというのが定番 になっている。 そしてこれらの項目は、単独か、相互に混じり合って参加者やクライアント企業の持つニー ズ(潜在的なものも含む)を形成している。もし研修プログラムの各コンテンツとこれらのニ ーズとの結びつきを押さえることができれば、研修の内容を建設的に組み換えることは勿論、 ときには経営目標の達成に即効性をもたせることさえも、思いのままとなる。 因子分析は、潜在ニーズをまとまった固まりとしてとりだせるだけでなく、研修プログラム 全体における当該ニーズの寄与率(ウエイト)を求められるという点で、もっとも適した手法 のひとつなのである。 3 . 分析する事例と場面について 本稿で紹介する事例は、機密保持のために企業名をはじめとする詳細情報は一切ふせるが、 中堅規模の外資系商社で実施した経営分析基礎講座のアンケートとその解析である。 まず研修対象は、事業部長から課長までの、シニア&ミドルマネヅャーである。彼らは部下 を動機づけしてそのもてる力を最大限にひきだし、彼らを効果的に組み合わせて、経営目標達 成に最も効果的な貢献をしなければならなし、。そのために経営目標の重要部分を構成する会計 の情報について理解、応用するとともに、それを翻訳して部下に伝えなければならない。 さらに外資系企業であれば、決算書は英文で、本社がある国の会計制度で作成されている。 これらを総合すると、定番コンテンツに加えて利益目標などを決定する損益分岐点、クライ アント企業の実際の決算書を使用した国際会計制度、実際の経営活動のなかで経営分析の活用 を考える事例研究などの内容を加える必要がある。経営分析基礎講座では、これらを講義、演 習、事例のいずれかの形式で含めている。 研修プログラムは 2日 間 (1日6時間)で、当ジャンルの教育研修では標準的な時間数であ る。基本的に講義+演習の繰り返しで進行してゆくが、 2日目の後半はすべて事例研究にさき、 それまでの項目の確実な理解と実戦的感覚を獲得することに費やされる。 ‑464‑

448.

事例企業において「経営分析基礎講座」が、定期的に継続されているばかりでなく、きわめ て建設的な質の向上がつづいていることは申すまでもなし が、因子分析による解析が、そのた めの有効かっ不可欠の連結環になっているのである。 4 . データセットとパリマックス(直交)回転による分析結果 ある年において、本講座は 15名の参加者にて実施された。 アンケートは、当研究所作成のものと、クライアント作成のものの 2種類が用意された。 クライアント作成のアンケートは、研修実施後に、当研究所用意のものは研修実施前、研修 実施後にそれぞれおこなった。 本節では、当研究所作成のアンケート関連についてまず言及する。その書式と結果を以下に 表示する。(図表 2) このように、殆どの項目について、 「できる J (自信がついた 「すこし J (すこし理解できる、すこしできる)から、 理解できた)に改善されているが、それはともかくとして、実施 後の結果についてデータセットを作成して因子分析をおこなってみると次の結果がでる。デー タセットには参加者個人個人の全体評価(各項目の平均)を加えた。(図表 3) 回転法はポピュラーなパリマックス回転によっているが、各因子の寄与率は次の通り。 (累計) 因子 l 実戦力・戦略力 42% 因子 2 基礎知識 18% 60% 因子 3 利益管理 12% 72% 因子 4 収益性(資本利益率) 10% 82% 因子 5 国際会計 7% 89% ここまででほぼ 9割 ここからわかることは、次の 2点である。 i)実際の仕事に使用できる因子 lが全体の 4割の傾向を占めている。これは事例によって 展開される部分である。 五)因子に示された各学習項目のいすれもが、高い寄与率をもっており、いすれも外せない ことがわかる。かりにこの状況で、予算等の理由から実施時聞を短縮したり、コンテン ツを落としたりすると、重大な支障が生じる可能性がある。 ‑465‑

449.

図表 2 当研究所作成の事前・事後アンケートと改善幅 経告?分析基礎研修をご受講いただき誠にありがとう ζ ざいました。 今後この研修をより良くしてゆくために再度ご協力をお願い申し上げます。 r l i i F J il こO印記入をお願いいたします。 該当 f S } 1 .l ki 1 1 の見方について里Il解できましたか で き そ う ‑ 1 分 十分 7 . 利経や資産の回転期間等について、 さらにコミュニケーションを活性化できそうですか 8. 売問債権や棚卸l 資産の管fll[lこは I~I 信がつきましたか 9 . fi 本利抜本を高める具体的プ'ïll~'まわかりましたか 図表 3 因子分析により抽出された潜在ニーズ(当研究所アンケート) I まI 子三 i i 没)J• i i 攻略力 カ凶子 I:W 凶 子 2 :)I~ 俗 知 識 主主 f本自勺内I~ヨE (番号はアンケー卜質問 NO) 財務知識を通した経営体質強化の具体策 • 2 . 製品のマージン管理 (相関度 76%) • 4 . 部門間連携 (相関度 63%) • 8 . 売上債権・棚 f f j l資産管理(相関度 91%) 全休評価との問.i1!度 61% I 共通話 J としての財務 l 決算書の見方 • 7 利益や回転率に (相関 I J t89%) ュニケーシヲン(相 I l ¥ j 皮 8G%) ついてのコ t 全体評価との関迎度 1896 仏j‑ rl : 平 』在官ー理 損益分岐点 • G 損益分 l 岐点の実務への適用 C i 1 i関 j 支 93%) • 4 . 部門間連携 (相関度 59%) 全体評価への関連度 34% 1 1 i子 1 資本利益率 資本利益率の向上 5 経常活動を把握する上て必、要な情報(相関度 69%) 資本利益率を高める具体的方法 (粍!関度 82%) 全体評価への関連度 36% I!際会計 。 .3 : 同際会計と日木会計の通い 全体評価への関連度 食は、特に影稗 1 S tが強いもの。 J r9I%) (相│刻 J 36% 一一パリマックス回転一一一 ‑466‑

450.

図表 4 図表 3の因子間相関 一一プロマックス回転一一 Inter‑factor Correlations FACTOR1 FACTOR2 FACTOR3 FACTOR4 FACTOR5 FACTOR1 FACTOR2 FACTOR3 FACTOR4 FACTOR5 1.00000 0.31038 0.32706 0.34027 0.21377 0.31038 1.00000 0.10519 0.14974 0.22269 0.32706 0.10519 1.00000 0.13080 0.27298 0.34027 0.14974 0.13080 1.00000 0.32936 0.21377 0.22269 0.27298 0.32936 1.00000 Reference Axis Correlations FACTOR1 FACTOR1 FACTOR2 FACTOR3 FACTOR4 FACTOR5 FACTOR2 FACTOR3 FACTOR4 FACTOR5 1.00000 ‑0.26274 ‑0.28431 0.28165 0.00194 0.26274 1.00000 0.03418 ‑0.00103 ‑0.HN64 ‑0.28431 0.03418 1.00000 0.04210 ー0.22521 ‑0.28165 ー 0.00103 0.04210 1.00000 ‑0.27748 0.00194 ー0.16464 ‑0.22521 ‑0.27748 1.00000 司 ー 図表 5 因子分析の結果(クライアント側アンケート) 一一パリマックス回転一一 } 一 人 刈 イ I 一 一 : 壬 壬 [ 立示 子 川l 姉 m g 抑 附l 川 しこ f た i l げセ汁汁‑‑イ内附内附勾特符 食剖州閃川刈 が 何 州 、 勺 ; 計 l 講座の t [ l'2 . じ 1ナー進め方 ~.講師について 5 会J 易 f t ' j i ( ) 他の j jへの j f l ' 薦 函 % ( 日 両 両 示 函90 而 ム di (相関 j 支 87%) (相関度 97%) (相関 J f [77%) (相関 j 史 7G9 6 ) [ J . I‑ r2 :受講将が実感した 7 研修を通しての学押効果(村1 関j 支 95%) 1:11 滋の JIII~1~ 凶了 3 :受講者からみた 実践への適応 │ │ ・3 実際の仕事に役立っか 一 一 一J {:(は、特に影響 j 史が?郎、もの。 ‑467‑ (相関 j 支 96%)

451.

温)通常の経営分析研修に含まれる因子 2、因子 4の寄与率は、合計でせいぜい 2 0 %にみ たない。研修講座という商品の現状において、オーダーメイドの部分がいかに威力をも ちうるかがわかる。 5 . プロマクス(斜交)回転による分析結果 それでは、因子同士の関係は相互補完的なのだろうか、それとも独立的であるのか、それに よって、研修コンテンツを併合(二つのセッションの講義と演習を同時におこなう等)できる 可能性の有無も決まってくる。 これを調べるには、プロマクス回転により因子聞の相関をみる。その結果を図表 4 に示す 。因子聞の相関係数は、どれも 35%を越えないので、 5つの因子はお互いに殆ど関連をもた ないことがわかる。かかる状況下でのセッションの結合、省略などは不適切な処理となる可能 性が高い。 6 . 参加者個人の興味について(固有ベクトル分析) n et oO n eM a r k e t i n gの実現で、ある。 データマイニングの究極の目的は、俗な表現をすればO すなわち顧客をクラスターとしてではなく、ひとりの人間としてつかむことである。 研修講座という商品が顧客に引き渡されてゆく時は、研修が実施されている期間中である。 それは瞬間ではなく、徐々に渡されてゆくものである。 因子分析では、その期間のなかにおける、参加者個人のうけとめ万を捉えることもできる。 今度は、クライアント作成によるアンケートを分析してみよう。 クライアント作成のアンケートは、セミナーの内容、進め方、会場、食事、講師などについ て 5段階評価をおこなう、きわめてオーソドクスな質問内容である。まず因子分析による結果 は図表 5 のようになった。(パリマックス回転) 参加者へのノウハウのインプット(因子 1)から、仕事への活用というアウトプット(因子 3)まで、各プロセスを代表するような因子が抽出された。それぞれの寄与率は次のとおり。 ‑468一

452.

(累計) 因子 l 講座の質 54% 因子 2 知識の理解 20% 74% 因子 3 実戦への適応 13% 87% これは一見悲観的な結論に見えるが、参加者が受講後すぐに、研修内容を実行に移すことは 稀で、得た内容を反拐する期聞がどうしても必要となる。大事なことは、この期間中に研修内 容にたいする意識と興味を維持することである。 そこで、参加者個々の各因子への固有ベクトルを図表 6 のような形でチェックしてみる。 a‑hは、参加者を示す。 たとえば、 eの方は、各因子にたいしていずれも強い関心を示している。職場内がこのよう なマネージャーばかりだと、研修講座で取り入れた内容が職場に確実に吸収され、それらが実 際の職場で活用されるまでテンションは維持されてゆく。 しかし現実には、研修の質には高い関心をもつものの、その知識を身につけるとか、活用す るという点に関心がない方もいるようだ。いずれにしても、このマトリクスを眺めていると色 々なことに気がつくはずだ。 全体評価との関連は図表中に表示しである。因子との関連をみてみると面白い。 同様に、各人の職階との関連や、当研究所作成のアンケートについて同じ方法の出力をした ものを対象させてみると、クライアント企業についての立体的な理解も可能となる。 7 . さいごに 研修講座は、実施される企業のために存在するのであり、決してその逆ではない。コンサル タントは、ややもすると年聞における出講や講演等の日数や、それによる水揚げに意識がゆき がちであるが、クライアント企業の風土や、その中で接する個人の想いに敏感になり、量より 質の仕事をつねにこころがけていなければならない。 本稿で示した事例と分析は、我々自身がその事を再発見するきっかけとなった。また SAS システムが、統計解析の専門家だけの道具にとどまらず、さまざまな用途に応用されてこそ、 その真価が実現することを痛感した。 ‑ 4 6 9

453.

図表 6 各参加者のニーズ解析 X7 NAME FACTOR1 a 4 9 3 9 1 7 ・7 3 2 9 7 1 2 6 2 A 4 3 3 8 1 6 6 3 2 8 6 ・6 252 ︒ι q J qJ qJ quqJ qJ qJ qJ nJιqJ qJ qJ qJ qu •••.•.•.•..•. 0.48320 司 ﹄ ﹄ ﹄ UFVAuouel ﹄ ﹄ ︑ ﹄ ﹄ ﹄ ﹄ ﹄ ﹄ H h H . 4・ 1JLMHT4m川 門 川 門 円 ﹄ u NAME FACTOR1 ‑0.14599 0.94345 0.97886 1.20654 ・0.17746 0.68287 0.07453 ・0 .40904 ‑0.25456 ‑2.37400 0.97599 ‑1.26508 0.98560 ‑0.73852 FACTOR2 FACTOR3 ‑0.55281 ‑0.46934 ・0.43666 0.98647 1.09375 0.19772 0.06457 ‑1.01605 ‑1.16287 0.61725 0.38092 ‑0.38440 ・1 .74662 0.21057 2.21749 0.02198 ‑2.38775 ‑1.30669 ・0 .32388 1.23555 0.07032 0.15087 0.29404 0.17227 1.30758 ‑0.24338 1.47381 0.62641 ‑0.35245 0.59805 司 町 FACTOR2 FACTOR3 FACTOR4 FACTOR5 a UFVAueel ﹄ uohH 門 0.61704 ・1.24937 ・1.79871 0.79906 ・0.79175 ‑1.85480 ‑0.02680 0.25086 0.28640 0.50930 ‑0.87850 ‑1.47041 0.14972 ‑0.59126 0.81612 0.25694 1.10224 0.66925 0.22921 0.80795 1.09406 0.45547 1.07523 1.90171 1.10382 0.18180 0.86107 0.90583 ‑1.11988 ‑0.67279 0.64577 ‑0.86962 0.32327 ‑0.74137 1.18870 ・0 .42157 ‑1.18410 0.73014 ‑0.88837 1.09223 ・0.91506 ・1 .45949 0.13420 ・0.62412 ‑0.79052 0.56225 0.60747 ・0.20111 0.73749 1.04225 0.64749 ‑0.26584 0.19137 0.79650 ・1.72966 ‑0.56273 0.73758 0.00390 0.54658 ・ 0.65414 ‑0.80732 0.79469 1.98816 ‑2.07328 ・1.16712 ・0.68736 0.61342 ・1 .54007 0.70833 0.68075 2.12199 1.35368 1.09427 0.03301 0.74931 司 1J‑U円 T 4 m川 n u O ・司4・ 司 470一

454.

日本 S A Sユーザー会 (SUG I‑J) 日本プロ野球選手の成功要因の分析 [野手編] 陶山博太 (有)企業行動デザイン研究所 代表取締役社長主席研究員/慶応義塾大学総合政策学部講師 ~Clayton U n i v e r s i t y 教授 AV i t a lF a c t o rf o rB a s e b a l lP l a y e r s( C a t c h e r s&F i e l d e r s ) ,P h .D Hi r ot aS u y a m a P r e s i d e n t, T h eR e s e a r c hI n s t i t u t eo fC o r p o r a t eB e h a v i o rD e s i g n OU n i v e r s i t y L e c t u r e r, 阻 I P r o f e s s o r, C l a y t o nU n i v e r s i t y 要旨 プロ野球選手にとって、大事なモノサシとされる打率、打点、防御率などの 値は、果たして何によって影響されるのか ?SASシステムによって解析を行い、 従来の当該分野のシンクタンクの原データを解析・比較する。 h 卜 ワ キ プロ野球(野手)、相関分析、 SAS/INSIGHT NNA 重回帰分析、年俸制 ‑471

455.

はじめに 従来から、企業は自らの成功要因をつかむために、あるいは社員の業績を適性に評価するために、さま ざまな経営学上の手法やモデルを導入・擬す・議論してき f 。 こ そこには、他の学問領域も巻き込んで、の議論カ帝在しむ SASインスティチュートのソフトウェアで、 あるエンタープライズ・マイナーも、生物学や医学の分野を応用したニューララル・ネットワークカ噂入 されたモデルの実例といえる。 しかし、ビヅネス以外の社会から学ぶという点では、まだまだ未開拓である。たとえばここでこれから とりあげようとするプロ野球選手に関する分析も、世間でいろいろ話題にされている事にもかかわらす。 その分野専門のシンクタンクが実施しているのみで、実際のビジネスに応用する動きは今まで殆どなかっ た。プロ野球もビヅネスも同じ莫食!踏会の世界である。それなら共通の法則を見出さない手はない。 本稿では、町甜守なプロ野琢分野でのシンクタンク「アソボウズ」の分析結果が示されている「江J I I 卓 スカウティングレポート, 99Jに掲載された情報からデータセットを作成・分析した結果を報告する。 今回は対象を野手に絞り、セパ 12球団の主要選手とされている 96名(l球団 8名)とした。 立す象』こする変量は、図表 1‑1に示す通りである。使用プロダクツは、対話型統計額新システム (SAS /1NS1GHT)を中心とする。データマイニンク.ではオーソドクスな手法を主として利用する。ちなみ にデータセットは、図表 1‑2に示す形態になってし喝。牧躍的にそれ程大きなサイズのデータではないが 、ポジションや出身といった定性要因や、打球の方向に隠するデータも含んでいるため、実際にゲームやニ ュースなどで解説者が述べている事などと意識の上ポ摘させっつ、分析をすすめてみたい。 ‑ 4 7 2

456.

E司三隻 1 1 日オ丈フ。ロ里子五:1< (里子弓三奈肩〕 テご一一タセット a M けp 3 .年 令 4 . プロ在籍年数 5 .身 長 6 .体 重 7 .安 打 8 .試 合 9 . 本塁打 1O .打 点 11 . 三 振 12 .盗 塁 →i 日 μ 13 .打 率 14 . 投 球 (L/R) 15 . 打席 (L/R) 16 . 打率(対右投手) 17 . 打 率 ( 対 左 投 手 ) 18 . 打率(初球打ち) 19 . 打率(フルカウント) 2O . 打 率 (2S 08) 21 . 打 率 (OS.18) 22 . 安打方向左の割合 % 23 . 安打方向中央の割合% 24 . 安打方向右の割合 % 25 . 本塁打方向左の割合 % 26 . 本塁打方向中央の割合% 27 . 本塁打方向右の割合 % 28 .出身地 29 . 賞獲得数 3O . 前のチーム(カテゴリー〕 31 . 年 棒 32 . 所属球団順位 33 . 所属球団 l日当たり平均観客動員数 N OSSSE S‑‑23456789012345678901234R567 TllWIlli‑‑112222N20222 EIqqqqqqqqqqqOIqqqqqqqqqqqqRqFqqq MSRTOE AOHIBB 1.名前 2 . 守備位置 s s ‑ 4 7 3

457.

凶衣 l-~ データセット画面(部分) 砂 33 名義変数三三名義変数三間隔変数三三間隔変数人:三間隔変数 ( i p﹁針 一 市 治 二 明 圃 7 1 1 8 0i 2 7 1 到 ?L 3 7I 1 9' 1 9 1 i 外野 6 1 1 7 3 ! │内野 1211741 i 外野 Fhd • 圃 7 1進 藤 達 哉 圃 8制 貴 弘 外野 トー ‑ ‑ ‑ ̲ 一 c : 9川幻崎武司 i 内野 • • 一一寸 1 0 . 1 ゴ、メス 圃 「一 ご • 1二十二日‑ 7185 I 3 1 [ 1 3 [ 一一一一ー一一一一←←ー←寸一一一一一 !内野 ! 一 一 ト 十 一 一 一 一 1一 一 一 一 i内野 一一一一一一一寸←一一 1 1 1立浪和義 一一 圃 3 2i !内野 F 一号 凋 斗 E .Q 2, , :c L今:~ iと ら 三Q 3 :三二戸 三一一一一一一一一「一一一一一一一寸一一‑ 一向子 内︽U 圃 i 三P OSI' 一 ー 同 時 ー 一 四 圃 N A M E 一卜典 十朗信一広 一一↑尚 一 琢 元 一 徳 一バ‑木 ↑ 井 繁 一 回 ← 民 z 3 2 1 一一 1 3 0! I i 引 っ 1 8 1 : 一一一 l 一 一 1 8 0 一一一一丁一一一 1 2I 1 7 3 一一一一一一一一一一一斗一一一一一一一斗一一一一一一一十」一一一一一一寸一← 3 0 1 内野 8 1 1 叫 ‑i 一一一一一一一 一一十一ー 一 一 一 一 一 一 一 ‑ ‑ r ‑ 一 一 1 4 • 圃 圃 圃 ‑ 4 7 4一

458.

「一般にし、われる業績要因 j の分析 プロ野球選手〔野手〕にとって、業績とされるものは、いろいろ考えられるが、次に示す 8つが主な ものである。 (q 5の安打数は、単年度よりむしろ各選手ごとの累計で議論されることが多いので、今 回の分析ではむしろ諸要因のーっとして捉える) 1i1A1iヮヮ 17.打率(対左投手) 29 . 賞獲得数 31 . 年 棒 これら相互の関係を、 2変量の分析、すなわち相関行列で見てみよう。 両者の関係をみる相関係数が特に高いのは、 q 7と q 8, nhV7'且U'inLηd 凋 住 民υ qqqqqqG.O. 一 一 8 . 試合(出場試合数) 9 . 本塁打 1O .打 点 13 .打 率 16 .打率(対右投手) (図表 1‑3) q 11と q 12 ・q 13、 q 24と q 2 5 で、それぞれ順当な結果といってよし、。しかし選手個人にとって最大の成功要因である q 25と、他の 変量の関係が妙に薄いのは不思議である。 ηI RU Aq

459.

図表 1 ‑3 r 一般にいわれる業績要因 j の相関行列 ゴ ー 相関行事J I 一一一十一一一一一 一一一一 I 一一一 「一一一 一一一 「一 一一一一 I 06 I 07 I 08 I 011 I 012 I 013 戸 一 一 一 似 凶 一一一一一 06 1 . 0 0 0 0 O .3 9 0 5 0 . 5 6 3 1 O .0 5 2 6 O .0 6 6 6 一0 . 1 0 1 2 0 . 1 6 4 2 0 . 3 0 9 4 07 0 . 3 9 0 5 1 . 0 0 0 0 O .8 9 0 1 0 . 1 3 8 1 0 . 1 3 3 0 0 . 0 5 1 9 0 . 1 9 6 9 0 . 4 2 9 5 08 0 . 5 6 3 1 0 . 8 9 0 1 1 . 0 0 0 0 0 . 2 8 4 0 0 . 2 7 1 9 0 . 1 2 7 0 0 . 2 8 4 7 0 . 5 2 4 6 0 1 1 0 . 0 5 2 6 0 . 1 3 8 1 0 . 2 8 4 0 1 . 0 0 0 0 0 . 9 3 4 9 O .6 4 5 9 0 . 2 3 0 7 0 . 3 3 6 2 012 0 . 0 6 6 6 0 . 1 3 3 0 0 . 2 7 1 9 0 . 9 3 4 9 1 . 0 0 0 0 0 . 3 8 0 9 0 . 1 8 9 1 0 . 3 0 0 7 013 一0 . 1 0 1 2 0 . 0 5 1 9 0 . 1 2 7 0 O .6 4 5 9 O .3 8 0 9 1 . 0 0 0 0 0 . 1 6 8 6 O .1 7 9 7 024 0 . 1 6 4 2 0 . 1 9 6 9 O .2 8 4 7 O .2 3 0 7 0 . 1 8 9 1 0 . 1 6 8 6 1 . 0 0 0 0 0 . 8 0 7 3 025 0 . 3 0 9 4 0 . 4 2 9 5 0 . 5 2 4 6 0 . 3 3 6 2 0 . 3 0 0 7 0 . 1 7 9 7 0 . 8 0 7 3 1 . 0 0 0 0 ‑476‑

460.

2 . r 一般にいわれる業績要因」となる諸要因の分析 次に、前節であげた要因に影響を与える諸要因をみてみよう。ここでは前節問機 2変量の分析をおこ なったが、図表は害J I 愛し、結果のみ示す。 まず、 q 6 r 試合数」は、 q 5 r 安打」とかなり強い関係があるものの、完全に対応しているとはい いにくい。(相関係数 70%) たしかに今回の調査対象は、 12球団のスタメン出場クラスの選手で あるが、ゲームで期待されている役割が多岐にわたっており、安打のみでの評価でないことがわかる。 q7 r 本塁打」は q 8 r 打点」とそれより一段踏み込んだ関係がみられる(相関係数 80%)、本塁 打がただひとつの打点獲得の手段ではないにしても、一度で打点を稼ぎだす効果的要素として捉えられ ているニュアンスが良く表現された。 他に q 5 r 安打数」や q 9 r 三振数 J も q 8 r 打点」に影響していた。ただし三振数の場合は、少な ければすくないほど、打点が高くなるという負の相関である。また q 23 r 本塁打方向右の割合」 (各選手の本塁打が、右方向の打球であった場合の全体に占める割合)と、相関係数こそ低いが、面白 い関係があった、これについては後述する。 q 11 r 盗塁数 J に影響を与えているのは何であろうか、 q 5 r 安打数J と q 14 r 初球打ち打率」 である。足の早さとチャンスを狙ってゆく姿勢にいずれも関係しているのである。 今度は q 25 r 年俸 J と、諸要因の関係をみてみよう。前節で q 23 r 賞獲得数」以外に何と関係が 年令」と q 2 r プロ在籍年数」がここでは上げられてくる。ひとたび安定した地 あるだろうか、 q 1 r 位を得てしまうと、年功的色彩が強いことが伺える。ただし一般ビジネスマンの世界よりはるかに脱落 する確率は高いと思われるが。 ‑477‑

461.

3 . 定性情報と成績(その 1)ーーポジションごとの選手の特性 一一一 今度は定性情報と、 qの記号で示した要因との関係をみてみよう。いままでは相関分析による因果 関係でみてきたが、ここではヒストグラムにより、調査対象となる選手間の相対評価で検討する。 まずポジション(内野手、外野手、補手)ごとの特徴からみてみよう。(図表 1‑4) 捕手(調査対象 96人中 12人)は、 q 7 r 本塁打」が低〈、特に q 22 r 本塁打中央方向の割合」 が低い傾向がある。内野手と外野手の聞には、顕著な特徴の差はみられなかった。 パッティング(左、右、スイッチ)では、左打ちの選手の中には右投げがいるのに、右打ちの選手 には左投げはし、ない。スイッチヒッター(2名:松井稼頭央(西武)、大島公一(オリックス) )は 二人とも左投げである。また捕手には、左投げは全くいなし、。これはうなづける結果である。 (図表 1‑5) 左打ちの選手(該当 39名)の特徴をもうすこしみてみよう。 q6 r 出場試合数」は多く、ほとんどの該当選手が 100試合以上出ている。左投げの選手にも同 様の傾向がみられる。(図表 1‑ 6) q 18 r 安打方向左」や q 2 1 r 本塁打方向左 Jが低く、 q 20 r 安打方向右」と q 2 2 r 本塁打 方向右 Jが高いが、これはあくまで相対評価で、たとえば本塁打方向左の割合をみると、 45‑60 %の聞には l名 、 30‑45%の聞にも 2名いる。仮に監督の立場で左方向への長打がほしい場合、 単にその選手が左打ちだからとしもう理由だけで検討外にするのはいささか短絡的なようだ。 478‑

462.

(捕手について) 度 数 度 数 。 度 数 it~IL Q 7 479‑ 45 Q22 90

463.

図表 1ー 5 パッティングで左打ちの打者のポジションと打球 度 数 l i P O S I 度 数 護 l~_j THROW ‑480‑

464.

図表 1‑6 左打者の特性 39 度 度 数 数 5 3 5 Q 1 8 HIT 惨 ; 。 6 5 3 0 6 0 Q 2 0 砂 : 度 数 度 数 。 ! J 6 0 1 2 0 Q 6 。 4 5 惨 Q 2 1 ‑ 4 8 1一 。 9 0 45 :~I Q 2 2 90

465.

4 . 定性情報と成績(その 2) 一一一出身(以前属していたチーム)と選手の特性との関係 プロ野球選手は、さまざまなパックボーンの方がいるが、大きくは高校、大学、社会人、外国人、 プロに 5区分することができる。それぞれのグループごとの特徴をみてみよう。 まず内訳は、高校野球出身 35人、大学野球出身 26人、社会人野球出身 17人、外国人選手 8 人、球団移籍(トレードかフリーエージェント) 10人となっている。(図表 1‑ 7) 大学野球出身者は、 q 6 r 試合出場数」が高く、 q7 r 本塁打」は低めて・ある。 q 25の年俸も 個々には違うものの、全体として低い領域に集中している。 社会人出身者にも、似た傾向がある。それに対して、高校野球出身者は、この 3つの変量でほぼ. 分布通りのばらつきをみせている。 いっぽう、外国野球の出身者は、 q 25 r 年棒」が高く、最頻値は 5000万円から 2億円であ る 。 q4 r 体重 J が多く、 q5 r 安打数」と q7 r 本塁打数」が多し、。球団移籍クツレープの場合は、 特徴として、 q 6 r 出場試合数」は多く、 q 7 r 本塁打」は少ない、また q 22 r 中央方向の本塁 打」が少ない方のクラスに属し、其以外の変量については、ほぽ分布通りである。 具体的には、 30歳 プロ 7‑8年目の選手が多く、清原(巨人)、駒田(横浜)、秋山(ダイエ ー)を除いては、年棒数千万クラスの選手である。 図表 度 数 2 0 . ;~ ‑ 4 8 2一 1一 7 各選手の出身の分布

466.

5 . r 打点」と「本塁打に占める右方向打球の割合」 q8 r 打点」と q 23 r 本塁打右方向」は、散布図とパラメトリック曲線(直線と 2次多項式)で 図表 1‑ 8のような関係となっている。 2次多項式の決定係数は 30%弱で、視覚的にみてややノイ ズのあるデータ(どちらか一方に偏る選手が様々な打点水準である。)であるものの、明確な規則性 が読みとれる。 すなわち打点が高い選手は、結果としてかもしれないが、 q 23が適度な割合になることが示され ている。たとえ長打であっても、左右への打ち分けが上手になされている選手の方が得点への貢献度 は高いようだ。 q 23が 50%付近で、打点が飛び抜けているのは、①ブイジェル・ウィルソン〔 打点 124、本塁打 33本(右方向 25本 但し安打は 129個中 56が右方向の打球) )、②ロパ ート・ローズ(打点 96 本塁打 19本(右方向 9本) )、③松井秀喜(打点 100 本塁打 34本 )である。ちなみに、 q 23が 0 %に近いのに打点がとびぬけている一人は、フィル・クラーク(近 鉄)である。グラフ上は外れ値といえる。 多少の例外があるとはいえ、グラフ上部中央のバッターは、球会でも屈指のパワーヒッターであり、 その殆どが、左右へ安定した打ち分けをやっていることが分かる。球団が大物を戦力として加えたい 場合の参考になるのではないか。 ‑ 4 8 3

467.

図表 I~.! 打点」 と Q23 「右方向本塁打の割合%J 1‑8 Q8 r モデル式 Q 8 4 3 . 3 2 4 8 + O .1 1 4 1 Q 2 3 注)…は予測 7 0 %の信頼曲線である 圃 1 2 0 圃 1 0 0 8 0 • ‑ ‑‑ . . • r l . ' • • 圃 • • E • 圃 • . ・ • . ー ー ー ー ー 一 一 ー ー ー ー ー ー ー ----・~一-九. ‑. ‑ . / 、 ¥ ー・ .. ‑ . / ー 、 、 ‑ 60 ・ . ・ / 、 " ' ‑ 一/ I ~. 圃. Q / ー . • •• 圃 •• • ••• • 圃 圃 E ﹄ • E ‑固 . ・. ・ • •• • • EE a • ‑ ・ ‑ • •• .• ・ ‑ . • E 2 0 ・ ・ ・ ・ ・ ・ ・ ・ ・ 圃 ・ ・ 圃 圃 圃 4 . . • / . ・ ‑ 8 、¥ 圃 ノ / • • • ‑ • E • 。 50 Q 2 3 4 8 4 ‑ 1 0 0

468.

6 . 初E 求打ちか、フルカウントか 打率をトータルで上げてゆくには、特にプレッシャーの克服度合いと集中力を示すという点で、 初級打ちの打率とフルカウントて、の打率の二つに着目するべきであろう。 打率」と q 14 r 初球打率」の関係、図表 1‑ 10に「打率」と q 15 図表 l一日に q 11 r 「フルカウント打率」を示した。信頼楕円は外側が予測値 90%、内側が予測値 80%である。 q 15とq 14向上は、視覚的にみると、明らかに打率に好影響を与えているのがわかる。 統計的に外れ値と考えられるものが多いので、決定係数こそ低いが、フルカウントの打率との 関係は F統計量で 99%有意となっている。 ‑ 4 8 5

469.

図表 1‑9 Qll r 打率 J と Q14 r 初球打ち打率 J の関係 ~i モデル式 2 5 4 . 1 1 2 + 0 1 1 4 0 0 0.0527 014 • • •. . l 1 l i ・ ・ ・ ・ ・ ・ .' .防 ・ 園 o3 l o o l 田 F 圃 圃 ‑ ‑ ‑ E E 圃. • . . ・ .. 圃 • . , • ー • • • • • • • . .• 圃 • 圃 圃 圃 ・.・.. ・ ・. 圃 。 • 2 0 0 4 0 0 6 0 0 014 ~I I~I 信頼楕円 タイプ 係数 予測値 O .9000 竺 L~_j 予測値 O .8 0 0 0竺│凶 ‑486 楕円 ""・...... ・ ・ ・

470.

図表 1‑10 Qllr打率」と Q14 r フルカウントからの打率j の関係 ~! モデル式 Q 1 1 2 3 0 .6 6 5 + O .1 7 4 2Q 1 5 • 4 0 0 • ••・..F 。 .・曲圃 • • ‑圃 • • .・ • • 圃・ 圃. • • • • • ~ . . ・ 』 • ‑ .. • • •• 圃 '. • 圃・ 圃 園 、 • E 圃 圃 •• • . . 1 圃 • 圃 • •• . .圃 . r l 圃 • 圃 • •• . i ・ ,・圃 • . . . . . . .. • 。 • 2 0 0 4 0 0 Q 1 5 ー ; 487一 •

471.

7.年棒を決定する要因は何か プロ野球選手個人にとって、もっとも重要な成果は、やはり年棒であろう。 しかし前述したように、選手にとって望ましい成果であるはずの、打率、本塁打、打点などの変量は 、 2変量閣の関係でいずれも年俸とは強い関係をもっていない。 それでは、いったい何が大事なのだろうか、ここでいままでの前提を R e s e t し、発想を転換してみる ことにしよう。つまり、プロ野球を「純粋な実力主義の世界」という前提でなく、脱落率こそ高いもの の 、 「年功序列が幅をきかせたサラリーマン社会」と考えたらどうなるか。 年功序列の社会で評価されるためには、年長者であること、勤続(経験)年数、休まないこと、減点 されないこと、そして目立って脚光をあびることが大事である。 年令 J、 q 2 r プロ年数」、 q 6 r 出場試合 これを今検討しているデータに重ね合わせると、 q 1 r 三振数」、 q 24 r 賞獲得数」を独立変数として、これらの変量で q 25 r 年棒」を表現 数」、 q 9 r したモデル(重回帰分析)を作成してみれば良い。 その結果を以下に示す。(決定係数は、自由度調整ずみである。) (1)重回帰式①(年功的変量のみ) 年俸 = ‑ 3 8 61 .9 9 +1 4 7 . 6 9 9年令 ( ‑ 0 . 8 2 ) ( 0 . 8 8 ) 食 1 1 3 . 6 7 0 プロ年数+ 4 5 . 4 7 6 1出場試合数+ 1 5 . 9 6 8 3三振数 ( ‑ 0 . 7 6 ) ( 2 . 0 6 )食 ( 0 . 8 3 )食 +1164.25賞獲得数 o . 67 26 決定係数 ( J1 .7 6 )食 s .E = 4122. 3404 食は t検定で信頼できる変量。 甚だ残念なことであるが、決定係数が 68%と,..う、きわめて説得力のある数字がでてしまった。 しかし使用された変量のなかに、プロ年数のように充分信頼できる統計量が得られないものがある。ま たマイナス要素である三振が評価にプラスしているのも妙である。 打点 J r 本塁打」を加え、修正モデルを作成してみよう そこで、代表的な業績の変量である「打率 J r i (2) 重回帰式②(年功的変量+代表的業績変量) 年棒 = ‑ 4 2 3 8 .9 7 +1 6 .3 5 6 9年令 ( ‑ 0 . 7 3 ) ( 0 . 1 1 ) 71 .3 6 8 9プロ年数十 3 4 . 2 5 1 0出場試合数+ 1 5 . 9 6 8 3 本塁打数 ( 0 . 5 4 ) ( 1 .5 9 )食 ( 1 . 6 2 )食 +6 9 .1 0 1 0 打点数 6 6 . 1 1 5 9 三娠数十 1 6 . 8 3 8 3 打率 6 ) 食 ( ー2 . 7 4 ) ( 1 .3 4 )食 ( 1 .6 l 削 +9 7 8 .5 7 0 賞獲得数 ( 1 0 . 5 8 )食 決定係数 0.7557 S .E 3560.9601 t検 定 一 変 量 488一

472.

決定係数は約 76%となり、①よりはるかに統計的に信頼できるモデルとなった。業績の変量i 品、ずれ も t検定で信頼できる値となり、年功的変量の重要性は相対的に減少した。さらに三振数は年棒に対して マイナスとなる変量になる。 プロ年数はマイナスの変量となり、年令も t値が低くなった。これらを総合すると、典型的な実力の世 界が表現されてくる。統計量を検討してみると、年棒に最も貢献してくるのは受賞であり、本塁打数、打 点数、打率よりはるかに効いてくる。 受賞というファクターは、その殆どが、打率などのランキングのいずれかでトップになる必要があり、 新人賞などで最終的に受賞者が決まるのは、運などの、グラウンドの上だけできまらない要素も加わるた め、獲得や増強がむずかしい変量である。一つ獲得すれば年棒決定の上で相当なアド パンテージを得られ るのも、ある意味では当然であろう。 以上のように、年棒決定のモデルでは、年功より実績、しかも取得が難しい実績がきわめて年棒向上に 重要であることがわかった。また重回帰モデル構築の場合は、かりにひとつの考え方・仮説で、ある程度 納得性があるモデルができあがったとしても、かならず別の仮説、可能性を試してみなければならない事 も明確に証明されたことになる。いずれにしても、年棒を決定するモデルとして、きわめて自然な形がこ こに実現した。 8 . 本当の業績とは何か しかし選手個人の年棒が、本当にチームとしての成功(リーグ優勝)に結びついているのであろうか、 かならずしもそうとはし、えないようだ。たとえば阪神タイガース監督の野村克也氏と永世棋聖の米長邦雄 氏による対談形式の本「一流になる人、三流でおわる人 J (致知出版社〕のなかで、野村氏は次のような 言をしている。 (自チームが)勝たないと思っていると、個人成績に走るようになる。このことは(阪神タイガ ースの)チーム成績にもあらわれている。まず盗塁数がすくない。 盗塁はチームプレ の典型である。ヒットを二本打たねばならないところを、一本で帰ってこ れる。(中略) ー だが、失敗した〈なし、から走らなし、。一つでも先の塁を取ろう としない。それで済ませているのは、 らない。 (最初から臼チームは)勝てないと思っているからに他な ( P P 2 2 6 ‑ 2 2 7 ) .98年度における阪神の盗塁数は 28個で、リーグ中最多の中日 (91個)の 1/3以下である。 ちなみに巨人の盗塁数も 51個(リーグ 5位)と低水準て、あった。大いに気になるところだ。 ‑489

473.

阪神タイガースへの厳しい指摘はともかくとして、この話は、個人成績とチーム成績がし、かに翠離しや すいものであるかを端的に示している。しかしチームの成績は、数年程度の期間内には、必ず個人の利害 にフィードノ〈ックしてくるのはいうまでもないだろう。 チームの勝利や優勝が最終目的になるような、個人業績のモデルを犠築しなければ、プロ野球(野手) の本当の成功要因を把握したことにはならない。これを把握するためには、モデル構築自体に大幅な発想 の転換が必要とされる。次節ではその具体的試案モデルを展開してみよう。 490

474.

9 . チーム成瀦と個人業績の複合モデル 前述の目的を満たすために、先す分析尺度に工夫をくわえてみよう。そもそもプロ野球選手(野手〕 にとってひとかどの成功とはどのような状況をさしているのだろうか、いろいろな考え方があって一 概に確定はできなし、ものの、どのような職業でも実績技量ともに一点し市ばマエストロとでも呼べ る水準は存在する。 プロ野球選手(野手〕の場合、年律 l億円以上をその水準にすることに異を唱える人は盤よであろ う。なぜならば、どの球団に属するかにかかわらず、それか一定の実績を継続的に残さなければ決し て主l 躍しないばかりでなく、極端な賛沢をしなければ、比較時豆し、選手寿命や万が一の致制守負傷を カバーして生涯生活が補償されうるからである。 ~\*、年律を連続尺度(パラメトリック〕から順序尺度(ノンパラメトリック〕に変換し、 l 億円 未満を 0、 l億円以上を!としてみた。そして l億円五L 上の選手 (32人〕の特徴は、次のように表 現できる。(図表 1‑ 11 ) すなわち次の特徴カ噛出された。 1 . q 5 (出場試合数〕が多く、 q 6 (安打数〕か高い。 2 . 左打ちはし、るものの左投げは、大洋の駒田選手 l人だけである。 3 . q 15 (フルカウントからの打率〕は、分布の中心に位置してし唱。 この結果を、チームとしての業績と統合させるために、次に、ここまでで用いなかったモデルを選 定する。すなわち因果や繕造が不明確な場合のモデル化に適したニューラルネットワーク (NNA) を用いるのである。 出力層』こ順序尺度とした年棒 (A)、入力層には q5 (標準化して使用〕、 q6 (標準化して使用 〕 、 THROW (名義尺度〕、 q 15 (標準化して使用〕、 q 26チーム(J鷹位尺度〕の 5変量をそ れぞれ設定して、反復学習による誤差の収束度合いをみると、図表 1‑I2のようになる。(中間 ニュ ロンは一層 3低 予 備 学 習 回 数 250且最大学習回数 50回) SBC (シュワルツ・ベイ ズ標準誤差〕により損J I 定したが、 10回目までの学習では急速に誤差は減少し、以降も安定した収束 をみせた。 また学習プロットも、予調I Jf直か年棒 Aの Oと lの間で程よく鉱散さ才工、残差は学習がすすむにつれ 徐々に小さくなった。(図表 1‑13 ) ι L 上のように、ある程度は学習効率のよいモテ'ルが出来上がったが、最後に結果の解釈と、いわゆ る他分野のデータセットを分析する意義について述べてみたし、。 4 9 1

475.

8 3 度数 度 数 度 数 R L l t j T H R O W 安打数 左投げの選手 1人だけ 0.00 主j 32 0.60 A 年俸 1億円以上→ 1 1億円未満→ O 度 数 度 数 。 i v j 60 1 2 0 Q 6 出場試合数 1 . .' " ' i ' 1 Q 1 5 フノレカウント打率 図表 1‑11 年俸 1億円以上の選手の特性 ‑ 4 9 2

476.

'.<>'、与 I SBC 対 反 軍 国 凱 j l ¥ [ 1 t l 」五」 図表 1‑12 複合モデル(年俸+チーム順位)による学習曲線の収束 493

477.

d l.0~輔世体 喝E 醐 D. R 。 本 草 本 車 本 中。守 D.• o.• D• ~ D. 0 ‑D.! ‑0.. 1 ‑ D . . ‑ D. R ‑l.D lO !D t D LD iD D . 10 tD オ プ ザ ペ '̲V‑ Q;..‑"審 号 車市申目橿盛 骨骨骨予温山富 島 奇 骨 謹 益 」ぇ」 図表 1‑13 複合モデル(前述 A を出力とした)学習プロット ‑494 ! O lDO

478.

1o .複合モデルの解釈 入力層に設定した安打と出場試合教は、特に監督の立場からみて、計算しやすく〔安打数=コンス タントに打ってくれる)、結果として信頼できる〔出場試合数=スタメン出場がが多い、ケガによる 離脱もないかもしれなしつことにつながる。 また左打ちは相手投手次第で重要な武器になることは常識であるが、フィールテeィング上のメリッ トがない左投げの野手に l億円プレーヤーは極めて稀なことも判明した。 またフルカウント打率で 100を切る選手は、 l億円未満の選手では 5人もし、る〔最低値は 0)、 のに対し、 l億円以上では l人(長低値 94 ) しかし、なし、。 180未満でも 8人だけである。 つま り l億円以上のプレイヤーは、多少の苦手こそあっても、ここぞという状況で極端な弱みがない。こ れも決断する側とすれば、 「状況判断がしやすい。不安がなしリことにつながるであろう。 どうやら、 l億円以上の人には、安心して場を任せられるようだ。さらに複合モデルでは、ノンパ ラメトリックな個人業績のための要件に加え、明確な因果関係は認識できないものの、チーム順位が 関わってくることも見逃せない。 くわえて、ヒストグラム仁、他の多くの変量で規員) 1 性が見出せなかったことは、選手の個性を認め 評価する厘ほか昧界にあることを示してし、る。 11.まとめ そもそも手1.JJ¥今まで SUGI ‑JIこ余りエントリーされてこなかった趣味的なテーマをとりあげ たのは、 SASや JMPユーザーの仲間が増えることを指向したばかりでなく、本業の経営コンサル テイングに有効なヒントが見つけるためである。再び前掲書のなかにある野村氏の発言を引用してみ ょう。 i テレビ槽で慨をやっ山附こノムラスコーだいうストライクゾーンれ畑山の を使用し好評を得たが、これではプロ野球の実戦では使いものにならなし、。私はストライクゾーンを 水平に八分害 l .k垂直に十分割し、全体を 80に分けてデータを取っている。 このような詳細なデータか取れるのも、コンビューターのおかげである。 ストライクゾーンを 80に分けてデータを取ると、相手打者の得意なコースと球種、苦手なコース と球種、まったく打て郎、コースと球種カ年にとるようにわかる。 (PP166‑168) 本稿取り扱った分析は、定件ーカテゴリー〔ポジションや出身)ごとの特徴や、目的変数に影響を与 える独立変数など、 2変量以上の分析による全体の傾向把握か主であり、プロ野球の世界で安惣E にお こなわれてしる、特定の選手の長所・短所を姻んで攻略するための分析とは基本的に異なっている。 ‑495

479.

しかし多変量によって、得意なカウン卜、全く打てないカウン卜、安打方向の傾向などか制明する ことによって、個人やチームの成功要因を把握する行為は、ある部分でこの発言と共通している。 さらに前述した目的からすると、経営学でよく使用される PPM 、アンゾフマトリックス、 GEの 事業マトリックスなど臥このような意識をもって利用されているか疑問なことか多い。特に競争や 顧客ニーズというものを本当につきつめてゆくと、よりハイブリッドな手法の発明が必要:になる。 また、個人の成果(年棒)とチームとしての成果(J噴位)との融合も、成功というキ ワードにま つわる大きなテーマて、あった。昨今は、企業でも目標管理を応用した年棒牲を導入するところが増え ているものの、過度の個人成績追求と、個人成績のモノサシが、企業成果にダイレク卜に結ひ'ついて いるのか、あらためて再考させられる。いかなるテーマのコンサルティングでも、この点か直接間接 犬況であるが、何が本当に企業の為になるのか、本当に個人を大事にして に関わってくるのが最近の1 ゆくとはどのようなことか、常に感性を働かして考える必要があるだろう。 当該カテゴリーの分析には無限の可能性があり、 SASのプロダクトの予想もつかない利用法を自 身でも追求するとともに、今後それらが沢山置場してくることを確信しつつ、‑̲e筆をおくこととす る 。 4 9 6

480.

日本 S A Sユーザー会 (SUG I‑J) 出向者の健康状態 0豊 島 裕 子 女 輔俊彦帥 清水英佑帥 昔日本たばこ産業(株)関東コーポレートセンター保健部 帥東京慈恵会医科大学環境保健医学教室 Thep h y s i c a lc o n d i t i o no ft e m p o r a r i l yt r a n s f e r r e ds t a f f * H i r o k oToshima * * T o s h i h i k oAgata * * E i s u k eS h i m i z u *H e a l t hc a r eDepartment ,K antoC o r p o r a t eCenter,JapanTobaccoI n c . *本 Departmento fP u b l i cH e a l t handEnvironment ,J i k e iU n i v e r s i t yS c h o o lo fM e d i c i n e 要旨 当社社員中,本社勤務社員と出向社員の健康状態を比較した.本社勤務群では,運動不足と飲酒 過剰の所見が,年齢の高いポストオフ出向群では加齢現象が,戦略出向群ではストレスに伴うと考え られる所見が認められた. キーワード: 健康診断, 出向者 Proc GLM,P r o c NPAR!WAY 1 . はじめに 近年、業務の一部を子会社として分離し、経営の円滑化を図る企業が増えている。当社でも、主とし て新規事業において、部門の関連企業化が進んでおり、これに伴い、出向社員数の増加と、これら社 員からの健康上の相談が増えている。そこで、今回私たちは、出向社員の健康状態について、検討を 加えたので報告する。 2 .対象と方法 2 . 1 対象 当社本社勤務の男子社員 310人(平均 41 .8i : :5 . 2歳)、本社在籍で関連企業への戦略出向中の男子 1 4 3人(平均4 2 . 2i : :5 . 5歳)、ポストオフ後本社在籍で他企業へ出向中の男子社員 社員(以下戦略出向 ) 3 0人 ( 5 5 . 6士2 . 1歳)の計483入 。 (以下ポストオフ出向 ) 497

481.

2 . 2 方法 定期健康診断項目より、肥満度・血圧・ GPT・γ‑GTP・総コレステローノレ・中性脂肪・空腹時血糖・尿酸 の測定値と、心電図と胃 X線撮影の所見を 5段階評価で表わしたものに関して各勤務形態問で比較検 討した。統計学的検討は、 S t a t i s t i c a lA n a l y s i sS y s t e m: S A Sを用いた。 3 .結果と考察 3.1.各検査の結果 勤務形態 人 数 年 齢 ß~ 溝 血 圧 GPT ( IU GGTP(Tcho(mg TG(mg/F8SmgUA(m (人) (蕗) 度 (mmHgi ) I U ) dl ) Idl ) Idl ) g/d l )I ( : : ! : : 弘 ) 本社勤務 4 7 . 8: ! :9 31041 .8 : ! :7 . 2 : ! :1 1 8 . 5 2 4 . 0: ! :1 9 0 . 2 士 1 5 . 5: ! :6 . 0: : ! : : I 5 . 0: ! :3 1 2 . 6 : : ! : : 1 3 . 51 1 0 8 . 9 1 5 . 2 4 . 8 2 8 . 1 31 2 . 1 1 .2 . 1 関連企業戦 略出向 1 3 . 7 2 4 . 7: ! :3 2 . 0: ! :1 9 2 . 4 : ! :1 4 0 . 8 : : ! : :9 1434 2 . 2: ! :4 . 8 士 1 0 . 0: ! :6 . 2: ! : 1 2 . 9 : ! :1 2 . 91 4 . 2 3 3 . 1 9 4 . 8 5 . 5 5. 1 3 . 2 1 4 2 . 1 ホ.ストオ 7後 外 4: ! :1 2 3 . 1: ! :9 305 5 . 6: ! :5 . 9 : ! :1 2 6 . 3 2 2 . 6: ! :3 1 . 7: ! :1 9 9. 5 . 5: ! :5 . 9: ! : : ! :1 6 . 59 6 9 . 7 2 . 1 8 . 1 2 0 . 7 2 6 . 3 1 3 . 6 1 . 3 . 1 部企業出向 表 1 各検査の結果(平均±標準偏差) 胃X線 撮 影 心電図 勤務形態 所見 なし 所見 あり 要経 過観 察 要精 密検 査 小 計 所見な 所見あ 要 経 過観 し 察 。 。 。。 。。 。 本社勤務 (人) 292 14 3 (%) 9 4 . 2 4 . 5 2 0 . 9 7 関連企業 戦略出向 (人) (%) 1 3 1 1 1 9 1 . 6 7 . 6 9 ホ。ストオ 7後 22 5 (%) 7 5 . 9 1 7 . 2 3. 45 45 3. 合計 6 3 1 4 2 . 2 6 . 6 7 2 . 3 2 0 . 7 要治 療 0 . 3 2 外部企業 出向(人) 要精 要治 小計 密検 療 査 42 3 10 310 310 149 106 100 4 8 . 1 3 4 . 2 1 3 . 5 3 . 2 3 0 . 9 7 100 143 73 5 1 8 8 3 143 100 5 1 3 5 . 7 5 . 5 9 5 . 5 9 2 . 1 100 29 13 1 1 3 100 4 4 . 8 3 7 . 9 1 0 . 3 45 3. 3 . 4 5 100 682 334 238 7 2 . 1 2 7 . 8 1 0 . 1 682 。 。 表 2 心電図・胃 X線撮影の結果 ‑498‑ 29

482.

3 . 2 勤務形態別検討 3 . 2 . 1 分散分析(Tukey法) 年齢は 1 0歳・肥満度は 1 0 %ごとの水準で検討で、ポストオフ出向群において、その性格上、他の 2群に 比して、有意に年齢が高かった ( Pく0 . 0 0 0 1 ) 。また、 3群問で、血圧に有意差を認めた ( Pく0 . 0 0 0 1 )。 3 . 2 . 2W i l c o x o n順位和横定 ポストオフ出向群において、心電図所見が有意に重症で、あった ( Pく0 . 0 0 0 1 )。 3 . 2 . 3 ロジスティック回帰分析 CG所見について,有所見群と無所見群の間で、 S t e p w i s e法で、ロシeス テ 勤務形態問で有意差を認めた E fこ示した。有意な偏回帰係数は勤務形態と血圧で、あった. ィック回帰分析を行った。結果を表 3 値 説明変数 偏 回 帰 係 標 準 化 偏 標準誤差 P 回帰係数 数 Odds比 重回帰式 値 のP 0.05 .722 勤務形態 ーO ‑0.247 1 .2 3 7 1 O .0023 0.486 ‑0.037 ‑0.285 1 .0122 O .0023 O .963 血圧 表 3心電図所見を目的変数とする、ロシ.スティッヲ回帰分析で、求めた有意な変数 3 . 2 . 4 重回帰分析 fこ示した。勤務形態聞で、有意差のあった血圧に関して、 S t e p w i s e法で求 各測定値の相関行列を表 4 めた当てはまりのよい重回帰式を表 5に示した。血圧は肥満度・ FBS・ UAの影響を強く受け、特に肥満 度の影響が強い事がわかった。 3 . 2 . 5t‑検定 本社勤務群と出向群の比較 ( t一検定):年齢に有意差のない、本社群と戦略出向群では、戦略出向群 CG所見が有意に悪く、本社群で γ‑GTPが有意に高く、肥満度・血圧・中性脂肪も極めて高かっ でE た(図 1 ) 。 499

483.

υ A 肥満度 血 圧 GPT GGTP T c h o TG FBS . 0 4 1 8 6 . 1 1 4 3 0 . 1 3 1 ー0 0 . 0 0 5 1 0 0 . 0 5 3 8 0 . 0 7 0 5 0 . 1 0 1 8 ー0 . 0 6 8 6 ‑ 0 . 9 1 1 1 0 . 1 3 2 0 . 2 3 8 1 0 . 1 2 1 8 0 . 0 2 5 2 0 . 3 5 8 6 0 . 0 0 3 9 0 . 0 1 2 . 2 2 9 1 0 . 1 1 6 0 . 2 1 1 肥満度 0 . 3 0 7 6 0. 43926 0.3128 0 0 . 3 0 6 . 0 0 0 1 0 . 0 0 0 1 0 . 0 0 0 1 0 . 0 1 0 7 0 . 0 0 0 1 0 . 0 0 0 1 0 . 0 0 0 1 0 年齢 0 . 2 0 2 8 0 . 0 0 0 1 血圧 GPT 0 . 1 9 8 1 0 . 0 0 0 1 0 . 5 1 2 0 . 0 0 0 1 0 . 0 8 2 1 0 . 0 7 1 4 0 . 2 5 1 5 0 . 0 0 0 1 0 . 2 5 7 7 0 . 0 0 0 1 GGTP T c h o 0 . 1 7 9 5 0 . 0 0 0 1 0 . 2 7 0 1 0 . 0 0 0 1 0 . 3 6 9 3 0 . 0 0 0 1 0 . 3 2 8 0 4 0 . 0 0 0 1 TG 0 . 1 8 2 1 0 . 0 0 0 1 0 . 2 0 8 0 . 0 0 0 1 0 . 2 4 6 7 0 . 0 0 0 1 0 . 1 0 8 7 0 . 0 1 6 8 0 . 1 4 7 4 0 . 0 0 1 2 FBS 0 . 1 7 8 8 0 . 0 0 0 1 0 . 2 2 1 2 0 . 0 0 0 1 0 . 2 3 1 8 0 . 0 0 0 1 0 . 1 2 0 9 0 . 0 0 7 8 0 . 2 8 3 0 . 0 0 0 1 ‑ 0 . 0 5 1 2 0 . 2 6 1 6 表 4 相 関 行 列 上 段 : 相 関 係 数 下 段 :p値 説 明 変 数 偏 回 帰 係 数 標準化偏 回帰係数 V i f p値 肥満度 0 . 2 8 9 3 0 . 2 6 1 6 1 . 0 6 5 1E‑04 FBS 0 . 1 7 3 6 0 . 1 6 0 4 1 .0 2 2E‑04 UA 1 . 5 5 2 1 0 . 1 3 5 5 1 . 0 5 4 0 . 0 0 2 重回帰 式の 切片 R2 P値 8 7 . 0 5 3 0 . 1 4 5 1E‑04 表 5 血圧を目的変数とする S t e p w i s e法で求めた当てはまりの良い重回帰式 160 140 1 6 血圧 mmHg r ‑ G T P : I U 1 4 pく0 . 0 5 120 1 2 100 1 0 80 pく0 . 0 5 60 円 40 ~ 。 20 肥満度血圧心電図 8 肥満度 心電図: ス コ ア(x0 .1 ) ‑本社勤務 6 4 2 。 r‑GTP TG 図 1本社在籍社員と戦略出向社員の検討 ‑500‑ ロ関連企業戦略 出向

484.

4 . 結融 ・高齢者の多し味。ストオフ出向群には、加齢に伴うと考えられる所見が認められた。 ‑以上の分析より、出向とし、う勤務形態が心電図所見に影響を及ぼすことが疑われた 0 .出向者よりむしろ、本社社員の健康管理の徹底が必要と思われた。 ‑保健活動の現場で、出向者からの健康相談が急増してしも事実と、今回の結果では、必ずしも一致 していない部分があり、今後更に検討を加えていきたし、と考えている。 ‑ 5 0 1一

485.

SASファーマヘルス テクノロジーの紹介

486.

日本 S A Sユーザー会 (SUG I‑J) SAS/PH・C l i n i c a lソフトウェア PH‑テンプレート機能のご紹介 松井陽子 株式会社 SASインスティチュートジャパン ファーマテクノロジーセンター ClinicalSoftware, IntroductionofPH‑Templatefunctions SAS/PH・ YokoMATSUI PharmaTechnologyCenter SASI n s t i t u t eJapanL td. , 要旨 S A S / P H ‑ C Ii n i c a l ソフトウェアの重要な機能である P Hテンプレートは様々な側面を持って いる。 P Hテンプレートの活用の仕方と、標準テンプレートの詳細な機能に聞して記述する。 キーワード: S A S / P H ‑ C Ii n i c a lソフトウェア、 P Hテンプレート、 S A Sフアーマテクノロジ一、 臨床試験データプロセス、レポーテイング ‑ 5 0 5一

487.

S A Sフアーマテクノロジーには S A S j P H ‑ CI i n i c aI以外に臨床データウェアハ H . D a t a w a r eなども含まれる。 ウスのツール P である。 1.はじめに S A S j P H ‑ CI i ni c aIソフトウエアは S A Sインス テイチユートが臨床分野のデータ解析・レポ ーテイング用に提供する、臨床に特化したソ 3 .臨床試験データプロセス A S j P H ‑ CI i ni c aIソフ リューションである。 S 臨床試験データプロセスは 3つに別れており、 U I と管理 トウェアはワークグループ指向の G データの取り込み部分である臨床データ管理 環境を重視したデータ解析・レポーテイング C D M S )で は システム ( A Sシステムでは個人管理と 環境で、従来の S C l i n T r i a l などの専門データベースがある。 運用ルールに委ねるしかなかった管理機能を 新薬申請書となる解析・レポート結果の出力 補い、より効率の良い、バリデーションを考 o c u m e n t u m を管理する文書管理の部分では D O r a c l eC Ii n i c a l、 H 慮した臨床データ解析が可能になる。特に P などの専門文書管理システムがすでに市場に テンプレートは重要な機能を持っている。 D M Sで収集されたデータは通常 S A S 出ている。 C システムのような解析ツールを用いて様々な 2 . S A Sフアーマテクノロジー S A Sインスティチュートでは臨床に特化した 解析が行われ、その結果をレポートとしてま 部隊としてフアーマテクノロジーセンターを ウェアはその解析・レポーティング環境にて を 1 9 9 6年に発足し、 1 9 9 8年に日本支部を設 A Sに欠けていたグループワーク環境 従来の S 置した。ファーマテクノロジーセンターのミ と管理環境を提供するソリユーションである。 ッションは臨床向けの特化ソリューションで A S j P H ‑ CI i ni c aIソフトウェアは なおかつ S A Sフアーマテクノロジーのデリパリで ある S C D M Sに対してのインターフエース、文書官理 あり、日本支部はその日本語化と日本マーケ システムに対してのインターフエースも提供 ット向けのソリューションを展開することで し、臨床試験データプロセスをシームレスな ある。ファーマテクノロジーセンターでは臨 一環した流れに変えて、新薬申請のためのこ 床試験での作業およびデータの流れを臨床試 れらの作業を高速化し効率を上げるソリュー 験データプロセスと呼び、以下のように位置 ションである。 A S j P H ‑ CI i ni c aIソフト とめられているが、 S づけている。 4 . P Hテンプレートとは すでに多くの製薬会社がデファクトスタンダ A Sシステムを臨床の解析 ートツールとして S ツールとして用いている。しかしながら従来 A Sシステムでは臨床試験データ解析に必 の S A Sシス 要な機能を多く欠いている。従来の S A Sプログラ テムでは解決しようの無かった S 臨床試験データプロセスフロー図 ムの菅理・ユーザインターフエースの問題に S A S ファーマテクノロジーは臨床エリアに特 H 画期的なソリユーションをもたらすのが P 化したソリューションとテクノロジーの提供 テンプレートである。 P Hテンプレートは S A S S A Sインスティチュートのサービス プログラムに対してレイヤーのような役割を を行う、 ‑5 0 6一

488.

果たし、従来の S A Sでは不可能だった管理機 的に作成する。 能とユーザフレンドリなインターフヱースを 可能にする。従来の解析・レポートのための 開療費開閉照明照明曹関開閉開掃殺事 4563tp }hM MJJ T531 レ If‑‑i+lri+Il‑‑争 ア 間叶 L HE 目 白 白 日 一 叫 ⁝ 翠 ト 一‑‑ 聞い問一間口町一凶一羽田 T3‑ ツ EP プ F ウ 剛一時 : 3 ↑ 一 州 町 一 エ 一 J 吋ノ P 且 ウ ア 解析が実行できる。 十 │ │1 十 11 │ │ ll する際は必要な情報を選択するだけで高度な t‑ 一 3 5 9 ‑ 7 5 5 ‑ u w Z ‑4 25 43 5‑ 142‑41 ﹃ヰ t られるようになる。またユーザが実際に使用 l‑t メインワークである解析にフォーカスが当て ロ レートが補うため、プログラマの作業をより ぽ H テンプ 備のデータ加工のコーディングを P i ↑I LI‑‑ ‑4 ログラム作成にて不可欠だった解析データ準 山掛川同↑ ログラムの資産的価値を上げる。また従来プ 11 h b白 一 一 一 一 日 イ P Hテンプレートはこの状況を改善し、 S A Sプ 山則的問一円川田山田一日間口町田一回凹百四一一川白山一一前例一日ン F 畠出 c 一 日 日 目 一 目 白 引 一 9日 間 一 日 一 千 ' 凶 ↑││l 日開閉 ↑一一仁 L213 一 1 J 岨有国 一2 一‑tv ttt 一 ﹃ 一 脚mhk 一 一 一 一 正日 され、共有・再活用がほぼ不可能に近かった。 Tm S A S プログラムは個々の臨床データ用に作成 従来の S A S プログラムはサブミットした後に アウトプット画面に出力を、ログ画面にログ を表示するだけでユーザが意識して実行内容 を保存しないかぎり、情報は残らない。また 実行ソースもリコールをしてから保存という Hテンプレートはア ステップが必要となる。 P ウトプットオブジヱクトという出力を自動的 に生成するので、出力結果を保存すると同時 にソース・ログ・要約情報も保存する。それ ぞれのタブをクリックすると実行時に使った 「ソース」、実行時に出たメッセージ等を保 2次元度数表テンプレ 存している「ログJ、実行の際の情報を「要 トサンプル 約」で確認できる。 上は p r o qf r e q を利用した度数表の作成を行 H テンプレートのサンプル画面。ユーザ うP は実行時にテーブルを作成したい行と列を選 択するだけである。 5 .アウトプットオブジェクト P Hテンプレートでは解析・レポート環境を使 い易いものするだけでなく、ユーザがわざわ ざ意識しなくてもバリデーションと監査証跡 のための情報を確保したアウトプットを自動 ‑507一

489.

る。またオープンになっていたクエリの記録 泊 もあるので、どのような状態のデータでレポ ・ u .z ヨ ロ Uscr Id ペ.~ O . t e T i . e V e r: l :i o nl d :::~ P H‑Tu.pla 1 : ・ I d : : 1Veuion勤圏her :W I エ z :Iune 2 8 . 日1 9 9 1 5 : 1 0 : 0 2 ートを作成したか確認できる。画面ではスタ ・D OIOIIOOI01E :0 0叩 1 耳目 l D I E 0代の患者だけをクエ 1 )で取り出 ディ内の 2 :1 / . . ・ ・ . . . . . . . , . . ・ ・ . . . . . . ・ ・ ・ ・ . . . . . ・ ・ . . . . . . . . . . . . . . . . . . ・ . . . . . . . . ・ ・ ・ . / 1 O vu Q!PH‑te l a t e ‑ / 司 / . . ・0 ・ ・・ ‑ ・ ・ . . . . . . . . . . . . . . . . . . . . . ・:‑l・ . . . . . , ・ ・ ‑ ・ . . . . ・ ・ . . . . . ・ / r v l vallablefor e la . t e . / . . . . . . . . . . . . . . . . . . . . . . . . . . ・ . . . . . . . . . . . . . . . . . ・ . . . . . . . . . . . . . . ・ ・ ・ ・ . / f. . ・ . . ・ . . . ・ ・ . . . . . 厳 . . . . . . . . . . . . " . . . . . . ・・ . . . . . . . ・・ . . . . . . . . . . . . . . / J・ O t l nS t u d i 目 げ ";~/'"・ H ・...・H・........・ H ・....・H ・.""..・ H・...・ H ・...・ H・ H ・ H ・./ ; ' l τt u : .r e i, . 咽 ・ 叩 四 rtudy ヰ ヒ S tudyHu .e 'l.1Gスタヂィ S tu . d yD e f i tiQnsn ,.・.h er'dat Libr. u ‑i e s :fflpnyb. Vre t . . l b r e していることが確認できる。ユーザがわざわ H 1 . 町 'o'日町 r H :::~ ~O 胃 H H H t 1 f U' l I H 泊四四 H 岬 H ざ意識しなくても、自動的に監査証跡・バリ a 2 デーションのための情報を作成し、保存が可 l ! 吋 S~別加、 幽 能になる。アウトプットオブジェクトでは「ア 叫 旧 O ' t̲C! l l l c : ; 3 . ウトプット」 「ソース」 「ログ」 「要約」の 情報をタブで分けて一つのオブジェクトとし アウトプットオフジヱクトー要約(前半) て保管できる。また保存先は必要に応じて D o c u m e n t u mなどの電子文書管理システムに畳 Hテンプレ 要約タブの前半には実行された P 録したり、また H T M L 出力して管理するとい ートの名前、ユーザ名、日付、時問、テンプ うのも可能だ。 レートのバージョンナンバーが記録される。 要約タブを確認することにより、アウトプッ 保存したアウトプットオブジェクトは単に情 トがいつ誰によって作成されたものか確認が 報を保存しているだけでなく、実行環境の再 できる。またパージョンナンバーも保存する 生も行う。アウトプットオブジェクトには以 ので、レポート作成に活用したプログラムが 下のようなメニューが使用できる。 改訂されていても正しいパージョンを確認す ることができる。また解析を行った治験=ス タディ名、保管先も記録されている。 i 機;四闘機開 /. Cr!la'te dFrc 臥 ・ / / . ・ ・・・ . . . . . . . ・ ・ ・ ・ ・ ・ ・・ . . . ・ ・ . . . . . . . . . . ・ ・ . . ・ ・・ . / 沼 氏 ; こ: f ‑ f ¥ H H H H H H H S H 、 、 2 2 L m g蒜 T端 品4 lodified: t8U 99・22:01・1 8 J 山v 叫ム ! lt im 時 。 四 日 1 :3 U sed Pl 潤且e :J . GE 20代 R開 O ue r i e sI J s e d :J lo n e アウトプットオフジヱクトメニュー Patiem Que口回目。宅百 sed :J lo n e r i e s目 。tUsed R四 O ue :H四@。 ~~~禄腐務蕊務窓務蕊認蕊務蕊~主要 アウトプットオフジヱクトー要約(後半) アウトプットオブジェクトには r V i e w Jとr R u n P H ‑ T e m p l a t e J というメニューがある。 r V i e w J を実行すると、作成時と全く同じアウトプッ アウトプットオブジェクトの後半にはデータ ト等が表示される。 環境が記録されている。使用したスタディ名、 じアウトプットを再作成する機能で、アウト データセット名、スタディの更新(いつ作成・ プットオブジェクトが作られたセッションを 更新されたスタディかを確認)等の情報があ 再現し、そして閉じデータを利用して閉じク 5 0 8一 r R u nP H ‑ T e m p l a t e J は閉

490.

エリ等をオープンしてプログラムを実行する 雇歴情報を保存している。プロパティの雇歴 のである。 のタブをクリックすると、ユーザがいつアク セスしてどのような作業を行ったか確認でき る。アウトプットオブジェクトでの結果の保 存以外に、どのようなユーザがどんな作業を 行ったのかが雇歴で確認できる。 PHテンプレートの種類 山 、 、 山 、 川 、 、 町 2 ー ・ アウトプットオブジェクドセッション設定 SAS/PH‑ C l i n i c a l ソフトウェアをインストール するとデフォルトで 4 0種類以上もの解析・ レポート用テンプレートが設定される。 画面ではレポート作成時に利用した乳癌のス タディと、特定の有害事象をセレク卜するク エリをリセットすると表示している。このよ うに全く同じ環境を自動的に再現して、プロ グラムを再実行するため、バリデーシヨンに 活用することも可能だ。 6雇歴情報の管理 幽創開閉開閉酬側聞贈閣贈自白幽幽幽幽幽圃自由由也時j PHテンプレート履歴 SASIPH‑ C l i n i c a l ソフトウェアではテンプレー トに限らず、 P H ‑ C l i n i c a l内のオブジェクトの ‑509一

491.

これらのテンプレートにはそれぞれヘルプと デフォルト PHテンプレートのリスト プリントレポート サンプルデータが用意されており、使い方等 人口統計学的度数と平均 がプロパティに記載されている。*マークを付 臨床検査レポート けたものに聞して詳細な説明を行う。 臨床検査の評価 併用薬レポート AEレポート ネストした行を持つ表 ネストした事1を持つ表 1元度数表(チャート付き) 2元クロス集計表 来院日 ID別統計量 キカウントと p値の表 記述統計 )ック統計量 キ基礎ノンパラメト 1 検定による治療の比較 プロパティ概説 カイ 2乗検定 治療の交互作用モデル キ臨床検査の分散分析(プロット付き) プロパティの概説は u sフアーマテクノロジー 棒グラフ センターが書いた英語のままであるが、方法 対話式棒グラフ のボタンを押すと日本語化された Winヘルプ 対話式分布プロット が表示される。 単純プロットのマトリックス ヒストグラム MSEと箱ヒゲ図 !議議長議長議議長 単純プロット 回帰プロット 臨床桟査の分散分析{ブロット付き}レポートの概要 について 対話式回帰 このレポート il 週Hもた~~'*桟査についての分散分析 (ANOVA)表です.このレポートでは、独立変数としてS t u d y T r e a 加e は在{壷L,;Eす。これは通常の分散分析表{ブロシ N元クロス集計表 ト付き)レポートよりも特殊なケースです. 正規曲線付きヒストグラム 分散分析表!J'̲c;成された後、次のヲロクトを作成するか とうか迫択できます. ネストした行と事1を持つ表 ロ 最 小2景平均の比較 ロ予測値対残差 積み重ねた行と列を持つ表 ロ 予i A H 直対スチューデント{りJ た残差 ヨ ン 分散分析表(プロット付き) PHテンプレート ‑Winヘルプ MSEプロット 箱ヒゲ図 対応のある t検定 プロシージャの内容、利用するデー夕、実行 クロス集計表 するために必要な変数などの情報が確認でき 5 1 0

492.

んあるが、このテンプレートは臨床検査の では PHテンプレート以外の Winヘルプも完 SGOT等を選択するだけで治療を独立変数と 全に日本語化されている。ぜひ利用して欲し して分散分析表を作成する。 (SGOTのサンプ EEU ︑︒ る 。 SAS / PH・ C l i n i c a lソフトウェア日本語版 2 . 1 3 ル分散表は次ページを参照)また以下のプロッ トを作成する。 6PHテンプレートの実行 最小 2乗平均の比較 ANOVAP lo I s , C o m P l l i s o o !L e H I ‑ S Q O I I!l M e a " 治 験 藁 投 与 i 治 騒 薬 投 与 t 治験車E投与 1 対照 ‑71U' 治験の治痩 予測値対残差 5 a E 3 d ‑ a E 司 S T s t 7 4 s i c 4 ・ 4 ・守. 申 . 1 ' ︐ J ‑ ‑ a •• r ・ ' タディのデータに精通していれば PHテンプ I 1 l l i ︐ ・ ログラムに詳しくないユーザでも、解析とス す け F1 1 を選ぶだけの GUI対応となっている。 SASプ s ンプレートを選択し、メニューで、必要な情報 I o p iiLU PH テンプレートの実行はマウスで目的のテ . ︑ ‑ d ' p ANOVAPlo 恰 レートで様々な作業が行える。 予測値対スチユーデント化した残差 7臨床検査の分散分析(プロット付き) ANOVAP lo I s a s i E s t tBl 1 0 t e 3 3 4 .2 5 e E ' s ol O hTU l T E‑‑1T H EI‑‑ 散分析(プロット付き ) J は選択した臨床検査 に関しての分散分析 (ANOVA)表を作成する。 a w v t e c d g I F o ‑ p i r 臨床検査の分 U T S J テン 「臨床検査の分散分析(プロット付き ) プレートを実行してみよう。 自 1 5 1 7 P これらのアウトプットに合わせてソース、ロ グ、要約情報もアウトプットオブジェクトと して保存が可能である。 臨床検査の分散分析(プロット付き)・メニュー 通常の分散分析を行うテンプレートももちろ ‑511

493.

「臨床検査の分散分析(プロット付き ) J で作 成したアウトプットには以下の情報も含まれ る 。 戸品単羊己主半己当主 臨床検査の分散分析(プロット付き) ! . . . . . 国 PJ!OVA Table ; ・ ・ パ 包 ANOVAPlots トfjjResidualsDataFile i・ ・ 怒 Least‑SquaresMeansDataFile 議総務滋総 基礎ノンパラメトリック統計量レポート 怒滋誕祭綴総主 変数選択画面で分類変数と分析変数を選択し、 臨床検査の分散分析(プロット付き)のアウトプット 使用したい検定手法のメニューから選択する。 テーブ jレとプロット以外に解析時に作成され た残差データや最小 2乗平均データもアウト プットの一部として保存される。作成された データセットを活用して新たな解析を行うこ カウン卜と p値の表 とも可能だ。 このテンプレートは、選択したカウン卜変数 このように臨床検査を指定するだけで PH テ の値ごとのカウン卜と割合を治療別に示す表 ンプレートが複雑な解析処理を行い、結果を を作成する。表の最後の列にカイ 2 乗検定の 様々な形で提供する。なおかっその成果物の p ‑値が表示される。 ログと履歴、作業環境まで保存するのである。 基礎ノンパラメトリック統計量レポート このテンプレートは単一の分類変数を使って、 l つまたは複数の分析変数を、要求した一連 のノンパラメトリック統計検定にかける。使 用できる検定は次の 5つである。 W i l c o x o n順位和検定/Kr u s k a l ‑ W a l l i s検定 o w nMood検定 中央値検定/Br 司 Vand e rWaerden検定 経験的分布検定 S a v a g e検定 カウントと p値の表・メニュー 分類変数を複数選択すると、それらのグルー これらの検定を次のようなインターフェース プ変数の値の組み合わせを示す表が見1に作ら で選択して実行する。 れる。最終ページに各テンプレートのサンプ ル出力を添付した。 巳U η4 1i

494.

しかしながら今回紹介した標準テンプレート 記述統計レポート もほんの一部で、まだまだ多くの機能をもっ このテンプレートは選択した lつ、または槙 たテンプレートが沢山ある。また既存の SAS 数の分析変数について必要な一連の統計量を プログラムのテンプレート化に聞しても今回 生成する。幹/葉プロット、箱ヒゲ図、正規確 は割愛した。この論文で紹介できなかった機 率プロットなど、さまざまなタイプのプロッ 能に関しては SUGIJ等の場でファーマテクノ トが作成可能である。計算したい統計量に、 ロジーセンターが紹介していく予定である。 平均値の信頼区聞が含まれている場合は、必 また日本の独特の文化とも言える罫線への対 要な信頼区間のタイプとレベルを指定ができ 応、美しく整形されたフォーマット出力とい る。グループ化の変数を Iつまたは複数選択 う点に関しては標準のテンプレートでは対応 すると、グループ化の変数が取得する値の組 していない。標準のテンプレートで作成した み合わせごとに、一連の統計量が個別に表示 結果を再活用してフォーマットをするか、ま される。 たは専用のテンプレートを作成するかになる だろう。ファーマテクノロジーセンターでは 日本の現実を踏まえて、 MS‑Excelに対応した PHテンプレートも準備中である。 この論文を作成するにあたってさまざまな SAS ユーザにヒアリングを行った。その中で C l i n i c a lの日本でのフアーストユーザで も PH司 ある日本ベーリンガーインゲ、ルハイム株式会 社の研究開発部門の方々、また臨床統計部の 鍵村達夫氏からは多くの貴重を頂戴した。こ 記述統計司メニュー の場を借りて感謝を申し上げる。 メニューから分析変数とグループ化の変数、 参考資料: 計算したい統計量、また信頼区間を指定する S A S / P H ‑ C l i n i c a l ソフトウェア 2 . 1 0 日本語版 だけでさまざまなデータを導き出せる。 Winヘルプ S A S / P H ‑ C l i n i c a l S o f t w a r e : V e r s i o n 2 . R e l e a s e 最後に n dR e f e r e n c e 2 . 1 0Usagea ラ S A S I P H ‑ C l i n i c a l ソフトウェアのパージョン クリニカル・データマネージメントサイエン 2 . 1 0 日本語版は昨年末リリースされ、日本の テイス卜社 医薬関係の多くの SASユーザに対して紹介さ れている。しかし機能が多く、また臨床のエ *次ページに紹介したテンプレートのサンプ リアに対していろいろなソリューションを提 ル出力を添付。 供しており、全ての機能に聞しての説明はな かなか難しい。その点を踏まえ今回は PH テ ンプレートの機能に重点をしぼり紹介した。 EA 旬 nぺU 民リ

495.

A N O V AP l o t s A N O V Af o rL a bT e s t=S G O T( A S T ) G e n e r a lL i n e a rM o d e l sP r o c e d u r e C l a s sL e v e lI n f o r m a t i o n C l a s s L e v e l s T R E A T 5 V a l u e s 治 験 薬 投 与 1治 験 薬 投 与2治 験 薬 投 与3対照一実薬対照‑).うセポ N u m b e ro fo b s e r v a t i o n si nd a t as e t=4 9 8 A N O V Af o rL a bT e s t=S G O T( A S T ) G e n e r a lL i n e a rM o d e l sP r o c e d u r e D e p e n d e n tV a r i a b l e :L A B N R S L T 検査結果(数値) S o u r c e D F S u mo fS q u a r e s M e a nS q u a r e FValue P r >F M o d e l 4 5 5 8 .8 3 5 6 3 3 6 1 1 3 9 . 7 0 8 9 0 8 4 0 0 . 9 8 0 . 4 1 8 4 E r r o r 4 9 3 7 0 3 3 5 .9 3 5 4 5 0 7 3 1 4 2 . 6 6 9 2 4 0 2 7 4 9 7 7 0 8 9 4 .7 7 10 8 4 3 4 R ‑ S q u a r e C .V . R o o tM S E L A B N R S L TM e a n 0 . 0 0 7 8 8 3 7 8 .9 9 4 9 9 1 1 .9 4 4 4 2 2 9 8 1 5 . 1 2 0 4 8 1 9 3 S o u r c e D F S T y p e 1S M e a nS q u a r e FValue P r>F T R E A T 4 5 5 8 . 8 3 5 6 3 3 6 1 1 3 9 . 7 0 8 9 0 8 4 0 O .9 8 0 . 4 1 8 4 S o u r c e D F T y p e1 1 1S S M e a nS q u a r e FValue P r >F T R E A T 4 5 5 8 . 8 3 5 6 3 3 6 1 1 3 9 .7 0 8 9 0 8 4 0 0 . 9 8 0 . 4 1 8 4 C o r r e c t e dT o t a l A N O V Af o rL a bT e s t=S G O T( A S T ) G e n e r a lL i n e a rM o d e l sP r o c e d u r e L e a s tS q u a r e sM e a n s S t dE r r P r >I T I LSMEAN u m b e r O : L S M E A N = O N L S M E A N H L A B N R S L T L S M E A N T R E A T 1 3 . 9 7 0 5 8 8 2 1 4 . 0 4 6 7 2 9 0 1 6 . 4 2 4 5 2 8 3 1 4 .9 8 8 7 6 4 0 1 6 . 2 4 4 6 8 0 9 1 .1 8 2 6 7 4 1 1 . 1 5 4 7 1 1 0 1 .1 6 0 1 4 4 9 1 .2 6 6 1 0 6 3 1 .2 3 1 9 7 3 2 0 . 0 0 0 1 0 . 0 0 0 1 O .0 0 0 1 O .0 0 0 1 O .0 0 0 1 tlqL司 U8uzhν 治 験 薬 投 与1 治 験 薬 投 与2 治 験 薬 投 与3 対照実薬 対照‑).ラセポ Tf o rH O :L S M E A N ( i ) = L S M E A N ( j ) /P r >I T I i / j 4EE ︽川V 8U守 ︽ υanzl7'FO R Z l A守 内41lnd F n u a n M 1 n H H W ︽v 川n u u mノ ﹄ 4EEu ︽ d F h J V J v e ‑ ‑ F h J V ‑ a n M 1 ︐ ﹃ ・ a斗nvRunu内 ‑‑nU . 0 4 6 0 6 5 2 0 O .9 6 3 3 3 1 .4 8 1 2 2 2 0 . 1 3 9 2 . 5 8 7 6 7 3 40 O .5 5 7 0 5 1 .3 3 1 6 1 6 O .1 8 3 6 5 2 3 4 1 .4 8 1 2 2 O .5 8 7 6 7 ‑ 1 .3 3 1 6 2 0 . 0 4 6 0 6 ‑ . 1 3 9 2 O .5 5 7 0 0 . 1 8 3 6 O .9 6 3 3 0 0 .5 4 9 7 4 ‑ 1 .4 5 2 6 6 ‑ 1 . 30 1 7 O . 5 8 2 7 0 . 1 9 3 6 0 . 1 4 7 0 O .8 3 6 0 8 1 O .1 0 6 2 7 7 0 . 4 0 3 5 0 . 9 1 5 4 0 . 7 1 0 9 3 ‑ 0 . 8 3 6 0 8 O .4 7 7 5 0 . 4 0 3 5 . 7 1 0 9 3 4 ‑ 0 .1 0 6 2 8 0 .4 7 7 5 0 . 9 1 5 4 O N O T E :T oe n s u r eo v e r a l lp r o t e c t i o nl e v e l .o n l yp r o b a b i li t i e sa s s o c i a t e dw i t hp r e ‑ p l a n n e d c o m p a r i s o n ss h o u l db eu s e d 9 .1 9 9 9 C r e a t e do n :J u n e2 ‑514

496.

N o n p a r a m e t r i cS t a t i s t i c s NPAR 1WAY PR0GEDURE W i l c o x o nS c o r e s( R a n kS u m s )f o rV a r i a b l eD M A G E G l a s s i f i e db yV a r i a b l eA E S E V A E S E V 2 3 N S u mo f S c o r e s E x d p e c t e d U n d e rH O S t dD e v U n d e rH O M e a n S c o r e 8 4 1 4 5 4 6 1 2 0 8 8 . 5 0 0 0 1 9 6 7 3 . 5 0 0 0 6 1 8 8 . 0 0 0 0 1 1 5 9 2 . 0 2 0 0 1 0 . 0 6 3 4 8 . 0 6 0 6 . 8 6 6 2 6 7 6 5 7 . 7 9 7 6 9 7 4 91 .7 3 7 4 9 9 1 4 3 . 9 1 0 7 1 4 1 3 5 . 6 7 9 3 1 0 1 3 4 . 5 2 1 7 3 9 A v e r a g eS c o r e sW e r eU s e df o rT i e s K r u s k a l ‑ W a lI i sT e s t( G h i ‑ S q u a r eA p p r o x i m a t i o n ) . 6 7 6 7 6 D F= 2 Prob>G H I S Q=0 . 7 1 2 9 G H I S Q=0 G r e a t e do n :J u n e2 9 1 9 9 9 目 一515‑

497.

C o u n ta n dp ‑ v a l u eT a b l e 9, 1 9 9 9 C r e a t e do n :J u n e2 │ 治験の治療 T o t a l1 治 験 薬 投 与 11 治 験 薬 投 与 21 治 験 薬 投 与 31対照ー実薬 │対照ーアう跡. I T r e a t m e n t 一一一←一一一→一一一一一一←一一一一一一←一一一一一一+一一一一一一一 I D i f f e r e n c e N 1C o u n t 1P c t 1C o u n t1P c t 1C o u n t 1P c t 1C o u n t 1P c t 1C o u n t 1P c t Ip ‑ v a l u e 一一一一一一一一ー一一一一一一一一一一一←一一一→一一一一←一一ー+一一一一←一一←一一一→ー一一恥←一一ー一←一一一+一一ー一ー+一一一←一一一一一ー一 生塑L 一 一1 1 4 5 1 3 0 1 1 0 . 9 1 3 3 1 1 2 . 0 1 3 1 1 11 . 31 2 4 18 . 7 1 2 7 19 . 8 1 2 1 8 4 1 2 3 18 . 4 1 1 7 16 . 2 1 1 4 15 . 1 1 1 7 16 . 2 1 1 3 14 . 7 1 一一一一一一一一一一一一一一一一一一一一←一一一一トー一一一→一一一+一一一一→ーーー←ー一一一→一一一一←一一一一←一一+一一一一+一一→ー一一一一一ー‑ 3 1 4 6 1 1 0 1. 36 1 1 1 14 .0 1 6 1. 22 1 8 1. 29 1 1 1 14 .0 1 O .8 2 0 2 一 一 一 一 一 一 司『 ー ー ー 一 一 一 一 一 一 一 ー ー ー 白 押 ‑ ー ー ー ー ー ー + ー 一 一 一 一 一 一 + ー ー 目 勾 弔 問 守 司 十 ー ー ー ー ー + ー ー ー ← 一 一 一 → 一 一 一 ー ー + ‑ ー ー ー ー ー ー → 一 ー 一 ー 一 + 一 一 一 一 一 ー + ー 一 一 一 ← ー ー ー 一 一 一 一 + 一 一 一 一 一 + ー ー ー ー ー ー ー ー ー 句 ‑CHの P ‑ v a l u ef r o mC h i ‑ s q u a r eT e s tf o rT r e a t m e n tD i f f e r e n c e

498.

D e s c r i p t i v eS t a t i s t i c s U n i v a r i a t eP r o c e d u r e 年齢 V a r i a b l e = D M A G E O u a n t il e s ( D e f = 5 ) M o m e n t s R a n g e 0 3 ‑ 0 1 M o d e 4 5 1 4 4 2 ))))) qu今LマJqL l ﹃ F h d A J ι 内唱UFhd4E' U 戸 411 ' h u n H V ((((( ・ lnu o v +1 qdquEDFO凋斗 SEDEDRUEDFo n s ))))) ‑‑ U H N ︐ ﹃ 凋崎 PURu‑‑句u U nwvFhdnv 柄 m唱 S 4 1 4 1 内44j ' h u n H V ((((( w 出 ρν +LqvqvnU4LqL STI‑‑AtA49ι ﹄ nu aE ︑ nu +1111*I1111B +li‑‑*3111111 ‑h+ マ 守内 冒 一 冒 ︽ HV‑ ︽ HV‑ AHV‑ nu+ nHvnuv‑ nHVAHvnuvnuv‑ vnHunHU‑ A H VH ︽ nHVAHvnuvnuv‑ nυnυnυnu+ nuvnHVAHvnuvnuv‑ 一 A H UH ︽V H ︽V H ︽V H ︽V H ︽V H ︽V H ︽V H ︽ VAHUAHU‑ A H UH ︽V AHU H ︽ VAHUAHUAHU‑ nunυnunυnυnununu+ H ︽U H ︽V AHU H ︽V H ︽ V A H U A H U A H U A H U ‑ A H U H ︽V H ︽V AHU H ︽V H ︽V AHU H ︽V H ︽V H ︽ V‑ A H UH ︽V H ︽V H ︽V AHU H ︽V H ︽V H ︽ VAHUAHU H ︽ V‑ A H UH ︽V H ︽V H ︽V AHU H ︽V AHU H ︽ VAHU H ︽ VAHU‑ A H UH ︽V H ︽V H ︽V H ︽V H ︽V AHU H ︽V H ︽V H ︽V H ︽ VAHU4 H ︽V H ︽V H ︽V H ︽V H ︽V H ︽V H ︽V H ︽V H ︽V H ︽V AHU H ︽ VAHU‑ nunvnuvnuvnunvnuvnvnunvnununvnv‑ ︽V ︽ ︽V H ︽V H ︽V H ︽V H ︽V H ︽V AHU H ︽V H ︽V H ︽V H ︽V AHU H H V‑ A H VH nHVAHVAHVAHVAHVAHVAHvnuvnHvnuvnHvnuvnuv H ︽V H ︽V H ︽ V‑ ︽V H ︽V H ︽ n H VH ︽V H ︽V H ︽V H ︽V H ︽V H ︽V AHU H ︽V H ︽V AHUAHU H ︽V H V4 千a n u n v n u n v n v n v n v n v n v n v n u n z u n v n v n v ‑ qG H ︽V H ︽V H ︽V H ︽V H ︽V AHU H ︽V AHUAHUAHUAHUAHU H ︽V H ︽V H ︽V H ︽V e n u n u n u n u n u n u n u n u n u n u n u n u n U︽ UnU ︽ Unu‑ nvnunununvnvnvnvnununvnvnunvnunvnvnvnunvnv‑ ・・ +ーーー一一+ 口 噌 lAJι :i1s1anwvphuAtan ﹃qdn 口 ﹃ lpoan ﹃﹃ l 内J n ヨ ︽ Uqunnvn '1414L 内 正 内L I ‑ ' 1 4 L 4 1 1 a 噌i B o x p l o t ﹄ ‑+meLFaOzEtUnFUORRUURFUOEaDZE4DEnDvan口u﹃aFuO﹃aaua﹃aAu﹃tanuv守司n口ωF句uoqauzqtdn句vU4n口LF4OLaqaLq4Lnqv44n口1 517‑ 2 C r e a t e do n :J u n e2 9, 1 9 9 9 D e s c r i p t i v eS t a t i s t i c s 5 5 5 1 5 0 2 7 2 4 2 0 6 4 4 6 4 1 3 2 1 9 9 9首 9 5首 9 0 首 首 1 0 5 % 目 1 1 0 0 首M a x 7 5明日3 5 0 %M e d 2 5 %0 1 0 %M i n 2 5 0 2 5 0 S u mW g t s N 9 7 1 8 3 8 . 8 7 2 S u m M e a n 4 . 2 2 4 5 1 . 6 1 5 3 6 5 V a r i a n c e 7 S t dD e v 8 0 . 6 8 9 9 3 0 . 1 8 1 4 K u r t o s i s ‑ S k e w n e s s 1 8 4 81 .9 3 9 6 2 4 0 C S S U S S . 5 4 4 8 8 4 2 2 . 1 6 3 4 2 S t dM e a n 0 C V 0 . 0 0 0 1 T : M e a n = O 71 .34002 P r > I T I N u m‑ =0 2 5 0 0 . 0 0 0 1 1 2 5 P r > = I M M ( S iR E n ) O .0 0 0 1 S g nR a n k E x t r e m e s

499.

U n i v a r i a t eP r o c e d u r e V a r i a b l巴= D M A G E 年齢 N o r m a lP r o b a b i l i t yP l o t 6 5 + キ + + + +++ ++キ +*キ* * * * * * * * キキキ キキキキ キ*キ++ *キキキ+ * * * + + * * + + キキキ +キ *キ* * * * * キキキ * * * * * * * キキキキキ *++ 本件+ 1 9 + +一一ーー+ーーーー+ーーーー+ーーーー+ーーーー+ーーーー+ー一ーー+ーーーー+ーーーー+ーーーー+ ‑ 2 ‑ 1 0 + 1 9 9 9 C r e a t e do n :J u n e2 9, 1 D e s c r i p t i v eS t a t i s t i c s + 2 3 S t a t i s t i c sf o r :D M A G E (年齢) N u m b e ro f n o n mi s si n g v a l u e s M e a n S t a n d a r d d e v i a t i o n 2 5 0 3 8 . 8 7 2 8 . 6 1 5 3 6 C r e a t e do n :J u n e2 9 .1 9 9 9 D e s c r i p t i v eS t a t i s t i c s 5 1 8一 4

500.

U n i v a r i a t eP r o c e d u r e V a r i a b l e = D M H E I G H T 身長 ( c m ) M o m e n t s O u a n ti I e s( De f = 5 ) 2 5 0 S u mW g t s N 2 5 0 1 61 .404 Sum M e a n 4 0 3 5 1 1 2 . 4 4 8 8 V a r i a n c e 1 S t dD e v 5 4 . 9 7 2 7 S k e w n e s s ‑ 9 . 6 5 9 2 K u r t o s i s 1 2 8 . 6 1 5 7 6 5 5 1 4 0 1 C S S U S S 3 8 5 8 8 . 2 7 . 7 1 2 8 2 1 S t dM e a n O .7 8 7 3 3 1 C V T : M e a n = O 2 O .0 0 0 1 0 5 . 0 0 1 4 P r > I T I N u m‑ =0 2 5 0 N u m >0 2 4 9 O .0 0 0 1 M ( Si R E n ) 4 的~I~I S g nR a n k 1 5 6 8 6 . 5 P r > = i S O .0 0 0 1 1 0 0 %M a x 7 5 首0 3 5 0 首M e d 2 5目。1 0 百M i n 1 8 2 1 6 6 1 6 2 1 5 8 ー5 R a ‑ n Q g e 0 3 ‑ 0 1 M o d e 1 8 7 8 1 6 0 9 9国 9 5国 9 0国 1 0 国 5 首 1 首 1 7 6 1 7 3 1 7 0 1 5 4 1 5 2 1 4 0 E x t r e m e s O b s L o w e s t H i g h e s t O b s ‑ 5( 1 4 ) 1 7 5( 1 8 4 ) 1 3 6( 1 9 9 ) 1 7 6( 2 2 5 ) 1 4 0 ( 1 4 8 ) 1 7 6 2 3 1 1 4 5( 7 9 ) 1 7 8( 1 5 5 ) 1 4 6( 2 1 2 ) 1 8 2 ( 1 5 8 ) H is t o g r a m 1 8 5 + キ 非 材料****料 キキ*キネキキキキキホキネネネキキキキキキキホホキネホキキキホキキホキホキホホホ**本*キ キキキキネキ**キキキキキキネキキキホネキキキキキネキ キキ * 5 + キ ー 一 → ー 一 一 ー ー + ー ー キ 1 2 9 1 3 3 8 0 5 B o x p l o t 0 I +ーー+ーー+ + ー+ 0 1 0 1 キ + ーーー+‑‑‑‑+ーーーー+‑‑‑‑+ 一一+一一ーー+ m a yr e p r e s e n tu pt o 3c o u n t s C r e a t e do n :J u n e2 9 .1 9 9 9 D e s c r i p t i v eS t a t i s t i c s ‑519 5

501.

U n i v a r i a t eP r o c e d u r e V a r i a b l e = D M H E I G H T 身長 ( c m ) N o r m a lP r o b a b i l i t yP l o t ++++++++ * + , ト + + , ト キ * キ キ キ * キ キ キ キ ***ネキ********ネキ* *ホ*********本****++ ***キ*++++++++ *+++++++ 185+ * ‑ 5 + * + ー ー ー ー + ー ー ー ー + ー ー ー ー + ー ー 一 一 + 一 一 一 ‑ , ト 一 一 一 ‑ , ト 一 一 一 一 斗 ー ー ー ー ー + ー ー ー ー + ー ー ー + ‑2 ‑ 1 0 + 1 +2 C r e a t e do n :J u n e2 9, 1 9 9 9 D e s c r i p t i v eS t a t i s t i c s 6 L 円 Fhυ n u

502.

S t a t i s t i c sf o r :D M H E I G H T (身長 ( c m )) N u n .̲ e ro f n o n mi s si n g v a l u e s M e a n S t a n d a r d d e v i a t i o n 2 5 0 .4 0 4 1 61 1 2 .4 4 8 8 C r e a t e do n :J u n e2 9, 1 9 9 9 D e s c r i p t i v eS t a t i s t i c s 7 U n i v a r i a t eP r o c e d u r e V a r i a b l e = D M W E I G H T 体重 ( k g ) M o m e n t s O u a n ti I e s( De f = 5 ) 2 5 0 S u mW g t s 2 5 0 N 6 1 .7 3 6 S u m 1 5 4 3 4 M e a n 1 31 .9 3 1 . 4 8 6 0 8 V a r i a n c e S t dD e v 1 0 . 0 1 4 9 7 . 4 4 3 3 9 8 K u r t o s i s ‑ S k e w n e s s 0 9 8 5 6 8 4 C S S 3 2 8 5 0 . 5 8 U S S 0 . 7 2 6 4 4 3 C V 4 . 9 8 3 9 P r > 目 0 . 0 0 0 1 T : M e a n = O 8 N u m^ =0 2 5 0 2 5 0 N u m 0 . 0 0 0 1 1 2 5 P r > M ( S i E Rn ) 0 . 0 0 0 1 S g nR a n k 1 5 6 8 7 . 5 P r > 18 師16 制:作 I~I 1 0 0 %M a x 7 5首 0 3 5 0 首M e d 2 5 施 。1 0 百M i n 9 9 7 0 6 0 5 4 3 6 R a「I o E e 0 3 ‑ 0 1 M o d e 6 3 1 6 5 6 9 9百 9 5 拡 9 0 拡 1 0 百 5 百 1 百 9 3 8 2 7 7 4 7 . 5 4 5 3 8 E x t r e m e s H i g h e s t O L o w e s t O b s b s 3 6( 1 9 8 ) 8 6( 1 9 8 1 ) ) 1 4 8 8 9 3 7 9 3 ( 1 5 4 ) 3 8( 2 2 3 ) 4 1( 1 8 6 ) 9 6 ( 9 1 2 4 9 ) 1 2 0 ) 9 9 4 2 9 7 .5 +ホ # H i s t o g r a m ホ 料水 ホ梓料水 材料水*** 。神神神仲材料柿 材料************** 6 7 . 5 + *神神材料材料柿 紳紳梓紳材料特紳紳紳材料* * * * * * * * * * * * * * * * * * * * 柿材料神林* * * * * 3 7 . 5 + * * 一一ー+ーーーー+一一一一+一一ーーー+ー一一 + 2 1 5 1 1 1 6 2 8 3 6 3 0 5 0 3 8 2 2 8 3 B o x p l o t 0 I I I I + ‑ ‑ ‑ ‑ ‑ + I I ←ー* I I * ←ー一一+ 1 1 I *m a yr e p r e s e n tu pt o2c o u n t s C r e a t e do n :J u n e2 9, 1 9 9 9 D e s c r i p t i v eS t a t i s t i c s ‑521‑ B

503.

U n i v a r i a t eP r o c e d u r e V a r i a b l e = D M W E I G H T 体重 ( k g ) N o r m a lP r o b a b il i t yP l o t 9 7 . 5 + ** + * * * * + + * * * * * + + * * * * + * * * * * * * * * + + * * * * * * * * * * * * * * * 6 7 . 5 + * * * * * キ * * ** * + + + 3 7 . 5 + ** + + + + +ーーーー←ーーー+一一ー←白一一+一一一←ーーー+一一一+ーーーー+ーーーー+ー一一一+ ‑ 2 ‑ 1 0 + 1 9, 1 9 9 9 C r e a t e do n :J u n日 2 D e s c r i p t i v eS t a t i s t i c s S t a t i s t i c sf o r :D 刷E I G H T (体重 ( k g ) ) N u m b e ro f n o n m is si n g v a l u日s M e a n S t a n d a r d d e v i a t i o n 2 5 0 6 1 .7 3 6 1 1 .4 8 6 1 C r e a t e do n :J u n日 2 9, 1 9 9 9 522‑ + 2 9

504.

ー ‑ 日 本 SASユーザー会世話人会 代表世話人 東京大学 大橋靖雄 盲1代表世話人 キリンビール株式会社 本川裕 世話人 株式会社東京三菱銀行 青沼君明 成媛大学 岩崎学 国際大学 大槻聴幸 コンパックコンビュータ株式会社 坂原将生 クインタイルズ・アジア・インク 西次男 持田製薬株式会社 舟喜光一 株式会社竹中工務庖 八木章 株式会社 SASインスティチュートジャパン デイヴィッド C . フェンダー ‑ 日 本 SASユーザー会事務局 株式会社 SASインスティチュートジャパン内 干1 0 4 ‑ 0 0 5 4東京都中央区勝どき 1 ‑ 1 3 ‑ 1 イヌイピル・カチドキ 8F T E L : 0 3 ‑ 3 5 3 3 ‑ 3 7 8 0 F A X : 0 3 ‑ 3 5 3 3 ‑ 1 6 1 3 第 18回 日 本 SASユーザー会および研究発表会論文集 1999年 8月 23日 発行 初版第 1刷発行 日本 SASユーザー会 株式会社 SASインスティチユートジャパン