SASユーザー総会論文集 2013年

1.3K Views

April 21, 25

スライド概要

SAS 生存時問解析プロシジャの最新の機能拡張 浜田知久馬
NLMIXED プロシジャを用いた生存時間解析 伊藤要二
NLMIXED プロシジャ紹介 PK 解析及び生存時間 解析への応用 小林聡晃
マクロ経済指標を使った重回帰分析による倒産予 測 長井章夫
共同 DB における欠損値解析法の利用 今井健太郎
学生の実演芸術鑑賞構造とその変化-学生調査 と社会生活基本調査の結果から- 有馬昌宏
MRアンケートによる製薬企業の営業力診断 武藤猛
ODS LAYOUT によるワクチンの臨床開発におけ る Dashboard の作成 高浪洋平
京都大学大学院医学研究科社会健康医学系専 攻の講義・実習における JMP の活用 寒水孝司
統計を知らなかった私の「SAS日記」 大橋渉
(財)日本科学技術連盟における「臨床試験セミ ナー統計手法専門コース」と SAS 教育 池田敏広
一般財団法人日本科学技術連盟臨床試験セミ ナー統計手法専門コースの総合実習プログラムを通した生物統計家の養成-受講生の立場から- 上野真治
小標本のための100重交差検証法のすすめ 新村秀一
一般化加法モデル(GAM)によるイベントヒストリー 解析 田中祐輔
隠れマルコフモデルにおけるベイズ推定 稲葉洋介
名簿の住所情報を市区町村名で自動分割する SASプログラム 安井浩子
TUTORIAL市区町村名で住所情報を分割する SASプログラムの作成方法 周防節雄
MI Procedure による多重代入 SASver9.3 におけ る新機能の紹介 多田圭佑
PLM プロシジャによる回帰分析と予測の分離 関根暁史
国立循環器病研究センターにおける臨床研究 IT 基盤整備とSASの活用 山本景一
SASを使った情報管理事例~そしてリスクをやっ つけろ~ 惟高裕一
JMP CIinical 4.0 の日本での活用の試みと課題 富里遼太
RAND関数による擬似乱数の生成 魚住龍史
Continualreassessmentmethodにおける MCMC プ ロシジャの利用 加倉井靖之
MCMC プロシジャによる非独立データの解析 矢田夏城
SASによる例数設計のシミュレーション 土居正明
ジェトロ、システム知識ゼロの課長代理が語る、 SAS DataFluxを 利用した Data クレンジングの実際 田中政輝
ライブラリ参照と名前の定義を利用して EXCEL ファイルへの柔軟なデーター入出力を実現する-解析結果のレポーティングからセルオートマトンまで- 森岡裕
SAS CDI 環境における SDTM と Define.xml の作成 迫田英之
FDA Submission のための define.pdf 作成事例一 SAS によるファイル変換の Automation 化 豊泉樹一郎
SASを用いた医薬品開発の統計解析担当者に対 する CDISC の社内教育 浅見由美子
非線形回帰分析の基礎と応用 高橋行雄
2群の割合の差における信頼区間の構成法の比 較 飯塚政人
SASによる二項比率の差の非劣性を示すベイズ指標の算出方法について 川崎洋平
エラーディクショナリ作成と統計解析帳票作成業 務における問題点の抽出 松島純之介
SBCS SASでの日本語データハンドリング 矢嶋友也
ミクロデータ分析,規定課題 魚住龍史
ミクロデータ分析,擬似ミクロデータによる国内旅 行費支出と世帯情報の関連の検討 魚住龍史
ミクロデータ分析,規定課題,世帯主の就業状況が貯蓄性保険需要に与える影響についての考察 ~擬似ミクロデータを用いた Tobit/Hurdle モデル 推定~ 宇野慧
ミクロデータ分析,健康因子に対する支出傾向に 関する解析 岡村正太
ミクロデータ分析,規定課題 高宗太輔
ミクロデータ分析,食費の分析による食に対する 意識と食生活の把握 高宗太輔
ミクロデータ分析,規定課題 筒井杏奈
ミクロデータ分析,変曲点を用いた最低生活費の推定-疑似ミクロデータ(平成16年全国消費実態調査)による- 筒井杏奈
ミクロデータ分析,規定課題 土井優子
ミクロデータ分析,家計簿から見た「世帯人員ごとの幸福度」に関する研究 土井優子
ミクロデータ分析,教育用擬似ミクロデータを用いた収入・消費傾向の考察 冨里遼太
ミクロデータ分析,シニア世代の消費特徴分析 中島貴之
JMPCIinicalにおけるCDISCデータの解析について 大津洋

profile-image

SAS言語を中心として,解析業務担当者・プログラマなのコミュニティを活性化したいです

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

論文集 ﹁?パ判 / リ 巾 万仙川川

2.

SAS、SASを構成するプロダクト群は、 SASI n s t i t u t eI n c .の登録商標です o その他、本論文集に記載されている会社名、製品名は、一般にそれぞれ各社の商標または登録商標です。 本論文集の一部または全部を無断転載することは、著作権法上の例外を除き、禁止されています。 本論文集の内容を実際に運用した結果の影響については、責任を負いかねます。

3.

目次 Room A 【A ‑ 1】S A S生存時間解析プロシジャの最新の機能拡張 3 浜田知久馬(東京理科大学大学院教授) 【A ‑ 2 ]N L M I X印プロシジャを用いた生存時間解析 7 3 伊藤要二(アストラゼネ力株式会社) 【A ‑ 3】N L M I X E Dプロシジャ紹介 P K解析及び生存時間解析への応用 83 小林聡晃(日本たばこ産業株式会社) B i o S t a t研究所株式会社) 高橋行雄 ( I 【8 ‑ 1】マクロ経済指標を使った重回帰分析による倒産予測 長井章夫(リコ 中井良人 9 7 リ ス株式会社) 【8 ‑ 2】共同 D 8における欠損値解析法の利用 今井健太郎(日本リスク・デ 1 0 1 タ・バンク株式会社) 【8 ‑ 3】学生の実演芸術鑑賞構造とその変化 一学生調査と社会生活基本調査の結果から‑ 有馬昌宏(兵庫県立大学教授) 福永征世(株式会社エヌ・ティ・ティマ 王程(兵庫県立大学) 1 1 5 ケテインクアク卜) 【8 ‑ 4 ]MRアンケートによる製薬企業の営業力診断 1 2 5 武藤猛 (MarkeTechConsulting) 【8 ‑ 6 ]O D SL A Y O U Tによるワクチンの臨床開発における D a s h b o a r dの作成 1 3 5 高浪洋平(武田薬品工業株式会社) 【8 ‑ 7】京都大学大学院医学研究科社会健康医学系専攻の講義・実習における JMPの活用 1 5 3 寒水孝司(京都大学大学院准教授) 佐藤俊哉 【8 ‑ 8 ]統計を知らなかった私の r S A S日記」 1 6 5 大橋渉(東京医科歯科大学大学院非常勤講師) 【8 ‑ 9 ](財)日本科学技術連盟における「臨床試験セミナー統計手法専門コース J ‑ とS A S教 育 1 7 5 池田敏広(株式会社ベル・メディカルソリユーションズ) 奥田英樹(株式会社デンソー) 永田均(株式会社ユ トラム) 田辺大樹(扶桑薬品工業株式会社) 坂井絵理(塩野義製薬株式会社) 【8 ‑ 1 0 ]一般財団法人日本科学技術連盟臨床試駿セミナー統計手法専門コースの‑ 1 8 3 総合実習プログラムを通した生物統計家の養成ー受講生の立場からー 上野真治 ( A Cメディカル株式会社) 大竹優哉(株式会社ジャパン・ティッシユ・エンジニアリンク) 奥田英樹(株式会社デンソー) 永田均(株式会社 1 トラム) 田辺大樹(扶桑薬品工業株式会社) 高畑隆之(シスメックス株式会社) I (シスメックス株式会社) 笹川佳目J 坂井絵理(塩野義製薬株式会社) 池田敏広(株式会社ベル・メディカル・ソリューションズ) 吉川俊博(小野薬品工業株式会社)

4.

【8 ‑ 11]小標本のための 1 0 0重交差検証法のすすめ 新村秀 1 9 3 (成践大学教授) 【8 ‑ 1 2 J一般化加法モデル ( G A M lによるイベントヒストリー解析 203 田中祐輔(イーピエス株式会社) 辻谷将明(大阪電気通信大学) 【8 ‑ 1 3 J隠れマルコフモデルにおけるベイズ推定 213 稲葉洋介(株式会社新日本科学) 宮岡悦良(東京理科大学) I 【C ‑ 1】名簿の住所情報を市区町村名で自動分割する S A Sプログラム 安井浩子(公財統計情報研究開発センタ 周防節雄(兵庫県立大学名誉教授) 2 3 5 ) 【C ‑ 1JT U T O R I A L市区町村名で住所情報を分割する S A Sプログラムの作成方法一一一 2 5 1 周防節雄(兵庫県立大学名誉教授) 【C ‑ 2JM IP r o c e d u r eによる多重代入 S A Sv e r 9 . 3における新機能の紹介 多田圭佑(イ 2 6 1 ピーエス株式会社) 【C ‑ 3 JP L Mプロシジャによる回帰分析と予測の分離 2 7 5 関根暁史(株式会社 A仁RONE T ) 【C ‑ 5 J国立循潰器病研究センターにおける匝床研究 I T基盤整備と S A Sの 活 用 一 一 一 2 9 1 山本景ー(独立行政法入国立循環器病研究センター) 山本晴子 宮本恵宏 植田初江 桑田成規 【C ‑ 6 JS A Sを使った情報管理事例 そしてリスクをやっつけろ 3 0 1 惟高裕 (塩野義製薬株式会社) 藤原正和 北西由武 吉田祐樹 【C ‑ 7】J M PC l i n i c a l4 . 0の日本での活用の試みと課題 315 富里遼太(大鵬薬品工業株式会社) 津田克彦 【C ‑ 8 JR A N D関数による提似乱数の生成 325 魚住龍史(東京理科大学大学院) 浜田知久馬(東京理科大学大学院教授) 【C ‑ 9JC o n t i n u a lr e a s s e s s m e n tm e t h o dにおける MCMCプロシジャの利用 335 加倉井靖之(東京理科大学大学院) 浜田知久馬(東京理科大学大学院教授) 【C ‑ 1 0 JMCMCプロシジャによる非独立データの解析 347 矢田真械(株式会社 A仁RONE T ) 浜田知久馬(東京理科大学大学院教授) 【C ‑ 11] S A Sによる例数設計のシミュレーション 土居正明(東レ株式会社) 3 6 1

5.

[C‑13)ジェトロ、システム知識ゼロの課長代理が語る、 SASO a t a F l u xを利用した O a t aクレンジングの実際 371 田中政輝(日本貿易振興機樋ジ工トロ) [C‑14)ライブラリ参照と名前の定義を利用して EXCELファイルへの柔軟なデータ 入出力を実現する 一解析結果のレポーテイングからセルオートマトンまでー 377 森岡裕(ナイフィックス株式会社) Room D [0‑1)SASC O I環境における SOTMと O e f i n e . x m lの作成 393 迫田英之(株式会社タクミインフォメーションテクノロジー) 楊敏 [ 0‑2 )FOAS u b m i s s i o nのための d e f i n e . p d f作成事例 ‑SAS1!'によるファイル変換の A u t o m a t i o n化一 413 豊泉樹郎(塩野義製薬株式会社) 北西由武 吉田祐樹 仁川 平井健太(株式会社 5 [0‑3)SASを用いた医薬品開発の統計解析担当者に対する COISCの社内教育 423 浅見由美子(第一三共株式会社) 小山暢之 山之内直樹 [0‑8) 非線形回帰分析の基礎と応用 439 高橋行雄 ( B i o S t a t研究所株式会社) [ 0 ‑ 9 )2群の割合の差における信頼区間の権成法の出較 461 飯塚政人(東京理科大学大学院) 浜田知久馬(東京理科大学大学院教授) [0‑10)SASによる二項出率の差の非劣性を示すベイズ指標の算出方法についてー一‑ 475 ) 11 崎洋平(独立行政法人国立国際医療研究センタ 榊原伊織(株式会社タクミインフォメ 宮岡悦良(東京理科大学) │ /株式会社タクミインフォメ ションテクノロジー) ポスターセッション 山 ションテクノロジー) 土 エラーテ'ィクショナリ作成と統計解析帳票作成業務における問題点の抽出 松島純之介(中外製薬株式会社) 久力 j 羊 杉谷康雄 結城美保(株式会社中外臨床研究センタ 坂上拓 489 ) SBCSSASでの日本語データハンドリング 矢嶋友也(株式会社中外臨床研究センタ 坂上拓 i ) 497

6.

│ ~データ分析・ミクロデータ分析 l 507 p【規定課題】 /魚住龍史(東京理科大学大学院) し【自由課題】 、提似ミクロデータによる圏内旅行費支出と世帯情報の関連の検討 5 1 1 魚住龍史(東京理科大学大学院) 【規定課題】【自由課題】 世帯主の就業状況が貯蓄性保険需要に与える影響についての考察 o b i t/H u r d l eモデル推定 擬似ミクロデータを用いた T 515 宇野慧(テルモ株式会社) 519 【自由課題】 健康因子に対する支出傾向に関する解析 岡村正太(東京理科大学大学院) 若林将史 東川正晃 ν 523 【規定課題】 (時捕(株式会社デタフオシズ) 【自由課題】 食費の分析による食に対する意識と食生活の把握 525 高宗太輔(株式会社デタフォーシズ) f ‑ ( 529 【規定課題】 月卜ラー式会社) 【自由課題】 変曲点を用いた最低生活費の推定 6年全国消費実態調査)によるー ー疑似ミクロデータ(平成 1 533 筒井杏奈(アス卜ラゼネカ株式会社) 537 ̲.."【規定課題】 L 土井優子(1'¥ナソ三ツク株式会社) 【自由課題】 家計簿から見た「世帯人員ごとの幸福度」に関する研究 5 4 1 土井優子 ( 1 ' ¥ナソ二ツク株式会社) 545 【自由課題】 教育用挺似ミクロデータを用いた 収入・消費傾向の考察 富里遼太(大鵬薬品工業株式会社) 土生敏明 米倉孝俊 549 【自由課題】 シニア世代の消費特徴分析 中島貴之(株式会社デ タフォーシーズ) M . . l i l . t . l i, 追加〉 I 【D‑5JJMPC l i n i c a lにおける CDISCデータの解析について 555 │ 大津洋(東京大学大学院特任研究員) 山口拓洋 索引 561

8.

I . . . . . . e71J''1~71'''~/C':}--&' …件三 r . : J , : 3 ユ ー ザ ~I SAS生存時間解析プロシジャの 最新の機能拡張 選¥ C h i l くu maHamada TokyoU n i v e r s i t yo fScience 浜田知久馬 東京理科大学 What'snewi nSASs u r v i v a l procedures. 1 鮎 ユーザー総会加問……… S 201I 要旨LlFETESTプロシジャは生存関数の信頼バンド e r n e l法を用いた平滑化ハザード関数の推定が可 ,k 能になった.更に 3群以上の多群について多重性を考 量した多重比較も可能になった PHREGプロシジャは CONTRAST,ESTIMATE, LSMEANS,LSMESTIMAT , E HAZARDRATIO文で 柔軟な推測,共変量と多重性の双方を同時に調整し た多重比較も可能になった.また RANDOM文による 変量効果を用いた解析も可能になった lFETESTプロシジャ, PHREGプロシジャ, キーワード:L 多重比較, LSMESTIMATE,変量効果 3

9.

L lFETEST 生存関数の信頼区間と信頼バンド k e r n e l 5 . 去を用いた平滑化ハザード関数の推定 PHREG ESTIMATE文と LSMESTIMATE文 LSMEANS文による多重比較 ( L lFETESTによる多重比較) 事例 最大対比法による用量反応解析 HAZARDRATIO文 共変量と多重性の同時調整 事例 サブグループ解析の多重比較 RANDOM文による変量効果モデル 3 生存関数の信頼区間と信頼バンド 点と線 生存関数の信頼区間 ( p o i n t w i s e ): 骨 特定の時点について,真の生存割合を被覆 する確率を確保 :CL:ConfidenceL im i t S ( t) +1.96JV杯~ V [ S ( t) ] :Greenwoodの 公 式 aIt~一一一一一色一- 生存関数の信頼バンド ( s i m u l t a n e o u s ): 時点全体について,真の生存割合を被覆 する確率を確保 :CB:ConfidenceBand 副作用の後発時期等の生存時間曲線のプロファイル を比較するとき等に有効 4 4

10.

Gehanの白血病データ C o n t r o l ( N = 2 1 ), 6 ・ MP( N = 2 1 ) D A T AG E H A N ; F O R M A TD R U GD R U G F . D O[ = 1T O2 1 ;[ N P U TW E E KR E M [ S S@ @ ; O U T P U T ; E N D ; E N D ; 5 生存時間曲線の信頼区間のプログラム plots二 s( c1 )オプション proc Ii fetest d a t a二 gehan 日 ( o p l山 二 s Rrata= 阻 elJt州 a t ri s l く 二 t o4 0b y5 ) method二 k m : t i m e week*remiss(O); strata d r u g ; r u n : 6 5

11.
[beta]
信頼区間
時点毎に真値が含まれる確率を保証
ProduC1
.
‑Lirnは金三芋子庄邑量豊
リスク白晶る封 S
陸自
白 1 : = 6‑MP

0
.
6

一一
、 ユ

i

l
:4‑!

0.
2.
.
1

'
0

侵I

吐

母t

.
‑
<
ィ

、

^

"

亙 亙E
ζ会

;
;
ふ
ら
"

^

川

以

パ

川

、

I
I
l

白
山
山t 山 川 、 パ

, .

•

I

→

'
.
8

!
l.
6
.
.
i

04‑
!

一二士三ご一二一一一一一̲
̲
J

:
L

K
'
0
.
ι

。

生存割合を 2重対数変換後,正規近似で信頼区間を構成
7

生存関数の変換と信頼区間の算出
得られた生存割合

S
(
t
)を関数 g
(
x)
0
、変換
S
(
t
)
‑
g
斗今g
(
S
(
t)

変換後に区聞を計算し,逆変換

点
。))+1判 v
a
r
[
g
(
S
(
t)
]
)
鴎

g
‑
'
(点t
(
士
) l刈v制
(
t
)
}
]
)

B

6

12.

g ( x ) = x 変換無し(LlNEAR:NOTRANS) g( x )=l o g ( x ) 対 数 変 換 (LOG) 二重対数変換 (LOGLOG) g( x )=log(‑ l o g ( x ) ) 逆正弦変換 (ASINSQRT) g( x ) =sin‑( 口ジット変換 (LOGIT) g ( x )=l o g ( x j ( l ‑x ) ) ぷ) 1 9 各変換での95%信頼区間 変換後正規近似で CL 構成→逆変換 L lNEAR LOG LOGLOG ASINSQRT LOGIT S士 1 .96F v 亙 同 刈 巴ogS:t1.96Fつ可) 1 切 ( 一 切 (10gト10仰 l州 S t '. v a r [ S l ) ) .10gS 山 ) 2 (arcsin(♂ド1.96J(4S(I‑S)t. v a r [ s J ) A h ただし山村 10 7

13.

iL 一 閃称醐唱さ 一閃対一鵬一 下 v 上竺一議均一 閃称 L 対 下繍 上主 ﹂ 明 h ⁝ 時 一 GEHANのデータ(対照群)での 5 種類の信頼区間 デフォルトは LOGLOG変換 E豆宣車盟 1 1 9 50 / 0信頼区間の正確な被覆確率 区間 [ 0 . 0 5, 0 . 9 5 ]における平均値 • NONTRANS 定例数 [ n ] 1 2 50 • LOG 100 • LOGLOG 200 デフォルトは LOGLOG変換 8 • ASINSQRT • LOGIT 400

14.

95%信頼区間の正確な被覆確 リ3 9 2 9 1 佐藤聖士,浜田知久馬 (2011) 生存関数における信頼区間算出法の性能比較 SASForumユーザー会学術総会 90 ~1 ~2 ~3 ~4 ~5 ~U ~7 ~8 ~9 生存割合的真{直 [ 1 1 = 5 0 ) 13 L lFETESTプロシジャの信頼バンドの出力 UFETESTプロシジャのプログラム例 ATA=DA TDERR 信頼バンドの霊を指定 (EPorHW) All で荷方を出力 デフォルトは H W デフォルトは LOGLOG変換 14 9

15.

信頼バンドの種類 • EP(EqualPrecision)型信頼 1¥ンド ) + k σjs(1)S(/) S ( / )弘 (aL,aU)ト ' s( 1) S ( / )三 S ( / )三 S ( I (a aU L, N a i r .V .N .( 1 9 8 4 ) 上下対称 ・HW(Hall‑Wellner)型信頼バンド S(t) 九仇 01jl!?σ.~ ( t) ] S ( t )5 S ( / )5 S (μohY2 吋 ( t ) ] S ( / ) W.J .Ha I landJonA(1980) l 5 ( / )生 存 割 合 の 推 定 量 σ ;( 1 ) :生 存 害 恰 の 分 散 l 15 生存時間曲線の信頼バンドのプログラム p l o t s = s ( c b )オプシヨン proc Ii f e t e s td a t a二 g e h a n s t r a t a二 p a n e l附 plots=s a t ri s l く 二o t o4 0b y5 ) 回 m : method二 k t i m ew e e k * r e m i s s ( O ) ; strata d r u g ; r u n : 16 10

16.

信頼バンド(信頼区間より広い) 区間で真値が含まれる確率を保証 ←Lim比 生 存 鋤 線 Pro由 c デフォルトは リスクのある珂怠散 キ 換 H W型 で LOGLOG 者 ' * CONTROL じ etI545324h 一 一 ; ) 6 . . ' 佐 藤 聖 士 浜 田 知 久 馬( 2 0 1 2 ) 生存関数における信頼バンド構成法の比較 SASForumユ ー ザ ー 会 学 術 総 会 30 +打ち明りロ目、 . . . . ・ Welner白 信 輔 自 問 17 信頼区間と信頼バンドの同時出力 p l o t s二 s( c bci ) Product‑Limit 生 存 曲 線 リスク白島る封銀融 町 1 : =6‑ 附 1 . 0. . . 叩,‑ーー‑‑ , 寸 m 1 :.6. ・ー岡、‑‑島守峰崎司時四"' 、 、 届 a 吃 ヨ8ベ 事司降、‑ ‑ ‑ 弘 司 ゐ』 、J・一一一一一ー一一一一一一一一一ー‑ • ︐ . 今 却 を 'b 3喝 ‑ ‑ 司旨 l :2‑ ‑ j O ‑ i : 2 1 ~ l : 位 剖 1 . 0. . . ヨe . 1 :. 6 : J . 4 l :2‑ ‑ j ' . 0 一一一一一一一一一一‑ " ・ ・ ・ , o 10 +打ら切り 0 20 WEEK 目、 1 I暗 闇 界 ロ 9日Ha,I‑We 、 ーer(])f2岨日間 1 8 1 1 30

17.

ノ¥ザードの推定と平滑化 proc I i f e t e s td a t a二 g e h a nm e t h o d二 p l i n eI s o n l p l o t s ( o n l y )二 h a z a r c l ( k e r n eI 二 bb w 二 t i m ew e e k * r e m i s s ( O ) ; s t r a t ad r u g ; r u n : k e r n e l (カーネル)関数による平滑化 バンド幅 bw(bandwidth)=5週 19 ハザードの推定と平滑化 砂 Nelson‑Aalen推定量 累積ハザード関数 万( t )の推定量 ラ ん( んや)=Ldj/nj t )= dj/nj 1 ;三 r [ ? 卜 叫 咋 : n 叫i' 時点 jにおける群を併合したリスク集合の大きさ ハザード関数:離散的な値をとる .関数の形状の比較が難しい 圃 k e r n e l (カーネル):核関数法で、ハザードの平滑化を行う 2 0 12

18.

N e l s o n型の累積ハザード関数 = 層2 :d r u g CONTROL N e l s o n型のハザード関数 C o n t r o l h ( t )= d)ni h ハザード関数 1 .0: 0.9: 0.5 0. 4 : 4 1 2 2 26 0.3'2 2 1 2 2 01j 0.0' , 4 i li 。 10 20 t 時間(週) 22 1 3 30

19.

N e l s o n型のハザード関数 6 ‑ M P h ( t ) =d i / n h ハザード関数 j 2 1 ‑ 0 . 1 6 ] …… ?}‑‑一〆hu 一一 ‑ t 一寸I 0 . 1 8 0 . 1 4 0 . 1 2 0.08 ー 0 . 1 0 1 1 2 1 5 0.06 0.04 0.02 。 0.00 24 1 0 20 t 時間(週) 1 4 30

20.

k e r n e l ‑ s m o o t h e dh a z a r d関数の出力 Gehanのデータ Biwe唱 htKemel‑Smoothedによる J、 ザ ド 関 数 0 . 6 句 CONTRoL l 時 バンド幅 5週 1 ム ! ' 04 { ' 1 型 / 十竺一一~! /一て二三 00 戸一点三三二一一一一一一一二三三三三三三三士一二三?士三二三一一一一一一一¥ WEEK <Yug 一 一 一 一 一 一 一 ‑6‑MP 一 一 一 一 一 一 一 一 CON了ROL Bal¥dwId せ 、=5 25 カーネル( k e r n e l:核)推定 F ( t ん) = j宇 ( 子 ド ( t ) K(x) , ) 平滑化…‑ド推定量 :カーネル関数 バンド幅 b ある点(核)を中心とした確率密度 関数を複数可算した混合分布 カーネル関数 ( b i w e i g h t力一ネ jレ ) I¥ / y(‑1:'Sx三1) I/ K ( x ) =勾̲ x 2 1 6 ¥ ノ 、司 ¥ ¥ ¥ ... バンド幅 2 b 26 15

21.

時点ごとのカーネル密度 kh ハザード関数 0.20{ 0 . 1 8 ] ( x ) = t bx 2 ) 2 0 . 1 6 1 0 . 1 4 1 0 . 1 2 : バンド幅 5週 0 . 1 0 : 0.08 0.06 0.04 0.02: 万雪030‑ … O.OOi~ o 1 0 40 t h 時間(週) 27 カーネル密度の加算 C o n t r o l kh ハザ ド関数 0.25 0.20 1 ¥ンド幅 5週 0 . 1 5 0 . 1 0 0.05 。 0.00 2 8 1 0 20 30 t h 時間(週) 16 40

22.

時点ごとのカーネル密度 6 ‑ M P kh ハザード関数 0.030 0.025 0.020 0.015 0.010 0.005 0.000日 コ ー … ......~匂 ι :………ー 。 ‑ ‑ 1 2 b 10 20 ( " ' f ニ 29 30 40 也時間(週) カーネル密度の加算 6 ‑ M P kh ハザード関数 0.05 守 0 . 0 4 : 0 . 0 3 ' 0.02 守 0 . 01 ' 0.00 o 30 1 0 20 30 t h時間(週) 17 40

23.

d o i ' lO . 1 0 9 3 i j j r o ! h y q : : 0 9 A d v a n c eA c c c s sP ub l i c a l i o l l1 iN o v e m b e r2 0 1 0 凶 │ S 伯h 川 C 伽 0 m n m l l 山 l I 似叩叩 霊投与期間の比較(何6凶 v S . 1 2月) D o e s1Y e a rA d j u v a n tC h e m o t h e r a p yw i t hO r a l5 ・ F U si nC o l o n C a n c e rR e d u c et h eP e a ko fR e c u r r e n c ei n1Y e a ra n dP r o v i d e L o n g ‑ t e r mOSB e n e f i t ? 1 3 C h i k u m aH a m a d a, ' ,J u n i c h iS a k a m o t o2 , T a r 凶S a 旬h , s o 旬r oS a d a h i r o ,4 Hide卯k iM i s h i m a5 ,K e n i c h iS u g i h a r a6 , S h i g e t o y oS a j i 1andNaohiroTomi出 ' F a c u l t y0 1E n g i n e e r i n g, T o k y oU n i v e r s i t y0 1S c i e n c e, T o k y o, 2 Y o u n gL e a d e r sP r o g r a m, N a g o y aU n i v e r s i t yG r a d u a l e ∞101Medicine,Nagoya,3Departmenl0 1M ω i c a lO n c o l o g y , K i n k iU n i v e r s r t yS c h ∞101Medicine,Osaka, S c h ' S u r g e r y, T o k a iU n i v e r s i t y , K a n a g a w ,a 5 S u r g e r y, 0吉a k aN a t i o na JH o s p i l a l, O s a k a, 6 Su c a lO n c o l o g y , T o k y o r gi M e d i c剖a n dO e n t剖U n i v e r s i t y , 7 J a p a n e s eF ω n d a l i o nl o rM u l t i d i s c i p l i n a r yTr e a t m e n t0 1C a n c e r ω T o k y oa n d8 0 i v i s i ∞ 0 1L o w町 G I, D ep a同m e n t0 1S u r g e r y , H y o g oC o l i e g e0 1Mωl ロn e, N i s h i n o r n明 。J 叩m ' F o rr e p r i n t sa n da l ic α r e s p o n d e n c e :C h i k u m aH a m a d a, F a ω仕y0 1E n g i n e e r i n g, T o k y oU n i v e r s i t y0 1S c i e n c e h i n j u k u ‑ k u,T o k y o1 6 2 ・ 8 6 0 1,J a p a n .E ‑ m a i l :h a m a d a @ m s . k a g u . t u s . a c . j p K a g u r a z a陥 S R e c < i v 困J u 同 9 , お1 0 ;a c c 捌凶Oc t 曲e r1 0,2 0 1 0 3 1 対象データ X‑ACT 試験と財団法人がん集学的治療研究財団によ る3試験(JFMC7‑ 1, JFMC7‑ 2, ] FMC1 5 ) ・ステージ Eの治療群患者のみ使用(投与期間の比較) 圃全生存期間:o v e r a l ls u r v i v a l,05 ・無病生存期間:d i s e a s e ‑ f r e es u r v i v a l,DF5 試験 X‑ACT JFMC7‑1 JFMC7‑2 JFMC15 化学療法 5‑FU/LVカベシタピン 5‑FU, HCFU 投与期間 6ヶ月 1 2ヶ月 患者数(人) 983 1 0 0 4 405 男性(人) 女性(人) 532 4 5 1 543 4 6 1 1 9 0 215 32 1 8

24.

6VS.1 2月投与 ( D F 5 ) K M法 に よ る 生 存 関 数 : 6 生 杭ι カーネル法によるハザード関数 0 . 2 5j /¥ザード比 0 . 6 7 9 9020『 〆 ド 0.15γ--~, 0. 4 / L o g r a n kp < O . O O O l ¥ 0 . 2 1 6 ヶ月 、 . ̲ ‑ ‑ ‑ . . . .̲ ̲ ̲ ニ ヒ 〆 1 2ヶ月 時間(年) 時間(年) • 0 ‑ 0 . 5年はあまり差がない バ ン ド 幅 b= 1(年間) ~ 0 . 5年以降ハザード、 l 二差が現れる ~ 1¥ザード比:0 . 6 7 9 =今 1 2ヶ月投与の方が再発・死亡リスクを約 32%抑える 33 6VS.1 2月投与 ( 0 5 ) K M法 に よ る 生 存 関 数 力 1 .0i ネル法によるハザード関数 ノ一 0 . 1 0 7 1 7 7 L、 0 . 8; 6ヶ月/ f / / f 入¥ /‑‑12ヶ月 0 . 0 8 ; J 生 存 一 υu 率 7006 0 . 4 ぺ ド0.04; L o g r a n kp = 0 . 1 5 9 、 〆 ハザード比 ぷ 0 . 8 5 5 0 . 0 2 ; ; グ 0 . 2 1 ハ u nU n u 品 開 ( 手 ) 時 間 (4) ~ 0 ‑ 1年はあまり差がないハンド幅 b= 1(年間) ~ 0 や l、 2 1 年以降ハザード、に差が現れる ~ 1¥ザード、比:0 . 8 5 5 二 争1 2ヶ月投与の方が死亡リスクを約 14%抑える 34 1 9

25.

VAL u n gC a n c e rd a t a ( P H R E Gのマニュアルより) VeteransA d m i n i s t r a t i o nl u n gcancert r i a lpresentedi n K a l b f l e i s c handP r e n t i c e ( 1 9 8 0 ) 男性を対象とした進行肺がんのランダム化臨床試験 エンドポイント:Time(死亡までの時間(日) ) 共変量 Therapv(2)(治療法:standardo rt e st ) C e l l ( 4 )(臆嬉セル型:adeno.l a r q e .smalL squamous) P r i o r ( 2 )(既往歴:O=no,1O=yes)Age(連続量)(年齢) D u r a t i o n(連続量)(診断からランダム化までの期間(月) Kps(連続量)(Karnofskyのperformances c a l e ) 0‑100 35 生存時間 KM曲線 ( V AL u n gC a n c e rd a t a ) C e l l型で層別 Produc←Limit生 存 推 定 リスクのある酎象阻 1 . 0 8 0. 0 . 6 時 4 制 J j : 0 . 4 2 0. 0. 0 , . . '00 200 JOO ・ 400 500 t j r 胃 et o d 8thi nd四ys Cell ‑‑‑, ・ d o 8no ‑一一一一一一‑2.I rg・ーー一一一一一一 J.small ‑ ‑ ‑4: . ! I 36 2 0 :>Qt旭 m~崎 600

26.

生存時間 K M曲線( V AL u n gC a n c e rd a t a ) T h e r a p yで層別 02 ‑ . 0 . 0 ・ 的 3 ‑ 1 12 13 2 1 8 ~ 2 9 4 0 2 一 一 一 一 一20一 一 3一 一 一 一 一 一 一 o 100 0 00 400 500 600 ・ , ) ・ tim todeathi nd ys ー ー ー 一 ー ‑l'st..ahdard 一 一 一 一 一 一‑Z t‑ es t T h t H " e o p y 3 7 N I I I . . 向、. . . . ヤU附官室~.~ ス四 生存時間 KM曲線 h 需 品 沼 田 . " ち " 守 一 叩 ' 1 1 ' , 0 : ' ) ﹁ e pn o y t e HHJu ea c= ー ド C e l l型と Therapy 層別 「 lL l a r g e 同「 ω , ,. 同 . .. ・ ̲ . . 副 . . 胴 m m 間 島網開 n . . . ̲‑'.‑.4一山 日 一 一 ‑t...... 日制一回虫町田 ' 1 1 7帥 捗 " ~. Ho:μ31主 "μ32. , Ismall I '~、 standard N 内 ・4 ・ . ‑ L . . . "0 ・ , , , . . . よ ヨ squa町lOUS 寸 . . ,. t e s t 咽 38 2 1 時袋町随,. . . . . 間 嗣 ・; 圃

27.

4x2 2元 配 置 セ ル 平 均 の モ デ ル Therapy Cell S山 α 1 Large α Small α1 Squamous α 4 Adeno ウ 玖 r 百s t s 2 μ刊 Oα'A μ120αsl μ 1・ μ 2 1 0αß~l μ220αs 2 μ 2・ ト l 3 11αs31 尚一 l α ん μ 3・ μ 4 10αs 4 μ420αs 4 ト l 4・ μ・1 μ・2 μ. I C eI IT h e ra p yC eI1 *T h e ra 叫 m 39 ESTIMATE文 , LSMESTIMATE文 セル平均を用いた仮説の表現 。匹 =μ 帰無仮説 : H C e l l ( i )s m a l lにおいて,対数ハザードが処置。) 8tandardとT e s t lこ差があるか h i j( t ) h o( t ). e却 (αi+β~. +(αβ) ゥ ) 二 μ0 l o gh i j( t )==μ+αi+β~+(αβ)u ・二 μ h o ( t )α i :セル効果, β j :治療効果 二 ぅ 40 22

28.

P H R E GのE S T I M A T E文としS M E S T I M A T E文 r o cp h r e gd a t a二V A L u n g ; l m ; c l a s sP r i o rC e l lT h e r a p y / p a r a m二g eI IT h e r a p y m o d e lT i m e * S t a t u s ( O ) C C eI 1 *T h e ra p y; e s ti m a t e" 3 s m aI I1s t a n d a r dv s2 t e s t " 1 0O / ee x p ; C e l l * T h e r a p y00001‑ I s m e s t i m a t eC e lI * T h e r a p y t a n d a r dv s2 t e s t " " 3 s m aI I1s 00001 ‑ 1 0O A e~xp;run; 二 αβ31αβ32 4 1 パラメータ推定値 自由│パラメタ 標準誤差 カイ 2乗 Pr> 度 推定値 1 . 5 6 5 3 9 0 . 8 2 2 7 8 ChiSq ‑?一+・一 S 一 eTe 一一 一一 C J U O S一 一 ‑‑U m q y 一V 一V 一V 一 一P 一 口 一 口 一 p V 一 Ih‑‑h e 一 一日川一品一 g 一e E 一回一同一凶 帆一川一m 一 m 一 Lυ7H 同一S一S一S p 一 l h 一 h *一本一*一*一* a 一 a 一a 一a 一a v‑‑vp‑va‑vp‑va e 一e 一e 一e‑e h T T 一 干 ' 一T T 一 e 一e 一e 一e 一e C C C C 一 C 一 一 一 0 . 0 3 9 8 < . 0 0 0 1 0 . 3 8 9 3 8 3 . 7 0 6 4 0 . 0 5 4 2 0 . 5 6 9 2 5 2. 4724 0 . 1 1 5 9 0 . 5 6 0 4 5 4 . 7 8 3 5 0 . 0 2 8 7 0 . 5 1 1 2 7 I C e l l ネT herapyIsquamous I~est 23 くβ 001 0 . 3 8 4 9 9 1 6 . 5 3 2 6 40 0 2 1 4 . 2 2 6 7 0. 0 . 3 9 1 6 5 2 1 . 5 4 8 1 7 . 8 2 4 6

29.

ESTIMATE文と LSMESTIMATE文の結果 ESTIMATE文 推定値 F 内 d 内 VE 一 円 川 叶 j + L 一 ・ ν l m 山 一 ベ 一 2 4 γ1JP 推定不能 WJNUQ ﹁ nd‑ e T + L m一 e ed‑cu + L一 ヒ 一 一 L q u 一円 n H一 ‑cu 一 V e一 M 一吋 S一 a 一 d e ‑nd ud一 一+目︑ S q S一 1 一HH a UJ‑1J一 LSMESTIMATE文 u=フ一主 α s 3 J αん=‑l. 43016 とは異なる 43 HぷS V 3 s m a l l1 s t a n d a r dv s2 t e s tI N o n ‑ e s t

30.

モデルパラメータによる仮説の表現 C e l lCの5 t a n d a r d (ド3 1 )とT e s t (ド3 2 )の差 μ0 μ+αi+βj‑+(αβ ) u ・二 μ31 ニ μ+α3+ 向 +(αβ)31~ μ32=μ+α3+β'2+(αβ)3 4 円 QU' QU' μ31μ32 二 月 ‑s2+(αβ)31‑(αβ)32 45 ESTIMATE文の指定(主効果も指定する必要) T h e r a p y1‑ 1C e lI * T h e r a p y00001‑ 1 00 s Is 2 αs3JαA2 μiαl α2 α3 α4 ラ ラ ラ αs 3 1αメ し αβ41αβ42 ラ ラ α β ) 3 1 μ 3 1ニ μ+α3+β'1+( μ 3 2 μ+α3+β2+(αβ)32 二 s 1-ß2 I~(々九三(♂)三i μ31μ32= 1 2 5

31.

ESTIMATE文と LSMESTIMATE文 e s t i m a t e" 3 s m a1 1 s t a n d a r dv s2 t e s t " i T h e r a p y1‑ 1 Cel い~Therapy 00001‑ 10 0 1 ; e s t i m a t e" 3 s m a l1 1 s t a n d a r dv s2 t e s t " 一 1C e11い:>fド灯叶 ~The 司弔 T刊「 i T h e r a p y卜 1 (省略した場合は Oとして扱われる) I s m e s t i m a t eC e1* T h e r a p y " 3 s m a111 s t a n d a r d o0001‑ 1 00 ; 1 v s2 t削 " 4 ' C e11* T h e r a p yのみ指定) セル平均を用いた仮説の表現 平均効果 A d e n oとL a r g eにおいて差があるか 。 帰無仮説 : H μl=μ2 μ11+μ12̲μ21+μ22 2 2 h i j( t ) h o( t ) .e却 (αi+β~ + ( α β) i j) 二 約二 l o gh i j( t )==μ+αi+β~. +( α β) u ・ μ h o ( t )α i :セル効果, β j : 治療効果 二 ラ 2 6

32.

H ド モデルパラメータによる仮説の表現 平均効果 C e l lAとBの差 μ 1 ] μ+α1+β.]+(αβ)11 い12 二 μ 1 2 μ+α1+丸 +(αβ)12 ド21 二 い22 μ21=μ+α2+β.]+(αβ)21 μ22=μ+α2+β'2+(αβ)22 μ 2 1+μ22 49 iMATE文の指定 I I 1‑ 1 00 e II * T h e r a p y. 5. 5‑ . 5‑ . 5 0000 α β 1 1 α β 1 2 α β 2 1 α β 2 2 μ α l α2 α3 α4βl β2 ラ ラ ラ ラ αβ11 αβ12αβ21 αβ22 ラ ラ s 3 1, a s 3 2 αβ4 1 'a β42 α' μ 1 .一 μ2 ・二 l 1+μ12μ21+μ22 一 2 ( α β ) 1 1+(αβ)12‑( α β ) 2 1‑(αβ)22 27

33.

ESTIMATE文と LSMESTIMATE文 e s t i m a t e‑ ' a d e n o ‑ 2 I a r g e ‑ o r estimate "1adeno‑2Iarge" C e lI1‑ 1C e lI * T h e r a p y. 5. 5‑ . 5‑ . 5 ; (省略した場合は Oとして扱われる) n I s m e s t i制 e1 C e l l 勺 adeno‑2large 1 ‑ 1 00 : 1 ( C e1 1のみ指定) 5 1 セル平均を用いた仮説の表現 平均効果 Therapy S tandardとTestにおいて差 があるか 帰無仮説:Ho:μl=μ2 μ11+μ21+μ31+μ41̲μ12+μ22+μ32+μ42 。 ; 二(t)押 収i+βj+(2β)ij・) h i j( t ) ん ・ 二l o gh i j(t) 二 μ+αi+β~. +( α β) i j f 二 h o ( t )α i :セノレ効果, β j :治療効果 ぅ 2 8

34.

一 一 一 t ド1 2 モデルパラメータによる仮説の表現 平均効果 C e l l AとBの差 1 4 2 ド22 3 2 1 ‑ 1 μ1μ.2 ・ 一 μ11+μ21+μ31+μ41μ12+μ22+μ32+μ42 4 4 53 ESTIMATE文と LSMESTIMATE文 e s t I m a t e" 1 s t a n d a r d ‑ 2 t e s t " h e r a p y 1‑ 1 e I1 *T h e ra p y. 2 5一 .2 5. 2 5‑ . 2 5. 2 5一. 2 5. 2 5一. 2 5 αβ))αβ12αs21αs 2 2αs31αろ メ2αメ J 4 2 4 1 αs l s m e s t i m a t e 1・ T h e r a p y 1 s t a n d a r d ‑ 2 t e s t " 1‑ β ' )s2 ( T h e r a p yのみ指定) 54 2 9

35.

ESTIMATE文と LSMESTIMATE文 交互作用を含むモデルの ESTIMATE文 1)主効果を含めて複雑な係数を指定する 必要がある. 2) 多くの要素をフログラムで指定. 3) 0の省略等簡略も可能だが,非明示的 Eオフションで確認) • なルールがある ( 面倒かつプログラムミスをしやすい. LSMEANS文は出力が冗長で柔軟性なし → LSMESTIMATE文 ESTIMATE LSMESTIMATE LSMEANS マニュアル オートマ 路線バス 複数の効果を指定一つの効果のみ .柔軟な指定が可指定.簡単便利 能だが,慣れない.慣れてしまう と面倒でミスしゃとマニュアルは すい. 使えなくなる. 56 × 0推奨 3 0 対比較または, 基準群との比較 を不必要なもの を含めて網羅的 に出力. A

36.

E S T I M A T E .L S M E S T I M A T E .L S M E A N S E S T I M A T E文(マニュアル) 推定可能にするため原則的にすべてのパラメータ 0のものは省略可) を指定 ( L S M E S T I M A T E文(オートマ) 比較の対象の効果のパラメータのみを指定 任意の対比についての多重比較が可能 現在では多くのフロシジャで利用可 L S M E A N S文(路線パス) 比較の対象の効果のみを指定 群間の対比較のみ可能 57 交互作用の比較の場合,出力が冗長 N O N P O S I T I O N A L(位置非依存型 ) S Y N T A X p o s i t i o n a l(位置依存型)と n o n p o s i t i o n a l(位置 非依存型)の文法による指定が ESTIMATE文と LSMESTIMATE文で可能である. n o n p o s i t i o n a l(位置非依存型)の文法 .入力の順序情報は利用しない. • 0でない係数の値のみを指定する. p o s i t i o n a l 1 ; Ismestimatedrug" D r u g :A VS. B"1‑ n o n p o s i t i o n a l 5 8 l s r n e s t i m a t edrug"Drug:Avs.B"[1,1 1 1 ‑ 1,2 1 ; 3 1

37.

POSITIONALとNONPOSITIONAL文法 p o s i t i o n a l(アナログ型) 1 )左からの文字の相対順序によって, 対応するパラメータの値を設定 2 )ある位置以降すべて Oであれば,空白で OK 例 I s m e s t i m a t ed r u g~1-3~ ‑ 1 010 ; n o n p o s i t i o n a l(デジタル型) 1 )パラメータの番号を明示的に指定 2 ) 0のパラメータは省略可 {2~ I s m e s ti m a t ed r u g~ 1 ‑ 3 ~ [ ‑1 ,1 J[ 1,3 J; 2 種類の文法の例 2 次水準の比 p o s i t i o n a ls y n t a x I s m e s t i m a t eC e lI * T h e r a p y ,3 s m a11 1 s t a n d a r dv s2test~ o0001‑ 1 00 ド1 1 ド12 n o n p o s i t i o n a ls y n t a x い21 い22 I s m e s t i m a t eC e lI * T h e r a p y 1い32 ~31 ‑ ,3 s m a11 1 s t a n d a r dv s2test~ 1 [31 J [32 J [1 ,31 J[ ‑ 1,32 J/ e; r u n; い41 い42 60 3 2

38.

D A T AS C A N C E R ; D OD O S E = 1 0,3 0,9 0 ; D OI 二 1T O3 0 ; I N P U TT I M EC E N S O R@ @ ; O U T P U T ; E N D ; E N D ; C A R D S ; 4 01 7 60 7 60 7 60 6 40 6 61 7 60 7 60 7 60 7 60 3 21 4 6 0 1 01 7 20 7 60 4 41 6 00 7 21 6 60 7 60 4 01 4 21 6 01 7 60 7 60 4 81 7 60 7 60 7 60 7 60 2 60 4 61 3 21 4 90 4 41 4 40 4 30 4 01 4 41 4 51 2 21 4 30 4 81 4 41 4 61 4 41 3 41 4 21 4 51 4 90 3 30 3 81 4 80 4 80 4 70 4 11 4 61 4 61 3 81 3 50 01 4 41 4 90 2 91 2 81 3 3 61 4 41 4 40 4 81 4 90 4 01 4 21 4 01 3 81 3 81 3 21 3 81 3 21 4 90 2 21 81 4 80 2 30 3 21 4 90 4 40 4 51 4 9 0 10 ~? 1 3 皮膚癌データ :SCANCER 生存率 1 . 0 1 0 :HR=l 0.9 0.8 0.7 0.6 0.5 4 0. 90:HR 5.680 0.3 ご 0.2 。 。 。 0 . 1 D ~ a ~ ~ 00 皮f 荷癌発生までの時間(週) 投 与 孟 (nmo1 )一 一 10 一 一 30 一 一 90 62 3 3 m 00

39.

生存時間の多重比較の方法 L 1F E T E S TS T R A T A文 A D J =オプション │打ち切りと非打ち切り値の j I_~__ 1 . . . . . ー ADJUST=BONFERRONI I 層 ADJUST=DUNNETT ADJUST=SCHEFFE ADJUST=SIDAK ADJUST=SIMULATE GT2 ADJUST=SMMI ADJUST=TUKEY TEST=WILCOXONで一般化ウイルコクソン 検定の多重比較も可能 63 A, 8, Cの比較 基本的な多重比較法 m:比較の数 Tukey:AB, AC, BC AC Dunnett:AB, Scheffe: AB, AC, BC, A‑BC B o n f e r r o n i:p値を m倍 B Sidak:独 立 性 を 前 提 に多重性調整 川 ツ 整 調 性 重 多 ー ‑ よ ヨ 3 4 C ン puシ レ ユ ン ︑ ﹄ EL D F T A M U S A一 A

40.

検定の多重性 意水準 Gで、独立な検定を m回行った場合 1) 1回も有意にならない確率 a=0.05, m=10のときの確率 (1‑a)m (1‑ 0 . 0 5 ) 1 0=0.59874 2) 1回以上有意になる確率 また a=0.05, m=10のときの確率 1 ‑ (1‑a)m今 m.a 1 ‑ (1‑ 0 . 0 5 ) 1 0=0.40126 65 独 立 な 最 小p 値の分布 m 1 固の独立な検定のうちl つ以上が 1‑αyn α水準で、有意: 1‑( l つ以上が有意二今最小 p値 が 有 意 m 1 1 固の最ノトp値 の 分 布 分 布 関 数 :F(x)=l‑( 1‑x)m 確 率 密 度 関 数 :f(x)= F(x)'=m(1‑x ) 1 1 1一l 66 35

41.

m個の最小 p 値の確率密度関数 確率密度関数 /(P)lirof(P) m(l‑p ) m ‑ l 二 i l h [ ; 1日 ¥ごさミミミ三ご三一 p 最小 P 値 項 目 数 ‑ 1‑ 2‑ J‑ ~ ‑ I‑ l~ 67 m個の最小 p 値の累積分布関数 0.40126 ~.1 68 ~.2 ~.J ~.l ~.) ~.5 ~.1 ~.~ p 最小P値 項 目 数 ‑ 1‑ 2‑ J‑ 1‑ I‑ 1~ 36 ~.~ l.~

42.

多群の場合のノンパラ検定 包括検定:分散分析型統計量 /=llTVll 自由度:群の数(r) ‑1 u :観測死亡数と期待死亡数の差のベクトル V:分散共分散行列 U ]I U二 , V 1 : ‑ 1 I ~] 九 ~I │ 九 V22 V2r ~'2 ~T 二 どこ uTV‑u:r群問で、差があるか 69 D u n n e t t型多重比較 (基準群(用量 10nmol群)との比較) t i m et i m e * c e n s o r ( O ) ; 戸百互王子百ZE 日 70 37

43.

ログランク検定の出力(包括検定) j 順位統計量 V れl V勺 2 JY一 X 1 0 川 町 ‑ 一 + 一 一 一V勺 3x1 IOOSE 3x3 、 二 T 層に対しての同等性の検定 │ 力 イ 2乗 自由度 Pr> ログランク 2 く0 001 =uJV‑uI 検定 Chi‑Square 20.2565 7 1 群 iと群 jの 対比較のカイ 2乗統計量Xij2 X..2 = i zdj‑Mi)2=(M/Mi)2 υVIMj‑uJ Yu+に‑‑2F3 ) 2 一 切2 ‑ U 1 12R2+V11‑2F12 X 2 (4.814‑(‑13.863))2 9.0072+10.2810‑2(‑5.7890) =11.2982 72 38

44.

多重比較の調整 p 1 直の計算 m:検定の回数, r :群数 non‑a d j u s t e d( 未加工): p=PrU12〉 X i j 2 ) Bonferroni: α φ r p=minラ 1 ( mxp) Sidak:αd j p=1‑( 1‑p) / 1 1 Schφ 吋 p二 同 信 〉 xh Tuk句7 αd j p:Tuk勾 ‑Kramer 二 Dunnett:adjp:Dunnett‑Hsu 7 3 D u n n e t t型 多 重 比 較 ( a d ju s t二d u n n e t t ); 層に対しての同等性の検定 力イ 2乗 検定 自由度 Pr> Chi‑Square 2 く. 0 0 0 1 Y2=117v‑U ログ、フンク 20.2565 多重比較の調整:Logranl く検定 力イ 2乗 p 値 層比較 2 Dunnett‑ 未加工 DOSE DOSE X i j (調整無) Hsu 1 1 . 2 9 8 2 0 . 0 0 0 8 0 1 0 . 0 0 1 5 * * 30 0 0 0 1 1 9. 4717 く. 1 0 90 く. 0 0 0 1** 74 39

45.

T u k e y型多重比較(全ての対比較) time time*censor(O); く日主主回 test=I o g r a n l 75 T u k e y型多重比較( a d ju s t二 t u k e y ) 多重比較の調整:Logrank検 定 力イ 2乗 層比較 p値 DOSE DOSE 1 0 3 0 1 1 . 2 9 8 2 未加工 Tukey‑ (調整無)Kramer 0 . 0 0 0 8 0 . 0 0 2 2 * * 1 0 9 0 1 9. 47 1 7 く. 0 0 0 1 30 9 0 0 . 7 7 4 8 0 . 3 7 8 7 0 . 6 5 2 8 2 X i j 7 6 40 く0 001**

46.

80nferroni型多重比較 ods graphics o n ; roc Iifetest data二 scancer vaI ( a t ri sk二 plots二 survi oto 80b y1 0 ) ; time time*censor(O); strata dose / o g r a n l く問刊訂当日高片町 I; test=I r u n : ods graphics o f f ; 77 多 80 較恒 層に対しての同等性の検定 力イ 2乗 検定 自由度 ログランク 20.2565 Pr> Chi‑Square く. 0 0 0 1 2 多重比較の調整:L o g r a n l く検定 力イ 2乗 p直 { 層比較 DOSE DOSE 未加工 Bonferroni 8 10 30 11.2982 0.0008 0.0023(0.0008x3 ) 10 90 0 0 0 1( く 0001x3 ) 19. 4717 く. 0 0 0 1 く. 30 90 0.7748 ) 0.3787 1.0000(0.3787x3 Bon . f e rroni:αφり =min{l rnxp) ラ 41

47.

S i m u l a t e d法の多重比較 ( T u k e y型) p r o cI i f e t e s td a t a二 s c a n c e r u r vi v aI( a t ri s k二 t o8 0b y1 0 ) ; p l o t s二 s t i m et i m e * c e n s o r ( O ) ; s t r a t ad o s e/ o g ran~く t e s t二 I a d j u s t二 s i m u r a t e ( r e p o r ts e e d二4 9 8 9 ); o d so u t p u ts u r v d i f f二 d i f f ; r u n ; o 7 9 S i m u l a t e d法の多重比較 ( T u k e y型) 確率点シミュレ‑ションの詳細 4 9 8 9 乱数シード A I I 比較型 標本サイズ(シミュレーション回数) 1 2 6 0 5 ターゲ、ツトアルファ(目標水準) 0 . 0 5 ζ] 己 精密の半径 Accuracyradius 0 . 0 0 5 精度の信頼度 Accuracyconfidence9 9 % γ 1‑& J言頼区間 0 2幅 2γ 80 4 2

48.

3回の最小 p 値の分布 理論分布とシミュレーションによる近似 理論分布(確率密度関数) 12605回のシミュレーション 会︹ f(p) 3 ( 1 ‑p)2. . 二 審 同日ロ 000000000000000 Hmm 個 別 島 M 白 例 閃 位 制 ∞ 明 0 0 0 . 1 0 . 2 0 3 0 . 4 0 5 0 . 6 0 7 0 8 0 9 I ( pmm 8 1 S i m u l a t e d法の多重比較 ( T u k e y型) シミュレーション結果 99%信頼限界 O.05: tO.005(y) q:来主1限界 i l i ' ( フア α=F(q . 3 4 9 0 6 1 0 . 0 5 0 0 0 . 0 4 5 0 S i m u l a t e d 2 手法 95%分位点 推定アル Tukey Kramer 2 . 3 4 3 7 0 1 0 . 0 5 1 1 U.U4oU U.υbol B o n f e r r o n i 2.393980 / 47 53 S i d a k 2.387738 0 . 0 4 5 4 0 . 0 3 9 9 0 . 0 4 9 4 0 . 0 4 0 6 0 . 0 5 0 2 GT‑2 2.387738 0 . 0 4 5 4 0 . 0 4 0 6 0 . 0 5 0 2 S c h e f f e 2. 447747 0 . 0 3 8 5 0 . 0 3 4 1 0 . 0 4 2 9 Z 1 . 9 5 9 9 6 4 0 . 1 1 9 2 0 . 1 1 1 8 0 . 1 2 6 7 弘 常 82 。ア' 0f . i l . . . 4 3

49.

S i m u l a t e d法の多重比較 ( T u k e y型) 多重比較の調整:L o g r a n l く検定 層比較 DOSE DOSE 1 0 1 0 3 0 30 90 9 0 力イ 2乗 p値 未加工 1 1 . 2 9 8 2 0 . 0 0 0 8 0 0 0 1 1 9. 47 1 7 く. 0 . 7 7 4 8 0 . 3 7 8 7 S i m u l a t e d 0 . 0 0 2 2 * * く. 0 0 0 1** 0 . 6 5 1 4 シミュレーションで、 p値が 0.0008以下 26/12605=0.0022 83 シミュレーション回数の設定 Pr(F(q)‑(1‑α)< y)= 1 ‑& q:推 定 棄 却 限 界 値 F(q): 累 積 分 布 関 数 α :F(q) 推定有意水準 α : 日程裏手干主主オ℃者主 y: 抑 え た い 精 度 命 中 主 γ E 1‑&: 精 度 の 信 頼 度 ( イ 言 頼 水 準 ) N :シ ミ ュ レ ー シ ョ ン 回 数 84 44

50.

シミュレーション回数の設定 八 八 F(q)= 1一 久 α(1‑α) V[α ] =一 一万 八 Pr((α‑α)三 y)ニ 1‑& Z _, ~_I α(1-α)γ ‑ E/2V N / Zo.o112 =2.60 ~- う よ N= α(1‑α) 2.602 = :-~-~0.05(1‑0.05) 12605 85 0.005 ̲7 二 ノ α の信頼区間 . p G α ) ベ ぷm α こ ん +ZC/2 = 0.05士 2 ニ 0011 0.05+0.005 =0.045 ラ 0.055 8 6 45

51.

調整 p 値の計算プログラム d a t ad i f f ; s e td i f f ; m = 3 ;r = 3 ; ) ; *調整しなしゅ値; p = 1 ‑ p r o b c h i( c h i s q,1 b pm i n ( 1,m * p ) ;* B o n f e r r o n ip f 直; s i p = 1 ‑ ( 1 ‑ p ) * * m :* S i d a kp f 直; s c p1 ‑ p r o b c h i( c h i s q,r ‑ 1 ): * S c h e f f ep 値; t p = 1 ‑ p r o b m c ( ' R A N G E ',s q r t ( 2 * c h i s q ),.,.,3 ) : * T u k e yp i 直; p r o cp r i n t : r u n : ご 二 87 調整p 値の計算結果 OBS S t r a t u m 1 Stratum2 ChiSq Raw 1 1 . 2 9 8 20 1 0 30 . 0 0 0 8 1 0 1 9. 4717 く. 0 0 0 1 90 2 3 30 0 . 7 7 4 8 0 . 3 7 8 7 90 調整無 p j 直 <T u k e y< OBSIStratum11Stratum21p I t p Tukey 0 . 0 0 2 2 く. 0 0 0 1 0 . 6 5 2 8 S i d a k< B o n f e r r o n i <S c h e f f e I s i p I b p I s c p 10 11 1 3 0 10.0007810.0022410.0023310.0023310.00352 2 1 1 0 1 9 0 10.0000110.0000310.0000310.0000310.00006 3 1 3 0 90 0.3787510.6528210.7602311.0000010.67883 88 46

52.

H LHHHHMι 47 ん λん " . ムム‑ム 4 90 ペ﹂勺ぺ﹂勺ん lレ , JA んん 1 ν 2 ーーー AA234 ・ ・ 句 EEAIr‑ d , , 2 由日 以 ・‑ ︑ ・ ︐ ︑ ︐ 斤‑ Aム ‑ り 1 ¥ はんんん v w ム bA24 列々ーん liil tm 同 ‑T‑AAA 比町 1 人 ‑4││斗﹁││ Ill11111ili‑‑ 町内門 l 仇一門的 同月刊一 l A 重酢 A A 4川 川 │ 多 川 IJ1lppp ‑ EF l i h ‑ s t a r t ' j (‑ 1‑ 12 / ) 1 ( ‑ l H ' f ) 9 P l I ' dOSe(10, 20, 竺 (5‑27) , (‑ 211 ) 噌 ︽月刊 月刊月刊月刊 E三三日 I t y p e=llinear I j 「ーで一一 m ‑ e n d 4比較群以上は近似 3比較群までは正確 , ,/ L i n e a r ︐ ︑ ﹁ ﹂ ︑'︐︐ AHU33334 MX l 23 1 23234 月刊月 0 ..... ヨ ' 1 , . , . I ~王5.4t!Jra h量 ト計月刊 叫統 刊定一 l 臥検│﹂││斗 RR 相関行事!JRを因子分析による近似で係数入を算出 89 生存時間データへの最大対比法の適用 圃 (101 )圃 (1圃 12 )( ‑ 211 )( ‑ 5・27 ) ーH

53.

最大対比法(対数ハザード)の適用 p r o cp h r e gd a t a = s c a n c e r ; l mr e f二 f i r s t ; c l a s sd o s e / p a r a m二 g e f; h a z a r d r a t i od o s e / d i f f二 r o s e ; m o d e lt i m e * c e n s o r ( O )二 d I s m e s t i m a t ed o s e I i n e a r' ‑ 1 01 . ' d o s e ' ‑ 5‑ 27 h ‑ s t a r t ' ‑ 1‑ 12 .' m ‑ s a t u r a t e '‑ 2 11 9 8 9 ; / a d j = s i m u l a t e ( r e p o r t )s e e d二 4 r u n : 9 1 Simulated法の利点 Sidak法は複数の対比の統計量が独立を前提 B o n f e r r o n i法は Sidak法のよい近似法 Scheffe法は任意の対比の最大のものを統計量とする ことを想定するので過度に保守的 用量反応モデルに対する対比統計量は正の相聞が高く 相関構造を反映できる Simulated法の検出力が高くな る(名義水準に保たれる)• S i m u l a t e d法 で 、l i任意の複数の対比について,共変量と 多重性の同時調整が可能 12605回のシミュレ‑ションでは最大 1%程度の誤差 92 48

54.

B o n f e r r o n i法との性能 REPORTオプション シミュレーション結果 手法 1 9 5 %分位点 推定アルファ 99弘 信 頼 限 界 Simulated 2 . 2 1 4 6 6 1 0 . 0 5 0 0 0 . 0 4 5 0 0 . 0 5 5 0 Bonferroni 2 . 497705 0 . 0 2 4 2 0 . 0 2 0 7 0 . 0 2 7 7 Sidak 2. 490915 Scheffe Z ー 。 占 0 . 0 2 4 8 0 . 0 2 1 2 0 . 0 2 8 3 2. 447747 0 . 0 2 8 2 0 . 0 2 4 4 0 . 0 3 2 0 1 . 9 5 9 9 6 4 0 . 0 8 6 6 0 . 0 8 0 1 1 0 . 0 9 3 0 最大対比法の適用 LeastSquaresMeansEstimates justmentf o rM u l t i p l i c i t y :Simulated 調整済│指数 P A斗 一 n u一 7F一 円︒一 一 一 J n J ι 比一社 a 一れ U e 1ご 比 え一 戸﹂一戸﹂ 什一 m 日 QU 一QU O‑O D D 一 7 . 7 4 2 5 最大対比:2 . 2 1 5を越えているので有意 94 49

55.
[beta]
対
比
(
・ 101
)の適用結果
生存時間 KM曲線

対比による予測生存時間曲線

"

2

O
J

f3‑

ー
と
=
t
.
c
,

1
¥
1 _~
'L̲.

0
1

a

e
剥

'
L~:一一一

a
日

0
1
.

工

e
l
‑

1「

",

a

π
"
'

可
"e

~鎚

~

~

1
班
臨ミーーー'.司ー‑ 0 ‑ 1

回 SE-一得一一-))一一-~

95

HAZAEDRATIO文(対応の ESTIMATE文)
proc phreg data=VALung;
class Prior Cell Therapy/param=glm
model Time*Status(O) 二 Kps C
e
lIPrior Therapy Prior*Therapy;
azardrati
0'
H
1
' Kps / units二 1
0cI
二b
oth;

、
;

i
、a
z免 rdratio '
H
2
' Cell /cl=both;
1aurdrati
0 '
H
3
' Ther司
l
2
L
L
S
l
Jff=ref cl二 both

' Kps 1
0/ exp;
estimate 'El
estimate '
E
21
2
' cell 1‑
1 00
,1
*adeno vs large

*
i
*
i

'
E
21
3
' ceII1 0‑
10
, 1
*adeno vs smaII
'
E
21
4
' ceII1 0 0‑
1, 1
*adeno vs squamous ホ/
'
E
22
3
' cell 0 1‑
10
, 1
* large vs small */
'
E
22
4
' cell 0 1 0‑
1, 1
* large vs Squamous ネ/
E
23
4
' celI0 0 11 1
*sma!Ivs squamous *! / exp;
enimate '
E
3n
o
' Therapy 1‑
1 Prior*Therapy 1‑
1 00,
'
E
3 yes' Therapy 1‑
1 Prior*Therapy 00 1‑
1
/ exp;run;
96

50

56.

検定結果 Type3検 定 自由度 効果 Wald 力イ 2乗 Pr>ChiSq 35.9218 く0 001 17. 4134 0.0006 P r i o r 0.1150 0.7345 Therapy 0.2510 0.6164 Prior*Therapy 2.9269 0 . 0 8 7 1 Kps C e l l 3 97 パラメータ推定値 パフメータ Kps C e l l C e l l C e l l C e l l P r i o r P r i o r 自由 パフメー 標準誤差 カイ 2桑 Pr> ChiSq 度 タ 推定値 ト0 . 0 3 1 1 10 0 0 0 1 . 0 0 5 1 9 3 5 . 9 2 1 8 く. adeno 1 . 1 6 0 5 2 0 . 3 0 0 0 2 1 4 . 9 6 2 9 0 . 0 0 0 1 l a r g e 0. 41145 0 . 2 8 3 0 9 2 . 1 1 2 5 0 . 1 4 6 1 s m a l l 0 . 8 5 4 1 00 . 2 6 8 9 4 1 0 . 0 8 5 8 0 . 0 0 1 5 squamous 1 0 no 0 . 2 7 6 8 8 0 . 3 0 4 9 0 0 . 8 2 4 7 0 . 3 6 3 8 t y e s 。 。。 KPSが 1単位変化 HR::exp(‑0.03111)=0.969 adeno‑squamous HR:exp(1.16052)=3.192 41145)ニ 2.115 adeno‑Iarge HR :exp(1.16052‑0. 98 5 1 ハザード 比 0 . 9 6 9 3 . 1 9 2 1 . 5 0 9 2 . 3 4 9

57.

W a l d検定と尤度比検定ベースの信頼区間 信頼区間:検定で棄却されない母数の集合 対数尤度 C L = B O T H M L E ‑ 1 . 9 6 S EIM L E + 1 . 9 6 S E MLE 最尤推定量 Wald検 定 ベ ス の信頼区間 C L=WALD 日 99 h a z a r d r a ti 0 ' H 1 ' I く p s/u n i t s1 0c lb o t h ; 二 二 連続量は U N I T Sオプションで増分単位を指定 c l二 b o t h 、 でW a l d検定と尤度比検定ベース C Lを出力 CL=WALD CL=PL 0 . 8 1 1 KpsUnit=10 ラベル Pr>I z lI 指数 E 1 く. 0 0 0 1 100 52 1 0 . 7 3 2 6

58.

h a z a r d r a t i o ' H 2 ' C e lI/ c l二 b o t h ; デフォル卜 ( d i f f = a l l )は全ての対比較 H 2 :ハザード比 C e l l CL=WALD 95%Wald信頼限界 CL=PL 95%プロファイル尤度 による信頼限界 C e l ladenov sl a r g e2 . 1 1 5 1 . 1 6 4 3 . 8 4 3 1 . 162 3 . 8 5 5 C e l ladenov s s m a l l 1 . 3 5 9 0 . 7 9 8 2 . 3 1 2 0 . 7 9 1 2 . 3 0 1 C e l ladenovs squamous 3 . 1 9 2 1 .773 5 . 7 4 6 1 . 7 7 0 5 . 7 6 8 C e l l l a r g ev ss m a l l0 . 6 4 2 0 . 3 8 5 1 .073 0 . 3 8 0 1 . 0 6 5 C e l l l a r g ev s squamous 1 . 5 0 9 0 . 8 6 6 2 . 6 2 8 0 . 8 6 3 2 . 6 3 4 C e l ls m a l lvs 2 . 3 4 9 1 . 3 8 7 3 . 9 8 0 1 . 3 9 9 4 . 0 3 0 説明 点推定 値 ~quamous E5TIMATE文の出力 EXPオプションで e x p ( s ) = H Rを出力 CLオプションで W a l d検定ベース C Lも出力 推定 (ESTIMATE文) フベル 推定値 標準誤 z 値 Pr> I z l 指数 差 E212 0 . 7 4 9 1 0.3046 46 2. 0.0139 2.1150 E213 0.3064 0.2713 1 . 1 3 0.2587 1.3586 E214 1.1605 0.3000 3 . 8 7 0.0001 3.1916 E223 0. 4427 0.2617 ‑1.69 0.0907 0.6423 E224 0. 4114 0.2831 1. 45 0.1461 1.5090 E234 0 . 8 5 4 1 0.2689 3 . 1 8 0.0015 2.3493 102 6回の対比較ー多重性による Gエラ 53 の増大

59.
[beta]
h
a
z
a
r
d
r
a
t
i
o '
H
2
' C
e
l
l/
c
l
=
b
o
t
hd
i
f
f
=
r
e
f
;
r
e
f二, ,)により基準群を指定
C
e11 (
H
2
:ハザード比 C
e
l
l
9
5
%W
a
l
d信頼限界 9
5
%プロファイル

点推定

説明

Cell(ref
ご
squamous'時

尤度
による信頼限界

C
e
l
la
d
e
n
ov
ss
q
u
a
m
o
u
s
C
e
l
ll
a
r
g
ev
ss
q
u
a
m
o
u
s
C
e
l
ls
m
a
l
lv
ss
q
u
a
m
o
u
s

1
.
7
7
0 5
.
7
6
8
0
.
8
6
3 2
.
6
3
4
1
.
3
9
9 4
.
0
3
0

.
7
4
6
3
.
1
9
2 1
.7
7
3 5
1
.
5
0
9 0
.
8
6
6 2
.
6
2
8
2
.
3
4
9 1
.
3
8
7 3
.
9
8
0
"
"
.
.
.
,
.
.
.
.
.
1
.
0例
・
.

P "",, -"o~-Lj......j..

生円楠宜

リニ

. 。 匹h
』

1
.
'
、
,
.
一L…

凶

¥¥
ア叶」
1
.
.
.
.

l~--t~

い
之
s
q
u
a
m
o
u
s
," h"i"small 、ゴιge} 」ー~1
a
d
ej
10
、.も
'
¥ ~,

a ー
'
‑
‑
‑
‑
‑
‑
,

103

a
r
d
r
a
t
i
o '
H
3
'T
h
e
r
a
p
y
/
d
i
f
f
=
r
e
fc
l
=
b
o
t
h
;
「l
o
rキ T
h
e
r
a
p
yを指定した場合.

P
r
i
o
r
(
y
e
so
rn
o
)ごとの HRを出力

H
3
:ハザード比 Therapy
│点推定 1
9
5
%Wald信頼 1
9
5
%プロファイル尤度
値
│限界
│による信頼限界

説明

Therapys
t
a
n
d
a
r
dv
s1
0
.
6
3
3 1
0.
40
0 1
1
.002 1
0
.
3
9
9
t
e
s
tAtP
r
i
o
r
二n
o

1
1
.002

Therapys
t
a
n
d
a
r
dv
s1
1
.268 1
0
.
6
3
8 1
2
.
5
2
21
0
.
6
4
1
t
e
s
tAtP
r
i笠三盟主

1
2
.
5
6
5

推 定 (ESTIMATE文)
フノミ jレ

E3no
E3yes

推定値
45
67
‑0.

標準誤差

z値

0
.
2
3
4
2

‑
1
.
9
5

Pr>I
z
l
0
.
0
5
1
2

0
.
6
3
3
4

0
.
2
3
7
7

0
.
3
5
0
8

0
.
6
8

0.
49
80

1
.
2
6
8
4

104

5
4

指数

60.

共変量 ( K p sP r i o rT h e r a p y ) を調整した多重比較 p r o cp h r e gd a t aV A L u n g, c l a s sP r i o rC e l l( r e fa d e n o ') T h e r a p y / p a r a mg l m, m o d e lT i m e * S t a t u s ( O ) K p sP ri o rT h e r a p yC eI I ; I s m e a n sC eI 1 / d i f fa1 a d jt u k e yc le x p ; r u n ; 二 二 , 二 二 二 二 105 共変量 ( K p sP r i o rT h e r a p y ) を調整した解析 パラメータ推定値 55

61.

共変量を調整した多重比較 信頼区間 C e l lの最小 2乗平均の差 多重比較の調整:Tukey‑Kramer c e l l type ExponentE x p o n e n t │ │調下整済 p l上 調 整済 i a t e d i a t e d 限 Ex 限 Exp Lower Upper 指数 I c e l ltype I adeno I l a r g e 2 . 1 7 1 2 1 . 1 9 8 5 3 . 9 3 3 5 0 . 9 9 6 4 4 . 7 3 1 3 m a l l adeno s 1 . 4045 0 . 8 2 6 6 2 . 3 8 6 6 0 . 7 0 1 0 2 . 8 1 4 0 . 7 8 0 3 1 . 7 8 6 8 5 1 . 4888 6 . 9 3 7 0 1 . 0 8 5 1 0 . 3 2 8 4 1 . 2 7 4 3 . 2 1 3 7 adeno squaπlOUS 3 0 . 6 4 6 9 0 . 3 8 5 7 l a r g e s m a l l l a r g e squa什lOUS 1 . 48 0 1 0 . 8 5 1 3 2 . 5 7 3 6 0 . 7 1 6 8 3 . 0 5 6 2 s m a l l squamous1 2 . 2 8 8 1 1 . 3 4 9 0 3 . 8 8 0 9 1 . 1 4 4 8 4 . 5 7 3 3 LSMEANSによる共変量を調整した多重比較 T i m e 0'>上ヒ車圭 C et 1 l.I..~. ‑20 π . . . . . n ‑ o c > ‑ . . t I I I.a噌・ ‑2.5 ' . i L 寸一一一一一一一一一一一一寸 ‑2,5 一一一一一一「 ‑ 2 . 0 τ 5 一一一一「 ‑10 さ士ヱ2 5 2 L 2 宅3 4 1 ? ? こ K r . a , ' n 工 事 室 》 ‑0.5 日の調整 推定値 し 108 56

62.
[beta]
共変量(点推定値が変化)と
多重性(区間幅が増加)の同時調整
c
e
l
ltype c
e
l
ltype

調整無 調整無 調整無 調整
調整
謂整
ハザー ハザード ハザード ハザード ハザード ハザード
比下限 比下限 比
比下限 比下限
ド比

adeno

l
a
r
g
e

2
.
4
8
7
31
.
4
1
4
6 4
.
3
7
3
3

2
.
1
7
1
2 0
.
9
9
6
4 4
.
7
3
1
3

adeno

small

1
.
15600
.
7
0
9
2 1
.
8
8
4
2

1
.
4045

0
.
7
0
1

2
.
8
1
4

adeno

squamous 3
.
1
3
1
11
.
7
6
3
7

3
.
2
1
3
7

1
.
4888

6
.
9
3
7

l
a
r
g
e

small

0
.
6
4
6
9 0
.
3
2
8
4

1
.2743

l
a
r
g
e

squamous 1
.2588 0
.
7
3
1
0

2
.
1
6
7
8

small

squamous 2
.
7
0
8
61
.6
479

4
.
4
5
2
1

adeno‑Iarge
44

10宮 司

5
.
5
5
8
6

0
.
4
6
4
80
.
2
8
3
2 0
.
7
6
2
6

0
.
7
1
6
8 3
.
0
5
6
2
2
.
2
8
8
1

無調整
砂調整

、
J
〆
'
、

1
.
1448 4
.
5
7
3
3

2
.
4
8
7
3(
1
.
4
1
4
6
‑
4
.
3
7
3
3
)
2
.
1
7
1
2(
0
.
9
9
6
4
‑
4
.
7
3
1
3
)

P
H
R
E
GB
A
S
EL
lN
E文による生存時間
共変量調整無

共変量調整有

1
h
‑
t
M
0
0
2L
ぷγ明
6
;
2
3
2
9
e

…ふ明L
‑
一二こ

ω

4
旬
時

白i
)

..猷"
‑
‑
,‑
‑
, ‑‑l‑‑''"唯 !odut..~'"町z

,
:
>
?
,
.
l
!i
n血行

'作宅 t

Co.~司.5"

‑
一
ー
ー
与
̲
:
.
.
.
.
.‑
一
一
‑,
知
。
一
一
一
一
:
町
・
一
一
一
‑
,
岬

110

57

1
間

63.

C e l l士T h e r a p yの交互作用の解析 r o c phreg d a t a = V A L u n g ; c l a s sP r i o rC e lITherapy/param二 g l m ; m o d e lT i m e * S t a t u s ( O )二 K p sP ri o rC eIIT h e r a p y C e l l * T h e r a p v : hazardratio ' T h e r a p y 'T h e r a p y ; I s m e a n s C e l l * T h e r a p y / a d j二 t u k e ye x p ; 1 1 1 交互作用の検定結果 Type3検 定 効果 自由度 Wald Pr>ChiSq 力イ 2乗 Kps 3 4 . 1 8 1 9 く. 0 0 0 1 P r i o r 0 . 0 9 7 3 0 . 7 5 5 1 20.3860 0 . 9 4 8 7 0 . 0 0 0 1 0.3300 6 . 6 2 8 4 0 . 0 8 4 7 C e l l Therapy 3 Cell*Therapy 3 Cell*Therapyの交互作用は pく0 . 1 0 adenoとsquamousはp o s i t i v e, l a r g eとs m a l lは n e g a t i v e 58

64.
[beta]
C
e
l
l型ごとの T
h
e
r
a
p
yの効果
h
a
z
a
r
d
r
a
t
i
o,T
h
e
r
a
p
y
'T
h
e
r
a
p
y
;
T
h
e
r
a
p
y
:ハザード比 Therapy
95%Wald信頼限界

説明
点推定値
Therapys
t
a
n
d
a
r
dv
s 1
.
2
4
3
t
e
s
tAtC
e
l
l二 adeno
Therapys
t
a
n
d
a
r
dv
s 0
.
6
0
5
t
e
s
tAtC
e
l
l
=
l
a
r
g
e
Therapys
t
a
n
d
a
r
dv
s 0.
448
t
e
s
tAtC
e
l
lニs
m
a
l
l
Therapys
t
a
n
d
a
r
dv
s 1
.
3
9
7
t
e
s
tAtC
e
l
l二 squamous

0
.
5
4
0

2
.
8
5
9

0
.
2
7
6

1
.
3
2
4

0
.
2
3
6

0
.
8
5
2

0
.
6
4
4

3
.
0
2
8

1

でTherapyの効果は有意
Cell=small、
サブグループ解析の多重性の考慮、
1
1
3

・

z

・
.
,
.;
G
:.
J

1 し

F
h
J
U

J

円

Fhd
nu o
cun
nu

z

2

wq

ー,.. ・
.「
・ ‑

.
一

︐
怯

HR=1.243
p二 0
.
6
0
9
2

'・

2

一

large
'
ト
'
門
︑
ゴ ur

L

.!j ろ~"?

R

c
e
l
ltype
=adeno

ネ

副

'}1?'C色.荷u

nU L
二
︑

巳

ー
‑
防 団Je
t
‑
L
im
i
t笠移植y

生存時間 KM曲線内由H 同 日 間

圃

回

@

四1D ~.a ..,.

日-!>--~..,.,

日宅叩~".~
畑同島崎山

,
.
"
;n
"'
・
.
.

.....岨 ~-Li側亀袋町随,.

lsmall I

squamous
ニ1
.
3
9
7
HR
p
=
O
.
3
9
7
5

4
4
8
s
t
a
n
d
a
r
dHR=0.
p
=
0
.
0
1
4
4
同

ω .

,
.
.
.
.
'
.
.
.
.
.
.
.
1
0
.
.
.
.
.

114

5
9

65.

特定のセル型のハザード比の出力 h a z a r d r a t i o' T h e r a p y 'T h e r a p yA a t( C e1 1二, s m a1 1 ') 1 : T h e r a p y :ハザード比 Therapy 5弘Wald信頼限界 点推定値 9 説明 . 8 5 2 Therapy 0. 44 8 0 . 2 3 6 0 s t a n d a r dv st e s t r A tC e l l二 s m a l l 1 s m a l lにおける t e s tに対する s t a n d a r dのハザード比 115 e l l * T h e r a p y / a d j二 t u k e ye x p ; I s m e a n s C 8( 4x2 )水準間 ( 8C2 = 2 8通り)の比較 C e l l * T h e r a p yの最小 2乗平均の差 多重比較の調整:Tukey‑Kramer c e l lt y p e ~ype o c e l lt y p e f I P r >I z l atment f t r e a t m e n t a r g e 0 . 2 0 8 5 l a r g e s t a n d a r d l e s t l a r g e m a l l s t a n d a r d 0 . 2 5 8 6 s t a n d a r d s l a r g e e s t 0 . 0 0 2 4 s t a n d a r d s m a l l t a n d a r d 0 . 9 0 6 0 l a r g e s t a n d a r d squamous s l a r g e l a r g e l a r g e l a r g e 116 q u a π l O U S e s t 0 . 4 4 7 3 s t a n d a r d s s m a l l s t a n d a r d 0 . 7 4 4 9 e s t 0 . 0 8 5 0 e s t s m a l l e s t squamous s . 2 6 4 3 t a n d a r d 0 e s t squamous e s t 0 . 0 4 8 7 s m a l l t e s t 0 . 0 1 4 4 調整済 P 1指数 1 0 . 9 1 4 2 0 . 9 5 0 4 0 . 0 4 9 7 1 . 0 0 0 0 0 . 6 0 4 6 0 . 6 7 9 8 0 . 3 0 4 9 0 . 9 5 4 5 0 . 9 9 5 0 1 . 0 0 0 0 0 . 6 7 2 7 0 . 9 5 3 5 0 . 5 0 1 7 0 . 2 1 8 6 1 .3 3 3 1 1 . 1245 0 . 5 0 4 3 1 .5788 2 . 2 0 5 0 0. 4485 8群比較の多重性を考慮すると s t a n d a r dv st e s ta tC e l l = s m a l lは有意差なし 6 0

66.
[beta]
LSMEANSによる多重比較
不必要な比較を含むため過度に保守的
Time 0フ上乞車交 :Celt牢 Therapy
/1

o.j

,,'~くも

司氏'‑

p=0.0144
/I
多重性 p
=O.2180448(0.2360.8泣)

I、 ¥

/

a~ÞO 省、 a怜da ,活

守

一
一
一
当
山
・

rnous :
I
lt.
and.ord
旬 甲 山 岡 』 吋

t

‑2

〆

一

!

S吊 岨 昨 従 民 拍 s u
伶 d
ard

宮 申 且 n ' " O O Us t
.o.引

一一一一
.
.
唱
.
e
‑ !'<lL<n由 吋

h柑...~~.:I.l..._

i.‑・&t̲.and.ar d l

ー2

ade.
‑
.
ote~t
狗 何 時

5r T 暗 闇 te!lt
9'tAl"曲川

……

‑哩

y

O

…

i
e

alph.a=O.05 で の 舞 (Tukey‑Kramer 白河室〉

一一四一有意でない一一四四一割量

1
1
7

サブグループ解析の多重性の調整

B
o
n
f
e
r
r
o
n
ia
d
j=
b
o
n
f
e
rr
o
ni

r
o
c phreg d
a
t
a二 V
A
L
u
n
g
;
class P
r
i
o
rC
e
lITherapy/param=glm;

U
1
G
m
o
d
e
l Time*Status(O) = K
p
sP
r
i
o
r C~ 1
Therapy CelyThザa
p
y
/
;
Ismestimate C
e
lI
*
T
h
e
r
a
p
y
, l
a
d
e
n
o lstandard v
s 2test~
,2
1arge lstandard v
s 2test~ 0 0 J‑
1 q0ト
o0,
,3
smaII1
standard v
s 2test~ 0 0 0 0 1
'10,
,4
squam lstandard v
s 2test~
118

61

0 0 0 0 0 0 11

67.

サブグループ解析の多重性の調整 B o n f e r r o n i p 値を 4 倍 L e a s tSquaresMeansE s t i m a t e s Adjustmentf o rM u l t i p l i c i t y :B o n f e r r o n i 推定値 フベル 1 adeno1 s t a n d a r d0 . 2 1 7 3 v s2 t e s t 2 1 a r g e1 s t a n d a r d v s2 t e s t 標準誤差 z値 4250 0. 0 . 5 1 40 0 1 0 . 5 0 3 2 0. Pr>I z l調整済 P 0 . 6 0 9 21 . 0 0 0 0 1 .26 0 . 2 0 8 50 . 8 3 3 9 0 . 8 0 1 9 0 3 s m a l l1 s t a n d a r d ‑ . 3 2 7 7 v s2 t e s t 45 0 ‑2. . 0 1 4 40 . 0 5 7 6 0.0144x4 4squam1 s t a n d a r d0 . 3 3 4 1 v s2 t e s t 0 . 8 5 百 0 . 3 9 4 8 . 0 0 0 0 0 . 3 9 7 51 Bonfi 色' rronz αc i j p= 立 也 氏L m xpラ 二 サブグループ解析の多重性の調整 H o l m (逐次 B o n f e r r r o n i ) r o c phreg d a t a = V A L u n g ; c l a s sP r i o rC e lIT h e r a p y / p a r a m 二g l m ; m o d e lT i m e * S t a t u s ( O ) =K p sP r i o rC e lI T h e r a p yC e lI * T h e r a p y ; I s m e s t i m a t eC e lI * T h e r a p y l a d e n ol s t a n d a r dv s 2test~ 1‑ 1 0 00000, 2 1 a r g el s t a n d a r dv s 2test~ 00 1‑ 1 00 00, 3 s m aII1 s t a n d a r dv s 2test~ 000 0 1‑ 1 00 4squam l s t a n d a r dv s 2test~ 000000 1‑ 1 4 a d j = b o n f e r r o n i山 p d o w n ; tu n; 120 62

68.

サブグループ解析の多重性の調整 H o l m (逐次 B o n f e r r r o n i ) L e a s tSquaresMeansE s t i m a t e s d u u s t m e n tf o rM u l t i p l i c i t y :Holm I P r >I z l l調 整 済 P ラベル 1adeno1 s t 山 r dv s2 t制 0. 7附 1 0 . 6 0 9 21 2 1叫 e1 s t a n d a r dv s2 t e s t 1 0 . 2 0 8 51 0 . 6 2 5 4 0 . 2 0 8 5x3 制凹盟問盟 3 s m a l l1 s t a n d a r dv s2 t 0 . 0 1 4 4x4 quam1 s t a n d a r dv s2 t e s t1 0 . 3 9 7 51 0 . 7 9 4 9 0 . 3 9 7 5x2 1 2 1 サブグループ解析の多重性の調 a d j二 simulate p r o cp h r e gd a t a = V A L u n g ; c l a s sP r i o rC e lIT h e r a p y / p a r a m = g l m ; m o d e lT i m e * S t a t u s ( O ) =K p sP r i o rC e lI T h e r a p yC eI 1 *T h e r a p y ; I s m e s t i m a t eC e lI * T h e r a p y , 1 a d e n o1 s t a n d a r dv s2 t e s t " 1‑ 1 000000 , 2 1 a r g el s t a n d a r dv s2 t e s t " 001‑ 1 0000 , ,3 s m a lIl s t a n d a r dv s2 t e s t " 00001‑ 1 00 , 4 s q u a ml s t a n d a r d vs2test" 0000001‑ 1 y a d j二 s i m u l a t e ( r e p o r t ) I s e e d二4 9 8 9; ru n ; 122 63

69.

サブグループ解析の多重性の調整 a d j = s i m u l a t e シミュレーション結果 95%分 位 手法 9 9弘信頼限界 推定アル 占 ファ . 0 5 0 0 S i m u l a t e d2 . 1 8 5 1 6 7 0 . 0 4 8 2 B o n f e r r o n iろ ( 4 9 7 7 0 5 0 . 0 4 8 9 Q. 490915 0 S i d a k 0 . 0 4 5 0 0 . 0 4 3 3 0 . 0 4 4 0 0 . 0 5 5 0 . 0 0 8 2 . 0 8 0 2 1 6 0 S c h e f f e/ 3 . 1 8 1 0 1 . 9 5 9 9 6 4 0 Z 0 . 0 0 6 1 0 . 1 7 2 2 0 . 0 1 0 2 0 . 1 8 9 9 / 1 2 3 0 . 0 5 3 2 0 . 0 5 3 9 独立に近いので S i m u l a t e d法と B o n f e r r o n i の棄却限界値が近くなっている サブグループ解析の多重性の調整 a d j = s i m u l a t e LeastSquaresMeansEstimates AdjustmentforM u l t i p l i c i t y :Simulated ラベル I P r >I z lI 調整済 P 1 adeno1 standardvs2test 0 . 6 0 9 2 1 0 . 9 7 6 2 21arge1 standardvs2test 0 . 2 0 8 5 1 0 . 6 0 7 5 3small 1 standardvs2test 0 . 0 1 4 4 1 0 . 0 5 4 6 4squam1 standardvs2test 0 . 3 9 7 5 1 0 . 8 7 0 5 64

70.

主効果とサブグループ解析の多重性の調整 p r o cp h r e gd a t a = V A L u n g ; l m ; c l a s sP r i o rC e lIT h e r a p y / p a r a m二g p sP r i o rC e lIT h e r a p y m o d e lT i m e * S t a t u s ( O )二 K スライド 5 4参照 C e l l * T h e r a p y ; e s t i m a t e ,O m a i nl s t a n d a r dv s2 t e s t " T h e r a p y1‑ 1, 1 C e lI * T h e r a p y. 2 5‑ . 2 5. 2 5‑ . 2 5. 2 5 2 5. 2 5‑ .2 5, 1 I . l ・1 ‑l a d e n ol s t a n d a r dv s2 t e s t ‑T h e r a p y1‑ 1 ~一一? C e l l * T h e r a p y1‑ 1 000000 , ‑2 1 a r g el s t a n d a r dv s2 t e s t ‑ T h e r a p y1‑ 1 C e lI * T h e r a p y001‑ 1 0000 , ‑3 s m a lIl s t a n d a r dv s2 t e s t ‑ T h e r a p y1‑ 1 C e lI * T h e r a p y00001‑ 1 00 , ‑4 s q u a ml s t a n d a r dv s2 t e s t ‑ T h e r a p y1‑ 1 い41 C e lI * T h e r a p y0000001‑ 1 / a d j = s i m u l a t e ( r e p o r t ) ;s e e d二 4 9 8 9r u n ; 125 主効果とサブグループ解析の多重性の調整 シミュレーション結果 95弘分位 推定ア 手法 占 99%信頼限界 jレ ファ Simulated 2.546559 0.0500 0.0450 0.0550 B o n f e r r o n I 2.575829 0.0475 0.0426 0.0524 Sidak 2.568763 0.0479 0.0430 0.0528 Scheffe 3.080216 0.0103 0.0080 0.0126 Z 1.959964 0.1990 0.1899 0.2082 126 主効果はサブグループを含んでいるので相関あり 65

71.

効果とサブグループ解析の多重性の調整 Omain1 s t a n d a r dvs 主効果 2 t e s t . 9 7 1 adeno1 s t a n d a r d 2 t e s t 2 1 a r g e1 s t a n d a r dvs 2 t e s t 3 s m a l l1 s t a n d a r dvs 2 t e s t s t a n d a r d quam1 2 t e s t 0 . 3 9 7 5 1 0 . 8 7 5 7 B L lN Dデータ ( P H R E Gのマニュアルより) 197人 394眼 デ ー タ 'も~ 個 体 識 別 番 号 :1 0 エンドポイント:TIME(失明までの時間) 打ち切り変数: STATUS ( 0 :打ち切り 1:イベント) 処置変数:TREAT(1: L a s e r O : O t h e r s ) 片眼!こ Laser1 也眼!こ Others 発症時期:TYPE 0 :幼 少 (20歳未満) 1:成人 (20歳以上) 128 66

72.

ち切りと非打ち切り値の数の要約 層 │ T r e a t │ T y p e │全体│死亡│打ち切り│パーセント 打ち切り O (他)O(幼) 114 5 1 63 2 1 0 (他) 1(成) 1 8 3 1 5 0 1 3 3 1 3 9 . 7 6 3 1 1 4 1 3 6 1 L ) O(幼) 1 1( 7 8 1 6 8. 42 4 1( L ) 1(成) 83 h & > t a lI 1 8 394 65 7 8 . 3 1 155 239 6 0 . 6 6 カプランマイヤー曲線 Product‑L imit 生 存 推 定 リスクのある封象監 10 ~ O̲ S j 1111 宵 M 体制 64 OO 成人 0 . 2 。 。 1 1 4 8l 88 2i J! 1 ! 1 4 9 1 4' 8l 7 3 fi~ 。 一 一 " " " 20 80 ,. ,." 50 12 。 舎 50 36 40 ・ = 0一一一一一一‑ ・ ・ 1 Trdat = OTyp " " . , " Time ・ レーザーなし " 6 " " 60 2τreat=OTyo = 1 一 一 一 一 一 一 一 3 了 間 前 三 1Type=O 一 一 一 一 一 一 一 一 ‑4 .Tr d l = lTyp = 1 1 3 0 67 s o

73.

両眼を独立だとして解析 proc phreg d a t a二 BI i n d; c l a s si dt y p et r e a t ; m o d e l Time*Status(O)= T r e a tT y p eT r e a t * T y p e ; hazardratio T r e a t : i dI D : r u n : 131 •• 両眼を独立だとして解析 最尤推定値の分析 パフメータ T r e a t ¥フメータ 標 準 誤 差 力イ 2乗 Pr> 自由度 1 ChiSq 推定値 0 0 0 1 1 . 2 7 0 3 3 0 . 2 7 5 3 1 2 1 . 2 9 0 9 く. Type 0 . 5 0 4 8 2 0 . 2 8 8 7 8 3 . 0 5 5 7 0 . 0 8 0 5 Type*Treat ‑ 0 . 8 4 5 6 6 0 . 3 5 0 8 8 5 . 8 0 8 4 0 . 0 1 5 9 」ー /、ザード比 T r e a t T r e a t0v s1AtType二 O 1 . 5 2 9 95%Wald信 頼 限 界 0 . 9 9 8 2 . 3 4 3 T r e a t0v s1AtType二 1 3 . 5 6 2 2 . 0 7 7 説明 成人で 点推定値 レーザーありで強い効果 132 68 6 . 1 1 0

74.

両眼の解析 ・左右眼の相関 ある個人の左右眼は遺伝的,環境的要因が類似 しているので独立ではない(正の相関) N )を過大評価 独立だとして解析すると情報量 ( ・口バスト分散(サンドイツチ型分散) 左右眼の相聞を考慮した分散 相関を考慮することで分散が大きくなる. (相聞が 0のときは通常の Wald検定!こ一致) r a i l t y (脆弱さ)モデル ・f 個体差を変量効果としてモデル化 133 左右眼の失明までの時間の相関 JP 一回一圃 /F 圃 圃究 40 r JE一 一 園 田 園 L3F. . ' a r dz 20 園田 週 一 0 ︐ ・ ⁝ 一 ‑ ‑ ' 一 ︐ . ﹁ ・ J ‑・ ・ ・ ・ 圃 圃 薗 E 圃 ︐ . ‑ ‑ v r . . F P U ・ ‑ t s Ed︐ . . . i t ‑20 60 80 COL2 左眼 134 69

75.

f r a i l t y (脆弱さ)モデル 個体差による変動によって,弱い個体が生じ 早期に死亡が起きることを想定したモデル 生存時間の変量効果モデル. (比イ列ハザードf r a i l t yモデ、ル) 個人 i r a i l t y ( 0 ‑∞) のf BE . . . し ρw ︐ / m l ︑ . ︑ u 4 ' ι ¥E 〆 ︐ ︑ ノ ︐ n ︐ nu 一 一 ︑ ︑ . ︐ ︐ ノ 4 ' ι 〆 ︐ ︑ ム HI ︑ ︑ノ Z ︐ T QV Uj ~σ) 先天的な弱さ l o gU iの分布 135 る 70 す で価定 位評指 136 単をを m o d e lT i m e * S t a t u s ( O )二 T r e a tT y p eT r e a t * T y p e ; hazardratio T r e a t : i dI D : r u n : 個分こ ﹄ ﹄ c l a s si dt y p et r e a t ; 体散と η/ η/ n H 一 一 o u n H o u m nd サンドイツチ分散による解析 proc phreg d a t a二 BI i n d

76.

サンドイツチ分散による解析 最尤推定値の分析 1 ¥フメータ ¥フメータ 標 準 誤 自由 1 推定値 差 度 標 準 誤 力イ 2乗 Pr> 差比 ChiSq T r e a t 1 . 2 7 0 3 3 Type 0 . 5 0 4 8 2 0 . 2 8 9 6 1 1 . 0 0 3 ‑ 0 . 8 4 5 6 6 0 . 3 0 3 5 3 0 . 8 6 5 Type*Treat1 0 . 2 4 1 5 1 0 . 8 7 7 0 0 0 1 2 7 . 6 6 7 2 く. 3 . 0 3 8 3 0 . 0 8 1 3 7 . 7 6 2 2 0 . 0 0 5 3 1¥ザード、比 T r e a t 5九Wald口バスト信頼限界 点推定値 9 T r e a t0v s1AtTypeニO1 . 5 2 9 1 . 0 6 4 2 . 1 9 7 説明 T r e a t0v s1AtType=1 3 . 5 6 2 2 . 2 1 9 5 . 7 1 8 137 f r a i l t yモデルによ proc phreg d a t a = B Ii n d ; class i dt y p et r e a t ; m o d e l Time*Status(O)二 Treat Type T r e a t * T y p e ; 個体1 0を 変 量 効 果 として RANOOM文 T r e a t : で指定 r u n ; 138 7 1

77.

f r a i l t yモデルによる解析 共分散パラメータの推定 共分散パラメータ I D IREML推宰 10.8308σ ー ニ 最尤推定値の分析 パラメータ │自由 度 ‑ 1 │パラメ 標準誤差│力イ 2乗 I P r >ChiSq │タ推定値 T r e a t Type 056749 1 0 . 3 2 2 4 8 1 3 . 0 9 6 9 1 0 . 0 7 8 4 Type*Treat1 ‑0.965381 0 . 3 6 1 4 2 171347 1 0 . 0 0 7 6 く0 001 146388 1 0 . 2 8 3 2 0 1 2 6 . 7 1 9 3 1 2 . 5 6 0 a t0v s1AtType二 1 7 . 5 3 0 T r e a t Type Type*Treat 独立として解析するより,サンドイツチ分散, f r a i l t yモデルによる解析の方が交互作用の有意性が 強い. (一般には,独立とした解析の方が革新的. ) 同一個体内で異なった処置を両眼に割り付けている ので,個体間差を除いて,処置効果を評価できる. y p eについてはで結果はほとんど変わら 個体単位の t ない. 140 72

78.

NLMIXEDプロシジャを用いた生存時間解析 伊藤要二 アス卜ラゼネカ株式会社 │臨床統計守・プログラミンググループ Sl Ir v i v a la n a l y s i sl Is i n gNLMIXEDp r o c e d u r e Y o h j iI to h C l i n i c a lS t a t i s t i c s& ProgrammingG r O l l p, A s t r a Z e n e c aK . K . 要旨 NLMIXEDプロシジャの最尤推定の機能を用いて、指数分布、 W e i b l l l l加速モデル、 Cox比例ハザードモ デルの場合を例として、生存時間解析を試みた c そして、 LIFEREGプロシジャや PHREGプロシジャと 同等な解析結果を得ることが可能であることを示した。このことを通して、生存時間解析の習得及び応 用において NLMIXEDプロシジャが強力な道具となり得ることを示したと キーワード.最尤法、指数分布、 W e i b l l l l加速モデル、 Cox比例ハザードモデル 1.はじめに どのような複雑な統計解析でも SASが全てやってくれるため、多くの場合、必ずしも SASの計算内容の詳 細を知る必要はない。そのため、例えば LIFEREG プロシジャを用いたパラメトリックな生存時間解析や、 PHREGプロシジャを J f Jいた Cox比例ハザードモデル解析の理論や計算!アルゴリズムの詳 H Ilが理解されてい ないことが多 L、。一般的に、自分でプログラムを書いてみることが計算アルゴリズムを理解するのに非常に 省川であるが、これらの生存時間解析のプログラムを自分で書こうと思っても、最尤推定のアルゴリズムを 自分で警くのはなかなか面倒である。しかし SASにおいては、 NLMIXEDプロシシャが一般的な最尤推定の 七g絞的存i ' ¥単に生存時 I~\'J 解析のプログラムを畜; ための計算ルーチンを促供してくれており、これを月九、れば、 i くことができる。 本稿の目的は、いくつかのモデル(指数分布、 W e i b l l l l 加速モデル、 Cox比例ハザードモデル)を例と して、生存時間解析のプログラムを NLMIXEDプロシジャを用いて比較的簡単に書くことができることを示 Jな道具て、あることを限 し、さらに NLMIXEDプロシジャが生存時間解析を合む統計計算において非常に強 ) 解してもらうこと、および生存 1寺問解析への更なる応用の可能性を示唆することである。 7 3

79.
[beta]
2
. 生存時間解析における尤度
生存時間 Tが連続の場合のみを考える。次のように、確率密度関数、生存開放を表わす 0
・確率密度関数
生存関数:

f(
1;
O
),1>0

十

叩 )=P(T>1;
0
)=1

(
s
;
O凶

データには n 個体が含まれており、各個体のデータは生存時間及び打切り情報とからなっているとする(し
ばらく共変量については無視する L
・ 生 存 時 間 ' 1 ',
.
]
[ '
)
'
… ,1n
•t
l切り情報

打切り例の場合は最終生存確認までの時間)

(

ι…,孔(イベン卜ありなら死 =1,打切りなら死二 0)

O
" O2,

i番目の個体の尤度への寄与 Ljは下記のようになる:

・イベント観察例の場合

L,=f
,
l
(;
O
)
:i
i
存率密度

・打ち切り例の場合

L
j=S
(
/;
O
)
: 生存関数、すなわちんまで生存したという情報を利用

,

尤度はこれら全てをかけ合わせたものであり、

日
ム (9)=
日
[
f(
I
,
;
O
)
O
,
S
(
l;
9
)
'
‑
0
,
]
j

となる。対数尤度はこれを対数変換して、

工logLj(O)=工
同 logf(l;O)+(
1
の logS(l;9)]

1
(
9
)=

j

j

となる。このように対数尤度さえ定義されれば、あとは NLMIXEDプロシジャを用いて推定が可能となる。

3
.N
U
1
I
X
E
Dプロシジャによる最尤推定
NLMIXEDプロシジャは本米は非線形混合効果モデルのためのプロシジャであるが、そこに備え付けられ
ている最尤推定のための一般的な機能を利用して、種マのモデルの最尤推定に利用することができる。
本プロシジャの MODELステートメン卜には正規分布やポワソン分布などの分布が指定できるが、その代
わりに I
genera]Jというキーワードの後の括弧内にユーザーが定義した対数尤度を含む変数を指定して、

MODELdependent‑variable‑g
C
l
l
c
r
a
l
(変主主名);
と書けば、ユーザーが定義した対数尤度に基づく最尤推定を行うことができる。

4
. 指数分布
Program1
. 数値例 l

まずは最も簡単な生存時!日!分布である指数分布を考える。指数分布の確率密度関
'
{
l
(率密度関数及び生存関数の括弧の中のパラメタを省略)
数及び生存関数は(以下、 i
• u'{~ 率密度関数

f(/)= λe-'Ü

・生存関数

S
(
I
)=e
‑A,

data e
x
1
;
I
n
p
u
t te
v
e
n
t
;
c
a
r
d
s
;

31

と表わされる c ここで λはハザードを表わす。このように昨率街度関数及び生存開
放が定義されれば、それから対数尤度が定義でき、それをllJいて NLMIXEDプロシ

t定が可能となる c
ジャによる段尤 H

74

60
1
21
2
41
4
81

80.
[beta]
u

r
一
E

EdA

f
﹂
一

4
A

f
v
F
U

一
一
一
一
)
I)
I
(
(

︐
.
︐

︑
肉
↑
↑

・米白・米'

aa

内

d

)
)
+L+L

内

d

m川 m川

ehuehu

し
V

V︿

lu
門
lu
門

‑
‑

し

V︿

ρv ρ

((
pP

川

.
米
白

内

d

内

d

m

ehu

A
u

し

し

︐

内

ー;
=
一 一 ︑ EJ
'hu'hHIl

‑‑(

司

‑nuρV I l
‑‑ρuqu
d

内

=hH1lrl

門川ザ

d + L ρv ρ u

AU‑‑

U

門

円什

rl

ステートメン卜ではハザードを表

十L T I l ‑

NLMIXED プロシジャの PARMS

︒

r
o
g
r
a
m2示す。
をP

Ilnfk+L

指数分布を当てはめるプログラム

hU l
l
︑' 巴
m
=hg
qot

rl=J
u
a
pf
ah
l1
‑l
‑o
m Hu

て
、 NLMIXEDプロシジャによって

5VOli
m
e‑‑e

P
r
o
g
r
a
m2
.NLMIXEDプロシジャによる指数分布の当てはめ
p
r
o
cn
l
m
i
x巴dd
a
t
a
=巴x
1d
f
=1
巴8
;

P
r
o
g
r
a
m1に示した数値例を用い

わすパラメタ l
a
m
b
d
a に初期](,立を与
えている。その下の一連のプログラミング・ステートメントでは、ユーザ定義の対数尤度を定義している。

F文を用いて場合分けを行い、イベントあり (
e
v
e
n
t
=
l
) の場合{こは尤度への寄与として確本官度
すなわち、 I
e
v
e
n
t
=
O
) の場合には生存関数の値を与えている。次に、尤度をえJ
数変換して対数尤度を計
を与え、打切り (
算し(変数名 1
1
)、それを MODELステートメントで用いている。

r
o
g
r
a
m2を実行すると、下記の O
u
t
p
u
t1の出力が得られる。この結果から、指数分布におけるハザ
上記 P
ードの推定値はえ=0
.
0
4
3
0
1となることが分かる。

O
u
t
p
u
t1
.NLMIXEDプロシジャによって指数分布を当てはめた場合の出力
S
t
a
n
d
a
r
d
P
a
r
a
m巴t
巴r E
s
t
i
m
a
t
e
t
l A
l
p
h
a
Low巴
「
E
r
r
o
r
D
F tV
a
l
u
e P
r> I
l
a
m
b
d
a

O
.0
4
3
0
1

O
.0
2
1
5
1

1
E
8

2
.
0
0

0
.
0
4
5
5

ここで lつ注意すべきは、プロシジャ・ステートメントに

0
.
0
5 0
.
0
0
0
8
6
1

r
a
d
i巴n
t
U
p
p巴r G
0
.
0
8
5
1
6 9
.
8
2
9
E
‑
6

d
f
=
l
e
8
J というオプションを用いたことであ

るc 生存時間解析でよく用いられる LIFEREGや PHREGプロシジャでは、検定や信頼区間!の計算に χ2分布
が用 L、られるが、一方、 NLMIXEDプロシジャでは自由度を考慮した 1分布が用いられるため、微妙に結果が

f
ニ l
e
8
J を指定して、自由
一致しない心そこで、他のプロシジャと同等な結果が得られるようするために、["d
正胤分布に基づく推 i
H
l
J
を行うようにしたのである c
度を!実質的に無限大にし、 t分布の代わりに I

5
.W
e
ib
u1
1分布
5
.1 基本的なケース
次に W
e
i
b
u
l
l分布を考える。 W
e
i
b
u
l
l分イ1の昨ギ街!主!羽数、生存!主l
数には幾つかの表現法があるが、例えば、

C
o
l
l
e
t(
2
0
0
3
) に従うと、下記のように表わされる。
.(i'{~ 之本省 l主関数

/(1)=λ YI ,-1 e
x
p
(
λ
1
'
)

‑生存!共同支・

S
(
/
)=e
x
p
(ー λ
1
'
)

c
a
l
ep
a
r
a
m
e
t
e
r、
ここで、 λ は s
yは s
h
a
p
ep
a
r
a
m
e
t
e
rである。

これらの確率街度関数及
い、前出のプ
び生存開放を月一l
ロク ラムと同様に NLMEXED
プロシジャのプログラムを
簡単に書くことができる。先

9
]
1 (データ
ほどと同じ数値 1

(
1
)

P
r
o
g
r
a
m3
.NLMIXEDプロシジャによる W
e
i
b
u
l
l分布の当てはめ
p
r
o
cn
l
m
i
x
e
dd
a
t
a
=巴x
1d
f
=
l
e
8
;
p
a
r
m
sl
a
m
b
d
a
=
lg
a
m
m
a
=
l
;
a
m
m
aキt
キ(
g
a
m
m
a
‑
1)
i
fe
v
e
n
t
=
lt
h
e
nI
h
=
l
a
m
b
d
aキg
キ
巴x
p
(ー l
a
m
b
d
aキt
林g
a
m
m
a
); ←/
(
1
)
=
λY
I,
‑
1e
x
p
( λl
')
e
l
s
eI
h
=巴x
p
(
‑
I
a
m
b
d
aキt
林g
a
m
m
a
); ← S(/)=e
x
p
(
λ IY)
I
I=
[
o
g(
[h
);
m
o
d
e
[t
‑
g
e
n
e
r
a
l(
11
)
;
r
u
n

75

81.
[beta]
セソト e
x1
,P
r
o
g
r
a
m1参照)に W
e
i
b
ulJ分布を当てはめるプログラムを P
r
o
g
r
a
m3に示した。そして、それか
らの出力を O
u
t
p
l
l
t
2に示したが、このデータから得られた W
e
i
b
ulJ分布のパラメタ推定値はえ=0
.
0
1
6
1
2,
守=1.2
9
1
6であることが分かる c

O
l
l
t
p
u
t2
.NLMIXEDプロシジャによって W
e
i
b
u
l
1分布を当てはめた場合の出力
P
a
r
a
m
e
t
e
r E
s
t
i
m
a
t
e
l
a
m
b
d
a
g
a
m
m
a

S
t
a
n
d
a
r
d
E
r
r
o
r

r> I
t
l
D
F tV
a
l
u巴 P

0
.
0
1
6
1
2 O
.0
2
8
5
6 1
E
8
.4
9
5
0 1
E
8
1
.2
9
1
6 O

A
l
p
h
a

O
.5
7
2
4
O
.0
0
9
1

0
.
5
6
2
.
6
1

t
U
p
p
e
r G
r
a
d
i巴n

L
o
w
e
r

O
.0
5 ‑
0
.0
3
9
8
5 O
.0
7
2
0
9 ‑
0
.0
0
0
2
3
0
.
0
5

0
.
3
2
1
4

2
.
2
6
1
9 ‑
3
.
6
2
E
‑
6

Ve
i
b
u1
1分布の別の形
5
.2 l
上記の W
e
i
b
ulJ分布の定義 (
1)は教手│書的なものであるが、しかし、このままでは拡張性に乏しい。そのた
め
、 SASにおいては、下記のように変数変換及びパラメタの変換を行ったものを用いる.

¥
¥
'
=l
o
g
(
I
), σ=1
/y
, μ=一
(
lo
gλ
)
/
σ
あるいは逆に、

I
=
e
x
p
(
w
), y
=
I
/
σ, λ=exp(一μ/σ)

早川

これらを式 (
1
)に代入し、整理すると、新しい夏、数 w の生存関数及び確率密度関数は次のようになる。

σ

一

日一 σ

巴

11P

削

xλy

3V

Lt

eμ'
一

‑‑YA

列︑
一
一(

‑‑ρiw

r
o
g
r
a
m4に示し、そし
プログラムを P

piwny

リ

数を用いて書いた段尤 j
f
t定のための

σ
一

Weibull 分布の生存関数、 li'{I~2本省度関

川I

TUA
r
'
ん

このように変換された別形の

P
r
o
g
r
a
m4
.NLMIXEDプロシジャによる7]1])[:*W
e
i
b
u
l
l分布の当てはめ
proc nlmix巴dd
a
t
a
=
e
x
1d
f
=
l
e
8
;
parms m
u
=
ls
i
g
m
a
=
l
;
^
.
, 1 .W‑j1,
.W‑j
1
jパW)="
'
:
"
'
e
x
p
(
一一三)
e
x
p
[
‑
e
x
p
(
一一こ)]
w=log(
t
); ι σ σ σ

i
i
i
j
Wの数値 1
9
1
Je
x1(
P
r
o
g
r
a
m 1参

i
fe
v
e
n
t
=
lt
h
e
nI
h
=
l
/
s
i
g
m
aキ
巴x
p((
w
‑
m
u
)/si
g
m
a
)

いて得た出力を O
l
l
t
p
l
l
t3に
!¥引を m

キe
xp(
‑
e
x
p(
(
w
‑
m
u
)/si
g
m
a
)
);

て
、

巴I
s巴

示す。このプログラムでは、対数尤
度の計算に先 ‑
'
/
rち
、 3行 I
dで w=l
o
g
(
t
)
という変数変換を行っている。

1
h=exp(ー巴 xp((
w
‑
m
u
)/
si
g
m
a
));

~Sw(w)=exp[-exp(主二丘)]

1
1
=
l
o
g
(
l
h
)
;

σ

m
o
d
e
lt
‑
g
e
n
e
r
a
l(
1
1
)
;
r
u
n
;

e
i
b
u
l
l分布を当てはめた場合の出力
O
u
t
p
u
t3
.NLMIXEDプロシジャによって別形の W
S
t
a
n
d
a
r
d
U
p
p
e
r G
r
a
d
i
e
n
t
L
o
w
e
r
E
r
r
o
r D
F tV
a
l
u巴 P
r> I
t
l A
l
p
h
a
P
a
r
a
m巴t
巴r E
s
t
i
m
a
t巴
m
u
s
l
g
m
a

3
.1
9
5
6
O
.7
7
4
2

O
.3
9
7
6 1
E
8
0
.
2
9
6
7

1
E
8

8
.
0
4
2
.
6
1

<
.
0
0
0
1
0
.
0
0
9
1

0
.
0
5
0
.
0
5

2
.
4
1
6
3
0
.
1
9
2
8

3
.
9
7
4
9 ‑
4
.6
6
E
‑
6
1
.3
5
5
7 8
.
7
4
6
E
‑
7

同様の解析は L
IFEREGプロシジャを用いて、より簡単に行うことができる (
p
r
o
g
r
a
m5
)。その出力を

O
l
l
t
p
u
t
4に示す。

NLMIXEDプロシジャを用いた場合と基本的に同等な解析結果が得られることが分かる。

(ただし、 s
c
a
l
ep
a
r
a
m
e
t
e
rである σの信頼区間については、計算法が異なるため、多少の違いが生じている。)

7
6

82.
[beta]
P
r
o
g
r
a
m5
.L
IFEREGプロシジャによる W
e
i
b
u
l
l分布の当てはめ
p
r
o
c[
if
巴
「
巴 gd
a
t
a
=巴x
1;
m
o
d巴[ t
柁v
e
n
t(
0
)
=/
d
=
w
巴i
b
u
[[
;
r
u
n
;
e
i
b
u
l
l分布を当てはめた場合の出力
O
u
t
p
u
t4
.LIFEREGプロシジャによって W
5
%C
o
n
f
i
d巴n
c巴
C
h
iー
S
t
a
n
d
a
r
d 9
S
q
u
a
r
e P
r>C
E
r
r
o
r
h
i
S
q
P
a
r
a
m
e
t巴
「
D
FE
s
t
i
m
a
t巴
Li
mi
t
s
[
n
t
e
r
c巴p
t
3
.1
9
5
6
S
c
a
[0
.
7
7
4
2
W
e
i
b
u
[[Sca[e 1 2
4
.4
2
4
3
巴i
b
u
[[Shape 1 1
W
.2
9
1
6

0
.
3
9
7
6 2
.
4
1
6
3 3
.9
7
4
9 6
4
.6
0
0
.
2
9
6
7 O
.6
4
0
7
.3
6
5
3 1
3
.2
4
2
5
9
.
7
1
1
1 1
1
.2
0
4
3 5
O
.4
9
4
9 O
.6
0
9
5 2
.
7
3
7
2

<
.
0
0
0
1

Ve
i
bu1
1加速モデル
5
.
2 l
W
e
i
b
u
l
l分布を仮定して、 2つの治療昨 I
U
Jの比 肢を行う場合の lつの方法として、)Ju
j
m:モデルによる比較を
l

1
)および 5(
1
)と表わすとするつこの 2つの生存
行うことを考える。 2つの治療群のそれぞれの生存開放を 50(

関数の問に

5(
1
)
=(I'a),a>O
という関係が成り立っと仮定する。 σは J
)lI速パラメタ (
a
c
c
e
l
e
r
a
t
i
ol1 f
a
c
t
o
r
)とH手ば
れ
、 lより大き〈なるほど生存期間は短〈なる。通常は、 σ=e
x
p
(ーのとおき、
先ほどの関係式は

5,
(
1
)=
弐
,(
I
'
C
X
p
(
β
)
), ∞
〈βくつc
と表わされ、

3が推定すべきノ tラメタとされる。

2 つの治療砕を表わす変数を zとし、 z=Oは標準治療併を、 z=1は新規治

療g
"Fを表わすものとする。すると、 zが与えられた場合の生存関数は下記のよ
うに J
:
(
̲わされる。
5
(
I
;
z
)=50(
t・巴 X
p
(‑,8z))=5
0(
c
x
p(
lo
g
1 βz
)
),z=O
,
1

ここで再び W
c
i
b
u
l
l分布を仮定する。 i
i
i
j節では変数変換した変数 w=loglに

P
r
o
g
r
a
m6
.数値例 2
2
;
d
a
t
a巴x
I
n
p
u
tg
r
o
u
pte
v
e
n
t
;
c
a
r
d
s
:

o2 1

050
0111
o15 1
o2
11
1 31
1 61
11
20
12
41
14
81

対する生存関数及び確率密度開放を用いたが、ここ

P
r
o
g
r
a
m7
.NLMIXEDプロシジャによる W
c
i
b
u
l
l加速

では、その変数変換の代わりに、それに市の効果を

モデルの当てはめ

線形の形で付加した

w=l
o
g
lー βz
を月刊、る。そうすれば、先述の wについての生存関
数、昨率密度関数をそのまま用いることができる。
ここで、数 f
直f7
]
12(
P
r
o
g
r
a
m6
)を刑いて、 NLMIXED
によって W
c
i
b
u
l
l加速モデルを当てはめるためのプ

r
o
g
r
a
m7に、その:JU)結果を O
u
t
p
u
t5
ログラムを P
に示す。このプログラムと先ほどのプログラム

p
r
o
cn
[
m
i
x巴dd
a
t
a
=巴x
2d
f
=
l
e
8
;
巴t
a
=
O
;
p
a
r
m
sm
u
=
ls
i
g
m
a
=
lb
w
=
[
o
g
(
t
) ‑b
巴t
aキ g
r
o
u
p
;
t
=1t
h巴nI
h
=
l
/
s
i
g
m
aキ巴 x
p(
(
w
‑
m
u
)/
si
g
m
a
)
i
f巴V巴n
キ
巴x
p
(ー巴 x
p
(
(
w
‑
m
u
)
/
s
i
g
m
a
)
);
巴[
5
e[
h
=
e
x
p
(
‑
e
x
p
(
(
w
‑
m
u
)
/
5
i
g
m
a
)
)
;
1
[
=
I
o
g(
[
h
);
m
o
d
e[t
‑
g
e
n
e
r
a[(
[[
);
r
u
n
:

=[
o
g(
t
)J の後ろに I
‑
b
e
t
aキ g
r
o叩ーが付加されている点である。
(
P
r
o
g
r
a
m4
) と異なる点は、 3行日の w
e
t日の初期値設定が付加されているだけで、他の f
i
(
i
分は全く同じである。
あとは、 b

77

83.
[beta]
O
u
t
p
u
t5
.NLMIXEDプロシジャによって W
e
i
b
u
I
I加速モデルを当てはめた場合の出力
S
t
a
n
d
a
r
d
l
p
h
a
P
a
r
a
m
e
t
e
r E
s
t
i
m
a
t
e
E
r
r
o
r D
t
l A
L
o
w
e
r
F tV
a
l
u
eP
r> I
U
p
p
e
r G
r
a
d
i
e
n
t
m
u
s
l
g
m
a
b
e
t
a

2
.
6
1
5
5
0
.
7
3
1
5
O
.5
9
4
0

0
.
3
6
6
5 1
E
8
E
8
0
.
2
0
6
5 1
0
.
5
1
9
6 1
E
8

7
.
1
4
3
.5
4
.
11
4

<
.0
0
0
1
O
.0
0
0
4
O
.2
5
3
0

0
.
0
5 1
.8
9
7
3
0
.
0
5 O
.3
2
6
7
0
.
0
5 ‑
0
.
4
2
4
4

同様の解析は LIFEREGプロシジャによっても可能で、

3
.3
3
3
8 8
.0
9
8
E
‑
6
1
.1
3
6
3 2
.8
8
5
E
‑
6
1
.6
1
2
3 5
.
2
4
7
E
‑
6

P
r
o
g
r
a
m8
.LIFEREGプロシジャを用いた
W巴i
b
uIl加速モデルの当てはめ
p
r
o
c1
i
f
e
r
e
gd
a
t
a
=
e
x
2
;
キe
v
e
n
t(
0
)=
g
r
o
u
p
/d
=
w
e
i
b
u
l1
;
m
o
d
e1t
r
u
n
:

そのためのプログラムを P
r
o
g
r
a
m8に示す。これを実行す
れば、上て司求めた群の効果の推定値 0
.
5
9
4
0と全く同じ値
が得られるのが確認できる(結果の出力は省略)。

6
.C
o
x比例ハザードモデル
6
.1 タイ(同順位)が無い場合
r人の死亡例における生存時間を下表のように小さい順に並べる。

生存時間
治療群を表わす夏、数

C
o
x比例ハザードモデルに用いられる部分尤度 P
a
r
t
i
a
ll
i
k
e
l
i
h
o
o
dは次式のように表わされる(詳細は省略):
円 以

p
(
β
Z
f
j
}
)

PL=11=
.
.
.
~=~ ),州t,
JEXP(βz)
¥'1

ここで、 βは治療群の効果を表わすパラメ夕、 R(I(i))は時点 I
のにおけるリスクセソト(時点 1
(
0
'こおいてリスク
にi
察されている症例の集合)を表わす。
1
1
貢を数値例を用いて追ってみる。下に示した数値例は先ほど用いたものと同じものである(デー
この計算手 1

x
2,P
r
o
g
r
a
m6参照)。まず、下のように、このデータを生存時間 1(1)の!煩に並べ替える。
タセッ卜 e

。
2
。
。
5
。
1
。
。 15
δ
a

"1

2
1
3

6
1
2
2
4
4
8

(
i
)

2
4
5
6
7
8
9
1
0

。

I
(内

(
i
)

リスクセットのサイズ

9
8

3

3
1
IIf1に並べ替え
Iの1

。 2 d 10
。5 。
。 16 。
1
2
。
1
5
。 21

Z
(
i
)

7

6
5
4

、
,

3

2
4
4
8

2

各イベン卜発現時点の部分尤度への寄与は次のように計算される。
~po

l
(l}= 2の死亡例の部分尤度への寄与:

PL
.
,
= βoβ1βoβ1βoβiβ O
(l)
er~

, ~PO
, ~P}
r‑+er'+er~ +er'+er~ +e
r‑+e
r +eβi
+er'+e

Aβi

'C)=3の死亡例の部分尤度への寄与:

Pム
2 ) β } ,~P'O
,~po +e
β , +e
,̲ s+
Oβ0βiβ!
e
"
" +e +eβ , +e
e
"
'
‑
"+e +e
l"‑

J
‑
"

l""

l".

l""

1
(
3
)= 5 ではイベントがないので 1!l~ 視
nβ1
1(4)=

6の死亡例の部分尤度への寄与:

P L,=
.
.
.
.
.
.
(
4
)

o+e
P'
,
〆+eP'o+eβ,
+eP'
β'+〆
}
"+e

7
8

l
'
"

84.

以下同様である。 このような計算をするためには、元データのように l症例 1レコードというデータ構造ではなく、 Iレコ ードを lイベン卜に対応させ、そのレコードにはそのイベン卜発現時点時のリスクセソトに含まれる全症例 を含むようなデータ構造に事前に加工しておく必要がある。そのためのプログラムを Program9に、その結 こ示す。ここでは簡便のため IMLを用いたが、 Dataステップでも同様の処理は可能である。 果を Output6i Program9 .NLMIXEDプロシジャを用いて Cox比例ハザードモデルを当てはめる前に行うデータ加仁 proc i m l ; sort ex2 out=s b yt ; I do i = lt on r e c ; i f event[i]=l then d o ; v e c = iIlt[i]llgroup; use s ; read a l l ; I nrec=nrow( t ); I append from v e c ; e n d ; 悶a m巴="i "I I " t i m e "1 1( r 叩 ep巴a t( "z vn +left(char(1:nrec,2,0 ) ) ) ; vec=j( 1,n r巴c+2,0 ); 1 I create phdata from vec [ c oI name=vname]; (右に続く) I qui t ; e n d ; close phdata; O u t p u t6 . 加工されたデータのリスティング i time z l z 2 z3 z4 z 5 z6 z7 z8 z9 z10 ー ハ / ﹄ qdpo‑‑rhu‑‑nu 寸 n 口 111ln/﹄ 内 / ﹄ 刈 斗 寸 1lntnu rD7lnoqunu ιし、時間 111m このデータの各行はイベント発現 H寺点に九日 に; ¥ T .べられている内変数 z l~z10 は各時点におけるリス クセ y 卜に含まれる各症例の共変量(この場合は群の情 報)を表わすものである。この変換されたデータを用い て Program1 0を実行することにより、 Cox比例ハザード モデル解析をすることができる。このプログラムて ぶさ れているように、 NLMIXEDプロシジャでは配列や DO ルーフ。も使用することができる。この DOループでは、 各時点のリスクセットのサイス分だけループを回して、 Program1 0 . NLMIXEDブロシジャによる比例 ノ、ザードモデルの当てはめ proc nlmixed data=phdata df=le8; parms beta 0 ; array z[ 1 0 ] zl‑zl O ; denominator=O; do j = i to 1 0 ; denominatorコdenominator+exp(betaむ[j]); e n d : 10gpl=log(exp(betaキz[ i ] )/denominator); modeIti me‑generaI( 1ogp1 ); r u n ; 1 1 ' 0 : ーしている。 Output7にこのプ 部分尤度の分母部分を , ログラムの実行結果を示す。 O u t p u t7 .NLMIXEDプロシジャを用いて比例ハザードモデルを当てはめた場合の出力 Standard D F tValue Pr > I t l Alpha Lower Upper Gradient Estimate Error ‑0.9031 0.8724 1E8 ‑ 1 .04 79 0.3006 0.05 ‑2.6130 0.8068 ‑ 2 .65E‑7

85.
[beta]
Program 1
1
.PHREGプロシジャ
による比例ハザードモデル解析

同様の計算は PHREGプロシジャを用いた Program 1
1 によっても実
行できる。その出力を Output 8に示すが、上で NLMIXEDプロシジャ

proc phreg data=ex2;
model t
キe
vent(
0
)=
group;
r
u
n
;

,
Eできる。
を用いて計算したのと全く同じ結果が得られることが確 j

Output8
.PHREGプロシジャによる比例ハザードモデル解析の結果
Parameter
Standard
D
F
Estimate
Error
Chi‑Square
Variable

‑
0
.9
0
3
0
7

group

O
.8
7
2
4
0

P
r > ChiSq

Hazard
Ratio

O
.3
0
0
6

0
.
4
0
5

1
.0
7
1
5

6
.2 タイがある場合
Cox 比例ハザードモデルにおいては、真の生存時間は連続であり、本来、タイは存在しないものと仮定す

る。そして、実際のデータにおいてタイが生じたとしても、それは時間の丸めによるものであると考える。
例えば、下の表 lに示したデータを考える c ここで、 Iは時間、 δはイベントの有無、 zは群を表わす。
Program1
2
.数値{9
J
I3の読み込み

)
表1.タイのあるデータ(数値例 3
S
u
b
j
e
c
t

f

δ

3

2

。

4

3

5

4

2

。

data e
x
3
;
i
n
p
u
t t event group;
c
a
r
d
s
:

。

111
201
310

,

110

4 11

このデータでは症例 l及び 2がともに f lであり、同順位となっている。そのため、下記のような 2
!ニ 2通
二

順序が存在すると仮定される。
りの真の l
A1= {
1→ 2
}

Az={
2→ 1
}

これら 2通りの 1買序のそれぞれにについて部分尤度への寄与を計算すると、
n
β
e
β
=
2
ご

二戸三eP=
'+eP=s

PL1Ml)=JZI+JZ2‑h+J24+thx F
E
β
Z
i

二

e
β
=
1

Pム
(A,
)
ニ JZI+JZ2+JZ3+Eh+JZ5XF
e
P
=
J+eP日 +eP=
'

となる。これらを足し合わせることにより、当該時点における部分尤度への寄与が計算できる。これが E
x
a
c
t
法による計算法である。しかし、このような計算は同順位が多い場合には膨大な計算fI寺院]を要することにな
り、そのため、近似計算が必要となる。その 1つが Breslowの近似法で、ある c
Br
巴s
lowの近似法では、先述の数値例において、次のような近似を行う。
β = 1 β = 1
e
c

‑'

β
=
1
β
旨
β
ー
β
"
"
+e
"
‑
'
e
"
=
1+e
"
=
l+e
P=
e
三

--~--~=
ご
ミ

,

β
ー
β
h
β
ー
β
=
.
1+eβ
=
;
:
.
e
"
'
1
+e
"
‑
'+e
"
‑
J+e
"
‑
.
I
P
e
'
=

f
J
f
J
=
.+e
, eP=1+efJ,= +ef
J
=
, +e

ご
el
+e
l
l
=
l+eP
=
'+e
β
=

ご
、

)
および PL1
(A2)は L、ずれも次のように近似される。
これにより、 PL1(A1
β
弓
β
=
,
t

"
P
(ご1
+
=
2
)

,エ
(:IJz,1
)

X~--~-..."...-~O----~一一一一一一一一一­

ご
f
J
e
P
=
1+eP
=
'+e
P
=,+eP=
'+e
,
=.
.eP
1+eP=
'+e
f
J
.
ごJ
+eP
ご 斗 E
β
=

80

86.
[beta]
このように B
r
e
s
l
o
¥
¥ の近似は、各 H
寺点における同順位の問の仮想的な全ての順序の部分尤度の寄与の分尽に
対して共通なものを用いるもので、一般に l時点についての部分尤度への寄与は次の式のように近似される。

PL~

e
x
p
(
β 〉 ι"n Z
k
)
一 円

(
エ
同 exp(β i)円
}
ご

,

,

ここで、 d は I時点における同順位の症例牧、 Rj '主 i1
1
守点におけるリスク・セット、 D i
ま I時点における同
順位の集合を表わす

これらを全時点について掛け合わせて、データ全体の部分尤 j
立は次のようになる。

O

/
)
D
exp(β>,," n Z
k
)
J
PL=TIPL ~日一
] 叫 、
J
=
l
r
z
il
LMgEXP(βz
)
}

,

年点のお〔を表わす。
ただし、 D はイベントの発現があった異なる H
J
I
l工をしておく必要があ
先ほど述べたのと同様に、 NLMIXED プロシジャを用いる前に、事前にデータの )

3に、そして加工後のデータを OutpuI9に示す。
るc そのための IMLプログラムを Program1

γ﹄
nド

.︐︑目﹄'ouρu・'
十
Lnu﹁﹁︑
j
'nnnu
vd11".︐︐
﹂
U'ou""
c m 十L Z +
Quou'l""
=・・﹁+Lft/t︑︐本
tIJn"ttc
u+L・・!laa巴︑l
oft‑‑lle巴﹁.︑
く
;wrt"ppn
1ullorp!日巴
't
疋
.︐xlira"﹁﹁1l'4m
ll巴'anh=ftftftt
m s = c e l l ‑ ‑ ‑ l d = I二
b
‑‑十L A U C ‑ ‑ m 1 1 1 1 = e
﹁巴日巴macm
イf
c05巴﹁un巴│(︑
コ
一
osurnnvvt

Program1
3
. タイのあるデータの加工

・‑ P

c
r巴a
t巴 phdata from v巴c [co[nam巴=vnam巴J
;
do i
=
lt
o nr巴c
:
i
]=
i
f 巴V巴nt[
o
;
1 th巴n d
V巴c
I
lgroup';
m巴[
=
i1
i
J1
t
1ti
1
i
fi
=
l th巴n append from vec;
s
ei
ftime[W=time[i‑l
巴[
;
] thenapp巴ndfromv巴c
d
;
巴n
group[
i
J=
.
t[
i
J=
.;
d
;
巴n
c[ose phdata;
q
U
l
t
;

)m )m

什円什

川

HUHu
n
++
川

J しJPし

内/﹄

内/﹄

)ステ f ング
Output9
. タイのあるデータの加工後の 1

tim巴

t1

t2

t3

t
4

t
5

z1

z2

z3

z4

z5

1 1 1 2 3 4 0 1 1 0 1

4
5

3
4

3

4:
4

l.
.
9
.
.
.
.
.
.1

・

このデータの各行には各イベント発現時点においてリスクセソト{二含まれる症例のイベント発現時点 (
t
l
~

1
5
)及び共変量 (
t
l~ 1
5
)の情報が含まれる。このデータを用いて、 Program1
4に示したプログラムを実行

することにより Cox比例ノ、ザードモデル解析を行うことができる c その出力を Output1
0に示す。
program1
4
. タイのあるデータに NLMIXEDプロシジャによる比例ハザードモデルの当てはめ
proc n[mixed data=phdata d
;
巴n
d
;
f
=
l巴8
parms b巴t
;
f
in
:;
a0
‑t
;
do k=1to d
array t[
5
J t1
5;
I
array z[
i
+
k
‑l
5
J zl‑z5;
num巴rator=num巴rator柁 xp(b巴taむ [
]
);
I
d
;
denomi
nator=O;
巴n
I
=
i to 5
;
numerator=l;
do j
1
;
d
巴
n
o
m
i
n
a
t
or=d巴nomlnator+巴xp(betaキz[
jJ);
d=1
1
;
n
d
;
do k
=
i
+
1 to 5
巴
I
[
o
g
p
[ニ[og(numerator/d巴nominator本村);
i
n
; I
i
f t[
k
J三 tlm巴 then goto f
[ogp[
);
;
mod巴[ tim巴 日巴 n巴ra[(
d=d+1
(;(jに続く)
r
u
n
;

81

87.

O u t p l l t1 0 .タイのあるデータに NLMIXEDプロシジャを用いて比例ハザード・モテVレを当てはめた場合の出力 P a r a m e t e r b e t a E s t i m a t e ‑ 0 .9 6 9 8 S t a n d a r d E r r o r 1 .2295 D F 1 E 8 tV a l u e ‑ 0 . 7 9 P r> I t l 0 . 4 3 0 2 上述の P r o g r a m1 1と同じプログラム(ただし、データセット名を c x 3に変える必要あり)を用いて PHREG プロシジャ実行した結果を O u t p u t1 1(こ示すが、 j ニ述の NLMIXEDプロシジャを用いて得た結果と同じ解析結 果が得られるのが確認できる。というのも、 PHREG プロシジャにおけるデフォル卜のタイの取り扱いは B r e s l o wの近似法であり、この結果もそれを用いて計算したものとなっているからである。 O l l t p u t1 1.タイのあるデータを用いた PHREGプロシジャによる比例ハザードモデル解析の結果 D F 1 V a r i a b l e g r o u p P a r a m e t e r E s t i m a t e ‑ 0 .9 6 9 8 0 S t a n d a r d E r r o r 1 .2 2 9 4 7 C h i ‑ S q u a r e O .6 2 2 2 P r >C h i S q O .4302 H a z a r d R a t i o O .3 7 9 このようにデータにタイが存在しても、 B r e s l o wの近似を用いる場合については、多少プログラムが惚*に なるものの、 NLMIXEDプロシジャを mいて比例ハザードモデルによる解析が可能であることが示された G B r e s l o wの近似においては、]つのイベン卜発現時点において複数イベン卜が存在しても、それらのデータ x a c t を l レコードとしてまとめることが比較的容易であるため、このような計算が可能であった。一方、 E j 去においては、 lつのイベン卜発現時に k個の同 1日位のイベン卜が存在すれば k !通りの部分尤度を計算する 必要があり、これを上記の方法で行うことは非常に困難であると考えられる G なお、このように NLMIXEDプロシジャを用いて比例ハザードモデルによる解析を行うには、各行にリス クセットに含まれる症例の共変量の情報を全て含むようなデータを用意する必要がある。そのため、広例数 が多い場合や共変量の数が多い場合には、この方法を用いるのはあまり実用的とは考えられない。 7 . まとめ パラメトリックな生存時間解析においては、税率密度関数及び生存関数さえ定義すれば、 NLMIXED プロ シジャを用いて最尤推定が可能であることが示されたここれを用いることにより、 SASを用た絞雑な生存時 !日]解析もその計算内容を確認することができ、ブラック・ボックスでなくすることができる。 この方法を用いれば、 LIFEREGプロシジャがサポー卜していないような生存時間分布でも、その確率密度 開放及び生存関数をユーザーが定義さえできれば、 NLMIXEDプロシジャを用いて H t定を行うことができる。 i c c c w i s cc x p o n c n t i a Im o d c lなどのさらに筏雑なモデルにも応用可能である。 さらには、混合分布モデルや P Cox比例ノ、ザードモデルについても、事前のデータ加工を加えることによって、 NLMIXED プロシジャに よる推定が可能であることが示された。このことから、問題によっては、複雑な計算アルゴリズムの l f 1 .尤tH 定であっても、工夫をこらすことにより NLMIXEDプロシジャを用いて計算ができる可能性が示唆された G このように NLMIXEDプロシジャが生存時間解析において非常に強力な道具であり、更なる 1 [ :月jの可能性 が示 II~ された。 参考文献 C o l l e t,D .( 2 0 0 3 )M o d e l l i時 S u r v i v a lD a t ai nM e d i c a lR e s e r c h,2 n de d .,Chapmana n dH a ll / CRC SASO n l i n e D o cf o rSAS9 . 3a n dSASA n a l y t i cP r o d l l c t s1 2 . 1 ー 82

88.

NLMIXEDプロシジャ紹介 PK 解析及び生存時間解析への応用 0小 林 聡 晃 I 高 橋 行 雄 2 l 日本たばこ産業株式会社 医薬事業部 臨床開発部 2 B i o S t a t研究所株式会社 J n t r o d u c t i o nf o rNLMJXEDp r o c e d u r e PKa n a l y s i sands u r v i v a la n a l y s i s T o s h i a k iKobayashi1,YukioT a k a h a s h i2 1P h a n n a c c u t i c a lD i v i s i o n,C l i n i c a lDevelopmentDep. tJapanTobaccoI n c . 2B i o S t a tResearchCo.L td 要旨 ここ数年, ModelBasedDrugDevelopment (MBDD) が話題になっている c MBDDを実施するにあた って,非線形モデールを適切に使用することが求められている。非線形モデルの解析を SASで行う方法と して, NLINプロシジャや NLMIXEDプロシジャが候補として挙げられる。 これらの使用方法について SASのマニュアルに使用事例が記載されているが,適切に使用するにはよ り詳細な理解が必要となる。 そこで,本発表で、は非線形混合効果モデ、ルに着目し, NLMJXEDプロシジャのマニュアルに記載され ているデータを元に解析事例を 2つ紹介する。薬物愛)j態解析ーの事例としてスパースサンプリングデータ での解析を,生存時間解析の事例として頭痛発現時間データでの解析を扱う。 特に,生存時間解析の:事(7" j I は , SASの V9のマニュアルから新たに記載されたので ,I J D速モデ ルによ る解析で得られた推定結果について,従来の方法との比較と考察を行った。従来の方法として,生存時 間解析でパラメータの惟定を行う LIFEREG プロシジャが知られている c 被験者に変量効果を設定しな 1FEREG プロシジャの推定結果と NLMJXED プ口、ンジャの推定結果は一致すること いモデ、ルの場合, L を確認した。そして,被験者一に変量効果を設定した場合と設定していない場合で,推定結果を比較した ところ,変量効果を設定したモデ /レの方が,保守的な推定結果を得ることがわかった。 キーワード:薬物動態解析,スパースサンプリング,生存 1寺問解析,加速モテ'ル, NLMIXED 1.はじめに ここ数年, ModelBasedDrugDevelopment (MBDD) が話題になっている。 MBDDを実施するにあた って,非線形モテずルを適切に使用することが求められている。本論文では SASによる具体的な解析事例 を示し,臨床統計担当者と臨床薬用担当者との議論の士台となることを期待する。 83

89.

2 . 想定する事例 モテ。ルを設定し,制限付き尤度を DualQuasi‑Newton法によって数値計算を行い,パラメータ推定を行 っている。 2 .1.スパースサンプリングデータを用いた薬物動態解析 NLMIXEDプロシジャの Example51 .1のテオフィリンデータを使用する。このデータは NONMEMのサン プルデータとしても添付されており. NONMEMを使用することが多い薬物動態解析担当者と解析結果につ いて比較及び議論を行うことができる。 ・コンパートメントモテ、ルに従うと仮定した。 Examplc51 .1の テオフィリンの血中薬物濃度の推移は経口 l テオフィリンデータはプルスクリーンデータであるため,このデータに対してスパースサンプリングを実施 し,抽出したデータをJlれ、て PKパラメータ推定のシミュレーションを実施する。そして,スパースサンプ リングデータで被験者ごとの AUCの推定ができることを示し,プルスクリーンデータで、の推定i l 自:と比較する。 2 . 2 . 頭痛発現時間データを用いた生存時間解析 NLMIXEDプロシジャの Example6 3 . 5のデータを使用する。このデータは SASVer9より追加されたもので あり,生存時間解析で NLMIXEDを適用した例である G 比例ハザードモデルで、の解析で・は,推定結果として得られるハザードが臨床的に理解しにくいという問題 点、があった。そこで,より臨床的に耳r r 解しやすい指標として,薬剤を投与してから頭痛が改善するまでの H 寺 間(頭痛発現時間)に着目した。今回の例では a c c e l e r a t e df a i l u r et i m emodel (加速モデル)を用いて,頭千I f I 発 現時間における改善確率を被験者ごとに推定する。 8 4

90.

3 . スパースサンプリングデータを用いた薬物動態解析 3 .1.データの概略 1 2人の被験者で以下の測定ポイン卜に従って採血が行われた。 h r ) :0, 0.25, 0.5, 1, 2, 3, 5, 7, 9, 1 2, 24 測定ポイン卜 ( 以ドに 1名分のデータを抜粋する。 subject 被 験 者 番 号 subj巴cL tlme 測定ポイント, conc:lin.中薬物濃度, dos巴 vL 。 conc dose , 0.74 4 .0 2 79.6 0.25 2.84 4 .0 2 79.6 0.57 6 .5 7 4 .0 2 79.6 1 .1 2 10.50 4 .0 2 79.6 tlm巴 投与量, wt 体重 3 . 2 . モデ、ルの設定 テオフィリンの血中薬物濃度の推移は経口 J‑コンパートメントモデ、ノレに従うと仮定した。被験者間で、異な るパラメータとしてクリアランスと吸収速度定数を設定し,ランダム効果を導入した。クリアランスと吸収 速度定数は対数正規分布に従うと仮定した。 C:j J Jl.中薬物濃度, D:用 量 i 被験者, t :測定 H 寺間, b 変量効果, C J: クリアランス, k a 薬物吸収速度 定数, ke:薬物消失速度定数 Dk k r [ e x p( ‑t ) ‑ I ¥ t ) ] + e I ¥1 C .= --cJ~ , 叫 ( u , c ‑Cl‑ ( k ,一人)LV"'.l‑'¥ k . . . . c . , /V"'.l‑'¥‑k . . . . u . , J J 。 布 j a +bj1) C l i e 1 k a 2 二 叫 。 +bjJ 二 k e e 叩(払) 二 AUCl=D/ClI 3 . 3 . スパースサンプリング計画 被験者「に対する負担の軽減という観点から,薬物濃度測定用に採血を実施する凹数を減らすことが求めら れることがある。今回は, E xampJc5 J . Jのテオフィリンデータに対して,以下のようなサンプリング計画を 立てた c 表中の.は採血ポイントであることを示している。 !被験者の採血ポイン卜は 4点とする 吸収相と消失相では薬物濃度推移が被験者間で大きな差が無く, Cmax付近は共通と考え,交互パネ ルで、設定する 85

91.

3 . 4 . 解析フ。ログラム NLMIXEDプロシジャで,モデルを複数ステートメントに分けて記述できる。 b l,b2はランダム効果を示す パラメータである。血中薬物濃度の分布を modelステートメン卜で指定し,血中薬物濃度は正規分布に従う と指定した c ランダム効果 b l,b2の分布を randomステー卜メン卜で指定した。ここでは,分散共分散行列 の形で指定する。 proc nlmix巴ddata=lheoph parms betal=‑3.22 bota2=0.47 bcta3=‑2.45 s2bl=0.03 cbl2ニos2b2=0.4 52=0.5 ; l ) c l = exp(betal + b k a = exp(beta2 + b 2 ) ke = exp(beta3) pred = d05e*ke*ka*(exp(‑keキtime)‑exp(‑ka*time))/cl/(ka‑ke) model conc 、 normal( p r e d,5 2 ) ; [ 0, 0 , ] [s2b , lc bl2,s 2 b 2 ] ) random b l b2 、 normal( subject=5ubject run , 今回の解析に使用した詳細なプログラムを付録 lに示した。 3 .5 . AUCのモデル推定結果(フルスクリーンデータとスパースサンプリングデータ) フルスクリーンデータで得られたi¥UCを基準とした相対誤差を算出した。その結果,スパースサンプリン グデータの方で, AじCが最大 7弘程度大きく推定された。 s u b j e c t 相対誤差 % 7 . 1 2 4 . 3 3 C 2. 1 4 4 . 3 5 2 . 3 6 1 . 7 7 5 . 9 8 3 . 3 9 2 . 0 1 0 ドo 1 1 1 2 5. 4 86

92.

3 . 6 . 考察 スパースサンプリングデータのパラメータの推定値は,フルスクリーンデータの推定値とほぼ同じ結果が 得られたと考えられる。 4 . 生存時間解析 4 .1.データの概略 2傾類の頭痛鋲痛薬の効果を調べるために,臨床試験を実施すると仮定する。被験者を 2つの l t :tに割り付 け,それぞれの併で異なる頭痛鎮痛薬を投与する。薬剤l を投与してから頭痛が改善するまでの H 寺問(頭痛発 l 'で打ち切りとなった被験者もいる。 現 H年間)が各被験者で記録された。この試験では,試験途 r patient 出、者番号, group 群 , m ll1utes 頭痛発現時間, c e n s or =O 打ち切りなし, censor =1 打ち切りあ り p a t l e n t group I n l l 1u t e s 1 1 2 1 2 3 1 9 c e n s o r 。 。 。 ... 37 2 32 38 2 20 4 . 2 . モデルの設定 加速モデルに変最労J 宋ーを導入し,被験者ごとに頭痛発現 II:\.'I]~ を推定する c ハザード|到数はワイフ、ル分布に 従うと仮定した。ハザード関数,牛ー存分布関数 数 ハザード以j h ( t, s ) = y α ( α t )y‑l α=巴却(一(戸。+戸 lX+Z)} γ>0, G r o l l p1:X o Grollp2:X=I,z‑N(O, o ‑ ) ェ 生存分布 I~J 数 G (ゆ 確率密度関数 g ( t,s )=G ( t,s ) h ( t,s ) 打ち切りを考慮すると,対数尤度は以下のように表すことができる c 右 i Zlの第 1J頁は打ち切りが発生しな かった被験者データを,右 i 2 1の第一 2項は打ち切りが発生した被験者のデータを表している。 エ = 毘(リ)+乞 l ( t, s ) 1 0 1 0 g G (リ) n 全被験者数 8 7

93.
[beta]
この対数尤度を最大化するパラメータを数値計算で求める

G

4
.
3
. 角卒中斤フ。ログラム
頭痛発現1
1
寺聞が従うモデルを modc[ステートメントで指定し,ランダム効果の分布を randomステートメン
卜で指定した。
proc nlmixed data=headachc;
boundsgamma>0
;
lキ(
g
r
o
u
p
‑
2
)+z
;
l
i
n
p=bO・b
a
l
p
h
a=e
x
p
(ーl
i
n
p
)
;
a
l
p
h
a*Illi
n
u
t
e
s
)*
*
g
a
l
l
l
l
l
l
a
)
;
G̲t=c
x
p
(・(
g=gamma*alpha*((alpha*minutes)村 (gamma‑I)
)
*
G
̲
t
;

1=(censor
=O)*log(g)+(censor
=l
)吋o
g
(
G
̲
t
)
;
modclminutes‑g
e
n
e
r
a
l(
ll
)
;
r
a
n
d
o
l
l
lZ ‑ normal(0,
e
x
p
(
2キ l
o
g
s
i
g
)
)s
u
b
j
e
c
t
=
p
a
t
i
e
n
tout=EB;
p
r
e
d
i
c
tI
‑
G
̲
to
u
t
=
c
d
f
;
r
u
n
;

変量効果をモデルに組み込んだ影響を評価するため,変量効果を設定しないモデルと変量効果を設定した
モデルで,推定値を比較した。なお,変量効果を指定しない場合, NLMIEXDプロシジャと LIFREGプロシ
ジ.ャで得られる推定値と標準誤差は一致する。

1
.
4
. 結果
推定された変量効果を用し、て,データとして得られた頭痛発現時間での改善俄率と分布関数を被験者ごと
) 。実線及び・は投与 i
洋 lの被験者を示し,被線及び Oは投与群 2の被験者を表す。・及び
に求めた(図 1

Oは観察された頭痛発現 H
寺間を元に算Ii!された「頭痛が改善する催率」を表す。例えば,投与群 lで薬剤l
を
投与してから 1
1分で頭痛が改善した被験者の分布関数は(図 lの一番左側の分布関数)を見ると,この被験
1分で頭痛が改善する確率は 0.028とかなり低く,改善
者ーと同じような被験者がこの試験に参加した場合, 1

するまでに最大 25分程度かかると考えられる。
今回の解析に使用した詳細なプログラムを付録 2,こ示した。
図2

1~ll

10

10

邑

.

主

宅
2

Z

~

.

主 05

06

‑
‑

‑

"04

a

0
.

~

.

i 01
<

.

2

雪
5
E

凶

出

ロ2

口2

.
.‑。
•

00
1
5

田

2
1

:
J
j

1
0

1
5

。

8
2
c
Mm 凶白河内i!:a dilc~e P
.e
l
t
e
f

Mtnu!さ$10H~ lII dilChil ~"bef

88

0

‑‑‑oo
‑‑oc

U

、

8

00

邑
u

•

︒
.
︒
︒
︒︒

ロ8

ロ8

•

‑
‑
•‑
。
•

25

:
J
j

。

94.

変量効果を設定しないモデルと変量効果を設定したモデルで,推定値を比較した(図 2 ) 。変最効果を設 定しないモデルの推定値をダイヤモンド型の図形で示すc 塗りつぶしたダイヤモンド型の図形は,投与群 l の推定値を表し,白抜きのダイヤモンド型の図形は,投与群 2の推定値を表す。頭痛発現時聞が長くなるほ ど,変量効果を設定したモテずルの方が,変量効果を設定していないモデルよりも保守的な推定を行っている lが 0であるとしづ仮説検定結果に着目す ことがわかった。そして,薬剤問での効果の差を表すパラメータ b る。変量効果を導入すると, p値が 0.0185から 0.0398となっていることから,有意性が弱くなっているこ とがわかった。 5 . まとめ 被験者ごとの推定により,該当する被験者と似たような背景情報を持つ被験者に対する薬剤効果を事前に 予測できるようになる。 今回紹介した事例で、はハザード関数がワイブ、ル分布に従うと設定したが,設定するモデ、ルをロジスティッ ク分布やポアソン分布などにすることで,他の分布でも同様の解析を実施できる可能性がある。また,同一 被験者で繰り返し発生する事象(有害事象など)の発現データから,被験者ごとの事象発生確率を推定した い場合にも適用できる可能性がある。さらに,被験者背景やベースライン情報等をモデルに含めて,変量効 果の大きさを調べることで,薬剤効果に影響を与える要因を探ることが期待できる。 ただし,データに対して推定するパラメータの数が多すぎると,数値計算が収束しない場合や推定された パラメータの分散が極端に大きくなることがあることに注意する必要がある。 89

95.

p r e d= d o s e * k e * k日* ( e x p ( ‑ k e * t i m e ) ‑ e x p ( ‑ k a * t i m e ) ) / c 1 1( k a ‑ k e ); 付録 l スパースサンプリングデータを用いた 薬物動態解析のプログラム p r o cs o r td a t a = t h c o p h ; b ys u b j e c tt i m e ; r u n ; d a t at h c o p h 0 2; s e tt h e o p h; . 1 ) ; t i m e l = r o l l n d ( t i m e,0 i ft i m e l > = O .5a n dt i m e l < 0 . 9t h e n . 5 ; L i m e 20 i ft i m c l > = 0 . 9a n dt i m c l < l .5t h c nt i m c 2 = 1 ; > = 1 .5a n c lti m e1 < 3 .0t h e nti m e 2 = 2 ; i fti m e1 i ft i m e l > = 3 . 0B n dt i m e l < 6 . 0t h e nt i m e 2 = 4 ; i ft i m el >= 6 . 0a n dt i m e l < I1 .0t h e nt i m e 2 = 7 ; i ft i m c l > = 1 1 . 0a n dt i m c l < 2 3 . 0t h c n ti m c 2 = 1 2 ; i ft i m e l > = 2 3 . 0a n dt i m e l < 2 5 . 0t h e n L i m e 2 = 2 4 ; r u n ; m o d c 1c o n c、 n o r m a 1 ( p r c d,s 2 ) ; r a n d o mb lb 2、 n o r m a 1( [ 0,o J,[ s 2 b l,c b l 2,s 2 b 2 J ) s u b j e c L = s u b j e c L ; p r e d i c tp r e do u t = o u t & i . p r c d i c tA U Co u t = a u c & i .; p r e d i c tb lo u t = b l & i .; = b 2 & i .; p r e d i c tb 201lt p r e d i c Lc 1o u t = c 1 & i . p r e d i c tk ao u t = k a & i .; p r c d i c tk eo u t = k e & i .; t i t 1 e& T i t 1 e . ; r u n, 1 * 2ブロックに分割する。 * 1 世m e n d ; 1 * 1プロック S U s ] E C T =1t o6採用ポイン卜 0 . 5,2 ,7 ,1 2h * 1 1 * 2ブロック Sl Ls ] E C T = 7t o1 2採用ポイン卜 覧nlmixed(t h e o p h,'全実視J I データに基づく推定 ,,1 ) AUC=Dose/cl; 二 %nlmixed(sparse,' S p a r s eデータに基づく惟定 ,, 2 ) 1 ,2 ,4 ,2 4h * 1 d a t ad a t a l ; s c tt h c o p h 0 2 ; 6 ; i fS U s ] E C T > = 1a n dS U B ] E C T< i fL i m e 2 = 0 . 5o rt i m e 2 = 2o r time2=70r t i m c 2 = 1 2 ; r u n, 二 d a t ad a L a 2 ; s c tt h c o p h 0 2 ; i fS U s ] E CT > 二 7a n dS U s ] E C T = < 1 2 ; i ft i m e 2 = 1o rt i m e 2 = 2o r time2=40r t i m c 2 = 2 4 ; r u n, d a t as p a rぉe ; 日t a ld a t a 2 ; s c Ld r u n, 世m a c r on 1 m i x e d( D a L a,T it 1 e,i ) ; p r o cn l m i x e dd a t a = & D a L a . p a r m sb c t a lニー 3 . 2 2b c t a 2 = 0 . 4 7b e t a 3 2 . 4 5 s 2 b l = 0 . 0 3c b 1 2 = 0s 2 b 2 = 0 . 4s 2 = 0 . 5 ; c l =e x p ( b e t a l+b l ) ; 2 ); k a =c x p( b e L a 2 +b kC'ご c x p( b c t a 3 ); 二 世m a c r op a r m s ( d a t a ) ; 覧d oi = 1弘L o2 ; p r o cs o r td a t a = & d a t B .& i .; b ys u b j e cL;r u n ; d a t a& d a t a . & i . ; s e t& d a t a .& i .; i ff i r s t .s u b j e c t ; b ys u b j e c L ; & d a t a . = p r c d ; k e e ps u b j c c td o s c& d a t a r u n ; 日 ' b e n d ; 百m e n d ; 見>parms(AUC) 弘>parms(bl) 世parms(b2) 弘>parms(c1) 目>parms(ka) 弘>parms(kc) 1 *実測データに基づく推定 * 1 d a t ap a r a m l ; 巴); m e r g eA U C lb l lb 2 1c 1 1k a lk b ys u b j c c t ; 90

96.

run, I*sparseサンプリング * 1 data param2; merge AUC2 b12 b22 c12 ka2 k e 2 ; b y subject; run, data t i m e ; d oi i = 1t o4 8 ; d oi =1t o1 2 ; subject i ; t i m e = O .5 * ii ; output; e n d ; c n d ; keep subject t i m e ; run; proc sort data=time;by subject time;run; proc sort data=paraml;by subject;run; data e s t1; length cond $100; merge paraml time; b y subject; pred = dose*ke*ka*(exp(‑kc*time)‑exp(‑ka*time))/c 1 1(ka‑ke); 1 * '全データを使用した推定 ,* 1 x=auc, run, data e s t 2 ; merge param2 timl ' ; b y subject; pred = dose*ke*ka*(exp(‑ke*time)‑exp(‑ka*timc))/c 1 1(ka‑ke); / 〆 Sparseデータを使用した挽定 ,* 1 data c s t ; s e te s t ; i ff i r s t .subject; b y subject t i m e ; percent̲diff=y/x*100‑100; run, 1 *推移データをグラフ化する 実測値、全デー タを使用した推定、 Sparscデータを使用した推 1 定* 二 G 再macrographl( D a t H,VAR,Title); goptions rcsct=al1; symbol1 interpol=join value=none; axisl label=( " h o u r " ) ; axis2 l a b c l ( a n g lc 90 "Conccntrati o n " ); proc gplot data=&Dat日 plot &VAR.*time=subject/haxis二日 x i s l vaxis=axis2; title &Titlc.; 1 * by SUBJECT;*I run, 二 二 qUIt ; 覧m end; 見g raphl(theoph,conc,'全実! i I l J データ, ) 見g raphl( e s t1 ,pred,'全実視J Iデータに基づく推 定 ,) %graphl( e s t 2,pn~d , 'Sparseデータに基づく推 定 ,) 付 録 2 生存時間解析のプログラム data headachc; i n p u t minutes group censor申 @ ; p atJent = n ー; datalines; 1 1 10 1 2 10 1 9 10 1 9 10 1 9 10 1 9 10 2 1 10 20 10 2 1 10 2 1 10 20 10 2 1 10 2 0 10 2 1 10 25 10 2 7 10 3 0 10 2 1 1 12 4 11 1 4 20 1 6 20 1 6 2 02 1 2 02 1 20 2 3 2 02 3 2 02 3 2 02 320 25 2 12 3 2 02 4 2 02 420 y二 aUC, run, proc sort data=cstl;by subject time;run; proc sort d a t a est2;by subject time;run; data e s t ; merge e s t l est2; b y subject t i m e ; run, proc sort data=est;by subject time;run; l * fu1 1d at a( x )と sparse data( y )の 比 較 相 対 誤差を評価する伽/ 二 91

97.

kecp = pred minutes group) cdf(where = (group=2) ref 1a me = ( p red=pcdf2 子= 日 r r 川 T mi山 nutes keep = pred minutes group); drop group; run, 26 2 132 2 130 2 130 2 0 3 2 2 120 2 1 od只 output Paramct巴rEstimates=est; proc nlmixed data=hcadachc; bounds gamma >0 ; ; linp = bO ‑ b lキ (group‑2) + z alpha = exp(‑linp); G t= exp(‑(alpha*minutes)料 gamma); proc sgplot data=prcd noautolegend; l a b e l minutesl='Minutes to Headache R e li ef ' pcdf I ='Estim臼 ted Patient‑specific C D F '; series x=timc y=pr巴d I / group=patlcnt lineattrs=(pattern二 s o li d color=black); y二 prcd2 / ( ' senes x=t1m group=patlent !incattrs=(pattern=dash color二 b!ack); scatter x=minuteぉ 1y=pcdfl / g= 日amma句 lphaキ( ( a1 p h a * r n inutcs)キ キ ( 日 amma‑I))刈 t ; I 1 = (censor=O)キ l o g ( g )+ o g( G ̲ t ); ( c ( ' n s o r = l )ホl mod巴1minut目 、 general( 11 ) ; random z 、 normal( 0,exp(2キ logsig)) s ; subjectニpatient out=E predict I‑G̲t out c d [ ; run, proc transpose data=est(keep=estimate) out=trest(rename=(coll=gamma col2=bO coI3=bl)); run, 二 markerattrs=(symbol=CircleFilled size二 9 ); scatter x二 minutes2 y=pcdf2 / markerattrs=(symbo!=Circ!e size=9); run, /キ投与群ごとの推定本/ proc nlmixed data=headache; bounds g a m r n a >0 ; l i n p = bO ‑b lキ ( g r o u p ‑ 2 ); a!pha 二 exp(‑!inp); G̲t = exp(‑(a!ph日本日l ilJu t e s )キ*gamma); 1 cata p red; merge eb(keep=estimate) headache(keep patient group); array p p { 2 }p r e d l ‑ p r ( ' d 2 ; i f n = 1then set trest(keep=gamm日 bO b l ); do time二 1 1t o3 2 ; linp = bO ‑ b Iキ (group‑2) + cstimate; pp{group} = I‑cxp(ー ( e x p ( ‑ Ii n p )キt i m e )キ E日m m a ); 日y mboli d 二 patient+I; output; e n d ; keep predl pred2 time p日tient; 二 g= gamma句 I p h,内 ((alpha*minutcs)キキ ( g a m m a ‑ l ))キG 0日( g )+ I I=( c e n s o r = O )キ 1 (censor 1)*log(G̲t); m o d e l minutes 、 gcneral( 11 ); predict I ‑ G ̲ t outニ c c l f O ; run, / キ witha n c l without random effect scatter p l o tキ/ data prcd2; merge 三 rUI l , d日t a prcd; mcrge pred ) cdf(where 二 (group=1 renamc (prcd=pcdfI minutcs=minutesl) 92

98.

cdf(where = ( g r o u p = l ) rename = (pred=pcdfl minutes=minutesl) keep = pred minutes g r o u p ) cdf( w h e r e =( g r o u p = 2 ) rename = (pred=pcdf2 minutes=minutes2) keep = pred minutes g r o u p ) cdfO(山 ere = ( g r o u p = l ) rename = (pred=predl minutes=minutesl) predminutes g r o u p ) keep cdfO(where = ( g r o u p = 2 ) rename = (pred=pred2 minutes=minutes2) keep = pred minutes group); drop group; run, ご proc sgplot data=pred2 noautolegend; l a b e l minutesl='Minutes t o Headache ' Relief predl = 'Estimated Patient‑specific C D F '; scatter x=minutesl y=predl / markerattrs=(symbol=DiamondFilled size=9); ごm inutes2 y=pred2 / scatter x m日rkerattrs=(symbol=Diamond size=9); scatter xminutesl y=pcdfl / 二 し ) ︐ .Qd ム 7u1 ρU v ρ 一 1よ η 4 0 よ = 一 ‑ ρ ν T I 5 r ・ I ︐ し d// 戸 e = 1 1 ド η4r 1ri'b ︐ dm 戸 し ふ p a ecvd 1よ n s c=fk r1 4y = cd 1 /t U し v =よ s t et hugu 'nUbu r mne cd し vdl'k smr ︑ =a =x m r r +Lρ 笥 +し+し 'υAcd 令 し au a r ρUvρ r a m size=9); r u n ; 93

100.

マクロ経済指標を使った重回帰分析による倒産予測 長井章夫 りコーリース株式会社 審査部 D e f a u l tp r e d i c t i o nbyM u l t i p l eR e g r e s s i o nu s i n gm a c r o e c o n o m i ci n d i c a t o r s A k i oNagai Email:a n a g a i @r l e . r i c o h . c o . j p R i c o hLea s eC o ., L td . C r e d i tE v a l u a t i o nDepartment, 要旨 りース会社ではりーマンショックの様な大規模倒産を事前に予知できれば、与信を絞って損失を抑 制できる。マクロ経済指標で倒産推移に先行する指標を用いて重回帰モデ〉レで倒産予測がで、きるか 検討した。その結果よい精度が得られたので報告する。 キーワード.倒産予測、マクロ経済指係、重回帰モデ ル 1.先行マクロ経済指標の選択 リース会社ではリーマンショックの様な大規模な倒産の予兆を察知できれば、与信先を絞ること で損失を抑制できる。過去のマクロ経済指標と倒産数の推移を比較して先行性がある指標を見出 し、これらで大規模倒産を予測できるか検討する。 J、企業庁のマクロ経済指標を用い 当社のリース先は中小企業が多いことから、先行研究として中 I た重回帰モデルがある。有意で、あった指標と当社の解約との推移の比較を行った。 先行指標と解約推移 Ei 空:竺三二以江 一一解約 4 一平均株価 ・ 一 都市地価 一 一 ‑ . 竺 ち 国 竺f ー←銀行貸出金制 ‑DNFDN hDN‑DN ‑D‑FDN hD‑FDN FDDFDN hD口↑口 N F口四DDN 9 7 h口四DDN FD∞ロロ判︑ ‑J h口∞ロロ N E h g N 一切 同月 ‑DhDDN4 ‑口田口口問#﹄ T hD田口口 N 戸口町DDN h口田口口問 F 口寸口口 N h口寸口口 N F 口門口口 N h口門口口 N ↑口NDDN ト ロ NDDN FD‑DDN hD‑DDN 図I

101.

リース解約社数と銀行貸出金串l 2 i1 .9 I1 .8 説記寝袋 1 . 7 塁 詰 一←解約者数 1 .6 1 .5召 世 一←銀行貸出金刺 1 .4 1 .3 11 .2 1 .1 語 MD‑MD 一﹃ 一﹃ MD↓MD‑ MD↓‑D 一﹃ MD4‑D‑ MD‑DD MD‑DD↓ MDD回口一﹃ MDD由D4 ∞ MDD∞口一﹃ MDD叫口一﹃ MDD D‑ MDD叫D4 MDD∞口一﹃ MDD印口一﹃ MComo‑ MDD印D4 MDD品口一﹃ MDD品D4 MDDω口一﹃ MDDωD‑ MDDMD4 MDDMD叫 図2 何れの指標も解約推移に先行しているが、 ~ruT貸出金利と解約推移のトレンドは相似してその先 行性が顕著である。 │ 哩 rammmm叫 匂 周 囲I r a t e rate ‑一一一一 r a t e def def r a t e ‑一一一一 def def リース解約推移と銀行貸出金利推移のクロスキ目関 0 . 8 ‑ 一 一 0 . 6 0.4 相 官0.2 数 。 ‑ 0 . 2 ‑ 0 . 4 ‑ 0 . 6 0 ζ 〕 10 15 ラグ ( 4半期) 25 30 35 図3 両推移のクロス相関では 3四半期にピークがあり貸出金利は 1年の先行性がある。解約推移を 1 年前倒しすると推移の一致が確認できる。 98

102.

リ ス解約社数 (1年前倒)と銀行貸出金利 2 (一一一単渥叶こ説記立雄 1 .9 1 .8~ ¥ R 1 . 7 当 吋守 1 .64 t . I 島 解 約 1年前倒 1 .5司 1. 4f I i I ( 一←銀行貸出金利 1 . 3 : = 1 .2 司 1 . 1 トd トd トd ト . , ) 1 " > . ) 1 " > . ) 1">.)トd トd トd トd トd ト . , ) 1 " > . ) 1 " > . ) 1">.)ト.,) 1 " > . ) 1 " > . ) 1 " > . ) N N c コ Cコ Cコ Cコ Cコ Cコ Cコ Cコ Cコ Cコ Cコ Cコ o 0 0 0 0 0 0 0 0 0 o 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ~ー喰ーー毛ー-ー ト . , ) N W W . J : > , A c . n c . n σヲ σヲ 、 J 、 . . J oooo c.oc.o c コ Cコ ー ー ・ ‑ '" '" Cコ Cコ Cコ Cコ Cコ Cコ Cコ Cコ Cコ Cコ Cコ Cコ Cコ Cコ Cコ Cコ Cコ Cコ Cコ Cコ c コ Cコ ー叫ー、"‑、 ー、 ー、 ー、"‑叫ー、 ー 晶 、 "‑、 ー、 J J J J J J 4半期時系列 図4 解約は延滞が 6ヶ月ほど続いたあと計上されるので、本来の石断定は半年前(先行指標より半年後) と考えられる。米国の事例(米裁判所破産推移)では破産推移と 5年スワップ金利の推移を見る と金利は 2年先行していることがわかる。金利は業容拡大期には資金調達で上昇し、停滞が見込 まれると調達を抑制するので降下する。大幅な金利上昇が頂点に達し下降すると暫くして倒産が 増える解釈は自然である。 米国破産件数を2年前倒した結果 QU 1600 ∞ 主 語 m 詰 B∞ m 6∞ 400 200 皿 作 叫 制 作DDN 皿 作 崎 山 口 DN R ‑ 叫制作DDN R F 叫 刑 囚D O N ‑ ↑ 99 80N 一 図5 Eh 叶 E↑ 叶8 0N 一 Eh 叶寸 DDN EF 社寸 DDN Eh 社門 DDN EF 叶門 DDN R h 叫 刑 判DDN Rh 叶 ‑DDN Cコ Cコ N R‑叶 NOON Cコ RF 叶 FDDN m : 叶 Rh 叶 DDDN 0 一品川相叶旧日米 ''aUFhdA y 凶 q u n 4 1 1 n u 守 ∞一 一 1 4 1200 ‑ 破産 ( 2年前倒) 「← 5年金手J I

103.

2 . 重回帰モデルによる倒産予測 先行指標から 1年遅行して解約が推移しているので、解約を 1年前倒して重回帰モデルを適用す る。リーマンショック前の解約と先行指標を司1I練データとして重回帰モデルを作り、このモデル でリーマンショックのピークが予測できるか検証した。予測の精度は訓練の精度と同程度であっ た。説明変営汝の先行指標は l年先行しているので下図の解約推移は 1年後の予想である。 4半期時系列の解約件数推移 モデル化│予測 巨杢回 議サ干立時宿 同口一ω口 一 ﹃ ﹃ M口 一 ωD‑ MD↓MDJ ﹃ MD‑MD‑ MD↓↓ DJ ﹃‑ MO‑‑D‑ MD‑DD一﹃ 一 MD DD‑ MDDUDJ 一 s m w6 MDODO‑ MDD田 MDD吋口一﹃同円 M g田口‑山叶函 MDD吋D‑ 年 同DD白 口 一 ﹃ ﹃ MDD白D‑ MDD印D‑ MDD印DJ MDD品︒一﹃ MDD品︒‑ MDDUD‑ MDDUD吋 MDDMO吋 MDDMD‑ 表 1 重回帰分析の回帰係数と棄却確率 変数 推定値 標準誤差 切片項 6 . 1 8 1 4 0 . 7 2 8 2 7 0 . 0 1 7 5 4 ‑ 0 . 0 0 0 3 8 ‑ 6 . 5 E‑ D6 6 . 7E‑ D6 0 . 8 5 6 8 6 0 . 3 4 5 2 4 0 . 0 0 6 4 4 0 . 0 0 0 2 3 7 2 . 2 7 E‑ D6 5 . 3 6 E ‑ 0 6 貸出金利 都市地価 日経 2 2 5 家計可処分所得 現預金 P r t値 備考 7 . 2 1 〈∞0 1 2 . 1 1 0 . 0 4 8 4 2 . 7 2 0 . 0 1 3 5 1 . 5 9 0 . 1 2 8 4 ‑ 2 . 8 6 0 . 0 0 9 9 (季節変動分) 一1 . 1 9 0 . 2 4 8 5 注)家計可処分所得:当相先手約手炉しきの季節変動に合わせるため採用した。 現預金 :中小企業庁の重回帰モデルで採用していたので投入した(棄却確率高し、) 3 . まとめ 大規模倒産の予兆としては、金利の大幅な上昇から下降に転じる時点と考えられる。損失を抑制 するには、 1年後に予想される倒産規模を重回帰モデルで予測して、与信を絞る範囲を低格付先 から広げていく方法が考えられる。しかし本分析は取得できたリーマンショック近傍のデータに ついて行ったもので、あり、一般性の検討には今後の検討も含め過去や外国の事象での実証が必要 と考える。 参考文献 1 ) 中小企業庁編 「中小企業白書 2 002年版」 2 ) 大橋亨 企業倒産について重回帰モデルの構築 3 ) BloomBerg BanbTll( 米裁判所破産推移) 100

104.

1 1 1 ユーザー蝕ホ… ……〓 I p . m ] 共同 DBにおける欠損値解析法の利用 今井健太郎 日本リスク・データ・パンク株式会社データベース統括部 M i s s i n gO a t aA n a l y s i sw i t h O a t a b a s eC o n s o r t i u m I m a iKentaro DatabaseManagementDepa吋ment TheRiskDataBanko fJapan,L i m i t e d 1 / 26 S~'iíì"=ザー総会一向山…… ~I 要旨: 会員がデータを持ち寄る共同型 DBにおいて、全会員が同じ項目を収 集しているわけではなく、最大公約的な DBとなる。会員が独自で集め I値解析の 1つである多重 ている項目を利用する際には、本報告の欠混J 代入法が有効である。 i s s i n gd a t a,p r o cmi, キーワード欠損解析,欠測解析,多重代入法, m p r o cm i a n a l y z e,m u l t i p l ei m p u t a t i o n 2/26 1 0 1

105.

組Sユーザー総会加~~…叩 ロ弊社の業務内容 m 日 ・ ・ IAf=r II8 r rI IC r rI 全国 65の金融機関が 参加するデタベース・ コンソーシアム : R D B J ・事業法人データ ・個人事業者デタ ・債権回収データ ‑オペレーショナルリスクデータ データを利用したモデルの構築・提供 l ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー 3 / lo │ ωユ ー ザ ー 蝕 続 的 … 一 均 シ 7 ~I ロ信用スコアリング・モデルとは 財務の状況から、将来のデフォルト(債務不雇行)の発生を予測するモデル 融資貸出審査、引当金の計算などを定量的行うことが可能 o g i s t i cモデルを利用。将来のデフォルト率 pを財務指標xで回帰 弊社では l l o g ( p / ( l ‑ p ; ) ) = bo +bJ. xJ; + b2ホX2 i ,pんlog仰 d dロt o=町 口町 models t a t u s = x lx 2 ; ! i !r u n ; ! 債務者間の序列を知りたい 格付けモデル 興味・債務者!と債務者j のどちらが優良か? 債務者別にデフォルト率を知りたい ー デフ才ノル介事選針ぞデノル 興 味 債 務 者 lの 1年以内のデフォルト確率 I ま? 4 / 2 6 1 0 2

106.

.ヰーや給問…~リーン… g ロ共同データベースの構造 参加会員によって DB構造が異なるため、全会員が共通して保持する項目を 使う方が好ましい("最大公約数"的なデータベース)。 経営者の 総資産│中間配当│ 売上高│自己資本 i 車種 A行 I A v a i l a b l eIA v a i l a b l eIA v a i l a b l eIA v a i l a b l eI 日 行 I C行 I Z 社 I A v a l i a b l eIA v a i l a b l eIA v a i l a b l eI NA NA I I A v a i l a b l e A v a i l a b l eI・ .I I A v a l i a b l eIA v a l i a b l eIA v a i l a b l eIA v a i l a b l eI NA A v a i l a b l eIA v a i l a b l eIA v a i l a b l eI NA NA 創業年数 I I NA NA NA 使える変数が限定されても、大規模データを使うメリットの方が大きい 5 / 26 臥 [Sユ ー ザ ー 伶 加 一 一 日 ソ ー … ロ会員ニーズ g 「自行独自で集めている情報を活かすことで、より精度の高いモデルを構築で きないか ?J 分析データの構造 共通項目 B行データ 日行データでだけでは、データ件数 が乏しい 車種 田園・ 共同データでは、「車種」が集計対 象外のため欠損値 (Miss)になって いる ーーーーー「 共通デタ 有効な情報を持つ少数のデータ セット、一部情報が欠落している 大量デー夕、という構造 M i s s │ ※類似ケース ・事業法人の連絡,単体 ・個人事業者の B / S, P / L I______~ 103 6/26

107.

ωユザー総会加… 口今回の分析デザイン 分析データ観測値と欠損値の関係が類似した個人事業者の財務データを 利用 明し富国聞圃圏E 個人事業者は貸借対照表の作成は任意 RDBデータベースでは約 50%が未作成 附有り自調・ [ ; E s j : ] P/L項目と B/S項目を使って信用スコアリングモデルを構築する ‑応答変数決算月から 1年以内のデフォルト有無 テ'フォルト発生 ( s t a t u s = O )、正常な債務先 ( s t a t u s = l ) ‑説明変数 P/L財務項目から 4指標、 B/5項目から 1指標 P / Lの例売上高営業利益率、売上高支払手j I子率、・.. 出実際に僅用した項目 l 立 ノ ウハウのため非公開 B/5の例:自己資本比率 7/26 I ι~ユマザー蝕対……。一… 二 川 ヘ I 2引 口欠損値の発生メカニズム . 1 MCAR(MissingCompleteAtRandom) 欠損は完全にランダムに発生 日 . MAR( MissingAtRandom) 欠損は観測されたデータのみに依存する 自己資本比率の欠損になりやすさは売上高規模に依存する (事業規模が小さい先 l 立B / Sを作成しない) 1. 1NMAR(Non‑MAR,non‑ignorable) 欠損は欠損値に依存する 自己資本比率の欠損になりやすさは自己資本比率に依存する / Sを作成しない) (自己資本比率が悪い先は B 8/26 104

108.

│ Sm ユーザー触す方的均一 将 ‑ 火 山 v 川 ρ‑川 . ~ 目 白 ロ欠損値への対処方法の代表例 A )CompleteCaseAnalsys,L i s t w i s eD e l e t i o n, 欠損データを削除して分析。慣用的な手法 削除で N数が減ってしまう。 MCARの仮定が必要。 B )S i n g l eImputation(単一値を代入) 欠損値に何らかの値(例。平均値)を代入して分析 c )MultipleImputation(多重代入) M Iプロシ ジャ, M I A N A L Y Z Eプロシージャ 欠損値に複数の異なる値を代入した複数データで分析 他:マッチング, FIML 9/26 1 1 * ' ザプ告会加問……… 201D ロMIとMIANALYZEプロシジャを用いた分析手順の概要 1 . MIにより代入された複数のデータセットを作成 x lについて、 p r o cmid o t o = m i s s d o t oout=impdotロ n i m p u t e = 5 ; I 欠損がある変数 b monotoner e g ( b x l = p x 6px7px8px9pxl0pxll);E 欠損発生のモデルを指定 V口r px6px7px8px9pxl0pxllb x l ; nimputeは発生させるデータ r u n ; セット数 2 .データセット毎に分析の実行 p r o cl o g i s t i cdロto=impdotoo u t = m i o u tc o v o u t ; models t o t u s = p x lpx2px3px4b x l ; by̲ i m p u t o t i o n ̲ ; r u n ; 発生させたデ タセットごとに 回帰結果が mloutに出力される 3 . MIANALYZEで複数の結果を 1つに統合 p r o cm i o n o l y z edoto=mioutm u l t ; ν o ri n t e r c e p tpxlpx2px3px4b x l ; r u n ; 次項以降に詳細 mloutの結果を統合することで、 1つの推計結果を得る三とがで きる 1 0 / 2 6 105

109.
[beta]
l 鮎止ザー総会対町付JO~&." リー…

~I

S
t
e
p
O
.B
/
S変数と P
/
L変数の関係を調査
観測可能データで、欠損指標 b
x
lを重回帰
procregdロ
t
ロ=missdロt
ロ
;
modelbxl=pxOl‑ px20/selection=stepwise;
run;

パ
う
盗
品

変故

標準誤差

J
y
平p
e
方和
1
1

Ff
直 P
r)F

I
n
t
e
r
c
e
p
l ‑
3
1
6
.
5
0
6
1
3
1
8
.
7
1
3
8
7 6
2
9
3
6
6
1
4
2 2
8
5
.
8
6 <
.
0
0
0
1
p
x
O
I
ー0
.
0
0
0
0
3
0
8
4 0
.
0
0
0
0
0
3
9
8 1
3
2
2
8
9
5
3
1 6
0
.
0
9 <
.
0
0
0
1
9
3
1
9
4
3
2
4
.
1
3 0
.
0
3
3
7
D
x
0
4
0
.
0
0
0
7
3
2
4
3 0
.
0
0
0
3
8
5
1
6
p
x
0
6
3
1
6
0
8 3
7
7.
3
1
8
5
1 1
S
4
43
0
4
4
5
4
8 7
4
6
8
.
6
0 <
.
0
0
0
1
p
:
.
:
0
1
1
7 2
4
3
1
9
4
7
0
0 1
1
0
.
4
6 <
.
0
0
0
1
5
9
5
.
5
6
6
3
7
5
6
.
6
6S
p
x
0
8
‑
5
7
7.
2
3
0
8
8
5
6
.
4
5
7
2
8 2
3
0
1
4
5
3
6
6 1
0
4
.
5
3 <
.
0
0
0
1
.
s2496 1791187507 813.58 <.0001
p
x
0
9
6
1
7
8
.
8
4
7
5
5 2
1s
p
x
l
0
‑
1
7
.
3
3
4
6
6
1
.5
3
4
2
3 2
8
1
0
5
5
9
0
5 1
2
7.
6
S <
.
0
0
0
1
p
x
l
l
6
3
.
1
1
8
3
1
1
5
0
0
6
1
7
4
8 6
8
.
1
6 <
.
0
0
0
1
.0
3
7
3
2
5
21
p
x
1
2
‑
5
21
.3
3
2
4
0
6
3
.
1
1
3
1
3 1
5
0
6
0
1
4
4
6 6
8
.
4
1 <
.
0
0
0
1
p
x
1
3
0
.
5
0
5
9
0
0
.
2
7
7
4
6
7
3
1
9
5
3
4
3.310.0683
p
x
1
5
4
.
0
5 0
.
0
4
4
1
0
.
0
0
4
0
4
0
.
0
0
2
0
1
8
9
2
6
5
6
1
p
x
1
9
‑
0
.
0
0
1
1
1 0
.
0
0
0
3
1
3
4
2
2
.
0
3 0
.
0
0
0
5
2
6
4
8
5
3
6
2 1

プロシージャの欠損
bxl推計のために変数を 5個 (px05‑pxlO)採用して、 MI
値推計モデルに利用
1
1/26

P
1
I
I
B
J

~,:J.:Jユーザー総会 7カデ初予ヲJロトωJュー泊シセッション

S
t
e
p1
.P
r
o
cMI
{置務者番号

ステータス

BS有 無

px6

p
x
7

p
x
8

p
x
9

有り

0
.
0
2
0
.
0
7
0
.
0
1

0
.
0
6
0
.
3
8
0
.
3
4

6
.
9
4
1
2
.
0
1
2
.
4
3

1
3
.
1
5 i 16.
40
4
.
7
31

1
2

。
。

ヨ

1

無し
無し

: bxl

1
5
.
1
0:

l
m

作成の場合指
標は欠損

x
l
0
)
;
monotoner
e
g
(
b
x
l=px6px7px8px9p
Vロ
rpx6px7px8px9pxl0b
x
l
;
r
u
n
;
̲
i
m
p
u
t
a
t
i
o
o
̲慣輯者番号 ステータス
1
1
1
2
2
2
3

ヨ
ヨ

1
2
3
1

z
ヨ
1
2
3

px6

p
x
7

px8

px9

有L

0
.
0
2
0
.
0
7
0
.
0
1
0
.
0
2
0
.
0
7
0
.
0
1
0
.
0
2
0
.
0
7
0
.
0
1

寸。

6
.
9
4
1
2
.
0
1
43
2.
6
.
9
4
1
2
.
0
1
2.
43
6
.
9
4
1
2
.
0
1
2
.
4
3

1
3
.
1
5
16.
4
0 損値が穴埋め
4
.
7
31 5
4
.
7
4 されるが、値
15.10; 4
4
.
7
8 i
まimputation
1
3
.
1
51 1
6
.4Qi
毎に異なる
4.
73 1 1
4
.
5
5
15.10! 51
.02
1
3
.
1
5 I 16.
40
4
.
5
7
4
.
7
3
1
5
.
1
01 2
5
.
5
0
1
2
/
2
6

1
。
。
1

B/5変数の欠

B
S
有掴

。
。
1
。
。

無し
無し
有り
無し
無し
有ザ
無し
無し

0
.
0
6
38
0
.
3
4
0
.
0
6
0
.
3
8
0
.
3
4
0
.
0
6
0
.
3
8
.
.
3
4

。

1
0
6

! bxl

110.

m 側ユーザー総会一一…… 5 t e p 2 .P r o cL o g i s t i c p r o cJ o g i s t i cdロt ロ=impd ロt ロo ut=mioutc o v o u t ; modeJs tロt u s ( e v e n t = ' l ' )= p x l px2px3px4b x l ; by̲imputロt i o n ̲ ; ru~ Iデフォルト ( s t a t u s = O ) o r非デフオ ……一一一一τ一一一……一一一一…一一一寸 Jレ ト( s t a t u吋)lを予 ; f t l Jするため 1 の説明変数は、欠損値穴埋め の変数と異なってよい。 l ̲ i m p u t a t i o n ̲ 毎に推計結果が異なる ア ト 川: 1石 1 3 ( 2 6 仙 川 S~~ユーザー総会均宅~九i'l!.E:!引ンセツ泊ン ~ 5 t e p 3 .P r o cM I A n a l y z e 代入毎に得られたパラメータ推計値 qと標準誤差 W;を 、M I A n a l y z eによって 1つの 結果にまとめる。 mは代入したデータセットの回数 係数 。二 ~IQi 標準誤差 』 E = l i z t tf(14)(12211)ヱ,̲ (Q p r o cmiロnロJ y z edata=mioutm u l t ; vロri n t e r c e p tpxlpx2px3px4b x 5 ; r u n ; Q)l 7MJan卯 eが計算してくれる 1 4/26 107

111.

S~ユーザー総会………… ~I ロ本分析で検証したこと① 欠損値を含めたデータは使うにはどの方法が適当か? 5種類の方法を比較 ‑非欠損データ =B/5有り 100件(内デフォルト 50件、非デフォルト 50件) .欠損データ =B/5無し 100件(内デフォルト 50件、非デフォルト 50件) のW 1 l 圃 Methodl:説明変数に B / 5指標は使わず、全データを学習デ 三下コ 監呈星」 監呈査旦 タに使用 ( P L ) P/L指慣 入力量 • Method2・説明変数に B / 5指標も使うが、 B / 5無し先は学習デ i i デフォ │ 非デフォ P/L指 揮 iB / S惜し I I I 50I 入 力 皆 1 B / S有り i ふ 曲 1 タに使わない (CCA) IB / S指 揮 │ I 1 λ角 笛 i 1 5 / 2 6 一 ~I s ユザー倣…m … 一 知 的 地 • Method3・説明変数!こ B / 5指標も使い、 B / 5無し先は観;l! j l 値の平均値を代入 ( 5 1mean) M 用 L BIS 有り I 昔同E 7 '7 1 50 • Method4・説明変数!こ B / 5指標も使い、 B / 5無し先は観測値の最悪値を代入 ( 5 1w o r s t ) デフォ 8IS揮し ! 町 S有り 1 日 l ,~デフォ 501 田 5 0 • Method5:説明変数 l こB / 5指標も使い、 B / 5無し先は多重代入法を適用 ( M I ) デフォ 非千フオ P/L! 旨揖 f考 B / S指栂 代入番号 B ノS 用し 50 50 入力自 代入憧 1 B/S 有り 50 5 0 入力値 入力瞳 B / S帽し s o S O s o s o 入力箔 代入値 2 自IS 有り 入力檀 入力量議 B / S鼎し お 民 鯵 50 警 λy ; 信 代入値3 自I S有り 50 襲 撃 ω墜 五 竺 憧 穿 入力鐘 3 i i 露: E 1 6 / 2 6 108

112.

I A 201g ねーザー総会一……… ロ本分析で検証したこと② 非欠損データと欠損データの N数が変わると、欠損値の対処方法に 差が出るか? 非欠損デタ少 欠損デタ少 非欠損データ少 欠損デタ多 国国 国 i 国国 非欠損デタ:多 欠損デタ多 非欠損デタ少 欠損データ多 E 1圃 EMi55 :Mi55 : 国 i iMi日 I 17126 mg │側ユーザー鍛加…九一… ロ 手 法C CAによる分析結果 CCA(BS有りデ タに限定)による推計結果 N=I 田( O Fo50.NOo5 0 ) E s t i m a t e 5 . E 0 . 8 4 4 8 0 . 4 7 9 5 ∞ ∞ O (O F:5凹 I , ND=5田} N = I αJ E s t i m a t e 5 . E 0 . 1 4 8 0 0 . 5 1 9 2 0 . 4 4 5 8•• 2 . 6 2 4 8 N=2 ( O F : I 田 ' , ND=l 1 E s t i m a t e 5 . E 0 . 3 2 7 4 0 . 3 1 8 7 3 . 8 2 4 5 1田 88 1 7. 33 3 1 1 4回 目 0 . 0 1 6 0 。 α)63 oαJ04 。 一 O田 27 0同 1 8 0 . 0 1 3 1 0 . 0 2 3 6 0 . 0 1臼 ‑ 0 α)88 O . O l l l 0 . 0 2 5 1 8. . 0田 7 0 . 0 1 5 5 0 . 4 8 4 8 ~14.8到耳 1 . 0 7 4 7 8 . 9 4 8 5 α刃6 1 6 . 6 7 凹 4 . 0 2 3 8•• 。 ∞10 oαJ03 N = 2 αJ O (O F : I α) Q ,N D=lαJO) E s t i m a t e 5 . E 0臼 81 0 . 1 0 3 5 2 ̲ 7 2 7 7 l B ‑ 5724 。 αJ09 0 . 0 1 0 1 a 3 2•• 0回J92 ∞ 0 . 0 1 9 7 0 . 3 2 5 1•• 2 ̲ 9 3 9 B・ a aαJ03, . o∞ 7 5 。 ∞23•• "'‑,昆",の極限 85禍 帽 の 慌 . . 一 一 一 ' ¥一ー己一一 ‑3MRg 8642 10 01 00 ! 日 i サンプリングを繰り返し、 CCAによる推計を 100回 (lteration=100)行った結果 一 一 一 一 九 1 │使用データが │増えれば係数 cx"は安定する てーェーーニ→ 一川 1000 !OOO 畑農周データ蛍 情実用データ蛍 1 0 9 18/26

113.
[beta]
加D

i
ω

ユーザー総会……一助

ロ欠損値を補完することで係数は安定するか?
B
S有りデータを N
=
1
0
0
fこ固定し、 B
S無しデータを各手法に基づき欠損補完して、
0
0回実施
モデル構築を 1
8sllill の保留 S!m~~n

006<

・ ← ←

00

皇

:
:
j
l
j 日一千19

f
!

0
0
4
1
I ̲l̲

:

002~

片一

, I
i

000

一一
‑

巴出

ー←

1

一一一一

402L
8S200(CCA) P
l!OO

Pl200

ー

九 !OOO

j

f
'L2000

",.周デヲ也

ー
ヤ

i
:
:
i
ι

MI;
去の推計結果が安定
=士、

'
"
帥
19/26

I~ユーザー総会…
ロ推計モテ、ルのパフォーマンス評価方法について
信用リスクモデルの序列推計性能の評価は ARで行う
08642
20000

:
A
R
=
A
c
c
u
r
a
c
yR
a
t
i
o

叫

ω 高幅広崎パボムム ?Thhp

• ,対象となる貸出先のうち、デフォルト先の件
:数を口、非デフォルト先の件数を Nとし、貸出 j
:先全てにスコアをつけて、スコアの悪い順(モ'
:デルがより「デフォルトしやすい」と評価する
:順番)に並べ、悪いほうからx番固までの貸
:出先を取り出したときに、その中にデフォルト:
i先がy
j
牛含まれていたとすると、両者の組み :
合わせい,y
)
1立貸出先の数 (
D
+
N
)だけ存在す:
iる。このとき、検軸をxの全体に対する比率
:(
x
/
(
N
+
D
)
)を累積全体比率、縦軸をyのデ
;フォルト先全体に対する比率 (y/D)を累積デ 1
フォルト先比率としてグラフに表したのが左
:図である。
I

6

ROC曲線の A
U
C
(
A
r
e
aU
n
d
e
rt
h
eC
u
r
v
e
)、

6

1
.0

率

比

体

0.2

︒積
累

4

0.0

︒全

0.0

ジニ係数、 S
o
m
e
r
s
'
dと本質的に同じもの

YA

20
/
26

1
1
0

114.

. ー 蝕 一 … … … 201g ロ序列推計性能アウトサンプルデータ (N=7220) 852000 PL2000 百 8 E 司 一 一 一 一 一 一 一 106 ' ‑ 9 05 +t~ 04 ーー ‑竺竺ー i α 二 " ' 0J 什) 0 ' PL CCA Slworst $lmcl In Ml ‑十分なデータ量がある場合、手法問で性能 S 情報を使用/未使用で に大きな差は無く、 B 差{①)が出る。 • B / S 情報が少ない場合、 C CAではモデル性 能にバラツキが生じる(②)。悪いモデルを 選択する可能性が高まる。 • P/L 情報も少ないと、 MIでもバラツキが発生 する。 BS100 PL2000 88100 P1100 1 g <( 03" ‑ l I , 。 。 o4~ , ‑ 上 o o1 ψよ 0 T ・ ・ c r ' ̲ c( 0 3~ 01 T‑i ・ ・・ ・ ・ ・ ・ 圃申弓子 . . . 1 . T T圃 o5~ ② 04' T.1i 061 ム T圃 o6 o5 司 00" PL CCA SJworst Slmc< ln PL M! CCA 1 1 1 ユーザー飴市町…一泊シ Slworst SImcan MI 26 ~a ロ各手法によって推計されたデフォルト確率の相関 S~.齢 左図は BS2000, PL2000デ タ を 使 用して構築した各モデルが推計し たprobability(デフォルト確率 =PD) の散布図。 Slmean, MIで推計された 。I Slworst, PDの相関は非常に高〈、前項の 序列性能 =ARに差がで、なかった。 モデルに使用した変数を固定した ため、序列に差がつかなかった可 能性がある。 2 2 / 2 6 1 1 1

115.

I │ ωユ ー ザ ー 総 会 神 的 側 一 一 ン … P I i l l ロ水準に注意 推計された PDの要約統計量 要t ' J I 忌 オ 量 支蝕 P l C C A S I w o r s t S I m e a n J l I 7 1 1 0 7 1 1 0 7 1 1 0 7 1 1 0 7 1 1 0 平均 標準偏差 中央値 信,卜{直 最大値 0 . 5 0 1 1 3 0 . 4 & & 1 3 0 . 4 5 8 1 8 0 . 5 3 1 5 0 . 5 0 4 1 1 0 . 1 1 7 1 0 0 . 1 9 3 1 & 0 . 1 5 & 5 & 0 . 1 3 8 1 7 0 . 1 & 7 0 4 0 . 5 1 1 5 0 0 . 4 9 5 3 1 0 . 4 8 4 7 1 . 5 5 5 4 1 0 . 5 4 1 4 0 0 . I & S 3 & 0 . 0 1 3 0 1 0 . 0 & 0 5 5 0 . 1 4 0 5 0 . 0 8 1 4 & 0 . 7 9 0 8 4 0 . 8 5 4 5 1 0 . 7 9 8 9 1 0 . 8 3 3 & & 0 . 8 1 8 0自 。 。 。 MIの場合、推計された PDの平均は 50%で、構築データのデ フオ.非デフオ =1:1との関係と整合的 Slworst, Slmeanの平均値は 50%よりす、れている。係数のバイ アスの影響によるものと考えられる 2 3/ 26 │凱包ーザー蝕拘…… ロ結論 Grモデル構築に使えるデータ数が十分であれば、慣用的な手法 で、ある CompleteCaseAnalysis=欠損レコード、の削除を選択す れば良い (MCARの仮定が成り立つ必要あり) GrMI法のメリットは、完全観測されたデータが少なく、かっ欠損 データが大量にある場合に特に良好な結果であり、悪いモデル を選択する可能性が減少する Grデータ件数を確保を目的に、欠損値に単一値の代入を実施し ても、大きなメリットはない。また推計値の水準にバイアスが発 生 24/26 112

116.
[beta]
I
4
やー=鈴ヤヤ…一竹山 4m
ロ展望
F

指標探索の段階で、 M
1
5
:
去を用いることで、少数データでも有効
な変数の検出を行うことが可能と思われる。これによってモテ、
ル性能の向上は期待できる。
S
A
S
9
.
2では l
o
g
i
s
t
i
cプロシージャに s
e
l
e
c
t
i
o
n
=
s
t
e
p
w
i
s
eを指定した場合は、 MIAnalyze

に受け渡すことができなかった。

25/26

SAS.:::a.-~-.*
S
w
ユーザー総会アキ!
#M

7"JlTa三日;ヶ
九 刊 一 切 ン

~ID]

ロ参考資料
山岩崎学「不完全データの統計解析 J(2002)、エコノミスト社
[
2
]狩野裕「結測値データ解析の意味と有効性 J(2013)、http://www.sigmath.es.
osak
a‑
u
.ac
.jp/‑kan0
/research/seminar/others/KSPmissingWEB.Pdf

[
3
]星野崇宏「調査観察データの統計科学因果推論・選択バイアス・データ融
合 J(2009)、岩波書庖
[
4
]村山航「欠損データ解析完全情報最尤推定法と多重代入法 J(2011),
h
t
t
p
:
//
www4.ocn.ne.jp/‑murakou/missing̲data.pdf
SageP
u
b
l
i
c
a
t
i
o
n
s,
I
nc
.
[
5
]
P
.
D
.
A
l
l
i
s
o
nrMissingDataJ(2001),
[61Rubin,
D.B.rMultipleImputationf
o
rNonresponsei
nSurveysJ(1987
,
)NewYor
k
:Wiley
26{26

113

117.

学生の実演芸術鑑賞構造とその変化 学生調査と社会生活基本調査の結果から‑ 有 馬 昌 宏 l 福永征同一 2 王 程 l l兵庫県立大学応用情報科学研究科 2株式会社エヌ・ティ・ティマーケティングアクト Stmctureo f U n i v e r s i t yS t u d e n t s 'P e r f o r m i n gA r t sAppr 巴c wt巴A c t i v i t i e sandl t sChange e i s u r 巴A c t i v i t i巴sandS t u d e n tSurv巴y s ‑ ‑AnA n a 1 y s i sb a s巴donSurveysonTimeUseandL M a s a t o s h iFUKUNAGA2andCh巴ngWANG1 MasahiroARIMA1, , 1 Graduat巴 Schoo1ofApp1iedI n f o r m a t i c sU n i v e r s i t yofHyogo i n gActC o r p o r a t i o n "NTTMark巴t 要旨 1985 年 か ら ほ ぼ 5年間隔で有意抽出による 1万ノ¥規模の学生を対象とした芸術に関する鑑賞の実態な らびに意識を問う調査(学生調査)を実施してきている.本稿では,調査票の内容がほぼ問ーとなった 1992年の第 2回調査から 2008年の第 5回調査までの学生調査の調査結果に基づき, 1 9 9 1 年ーから 2 0 1 1 年までの社会生活基本調査の学生の実演芸術に関する種目の行動者率と行動平均日数の集計表データ と比較対照しながら,学生の実演芸術の鑑賞構造の実態とその変化を示し,アーツ・マーケティングの 発展に資することを目指す. キーワード:社会生活基本調査,学生調査,質問紙調査,文化芸術関連活動,実態・意識調査 1.はじめに 人口高齢化,高学歴化,高度伯z報化といった社会構造の変化を迎えている我が国では,国民の要求は物質 的豊かさの追求から精神的に充実した生活を送る方向へと向かつてきており,文化・芸術に対する関心も最 的増大と質的多様化を見せはじめてきている.このような状況の中, 2001年に「文化芸術振興基本法」が施 行され,文化芸術展興基本法に基づく文化芸術の振興に関する施策の総合的な推進を図るため, 2002年 , 2007 年,そして 2011年には,それぞれ第 I次から第 2次を経て,第 3次の「文化芸術の振興に関する基木的な方 針 Jが閣議決定されるに至っている.また,平成 2012年には,文化・芸術を提供する場である劇場・音楽堂 等の活性化を図るべく i 劇場,音楽堂等の活性化に関する法律」が施行されている.しかし,我々の劇場 関係者へのヒアリングでは,観客の高齢化が進んでいるとの指摘があり,大学教員との芸術鑑賞に閲する意 115

118.

見交換においては,最近の学生は劇場やホール(音楽堂)へ足を運ばなくなっているのではなし、かとの指摘 もなされている. そこで,木稿で、は, ヒ述の主観に基づく現状認識をエピデンスペーストで確認すべく,社会生活基本調査 の調査結果を用いて,実演芸術の熊賞の状況とその構造変化について分析を行う.その上で,時間と金と移 動のためのエネルギーを必要とする実演芸術鑑賞に関して,これら 3つの要件を最も兼ね備えていると考え られる学生に焦点を当て,彼らの鑑賞構造が 20年間で変化しているか,変化していなし、かについての分析を 行う.また,社会生活基本調査では,実演芸術の銀賞行動は 3つの大きな分野でしか把握されていないので, 局する研究グ、ルーフ。が 1985年からほぼ 5年間 i 痛で有意抽出による 1万人規模の学 その分析結果を,我々が所j 生を対象とした調査(学生調査)での細かな実演芸術のジャンル別の鑑賞行動に関するデータを用いた分析 結果と比較対照することで,学生の実演芸術の鑑賞構造とその変化を詳細に捉えることを試みる. 以下,第 2章では, 1986年から 2011年までの 5年間隔の周期調査である社会生活基本調査の公表集計結 果を用いて実演芸術の鑑賞構造とその変化の有無を検討する.その上で,第 3章では我々が属する研究ク、ル ープが実施してきた学生調査について概説し,第 4章で,調査票の内容がほぼ同ーとなった 1992年の第 2回 調査から 2008年の第 5回調査までの学生調査の調査結果に基づき,学生の実演芸術の鑑賞構造とその変化に ついて分析を行う.最後に,第 5章において本研究のまとめを行うとともに,今後に残された課題について も言及する. 2. 社会生活基本調査が示す実演芸術の鑑賞構造とその変化 1976年以降 5年ごとの周期調査として実施されている社会生活基本調査の生活行動調査では,実演芸術 j I J .舞踊鑑賞,音楽会などによるクラシック に関連する種目としては,趣味・娯楽の分野の中で,演芸・演 J 音楽鑑賞,音楽会などによるポピュラー音楽・歌謡曲鑑賞の 3つの種目が取り上げられている. 表 1には,これらの実演芸術 3種目について, 1986年以降の 25年間の総行動日数の変化,ならびにその 総行動日数の変化を行動者率と平均行動日数に分解して示している.また,図 1には, 1 5歳以上人口と 3つ の実演芸術種目の総行動日数の変化を示している 1 5歳以上人口は,長寿化と 1 9 7 1年から 1974年に掛け て出生した回見ジュニア層の影響を受けて, 1986年の 9, 429万人から 2011年には l億 817万人へと 1 , 388万 人の増加を示しており, 1986年後半から 1 9 9 1年前半にかけてのパフソレ景気の影響を考慮しなければならな 9 9 1年以降は,クラシック吉一楽鍛賞と演芸・演劇j・舞踊鑑賞(ただし 1 9 8 6年 いが,パブ、ル景気が崩壊した 1 は演芸と演劇・舞踊が別種目で剥査)には大きな変動は見られない.一方,ポピュラー音楽・歌謡山銀賞は, 1986年に 4億日を超える非常に高い数字を示しているが,パフール景気が崩壊した 1 9 9 1年に約 4分の lの1.24 億日に減少し,以降は 2001年ーまで増大しているが, 2006年以降は減少し, 2011年には 1 5歳以 k人口を若干 下回る1.04億日を示している. 総行動日数の内訳を性別およひ'年齢階級別で‑見ることにより,各種目の平均的な観客の特徴とその変化を 読み取ることが可能になる.表 2には,総行動日数に占める男性の総行動日数の比率(男性比率) , 5歳階 級別の行動者数と平均行動日数から計算した総行動者の平均年齢(平均年齢の計算には 5歳階級の中央値を , 75歳以上の階級が示されていない年次は 70歳以上に 75歳を割り当てて計算, 使用, 75歳以上階級は 77歳 30歳から 59歳までは 1 0歳階級のデータしか公表されていない 1986年から 1996年までは 1 0歳階級の行動 5歳から 24歳の若年者の鑑 者比率と平均行動日数を 5歳階級人口に適用して計算) ,65歳以上の高齢者と 1 賞者比率を要約して示している.表 2からは,実演芸術 3種目では,男性比率が低下して女性比率が高まる 116

119.
[beta]
表 l 実演芸術鑑賞活動の行動者率・平均行動日数・総行動日数
総数
男性
女f
i
j
行動者不平均行動 総行動 行動者J
宅、v
均行動 総行動 行l
f
U
J者卒 、
ド
均i
T
i
f
i
l
J 総行動
(%)
回数(日) 日数(千日) (%) 日数(日) 日数(千日) (
'
X
,
) 日数(日) 日数(千日)
1
9
8
6
年
677
3.8
5
2,
9
.
0
3
.
9
1
6,
1
'
1
.8
1
3
6
20.2
3
.7
36,
180
1
9
9
1年
1
7
.
2
80,
0
1
2
1
4
7
1
.
7
1
0
.
8
2
4,
23.2
1
.7
5
5,
1.6
836
年
1
9
9
6
1
5
.
9
1.5
7
4,
'
1
4
4
9
.
9
1.5
2
2,
.
1
1
6
.6
1
.
5
5
1,
9
9
8
21
2
0
0
1年
O
.1
.
1
6
.
3
5
.
5
9
5,
898
27,
8
2
1
9
.
9
7
9
6
5
.
6
68,
2
2
.1
'
2006年
1
1
.
3
6
.
3
97.259
8
.
8
6
.
0
2
7,
7
3
2
1
9
.O
6
.
5
7
0,
3
1
1
2
0
1
1年
3
7
1
22,
7
3
7
83,
6
.
9
6
.
3
1
6
.
2
11
.7
6
.
6
6
.
8
6
,
13
6
3
1
9
8
6年
5
.
7
1
3
.
6
7
2,
685
902
33,
6
.7
1
.5
1
6
.
3
7
6
8
38,
11
.9
379
50,
5
.
5
6.9
1
8,
8.0
6.3
3
1
7
1
9
9
1年
1
0
.
3
6
.
0
3
2,
076
1
9
9
6年
。
0,
7
8
'
1
5
.
2
8
.
1
2
7
.
7
6.3
,
12
8
7
28,
7
9
5
1
0
.
2
5.3
2
4,
2
0
0
1年
9,
1
8
9.3
6.5
6
'
1,
210
6
.
3
7
.
7
1
9
4
1
2
.I
3
9,
5
.
9
2006
年
200
25,
6
7
.
1
63,
6.0
8
.
2
9.0
6.5
3
7,
o
7
'
1
I
19
2
0
1
1年
8.3
6
.
5
58,
2
3
'
1
7.6
22,
0
1
0
1
0
.
9
3
5
'
1
6
.
0
36,
Q. "
1
2
.1
.
2
1
1,
1
0
6
37.0
132.359
1
0
.
9
12.3
1
3
.
8
33.0
1
9
8
6年
2
2
0
.9
6
‑
1
7
.
J
7
1
2
3,
1
9
9
1年
1
2
.
7
9
.
7
9.6
1
0
.
9
50,
8
8
9
1
5
.
6
72,
7
1
1
9
.
0
1
3
6,
1
9
9
6年
5
1
2
5
1,
6
9
6
1
2
.
0
1
0
.
9
1
8
3
8
.
1
1
2
.
9
1
5
.
5
9.8
8
1,
2
0
0
1年
1
7
.O
1
3
.
6
1
0
.I
1
1
6
.
8
2
1
~.5
11
.8
1
.8,
3
:
1
9
9
.
2
88.256
2006年
1
4
5
8
.
6
1
0
.
9
1
8,
9
1
9
1
6
.
0
7.6
1
1
6,
6
7
.
3
5
1
1
2
.
1
8
.
7
8
.7
3
8,
3
5
0
66,
9
,
1
8
1
0,1,,58
8
.
1
7.3
7
.
7
2
0
1
1年
1
2
.
6
1
6
."

~
演芸・
I
寅庫1
1
・
舞踊鑑賞

クラシック

音楽鑑賞

ポヒュラー

音楽・
想;議出

鑑賞

5
0
0
1
5
0
1
0
0
3
5
0
3
0
0

2
0
0
1
5
0
1
0
0
5
0

.
",

77
二
二
コ
ー
ト

表 2 観客の構成構造の変化
1
:5歳叫しl

~

1
9
8
6年
1
9
9
1年
t
主
主
・
1
9
9
6
{ド
u
首廟卜
舞踊鑑賞 2001年
2
0
0
6年
2
0
1
1
{
手
}
こ
1
9
8
6イ
1
9
9
1年
クランツク 1
9
9
61
手
自楽鑑:n 2001年
2
0
0
6年
2
0
1
1年
1
9
8
6年
ボヒ ュラー 1
9
9
1年
孟
事
ミ
・
1
9
9
6
年
歌誌曲
2
0
0
1年
9庄 一 % 主
0
1年
0
6年
1
1年 i
8
6年
鑑員
2
0
0
6年
総 行 動 日 数 の 変 化 ( 単 位 : 100万円(人) )
2
0
1
1
"
j
F

図]

3
J性 比 率 平均年齢
(%)
(蔵)
3
0
.
7
3
0
.
2
3
0
.
2
2
8
.
8
2
8
.
3
2
7
.
0
1
6
.j
:
1
6
.
3
1
2
.
5
3
8
.
9
4
0
.
6
3
7
.
7
1
8
.
9
1
'1
.2
1
0
.
3
3
9
.
8
'
1
2
.1
3
6
.1
'

'
1
3
.
8
1
1
.5
l
l
i
.
1
1
8
.
3
5
0
.
9
5
0
.
3
31
.2
3
4
.
5
3
8
.
6
1
2
.
7
1
5
.
4
1
7
.
2
2
7
.
0
.1
31
3
2
.
8
31
.I
1
0
.1
4
3
.
5

6
5戦以上

l 品 ~24 版

上ヒ半;(%)

比;
i
('
Y
o
)

鑑只者

1
3
.
0
1
1
.1
.
1
7
.
7
2
3
.
9
3
0
.
6
2
8
.
0
1
.
5
3
.
2
7
.
8
1
5
.1
.
2
2
.
4
2
3
.
9
1
.7
'
1
.2
5
.1
8
.
6
1
1
.
3
1
6
.
6

鑑釘者

1
8
.
8
1
9
.
1
1
5
.
9
1
5
.
2
1
2
.
2
1
3
.
5
3
9
.
7
3
8
.
7
3
3
.
0
2
5
.
9
2
2
.1
1
9
.
5
61
.0
5
0
.
7
4
3
.
7
'
1
0
.
0
2
7
.I
2
0
.1
'

傾向が読み取れる.年齢の構造では,どの種目も平均年齢が上昇し. 65歳以ヒの鑑賞者の比率が急上昇をし
ている.この観客の年齢構造の急激な変化は,わが国の人口の少子・高齢化に伴つての必然的な変化ではあ
るが,観客の高齢化は人口の高齢化の進展以上のスピードで進んでおり,このままで推移すれば,近い将来
に実演芸術への需要である総行動日数が急落する可能性があり,平成 24年に胞行された「劇場,音ー楽堂等の
活性化に関する法律」が有効に機能することが期待されるところである.
ところで,観客の高齢化の問題を考えるにあたっては,人口ピラミッドにおいて 2つの大きな癒を作って
いる「団塊の世代 J (1947年から 1949午 の 3年 1
1
1
1に出生した世代)と「団塊ジュニアのttJ:代 J (1971午ーか
ら 1974年にかけての 4 年間に出生した世代)の行動者率と平均行動日数の動向が大きな鍵を握っている.表

3には. 1986年から 2011年にかけての 5歳階級別人口の構造と,クラシック背楽鑑賞を対象に,行動者キ,
平均行動日数,給、行動日数についても 5歳階級 7
j
l
Jにぶしている.表中で網掛けをしている升目が「団塊の世
代 J (1986 年では 35~39 歳(実際には 37~39 歳) . 2011 午では 60~64 歳(実際には 62~64 歳)の階級)
と「団塊ジュニアの世代 J (1986 年では1O ~19 歳(実際には 12~15 歳) . 2011 年では 35~44 歳(実際(こ

117

120.

表 3 人口構造の変化とクラシック音楽鑑賞の観客の年齢構造の変化 60~ 65~ 70~ 40~ 45~ 30~ :l 5~ 50~54 i 5議 20~ 25~ ,j1i,'~ ; ; 9 段 7 4 1 孟 以上 2 9 i , ; i : 3 ' j歳 49 歳 日4~ 6% 孟 2 4 i : , 宝 39~ 1 9 # 宝 " v , 主 1 5 6 3. 3 8 4 966 6, 990 5, 6 0 7 4, 49 3 4, 6 8 9 8, 3 8 8 I , I: l 3 8 8, 5 2 0 8 . 3 1 8 7, 4 4 5 7, 9 9 5 7, 9 4, 2 9 1 9, 1 9 8 6年 5 1 7 7 3 5 6, 7 8 3 5, 286 3, 7 4 3 5, 5 2 8 11 , 13 6 8, 4 9 3 8, 1 3 9 7, 人 1 9 9 1年 1 843 9 9 1 7 7, 690 8, 0 0, 1 0 8 9, . 2 9 8 7, 1 1, 日 1 9 9 6 { f 1 4. 1 6 9 5 2 7. 5 1 5 11 .0 6 . 1 8, 3 7 3 7 . 9 8 4 7 、 470 6. 40 2 2 1 3 7, 71 0 8, 1 .0 90 8, 2 0 1 9 . 7 3 1 9, 0 . 0, 886 8, 209 7, 7 8 1 7, 1 1 7 1 4, 29: 3 2 6 4 7, 9 5 4 7 , 6 9 5 8. 43 9 1 3 1 7 8, 1 4 0 9, 635 9, 0 6, 7 3 1 7, 千 2 0 0 1{ t 1 670 8, 0 0 0 7, 43 9 6, 5 7 3 1 0, 740 0, 5 6 3 9 9 1 3 7, 6 2 2 8, 3 1 7 1 2 4 6 7, 949 9、 . 2 0 2 7, 0 7, 620 6 . 3 8 7 7, 人 2 006年 1 1 9 5 1 6 8 8 6, 952 1 2, 965 0 3 2 9, 6 1 3 9, 246 7 , 8 9 6 7, 5 5 8 8, ‑1 7 8 7, 0, 0 4 4 , 日315 7, 1 5 8 8, 0 8, 1 7 0 6, 2 0 1 1q 1 0 . 5 7 6 . 2 7 6 . 6 3 6 . 1 7 5 . 2 5 4 . 1 9 2 . 5 1 1 .9 0 1 .5 2 5 . 6 6 1 0 . 8 6 7 . 9 5 5 . 9 4 5 . 0 3 1 9 8 6年 4 . 2 8 48 1 . 38 9 . 0 3 1 0 . 1 8 9 . 3 8 8 . 6 6 7 . 7 1 5 . 8 1 2. 7 . 9 8 11 .8 1 8 . 5 6 8 . 5 6 7 . 2 4 1 1 '1 1 9 9 1 ' 1 9 . ; ; 7 7 . /, 1 1 9 . 8 5 8 . 9 6 7 . 7 4 6 . 2 6 2 . 5 6 動 1 9何年 6 . 9 9 6 . 7 9 8 . 3 4 9 . 3 1 0. 43 / . 2 4 4 . 8 7 7 . 3 8 6 . 9 3 9 . 7 6 1 2. 者 2 0 0 1年 40 1 1 .3 9 11 .0 5 1 0 . 9 3 11 .0 1 9 . 2 5 9 . 2 6 1 1. 44 8. 48 0. 白2 3 1 40 1 0 . 6 1 11 .9 3 1 0. 49 8 . 3 5 4 . 6 0 0 . 3 6 7 . 8 9 7 . 7 5 6 . 9 9 ギ 2 006 年 .2 2 1 0 . 3 6 11 9 . 0 3 1 0 . 2 3 1 9 . 8 0 9 . 0 6 9 . 1 6 8 . 8 9 5 . 2 1 9 . 8 6 6 . 2 4 6 . 8 0 6 . 1 5 7 . 9 3 9 . 6 5 1 0 . 2 4 2 0 1 1年 8 . 2 8 1 0 . 6 1 2 . 3 1 8 . 7 1 6 . 3 2 5 . 7 2 5 . 7 l : l . 6 1 8 . 7 1 5. 4 1 4 . 9 9 . 8 9 . 8 1 0 . 6 1 2 . 3 平 1 9 H 6年 4 . 6 6 . 7 5 . 3 5 . 3 4 . 6 1 . 8 4 . 8 6 . 6 4 . 3 3 . 8 3 . 8 均 1 9 9 1年 6 . 3 1 0 . 6 9 . 0 O.~ 4 . 9 5 . 9 5 . 8 5 . 6 5 . 6 9 . 5 4 . 7 5 . 0 4 . 8 4 . 7 行 1 9 9 6 年 6 . 3 11 .8 5 . 8 ' j i ) J1 2 0 0 1 { f 1 3 . 1 8 . 3 6 . 0 5 . 1 5 . 2 5 . 3 5 . 2 5 . 2 5 . 3 5 . 8 6 . 5 8 . 1 8 . 1 6 . 5 η 日 2006年 5 .白 4. 4 5 . 1 7 . 3 7 . 7 7 . 7 1 2 . 6 9 . 5 6 . 5 4 . 7 5 . 3 5 . 7 6 . 5 数 2 0 1 1咋 6 . 5 1 3 . 0 8 . 9 6. ' 1 5 . 8 6 . 5 5 . 0 5 . 0 4 . 8 5 . 3 6 . 5 5 . 3 7 . 1 8. 4 7 8 4 6, 1 5 0 6, 9 9 3 5, 9 6 8 5, 4 1 9 5, 7 2, 6 8 5 1 9, 1 5 7 9, 7 9 0 4, 1 5 4 3 . 6 1 3 2, 6 4 1 1 , 2 8 7 1 , 3 6 0 6 4 1 、 柱 1986年 3 6 7 7, 1 7 0 1 5 9 8 2, . 5 5 5 2 . 9 5 2 4 . 0 8 1 5 . 2 2 9 3 . 6 7 5 3 . 3 9 0 2 . 8 6 6 2, 9 7 1 319 286 0 . 3 7 9 1 1 丁 1 9 9 1{ f . 5 1 0, 7 8 1 1 5 3 8 3, 8 0 6 5 ., 1 0 6 3, , 6 . 1 1 089 6 . 6 9 8 3, 7 ' 1 7 2, 0 2 2 3, 933 3, 1 1 0 2 0, . 2 3 2 1 . 3 2 6 f~1 1 9 9 6 { 1 2 6 6 3, 46 7 4, 0 5 6 5, 0 9 3 6, 965 5, 7 2 7 4, 1 9 0 5, 256 4 . 6 6 4 4, 9 7 1 4, 2 7 7 0, 5 . 6 3 8 6 4 . 2 4 0 1 f ll ‑ ‑ 1 Q Q l 年 4 3 4 4, 0 0 4 3, 14 0 3, 5 5 8 4, 6 7 4 4 9 8 1 4, 865 5, 6 3, 2 0 0 8, 3 4 1 5, 6 9 4 4, 2 2汗 3, 804 . 8 7 4 3 . 8 0 6 4, 数 2 006 年 5 8, 2 3, 1 7, 2 0 1 1手 { 7 4 8 3, 5 0 7 3, 1 1 7 2, 865 4. 0 4 0 3, / 1 5 3 1 6 9 3, 43 7 4, 46 0 4, 7 3 1 1 , : 38 8 1 5, 670 . 8 5 4 6, ~ 総数 15~ OO~ 。 。 は 37~40 歳)の階級)のコーホート(世代)である.これらのコーホートについては,行動者率は 1986 年 の「同塊の世代」を例外に比較的に安定しており,平均行動日数も 1986年の「団塊の│止代 J と 1986年から 1996年にかけてと 2006年の出産・育児期にあった「団塊ジュニアの世代 Jを除けば安定して推移しており, 他の年齢階級と比較して母数が大きい分だけ,総行動日数が大きくなっていることが表中に明確に示されて いる.特に「団塊の世代」は,彼らの成長とともに受給のバランスが崩れて,高校ならびに大学の受験競争 が激化し,持ち家の取得時期である 30歳代後半にかかる 1980年代後半からパブ、ル景気を発生させた一因と なっており,本稿で取り上げている実演芸術 3種目への需要においても,その動向を把握しておくことは非 常に重要となっている.実際,クラシック音楽鑑賞においても r 同塊の世代 J の総行動日数は前後の 5歳 年齢階級よりも約 60% ,ほぽ 240 万日も多く,これは 2011 年の 30~34 歳の年齢階級の総行動日数にほぼ相 当するボリュームとなっている. 一方,表 3 で,学生が含まれる 15~19 歳階級と 20~24 歳階級の行動者率に注目してみると, 1991年が最 も高く, 1996年に低下した後, 2001年に再び 1991年の値に近いピークを迎えて, 2006年と 2011年は連続 して低下を示している.そこで,学生だけに焦点を当てて,実演芸術 3 種目の行動者 ~4さの推移を次ベージの 図 2 に図示している.図 2から,演芸・演劇・舞踊の行動者率は 1991年から微 I 訟で 2001年にピークになり, 以降は微減であり,ポピュラー音楽の行動者率は 1991年から 1996年にかけて大きく低下し,その後は微増 と微減を繰り返しているーこれに対して,クラシック苦楽の行動者率は, 2001 年ヵ、ら 2006年は横ばいて、あ るが, 1991年ヵ、ら 2011年にかけて一貫して低下傾向にあることが読み取れ r 最近の学生は劇場・ホール へ行かなくなってきている J という大学教員の観察を裏付けている結果となっている. 3. 学生調査の概要 前章で使用した社会生活基本調査は,総務省統計局が所管する基幹統計調査で、あり, 2011年に実施された こより,指定する調査区(全国で約 6, 900調査区)内に屑住する世 長新の第 8回調査では,層化 2段抽出法 i 1 1 8

121.
[beta]
表 4 学生調査のサンフ。ル構造(第 4回調査と第 5回調査)

4
0
.
0
3
5
.
0

設大学
立短期大学
形 芝i
等専門学校
態 <
!
i修学校
見
J
I大
,
,
/
院

3
0
.
0
2
5
0

性

2
0
.
0

~II

男子
友子

専文芸系学部
l会系ゼ部
主 t
分理工系学部
野保健系学部
北海道・東北

1
5
.
0

地 │到来

5
.
0r

域

甲信越・北経・東海

j
j
I
J 近畿

。
。
1
9
9
1

1
9
9
6

2
0
0
1

2
0
0
6

2
0
1
1

図 2 学生の行動率の変化

'
i
'
i
司
・
四I
司
九州・沖縄
全i
*

m41コ1
調査 (
2002年度)
有効副収
iWギ
母型lU
i サンフル 持(
%)
678
3,
O
.1
1
7
2,
199,
1
'
1
7
267,
086
0.000
21
.336
0.000
7
6
:
>
5o8
0
.
0
0
:
;
'
1
1
l
〆
i
223,
512
0.020
2,
085,
1
2
0
0.087
1
.
8
0
'
1
,
Y
?
)
'
1
1
1
.
6
91
0.116
.519
1
,
1
'
1
.
1,
7
8
1
2,
1
7
0
O
.1
9
0
1
.128,
3
6
.
o
1
,
302
O
.1
1
5
日8
9,
537
1
6
2
0.018
506,
089
1
2
9
0.025
3
2
.
1
.
8
1
6
0
.
1
1
.
1
3
7
1
1
.579,
0
2
1
0.068
1.066
523,
7
5
8
7
0
'
1
0
.
1
3
'
1
8
757,
073
1
,
1
2
.
1
2
6
1,
7
8
1
1
7
8
0.068
3
2
.
1
372,
227
0.087
3,
776.639
3,
767
0.100

。
。

。
]
>
1

I
D
5
L
l
'
i
!調 査 (2008年度)
有効回収
t
l
!
l
l
l
¥ギ
サンプル
(%)
2,
520,
593
7,
009
0.278
1
7
2,
725
1
6
0
0.093
5
9
.
1
.
1
6
1
8
8
0.316

母集団

262,
686
2,
0
1
1,
622
1
,
661.331
,
062,
:
>
o
9
1
9
3
'
1,
.
1
9
5
725,
1
5
7
295,
67,
1
216,
.
1
8
2
1
.291,
756
1
1
8,
1
8
9
620, 5
543
2
1
1,
276,
873
3,
0
1
5
.'
1
5
0

]
>
1

1
1
8
865
3,
3,
3
7
1
1.537
618
3,
875
868
115
2,
206
1
,
i
14
883
909
l
l
7
5
7,
'
1
7
5

0.015
0.192
0.203
O
.1
4
5
0.390
0.121
0.291
0.168
O
.1
7
1
0.410
O
.}
>
I2
O
..
1
3
0
O
.1
7
2
0.2,
1
8

帯のうちから,選定された約 8万 3千世帯の 1
0歳以上の世帯員約 20万人が対象とされている c 文化・芸術
を対象とした調査でこれだけの大規模な周期調交は他になく,非常に有用な調貨で‑あるものの,文化・芸術
に関して,分野や種目の紺l
分類による詳細な分析を行いたい場合:こは,実演芸術は 3種目に統合されており,
目的を達成することは難しい.
このような状況を踏まえ,

ミクロ統計データ(個票データ)に基づく文化・芸術の需要サイドの分析の重

要性を早くから認識していた松田芳郎(一橋大学名誉教授)らの研究クーループつにより,文化・芸術情報の体
系化と統計調査方法の確立を目的として,文化・会術の需要者側の実態調査『学生の芸術意識と芸術活動に
関する調査(以降

r
学生調査」と 1
1
略記) j
]
が 1985年以降 5回に渡って実施され,調査研究の進行とともに

データの蓄積が図られてきている(周防 [7]) .学生調査は全国の学生を対象としており.大標本を確保しな
がら限られた費用で詳細にわたる調査を実施するために,大学教員のネットワークを活別して,全国の大学
の地域と専門分野別の分布を考慮する害J
I当法て、標本設計を行って調査を実 j
庖している.有効回答サンプル数
0,
570,第 2回調査 (
1
9
9
1年度実施)で 1
0,
819,第 3回調査 (1996年度
は第 l回調査 (1985年度実施)で 1

実施)で 1
0,
0
6
1,第 4回調室 (2002年度実施)で 3,
763,第 5回調査 (2008年度実胞)では 7,
475で,第 5
回調査のサンプルの構造は,表 4に要約して示すとおりである.
学生調査では芸術・:文化の需要構造の実態把握に焦点を当てており,調奄票の質問は,大別すると,実演
芸術 7分野 64ジャンル(第 1回調査は 48ジャンル)のライブでの鑑質経験(過去通算と過去 1年)と実演
芸術 7分野のメディアによる鍛賞経験(過去 l年)を問う質問群,映画銀賞と美術などの視覚芸術鍛賞の経
に影響を与える文化・芸術への意識に関する質問群,稽古事や主体的
験と鑑賞場所を問う質問群,鑑賞行部J
芸術活動の有無と活動時期に関する質問群,読書に関する質問群,および鑑賞行動と何らかの関連を持っと
考えられる個人的属性(文化資木)に関する事項を問う質問群とヵ、ら構成されている.調査方法は,原則と
して講義などで学生に調査票を配布して,その場で記入させるか,または自宅で記入して次回講義時に回収
する方法で実施されている
また,第 4固までの学生調査のデータは ,JI
f
藤・有馬 [5, 6]によって個別の調査の横断面分析や任意の調
査回を選択しての比較や時系列分析が容易となるようにデータベースが構築され, SASによるマクロプログ
ラムで調査固と使用変数を指定するだけで,集計表の作成や回帰分析などの分析ができるようになっており,
現在,第 5回調査データのデータベースへの迫力n
作業が行われているところである.

119

122.
[beta]
‑
r

:
!
.
:
!
I
l

i. lJ.!.代 (i~J 小J~jJl.l-

I.~:![

η~~ ,
'
j
'
(
1
¥
‑
1
1

h
.
:
!
1
1
2
.
2完 当

,
;
;'
‑
;
1
:
'
1
:
,')マ久、 ,
'J)れ
i
江川

人
'
"
1
[
;
1
¥
'
1
1
1
.
.
.
:
"
,
山
川
凶
l
l
J
.
代
前
山l

,

)
.
1
)
川

:
:
:
1

l
.
(
¥
h

1
.
11

~.~μ

1
.1
1
:

:~:L '
>
!
.:
,
:[外地)

仇引I{I

I J.:I~

131

1
)
;
1
0
1

O
.
H
O
:
!
.
:
!
,
(
)
̲O
!
I
I
:
I
.
l
l
iバ
ユ:~ 1

:
l
.
(
j1
.

:
;
1
.
:
'
1
〆
ワ
ン
>
,
ノ'
1
‑ ダ〆ヌ (
1
1本."f'U
ム
.
i
.
'
、
ソ
オ
̲
"
,
'
;
"
‑'
.
(
1
1:
、
・
外J

)
,

:!b ぞ ν.J(山山円 r_]_~_. ~、 1

仁川

o.:~ ;
11
:
!
1
.I
:f
!1
1
.7
1
1
1

巳

ワラシヮ'/"'i'~し

:
;
7,'
1ーケス lラ (
1
1
1、
)
出オー'.'"), I
.
'
J
(外'1;)
2
日1
:
1‑
:
1'
r
"
!
(
1
1 ド・外地}

:l, :!11

ri.~11I

恥i

凶,↓,,~~ (
1本 外 ホ }

1
.
(¥
0
1

l
l
ii
.
f

!
li
.,
'
i可H1 ~.:・外'1.)

:
;~引

l
i
.
H
γ民
l
"そN 帆"川"ッツ日米

l
功、"ュラー汗兎;

;
jOサ{り双

百1
.
‑
:
̲
'
(
J
)
I
lI
!
引火勲一

白川サ;,.-'凡 I,~

,

2
1
.
0
'
1

i
.
、
。

引l

O. !l~

O.
'
}
:
I

1
l
.:
I.
'
I

1
2
.
1
1
:
1
3
.
8
6
5

h
2
.I
¥I
3
.
3
7
4

O
1A

込
:
2
l

0出

1
;,
りU

i川

Oリ5

O
.
2
.
i
'
().~ 1

0
.
:
;
1
,
1
0
.
:
1
0
.
7日

斗
.
J
1
.

斗
.
:
.
.
!
1

5
,
6
!
1
1,3
2
i
i
.
:
'
iリ
0
.
1
0
n
.
!
l
l
O
.
!
1
1
当2
.
!
)
:
:
2
.
2
0
6

t

3
γ

、
,
.

1
.
:
;
.
'
1

、

,
)2
:
;

0
.
5リ
1
7
.1
'
1
:
:
!
.
:
h
;
¥
:
;
0
.1
o
.
:
!
.
j
0
.
.
1
7
1
2
.
!
1
!
1
!
U
i村
l九0

‑

1リi

L
l
:
¥

o
.
!
'
.
i

0
.
0
0
0
.
:
1九

.
.
.
.
!
.
!
2
L
1
.

」以i

5
)
.
(
)
H
1
,
714

l
i
O.
:
.
!
1

883

斗L
込

~よ

0
.
5
1
O
.
2
i
.
:
!
.
I
I
0
.
2
5
(
)
.
!
i
:
l
2
.i
!1
0
.
1
:
1
l
リ0
.
1

2
.
:
¥
1
.5
り

J
.
O
!
'

0
.
1
7
0
.
¥
1
1
0
.
1
7
0
.
2
:
1
l鮎
0
.,
1
7

1
.¥
1;
1

1
:
12
7
.
21
‑
>
¥
.
.
'
i2
1
.1
7
1
.
'
日
』

」川1
'
;
.
1
¥
1

0
.
.
1
:
¥
丸
勾 l
i
l
i
21
.1
0

‑
5
.
"吋

1
0
.
1
¥
1
1
7
.
M
I

0
.
1
7

[
U
i
i

1
.1
‑
>
.
'
1
1
.1
¥
.
'
1
1
.¥
1

7
.
7
1
1
.4
2怜
1
1り
九

11
1
.
0
:
'
1
..
1
1

川日

1
0
.
I
H
1.1->~

0削 l

0
.
:
:
1

J
り弘、
1ι1
1
1り7

辿~

1 1
0
.
7
0
l
りIo
1
.1
1
0
.
7
0
O川 l

」ι
江

川 州l

!
i
.
1
‑
>7
1
.1
7
:
,
.
'
!
il

o川 l
O
.
!
I
¥

t
c
:
¥

IO.m
2
.
;
¥
,
1
I
.
j
(i

1
7
.1
‑
i7
l7
勾

0
.
h
7
0
.1
'
、

.
.
.
!
!
.
:
.
l
2
.
1
1
.1
‑
i
1
:
¥
'
‑
2討
2
)
)
7
:
'
.
1氏
。(I()

l
.
t
O

4と

I
.
!
(
)

l
t
i
.
O
I

1
¥5
.
l
i
7

475

1
.
6
6
7

(;.9~

1
.
¥
0

」
九7

。
,
"
11
.;
1
,
‑
1

7
.
1
'1
'
1
2九
九
1
.5
1
l
.
!H
0
.
(
、
7

句
"
I
.
h
:
;

"J"

1日0
0
.
7
1
;
1
.
1
:
1

匂
.
̲

O
.
:
i
l

2
.
0
:
1
I
.H
2

1
.1
1
1
.:
;
7
1
.
17
0 河川

:
!
:
U
i
!
i
'
)
'
)
向

1
0
.
1
1
2
.
7
¥
1

7
.i
1
!
1
!
,
(J
I
)

斗4
よ

り
"
1
.20
6凡1
1
.
!
I
:
!

iり7
1
.25

山
"

。
人

q
i
‑
n
‑

一

令ノ¥'/ん

(
i
t

!
日
り

l
i
.
l
i
l
リ 7
:
!
0
.
1
7
V
よ1
1
t
i
.
0
2
1
2
.
7
:
'

:
!
.
(
I
¥

j

¥
I
[
I
(
九̲.リ ¥
j
l
l
l
,

1
:
11
1
¥
付5
1
;

1
、
日h

O
.
H
日
t
O
.
7
1
i

,

A J A 1 A u n h A ‑ J川 AMmbA一HA‑j‑m‑

、冷出 '
¥
.
1
.
;、l
i
l
.
〆 1
I
!
I, J

も小"

」
以
止

l
i
.
:
lf

1
.1
:
1

:
;
.
¥
1
:
;
1
.
1
0
0
.
2当

1
.1
1
0.00

nio‑‑‑l‑占 rbF

1;; ,;';会,:!t・ If~illl ーポ~, tj:. ,
:
i
'A
!r

1
I
.
:
!
f
.
i1
O
.
l
i
:
U
I
I
.
!
J
:
H
1
.
5
7
1
1
.:
!
1、
日
0
μ汁
りf
り7
11
:
'
2
.
:
'
.1
'1
4751
7.

1
.
0
1
5
.
:
'
0
1
.5
"
l7
l
i
.(

'"引}

刻
。

,

¥
.
7
)

1引
,

1
.0
:
!

J

'
/
‑ (~"~'べ

¥
.
:
¥
1

1
0リN

[
l

1
1
.
:
!i
.
!
i.
l
刊
}

1
:
1的

1,,;:~

¥
.
1
:
¥
0
.
(
1
0

!日
川

2.
;
1
¥
1
.1
1

I
.
(
J
:
!

.
:
.
1

‑

1
2
.
.
'
;
り

O
.
:
!
¥
I
i
.i
:
2

t
i
.
H
I

、

1
i
J
且

寸
パ ‑JAJA‑‑H川一対一

17.;~L/l IIII. ,/I;ド 1',.'

k喰"間宮

1
.
:
:
:
1
5
.
:
;1
)

I
)
̲
J
(
)

1
1出}
2山:

、

リ

i

札似叫

I
li日 机

2
1
1完
り
I
.I
2
0
.
.
<
"り
O
.
:
!I
‑
¥

0
.
1
7
2り5
0
.
0
1
1
.
'
1.
:
1
.
1
2
1
2
.
1
0

1
.
!H
l
(
I.
I
I
Q

i

1
:
'
.:
1
'
;
,
:
,1
1
1
11;・山歌

問

1
~山
1
.2
1
にU
O
.
:
!
l
O
.
H
:
!
)H
1
0
.I

九0
"

1
.0

NリM

L(
l5
見
1
1り
2
.
2
1
(
1
.
1
1

.!.i~ H

1
1
.
.
1
:1

1
.
1
:
:

2
.
0
.
1

:U)
I
,

丸、ド以 l

5
.
7
H
I
1.¥川(ロリ日
当り 1
日バ 1
1
0
1
5
.
1
'
<
リ
1
.
2
t
i
l
入7
2
1
O
.
RI
‑
1I
1
.1
.
1
1
2
.
.1
‑
1
:UII
1
.7
0
1
:
!
町
民
2
.
7
2
1
7
.
:
1
2
01
7
1
0
.
1
11
¥1
0
.
.
1
1
1
1
).
1い1
(
J
.
(
川
172i
!1
1
:
¥
.
¥
1
0
1
1
¥
)
.
:
¥
7
1
1
(;
.
¥
1
1
;
1
21
.1
1
7
.
‑
'
;
(
11
1
0
.
2
7
1
札i
d
l
I
O
.!
i7
"
.
2川
1
.
1
¥
叫
1
.¥
17
1
:
U
l
l
i
!
:
:
.
5析1
'I. H~
Oリη 0 . '
汀1
:
1
,
.
"
;
1
1
:
u
I
;
1
2
.
.
1
.
1
β日 1
I
!
(
)
.
O
h
l
村 :
1
2
1
I
J
.
:
!
制
0ト川
2げ 1
肝
2
.
7
2
1
2
.
7
2
1
:
1
.2
1
.
iげ 1
2.H~1
:
1
.2
1
1
1
り2
1
1
.
(
;
:
¥
OO汁
o
.
m
.
.
1
0
.
2
7
1
(
l.
O
O
I
O
.
O
(
)
1
..
1
1
.
:
1
I
:L7:
d
1
7
.
.
1
0
1
I
¥I
.
{H
I
叩 2
7
1
1
:.
7
7
1
:
¥
.
2
2
1
1
.
(1
1
1
:
u)l1
1L
:
lH
:
!
以>
1
2
.
0
1
1
2
.
o
s
l
I
U
i
O
2
.
1
'
1
1
0リ7
1
1
1
.
:
¥1
0引
0
.
:
¥
2
1
1
.1
¥
1
:
民7
7
1
1
1
.1
!
1
1
1
:
1
.
21
‑1
2
1
.
1
.
1
I
(
)
.
:
I
I
I
1
日1
2
.
6
i
i
l
1.:叫1.
07
1民 I
川1
2
.
1
1
1
2.!¥lilλη
1
.
5
.
1
1
0171
1
.
11
7
1
0
.
.
¥
1
1
O.H
、
0
.
1
1
0
7ぉ制 1
7
.
:
;
0
1
1
1
.
:
¥
5
1
IU¥I
¥I
l
R
.
7
0
‑1
1
.1
1
1
1
り7
1
2
.
.
1
0
1
U)i
2
.
21
1
.2
6
1
1
(肘1
l
.
7j
l
1
.1
2
1
.
'
i
.
1
l
り
(
)
.
9
i
l
1
1
.
7
t
i
l
1
.2
2
1
1
.
1
‑
11
2
.
.
1
1
t
‑
.
:1
.
'
1.
1
.
¥
)
2
.
2
:
1
1
2
.
5
¥
1
1
2り 日 1 .1
1
.
1
1九1
0
.
5
1
1
o.I;~1
:
!
.
s
x
l
九 !
5
1
.
2
0
1
O
.
Hリ1
2
.i
!H
I
l
i
.
2
'
1
1
.
l
.
l
1j
1
.
1日1
2
.
7
1
i
l
1
.2
バ l . I
i
l
l
日己5
れ 1
7
1
1
).
.
1
1
1
札付 0
1
肘3
0
叩¥1‑11
2
0
.
1
2
1
2
人3
1
;
1
:
¥
札
お
り
2
5
.
0
1
1
1
:¥
.
1
叶
1
1
.
21
¥1
1
0
.
0叫
"ωI
2
2
.
7
1、
1
.1
:
¥
1
2
.!
i
1
l
:
1
.1
l
ω川 上 ! i
:
!
1
11
.
:
¥
1
¥
完7
汁
¥
.
5
2
1
2
.
!
ロ
1
九
三l
白川 1
t
1
:
1
.
1
)
1
1
1
1
.
2
2
1
7
.
:
1
:' . 1 五 叶
¥
.
.
1刈
l日
¥
1
.
1
り7
1
2
.
1
1討1
5
.
I1
!
5叶
¥
,
I
‑
I:
!
I
1
:引市
t附 1
H引
1
.
:
)
リ
,
0刈可
0
.1
‑
1
刈
2AOI
I
l
.
!
i
川
7
.
1
2
1
!
i
山
,1
:
1
.
1川
I
.H
O
I
百件リ
.
'
1
.
:
¥
叶
1
.
:
1
1
1
九台叶
1
.
.
'
1:
:
1
1
:
!
.
:
!
O
5泊1
1
.2
1
1
.
I
.
!
川1
I
:
U
)
)
6り汁
2ぷ叶
2
.
h
l
l
l
2
.
:
1
¥
1
1
2
.
.
%
1
.
;
.
1
;り
0山1
I
0
.
2
5
1
0
.
1人
(U21
()伽1
2
込.
H
I
I
2
¥
1
.
:
引d
:
¥
O
}
i
2
1
2
H
.
:
1
2
1
;
'
.
0刈 1
'
:
1
.:
)
1
1
1
.
1
2
1
.
'
i
臥)
1
1
1
.
:
以
I
.
;
H
I
230Jinul‑‑‑

札H

I
I
;
.
:
!1
I
.
H
iI

~

1
.
5
:
¥
o
.
i
J

υ
H
.
I
t2
1
:

.
1
.1
¥
2
1
九0
叶

川 15JAj;

(
!
I 、外

1
.
0
1
;
,
,1
7
1
.
'
i.
!
J
!
J
1
.
:
¥7
5対 l
:
1
.
2(
1
0
.
.
¥
1
;

2!
.
‑
1
.
'
1
l
:l
.
Ii
l

"
'
.
'

",.~.,

i
!.
H
¥
1
l
.t
i
s

1
.
0
:
1

0
.
1
1
;
'
i
l
i
.
7i

.
!
w
l

0
.
1
2

斗2!

h
.
i
3
I.m
0
.
7
5
.
:
'村

り 1
¥
1

0
.
2
:
¥

0似1

1
.
7
0

1
.7
7
1
.7
7

1
1
,
].

2
.7
b

I
:
!
.
(川

山 山 川 山 川 叩 一 川 一 川 山 川 附 川一川一山一間

…

1
1..t;?ノヨ(外本)

:
;
.
.
"
1
1
¥.
5¥
1
2,
1
¥
り

‑

0
.
1
2
k
.
!
l
i

l
J.
7
o
l
O
.
i
l(
7
.
¥
11
'

1
.
1
;
)

山川山川川口市川山川古川↑川一四

112F‑11‑
1
:
¥ホノ )'1,
(1-i~)

,

ぷ~
11
.0
7
1
.
1
、J

、

1
.1

2
.
1i
'
0
.
¥
1
;
'
1
.
1
.
1
U:I
O
.
I
!
I

九 1
;

i

lれ 1

‑
‑

1
.2
¥

0民 I

川町 1
1

J

1
'
1
.
>
‑
¥
'
<
(
1
1j
.
: 外木)

'
"
ロ
ソ
ワ(
1
1イ
、
)
H υ ノ勺(外公)

2
.
1
1
三号
0
.
:
1
1
1
O
.
!
f
i
n
.
H
:
!
1
2
.1
..
1
H
日:
;
1
:
U
i
'
Hげ 九
コ5
1
:
¥
'
U
I

1
.
0
1
;
;
.
0
;
;
0
.
1
1

I
.
:
I
!
I
1
.
i7
1
)
.1
~1
"U5
I九2
1
1
.
7

!
)
7
2リ5
1
,,'
;
¥
1
1
2
.
¥ド}
;
!
.
I
り

目(1(1

'
"
川
J
.H
h

1
)
,1

2
.
¥
1り
11
.1
1
2
1
.0
¥
1
:
1
.
H
l
o日0
2
7日
純1
)
1
1

市山山川一山一川山山川

"山 ~'l 山 (II{>.: ・外七)

¥
1
.'γ 円引外ホ)
"弘恥山 {
I
I-i~l

2
.
7
1

~I .i肘

‑

i
︐}

日以,~;山(外オ、}

I
.
:
IJ
!
1
.
0
0
i
:
!
.
7
1
1
1
.
1
;
1
1

1
:1
.
:
11

,,~

﹄

I
.
!
)
,
¥

JUl

.
ι

\.~日}

,

包

301
5 りq

1
.1
:
¥
1

1
1
.
1
0
1
:
!
.
I
H
I
1
.l
f
i
l
J
.
:
!
1
I

'
"
ヒ
'
,
"I~号 (11 に}

1
.:
;
1

1
.:
'
2
:
!
.
.
'
‑
H
0
.
7
h
‑
1
1
2
.1
U¥O
2
.
0
:
1

0
.
1
2

"
'
)
'
:

勺日

斗
.
.
.
!
l
!
.
'
1
;
,
:
¥
:
:

!
l.
:
!
5

'
1

211

"
1

‑

川一川一川山山川山山川川山山山一川一川山山山川山川川川一川一山川川川一川一川一川一醐

HNC

"
,
、ι
1
.
1
1
1>
1
、
)

1
1
1
κ

l
i
.
:
1
1
2加

0
.
1
:
¥

1
コ07

ι
i!
.
l

oah

‑

.
.
!
k
斗
1
:
1
.
1
:
1
:
!
.
7
:
1

.
.
.
!
!
.
:
,
;
己

止と

J
.
!7

0
.
7仏
1
.¥
1
)

u
n 同泊︒

~!.l(日目的"刷(外た)

り
.
:
l
:H
.
1:I~II
:
!
.
o
l
l
ト1
7
1

1:1
l
,
Ii
¥
2りl

2
.
01‑¥
2υ5
0
.
1
:
;

777H

1
り 1 t.:狗嗣 'U町民"地
:
!
n
.
J
(
f
:
'
r
'
I
(
M臆 制 (
1
1‑
1
.
)

:
l
.
:
;
i
i

り:;()

i
2
.
:
¥(
1
2
.
!
'
7
2
.
¥
1元

。州】

υ

虻盟三壬

.
:
!
I
i
o
.i
1
0
.
1~
5
.
5
'
;
'
l
.:
!
i
o
.~)7

1,,'i~
Oり
百

7
.
5
1
!
.
1
7

HJ﹄

~.o:!1

1
.1
.
'
i
i
,
()
(
J

O
.
O(
l

込4

~
1
.7
1
‑
>

2
.
0
2
0
.
1
¥
1

121 り

乙川河

f
i
.
O
l
:
1
.5
f
i
O
.
!
J
H
1
:
'
)
.
:
1
7
:
1
.
11
:

l
1
1
1リ7

1
.5
2
¥
.
2
:
¥

りり 3 り日

7

1 1\.::';,ージ )J ll.{ 外 ~J

1
7
.
1
:八歌山小し 1
:
'
"ー

0
.
1
2

斗
.
:
!
2

O
.
I
J

M
1
‑

円"

51712

11
.1ぶ人 (
/
)
(
:
1
1
0オへノ
1
:
;ミ ージ 1
1
/
.
‑
(
1
1本}

r:Ui へノ・刈へし ;;i/( 坪 'I~)

q射2

:
¥
.
i
i
リ

札1
2
1
O
.
D
!
I
1
5
.1 ¥ 凡 h()
:
1
.
7
2
1
1
..
1
1
2
.
:
¥
'
1
1
1
.
2
1
1
I
.
1
i
:
1
I
O
.
2
i
川.:m
:
;
.
1引

1
2オへノ吋へレ ;
;
'
/
/
1
1 日)

1
.1
0
2
.
(
;
1
̲.ド 3

乃:¥.ふ刈}

4へZノ 日

1
0
.
7
1

)
1
)
, 1
0

一

.
;
.
1九
¥
.
7
1、

佐川叩

6.;1ι ヒ ~-)-'-MJf'l 1

りO
り

以と

山川川山山川一川一日山山山山川川一川一川山山山叩山山一山一山山川山川川氏山山川山一山一山山川川山山山一川市川山川一川一川一山一川

附

7
川
l
.:
¥
l
i
o
.
!
)
(
;
)
,7

:
1
.
0
:
'
0
.
7
1
1
2
.
1
1

1
‑
>.
0
:
'

保守

剖

!'(~!)I

,

Ui
l
0
.
7
0
1
.1
、
1
0
.
2
5
11
.
¥
に3

!
i¥
O

iF

札2

β
5
川ム

:
,
̲iíi [l\~1

1
.1
7
1
.1
:
;

y
し
.
1
l1

I
q
l
l

系川

己立些立記些血l
i

且込邑虫L

:
;
.
:
11
{

0
.
:
;
1
1
).
:
;
1

i
l
I織

MA‑P

、

I

.;.:~ i
!

一
九W
l
J
︐
?
T

げJ
引
恥

1
.
5
7
l九
1

叩
山
附叩

じu

‑

7
.
7丸
I
.H
7
1
.2
り
1
.
:
;1
)
0,1
1
1

t
P
f
,
:
l
.
!
5

1

Hηl
川川

コ
可

以納 l
主

I

引引

I

l能 '
)
1
;,
(
2 え究:
{
司x
T
$i
五・スー円

I

h A

7
1

仏ど

~ti~j 山

え
リ
文
ケ

)
.
.
;
'
?
I
'
i
(正j世

1
.1

出山川山川一山古山川山山川川一山一川山川川山山川一川市川山山川山山川一叫川町一山山山山州側川川川盟川一川川川山川川山川川市一川山川川一川一川市一則

与年必且

I

リ;(

m
‑
‑
iFi

性別・大学所在地・学部・学年目1
'
にみた過去 1年間のライブ鑑賞経験の状況

iri
k

表5
何日'
1

ー
うI
t
;

123.
[beta]
表 6 性別・大学所在地・学部・学年別にみた通算ライブ鑑賞経験の状況
f
'
!
I
J
q

令f
j、

~fi.filil

:!(L~I~

上
保
九I

,
1
.0
1

1
:
!
.
Oリ

リい
7

ム
i
;
.
!
!
.
.
!
.
且
出
土
品
必
品

札民

込斗瓜旦

山 首 , ,7

!I.I,'~ rí\I~11

1
1
1入 院 削

仕
手
子υ
"

見代川削

日

は
il
.
H
? と 山

b

10.~

'j

,
'
: 山 V
:
i~魚りにJ
;巴

:
:
1
.7
x
.
!
I
!
1
1
1
;
.
l
i
¥
1
1

1
:0
.
1
2
i. 'i,~

勾ー

1
¥.
"
1
(
J
.
:
!S

L
i
'.
1巾

:
:
.
i
.
l
:
:

l
パ:
H
I

!
日
目

l
i
.
I
!
1

1
.1
¥
¥
1
.~ 1
2
日7
1引

、

,;,'"州刊
:
¥
.
!
叫
2山刊
1
.1
辺
1
.1
H
I
1
.
1川 l
出向1
1
i
.
.
!
i
l
i
l
¥
0
.1
1
1
1
1
.
:
.
:
1
1
o
.
H
z
l
(ud
附 附1
3.8651

おH

1
.
:
'
:
;
'
,.,附

仏削
.
'
1.
1
:
1

:
:
:
.
9討
(
!
り2
7
1
2
7叩
i
.
.
2
H
1
J.:l ~1
O
.
D
i
i
1
.
2
:
¥
1
.
:
'
:
:
¥
I
!:i目
3
.
3
7
4
引

1

:;:!刷、"',;01
1
0川 1
11
.l
i
l
1:¥訓 1
.
I
九1
:'::I.~川:!I. I!I
I
!I
:
'
:
.
Kf
I
7
.
¥
1
:
;
1
I
I
.
:
'
;
O
2
.
0
1
1
:
1
.
1
.
"
,
1
り7
:
¥
1
;
.
1川 、 ¥ : i.HI
ユi
.
:
¥
f
i
:
'
:
.
5
:
'
1
7
.
11
町1
:
1
.:
17
1
1
.1¥
1
九日九
~.HII
~.I i-II
I
.
.
"
)
f
!
0
:
1
1
1
1
.
:
'
:
2
1
1
.
:
1
:
1
1
"附 1
n
.
I
:
!
1
.
'
il
.:
1
1
>
2旬以 1
I
2
0
.
l
t
i
f
2!î.~ r.
.
'
i.
l
o
l
1
¥
.
5
0
1
l
i
.仰
山 間1
:
1
1日 1
:
¥
f
l
.
2
7
0(
川l
札l
i
:l
0
.
1
:
¥
(
)
,7
7
1
1
.2
7
1
1
.1
1
07 1
1
.
27
1
1
.1
.
1
:
1
¥
.
11
引1
.
7
2
1
口1
7
4151
2.2061
1
.
7
1
4

印

日O
.
i
i
l

,

,

:
!
;
I
1
7川
:D付?
i
U
i
2
1
.
1:
1
i
υ
1
.
1
7
.:
1
2
1
1
.¥
0
1
.
1
1
7
0川
5!
.
1i
f
i

4占
止

半以と

¥
.
'
i.
2
2

1022
i
司 1
:
1
.
11
!
1
:
!
1
.1i
:

‑
f
¥
.
H
H

1
.
7
元

乃は

1
(
)
.
i
l
:
!
2
.
2
1

,'0九

I
:
U
i
2

J己山 1

i【
}
日

バ
"
,
可

,

り
、

I
.
h
.
'

7
.
1
¥
1
0
.
.
1
5

り
。

l

山 り"
1

叩 川1

jI
.:
!
o
l
1
7時l
¥
,
;
]0
¥
.
I
H
1
1日
村
¥
.
12
1
.2
:
i
1
.7
7

‑

」と

U 側、

:
1
f
I.0'
i

1
0
'
:
;
1
i
り 01
‑
>
1
1
.
1
2
0
.
1
.
:
1
(un
1
!1
.:
n
883

1
.¥
1
1
:
1.
0
:
¥

i
‑
l.
Ii
'
.

お
付 "

“~!:i

1
1
.
7
5
1
)
.
2
1
1
I.
5
!
1
0
.
5
9

‑

り
よ1
!
l
909

、
0
.
:
有

.
.
'
j
¥

¥
.
¥
0

I
O
.
7
!
1
Jリ2
1
.5
2
:
‑
;
.
1
2
0
.
1
:
1
:
;
7乙i
¥
1
;
.
1
7
1
1
1
.
0
:
¥

1
(
)
.()~ 1

1
i
:.
2
1
O
.
7
!
1
7
1
>.
1
1、
1
.1
.
:
1
:
:
:
!
:
!
J
i
7

バ口

と
日
;
.
(
JI

:
.
!
i,
I
)
(
¥
S
.
I
I
I
1
:
!
.
I
.
j
t
i
.
S
i
I
:
.
!
.
:
.
!
I

:
i
1
.1
1
;

¥
1
.:
¥
1

I
I
.
!
I
.
'
"
,
(
.
:
;
7
<
1
.
5

~I. :
¥
}

J
り7
1
1
:
1
'
‑
.
1l

引¥
.
:
¥
:
1
1

~:i.-\ HI

k
.
:
!
!
J
f
l
1
.
:
:
:
.
:
1
1
1川 1
!
I
.
¥
H
I
2
2
.
5
:
.
,
;
5
¥
1
2
.
7
1
;
:
¥
‑
1山
;
>
.
1
1
:
'
:
.
7
:
1
1
.
71
:
1
.0
(
1

)
(
1
.
0
:
1
1
[
l
河
川1
l
f
o
i
.
1l
11
1
).
I
¥
n
l
1
:
'
:
1
.0
7

;
(
)
,
.
!
目

l

1
~I.!;:I

コJコ1

1
¥
1
日
?

!
¥
I
.
I、!
1
‑
1.
0'
1

、

出│ ; ; ; l u │ l : : ;

1

11
:
¥

パ
(
1
:
;
.
'
i.
iリ

.
i
i
.
5
1
1
印り1
1
(
1)
1
0
1
:
!
:
'
:
.
O
l
日 1
7
1
2
:
'
:
.
1
1
1
九1
7
.
0
7
1
1リ
¥
'
1
):
1
1
u川1
1
:
1
.
1!
l1
1
:
'
:
.
:
;
0
1
氏 ¥ I ! パ ,1
l
.
(i
!
1
1
1
¥
.
;
!
Z
I
I
.
(i
l
l
:UII
0171
1
.2
H
I
1LRd
日 川1
1
'
1.
0
1
1
2
5
.
1
¥
7
1
.
r
.
H
7
1
)
;
日
:
il
1
:
¥
.
5
7
1
'
1
0
.
0
0
1
0
.
1
7
1
0
.
1
:
:
1
0911
1
2
:
;
1
{山 1
1
.
2
:
.
:
1
1
υ
7
.
1
)
1
1
¥
1
1川 1
4751β871

1
"
,
、i
(
l
日I
.
:
!
!
I

"
コ
パ
"
九
"
勺 i
内

M

1
.'
1
日

,

7りi

市
"
出 1
(
;

民
1
:
!
:
1
:
:
.
:
'
:
2
O
.
:
!
(
i
1
.υ
0
1
.(
1
1
¥
附則

3.
498

、

)
1
)
(
;

J月1
¥
5
.
0
:
¥
:
‑
;
.
1
2
1
:
¥
1
0
.
1
3

11
.2
1

(
1.
1
;
7

。

t
i
.
:
l
:
i

1
.
1
7
¥
]
.
!
;
o

1
.;
1
7
2
'.
7句

1
.
1
日

斗
J
i
l
l
.
J
:
l.
!
1
1

.
!
J
!
1
2
:1
!
i
.
!
l
h
l
::
U
;
:
1
0
.
0
0

lli
O
.
7
1
i

~
875

l:!.!)~

、

1
2
.
12

り 1
:
1

7り
1
2
.
.
¥刊
i

。刷

1
;
1
1白
勺
¥
¥
1
.
5
1
、
1
2弘
ηi
'
.0

1
:¥
.
1
1
t ¥
i
1
¥
1
1
7
(
;
.
1
3
九7
日
1
1
:
!
.
:
¥
H
2
:
i
.i
2
1

、

九
九

1
1
:
'
:
.
1
日)
.
:
'
:
1
1
1.
1
;
(
;
1
7
.
l
i
7
1
九
i
:
l1
:
!
.
7
!
¥
1
!
O.HI
1
.
:
i7
1
1山 1
1
.0
0
1
l
1
.
7
2
1
印 :
1
1
1
I
;
¥
U
I
:¥
日7
1
1
2日 1
札りれ

(
1
.
72
1
仏7
2
1
札 。7
1
8681

"河川

ム
.
.
!
z
¥
7
.
0
1
1
1
.
.
:
2
:
'
.
t
i
'
l
iり5

1
7
.
.
;
2
'
‑
.
I
J
)

I
.1
"
I
(
I

0
.
:¥0
2
¥
1
.
0
1
h川

¥
.
7
i

町"
I
:
l
.
司
i
:
"
.
.
'
(
1
.
1
1
:
.
!
.
H
I

1
1吋
九
1
町 1
1
1
:
!
.
!
H
1
0
.
6
2
O
.
J
l

」止1

1
;l
.:\~ I

5り
;
,
:
.
!

‑

1
0
.
.
1、
1
1約
九
1
5
.
:
1
1
II
!
I
I.
11
.
:
¥
(
;

!
!
.
1
"
I
:
!
7
.
6
0
:
!
(
)
.
2
7
I
H
.
O.
'
i
:
!
7
.
5
H
I
リ7
1
1
0,

":
1
[
1
H
.
7
:
.
:
1
1
:
¥
.
0
:
:
1
1 .'i .:':~1

1
.
.
'
i7
1
2
.
(
1
1
1
日2
.
72
'1
1
.
31
1
.
t1
0
1
2
.
1
1
1
O
.
!
II
1
札 制1
2
7
.
:
'
:
1
1
i
:.
!
i
O
I
1
:1
.7
2
1
0
.
1
1
1
0
.
5
1
1
I
J
.
:
iJ
I
1
¥:
1
川1
1
.
9
2
51

9

、

日}ど l

ll
.
i
民
1
1
.
.
¥
2
1
2
.
1
7

山;
.
!
I
I
;
I

1
1
1仰 1
1
J
.
:
J
.
i1
.
'
i
:
1
.
‑
I~II

1
:
:
.
2
:
1
1
;
;
;
1訓 7
1
i
:.
i
i
l
:
!
.
U;
j
J
7.
1
泊1
.
I
,
!
l
(
i
!

:
¥
.
.
"
I
¥
[
2
.
1
2
1

品計
1 1.(川l
村羽

叶

日川日
九 .H~
目引

:
11
.7[¥
1
よ 2
1
:
!
i
.
H1
札
:
I
:
!
I
i
!1
.2
(
11
は

i
.1¥1[
1
.!
IO
1
1
)
.
い
日
1.
1
1
:
1
1
.
1
)
川

へ
4河

:
¥
H
.
2
1
:
!
I
.
:
!I
!
~!I.:':;
似1

i
!i
.7~
ぷ上ユ1
1[ 号

.
1
¥
.
1
1
;

コ
,
;

,

¥
1
.
:
0

(
}
.
O(
J

:I .'i.~

可日

山.
I
2
1

1
:
!
.
:
!
O
I
!
)
.
I,;

.
'
l.
7
(
;
1

5

ベ

~(I .()OI
川上只

丸 1“
廿

l川 :
.
!
I
11
.1
0
1

{
¥
I)
.
;
¥
:
!
I

i
.
:
I
:
!
.
:
!
O
I
.
{
;
:
:
川.
1
1

1
;~. ¥
1
¥1

先制

(
)
.
f
i
(
ll

2

げ

吋

l上
九
自

2
.
1
.
5
!
1
1
¥
0
.
,
(1
1
(
)
同1
訓川元 1
1
:
¥
.
1
6
1
出 .
1
i
'1
7
.
:
H
I

2
:
;.
1;
0
1
II
.R
I
I
I
J
.
:
I;
;
I
1
>1出│
¥
I
i
.¥
1
2
7
.(
11
り'2H
日 刊 1 ] 九1
:
¥
I
i
.~J:号
.12....,1->
れ.
R
7
1
7
九日!I
L(
lO
2
.
1i
:1
2
.
7三

自

(J.( ~Hl

1.2~lf

り2

1
!
l
.
!
ld

.
'
i0日 l
'
2
.
'
i
.
:
i
川I

1
0
2
2
.
'
)
(
)
H肘1
:
H
,
iO
;
r
0
.
1
1
..
1
1
1
.1
.
1
92引
675

7
.
7ミ1
;
j
1
i.
!
I
H
I
1
.
11
リ
1
.1
凶1
I
.
l
Ii
l
!J:!.~d
9
1川 1
2.5501 β 7 3 1

引

日L制:;'J.:I.~

2
':
.
.
I
H
I

1
;
.
7
1
1
:
¥
1
‑
;
.
0
7
1
0
.
1
7
1
1
.1
り1
1
.
1り1

:
1
7
.
1
C
:
.
!
¥
)
.
:
!
7
7
.
:
1
2

加

時

己

2
1
.
1
1
いけ

~H.lì!11

斗
J
!
!
i

:
.
!
O
.
:
I
I

‑
1.
1
1
2
7
.1
1
.:
1
2
1
l
‑
1.
I
O
札:
1
2

ql
lonsO
K707
1122

1
;
:
1
1

:
.
!
I
;
.
:
I
I
I

1
0
.i
'
.l
:
1.
7
1
1
1
)
.
.
)
¥
1
1
7
.
¥
1
:
1
!.
:
!
1
2i
O
.¥
(
)
印 1
1
1
:i
.H2
'
.
!
J
.
2i
Jリ7

‑

~q:n I

争1
.
1
2
1

U011
A112
NG71

1
.
1り i

h札5
1
り 1
い
¥
!
I
.,I
H

H
.
1
2

1
0
.
.
1
7
.
2
1
¥
1
1
.
1
0
Z
:
I
.
2
0
1
1
.2
5
2
1
:
i
:1
.1
9
1
0
.
7
0

l
:.
IW

臼白川

l
i
:
¥
.
O
H
1
:
.
!
.l
¥j
¥
1
.
0
7
6
.
(
¥
2
3
肘5
1
{

W50U
INN‑
‑R! と

:
:
I
.l
J
:
:

円"

.
.
.
.
!
k
.
.
!
.
!

25202
2NOON
N7h71

1
~I. '1~ I

7.
~17
1
7
.!
l
1
I

0
.
3
り
3
¥
1
.
1
)
(
;
、
1
;
.
2
1
1
.
:
;
山
1 M、
1
1
1机
、
7
.
:
'
,
1
¥

.
.
.
s
l
!
出4
立

l
i
l
.
!
l
.
(
¥
2
.
R
!
1
H
.
7
h
U
¥
:
!
ι
¥
.i
'
.2
1
1
7
.
1:
2
1
.
H
7
0
.
2
5

221UON1
5 5 N り 211h
Hihh555 り

1
:
,
.
:
'
.
1

1
1
.1
¥
.
<
'
:
l
り2
0
,
I
O
.
l
i
.
'

2l
.
!
il

2,
1
.0
1
.
II
!
I

7りh

7 り 3un7
日同九 1l

1
1
;
.~, 1
.
.
l
i
:
!

1
:
¥
.(I:~

¥
1
.7
1
;

1
5
.
.
¥
.
'
¥

1
O.
1行
日7!
l
r
'
.
1
ι
i

1
.
:
'
"

i

1
11
.
1;
7

、

u、りい

¥
0.
1

』以A

̲
!
i
l
l

1
;
1

:
¥
(
1

1
'
1

午川

A
込斗

:
'
.
:
1
1

:
.
:
¥
1
"
1

1
.
'
.
.
7
:
¥
1
1
:
:
:
'
.
!
コ
ロi
1
0
.
7
:
,

i
H
.
l
l
i
17
7
.'
5りi

山惚ぷ
3
7
.
1辺
山J
.
H
l
tυ7
1
:1
.:
¥
1
0
.
7
2
仏S
.
:
¥
f
l
:
1
.
12
7

ー

ー

ph 3 i i g

九
,7
7
1

;
;
'
1
.
1
1
1
1
:
:
.
7
1
1
7九
三
1.
11
と
山 1
1

(
1.
.
1
2

I

1

¥
0
.
2
0
よL9R
.
1
.
.
1
1
I
I.
!
i
:
'
i

とよ、

ベコ

M 知的出

:
U
.
t
lペ1

「 川

hkhrn 九 i
1
1 九日hit九
h{rJ
川 !?!"t1hl

川山川

吋 1110J2
1112lJ2

1
!
1
.
o
o
l

引

2
:
!
.
!
1
:
¥
.
72
1
:1
I
.i
h

り鳥り

‑

込ぶ

中部

I
(.
2
i
1
21
.¥
1
.
'
,

:.!){.~ï

:
I
.
!h
i

2
7
.
H
O
i
可I
!
I

,

JJI~ ¥
.:
'
j

2
7九0
.0
7
21
I
.
:
H
l

の7
0
1
:
¥.
1
0
¥
1
.01
¥

‑

H
i
.
.
'
ld
l
ι
1
.
2
1

州大役削桝.;';他シ』一

戸
:
1
.
1
¥
,

t
.
:
l
れ

1
1
.
7
:
:
:

加山!

三J
叫
1
1
.0
:
.
:
1
l
刊 川1
1
2
5
.
:
:
:川
1
t
i
.
H川
1
;I~ 川
1
{I山 1
1
1
.
0
0
1
1
川
I!I
り 1
0
1
1
7.4751

コ
ユ
"

.
1
1
.1
払3

1
7
.1
>7
1
1
:
1山 仏 仙 1
:
'
:
3
.
7叶
川 ロ ノ ク { 外 来 ! ¥ . : ¥ : I リ
7
.
1ゆ 1
1 乙 ;':_~i ーミ 1 ーシック・ノ!ーク 11 川、タ H
:
L
:
'
:
η
:
1.
2川
U.*ツ ノ 吋 1.t~)
:
U
i川"
,引叫

l

!
l
t
i

り巾

n
.
l
:
!

:
;
.
:
1
パ
1
.
:
¥0
1
:
:肘 1

日

1
1

旦A

n
.
1
7
l
川
、 1
1

~Uj~1

5
1早 川 I
'
I
̲仰 K決;ご能
3
;
}
I
(
I
;
】
3
:
!
;
.
:
.,
り
い
令ンヤ ;
"
1
.
1
イ
l
仙ザ〆ヴル t
,

川

¥
!
I
.
:
!
(
I

:
!
7
.
.I
li

0
.
1
1
.ï~) .
15

日1
.
.1
(;
1

,:0."リー力次

竹川、

O
.7
:
l

也記

‑
"
.
"

(
1
̲
.
'
i6

10.' ,>, ::(II.t同

1 吋:~; '
:
/
l
'if~ 山尚刷j;.,:fl.I:

11
.7
パ

l::;│:;;1111211111

民

:j‑ 目安

ぷ
J
!
!
.

.
.
.
.
Q
;
2

}句今守

0
.
7
1
1

:
¥
(
1ン 1
"
)
:
(
1
1本 斗 に )

I
(i出 放

uりi

,

'
1
.
(
ドi

l
ι
1
.
:1
‑
1
:
!
(
i
.
7
7
0
.
.
1
7

O
.
:
!'
1

主Lとニ.
i
l
1
I
一一一

!?そ山側1
υ
1オJ
ヒ

川
"
1
1
.
:
¥2

司¥1'

‑

:
i
5
.7
:
1
1
7
.
1
7
7
.
0可
:
!
.
!
I
:
J
¥
:
1
.2
1
11
.I;~I
1
2
匂白ご、

1
1
1
.
2
:
¥
.
I
:
U1

1
1
;
ζ
1
5

¥
.
II
(
¥

:
H外オ、}

k於 " 能

"
.
1
;
1

1
:
;.
5
り

4必

1
1
:
i
.
¥
9
ス1.(;
0

1l
.
t;
'
1

"作'>0仰 111 ド・外~~ 1

l 詩歌出州出 ::i~

1
1日l
肘 2
!
J
:
!
.
7
:
!
¥
'
,
.
1
(
,
i
.
l
l
i

1
2
.
H
よ
l
.
ll

九 I)H

Jり
?

I:;.~.~.;~:~:~(II~、}

,.,ポップス(外来

4込i

"
.
"
5

.
i
:I
.
(
¥
)

11
.7
0

日 以息日

止ニヰ叫丘とと5

I
t
i
.
!
I
.
1
l
り1
2
:
:
.
.
0
1
0
.
‑
1
1

I
:
U
'L
¥

I
J
.
.
"
乃

己&

1
:
!
.
:
:
1

1
0.I~ '
,
'I'
,
;(
I
I
本}
1.
;
:'
,
',~,ト{外 j、 J

~(i.l I~11

;
;
.
;
;
0

I~I リ i

0り 1

担止2

仁 川 " 川

::~J:';:I/.H',、 (j; f.:・外 ~.l

:
;
;
t
(
1
1イ、外 '
t
l
1
.
'
",
¥
(
i
.:~I\" , (
1々、・外 i
、
}
1
7
./
1
;,~,~

1
~. ~l 1

1
2
.
7
1
ι
!
l
.
l
i
l

‑
込&l

民川

仰上げ

干 判

J
内オーーワ丸].,:ノ{外 u

可

¥
:
‑
;
.
1
.
1

‑

札、 H
:
¥

I

l

中川

QjQe
コ
256

HNH

:
:
1
. ! / ) 〆 ノ リ ← ゲ /''.(1' 1
、外七}
:
!
.
'
}
.
,
, !
.
̲
.
.
.
.
〆 λ
1
1
1本・ 5
トj
、J

1
.
'
;,
'
"

.
'
i
,
1
l1

:
1
.
1
7
1
1
.'
<
;
;
1
1
1
1川 上1

日H1
J

'
1
.
1
[1

:
.
!
.
!
Ii
'
.

」止立

1
1
.1
(
l
t
、
:
¥
.
)
1
1
.
!
1
1

1日系

口町
引 qh
qJI‑NO

ト1町
内

1
.
:
1
凶1

丸、

υ1
:h
l
引 1
1
'.
1.
1
:
:

川

" 、 ̲~r. (11
.
、
)
:いによ(外収}

も川

1
:,1
1
1
!
.
:
.
!
.
)

¥
I
i
.
l
i
:!:~. 7
2

山日叶川

孔り叫

¥
1.
‑
1
:1

h 177

・

~¥
.
[.
¥r
?
;1
,抗!可制 t外 七 3

口一一一一

I
O
:
.
!
l
i
.
l
l¥
I

~ "1本 叫 1
1
1
'(
/
;
h
;
;
'
,i
也
I
日 I
(
{
;
‑
;
.
](
!
i
t~~r 刷 (I! ~, J

i以且

2h7

川 " 対 処

1
)5
1

l
i
Oリ l
I:U7
II
.U

175

己えと県立と三斗
江比二三4一一一一

持‑‑

」出

~.()2

1
'
1
.:
1
;
;
1
0
.
0
1

‑

\~I. ,
!

U門川白

:
!
i•:;~lI
;
:i川
旬日υ 7 . 1 1 1
7
.
7
'
1
1
【川
仏'
!
i
l
0
.
1
"

l
.
IH

、

二7
.
.
¥
(
21
.
:
l
I
i
.
IZ
!
l
!
l
.
Ii
2

1

l

m り 7 山一川一川

コ 山

J

I
:
!
l
i
l円 シ

:1 1.~り

2日7H

以斗

l
I
Li
'1
1
:1
.
3
:
1
1
.2
:
;
un
1
)
.
5
¥
1

A山ぷ
下町

川 l h引

I
:~. ‑
.
1ヘサ・オヘ ノ ゾ (
1
1
.
1、)
1
:
1オ へ ノ 4
ノ"
1外 市 }
¥
1
.1 ト人, /
)
(
:
'
]
1
1ォ 、〉
i
三、,""ゾjん():-1~1
I
li、 ー 力パ(タトオ、)
1
7
.,
'
:
,制
山f
r
;
.
(ピ r

~I

~:-;.7 !-1

J
v
H
l

日目出

1
1
.7
7
1
:
l
i
¥
1
.
!
'
l
i
l
'
1.
1
:
¥
制
,
;
l
i
̲
!
)
o
l
:
¥
!
i.
7河
川刊
刊.
7
1
1
11
.
!
¥
;
d 、 山.
0
1
o
̲
1
1
1
0
.
2
7

一山'íl~

;.ll!代的 'J"~'Il"
H
."
i
:
'
L
.
‑
'γ ",1,γυ 》川

‑

ι
t1
.
:
¥1
2iUl
1
.1
>
7
;0討7

q
qi
J

i
'
j
筑

970

I\';!:;:.-

I R 3 5 1 0 ‑ o 一7 0 1 7 1 2 h I ‑ 2 ‑ 3

)

九州 ¥
'
1

'
1
1いい

,
)I
'l
<
f

川一川川川川一山一M M M M M 川 州 市 布 川 山 川 山 川 川 一 川 一 川 山 川 川 山 川 山 山 一 山 一 山 川 川 山

{可U~ L!c .'I.- .,、 -':.lk\':II~

2
f
i
.
!
!
!
1

1

It前川

円一州川γ 日 川 川 目 的 川 口 山 口 川 一 川 一 川 川 削 山 川 出 川 一 出 一 山

I
.i
'
f
i
c・
)
1
:
,
'
:
'
,! )_'X~

J
時
;
'
:
11

川',Jたう〉日)

心ヰi!1fl
hI
K‑05who‑o‑

じ
牛
以
!
t
l
.

I

リJ(

:
¥
:
¥
.
.
1
:
;
1
7州?
0
.
0
0
川 ¥
.
1
2
'2
.
7い
!リヨ l
~U:I

H
.I
.
¥
!
IU I

,

約 1
:
1

H
.
I
:
¥
LHH

以斗
HUi汚

←

21
.1
!九
IUH
:
!
7
.
(
i
l
(
1
.
(
10

立
.
!
'
l

O
.
H
I
ミ
J
2
.
l
i
H
¥29

‑

124.
[beta]
表 7 過去 1年 間 の 実 演 芸 術 の 鑑 賞 経 験 率 の 変 化
ヰ~ 1
回調査

全体
伝統前劇
1
.
能'
1
1
0
1
2丈 島
3欧屍{走
1現代歌拷伎
5その他の伝統演劇
│
現 ¥
"
.
:
t
¥
I
i
劇
6.r~í朗

i刷
7ホヒ斗ラ‑(l
8新派・新 朋
J
}
9現代的小劇 J

w

10 外 [ëll~1凶

1
1
.アマチュア摘11'1
12J~"î'î: ~1

人
の
形
抽
劇の
1
3手
】
1
.{
"
i
f
>
!
r
l
!oJ
R
.f
l
:
:
楠
刷
オヘラ坤
1
5オベラ(日本}
日オへラ{外来}
i
l
l作オへヲ
1
7日本人の i
1
8ミュージプ'}'レ(Il本)
}
I
:
"
(外 的
1
9
.ミュージブ'
20レヒュー
2
1その{邑のオベラ'耳
舞制・夢野俊
.,日本舞踊ー伝統主建
0
t
i‑.民族持制{日本)
2
3
.
1f
2
<
1
.
1
.
<
:
m
.
1
止政舞踊{外来}
2
5パレエ(日本}
部バレエ{外来}
2
iモダノダンス{日本)
2
8そグングンス{外来)
2
:
9蝿1/;‑ハフ方ーマン y、(fI本)
3
0
.
1
聖路・ /'7";!'‑.,'ンス(外来)
!
I本・外来)
3
1コンテンポラリーダンス (

:
x

リ
I
J
'
‑
f

2
.
6
0
.
7
1
1
.5

2
.
3
0
.
5
3
.
3

。2

0
.
1

8
.
6
1
.5
0
.
.
1
0
.
6
0
.
8
l
札
I
l
.
,
匂B
0.
'
1

5
.
2
i
.
3
0
.
1
O
.
i
0
.
6
月5
1
.
.
1
1
.8
0
.
2

0
.
8

1
.6
0
.
3

11
.8

1
.
.

:
.
u

J
.
:l

0
.
5

1
.0

0
.
.

言~.![ìiJ ,.i\l N
訂3
回 調:
1
i
調1<
第2ドl
女,
も
々 lょ
男子
~J T
公r
,
女子
全1
ド
お2
5
.
6
2
.
5
2
.
1
9
.
7
1
.0
5
.
3
3
.
2
2
.
3
1
.2
3
.
5
u
1
.2
2
.
9
2.
‑
1
1
.1
0
.
.
1
0
.
5
0
.
1
)
0
.
8
0
.
9
0
.
3
1
.1
1
.0
0
.
5
。ι
3
.
0
:
'
:
.
0
1
.8
0
.
8
3
.
0
0
5
1
S
.
9
2
0
.
5
0
.
2
0
.
1
0
.
2
O
.
:
i
0
.
1
O
.
.
!
0
.
1
0
.
8
0
.
.
1
0
.
3
0
.
3
0
.
2
0
.
2
0
.
1
0
.
2
0
.
1
0
.
3
l
抗7
i
J
l
1
0
.
8
H
.i
.
11
.5
7
.
6
l
i
.1
I
!
.
i
付 l
:
5
.i
1
..
6
3.
‑
1
1
.9
:
u
i.
'
l
1
2
.
3
。7
1
.3
1
.3
!
.
I
l
.i
t
1
.0
1
.8
1
.
1
0
.
'
。1
0
.
5
0
.
1
0
.
2
0
.
1
0
.
1
O
.
!
0
.
8
0
.
2
0
.
8
0
.
5
3
.
0
1
.3
O
.
i
1
.9
0
.
.
1
1
.8
0
.
9
0
.
.
]
0
.
;
1
.3
0
.
7
0
.
3
0
.
8
0
.
3
1
.5
1
.2
3日
6
.
;
:
;
3
.
;
:
;
C~
1
1
.6
5
.
0
i
.
O
1
.8
3
.
3
0
.
5
0
.
1
0
.
.
1
0
.
9
1
.5
l
.
l
3
.
0
O
.
i
1
.
1
0
.
6
,
.
.
1
.9
1
.9
0
.
8
1
.
4
0
.
8
2
.
1
りi
0
.
2
0
.
1
0
.
1
0
.
1
O
.
i
0
.
2
0
.
1
0
.
1
9
ο
3
.
i
1
5
.
2
1
0
.
i
1
.8
8
.
2
3
.
1
1
5.
'
1
0
.
6
2
.
0
:
t
O
0
.
8
0
.
.
1
2
.
9
1
.3
1
.5
』
。
今
・
ー
1
.
6
0
.
5
0.
8
.
0
‑
1
1
.6
1
.2
0
.
9
0
.
5
1
0
.,
1
.1
.
。1
'
1
0
.
1
0
.
6
1
.0
0
.
3
0
.
5
0.
6
.
;
1
0
.
0
5.
3
1
.9
1
0
.
1
5
.
i
2
.
1
2
.
8
0
.
8
1
9
.
5
1
.9
0
.
9
3
.
2
1
.2
0
.
.
3
.
3
1
.8
。l
0.
.
1
0
.
6
00
O
.
f
i
u
0
.
1
0
.
8
。1
。1
。1
。1
。2
0
.
2
0
.
1
0
.
1
6
.
6
2
.
8
1
1
.9
6
.
2
2A
1
0
.
8
i
.
8
3.
4
.
ι
'
)
'
)
0
.
6
1
.9
1
.0
OA
I
.i
1
.9
0
.
9
1
.
1
。
史
。
月
0
.
3
0
.
5
0
.
8
0
.
6
1
.
‑
1
0
.
"
1
.3
。
府
1
.
1
.
0
.
3
0
.
3
1
.1
0
.
3
0
.
8
I.~
。
九
J
.
.
l
2
.,
(
1.
3
1
.5
O.
.
l
3
.
1
1
0
.
.
,
。
。
1
.1
.
!A
0
.
2
:
.
1.
0
1
.2
0
.
3
2
.
8
。7
0
.
3
O
.
I
0
.
3
l
.
Ii
2
.
3
1
.3
3
.
3
。7
0
.
.
1
0
.
2
0
.
1
0
.
3
0
.
1
0
.
5
0
.
2
0
.
1
1
.0
1
.3
2
.
1
1
.2
0
.
7
0
.
.
1
.2
0
.
3
0
.
5
0
.
9
0
.
9
0
.
3
1
.5
0
.
6
0
.
3

女下

冷一昔

1
.0

2
.
0

0
.
8

0
.
9

0
.
5

0
.
5

0
.
2

0
.
8

1
6
.
3

1
0
.
9

2
2
.
1

9
.
i

3
.
.
1

;
)
.
1

3
.
3

8
.
"

:
'
.
0
1
.8

3
.
2
3
.
0

8
.
3
6
.
8

汀~5回調古

u
:i
RA

1
.9
1
.:
1
l
.
:
l

全体
6
.
2
1
.
1
1
.0
2
.
l
i

j了
り
1
.8
3.
3

0
.
2
1
6
.
5
K9

1
.8

1
.0

2
.
6

8
.
2
2
.
3
3
.
1
。i
1
5
.
8
3
.
7

6
.
9
)
.
6
:
'
:
.
6
0
.
1
8
.
6
1
.
'
¥
1
.2
0
.
3
;
)
.
1
,
]1
.
0
.
8
0
.
1
5
.
6
1
.3
1
.0
0
.
3
1
.2
0
.
.
1

9
.
S
2
.
9
3
.
6
0
.
1
23.
.
1
長
。
3
.
6
1
.0
1
5
.
.
1
3
.
1

38 弦 ~M;;;_':' イタル川本)

39.S~'.~~:m りサイタ..,(外来)

同市内楽{日本・外来)
1
1.)'i'主配'1(日本・外来}

1
6
.
5

.12.I~i 世リサイタル{白太}

1
3
.
'
!
'張リサイタ'レ{外来}
切れ(日本}
H.1
1
5汁 "
s
(
外米}
白日常
1
1
7
ーその他のクラシ ク汗来
f

5
.
6

。
』
ー,

9.
'
1

1
1
.9

I
.
.
l

1
6
.
9

2
.
0
1
.8

I
.
.
!
1
.
0

2
.
6
2
.
6

0
.
6

0
.
5

0
.
6

5
.
8

6
.
8

21
.2

21
.
.
l

ホヒ';l..;;-_.;1"'~正.

.
1
8シャンソン (HA>;・外来}
1
9
.ンヤズ{日本}
5
0ジャズ(外来)
5
1ロ/タ{日本)
52.u:/ク(外米)
ニューミュージ yクーフォーク (IJ本]
5
3
.
;
5
4ニューミュージノク・ 7,ーク{外来)
5
5ニューミュージ yク(1I本)
5
6エューミュージ yク{外来)
.
'
)
iフ eーク(fI本・外来}
村ポップス{日本}
5
5
9ボノプス{外 *1
制耳~ð;~III!

0
.
2
1
7
.
1
7
.
1
2
.
5
~.O

1
.5
2
.
9

2
.
0
3れ
1
.5
0
.
1
1
.8
0
.1
i
1.~

0
.
3
2TA

21
.0

0
.
.
¥
2
.
.
1
1
0
.
.

3
.
0

0
.
.
1
0
.
9
2
.
0
0
.
6

よZ

u

3
.
0

3
.
6
5
.
8

。7

ヮ
。

0
.
6
i
.
2
0
.
9
1
.8
0
.
5
3
,
!
.
{
)
0
.
8
2
.
6

!
.
;
;
9
.
6
5
.
2

1
2
.
:
1
3
.
9

O.~

J
3
.f
0
.
.
'
0
.
8
0
.
2
2
2
.
i
0
.
1

R
.2

~.2

2
.
7
!
.
.
j
2
.
1
3
.
1
1
.6
0
.
.
1

:
u

O
.
I

1
.3
0
.
6
0
.
1
2
.
;
0
.
2

0
.
8
2
.
:
i
0
.
1
1
5
.
1
8
.
0

3
.
0
1
.5
0
.
5
2
9
.
3
1
5
.
i

:
!
A

O
.
f
i
1
.
1
0
.
2
1
.2
1
.2

"
'
司

5
.'
3
7
0

1
.
1
0
.
1
0
.
9
1
1
.2
0
.
9
6
.
1
0.
'
1
5.
‑
1
iH
蒔
1
.3
1
.9
05

コ
む
1
.9
2
.
6

1
.
<

3.
.
1
,
.
.
1
.9
t
i
A
8
.
0
6.
'
1

;
)
.
.
)

3
.
5

i
.
f
i

2
.
8
O
.
:
!
2
7
.
8

00
。2
,
1
.
5
2

3
.
5
0
.
5
31
.1
.

l8

1
.6

t6

5
.
.
1

K7
1
.9

1
)
内
1
2
.
1

1
2
.
1
スi

9
.
'
¥
1
.7

0
.
7

0
.
.

0
.
8

0
.
8

lJ
.
!

6
.
!
!
1
.0

1
6
.
2
2.
.
1

U.3
1
.2

9.
:
1
1
.0

l
i
.
1
!
.
3

1
6
.
2

1
2
.
3
1
.2
0
.
3
0
.
2

2
0
.
6

υ6
0
.
3
O
.
f
i
I
J
.
!
l

0
.
8
!
{
)
.
I

0
.
5
1
1
.
1
.0

7
.
6

ι:

8
.
l
i

lU

1
.2
0
.
1
0
.
9

9自
1
.3
¥
.
8
1
.3
2
i
.
i
0
.
3

1~.2

2.
3

0
.
1
0
.
5
5
.
0

1
.2
0
.
1
U
.
9
6
.
6
0
.
8
5
.
0
0
.
3
3
.
2
3
.
2
6
7
.
R
1
O
,2
i5

7
.
2

IA

1
.
1
1
.
1
、. 3

1
0
.
3
:
i
.
.
J
1
.0
0
.
1

0
.
7

ワq

いろ

1
.2
1
.2
1
.1
5
.
3

2.~

3
.
1

。l
0
.1
i
i
.
6
3
.
2
0
.
2
0
.
5
1
.8
0
.
3
2
.
6
0
.
2
0
.
6
0
.
6
.1
1
.8
9
.
.
1
5
3

1
.9

.
.

。
ー
ヮ
ー

1
.5

9
.
5
2
.
f
i
1
.
.
1
0"

IA

大政主 tj~

3
.
3

1
.9
l
.
‑
!
O
.
J
2
2
.
0
11
.7
3
.
3
月l

1
.
.
'
<
I
A

3
.
6

0
.
2
1
.2

日晶その 1
也のポヒコラー膏楽

I~.O

7
.
2
1
2
.
0
5
.
8

内

:
u

0
.
3
1
3
.
2
0‑

臼2

:
?
A

0
.
2
υ9
i
i
.
7
2
.
6
0
.
1
0
.
5
0
.
9
0
.
5
:
?
8
0
.
2
O
.
f
i
0
.
6
1
6
.
7
1
0
.
2
5
0

3
.
9
2
.
"
3
.
8
5
.
3
2
.
1
0
.
1
5
.
3
1
.1
1
.
;
:
;
0
.
.
3
0
.
J
1
.3

0
.
:
1
3
2
.
1

2A

I
U
i
1
0
.
.
1
2
.
3
2
.
0
0
.
2
9
.
.
1
2
.
0
lー
1
.0
2
.
8
1
.0

2
.
3

0
.
2
0
.
7
:
1.
3
2
.
0
0
.
1
0
.
5
0
.
8
0
.
5
2
.
1
。2
0
.
5
0
.
5
3
5
.
9
5
.
9
.
1
5

9
.
9
I
J
.
;
)

3
.
3
1
.8
2
.
1
4
.
1
5
.
5
'
1
.
;
:
;
1
.0
6
.
8
O
.
i
3
.
0
0
.
8
2
4
.
2
0
.
2

0
.
2
1
9
.
9
j
(
)
.
.
!
3
.
1

1
8
.,
5
.
1
!日
0
.
3

3
.
8

勾5

3.~

0
.
1
1
J.
3
5
.
1
I
.R
1
.8
。
日
2
.
3
0
.
8
lA
3
.
0
1
.5
0
.
3
3
.
6
0
.
1

u

8
.
7
3
.
9
2
.
3
0
.
5

~.1

1
.
1

0
.
3

0
.
2
2
3
.
1
1
0
.
"
.
1
.6

I
.f
i
0
.
2
1
3
.
1
i.:~
1
.1
.

0
.
3
1
9
.
6
0
.
2

O.t~

1
.0

0
.
0
0
.
8

0
.
3
:
!
.
1
.
8
1
0
.
3
5
.
i
5
.
0

5
.
0
1
.3

0
.
6
1
.0
0
.
5
2
.1
.5
0
.
7

2
6
.
0

!
l.
2

t> ï.l~ti昔ンョー

~.'!

0
.
1
8
.
9
1
.0
1
.1
1
.
‑
1
0
.
5
1
.5
0
.
5

l
i
.
1

。;

劇
6
8大衆向I
1
;
9サーカス
7
0その他の大衆'"能
その{出
7
1その他
全ジャン I
!
.
‑
{
(.
)
Iサンプル法

0
.
2
1
6
.
1
6
.
8

21
.
.
!

62. t.~,rJ:

6
.
1部,.・没才
日浪曲・諸説
66舟科i

'
1
0.
2
6
.
.
'
1
0
.
6

1
I
.
.
!
1
.0
0
.
9

J
.2

印刷歌

。l
1
0
.
.
1
'
1
.6
1
.2
1
.3
0
.
5

'
‑
'

O
.
I

O.:~

0
.
.
1
1
2
.
i
6
.
3
1
.5
0
.
1
1
.1
O
.
l
i
1
.9
1
.
1
.
2
.
9
0
.
2
1
6
.
1
1
.9
2
.
6
I
.t
l
9
.
9
1
.5
0
.
9
。!
11
.9
2
.
8
1
.9
1
.9
3
.
0
2
.
3
2
:.
3
O
.
I
]
.
,
0
.
9

:!~パ 7'~ ・両 7 ンス (H 本'外来)

電ド等
3
3その他の稼納"・ 9
クラ:/."/ク苦難
3
.
1オ ケストラ (8本}
3
5オーケストラ(外米)
36ヒアノ'}サイタル(日本}
3Iピマノリサイタル{外来)

女「

2
.
5
~.9

0
.
3
2
0
.
3
0
.
1

0
.
3

1
5
.
R
l
.
l
i
1
.0

8
.
:
;

3
.
5
0
.
1
0
.
5
1
.1
0
.
6
3
.
7
0
.
2
t
l
.
f
l
0
.
8
6
1
.
1
'
!
.
2
6
!
1

0
.
9

0
.
7

0
.
3

1
.1

0
.
1
0
.
6
1
0
.
3
3
.
9
0
.
1
0
.
3
‑
1
0
.
5
0.
0
.
8
2
.
9
。1
0
.
2
2
.
0
3
.
.
1
。l
0
.
2
0
.
6
0
.
5
0
.
6
0
.
5
3
2
.
2
5
9
.
6
J})~ tL_ 1
•.,
2i8

0
.
6
0
.
9
8
.
8
5
.
5
0
.
1
0
.
6
0
.
9
0
.
3
3
.
2
0
.
2
0
.
3
0
.
3
:
!
i.
3
:~. 7
2
,
1

0
.
2
1
.0
6
.
0

0
.
9
0
.
8
1
1九
I
.:
i
0
.
1
0
.
1
1
.1
0
.
3
3
.
9
0
.
2
0
.
5
0
.
5
5
f
l乃
1
,
9
.
1
9

:
u

。i
。}
O
.
I
0
.
.
1
.
.
:
.
"
O
.
:
!
0
.
2
。2
3
5
.
2
,
i
6
8
l

l
.
:
'
l

1
.
:1

0
.
9

I
.H
。I

4
.
1
0
.
1
Ot
.
i
0
.
6
1
2
.
6
日
3
.
8

のお

0
.
8
52.
‑
1
7
.
.
1
7
5

0
.
9
0
.
3

5
.
5
。。
1
.0
1
.0
6
2
.
9
3
.
3
7
1

4. 学生調査が示す実演芸術の鑑賞構造とその変化
学生調査」の対象母集団は大学をはじめとする高等教育機関に所属する学生であり,なかでも多数を占め
るのは

1
8歳 か ら 2
2歳 ま で の 就 学 者 で あ る . 彼 ら は . ICTの 進 歩 ・ 普 及 と と も に 成 長 し , そ れ ら を 逸 早 く 生

1
2
2

125.

活i こ取り入れてきた世代である.このような特徴を有する学生にと 2 5 . 0 ~ー〆ノ ノ‑・ ‑ーホヒュラ 汗米 │ │ ー+ークラン yク "来 ・噌由現代演劇 って,視聴覚機器による実演芸術鑑賞はライブ鑑賞との問で補完関 係にあるのか,代替関係にあるのかというテーマは,今後の実演芸 術の鏡賞構造を考えるにあたっても重要なテーマであると考えら れる.また,アルバイト時間の噌大による余暇時間の減少や ICTな らびにインターネットの普及により余暇の消費構造や余暇の時間 の過ごし方にも変化が生じており,実演芸術のライフ守で、の鑑賞行動 。 。 にも,大きな劇場・ホールでのライブ鑑賞を避けるといった大きな , ) / . 1 第 4向 調 査 2 同 第 3向調査 第 査 第!ー剖ー伝統前刷 。 変化が生まれているのではないかとの大学教員による観察もなさ 1 " 1 れている. 目 日 芳三ご 4ム 図 3 過去 1年の鑑賞経験率の変化 そこで,表 5と表 6に示すように,分野・ジャンル別に過去を通 算した実演芸術の銀賞経験と過去 1年間に限定した実演芸術の鑑 賞の有然に焦点を絞り,性別(男,女) .大学所在地目J I (北海道・ .沖縄) .所属学部矧 J (文芸系学部,社会系学部,理 東北,関東,甲信越・中部,近畿,中国・四国,九十卜1 I( 1年. 2年 工系学部,保健系学部) .学年目J 3年 4年 5年以上および大学院)に鏡賞経験率を算出 1¥1の鍛賞経験ネを比較対照可能なように表 7にまとめ,質問 し,第 1回調査から第 5回調査までの過去 1午 1 項目がほぼ同じで,実演芸術のジャンルにも大きな変化がなく,周期調査として継続性のある第 2回調査か ら第 5回調査までの過去 l年に│浪定した銀賞経験率の変化を分野別で図 3に示した.ただし,図 3では,各 回の鑑賞経験率を求める際に,復元乗率に基づく母集団の銀賞経験率の推定作業は行っていないため,標本 誤差が含まれていることに注意が必要である.このような限界はあるものの,図 3からは,パフール経済の崩 壊を反映して第 2回調査 (1991年度)から第 3回調査 (1996年度)の問で過去 1年間の鑑賞経験率は低下ま たは償這いであったが,第 3回調査 (1996年度)から第 4回調査 (2002年度)および第 5回調査 (2008年 度)にかけては,鑑賞経験率は伸びているものの,第 5回調査ではクラシック音楽の鏡賞経験率のみが低下 していることが示されている. 5. まとめと今後の課題 本研究では,加藤・有馬 [ 5. 6]の研究以降,課題となっていた第 5回の学生調査のデータ入力を完了させ, 第 1回から第 5固までの学生調査のデータベースを統合するとともに,社会生活基本調査から明らかにした 実演芸術の銀賞構造とその変化を,より細分化されて詳細な実演芸術の分野・種目別での予備的分析を行い, 各回の調査データを用いた横断面分析ならびに第 l回調査から第 5回調査までのデータを用いた時系列分析 の可能性を示した しかし,学生調査での鍛賞経験率の集計に際しては,各個票データへの母集団復元乗率に基づく重み付け の調整が必要でユあるといった課題が残されている.ただし,復元乗率を求めるために必要な,学校基本調査 のデータは 5年前までしか保存されておらず,何らかの方法で復元乗率の推定作業が必要となる.そのため, 社会生活基本調査の学生の行動者率を参照しながら専攻分野別や地域別の抽出率の逆数を復元乗率として用 いて再集計するなどの方法を試みているところであり, これらの結果については, 改めて報告を行いたい. 123

126.

注 木稿は,有馬 [3, 4]に大幅な加筆修正を加えたものである. 謝辞 本研究はこれまで 5回にわたって実路されてきた「学生調査 J (詳細は周防 [3]を参照)の研究成果に基い て行われているものである.これらの調査に関係された諸先生ならびに回答者である学生の皆さんに感謝申 8 ) し上げます.また,第 5回調査のデータ入力にあたっては,科学研究費補助金基盤研究 ( のミクロデータによるコーホート分析 r 周期統計調査 文化需要の実証的研究一 J (課題番号:23330073,研究代表者:勝 浦正樹)の助成を受けている. 参考文献 [1]有馬昌宏 r 全国学生調査に基づく実演芸術銀賞行動の規定要因の分析 J , W 2008 SA Sユーザー総会 アカデミア/テクノロジー&ソリューションセッション p . 9 3 ‑ 1 0 2,2 0 0 8 . 論文集 1 ,p r 需要サイドからみた芸術・文化活動の構造 J, W文化経済学とコンピュータサイエンス ー 人間の知的活動を科学する一11,兵庫県立大学政策科学研究所(兵庫県立大学政策科学研究叢書 L xxxvI ) , [2]有馬昌宏 p p . 2 3・5 6,2 0 1 2 . [3]有馬昌宏 r 学生の実演芸術鑑賞の現状と 2 0年ー問の変化 J , W 文化経済学会<日木>年次大会予稿集: 2 0 1 2 1 1 ,p p . 2 6・27,2 0 1 2 . r 鑑賞・観覧活動の変化と現状 J , W 統計1 ,第 6 4巻第 3号 , p p . 2 3 ‑ 2 8,2 0 1 3 . [5]加藤優希・有馬昌宏 r 学生の実演芸術鑑賞行動の規定要因に関する基礎的研究一過去 2 5年間の学生調 [4]有馬昌宏, 査データベースの構築と分析を通して J, W 文化経済学会<日木>年次大会予稿集:2 0 1 0 1 1,p p . 1 2 ‑ 1 3, 2 0 1 0 . r 5回の学生調査から探る実演芸術鑑賞行動ノ fターンとその規定要因 [6]加藤優希・有馬昌宏 ータベースの構築と分析を通して~ J , W 2 0 10 SA Sユーザー総会 ューションセッション [7]周防節雄(編), 学生調査デ アカデミア/テクノロジー&ソリ 論文集 1 ,p p . 3 8 7 ‑ 3 9 5,2 0 1 0 . W芸術・文化政策立案のための統計指標の開発と体系化に関する研究 1 (平成 1 3 年度 5年度科学研究費補助金(特別研究促進費 ( 1))研究成果報告書) ,2 0 0 4 . 平成 1 [8]杉江淑子(編), W実演芸術の需要の実態と構造に関する統計情報の収集と時系列分析1 (平成 1 0年度 9 9 9 . 科学研究費補助金(特定領域研究 A)公募研究成果報告書) , 1 [9]永山貞則(編), Wわが国文化・芸術情報の体系化と統計調査方法の研究1 (平成 3年度科学研究費補助 2 3 0 5 0 0 9 ) 研究成果報告書) , 1 9 9 2 金(総合研究 (A)研究課題番号 0 [ 1 0 ]福永征世・有馬昌宏 WSASユーザ r 学生の芸術文化鑑賞活動の現状一第 5回学生調査の 10%抽出データ分析から J, 総会アカデミア・テクノロジー&ソリューションセッション 111 神 戸 2 0 1 1 論文集 1 , p p . 8 1 ‑ 8 7,2 0 1, ] [ 1 1 ]三善晃(編), Wわが国の芸術活動の動向予測に関する基礎研究 1 (昭和 6 2 年度科学研究費補助金(特 定研究(1)研究課題喬号 6 2 1 2 4 0 1 4 ) 研究成果報告書) , 1 9 8 8 . 124

127.

M Rアンケートによる製薬企業の営業力診断 武藤猛 MarkeTechC o n s u l t i n g 代表 D i a g n o s i so fS a l e sC a p a b i l i t yu s i n gM RSurvey T a k e s h iMuto o n s u l t i n g P r e s i d e n t,MarkeTechC 要旨 医薬品市場の構造変化に伴い、製薬企業においては、従来のようなデ、イテーリング回数に依存した営 業スタイルからの脱却が急務となっている。その中で、 rMR活動の質」をし、かにして高めるかが重要な 課題となっている c ところが MR活動の質に関しては、確立された測定方法がなく、その改善方法も試 行錯誤的な側面がある G 本論文では、 MRアンケートを用いた営業力診断により、 MR活動の質を数量 化し、営業力強化に活用する方法を提案する。まず、営業力診断の流れと分析方法について述べる。 MR アンケートは、高業績 MRの行動様式をヒアリングして設計する。分析においては、岡子分析で「営業 力 Jを抽出し、営業力の総合力として「インパクト力」を算出する。インパクトカは MR活動の質に対 する総合指標で、あり、営業力はその情成要素を表わしている。次に、営業力診断の事例を紹介する。最 後に、「売とアッフeの公式」を紹介し、 MR活動の質の他、ターゲテイング精度とディテーリング回数を 総合して売上高や MR生産性を継続的に改善していく方法について説明する。 キーワード:医薬品営業、 MR生産性、アンケート、営業力診断、 MR活動の質、インパクトカ 1 . M Rアンケートによる営業力診断の背景 生活習慣病領域の成熟化やスベシャリティ領域の成長など、医薬品市場の構造変化 (1)に伴い、製薬企業は ディテーリング出数に依存した営業手法からの脱却を急いで、いる。各社は、 MR生産性アップや営業力強化 を重要な経営改革課題として渇げ、 MR配置や営業組織の最適化、専門 MRの導入、 MR教育の強化などに取 り組んでいる。これらの営業改革に共通するキーワードは rMR活動の質の改善J である。このように、 MR 活動の質に注目が集まっているが、その改善の取り組みはいまだに試行錯誤中であり、科学的な手法の確立 には至っていないように見受けられる。著者は、この問題に対して rMRアンケー卜による営業力診断 j と いう手法を開発し、実際に製薬企業で適用した。本論文では、この営業力診断の手法を紹介する。 本論:こ人る前に、営業力診断とモラルサーベイ(社員意識調査:)の違いについて説明する。 I 両者の比 t肢を ほl 表 iに示す。要約すれば、営業力診断の特徴は、次の 3点にある。①「あるべき MR活動Jの質」は製薬企 業の営業戦略に従って定めるべきこと、②アンケートは記名方式とし、業績データとの紐付けを前提とする こと、③ MR個人および営業所・支応の組織単位でのフィードパックを行ない、営業力強化に役立てること。 125

128.

図表 1 営業力診断とモラルサーベイ(社員意識調査)の違い N o . モラルサーベイ(社員意接調査) 営業カ診断 項目 目的 営業力強化のための具体的改革指針を得る 組織活性化のための具体的改革指針を得る 2 対象 営業部門 3 記名/匿名の区別 0 ' 会社 4 調査内容 ①,舌動計画、②営業プロセス、③実績管理 ④組 織管理、⑤藁績評価、@会社満足度 ①組織方針の浸透度合い、②組織運営状況、③コ ミュニケーシヨン(上司・部下、組織肉).@:処遇へ の満足度、⑤意欲・満足度 5 業績デ‑';1との紐付け 行う 行わない 般には匿名方式 名方式 ①MR~1j(営業力.インパヲト力)、②組織別(営業 E 分析肉容 7 フィードJ ¥ ッヲ ①州 R刻、 c g : > 組織耳J I 日 活用lJl J ① MR の億人指導、②マネジャーの指導、@営業教 ①組織 ~IJ 活性度に基づくマネジャーの指導、②社 育内容の改善、④業績管理方法の改善 員教育の改善、③マ才、ジャー教育の改善 力、インJ ¥ヲトカ) 組織別分析が一般的 組織別{マネジャ宛) 2. 営業力診断の方法 [ 1 ] 営業力診断の流れ 最初に、本論文における「営業力」の定義をしておこう。製薬企業の「営業力 j とは、与えられた製品ポ ートフォリオの下で、自社努力 (MR自身の努力だけではなく、営業戦略、営業マネジャーの指導、および 本社・支庄の営業部門スタッフやマーケティング部門の支援も含む)により売上高(あるいは MR生産性) を伸ばす jJ、と考える。なお、本論文で、は数量化が容易なテ ィテーリンクー回数は営業力に含めず、 MR活動 の質を主体に考える。営業力診断が目指しているのは、製薬企業の MR活動の質を数最化し、具体的な改善 方法を導き出すことである。いうまでもないが、医師の処方に対して、 MR活動の質が大きく影響すること が多くの調査で明らかになっている ω。特に、 2012年 4月以降実施された、医師に対する接待の自主規制に より、 MR活動の質の重要性はー層,¥:,まっている。 1 3 1表 2は、営業力診断の全体フローを示したものである。営業力診断は、①アンケート準備、②アンケー ト実応、および③アンケート分析の 3ステップに分けられる。 図表 2 営業力診断の全体フロー ①準備 ‑士lO価テェッヲ ・回答分布チヱ ノヴ ・社歴区分値 ・日程連成串区分1 直 ・回害一次車 E 十 {遺択肢別図書数) ・コメント分担 ‑重舗データ統合 ②実施 ・富里構造抱控 .相関係数 .宮重力抽出 ・ヴル ピンヴ {因子分析) ・童図掃分析 .コメント分析 ・インパヲト力計耳 ・問題構造白抱握 .偏差値化 ・個人別比駁 ・組 III~'J 比殿 126 ‑宮重力診断 ・MH生産性アップの ために何が必要か?

129.
[beta]
アンケート準備は、営業))診断の成否を左右する重要なステップである。内容は、ヒアリング、アンケー
ト原案作成、アンケート最終案作成からなる。ヒアリングにおいては、営業組織や営業戦略の他、その会社
の優秀 MRから営業活動の具体的な内容を聞きだす c こうして、「その会社の優秀な MRが実践している典型
的な行動ノ fターン」をアンケートの質問事項としてまとめてし、く。このため、後述のように、分析の結果得
られる f営業 )
)
J には、その会社の得意な疾患領域や組織文化特性を反映した「当社の優秀 MR像」が抽出
されるのである。
、 l
直ちに自動集計される。
アンケート実胞は、社内ウェブを利用して、 l週間程度の期限で MRが入 }Jし
アンケー卜は、業績データとの統合を行うために、記名式である。
アンケートの分析のステップでは、基本集計の後、アンケート結果と各 MRの業績データを統合し、さら
に営業力とインパクト力の分析を行うことで問題構造を把躍する(次項で詳述)。以とすべての結果を総合し
て営業力診断を行い、当該企業の強みと弱み、営業:力強化のために必要な施策を提言する。

[
2
J M R活動の質を数量化する方法
営業力診断のキーポイントは、図表 2の全体フローで示した営業力分析のステップである。そこで、図表

3に、営業力分析の方弘ーを詳しく示す

G

図表 3 営業力診断の方法
①M R行動要因(アンケート)

ι'

が訪問するの"覇削 t
して会む
。 001 台、b筒'"されたターゲット.i'l~ドヲ
ヲのゐてある.

151

②宮業力

③偏差値化

④営業力を総合

己
と
二J

131111

処方直得のための
MRの総合力

4・
・
恥

・
園
田

0
0
2
1弘が Sコする多要提1)"r
:対して.孟 151413121 r
l
i
l
l
t酬を作成し実行している.

時

(インパクト)

¥ カ ノ
達成売上高

に貢献している営章力はつ
(
)
4
0
I
l
l
.
i享当社に渇足している.

,.,孟おの乏

"
1
1

警高"るため盟践的山ご"見があれ".以下

。
'
"に 8白!こ記入して〈ださい
J

出発点(土、 MRへのアンケートで得られた、入力済みの質問票データである(図表 3の①)。データの内容
は 5段階選択肢の凶答結果と、自由記入式のコメント文である。コメントコどからは、アンケートて、は網羅で
きない、 fMRの本音 Jを収集できる。なお、この段階で、業績データとの統合を行う。「業績」の例として
は、直近の他人売上高、 MR生産性(ディテーリング I回当りの売上高)、あるいは売上高目標達成率が考え
られるが、{可を「業績」とするかは、 MR活動の質を決定する上で非常に重要である。
庖状況に関する質問項目だけを用い
次に、②に示すように、アンケートの質問項目のうち、 MR活動の実 j
天l
子分析の手法で、共通因子を抽出する(つまり、活動内容のグルーピング) 抽出は統計的 l
こ意味のあ
て
、 l
0

る範開(固有値が i以上)でL行われ、通常は数個の因子が得られる。各因子には関連する質問項目が紐づけ
られており、これらの質問項目の共通点を検討して命名する。たとえば、「ドクターの信頼獲得」など、誰も
が内容をイメージできるように命名することが重要である。

1
2
7

130.

次に、③では、②で得られた因子の影響力を表わす因子負荷量を偏差値化する。このような変換により、 個々の M Rの営業力の解釈が容易になる。たとえば、ある M Rの「ドクターの信頼獲得 J という営業力の偏 差値が 75で、あったとすると、この M Rの「ドクターの信頼獲得 Jに関する能力は社内のトップクラスである。 最後に、④に示すように、営業力を総合して M R活動の質を表わす指標を作成する。本論文ではこの総合 力を「インパクト力」と名付ける。インパクト力とは、文字通り処方(売上高)獲得のための M Rの総合力 である。 営業力からインパクト力を算出する方法を詳しく説明すると、図表 4の通りである。 図表 4 インパクト力 (MR 活動の質)の算出方法 ①因子分析により、各 M Rの因子負荷量 ,, . . ソ J を算出する (XI X2 ②囚子負荷量を偏差値 (X"X, , '・ ・, X, ) 、つまり営業力に変換する /または M R生産性)を目的変数にして、回帰式を作成する: ③ 売 上 高S ,, S ;=h o+h, X, +bX +・・・+ん X" ④得られた同帰式のパラメータ(九 h"・ ・ ,'h) と各 M Rの営業力を用いて、 各 M Rの売上高(または M R生産性)の予測値を求めると、これがインパクト ;で あ る :S ;ニ 1 ;=ho+h , X, +h , X, +・・・ +h"X" 力1 ⑤インパクト力 1 ;を偏差値化する。 立 [l 表 4の手順を踏むことで、 IMR活動の質 j という│唆昧な表現が、「営業力」として構造化され、かつそ れらの合成である「インパクト力 J として指標化される。インパクト力は、売上高のように M R活動の結果 を示す指標ではなく、あくまで結果をもたらすための要因を表わす指標であることに注意いただきたい。営業 力やインパクトカを活用することで、 M R個人および組織全体の営業力を強化するための具体的な方策が明 らカ斗こなる。 [ 3 J 営業力診断に関する留意事項 以上説明したように、営業ノJ診断は通常のアンケート分析とそれほど変わらないが、いくつか留意事項が ある。第 は、従来から行われているモラルサーベイ(社員意識調査)との違いを理解し、混同しないこと である。図表 lにまとめた通り、営業 )J診断は、営業部門主導で、営業力強化のための具体的ヒントを得る ことが目的である。このため、回答は記名方式で行われる。質問内容は、 M R活動に特化している。また、 アンケート結果と業績データとを統合することで、営業力やインパクトカという、営業部門独自の指標が作 成される。フィードパックは個人および組織単位で行われ、 M Rの自主的努力目標設定、上司の指導内容、 営業教育の改善ーなど、具体的施策に活用される。 第二は、アンケートの質問項目の設計の重要性である。アンケート設計は営業力診断の成否を左右するの で、内容は M R活動の重要な側面を網羅する必要があるが、あれもこれもと多くの質問項目を盛り込むのは 避けるべきである。回答者の負担を考え、質問項目数は最大 50程度に絞り込むことが望ましい。なお専門 M Rを設置している企業で、活動内容がエリア M Rと大きく異なる場合には、質問項目を別々にすることも 、 考えられる。閑表 5は ドクターとの面談に関する質問事項の例である。 128

131.

図表 5 ドクターとの面談に関する質問項目例 く そ どち 全 〈 そ そ う で全 と もそ の ら で う 町通 は な は 通り 言え な り なL、 L、 ι、 ま常日頃、ドヲヲーに関する公的・私的な情報を出来るだけ多く集めるよう.心街けている。 008 私l 5 4 3 !ま患者さんl 、どうすれば役立つか、具体的イメージを持って、毎回担当先を訪問している。 009 私 5 4 3 2 5 4 3 2 2 日10 私は当社の製品を、自信を待ってドヲヲーに紹介できる包 j レゼンのために、自分独自の工夫をしている。 日11 私は、製品パンフレットや販促資材の効果的 ‑ 012 私は、重要施設の攻略が成功するまで、綿々な工夫をして、決してあきらめない。 5 4 3 2 5 4 3 2 013 私はドヲヲーf~ ,製品のメリットだけではなく、その製品で留意すべき事項も説明している。 5 4 3 2 5 4 3 2 5 4 3 2 5 4 3 2 5 4 3 2 日14 ドヲヲーとの面談中、私が話す時間よりも、私がドヲヲーの話人耳を傾ける時間の方が長い。 業所肉(または宮業部門肉)で、成功する話法が共有化され、私も活用している。 015 営 日16 私の担当先への訪問回数は、重要度に応じてメリハリをつけている。 017 ドヲヲーとのアポイントを取る」とは、特 I~ 苦 f~ならない。 3,営業力診断の事例 営業力診断の事例を紹介する。ただし、ここで説明するのは、実施事例を参考にして作成した仮 想的な事例である。 [ 1 ]営業力の構造の診断 営業力診断にあたって、まず組織全体の'汚業力の構造を確認することが重要である。そのため、アンケー ト分析の結果得られる営業力の内容を確認する。ある製菜食業の営業力診断て、得られた営業力は図表 6の左 側に示す 7 種類 (FOI~F07) であった。これら 7 つの営業力で:' n~且織の全営業力の 55% を説明している。 図表 6 営業力とインパクト力の関係(例) MR の本来の MRの 営 業 力 潜在的な営業カが 一部、活かされていない FOl ドクターの信頼獲得 │F03 ー積根的な知識スキル獲得 l m 己 AW 処方獲得のため の MRの総合力 F02 営業所マネジメント 一会社の仕組みへの満足 , , , , , , , F05 アクションプランの作成実行 F06 効果的なターゲット先訪問 │F リ動実績報告 r ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ー+ーカを高める吋献 ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ← 一一一一ー令 インパヲトカには影響していない この段階では、これらはいずれもこの製薬.企業の MRが持っている沼イ玉的営業力であり、これらが業績に 貢献しているかどうカ寸土、インパクトカを有五;に高めているかどうかで決まる。この製薬合業の場合、イン パク卜力、つまり売上高達成に貢献する MRの総合力 (MR活動の質の総合指標)を高めるのに貢献してい る営業力は図表 6に実線で示す 4続類だけであり、残りはインパクトカに貢献していなかった。この結果か ら、インパク卜 ) Jに貢献していない営業力改善に関して、組織的な取組み策への示 H 変が得られる。 次に、 MR活動の質の総合指標であるインパク卜力と売上高との関係を確認しよう。図表 7,土、ある仮想 企業におけるインパク卜力と売上高の関係を示す c 決定係数 ( 0 . 1 4 5 )から相関係数を求めると 0 . 3 8 1 となる。 129

132.

このように、 M R活動の質(インパクトカ)がかなり高い相関係数で売上高 (MR活動の成果)と結び付けら れることが確認できた。なお、インパクトカにはデ.ィテーリング回数は含まれないことに注意いただきたい。 y ) がインパクトカ ( x ) の l次式で表せる(もちろん誤差は含まれる)ことは、 IMR活動の また、売上高 ( 質の測定と可視化」が可能であることを意味するロ 図表 7 売上高とインパクト力の関係(例) . . 400 350 [売上高対インパクトカの近似式] 300 y=1 .9807x+9 1. 406 . 1 4 5 R '=0 • ‑?‑‑L 3 J ; j Y j μ手 250 凹叩 売上高 . . 2・ J ・ f• • .・. . ふkず . . . t・ ・ . .呈 ・ . . イ J J i 〈官民 ; . '? . . .. . . . . .、 . : 句、 ~I. は ~ー~,. Z . ー : ・ 3事 1 0日 50 。 。 1 0 20 30 40 50 60 70 8 0 90 MR活動の質(インパクトカの偏差値) [ 2 J 個別 M Rの営業力診断 次に、営業力診断が個別 M Rに対してどのようなアウトフ。ッ卜を提供するかを説明しよう。営業力診断で は、各 M Rに刻して営業 ) Jとインパク卜力の偏差値を出 ) Jすることができる。個別診断結果と共に、」二百j 経 由でこの結果を M Rにフィード、パックすることで、各 M Rは自分の強みと弱みを数値的に把握でき、スキル アップのために何に取り組めばよし、かを自覚できる。これは、偏差値という M Rにとって馴染みのある表現 mし、るメリッ卜である。一方、営業所長も、部下の M Rの個別診断を通じて各 M Rの特性を数 f量的に把握 を できるとともに、自分自身のマネジメントの強みと弱みも明確になる G こうして、営業力診断の結果は、個 別 M Rだけでなく、営業所や支庖レベルの改革課題を明らかにすることができるロ 営業力強化の課題を絞り込むには、 M Rの業績グループ毎に、それぞれの営業力の特徴を把握することが 有別である。│刻表 8は、ある仮想企業において、高業績一および低業績 M Rにク守ループ分けし、それぞれの営 業力の特徴を示したものである。この図から、 M R活動の何が業績を分けているのかが明瞭となる。 また、 各 M Rにとっても、最優先で取り組むべき課題が分かり易くなる。 130

133.

図表 8 M Rの業績グループ別営業力の特徴(例) F01̲ドクヲ の { 言 一ー{正業績グルプ 頼獲得 一ー高業績グループ [ 3 J営業力診断のその他のアウトプット 以上の他にも、営業力診断により様々なアウトプットが得られる。いくつかを紹介しよう。 1 ) ハイパフオーマー(高業績 )MRの特徴の抽出 個別 MRの営業力診断でも紹介したが、高業績 MRが低業績 M Rに比べて顕著に高い偏差値の質問項目を 選び出せば、ハイパフォーマー ( H P ) の特徴を抽出できる。いくつかの特徴をほl 表 9に示す。 図表 9 ハイパフオーマーの特徴的行動の例 高 業 績 MR(HP=HighPerformer)に特徴的な行動要因(例) HPは毎回の面談の事前準備を十分行う HPは事前にドクター情報を収集する HPは患者数を把握する HPは製品や症例説明のプレゼンに工夫する HPは一度断られでもあきらめない HPはドクターの話を傾聴する HPは訪問回数にメリハリをつける これらの特徴は、「当社 MRのあるべき姿」として、教育研修や営業所長によるコーチングで活則すること ができる。 2 ) 組織別営業力診断 営業所や支庖単位で営業力を算出(所属 MRの平均値)することで、組織単位の営業力強化の課題を明確 にできる。 3 ) 教育研修効果の数量化 関表 7中に示したように、売上高はインパクト力(の偏差値)で近似的に表すことができる。毎年営業力 診断を行うことで、教育研修の効果を数量的に把握できる。また、必要があれば、教育研修の費用対効果も 算出可能で、ある。 131

134.
[beta]
4
) 組織文化の診断

高業績の MRが会社の制度や仕組みに満足しているかどうかを調べることで、自社の組織文化を診断でき
る
。

イ
タ
>
l
J
を図表 10に示す。この結果から、営業部門が持続的に成長できるような報奨制度(金銭的だけでな

く非金銭的なものも含む)やキャリア制度の改善のヒントが得られる c なお、コメント文のキーワード分析
も、組織文化の診断 (MRの「本音」の分析)に役立てることができる。キーワード分析を数量的分析と併

)
1
1することで、組織文化の診断がより的確になるョ

図表 10 会社満足度と業績達成率の関係
①会社満足度と業績達成率に
あまり関係がない例

②業績達成率高グループの会社満足度が
相対的に低い場合
会社満 E度と畢tI達成串の関係 (y社)

会社満足度と章 t
l
遭成率の間保 (X社)
勺逮成司区一 l
a
;]A白

耳
慣

沼
、

'
1
1

会往涜足度。

会役..足直低

V

%

a
拘

四国

置
虫

c遺 庭 事 < p

回連成事ー高

J 人 ttl!.l.IJ..1 11i宝い,~~ ;O;~~OOIO. t L. r: 叫

人慰比率(輪

人

比

5週
民i
J
l
!I
!
!

浬
民E
司
区
一
中 酒運""Jl!̲"

,

T
.
l
:
.!
>
l
1
2レへおき.'苛 2
区Pーとしニ比,

会捻涜足度高

ι
.
.

会役涜 ~ll_低

4
易
MRのモチベーションを高める制度が
機能しているか、検討する必要がある

会祉活足度ロ

会社渇足度高

高業績者 (HP)の満足度が高くない理由を
調査し、対策を打つ必要がある

4. 営業力診断の M R生産性アップへの活用
[1
J

r
売上アッフ。の公式」とその活用

売上高(あるいは MR生産性)がどのような要悶で決まるかは、営業関係者の大きな関心事である。ただ
し、ここで‑は製品ポートフォリオは与えられたものとし、営業部門の努力で決まる要因のみ考える。「売上ア
ップの公式」とは、売上高 (MR生産性についても同様)が次の 3つの要因でt
夫まるとするものである{九
(1)ターゲ、ティング精度
(
2
) MR活動(主にディテーリング)の質

(
3
) ディテーリング回数
この公式は、「最適な顧客 l
こJr
質の高いメッセージを Jr
最適な頻度で届ける」ことを意味し、しごく当た
り前のことを述べているにすぎない。厳密にはこれ以外の要因も売上高に影響しうるが、実践上は上記 3つ
の要因だけ考えれば十分である。売上アップの公式は、製薬業を含む多くの業純の営業関係者が、経験則と
してその有用性を認めている。売上アップの公式で重要なポイントは、ヒ記 3つの変数は独立ではなく、 (
1
)(
2
)
(
3
) の1
)
頃に最適化を進めなければ、効果がないという点である。

著者は、実データ(医師アンケートおよび製薬企業の社内データ)を用いて、売 kアップの公式が成り立
っていることをいくつかの疾患領域で検証している向。したがって、売上アップの公式は、 MR生産性アップ
のための手掛かりとして科学的根拠があると考えている。

[
2
J ターゲティング精度

132

135.

ターゲティングとは、「希少な営業資源である MRの活動を、販売ポテンシャルの f 吉川、顧客に集中する J と いう怠味である。このためには、自社製品の対象疾患領域において、顧客(医師)が持つ患者数(つまり販 売ポテンシャル)を把握し、データベース化しなければならなし、。著者は、「量的基準×質的基準 J のマトリ ックスで医師ターゲティングを行う方法をかねてから提唱しているの)問。「量的基準」は、各医師の有する対 象疾患領域の患者数である。 一方、「質的基準」は、当社製品に対する医師の処方意欲で、あるが、成熟期の製 品については、簡便法として、向社シェアで代JfJ できる。なぜなら、シェアとは医師から見た自社製品の「支 持率」とみなせ、処方意欲の大きさの指標と考えられる方、らである。このマトリックスを用いるメリッ卜は、 高ポテンシャル (HP) の 3 セグメントに患者数の 60%~70%が集中することである。したがって、営業戦略 上は、実質的には、 HPセグメントにのみ集中すればよい。また、質的基準と組み合わせることにより、競合 を退け、自社独自の戦略で顧客の信頼を獲得可能となる。ターゲティングの重要性は、スベシャリティ領域 に特化した製薬企業が高い MR生産性を達成していることからも明らかである問。 [ 3 J MR活動の質 営業力診断は MR活動の質の測定が目的である。 r 3 .営業力診断の事例 j で、事例を通じて、 MR生産性ア ップへの活用について説明した。まとめると、次のようになる c ( 1 ) 営業力診断などの手法で、定期的に自社の営業力の構造を杷握し、すべての MRの活動の質(営業力・ インパクト力)を計測すること。 ( 2 ) MR に各自の営業力・インパク卜力の結果(偏差値)をフィー I~. パックし、改誇に向けた自党と自助努 力を促すこと。 ( 3 ) 営業所長・支 J 苫長に、所属 MRの営業力・インパク卜力および組織としての平均値をフィードパック し、部下のコーチングやマネジメン卜に活用してもらうこと。 ( 4 ) 教育研修では、自社の営業力・インパク卜力の調査結果を踏まえ、数量的な効果検証が可能な教育研 修プログラムを導入すること。 [ 4 J ディテーリング回数 ディテーリング回数については、「もはや SOV( S h a r eO f V o i c e ) の時代ではない、 MR活動の質の方が重要 だ」という意見もあり、やや影が ) Wくなっている。現実には、製薬企業の売上高と MR人数との聞に強い相 聞があることからも分かるように、ほとんと員の疾患領域で、テーィテーリング回数は依然として売上高に強い影 響を及ぼしている。しかし、 MR生産性アップのためには、「ディテーリング回数の最適化」が必要である。 ディテーリング回数の最適化のためには、横軸にテ ィテーリング回数、縦軸に売上高(施設または医師単 位の)をとり、すべての MRの実績を散布聞に表した「売上レスポンス曲線」を作成する。この散布図に近 似 2次 I r h線を描くことで、最適ディテーリング 凶数が求まる。営業現場に対しては、この最適ディテーリン 見場の実情に応じた運 J I Iを行うことが考えられる (3)。 グ回数をガイドラインとして示し、 E [ 5 J 継続的な MR生 産 性 ア ッ プ に 向 け て !れ、て、継続的に MR生産性を改善していく方法を簡単に説明する。本社部門(マー 売上アップの公式を J ケティングおよび営業本部)の役割は、マーケティングおよび営業戦略を立案することである。最も重要な コントロール変数はターゲティングである。本干上が様々なデータを駆使して、「最も販売ポテンシャルが高い 顧客 J という本来の.'2.味でのターゲッ卜先を定めることが、 MR生産性アップに決定的に重要て、ある。 MR活 動の質については、営業力診断など科学的な恨拠のある方法で数量化し、教育研修で、全社的な改善策や、「ハ イパフォーマー MRの特徴(チェックリスト)J などを具体化することが望ましい c 最後に、ディテーリング 133

136.

回数を本社が定め、現場に指示することは望ましくない。このようなやり方ではターゲティング精度や M R 活動の質が犠牲になり、 M R生産性アップに逆効果になるからである。 現場の営業部門では、売上アップの公式の 3要素について、業績指標 (KPI)を設定し、定期的にモニター することが重要である。ターゲテイングについては、重要(高ポテンシャル)セグメントのカバー率、 M R 活動の質については、ハイパフォーマ ‑ M Rの特徴(チェックリスト)の達成状況、ディテーリング回数に ついては、重要セグメントの訪問計画の実施率、などである。 以上、営業改革においては、売上アップの公式を参照することで営業マネジメントが簡略化され、 MRIま ドクターや患者さんのための活動 H 寺間を増やすことができ、結果として成果につながることが期利できる。 5 . まとめと今後の課題 [ I J まとめ 本論文で提案した、 MRアンケートによる'営業力診断は、 fMR活動の質」を数量化し、営業力強化の具体 策を導きだす上で、簡便かっ有用な手法である。ターゲティング精度の改善やディテーリング回数の最適化 と併せて実施することで、科学的根拠のある継続的な M R生産性アップにつなげることができる。 [ 2 J 今後の課題 医薬品市場は今後もダイナミックに変化していくと予想される。その時々の医療ニーズや患者さんのニー ズに合った MR活動を今後も行っていくため、あるべき fMR活動の質」も変化していくことが考えられる。 また、エリア相当 MRや専門 MRでは、求められる fMR活動の質」も異なることが予想される。営業力診 断も、これらの状況変化に合わせて、常に改善が必要である。 参考文献 ( 1 ) 井 上 良 一 :21世紀の医薬品マーケティング、 TheJapaneseJournalo fA n t i b i o t i c s (Apr.2005) ( 2 ) 特集:医療情報の情報源と処方影響度、 Monthlyミクス ( 2 0 1 2年 1 1月号) ( 3 ) 武 藤 猛 :MRの生産性アップと最適配置戦略、 AndTech社 ( 2 0 1 2 ) ( 4 )武 藤 猛 ・ 小 泉 芳 克 : 1人 で で き る ! 医師ターゲティング、メデイカル・パブリケーションズ ( 2 0 0 8 ) 134

137.

ODSLAYOUTによるワクチンの臨床開発における D a s h b o a r dの作成 高浪洋平 武田薬品工業株式会社医薬開発本部日本開発センター クリニカルデータサイエンス部統計グ、ループ C r e a t i n gDashboardf o rC l i n i c a lDevelopmentofVaccineUsingODSLAYOUT Y o h e iTakanami , L td . TakedaP h a r m a c e u t i c a lCompany 要旨 Dashboard(ダッシュボード)とは,臨床試験のような膨大な量の解析結果から,必要な情報について表・ グラフ等を集約して表示する,意思決定において大きな役割を果たす重要なツールで、ある. SAS では, ODS LAYOUTを使用することにより,目的に合わせてレポートの出力レイアウトをカスタマイズして Dashboardを作成することができる.木稿では, ODSLAYOUTの基木的な使用方法を紹介するとともに, 活用事例として,ワクチンの臨床開発における仮想臨床試験データを用いた Dashboardの作成を提案す る. キーワード:ワクチン, Dashboard,ODSLAYOUT,ODSREGION 1 .Dashb o a r dと ODSLAYOUTの概要 本主主では, Dashboardと ODSLAYOUTの概要ならびに ODSLAYOUTの基本的な使用方法を紹介する. 1 )Dashboardの概要 Dashboardとは,上述したように,必要な情報をまとめて表示するツールで、あり,薬剤開発のみならず,様々 な分野で、迅速な;古思決定に利用されている.薬剤開発における臨床試験では,被験者背景,有効性ならびに 安全性データ等の多くの情報を収集し,特に開発後期においては数千ページにも及ぶ膨大な量の解析結果を 作成することもあるー統計解析を合む薬剤開発に関わる担当者は,開発の継続・中止,至適用量の選択,さ らなる解析の実施の要否等の重要な意思決定を行うために,解析結果をもとに当該薬剤の有効性及び安全性 プロファイルを分析・精査するー Dashboardは,それらの重要な意思決定に関わるような情報をコンパク卜に まとめて表示することによって,保々な部門の担当宕が重要な結果を効率的に分析することができる非常に 有用なツールで、あるといえるー l 火1 1 .1に SAS9.3の ODSLAYOUTを使則した D ashboardの作成例を示すが, ODSLAYOUTの基本的な使用方法や使用例については次節で紹介する. 135

138.
[beta]
‑
]一一」川一̲̲j叩

内向対

談N

^~i. ロパ

ζ二
二
三
川 ζ二..
:
.
J
,
.
,

W叩

画面画面H 画面・:~

USA

i[
富 市

州亡二〉・ ご二三間
USA

量量出

o I曲

2 3

2回 訓 ' )

・

山
一
一J

ゅ広二二 ・

面量 I'~~ 1
:
固圃圃・圃・ω,~・
U品醐・・岨旦~~ ;~~

引

100

i
)

2
0
.
;
)

3
凹

o

!
O
O

~田

竺竺虫色川

t
o

3$,開.[i̲!I制

P 悦町山?

日同"珂

MSRP(S
)

ト 幅 引 " 咽d凹}

'
,
,
,
.
コ
!
l
1
'
t
.
‑l .
:
lSIN 辺 地 二
.S町三・,.且 a 国内

O
ri
,
;
回
'
;
:
1
/
1
.
・ a:
:
J LZ"句)f" :
Jt
1
5
"
‑

a

a
刈

一日

EE

1J剖

HE‑‑EEEE

志瀦摺題遺書聾

川田置

f~ 唱

a
‑
‑
‑
‑
E

嗣
'
^

1ij

。
:

l叶

主 10

・aaヨ
圃
・
‑

JO

い吋廻廻湿SS
週
刊温調週週狙酒唖掴

語諮
問同盟関

H
E
a
‑
‑
a
a
a
u

,.
1
・

u
.
'
¥
A

。
自
伊

Y何 時 コ l !iW<I臼 SUV ~ s
e
t
胞 :J S::'~'!1. :
J 1 'l."C以 2・ \'I~

..JSlN .
.
JS
I
I附 遁 ? 叩S 幽 >
:
1<11.'<1"" Ir)C<C 閥
均;)".,

@ LlSAS9.3による D
a
s
h
b
o
a
r
dの作成例

2
)ODSLAYOUTの概要
ODSLAYOUTは
, PDF形式等の外部ファイルにレポートを出力する際に,表・グラフの山力レイアウトを詳

細にカスタマイズできる SASの有用なレポート作成機能で、ある .SASを用いた Dashboardの作成方法は ODS
LAYOUTの使用以外にもいくつか考えられるが,本稿では機能の豊富さならびに SASコードの簡便さから,
SAS9.3の ODSLAYOUTを使用した D
a
s
h
b
o
a
r
dの作成方法を提案する.本節では, ODSLAYOUTの基本的な

使用方法を説明するとともに,テストデータを用いた簡単な使用例を紹介する.なお, ODSLAYOUTについ
ては DanO'Connorら (
2
0
0
8
) が詳しく解説しているのでそちらも参照されたい.

•

ODSLAYOUTの構文

ODSLAYOUTでは. ODSLAYOUTSTARTステートメントでグリッドや出力領域の定義を行い,出力領域ご

とに ODSREGIONステートメン卜と表・グラフを出ノJする SASプログラムを記述する.最後に ODSLAYOUT
ENDステートメン卜を記述する.

。
d
sl
a
y
o
u
t start <option>
ods region
くレポート出力プログラム〉
ods region
〈レポート出力プログラム〉
ods l
a
y
o
u
t end

ODSLAYOUTには,大きく分けて「グリッドを定義する方法 J と「グリッドを定義しない方法 Jのごーつの使
o1
umns,rowsオプションで 1ページあたり
用方法があるが,それらの概要を表1.1にまとめる.前者では, c
i
d
t
h,h
e
i
g
h
t オプションで全体の領域サイズを定義し, ODS
に出力するレポート数を指定し,後者では, w

136

139.
[beta]
REGIONス テ ー ト メ ン ト で 各 山 )J領 域 の サ イ ズ と 位 置 を 指 定 す る .
種類

概要

グリッドを定義する方法

‑グリッドの順番に出力されるので指定が簡単である.

•l
H力が複数ページにまたがる場合に :
!
i
l
J御が容易である.
.i
列 o
d
sl
a
y
o
l
l
ts
t
a口 c
o
l
u
m
n
s
=
2r
o
w
s
=
4;
グリッドを定義しない方法

.F
1
1主i
に出力レイアウトをカスタマイズできる.

(
f
問I
)
]
I
Jに出力サイズを指定)

‑各 i
H力領域のサイズを個別に指定する必要があるので出力位置の調整等が難しい.

•i
9
"
J
I:o
d
sl
a
y
o
u
ts
t日口 w
i
d
t
h
=
8
i
nh
e
i
g
h
t
=1
1i
n;
表1.10DSLAYOUTの 使 用 方 法

統し、て,上述した二つの方法について,図1.2に プ ロ グ ラ ム と 出 力 レ イ ア ウ ト の イ メ ー ジ を 例 示 す る .
グリッドを定義する方法

グリッドを定義しない方法

o
d
sl
a
y
o
u
ts
t
a
r
tc
o
l
u
m
n
s
=
2r
o
w
sニ2;
o
d
sr
e
g
i
o
n

o
d
sl
a
y
o
u
ts
t
a
r
tw
i
d
t
h
=
8
i
nh
巴i
g
h
t
=
l
l
i
n
o
d
sr
巴g
i
o
nw
i
d
t
h
=
3
i
nh
巴i
g
h
t
=
3
i
nx
=
O
.5
i
ny
=
l
i
n

〈表・グラフ出力プログラム1>

〈表・グラフ出力プログラム1>

o
d
sr
巴g
l
o
n.

o
d
sr
e
g
i
o
nw
i
d
t
h
=
3
i
nh
e
i
g
h
t
=
3
i
nx
ニ4
.5
i
ny
=
4
.
5
i
n

〈表・グラフ出力プログラム 2
>

〈表・グラフ出力プログラム 2
>

...

o
d
sl
a
y
o
u
t 巴n
d;

o
d
sl
a
y
o
u
t 巴n
d
LAYOUT(llinx8
i
n
)

Report1

Report2

Report1
(3inx3
i
n
)

円川

Repo代 2
(3inx3in)

[
'
g
[1
.2ODSLAYOUTの 定 義

ODSLAYOUTス テ ー ト メ ン ト 及 び ODSREGIONステートメントの主なオプションを表1.2に 示 す . 各 オ プ
ションの指定方法は複雑ではないため,利便性は高い.
ステートメント

オプション

内容

ODSLAYOUT

r
o、
.
V
S
=
λ c
o
l
l
l
m
n
s
=l'

行
, ;
Y
J
I
のグリッド数を指定

w
i
d
t
h
=
x,h
e
i
g
h
t
=
y

レイアウト領域の幅と高さを指定

r
o
w
̲
g
u
t
l
er=
x,c
o
l
u
m
n
̲
g
u
t
t
er
=
)
'

行
, ;
Y
J
I
のグリッド問のスペースを指定

r
o
w̲
h
e
i
g
h
t
s
=
(.
ryz
),

各グリッドの悩とおさをまとめて指定

c
o
l
Ul11l
l
̲w
i
d
t
h
s
=
(.
ryご
)
ODSREGION

w
i
d
t
h
=
.
λ
:
.h
e
i
g
h
t
=
)

該当する領域の幅と高さを指定

x
=
,
r
.y
=
つ

出力位置(座標)を指定

r
o
w
̲
s
p
a
nニ r
.c
o
l
u
l
ll1l̲
s
p
a
l
l
=
Y

行
, ;
Y
J
I
のグリッドの結合数を指定

r
o
¥
¥
'
=
x
.
ι
c
o
l
ul11n
=
y

該当するグリッドを指定

表1.2ODSLAYOUTと ODSREGIONス テ ー ト メ ン ト の 主 な オ プ シ ョ ン

1
3
7

140.
[beta]
続いて, I
グリッドを定義する方法 J と「グリッドを定義しない方法(個別に出力サイズ・位置を指定)Jに
ついて,テストデータを用いてそれぞれ使用例を紹介する.

‑グリッドを定義する方法
ODSLAYOUTステートメン卜の rowsオプションと columnsオプションでグリッドの定義を行い, SASHELP

ライブラリの CARSデータセットを使用して自動車の地域ごとの企業別・タイプ別の平均価格について棒グ
ラフと要約表を作成する.体グラフ及び要約表の作成にはそれぞれ SGPANELプロシジャと TABULATEプロ
columns=2,rows=2Jオプションで lページあたり 4個のグリッドを定義し, ODSREGION
シジャを使用する.I

ステートメン卜とともに各グラフ・要約表を出力する.図1.3のように,出力結果 (PDF形式)には地域ご
とのグラフ及び要約表が各グリッドに,':1:'.力されていることが確認できる.
プログラム

出力結呆

司岨四国

漉

LHH

︐a
凶

叫
珊

SEE‑

同制

拘両日司

ル
即
日L
m

MM

A
E
‑
‑
4

‑u‑S

Eag翻 車 種 薗 狙 橿 車

山知明制

仲
︒

﹄

哨時四

誕伺

I
!U
l
!
11
1,
11
~lil固で

も
"
ぉ
:

.
.
.
.
.
..
.
.
.
.
.
.
.
.
.
.
.
.
.
.
佳
日
泊
創
,
.
.
.
.
..品... g
}

‘.~ゅ.'…"~.偏.........

.;'-'~

:
.
.
. U;'・
)
,v

.'~Þ

11 u J
,
l
i

・
.
川
内
一
ー
.
̲山
.
.
.
.
,
.
.
.
.
'‑句

闘 い ・ C ‑ ' ̲ .;I~'..__
H'刊し皆、

l;::" ,~"

崎 同

.Jc
い …

"
‑ .
.
.
.
.
̲
訓
"
'
,
.
.
.
.
.
.
.,
・
.
.
由
鮒
.
,
凶
・山
・
・ :n.<

l

.~ .
.
̲
̲
l川 田

船 出M

河川同叩河は

H"HHEuuu

•.

同日沼畑﹄副酎 F

︐
d u " u u B﹄回目闘

L目別副副引副副副﹄ぽ‑SEEL山町引制剖剖

恥目白山

・

i
il

』 叩

d

、

酌 勺

止措Halieum回目腿

,
…

;ijlhil仙ll~111

酌同町

o
d
sg
r
a
p
h
i
c
so
nIw
i
d
t
h
=
3
.
8
i
nh
e
i
g
h
t
=
5
i
n
o
d
sp
d
fs
t
yI
e
=
S
t
a
ti
s
ti
c
a1
o
d
s1
a
y
o
u
ts
t
a
r
tc
o1
u
m
n
s
=
2r
o
w
s
=
2
c
o
l
u
m
n
̲
g
u
t
t
e
r
=
O
.1i
nr
o
w
̲
g
u
t
t
e
r
=
O
.1i
n 市ーーグリッドの定議,
o
d
sr
e
g
io
n トー 1個目のグリッド;
t
i
t
l
e"
A
s
i
a
"
p
r
o
cs
g
p
a
n
e1d
a
t
a
=
s
a
s
h
e1
p
.c
a
rs;
w
h
e
r
eO
R
I
G
I
N
=
"
A
s
i
a
"
p
a
n
e
l
b
yT
Y
P
EIl
a
y
o
u
t
=
p
a
n
e
lr
o
w
s
=
3c
o
l
u
m
n
s
=
2n
o
v
a
r
n
a
m
e;
e
s
p
o
n
s
e
=
M
S
R
Pg
r
o
u
p
=
M
A
K
Es
t
a
t
=
m
e
a
nd
a
t
a
s
k
i
n
=
s
h
e
e
n;
v
b
a
rM
A
K
EIr
t1
e
=
"
C
o
m
p
a
ni
e
s
/
B
ra
n
d
s
";
k
e
y1
e
g
e
n
dIti
c
o1
a
xi
sdi
s
p1
a
y
=(
n
o1
a
b
e1n
o
v
a1
u
e
sn
o
ti
c
k
s
)
1
a
b
e1M
S
R
P
=
'A
v
e
r
a
g
e ($)'
f
o
r
m
a
tM
S
R
P8
.
r
u
n;
く問機に他地域の 2つのグラフを作成〉
o
d
sr
e
g
io
n ;ト‑ 4個目のグリッド;
t
i
t
l
e"
A
v
e
r
a
g
ep
r
i
c
eb
yT
y
p
ea
n
dR
e
g
i
o
n
";
p
r
o
ct
a
b
u1
a
t
ed
a
t
a
=
s
a
s
h
e1
p
.c
ar
s
c
l
a
s
sO
R
I
G
I
NT
Y
P
EM
A
K
E
v
a
rM
S
R
P
t
a
b1
eT
Y
P
E
= O
R
I
G
I
N傘M
S
R
P
= (
n市f
=
b
e
s
t
.m
e
a
n
市f
=
d
o
l
l
a
r
l
0
.)
Ir
o
w
=fl
o
a
t
r
u
n
o
d
s1
a
y
o
u
te
n
d ;ホ一一レイアウトの終了処理;
o
d
sp
d
fc1
o
s
e

aM

ト山・・:.o.
.
.
.
守 叩 ,1
.
.
‑, 白 山 .

、~"__

̲4 鳴 り 崎 山

~<HUZ::.t

2
酬
'.同町、'"』川'l:. ~'l

:lH 出.,u.;!;

I'"Ut:lO
.
.
..
.
.
.
.
‑
'
!
I且白.... :
t叫 .hl '.I..n.~

' 叫 , 悶 劃

崎~­

叫 噌 弘 時

図1.3グリッドを定義するプログラムと出力結果

‑グリッドを定義しない方法(個別に出力サイズ・位置を指定)
ODS LAYOUT及 び ODSREGIONステートメン卜の widthオプションと h
e
i
g
h
tオプションを使用して,全体

のレイアウトのサイズ及び個々の表やグラフの出力領域のサイズをそれぞれ定義する方法を紹介する.CARS
データセットを使用して,自動車のタイプ別の都市部・高速道路部の平均燃狩 (MPG) について株グラフを
作成し,

r
width 8
i
nh
e
i
g
h
t
=1
1i
n
J オプシヨンで全体のレイアウトのサイズを定義するとともに, ODSREGION
ニ

ステートメン卜で各グラフを出力する領域のサイズ及び位置 (
1x
=
O
.
5
i
ny=I
i
n
J 等)を定義する.また, ODS
1
.4に SASプログラムと出
TEXTステートメン卜を使用して,任意の文字列をグラフの直下に出力するー│きI

力結果 (PDF形式)を示すが,定義した各領域にグラフが出力されていることが確認できる.

138

141.

プログラム t i t l ej = ch = 1 2 p t" M P Gf o ra l lr e g i o na n dc o m p a n i e s " o d sg r a p h i c so nIw i d t h = 4 .5 i nh e i g h t = 3 .8 i n: o d sp d fs t y1 e = S t a ti s ti c a1 o d s1 a y o u ts t a r tw id t h = 8i nh ei g h t = l li n :本一ーレイアウト定義, │出力結果 1 1 1 町 助1 :I > rT.‑ E a 司壇掴彊 ・ 量 置 置 ・ 圃 圃 臨 圃 邑 調竃璽 a E E B E E E E d 宿濁酒 R EEEEE 羽週週彊掴 日問問問 E・ ・ ・ E ・ ‑ E ・・ EE‑‑‑ZEEE‑zE 廻 温週週週週麺週温温濁掴掴 p o d sr e g i o nw i d t h = 5 i nh e i g h t = 4 i nx = O . 5 i ny = li n 率一一グラフ 1 t i t l e" M P G ( C i t y )b yT y p e p r o cs g p l o td a t a = s a s h e l p .c a r s: e s p o n s e = M P G ̲ C i t yg r o u p = T Y P E v b a rT Y P EIr s t a t = m e a nd a t a s ki n = s h e e nd a t a1 a b e1 f o r m a tM P G ̲ C it y8 . 1 r u n ti tl e na1 1t y p e s o d st e x t = " M P G( Ci t y )o fH y b ri di st h ehi g h e s t0円ei 闘 相d剛 仰 州 制 相 明 明 . " , , , ・ 日 日 句 ー 町 ' ‑ , ) " " ‑ , , , ‑ . . ̲ 一 一 M ・ 駒 市 山 占 由 、 鳩 町 日 吋 ω 彊窪温遭遇 Z E g e s ‑ ‑ s s a a a ︒漕調温瞳温 "2:、明 白濁窪廻 .湿掴掴鍾週遭遇 官民齢鳳町町国国民 , . . . . " 選酒運遭 吋同日間同時国間 o d sr e g i o nw i d t h = 5 i nh e i g h t = 4 i円 x = 2i ny = 6i n 本一一グラフ 2: t i t l e" M P G ( H i g h w a y )b yT y p e " p r o cs g p l o td a t a = s a s h e l p .c a r s: v b arT Y P EIr e s p o n s e = M P G ̲ Hi g h w a yg r o u p =T Y P Es t a t = m e a n d a t a s ki n = s h e e nd a t a1 a b e1 f o r m a tM P G ̲ Hi g h w a y8 .1 r u n ti tl e y b ri di st h ehi g h e s to n ei na1 1t y p e s .": o d st e x t = " M P G( Hi g h w a y )口fH 本 レイアウトの終了処理; o d s1 a y o u te n d: o d sp d fcl o s e: h・l . . . ̲̲ マ 咽 " 町 一 川 山 畑 山 由 . . 0 1 ̲ 図1.4出力サイズ・位置を定義するプログラムと出力結果 以上, ODSLAYOUTの構文及び基木的な使用方法を紹介したが, ODSLAYOUTは SASの表・グラフ作成プ ロシジャと組み合わせることによって高品質なレポートを容易に作成できることから,臨床試験等の解析結 果作成業務においては非常に有用な機能であるといえる 2 .ワクチンの臨床開発における D a s h b o a r dの作成 本~では,ワクチンの臨床開発の概要を紹介するとともに, ODSLAYOUTの活用事例として,ワクチンの 臨床開発における有効性・安全性の主な解析結果をまとめて 1ベージに表示する Dashboardの作成を提案す る. 1 )ワクチンの臨床開発の概要 ワクチンとは,病原体あるいは細菌毒素の毒性を弱めたり失わせたりしたものを人為的に接種しておくこと 謀 で,人間が本来持っている「病原体に対する抵抗力(免疫 ) J のシステムを利用して,これらのさまざまな J 感 珠 染 , 症 症 ‑ に 宗 対I する「免疫 J をあらかじめ作らせておく製斉舟剤│リl であり札,発病することなく免疫反応の記f 憶士立〈を残すこと が五可I 能となる 仏 ( h t t o ω 配 D 凶 : ゾ : / ρ / 八 1 ワクチンの臨床開発の概要を紹介する. ‑通常の薬剤開発との比較 表 2 . 1 に通常'の薬剤開発と異なる主な点をまとめるが,ワクチンの臨床開発においては,健常人(健康乳幼 児等)が対象であること,薬物動態試験が実施されないこと,アジュパントの評価が必要であること等,ワ クチン開発特有の項目が多数存在する.ワクチンの臨床開発において求められる詳非I l l f ,,:情報については,感 139

142.

染症予防ワクチンの臨床試験ガイドライン ( 2 0 1 0 ),W I ‑ I O( 2 0 0 4 ) ならびに EMEA ( 2 0 0 5 ) を参照、されたい. 分類 目的 対象 薬物 ~J 態試験 有効性の評価 安全性の評価 併用治療等 その他 ワクチン 感染症予防 健常人 通常実胞しない ‑サロゲートとなる抗体価・抗体保有率等の免 疫原性の評価(既承認ワクチンとの比較は非 劣性の検証試験を実施することが多し、) ‑感染防御については,他の薬剤の普及等によ り感染率が激減し,評価が困難となる. ‑プラセボの使用は困難 有害事象,局所・全身反応(日誌等) 健康乳幼児が対象の場合は臨床検査,バイタル サイン等のデータは通常収集されない I 己] 1 1 寺接種,混合ワクチン ‑ロット問の比較 ‑アジュパント,ブースター(追加免疫),株 ‑オフ ザーバーフ ラインド(プラセボ作成が困 W f tな状況下で,評価者には盲検性を維持) 通常の楽弗i 疾患の治療 患者 実施する ‑サロゲートとなる臨床検査項目の評価 ‑心血管イベント等については,多数の症例が必 要となるが,患者は多数存在する. ‑プラセボの使用は可能 有害事象,臨床検査,バイクルサイン,心電図等 併用薬,併用治療,配合斉J I 左記については,臨床試験では通常主な評価lの対 象とはならない ε ̲ 1 ワクチン開発と通常の薬剤開発の主な違い 表 2 ‑ワクチンの臨床開発における主な評価項目 . 2に ま と め る . 有 効 性 に つ い て は , ワ ク チ ン 特 有 続いて,ワクチンの臨床開発における主な評価項目を表 2 の抗体価に関連する評価項目,安全性については,通常の有害事象に加えて日誌等を用いた局所反応・全身 反応に関連する評{耐項目の情報がそれぞれ収集される.但し,表 2 . 1 にもあるように,乳幼児が対象の試験 では,臨床検査項目,パイタルサインならびに心電図等の情報については通常収集されない.また,各評価 項目に用いられる統計解析手法の詳細については, JozefNauta ( 2 0 1 0 ) や松尾ら ( 2 0 1 0 ) を参照されたい. 分類 評価 J夏 目 備考 有効性 Geom巴t r i cMeanT i t e r(GMT: 幾何平均抗体価) 抗体価{土抗原抗体反応より得られる免疫JJj(性を評価す 安全性 G e o m e t r i cMeanR a t i o(GMR: 幾何平均比) る指標で,通常対数正規性を仮定 逆累積分布曲線 抗体価の分布を図示 抗体保有率,抗体陽転率 抗体価について抗体保有の基準を満たす被験者の割合 V a c c i n eE f f i c a c y(VE; ワクチン有効性) 大規桜臨床試験による感染防衛i 等の評価 有害事象 I開発と同様 通常の薬斉J 局所反応・全身反応 日誌等による接種後の局所・全身反応の収集 表2 . 2 ワクチンの臨j 未開発における主な評価項目 2 ) ワクチンの臨床開発における Dashboardの作成 木 節 で は , ワ ク チ ン の 臨 床 開 発 に お け る 架 空 の 臨 床 試 験 を 想 定 し , 主 な 評 価 項 目 を 1ペ ー ジ に 要 約 し た Dashboardの作成を捉ー案する. ‑想定する臨床試験の概要 . 3 のようなワクチンの臨床開発後期における臨床試験を想定する.健康乳幼児を対象とした被験薬群, 表 2 対 照 薬 群 の 並 行 群 間 無 作 為 化 比 較 試 験 と し , 初 回 免 疫 期 に 3回 , 追 加 免 疫 期 に 1回 治 験 薬 を そ れ ぞ れ 皮 下 接 種する.抗体価については初回免疫期の前後ならひ。に追加免疫期の前後に測定し,主要評価項目は初回免疫 1 4 0

143.
[beta]
期 3回 接 種 後 の 抗 体 保 有 率 と す る . ま た , 各 接 種 (
4回 ) に つ い て 局 所 反 応 ・ 全 身 反 応 の 有 無 を 調 査 し , 臨
床検査値,パイタルサイン,心電図についてはデータを収集しない.
項目

内容

日
中

第 J
lI相検証試験(試験名

対象

健康乳幼児

PROD‑XXX
lSTUDY‑XXX)

試験デザイン

21
持(被験薬群 (YaccineA) ・対照薬群 (YaccineB)) 並行群問 !
!
l
¥作為化比較試験

目的

被験薬と既承認ワクチンとの非劣性を検証する.

主要評価項目

初回免疫期 3回接種後の抗体保有率(対!l日薬群との非劣性検定)

その他の評価項目

抗体価の G M T,逆累積分布曲線,有害事象,局所反応・全身反応の発現率

免疫 J
V
Iとして皮下に l回接稀
初回免疫期として皮下に 3回接種,追加l

表2
.
3日
先l
定する臨床試験の概要

‑テストデータ

k述した臨床試験において, Dashboardの 作 成 に 使 用 す る テ ス ト デ ー タ を 図 2.1 に ま と め る . ワ ク チ ン 開 発 特
有の抗体価の情報を格納したデータセット

rTITERJ や 局 所 ・ 全 身 反 応 の 発 現 率 を 算 出 し た デ ー タ セ ッ ト

rL R TJ 及 び rS R TJ を用意する.
内容(ー部抜粋)

データセット

l
D

MASTER

被験者 10(
1
0
) と投与群( GRP)
卜 (
1 症 例 I レコード)

TITER

I
D
(YJS汀 ) の 抗 体 価

( TJTER),対数変換後の抗体側
(LOG̲T汀), 抗 体 保 有 の 有 無
(̲SERO)等を格納したデータセ

ット

LR T.

SR T:

各接待後の各投与 i
洋
)
3J
Iの局所・
全身反応の有無
発を見本

(LR.

SR) と

(GI, G2) を格納した

データセット(あらかじめ各投
与群の発現率会計算しておく)

T
甘ER
3
s
9
9
1
3
3
4
1
9
5
.
1
.
3
0
5
8
3
5
5
9
5
u 19821953
1
1
9
7
B
S
1
4
3
S
2
0
8
7
9
0
9
5
7
2
9
5
3
6
.
0
9
9
4
3
3
9
8
4
1
<29
8
2
3
7
8
9
6
1
1
6
5
6
1
3
2
7
3
8
6
5
8
4
3
5
0
2
0
7
1
2
1
9
7
1
1
5
1
8
1
7

V
l
S
汀
1 GRP
̲GRPC 1
IV<!ICC
!
同A VaccneA 8a司 l
i
n
e
官 A V占ccneA A
f
l
e
rP
r
i
m同
I¥jdl;<:官
1V
a
c
c同 A V
a
c
c同 A 8ef
O
f
'e8回 ~tef
IVdCC
l
同 A Vacc同 A A
f
f
e
rB
∞:
;
t
e
r
2 V耳
,
目
、eA Vdcc.
r
eA Bas
e
l
i
n
e
2 Vιc
同
, A VdCc
i
n
eA A
H
e
rp
ri
m向
2VdCc
i
n
eA V~ccm A B
ef
o
r
e8田 :
:
;
t
e
r
2V
a
c
C
l憎 A Vaccr
,
eA A
f
t
e
rB
∞
引
'
"
3V
o
c
c
i
問
B ¥
j
,占c
c
i
n
e8 Ba~el れe
官
官 B Vac、
町.B 削 t
e
rP
r
i
m
官
官
3V
a
c
c

V
1
S
π
1
s
t
1
s
t
2
n
d
2
n
d
,
d
3
3
,
d
4
th
4
t
h
Ov
e
r
al
I
Ov
e
r
al
I

AE:

lR
2
2
2
2
2

0
1
02
3
7
2 4
7
2
5
2
8 5
2
.
8
4
3
.
6 5
7
.
5
5
6.
4
4
2
.
5
7
2
.3 61
.
3
2
7
7 3
8
7
7
3
.
1 '
7
2
2
6
6 5
2
.
8
9
8
9 9
6
.
2
1
1
3
.
8

岨
:
<
:
r"
,
,
;
r
司A
IVl>!:c

河
。

l
O
v
e
r
a!

!',J,.../.~;.

を絡納したデータセット (1 事象
,

,
l'
.
,
f
玩
,
.
.
.
.
.
‑
:
;
.

2

1 V~.f::.

含

11/
1
>
<
'
'
'
:
'
哩 A

2

1Voc<:

V~正..,

r
品
司

'
<
.
)
.
司
,
.
,
哩
同
町

一

looπT
2 0
.
5
9
0
宮6
8
0
9
I U8i501816
,
9
8
6
2
4
9
5
、
12
1
[
12
0
7
8
4
0
2
9
5
8
'
2‑
0
0
5
6
4
5
8
1
3
1 1
.
5
5
7
5
0
0
9宮
11
1
5
5
2
8
2
5
1
8
11
6
1
9
6
8
2
0
7
6
2 0
8
1
8
5
1
2
9
2
:
11
3
4
1
8
5
3
0
2
3

山一一一一ムG一~円:'1'吋町"l'h噛ï;.書~官‘事J官E軍E 一

‑

..
骨

}
市
:
‑
c
'
'
'
'
'
'~戸".d.l 1帥~
、
世
口
正:'1"
'
.
.
.
.
.
.
.
f
自
司
叶4
.
,‑1岨
,
,
,
臼
=
同
,1 1.....、

E

~,可t' r ..s,,~...且、

"'~引町、;,'-!"ff ",骨官町『

h
I
l
"
:
'
o
;
"~i,~明暗 :1""
h
骨
甲
府
'
.
"
,
.
.
.
.
暗
.
.
.
.
,10::>"'

凶 2.1 テ ス ト デ ー タ の 概 要

昨, .
,
.
.
.
,
.
I
!
'
時
計
川
町
、

'
.
t. ι.

ぐ割H剛 a:Jπ<";""';'富山町刷、,,!I':II'ø~.'等

h皿"吃""J!e f':'士.~

141

SERO

SR I̲
G
I ̲
0
2
3
0
2
3
.
' 3
2 7
5
6 6
7
0
1
9
1
6
0 3
2 8
4
.
0 6
5
1
2
B
.
7 2
8
3
7
2 7
1
3 7
1.
1
1
7 2
7
.
1
2 8
B
3 7
2
.
6
5
3
2 7
9
.
2
2 4
6
3 2
0
.
8

V
1
S
汀
1
s
t
1
s
t
市,d
2
2
n
d
3
,
d
,
d
3
4
1
1
、
4
仏

1 VA民間 ~-'-T.一
'Y'!l(一再
B一
1,
j
¥

有 害 事 象 の 情 報 ( PT, SOC)
l レコード)

GRPC
1V
a
c
c
i
n
eA
.
r
eA
1Vacc
2V
a
c
c
i
n
e8
2V
a
c
c
i
n
e8
1V
a
c
c
i
n
eA
f
l
き
日
2 VaccI
1V:
a
c
cI
f
l
eA
tV
a
c
c
i
n
eA
2V
a
c
c
i
n
eB
2V
.
c
c
i
n
e8

2
3
4
5
6
7
B
9
1
0

等の情報を格納したデータセッ

各評価時点

GRP

",

会 問 問

明
.
記
d
"
暗M 民..制画、e~",r,<l:!r~1申制e
廿
白
吋 B可
.
,
血
町t
s
.
O
h
:
n
$
.
l
e

屯
f

由
唱

G
弔宮
Z市
d
3
s
E
a
J
I
x
d
d
$
z

h
le
o
:
'
.
.
.
.
.
.
.
.
‑
l
Io
i

刊 行¥
d
'
.
.
.
.
.
.
.
;

ヰ
3
:
喧F
d
a
o
!
u
d幅 ...~,!IIl世記"'''ど, 001 0'司 s 句
,-;",、~守
d品記1 -1,隠

o
̲

孟 .
.
.
.
~~血き罰刷ヰ苛剖正晴 S 恒

i
d:Io:~,守宅 IY"""南宮、泊剖白川ーで

ら
.
"
.
'
"

判 的

__j…

~~E~

"
'
‑
‑
'
i
l

144.

‑各評価項目の解析結果・グラフの作成 有効性の主な評価'項目について, SAS による実行方法と表・グラフの作成方法の概要を以下に紹介するとと もに, SASプログラムと出力結果を図 2 . 2に示す.なお,有害事象や局所・全身反応の表・グラフについて は付録の Dashboard 作成プログラムを参照されたい.また,解析プログラムや表・グラフの作成方法につい ては高浪,舟尾 (2012) や高浪 (2011,2012) も併せて参照されたい. ‑抗体価の初回免疫前後の逆累積分布曲線 FREQ プロシジャで対数変換後の抗体価 (LOG T汀)について累積ノ〈一セントを算出後,逆累積パーセン t e pステートメントで逆累積分布幽線を作成する. トに変換して SGPANELプロシジャの s ‑抗体価の初回免疫後のヒストグラム SGPANELブPロシジャで投与群ごとの抗体価についてヒストグラムを作成する(初回免疫後の時点に絞る). .各評価時点の抗体保有率の棒グラフ FREQプロシジャで各評価時点の抗体保有率を算出し, SGPLOTプロシジャの vbarステートメントで投与 群を横に並べて抗体保有率の棒グラフを出力する. ‑抗体価の初回免疫前後の箱ひげ凶 SGPANELプロシジャの hboxステートメントで初回免疫後の対数変換後の抗体制について投与群を縦に並 べて箱ひげ図を出力する. ‑初回免疫後の抗体価の GMTのフオレストプロット SUMMARYプロシジャで対数変換後の要約統計量を算出後,逆対数変換して値を数値及び文字列で格納し, s c a t t e rステートメントの markerchmオプションを使用して GMT及び信頼区間の値をそのままグラフに出力 する(グラフ出力部分以外は付録の Dashboard作成プログラム参照). ‑初回免疫後の抗体保有率における非劣性検定 SAS9.3では, FREQプロシジャで割合の差について非劣性検定をいくつか実行できるが,ここではその中 i s k d i f fオプションの中 の一つである FarringtonandManning (1990) による検定を実行する.使用方法は, r , 日l a r g i n = O . 1 (非劣性マージン)をそれぞれ記述する. で method=FM,noninf プログラム 初回免疫前後の逆累積分布幽線の作成, 出 ノJ結果 本 p r o cs o r td a t a = ̲T !T E R b yV I S I T̲ G R P run; o d s1 i s ti n gc1 o s e; o d so u t p u tO n e w a y f r e Q s = ̲ O U T F R E Q ( k e e p= V I S I T̲ G R PL O G ̲T !T c u m p e r c e n t ) *ーー累積パーセントの取得: p r o cf r e Qd a t a = ̲ T I T E R; b yV I Sl T̲ G R P ;t a b l eL O G ̲ T I T r u n o d so u t p u tcl o s e o d s1 i s ti n g; d a t a R C D s e t̲ O U T F R E O ;b yV1 SI T̲ G R P; i ff i r s t .̲ G R Pt h e nd o C D F=1 0 0 ,o u t p u t ;e n d; ̲ C D F=1 0 ( トc u m p e r c e n t * 逆累積パセント; o u t p u t r u n p r o cs g p a n e1d a t a =̲ R C D w h e r eV I S I Ti n ( 1 0 . 2 0 ) p a n e l b yV I S I T/n o v a r n a m e; s t e px = L O G ̲T I Ty = ̲ C D F/g r o u p = ̲ G R Pj u s ti f y = ri g h t 1 e g e n d1 a b eI = " " k e y1 e g e n d/ti t1 e = " r o w a x i si n t e g e rl a b e l = 'P e r c e n t (百)'; c o l a x i si n t e g e rd i s p l a y二 ( n o1 a b e1 ) r u n 142 ∞ 1 2 曲 面 、 。 A f t 酢 P r i n " 合 理 B. 『 80 h L 日 c 60 判白 包 40 ο 止 20 耳」 。 1 0 2 v . ιrine ‑A 3 1 0 v.凶~ 3 ー ヲ

145.
[beta]
プログラム

出力結果

トー初日免疫後の抗体価のヒストグラム,

p
r
o
cs
g
p
a
n
e1d
a
t
a
=
̲T1
T
E
Rn
o
a
u
t
o1
e
g
e
n
d;
w
h
e
r
e VISIT=20
p
a
n
e1
b
y̲GRPI1
ayout=co1
u
m
n1
a
t
ti
c
en
o
v
a
r
n
a
m
e;
histogramLOG̲TITIscale=count
f
iI
l
a
t
t
r
s
=
(
c
o
l
o
r
=
s
a
l
m
o
n
)
transparency=0.5
y
p
e
=
n
o
r
m
a
ll
e
g
e
n
d
l
a
b
e
l
=
u
n
d
e
n
s
i
t
y LOG̲TITIt
r
o
w
a
xi
s1
a
b
e1
=
"
C
o
u
n
t
"
c
o
l
a
x
i
sl
a
b
e
l
=
"
L
o
g
‑
T
i
t
e
ra
f
t
e
rp
r
i
m
i
n
gv
a
c
c
i
n
a
t
i
o
n
";
r
u
n

2
5
2
0

515

0
{
.
)

1
0

o

1

2

3

0

L
o
g
‑
T
i
t
e
ra
f
t
e
rp
r
i
r
n
i
n
gv
a
c
c
i
n
a
t
i
o
n
ホー

初回免疫前後と追加免疫前後の抗体保有率棒グラフ

'
;
;
? 100

o
d
so
u
t
p
u
tC
r
o
s
sT
a
b
Fr
e
q
s
=
̲SRATE (
w
h
e
r
e
ニ
(
ーT
Y
P
E
̲=
"
1
1
1)
)
p
r
o
cf
r
e
q data=̲TITER ;
table VISIT
ホ̲
GRP
ホ̲
SEROIn
o
c
o1nopercent
r
u
n
o
d
so
u
t
p
u
t c1
o
s
e;
p
r
o
cs
g
p1
o
td
a
t
a
=̲SRATE ;
w
h
e
r
e S
E
R
O= 1
v
b
a
r VISITIresponse=RowPercent barwidth=1
.0
group=
̲GRP d
a
t
a1
a
b
e1dataski
n
=
s
h
e
e
n
groupdi
s
p1
a
y
=
c1
u
s
t
e
r
唱
)
'
y
a
xi
s1
a
b
e1
=
'Seroprotecti
o
nR
a
t
e(
x
a
x
i
sd
i
s
p
l
a
y
=
(
n
o
l
a
b
e
l
)
f
o
r
m
a
tR
o
w
P
e
r
c
e
n
t6
.1
r
u
n

U

百

947

fJ5

8
7
1

80

ι
g7

1
4
5

Z
~

5
0

U

。 40
(
l
)

与 20

』

お

。
。
、

ベ
主

z

、
.
̲

令
巳

、~

ミ
お
う
ヲ

、

弓
,

'0
,
,
‑

よ
k'e
A d L

e

九
、
.
.
1

'
‑
1
.
.
0.

省、や~~

金
」

[面 V ,.cci晴卓三 V9~cin<e B!

唯一一初回免疫前後の抗体価の箱ひ 1
1図,

p
r
o
cs
g
p
a
n
e1data=
̲T1
T
E
R
w
h
e
r
eV
I
S
I
Ti
n
(
1
0,2
0
)
p
a
n
e
l
b
yV
I
S
I
TIl
a
y
o
u
t
=
c
o
l
u
m
n
l
a
t
t
i
c
en
o
v
a
r
n
a
m
e;
h
b
o
x LOG̲TITIgroup=̲GRPboxwidth=0.5
1
e
g
e
n
d1
a
b
e1
="" grouporder=ascendi
n
g
groupdi
S
p1
a
y
=
c1
u
s
t
e
r
t1
e
士" .
,
k
e
y1
e
g
e
n
dIti
c
o
l
a
x
i
si
n
t
e
g
e
rl
a
b
e
l L
o
g
‑
T
i
t
e
r
'
r
u
n
唯一一初回免疫後の抗体価の G
M
T;
p
r
o
cs
g
p1
o
td
a
t
a
=̲LOG̲BACK n
o
a
u
t
o1
e
g
e
n
d;
where V
I
S
I
T= 2
0
s
c
a
t
t
e
rx
=
G
M
Ty
=
̲GRP
Ixerror10wer=LCLM xerrorupper=UCLM
markerattrs=(color=black s
y
m
b
o
l
=
c
i
r
c
l
e
f
iI
l
e
d
)
s
c
a
t
t
e
rx
=
x
1 y=
̲GRPIx
2
a
xi
smarkerchar=GMTSD̲C
s
c
a
t
t
e
rx
=
x
2 y=
̲GRPIx
2
a
xi
smarkerchar=LCLM̲C
s
c
a
t
t
e
rx
=
x
3 y=
̲GRPIx
2
a
xi
smarkerchar=UCLM̲C
r
e
f
l
i
n
e7
5
0Ia
x
i
s
=
xl
i
n
e
a
t
t
r
s
=
(
p
a
t
t
e
r
n
=1
)
y
a
xi
sdi
screteorder=unformatted i
n
t
e
g
e
r
di
s
p1
ay=(
n
o1
a
b
e1
)
o
f
f
s
e
t
mi
n
=
O
.3offsetmax=0.3 ;
x
a
x
i
so
f
f
s
e
t
m
i
n
=
O
.1offsetmax=0.5
l
a
b
e1
ニ"
G
M
Ta
n
d9
5百 C
Ia
f
t
e
rp
r
i
m
i
n
gv
a
c
c
i
n
a
t
i
o
n
";
x
2
a
x
i
s display=(noticks n
o
l
a
b
e
l
)
offsetmin=0.65 offsetmax=0.05
f
o
r
m
a
tG
M
T7
.
1G
MS
DU
C
L
M LCLM 7
.
2
r
u
n

A庇哩 r軒 z
何宙博

8
0
z
e
l昨告
ト ーζ互
トー寸

」一直子→

川一一・・1‑→

。

4

1

3

"

‑
1

。

トー圃圃ー→
1

2

3

GMT(SDl

LCL

UCL

lo g- T 孔~,

l .y"ι O:;'X>4 ^
口 v ι M唱団

ご,

nuA

faE14BIll‑﹂III‑

e
e
円︑
cc
uιE
VV

143

←
‑
・
一
一
→

.
tt:l釦 < 、 e

ト‑‑‑+‑一一寸
rー
ー
ー
寸
ー
ー
ー
‑
‑
r
一
ー
ー
守
45 :
:
=
.
r
:
三
‑
5 6
.
0

、

い t U,
)
I

~~I

GMT n
d95 Cl<t ft~. p
r
il'l!tlj(袖CC;'.誌b占h
!
j

146.
[beta]
フ。ログラム
トー初回免疫後の抗体保有率についての非劣性検定,
o
d
so
u
t
p
u
tP
di
f
f
N
o
ni
n
f
=̲
FM;
p
r
o
cf
r
e
qd
a
t
a
=̲
TJ
T
E
R;
t
a
b
l
eV
I
S
J
T
*G
R
P
本 S
E
R
O
/n
o
c
o
ln
o
p
e
r
c
e
n
t
r
i
s
k
d
i
f
f
(
m
e
t
h
o
d
=
F
Mn
o
n
i
n
fm
a
r
g
i
n
=
O
.
l
l
r
u
n
o
d
so
u
t
p
u
tc1
o
s
e
d
a
t
a F
M
2
s
e
t FM; i
f N =2; 本
初回免疫後;
r
u
n
p
r
o
cp
ri
n
td
a
t
a F
M
21
a
b
e1n
o
o
b
s
s
t
y1
e(
h
e
a
d
e
r
l=!
b
a
c
k
g
r
o
u
n
d
=
A
z
u
r
e
}
v
a
rE
s
t
i
m
a
t
eP
v
a
l
u
e/s
t
y
l
e
=
!
w
i
d
t
h
=
1
0
0
p
t
}
‑
v
a
l
u
eo
fN
o
n
‑
i
n
f
e
ri
o
ri
t
yT
e
s
t
";
l
a
b
e
lP
v
a
l
u
e= P
r
u
n

出力結果
f
f
e
r
e
u
c
e
P
I
'
o
p
o
r
.
i
o
l
lD
i.
0
.
0
6
9
5

Fu
l
m
o
f
N
O
E
H
E
r
e
H
o
T
r
m
i
t
y
gl
│

O
.
o
o
o
l
j

二一

図2
.
2 各評価項目に関する表・グラフ作成プログラム

•

Dashboardの作成

ODSLAYOUT,ODSREGIONならびに上述した SASプログラムを組み合わせて,ワクチンの臨床開発にお

ける Dashboardを作成する.プログラムの大まかな流れとしては, TEMPLATEプロシジャでフォントの種類
や表・グラフの背栄色等の出力スタイルを定義した後, ODSLAYOUTステートメン卜でグリッドを定義し,
ODSREGIONステートメン卜とともに各評価項目に関する出力プログラムを順に記述していく

なお,出力

.
3に示すが,プログラムの詳細は
ファイル形式は PDFとする. Dashboard作成プログラムの処理フローを図 2

付録を参照されたい.

抗体保有率の算出,非劣性検定の実行

O
D
SP
D
F, O
D
SL
A
Y
O
U
Tの終了処理

関2
.
3Dashboard作成プログラム処理フロー
‑グリッドの定義
ODS LAYOUTステートメントによるグリッドの定義とイメージを閑 2.4に示す.上:段に有効性の評価項目,

下段に安全性の評価項目を出力するためのグリッドを定義しているー使用するオプションの概要を以下に示
す.
,
,
/ c
olumns= 5,rows= 3

亨J
Iに 5個,行 i
こ 3個のグリッドを定義する

=0
.
1i
n,row̲
g
u
t
t
e
r=0
.
1i
n:グリッド問のスペースを行,亨J
Iともに 0
.
1インチとする.

,
,
/ c
o
l
l
ll
1
1n
̲
g
l
l
t
t
e
r

,
,
/ c
o
l
l
ll
1
ln
̲
w
i
d
t
h
s= (
3
i
n3
i
n1
.5
i
nl
.
5i
n1
.5
i
n
)
:各列のグリッド帽を定義する.なお,抗体保有率の棒グラフ,

1
4
4

147.
[beta]
非劣性検定の検定結果,局所反応・全身反応の棒グラフを出))する際には, c
o
l
u
m
n
̲
s
p
a
nオプションを
指定してそれぞれ 2列分のグリッドを使用する.
J row
̲h
e
i
g
h
t
s= (
2
.
5
i
nI
.2
i
n3
.
5
i
n
):各行のグリッドの高さを定義する.

ODSLAYOUTステートメント
│レイアウトイメージ
o
d
sl
a
y
o
u
ts
t
a
r
t
c
o
l
u
m
n
s
=5
r
o
w
s
=3
c
o
l
u
m
n
̲
g
u
t
t
e
rニ 0
.
1i
n
.1i
n
r
o
w
̲
g
u
t
t
e
r =O
c
o
l
u
m
n
̲
w
i
d
t
h
s=(
3
i
n3
i
n1
.
5
i
n1
.
5
i
n1
.
5
i
n
)
2
.
5
i
n1
.
2
i
n3
.
5
i
n
)
r
o
w
̲
h
e
i
g
h
t
s =(

図 2.
4D
a
s
h
b
o
a
r
dのグリッド定義

.Dashboardの出力結果
D
a
s
h
b
o
a
r
d作成プログラムの山 j)結果を図 2
.
5に示す.定義したグリッドに各評価項目の結果が山 jJされてい
る.抗体価,有害事象ならびに局所・全身反応の発現プロファイルの投与群問の比較等,ワクチンの臨床試
験で求められる主な解析結果が高品質な表・グラフで 1ページに要約されており,言点検結果の確認や意思決
定を行う際の利用価値は非常に高いと考えられる.

i
:
i
;
j
¥¥
PROD‑XXX
.
l
STUOY‑XXXEfticxyRes!
it
s

・
・
・・

b

…
、・
‑
…

,,

,きー

l̲̲̲

;
!
L
m
叫i
l
:
ご

M .P
r
t
布陣

R

a

E軍配当.

rー
も E昌置

"'~A..r

。 1 :

3

』ー.a:ト4

・
←
‑
‑
一
『
・

相

・
拘'
1 ,
̲
.
.
.
.
.
寸
I

・.',.~

C

畑一什

トー←‑,

と'
!
.
D ~"

IT
玉三豆J
.
.
.
.
.,
̲j
i

. : 0 陶

,・一一

.
'
.
,
.
.
.

ト

~""""

・・

R h斗 .

“no~.
.
v、司副鱒包画面圃圃圃量
h目前日れ柄欄$司繍瞬鵬層

答~.....-I・

…‑

・
.
.
'l'I~,.l‘..・

,
'
""(:"1園 田

p
"

トー.
.
.
.
.

←『←‑<

.
.
,
.
.
̲
市
圏
車

~事 W 内旬 ...tc..,.'lr 'εε ・n 伺 """,,,..ty..... -I ・

ド4

一一‑

町獅

C1
1
)i
:
:
lJ~ ‑
C
C:
.
ρ
'
"
1
0
i・..~;;.ι;;"';:1

ニ.!~.~:~.'・;:;:1

i

・

,
r
:
: "1...-~...o I
'
¥
.

'~'"

『 曹 ...

‘)~

.

..
ι

‑

I,
..、量
1

F
u
l
lA
.r
司Y5!
S50
:1
(FAS)
W晶 u~dinlf碍寸f-<:acy

.
c(:Jc:J田S 四 ~S a:官 .
.
.
.
.
x
可

(
>:;;~~~

1
"
j
.
'>同同‑dJt::
n
t
h
eo
?
‑n
e
‑
ロ
。fV3i::εinE
:A w
苗 間
│岡山lt'..1n
c,~ 3C ~ve 出向,,, 1 由唱.3I' d !
n
!1
!
"
!
"
:
e
mby
Imo'モ!:'un.J?暗唱 pecf~c ~Cn而日 onty m3司 10%

:
h
.
'
"

l
!
Jds
L
e
:
j
.E
:C
f
5p
o
:
rg
悶叩
3
陀 げ 鴫J
OEd

n

一

:
l
i
孟(通1型

n.".,t-~,・"掴・

世
,
、ce~,1 tぞ仇,

事覇軍軍閥匪謹

:.:J骨羽2

h
¥c
ii
3
enCf
:
l P...II te 偶 ðl~Ó RR(
8
.
.
$
.
;
;,
;
:
;
2
)

i>"Jl'i!t c:'!:!lr...e~可'''!:~I1I",圃圃圃圃圃画面画-

l
"
o
i

I1
I

.
・ T.... study

ド 民

1,
c

甲 山 町 ' ̲ '

I
n
c
id
t
:nc
;
:
;e R.
1l
c(
包 }ofAd
ver写eE'Jc
n
l
:
:

G制*脚ベF

0
1V
a
c
.
c
j
f
l
e6

~叫 I

ι

L=r T
'
:
‑
t
.

Lb""

,
I
i
g
l
悩 yt
¥"
.
;
n
e
r
t
h

I

I
P
̲
v.1̲Df~a-,i.&ri~~;-I"!i
r‑
‑
‑
‑
‑
‑
‑
‑
‑
‑
‑
‑
‑
‑
‑
‑
‑
‑
‑
‑
‑
‑
‑
‑
j~・ m ・-回f&l' f a(1'
y
"
吋
叫!'::l."

¥
.
'
;
)
Cc
i
n
eA aner
vxdn.3t
'
O
r
:penoo.
:
m
d

墨遺書量遺書

護主主主ζ三五~

lorH
.
!
:
r3~tor pt"im
町家 "
'
K
>
:
:i
I
'
l
(
r
t時 間

l

I
I

審蓮量 華麗遭I 1 I

"
,

)
;

彊

・
<
,
凶1
1
.
.
.
.
.
..
.
1
・
寸

u

1
:
1

句"吋ι~ L,同r
HR

謙.:=!.:.二三三~

Inc 元de~ヲ,.日陀 cf L
ce<
l
l

Re :3 ctc 市 ofVacε r-~ A
~,詞司Iy府市高 ed 0叩 n
g

,
mmgVX.C
l世 間 nþ~ :1 c-<i.
pr

ψ‑

︑

‑EZC

i‑圃町J
︑:
電

WJ‑‑

・

曲一‑

剛

7A 幅引 L V E引hg

岨
E
‑A一
国一国一 E
S"CEE
‑
・玄z
‑c
Z2 3

E
3開
・
3
u
‑‑
予
J
‑
‑︒
i

Pc
t
.
.
.

三
二
│
庄
工

ぽ1
2
.
5 ワクチンの仮想臨床試験における O
a
s
h
b
o
a
r
d

145

直豆~

0時r.JUne:do
?r
羽田吊憧"
S
y
s
t
.
:
m:
.
cF
:eacbcn'
5o
f
Vxci
r
.
‑
eBw.
晶 s
!
i
g
n
t
l
y
h
l
g
h
e
r1
J
.
a
n1
h
3
1o
fV xc
.
同
A

148.

3 .おわりに 木稿では, Dashboardの有用性と SASの ODSLAYOUTの使用方法を説明するとともに,活用事例として,ワ クチンの臨床開発で求められる主な評価項目について仮想の臨床試験データを用いた Dashboard の作成方法 を紹介した.その結果, ODSLAYOUTを用いて作成された Dashboardは膨大な量の臨床試験の解析結果を分 析する際の有用なツールの一つになり得ると考えられた. SASには ODS LAYOUTのみならず,高品質かっ 豊 富 な 種 類 の グ ラ フ を 作 成 で き る SG プ ロ シ ジ ャ , レ ポ ー ト の 出 力 ス タ イ ル の カ ス タ マ イ ズ が 可 能 な TEMPLATEプロシジャ,高品質な要不J 表を作成できるレポート作成プロシジャ等に有用な機能が順次追加さ れており, Dashboardの作成はそれらの発展を最も享受できる活用方法の一つであると考えられる.今後も臨 床試験のみならず他の分野においてもさらなる活用方法の提案が活発になされることを期待したい. 謝辞 本稿を作成するにあたり,日頃より有益なご助言を戴いた橋本隆正氏に感謝申し上げる. 連絡先 vouhei.takanami( a )t akeda.com 参考文献 • DanO'ConnorandS c o t tHuntley( 2 0 0 8 ) .CustomR e p o r t i n gUsingODSLayout .SASG l o b a lForum2008 ・感染痕予防ワクチンの臨床試験ガイドライン(薬食審査発 0527 第 5 号 , 2010) • i n e sonc l i n i c a le v a l u a t i o nofv a c c i n e s :r c g u l a t o r ye x p e c t a t i o n s(WHOT c c h n i c a lRepo , ロS c r i c sNo.924, Guid巴l 2004) ・ GUIDELINEONCLINICALEVALUATIONOFNEWVACCINES(EMEA/CHMPNWP/164653/2005) • J o z 巴f Nauta( 2 0 1 0 ) .S t a t i s t i c si nC l i n i c a lV a c c i n eT r i a l s .S p r i n g e r ‑ 松 尾 宮 土 男 , 甘 利 裕 邦 , 大 橋 立1 守 主 ! t(2010)iワクチンの評価における統計解析」臨床と微生物 Vol . 37NO.3 • .P .andG .Manning( 1 9 9 0 ) .T e s ts t a t i s t i c sandsamples i z efom1Ul a ef o rc o m p a r a t i v eb i n o m i a lt r i a l s F a r r i n g t o n,c w i t hn u l lh y p o t h e s i s ofn o n z e r or i s kd i f f e r c n c eo rn o n e n t i t yr e l a t i v er i s k .S t at . Med.,9 :1 4 4 7・ 1 4 5 4 . DOI 1 0 . 1 0 0 2 / s i m. 4780091208 ・高浪洋平,舟尾暢男 ( 2 0 1 2 ) r 統計解析ソフト ~SASj] J 工学社 ・ 高j 良洋平 ( 2 0 1 1 ) rSGプロシジャと GTLによるグラフの作成と ODS PDFによる統合解析 l 阪票の作成 TQT 試験における活用事例 ~J SASユーザー総会 2 0 1 1 ・高浪洋平 ( 2 0 1 2 ) iSASと HTMLアプリケーションによる CDISCADaM形式の解析用データセットを用 いた有害事象の解析帳票・グラフ簡易作成ツールの開発事例 JSASユーザー総会 2012 146

149.

付録 (Dashboard作成プログラム) Oashboard作成プログラム o d s 1i s ti n g; o p ti o n sn o c e n t e r nodate nonumber p a p e rsi z e =A 4o ri e n t a ti o n =1 andscape n o f m t e rrm p ri n t. ti t1 e ;footnote ; 本本料梓梓梓 Dashboardのスヲイルテンプレートを定義材料材料料, proc template ; d e fi n es t y1 eMystat ; parent=sty1 e s .stati s ti c a1 c1 a s sc o n t ai n e r / backgroundco1 o r =whi t e f o n t f a m il y = " T i m e s New Roman" fontsize=9pt ; ホ o d s text部分に効く c1 a s s document / backgroundco1 o rニ w h it e; c1 a s sb o d y / backgroundco1 o r =whi t e 1 eftmar gi n = O .5cm ri g h t m a rgi n = O .5cm t o p m a rgi n 三0 .5cmbottommargin=O.5cm ; c l a s s table / backgroundcolor = CXFFFACD frame=box rules=rows bordercolor=black ; c1 a s sc e1 1 / backgroundco1 o r =w hi t e; c l a s sd a t a / backgroundcolor =white f o n t f a m il y = " T i m e s New R o m a n " fontsize=8pt ; 本 表中の数値に効く c1 a s s output / backgroundco1 o r =whi t e class RowHeader / backgroundcolor = CXFFFACD f o n t f a m il y = " T i m e s New Roman" fontsize=8pt ; m e s New Roman" fontsi ze=8pt ; c l a s sH e a d e r / backgroundcolor = CXFFFACD f o n t f a m iI y = Ti c1 a s sG raphBackground / c o l o r =Azure ;*一一グラフ軸の外側の背景色, c l a s s GraphWalls / グラフ措函エリアの背景を指定; c o l o r =white frameborder = o n 1i n e s t y l e = 1 1i n e t h i c k n e s s= l p x ;* c l a s s GraphBorderLines / contrastcolor = black 1i n e s t y l e = 1 1i n e t h i c k n e s s= l p x .トーグラフ領域の外側のライン, c l a s s GraphAxisLines / a c k 1i n e s t y1 e二 1 1i n e t hi ckness = 1 p x ti c k di s p1 a y = outside" ;*一一車車線の定義, c o n t rastco1 o r ニ b1 c1 a s sG raphdataDefa u1 t/ contrastcolor = blue 1i n e s t y l e = 1 1i n e t h i c k n e s s= l p x markersymbol = " c i r c l e f iI l e d " foreground = b l u e; class G r a p h d a t a l/ contrastcolor =blue 1i n e s t y l e=2 1i n e t h i c k n e s s= l p xmarkersymbol =" t r i a n g l e f iI l e d "foreground=CX696969 ; c1 a s s Graphdata2 / contrastcolor=r e d 1i n e s t y l e=11i n e t h i c k n e s s=l p xmarkersymbol =" c i r c l e f iI l e d " foreground= 1i g h t g r a y; e n d r u n 目 紳梓紳梓紳有効性項目の解析材料料材料 *一一抗体保有率の算出と非劣性検定. o d s 1i s t i n gc l o s e; o d s output CrossTabFre q s =̲SRATE ( w h e re =( ̲T Y P E " 11 1 " )) o d s output P di ffNoni n f =̲ FM proc freq data=̲TITER ; 本 G RP* ̲SERO/ noco1nopercent ri s k di f f( m e t h o d = F Mn o ni nfm a rgi n = O .1 ) table VISIT r u n o d s output c1 o s e; o d s 1i s t i n g・ 本一一累積 J¥一 セ ン ト の 算 出 . proc s o r t data=̲TITER ;b y VISIT ̲GRP ;r u n; o d s 1i s ti n g c1 o s e; u m p e r c e n t ) o d s output Onewayfreqs=̲OUTFREO( k e e p 二 VISIT̲GRP LOG̲TIT c proc f r e qd a t aニ TITER ; b y VISIT̲GRP ; table L O GT I T r u n o d s output cl o s e; o d sl i s t i n g data RCD s e t OUTFREO b y VISIT ̲GRP . i ff ir s t .̲GRP then d o CDF = 1 0 0 .output ;e n d. CDF = 100‑cumpercent ; output r u n *一一 GMT等を算出(フォレストプロット用) proc summary data= ーT ITERmissing noprint nway a l p h a = O .0 5 c l a s s VISIT GRP a ご 147

150.
[beta]
MM
EL
PU
NU

戸
U

m

'L

A
ar

‑
‑HU

PU

BL

m
一
一
l '
:

GI'i

一‑‑

nυ
︑
Fu n
pu

PO

uvnHν
p
u
Jnu‑‑
JnuH
+LnU+L

川

711unν

M
G
(r
‑n

一︐

‑1‑D

=!t
nrt
ata
ρued
m‑‑s
)nn
n
H
M
W
n
w川

戸ト﹂マ︐

︑
︐
︐
︑

J

w

ι

J

守J

︑︐
)
︑
︐

u

︑
円
山
閉
︐
︑
t

ν
nド

+L11

←

︑
t

H‑‑n

﹄

e

n
u

ρ
u

戸U

TA

?
l
l
n
u
J Jl
︑︑
J︑J+L
ntntnV
︑‑JJ︑

e

︑
︐
ー
︑

︑

川

︑

﹄

し

川し
川
↓
一
一
一
一
一
一
一

し
ー

︐
︑

川閉
山
円
︑

︐ 一 ‑︑︐ー︑
一 一︑

︐
︑

﹄
一円 ︑

EEll
ヒ
戸
一︑

・

rd

nr
守
J''
︐
マr
山M m a
vt'M
TIIT‑‑‑BLEE
l
n
H
山 nunuc
‑M
nhuHUM‑‑﹂ v
a
nμe''r
f
e
一
一
O+L+L+LLR
r))uuur
AU
JMmMmnvnvnva
﹁
︑ mega
' t T l n U B L B L r t f︑
n u u m p a n u n u n ド nド nド ︐
nununUHMILli‑‑REHN
;IL
rrrn
JMl
i
+L+L+L‑fenulLnU
‑r1
71=vnnvnvnvn
vsssspapUHU
r
I a t p u ' x x x x uι
f
BL
71UAAeeee‑‑==γl
‑nunHυnhur
M
M
nu‑nu====puonu
nu+LnUBL
一n u n u r r n H H
ハ
U‑nunu‑‑
BLU
nド
uMM H uHM M
M
l
v +L
+LTl‑BLILT‑
nu‑‑lntqu
a u ' e M m u m p u n U M川 nul
uvnUGap‑nhunhuHUM‑‑﹂nhuHUM‑EL 台守 VAHVAHVAH
nt
HUGG

run

材料紳材料 Dashboardの 作 成 開 始 紳 材 料 材 料 .
ods escapechar='Y'
ods 1isting ・
ods pdf fi1
e
ニ"./
output.pdf" sty1
e=Mystat pdftoc=3 ;トーカレントディレクトリに作成される.

トーグリッドの定義.
ods 1
ayout start co1
umns=5 rows=3 co1
umn̲gutter=O.1i
n row̲gutterニ0
.
1i
n
co1
umn wi
dths二 (
3i
n 3i
n1
.5i
n1
.5in 1
.5in
) row̲hei
ghts=(
2
.5i
n1
.2in 3
.5i
n
)

材料*有効性項目材料* ,
*一一逆累積分布曲線の作成,
ods region ;
ods text="VS={just=1 fontfamiI
y
=
'Arial'} PROD‑XXX/STUDY‑XXX Efficacy Results" ;
proc sgpane1data=̲RCD
0
)
where VISIT i
n(
1
0,2
panelby VISIT / novarname ;
step x=LOG̲TIT y=̲CDF / group=̲GRP justify=right legendlabel=
key1
egend / ti
t1
e=
rowaxi
si
nteger 1
abe1
=
'Percent (
も
)
';
colaxis integer display=(nolabel)
run

…

…
.

キ‑̲‑ヒストグラムの作成,
ods region ;
ods text=" 平n "
proc sgpane1data=̲TITER noauto1
egend ;
where V1
SI
T=20
pane1
by ̲GRP / 1
ayout=co1
umn1
atti
ce novarname ;
histogram LOG̲TIT / scale=count f
iIlattrs=(color=salmon) transparency二 0.5 ;
densi
ty LOG̲TI
T / type=norma1 1
egend1
abe1
=
…
rowaxi
s1
abe1
="Count" ;
=Log‑Titer after priming vaccination" ;
co1
a
xi
s1
abe1
run

キ ー抗体保有率の棒グラフの作成;
ods region column̲span=2 ;
ods text="平n "
ods graphics on / width=2.9in height二 2
.2
in ;
proc sgplot data=̲SRATE ;
where ̲SERO = 1
.0 group=̲GRP datalabel
vbar VISIT / response=RowPercent barwidth=1
dataski
n=sheen groupdi
sp1
ay=c1
uster ;
yaxi
s1
abe1
=
'Seroprotecti
on Rate (
則
。
xaxi
s di
sp1
ay=(
n
o1
abe1
)
key1
egend / ti
t1
eニ … '
format RowPercent 6
.1
run
ods graphics on / reset ;

*一一コメント品函像;
ods region ;
n
g
'}平r
洋nSeroprotection Rate of Vaccine A after priming
ods text="平S=lfontfamiI
y
=
'Arial' just=1 postimage='./ワクチン p
vaccination period and booster period was s
lightly higher than that of Vaccine B 平n

*ーー箱ひげ図の作成.
ods region
ods graphics on / width=3in height=1
.1in ,

148

151.
[beta]
p
r
o
c sgpaneId
a
t
a二 Tl
T
ER本
: noautoIegend :
T in(10,2
0
)
where V
I
Sl
p
a
n
eI
b
y V1
Sl
T/ I
ayout=coI
u
m
nI
a
t
ti
c
en
o
v
ar
n
a
m
e:
T/group=̲GRP boxwidth=0.5 legend!abe!=…grouporder=ascendi
ng g
r
o
u
p
di
s
p
!a
y
=
c
!u
s
t
e
r:
h
b
o
xL
O
G
̲
Tl
k
e
yI
e
g
e
n
d / ti
t
!e
=
"
c
o
!a
xi
si
n
t
e
g
e
r!
a
b
e
!=
'L
o
g
‑Ti
t
e
r
'
r
u
n
本一一フォレストプロットの作成.
o
d
sr
e
g
i
o
n:
p
ro
cs
g
p
!o
td
a
t
a
=̲LOG̲BACK noautoI
e
g
e
n
d:
T
ニ 20
where V
I
Sl
ニ G
R
P/
s
c
a
t
t
e
rx
=
G
M
Ty
x
e
r
r
o
r!
o
w
e
r
=
L
C
L
M xerrorupper=UCLM
markerattrs=(co!or=b!ack s
y
m
b
o
l
=
c
i
r
c
l
e
f
iI
l
e
d
)
s
c
a
t
t
e
rx
=
x1y=̲GRP / x
2
a
xi
smarkerchar=GMTSO̲C
s
c
a
t
t
e
rx
=
x
2y
=̲GRP/ x
2
a
xi
smarkerchar=LCLM̲C
s
c
a
t
t
e
rx
=
x
3y
=̲GRP/ x
2
a
xi
smarkerchar=UCLM̲C
)
r
e
f
li
n
e7
5
0/a
x
i
s
=
x!
ineattrs=(pattern=1
y
a
x
i
s discreteorder=unformatted i
n
t
e
g
e
rd
i
s
p
!
a
y
=
(
n
o
!
a
b
e
!
) offsetminニO
.3o
f
fs
e
t
m
a
xニ0
.
3:
x
a
x
i
so
f
f
s
e
t
m
i
n
=
O
.1offsetmax二 0
.
51
a
b
e
!=
"
G
M
Ta
n
d9
5
%C
Ia
f
t
e
rp
ri
mi
n
gv
a
c
ci
n
a
ti
o
n
":
x
2
a
xi
sdi
s
p
!a
y
=(
n
o
ti
c
k
sn
o1
a
b
eI
l offsetmi
n
=
O
.6
5o
f
f
s
e
t
m
a
x
=
0
.
0
5:
f
o
r
m
a
tG
M
T7
.1GMSO U
C
L
M LCLM 7
.
2
r
u
n
トー非劣性検定結果,
o
d
sr
e
gi
o
nc
o1
umn̲span二 2 :
o
d
s Ii
s
ti
n
g cl
o
s
e:
d
a
t
a F
M
2
s
e
t FM
i
f N =2
r
u
n
p
r
o
cp
ri
n
t data=̲
F
M
2!
a
b
e1n
o
o
b
ss
t
y
!e(
h
e
a
d
e
r
l={
b
a
c
k
g
r
o
u
n
d二 A
z
u
r
e
}
v
a
r Estimate Pva!ue / s
t
y
!
e
=
{
w
i
d
t
h
=
1
0
0
p
t
}
!
a
b
e
! Pva!ue = "P‑value o
f Non‑inferiority T
e
s
t
":
r
u
n
o
d
s 1i
s
ti
n
g・
o
d
stext="~S=!fontfami !
y
=
'A
r
i
a
l
'}
Th
i
ss
t
u
d
ys
h
o
w
e
dt
h
a
tt
h
ee
f
f
e
c
to
fVaccineAw
a
sn
o
tworsethant
h
a
to
factivec
o
n
t
r
o
l
s
t
a
n
d
a
r
d treatment bymore t
h
a
n apre‑specified noninferioritymargin, 1
0
首"
本一一一コメント
o
d
sr
e
g
i
o
n,
o
d
st
e
x
t
=
'¥S
=
!
f
o
n
t
f
a
m
i!
y
=
"
A
r
i
a
!
"
)
F
u
!
! Ana!ysis S
e
t(
F
A
S
lw
a
su
s
e
di
nt
h
e efficacy analyses a
n
d9
4a
n
d1
0
6 subjects p
e
r
g
r
o
u
pa
r
ei
n
c
!u
d
e
d
.'
材料本安全性項目材料本;
o
d
sr
e
g
i
o
n:
!
f
o
n
t
f
a
m
i!
y
=
'A
r
i
a
!
')PROD‑XXX/STUDY‑XXX S
a
f
e
t
yR
e
s
u
!
t
s
",
o
d
st
e
x
t
=
"お =
柿本各筏種群の発現率の算出と棒グラフの作成.
p
r
o
cs
q
l
c
r
e
a
t
et
a
b
!e̲AECAL a
ss
e
!e
c
tB
.̲GRP, B
.̲GRPC,A
.̲
P
T, c
o
u
n
t(
A
.̲
P
T
la
s̲
N,̲ALL, count(
A
.̲PT
)/̲
A
L
L
*
l0
0a
s̲
P
C
T
from (
s
e
l
e
c
t distinct I
D, G
R
P, GRPC,̲
P
Tf
r
o
m̲
A
E
)a
sA
ri
g
h
tj
oi
n
o
u
n
t(
1D
)a
s ̲ALL
(
s
e1
e
c
t ̲GRP, ̲GRPC, c
R
P,̲GRPC f
r
o
m̲
M
A
S
T
E
R
lg
r
o
u
pb
y ̲GRP,̲
G
R
P
C
)a
sB
f
r
o
m(
s
e
!
e
c
t distinct 1
0, G
o
nA
.G
R
P=B
.G
R
Pa
n
dA
. GRPC =B
.G
R
P
C
.̲GRPC, A
.̲PT o
r
d
e
rb
yA
.̲
P
T:
g
r
o
u
pb
yB
.̲GRP, B
q
uI
t
p
r
o
cs
q
!n
o
p
ri
n
t s
e
!e
c
t compress(
p
u
t(
5川 1n
t加a
xしP
CT
)/
5
)+1
),b
e
s
t
.l
)i
n
t
o
: MAXP fr
o
m̲AECAL
quit :*一一発現率の最大値(軸の割当用)
p
r
o
cs
o
r
t data=̲AECAL ,b
y̲
P
T :r
u
n :ト一例数と発現率を投与群で横展開.
p
r
o
c transpose data=
̲AECAL o
u
t
=̲AECAL̲N(
d
r
o
p
=̲
N
A
M
E
̲
lp
r
e
fi
x
=̲N ,
本
伊j
数の横展開.
v
a
r ̲N :by ̲
P
T :i
d̲GRP :i
d
!a
b
e
! GRPC f
o
r
m
a
t̲
G
R
P
r
u
n
p
r
o
c transpose data=̲AECAL o
u
t
=̲AECAL̲P(
d
r
o
p
=̲
N
A
M
E
̲
)p
r
e
fi
x
=̲P 本
弘の横展開.
v
a
r ̲PCT :b
y̲
P
T :i
d̲GRP : i
d
!a
b
e
! G
R
P
C f
o
r
m
a
t ̲GRP
r
u
n
*一一例数と弘の結合,
d
a
t
a A
E
C
A
LT
merge ̲AECAL̲N ̲AECAL̲P :
b
y̲
P
T:
1
5
i
e
n
g
t
h ~NPCT 1~NPCT2 $
目

149

152.
[beta]
a
r
r
a
y̲N{
叶 N
1̲
N
2
a
r
r
a
y̲
P
{吋 P
1 P2;
1 ̲NPCT2 ;
a
r
r
a
y ̲NPCT{
*
l $̲NPCT
)
d
o 1= 1t
o di
mしN
l
} = then ̲NPCT{
l
} ="0" ;
i
f̲N{
e1
s
ed
o
N
P
C
T{
l
l =compress(
p
u
t(
̲
N{
l
l
.b
e
s
t
̲)
)1
1 c
i1compress(put(̲P{ll.6
̲1
)
)1
1"
)
'
.;
e
n
d
e
n
d;
r
u
n
率一一有害事象の頻度順,
p
r
o
cs
q
l
create t
a
b
l
e ̲AEALL a
s select ̲
P
T
.c
o
u
n
t
(
̲
P
T
)a
s̲
N
A
L
Lf
r
o
m(
s
e
l
e
c
t distinct I
D
. P
Tf
r
o
m̲
A
E
)
g
r
o
u
pb
y̲
P
To
r
d
e
rb
y̲
N
A
L
Ld
e
s
c;
q
uI
t
d
a
t
a A
E
A
L
L ;s
e
t AEALL; N
o = N ;r
u
n
P
T ;r
u
n;
p
r
o
cs
o
r
td
a
t
a
=̲AECAL̲T ;b
y̲
p
r
o
cs
o
r
td
a
t
a
=̲AEALL ;b
y̲
P
T ;r
u
n;
d
a
t
a̲
O
U
T ;m
e
r
g
e ̲AECAL̲T ̲AEALL ;b
y ̲PT ;r
u
n;
p
r
o
cs
o
r
td
a
t
a
=
̲OUT ;b
y̲
N
o̲
P
T ;r
u
n;
キ
ページ番号の付与;
d
a
t
a O
U
T
s
e
t̲
O
U
T ;b
y̲
N
o̲PT ;r
e
t
ai
n̲PAGE 0
i
fm
o
d(
̲
N
o
.1
0
) = 1t
h
e
n P
A
G
E
+1
r
u
n
p
r
o
cs
o
r
td
a
t
a
=
一OUT ;by ̲PAGE ̲No̲
P
T ;r
u
n;
率一一発現率の棒グラフの作成,
o
d
s graphics o
n /width=3in h
e
i
g
h
t
=
2
̲B
i
n;
ti
t1
e.1
n
ci
d
e
n
c
eR
a
t
e(
首
)o
f Adverse E
v
e
n
t
s
'
procs
g
p
l
o
td
a
t
a
=
̲
O
U
T
w
h
e
r
e P
A
G
E=1
1b
a
r
w
i
d
t
h
=
O
̲5f
iI
l
a
t
t
r
s
=
(
c
o
l
o
r
=
b
l
u
e
) dataskin=sheen n
a
m
e
=
"
G
1
";
本
岩
手 1;
h
b
a
r̲
P
T/ r
e
s
p
o
n
s
e二 P
h
b
a
r̲
P
T/response=̲P2barwidth=O̲Bf
iI
l
a
t
t
r
s
=
(
c
o
l
o
r
=
s
a
l
m
o
n
) dataskin=sheenn
a
m
e
=
"
G
2
"t
r
a
n
s
p
a
r
e
n
c
y
=
O
̲5 ; 本 群 2;
k
e
y1
e
g
e
n
d"
G
1
""
G
2
";
y
a
x
i
s discreteorder=DATA d
i
s
p
l
a
y
=
(
n
o
l
a
b
e
l
)
x
a
xi
sv
a1
u
e
s
=(
0t
o &̲MAXP b
y5
)1
a
b
e1
=
'1
n
ci
d
e
n
c
eR
a
t
e(
も
)
'
r
u
n.
t
i
t
l
e
目

日

料率全体の有害事象発現率の要約表の作成,
p
r
o
cs
q1
c
r
e
a
t
et
a
b
l
e̲AEOVALL a
ss
e
l
e
c
tB
̲̲
G
R
P
.B
̲̲
G
R
P
C
.c
o
u
n
t
(
A
̲I
D
)a
s̲
N
.̲
A
L
L
.c
o
u
n
t
(
A
̲I
D
)
/
̲
A
L
L本 1
0
0a
s ̲PCT
f
r
o
m(
s
e
l
e
c
t distinct I
D
. G
R
P
. G
R
P
Cfrom̲
A
E
)a
sA
ri
g
h
tj
0i
n
lD
)a
s̲ALL
(
s
e1
e
c
t̲
G
R
P
.̲
G
R
P
C
.c
o
u
n
t(
f
r
o
m(
s
e
l
e
c
t distinct I
D
.̲
G
R
P
. ̲GRPC f
r
o
m̲
M
A
S
T
E
R
)g
r
o
u
pb
y̲
G
R
P
.̲
G
R
P
C
)a
sB
o
nA
̲G
R
P =B
̲ GRPa
n
dA
̲ GRPC= B
̲G
R
P
C
group b
yB
̲̲
G
R
P
.B
̲̲GRPC ;
q
u
i
t;
title h
=
1
0
p
t.
N
u
m
b
e
ro
f Subjects (
百
)f
o
r Treatment E
m
e
r
g
e
n
t Adverse E
v
e
n
t
s
'
proc p
r
i
n
td
a
t
a
= AEOVALL n
o
o
b
sl
a
b
e
l s
t
y
l
e
(
h
e
a
d
e
r
)
=
{
b
a
c
k
g
r
o
u
n
d
=
A
z
u
r
e
ls
t
y
l
e
(
r
e
p
o
r
t
)={
f
r
a
m
e
=
b
o
xr
u
l
e
s
=
r
o
w
s
l
v
a
r ̲GRPC N P
C
T
: / style=lfontsize=9pt c
e
l
l
w
i
d
t
h
=
5
0
p
t
l
̲1
f
o
r
m
a
t P
C
T7
汀=官
l
a
b
e
l GRPC="Treatment" ̲N="Nwith A
E
"̲
P
C
r
u
n
t
i
tl
e

神*リスク比品 9
5
九信頼区間のプロットの作成,
d
a
t
a A
E
R
R
s
e
t AECAL
R
P
G
R
P
x=‑
1本 G
̲
A
E
Y
N = 1;
o
u
t
p
u
t;
L
L ー → N .o
u
t
p
u
t
A
E
Y
N = 2; Nコ A
r
u
n
p
r
o
cs
o
r
td
a
t
a
=̲AERR ;b
y̲
P
T̲
G
R
P
x ̲AEYN .r
u
n.
トーリスク比と 9
5
も信頼区間の算出
o
d
se
x
c1
u
d
e a1
1
R(
w
h
e
r
e二 (
in
d
e
x(
S
t
u
d
y
T
y
p
e
."91J
o
d
s output R
e1
a
ti
v
e
Ri
s
k
s二 一R
p
r
o
cf
r
e
qd
a
t
a
=̲AERR ;

n >0))

1
5
0

153.

b y ̲PT ;weight ̲N tables ̲GRPx*̲AEYN / relrisk nopercent n o c o l r u n ods output c1 ose o d ss e1 ect a1 1 proc sort data=̲OUT out=̲OUT2( d r o p =̲ P A G E ) ;b y ̲PT ;r u n; y ̲PT ,r u n 本 発現率とのマジ. d a t a ̲PCTRR ;merge ̲OUT2 ̲RR ,b proc sort data=̲PCTRR ,b yV a1 u e ̲PT ;r u n; 本 リスク比の降順に並べ替え, data PCTRR s e t PCTRR nobs= NOBS N oR R = N N oR R 2 = NOBS ̲ N + 1 r u n proc sort data二 一 PCTRR ;b y ̲No̲RR2 ̲PT ;r u n; 本 ペジ番号の付与. data PCTRR2 s e t PCTRR b y ̲No̲RR2 ̲PT ; r e t ai n PAGE 0 1f m od(N o RR2 1 2 ) 二 1then PAGE+1 r u n proc sort data= PCTRR2 ; b y ̲PAGE descendi n g ̲No̲RR2 ̲PT ; r u n 本一一日 T Lによるテンプレートの定義(左 発現率 右 1 )スク比品 9 5 百信頼区間) ; proc temp1 ate defi n e statgra p h ̲AEPCTRR dynami cV A R l VAR2 AE̲NAME E S T LOWER UPPER TI TLE begi n g ra p h; entrytitle TITLE l a y o u tl a t t i c e / columns=2 r o w s = 1 columngutter=3px columnweights=(.5 . 5 ) rowdatarange=unionall * 車自の定義 rowaxes ;rowaxis /l a b e l三 , " ;e n drowaxes c o1 umnaxes ;c o1 umnaxi s/ 1 abe1 = " " ;endco1 umnaxes ; 本 発現率プロット 1 ayout o v e r1 a y/ ncrement=5) ti ckva1 uepri o ri ty=true)) x a xi sopts = ( 1i nearopts=( ti c k v a1 uesequence=( s t a r t = O end=品 MAXP i yaxisopts = ( d i s p l a y = ( 1i n e ticks tickvalues)) r e f e r e n c e li n e y=AE̲NAME / 1ineattrs=(color=1i g h t g r a y pattern=2) 1 "1 egend1 abe1 = " V a c .A "; scatterp1 o tx = V A R l y=AE̲NAME /markerattrs=( s y m b o1 = t ri ang1 e fi1 1e d ) name="T scatterp1 o t x=VAR2 y=AE̲NAME / markerattrs=( s y m b o l= s q u a r e ) name="T2" 1 egend1 abe1 = " V a c .B "; T 1 ""T2" / va1i gn=bottom ; * di screte1 egend " e n d1 ayout ; 本 1 )スク比プロット 1 ayout o v e r1 a y/x a xi sopts = ( t y p e =1 o g1 ogopts=( b a s e = 2 ti c ki nterva1 sty1 e =1 ogexponent)) referenceli n ex = 1 / 1ineattrs=(color=1i g h t g r a y pattern=1 ) reference1i n e y=AE̲NAME / 1i neattrs二 ( c o l o r = 1i g h t g r a yp a t t e r n = 2 ) scatterp1 o t x=EST y=AE̲NAME / x e r r o rl o w e r = LOWER xerrorupper = UPPER errorbarattrs = ( p a t t e r n = 1c o l o r二 darkred) markerattrs = (color=black symbol=circlefiI l e d ) e n d1 ayout 本 凡哲I J ; si d e b a r / a1i gn=bottom di screte1 egend " T 1 ""T2" / border=fa1 s e di s p1 a y c1i pped=true , e n d si debar, e n d1 ayout endgraph ; e n d r u n 目 ← トーグラフ出力 ods region ; o d sg raphi c s on /wi dth=3i nh ei ght=3i n, o d s text=" 平n proc sgrender data= ̲PCTRR2 temp1 ate=̲AEPCTRR ; where PAGE = 1 , l a b e l Pl="Pct." Value二, R R ' 二Pl" VAR2="̲P2" AE̲NAME=μPT" ESTニ"Va1ue" LOWER="LowerCL" UPPER="UpperCL" dynamic V A R 1 = ' T I T L E = ' ' Jn cidence Rate ( 出 )a nd R R( B a s eニ2 )" r u n 151

154.

材場局所反応、と全身反応発現率の梅グラフ作成 。 d sr e g i o n yゴ A r i a l 'j u s t = 1 postimage='./ワクチン 2 .p n g '}平n 平n lncidencer a t eo fAdverseEventsa r ealmostt h e o d stext="~S={fontfami I . s a m e between treatment g r o u p s . 平n. . o d s text=" 平n平n平n. 場 各接種の発現率棒グラフ作成マク口 弘m acro̲BARCHART( ̲ O T =,̲ W H R = ) p r o cs g p l o t data=&̲OT ; where &WHR v b a r VISIT/ r e s p o n s e = ̲ G l barwidth=0.4 f iI l a t t r s = ( c o l o r = b l u e ) name="aaa" dataskin=sheen b b " dataski n=sheen transparency=0.5 v b a r V1 SI T/ r e s p o n s e = ̲G2 b a r wi d t h = O .7fiI 1 a t t rs =( c o1 o r = s a1 m o n )n a m e =b x a xi sdi s p1 a y =( n o ti c k sn o1 a b e1 ) 唱)" ; y a x i s values=(O t o1 0 0b y1 0 ) l a b e l = " P e r c e n t ( keylegend " a a a " b b " /t i t l e = . . . .; 1 a b e1 G l= 'Vacci n eA ' G 2 = 'V a c ci n eB ' r u n 知n e n d o d sr e g i o n o d st e x t = " 平n. . o d s graphics o n/width三 1 .5in height=1 .1i n; 。弘 一 BARCHART( ̲ O T一 =L R ̲ T,̲ W H R = もs t rー (L R= 1a n d VISIT n e5 ) ) ti t1 e" L o c a1R e c ti o nb ye a c hd o s e " ti tI e"Systemi cR e c ti o nb ye a c hd o s e " ;首 B A R C H A R T← (O T =S RT ・ ̲WHR= もs t r( ̲ S R = 1a n d VISIT n e5 ) ) o d st e x t = '平S = { f o n t f a m iI y三 " A r i a l " }l n c i d e n c er a t eo fL o c a lR e a c t i o n so f Vaccine A g r a d u a l l y i n c r e a s e d during priming v a c ci n a ti o np e ri o d .' トー全期間の発現率の棒グラフ o d sr e g i o n o d s text=" 平n. . .5in height=1 .1 i n, o d s graphics o n /width=1 title " L o c a lR e c t i o n( O v e r a l l ) "; p r o cs g p1 o td a t a = 一L R; where V I S I T =5a n d L R = 1 v b a r ̲GRP/ response=RowPercent group=̲GRP b a r w i d t h = O .3dataskin=sheen d a t a l a b e l; x a x i s display=(noticks n o l a b e l ) offsetmin=0.3 offsetmax=0.3; y a xi sv a1 u e s =( 0to 1 0 0b y1 0 ) 1 a b e1 =P e r c e n t(首) . f o r m a tR o w P e r c e n t6 .1 k e y1 e g e n d /ti t1 e =…' r u n t i t l e "Systamic Reaction ( O v e r a l l ) "; p r o cs g pI o td a t a =̲ S R whereVISIT =5a n d S R = 1 v b a r ̲GRP/ response=RowPercent group=̲GRP b a r w id t h = O .3d a t a s ki n=sheen d a t a1 a b e1 x a x i s display=(noticks n o l a b e l ) offsetmin=0.3 offsetmax=0.3 ; ) y a x i s values=(O t o1 0 0b y1 0 ) l a b e l = " P e r c e n t (首 f o r m a t RowPercent 6 .1 k e y1 e g e n d / ti t1 e = r u n 、 目 … 場 コメント o d st e x t = '将 ={ f o n t f a m il y = " A r i a l " } O v e r a lIi n c i d e n c er a t eo fS y s t e m i cR e a c t i o n so fVaccineBw a ss li g h t l yhighert h a nt h a t o f Vacci n eA .' 場 終了処理 o d s1 a y o u te n d, o d sp d fc l o s e; o d s graphics o n/ r e s e t; ti t1 e 152

155.

京都大学大学院医学研究科 社会健康医学系専攻の講義・実習における JMPの 活 用 B i o s t a t i s t i c sc a u r s e su s i n gJMPロtDepartmentofB i 口s t 口t i s t i c s ••• KyotaU n i v e r s i t y5 c h o o lafP u b l i cH e a l t h υ T a k a s h i5 0 l T o s i y o5 0 t o 5 3 D e p o r t m e l l to fB i o s t a t i s t i c sK y o t oU n i v e目 i t y5 c h o o lofP u b l i cH e a l t h 京都大学大学院医学研究科 社会健康医学系専攻医療統計学 寒水孝司・佐藤俊哉 S A Sユーザー総会 2013年 7月 19日 要旨 ロ京都大学大学院医学研究科社会健康医学系専攻 P H :S c h o o lo fP u b l i cH e a l t h )における (京大 S 医療統計学関連の講義・実習の内容を概説 JMPを使った実習の進め方の工夫 圃 J MPの良い点・悪い点 圃 ロキーワード ・医療統計学,疫学研究,臨床試験,グループ実習, J M P .集計,解析 2 153

156.

発表構成 ロ 京 大S P Hの紹介 ロ医療統計学分野が担当する講義・実習の内容 ロ JMPを使った実習の進め方の工夫 ロ JMPの良い点・悪い点 ロ Webによる授業評価 固まとめ 3 京都大学大学院医学研究科 P H 社会健康医学系専攻:京大 S ロ 2000年 4月:わが国初の公衆衛生大学院 ・修士課程 (2003年 4月専門職学位課程に移行) 圃博士後期課程 ロニューパブリックヘルスの理念のもと ・医学・医療と社会・環境を包括した活動(教育,研究, 成果の還元,専門的貢献)とその相互作用を通じて 人々の健康と福祉を向上させる ロ 19分野(教員数 45人) ・特別コース, 特別プログラム 3 5 4 154

157.

京大 S P Hの概要 ロ専門職学位課程(原貝I J 2年制) ・社会健康医学修士(専門職)(Master0印 刷 cH回│山:MPH) .高度専門職業人の養成 ロ博士後期課程 ( 3年制) ‑博士(社会健康医学 )(DO山 rofPublicHealth:DrPH) .研究者,教育者の養成 ロ1 3分野:医学専攻博士課程(医学)( 4年制)を兼担 ‑博士(医学)(DoctorofM吋 凶 Scienc巴: PhD) 5 構成分野 │ 分野(c協力分野 医療統計学,医療疫学,薬剤疫学, 健康解析学講座臨床研究管理学,ゲノム情報疫学¥ 臨床情報疫学 医療経済学,医療倫理学,遺伝医療学, 健康管理学講座健康情報学,医学コミュニケーション学, 知的財産経営学ホ 環境衛生学,健康増進・行動学, 健康要因学講座吊 予防医療学字 国際保健学講座社会疫学,健康政策・国際保健学 社会生態学講座環境生態学¥人間生態学キ 1 5 5

158.
[beta]
シラバスは Webで、公開
│§伊伽…均州
山
M
.
‑
r
.
c
I
h
抽
…
e

照悶
炉
.
人
、
げ
守

白

人,円京 g
色己'町
t
干
町
宅守支ド

包
目
含凶
'
l
!
翁:
.
I
:
!
昆
、
押
司
'
ヂ4
ふ
抽
み
池
畠
二
弐
ミ

'
'
'
1
1

H
:
t
:
・e
血区司,..町噸平峰

.

l
r
.
:

隔!O 羽岡い‑OA)金,..,

︑ !;l
ZJ

戸
aMtL n
f

噺 制 組 曲 三H

削
・
'
一

四 "
~ニ:;"i"'II.

;~;"

"
,
舗
仁

μ
"
'
"
乙三ι
ょ1
ュ
.
1
,
;
、主之主ニn
.

局

四

斗み

ー

瑳よ

司

,
、
袋

4】

ν
銭峰 1

竃
ιm

,
,
.
.
.
.
1

'
l
f
I
'
; :
.
.
.
.
,
<
1
.:
;
,
c
.
.
:
,

"一覧

:~,.,:

~ilJt''7 1 巳笠'"邑『

ー
‑
‑

怖
.
.
.
;:
"
・

'l'~'"

日 現I

1
1
'
'
‑幻

・
・
ー
・
使
)
:
1
,
上
z
.
・
'
"
.
、
<
.
.
.
・
,
.
.
.
..

ーい

"
.
,
.

L

W .ぞ

川~過"'1'\:1.,古川

民
主
r
!
.
.
:
i
:
.
唱
'
"
且
M

rl
副p 0

白 、 四

、・ ・

コ
過1
¥
',<:

自 明

之星i
三
盈i
二
三E温

三互与~

川、 6

;
.
.
、
"

.

,
.
,

日

ν

r
.
.,
....命
t

曹
"

可..

1国

llll
Y
.
. ~;:i.1. '
f

.
"柄ι

日

叩3

E
ニム‑

E玄

":':'・, ;t ,可z・~,・

.
"
国
,
.
.
L
.
i
'
,
E

,~

6骨 E
円,~

.
.
.
.

民丘正主主盆渇

'
:
;
r
.
, .
.

盟EL:よ

7

医療統計学分野の担当講義・実習

離(理)

6月集中

~A 後期
'(火曜日)

(土曜日)も~'

ラ
ー

医療統計学
(コア科目・必修) 観察研究の
統計的方法
午後│医療統計学実習

午前

交絡調整の方法
解析計画実習

午前中の講義の内容の理解を深める
(JMPを使った実データの解析が中心)
一部の講義を担当・協力する外部の先生方(敬称略)
森和彦,安藤友紀 (PMDA),大森崇(同志社大学)
j
賓崎俊光(大阪大学),杉本知之(弘前大学)

156

8

159.

受講生の内訳 ロ1 ' ・ 生 男J I:ほぼ半々 ロ年齢:20歳代 ‑30代前半が中 I [ ) ・代の方も数人 50 ロ専門性:医・歯・看護系が半分 圃それ以外(薬,農,理,工,法,経,商,文,教…) ロ専門職学位課程の学生以外も受講 ・博士後期課程,人間健康科学系専攻,医科学専攻, 医学専攻博士課程,工学研究科… ロ教員も… 9 医療統計学(前期 2限必修) ロコントロールの重要性 ロ疫学研究・臨床試験デザイン ロ曝露効果,治療効果の指標 ロ仮説検定の考え方,検定と信頼区間の関係 ロ研究に必要なサンプルサイズ ロコホート研究・ケース・コントロール研究の妥当性 ロ交絡 10 157

160.

講義風景(満員御礼ほぼ 1 0 0人) 医療統計学実習(前期 3・ 4限) ロ表計算ソフト (Excel)の利用,データのチェック ログループ実習(発表会) ・テーマの選択,データ収集,集計,解析,発表 ロランダム化の手順と実践 ロリスク比,リスク差,オッズ、比の計算 ロ割合の差の検定と帰無仮説の意味 ロサンプルサイズ設計 ロ 95%信頼区間の計算とその解釈 ロランダムサンプリング 1 2 158

161.

実習風景(今年は定員オーバー) 交絡調整の方法(後期 2限) ロ交絡の復習,標準化,共通効果の推定 ロ平均値の比較 ロサンプルサイズ設計 ロ回帰モデル入門,口ジスティック回帰 ロ生存時間解析 ロ欠現] 1データの対処 ロ研究計画書の作成,解析計画書の実際 ロ医薬品の審査と市販後安全対策 ロ変数選択,傾向スコア 14 159

162.

解析計画実習(後期 3・4限) ロガイドライン・倫理指針実習(発表会) ロデータのチェックと集計表の作成 目標準化リスク比と MantelHaenszelリスク比の計算 ロ平均値の比較 口回帰分析,ロジスティック回帰 口生存時間データの解析 口欠測データの解析 ロ新医薬品の審査実習(発表会) 口解析計画書作成(発表会) 1 5 実習の進め方の工夫 口作業手順を記載した資料(手引き)を用意 ・当日は実際の資料を紹介します ・ 前 期 第 8回:TheWizardo fOdds ・課題のレベルを明示(中級者・上級者) ・楽しいコラム付き(前期のみ :Webで、公開) 口専門性と統計学の学習歴を考慮して班を構成 ・多種多様な意見が飛び交う ・lI~I 4 ""5人(班長さん 1人) .前期 :8班,後期:4I~I 1 6 160

163.

実習の進め方の工夫(続) ロ人数が多いことを活かす ・みんなで検定して第一種の過誤確率を計算 ・班ごとにサンプルサイズ、を設計して遣いを実感 ロパソコンは 1人 1台(だけど古い ( 5年経過)) ・インターネット接続可能(学内無線 LAN) ・ ・ O f f i c e2007(Word,E x c e l,PowerPoint) JMP8 . 0 ロl まぼ毎回レポートを提出 ・すご く丁寧なフィード/ミックあり 1 7 JMPの良い点(私見) ロ初めてでもそれとなく操作できる(悪い点かも) ・視覚的・対話的に解析できる ・計算式が扱いやすい ・実習の内容(課題)に集中できる ログラフが容易に作成できる ・プロットしたデータと個別テ、ータが対応 ロたくさんの出力が得られる(悪い点かも) ロインストールに時間がかからない ロ比較的安価:JMP10アカデミック版 81, 900円 1 8 161

164.
[beta]
JMPの悪い点(私見)
ロマニュアルがあまり詳しくない
・オプションの使い方がわかりにくい
・解析方法が不明なことがある
口出力結果を加工(外部出力)しにくい
ロ医学論文での使用実績が相対的に低い
ロ習得した知識を他のソフトに活かせない
・プログ、ラム中心のソフトだとお手上げ
・他のソフトとの互換性が低い
ロ修了(卒業)したら(有償だから)使用できない
1
9

京大 SPH独自の Webによる授業評価

‑ 1当日は実例を紹介

険叫lI!Im山

I~.ijlill惣..陶.UJ'-U'l

!). ~

h 伽納品,<ん

官
を
1
.
:
2
;
ユ
・

~!.'モJ注

m lIl:;.r:由主宮鴫

喧

.
O
;
v
..
.
.
'<r~比$I'>Þ"~'刊J阜、

:
̲
.
.
,
.
,
<
:

:
"
'
'
'
,‑
H
'
.

ー も

:...^,~‘関
市軒、前
日 < T ' 刷

.
帽
.
.
"
"

a "'8

I
o
.w金 制 曲 眠 、 ん

、
.
‑
,
・m

"""盆玄L 二畠.t:t.~旦S

:唱埼=会主治:

.
.
.
.
,
膚
.
.
.
.
.
.
.
.
町

.
,
̲
:
剛,.. ,1o ,

li
f '
!
1 eO
!
<
!
'
.
"
.

1

が
"
.
・
.
̲
,
.
、
l
四竃柳、,
.ι

・
'
.̲
t

.
• ・ 、・

即, 'a ...,..-吋.....';.“円、修会

..煙草"凶事.,.
忠

乱入1

│
…

・・‑‑・温・・・・・
‑‑山

々

1...・"

r
:

:,-&1,""。竺L ぷ:・

m錨

一 盟 主

・~'.""

2

一曹、 2 ・ぇ~・

。,、

弘 一 司 官

h 河内 ent <'J 7. ,.;;CI:1lパ,~

̲ ,会'.

o
l

嗣
'
"

吋….,'~;-

'
;
"
$
"

" T 省 ue ,司・;..+-<,n 'l:‘~

,
.
,
民
倹
'
・ na
:
i
.

..
・
l
U
tT

e

'
¥
,
'
1
.1'." ,
(
'
'
'
'
' :
t
;
‑
.
;
t "';'

.1 '1o f!> ・ 11". 勾 ;'J^'ミf'.~:^

,‑、・,‑

c

、

,
̲

ι

n

・
4

・司、ー

:
1
. T.肉WU I'JI,‘., ι ・ 4 ・>の・合".ø. l~ ‘ R れか

20

162

165.

まとめ ロ 京 大 SPHにおける医療統計学関連の講義・実習の 内容を紹介 圃 J MPを使った実習の進め方の工夫 圃 J MPの良い点・悪い点 ロ講義と実習の組み合わせが実務者にとって有用 ・受講生は実習やレポート課題を通して理解不足や 間違いを痛感 圃その後一緒に研究することも 21 参考資料 ロ公開資料 E 京大 S P H • h t t p : / / s p h . m e d . k y o t o ‑ u . a c . j p / 圃パンフレット(毎年作成) ・京大 S P H医療統計学 • h t t p : / / w w w . k b s . m e d . k y o t o ‑ u . a c . j p / ロ内部資料 ・医療統計学関連講義資料 22 163

166.

i i I 一一一一〓ケ f i ' I D ~ ー ザ ー ー ~ !均売開Jロト&Y'J.::I.引ンセ均 統;言十を知らなかった手ムの S A S日記 大橋渉 東京医科歯科大学大学院保健学研究科 Howt ouseSASSystemwho d o e s n ' tknowS t a t i s t i c s ? WataruOhashi TokyoMedicalandD e n t a lU n i v e r s i t y ,Graduate Schoolo fH e a l t h c a r eSciences f .. :駄抱一ザー除前向 三 五 三 Jロ ト ソ リ ー … ヨ 2 0 1I m 要旨: 著者の書籍「統計を知らない人の SAS入門(オーム社)J は本当に効果があるのか? SASも統計も知らなかった 初心者ユーザーによる、学習の記録を報告する。これは 究極のユーザー目線だ! キーワード:統計、教育、教材 165 ぷ 引

167.

II ユ ー ザ ー 総 会 加 ‑ … …ω W J I 「統計を知らない人の S A S入門」とは? ‑オーム社より 2010年6月に発売されました ・改訂版は 2012年 12月に出ました ・ 3部 17章より構成されており、基本的にはインストールから自 習できるように作成しております .SASはもちろんですが、統計の基礎も SASを通じて学んで頂け ればと思っているところです ・元々は「サルにもわかる SAS講座」として、某医学書で連載して いたもので、す ・看護学専攻の学部の皆様向けの授業で使えることを目的とし ておりましたが、何故か自習書にもなりました 1 1 s ユーザー総会的問……伽ン ~I S A Sの厳しい現実 ( 1 ) 私の大学で「クリックだけの統計教室」を聞こうとしたら 50人 以上の希望がありましたが、 SAS教室を聞こうとしたら 4人し か集まりませんでした 参考までに、 R教室は 2人でした ・私が聞いたところによりますと、「敷居が高い J I難しそう」 I G U I ( G r a p h i c a lU s e rI n t e r f a c e :通ハカチ力チ)じゃないからイ ヤJ Iプログラムは叩きたくなしリ等々、あまりいい印象があり ません 本年度、私が宇事をしております「看護」の分野では、ほとん ど用いられておりません いや、用いられないどころか、時には目の敵にさえされます 易な力チ力チの利用で統計的誤用が蔓延している .しかし のも事長 Cす 3 166

168.

I ぬs ユーザー総会対向付………干 I SASの厳しい現実 ( 2 ) 一部 CROの人間などは、 SASのユーザー数が増えることを好 まない人もいます。理由は「自分の優位性がなくなるから」だ そうです ・ある CROの責任者は rCRO!こ統計の知識は不要で、ある」とさ え言い切っています . 時に、 SASはヨド、バシで、売っているとさえ思っている人間もい ました 「生物統計はやりたいけどSASがねえ」・・・こういう人は何人も いるのではないでしょうか? 川三一付会…J白 山 一 一 … 本書のテーマ 「力チ力チ」では身に付かな~ ¥ SASの教育効果についてお話さ せて頂いております ・本当に SASの基礎から行きます。使用経験のある方は少々 退屈かもしれません .基本的に本書に沿った形で指導しておりましたが、看護学科 n t e r p r i s eG u i d eではない、プログラムを駆便できる の学生が E ようになるまで;それほどの時間はかかりませんでした ・結果、安易な p値探しは無くなりました。その分、指導教官と 対立する図書虫:は増えました(?) ・統計の知識は現段階では無くても、 SASを通じて身に付けて ほしい・・・なんて思いを持って出しました 167 g

169.
[beta]
I
P
I

ユーザー総会加7/'i"'J.lr:J<;‑&')1} 叩 …
:
J
.

m
II

あるユーザーの素朴な疑問
これって、要は授業で用いたネタですよね?つまり、究極を言え
ば自習書ではないのでは?

•
.

著者としてこのような指摘を受けたことはない。しかし、究極はイ
ンストールから完全に一人で完結できることを目的としているの
で、願わくば「授業」でも良いけど、本当の「完全独習」でやれな
いだろうか?

ならば、是非とも検証してみようではないか!

│
ωユ ー ザ ー 総 会 … 一 …

~I

今回の被験者
.
3
8歳女性。最終学歴(修士)。基本的に文科系学部出身
・統計学などを学んだことはない
.SASをはじめとした統計ソフトウェアの利用経験はない

レ
.

・可能な限りインストー jレから始めてもらう

SASの良いところ、使い難いところ、さらには本書の良し悪しにつ
いて指摘を頂いた。題して

コ統計を担皇皇位私の SAS日記(過去形になってほしいもの)

168

170.

Jr I l j ヰ プ ザ. . 鈴内々1::I~""J:r._'/:I:'- Î!~シ ふ ‑ 円 ー や 三 三 乙 1 2 0 1 3 インストール(以後、上段は被験者、下段は著者) 1 .確かにこれを読みながらやると出来るかも知れない 2 .でも、 SIDの当て方などは苦しいかも 3 .インストールを想定する必要つであるのだろうか?インストー ルされているものを用いるのがメインでは? レ . 2 .この部分は完全独習とは行きませんでした。やはり、もう少し 記載方法を工夫します 3 .確かに教育機関ではその通りです。が、出来るに越したこと はないと思いますので、残させて下さい I S 指令供給吟. . … ャ ι2013I 各章のまえがきなど 1 .ちょっと前置きが長いかもー。(インストールの話とかファイル レ . 保存の話とか)著者の性格がよく出ている 1 .これ、某ブログでも言われました!隣人ゆえに性格を知られ ているようですが・・‑。実は冗長であるというご意見も無いわ けではありません。おなじみの「流せ」というご意見もございま すが、まあご判断にお任せ致します 169

171.

I縞ユーザー総会湖町~.IC日…… 201I 構成について 1.2章データ解析で、いきなりプログラムの入力が出てくるが、そ の詳細について説明があるともっとわかりやすい 2 .たとえば r p r o c Jは何の略語でどういう意味か知りたい。 P37、 P74でr p r o c e d u r e Jとしヴ意味とあるが、 P26の段階で出てくれ るとうれしい • 基本的な構成のまずさですね。実は、 SASユーザーにはおな じみの r p r o c Jですが、初心者ユーザーの皆様は案外疑問に持 っかも知れないということで、した コ慣れてきても「当たり前」と考えるなということですね │ω ユ ー ザ ー 総 会 内 需 加 … … … 201I L ibname? ? ? ファイルを SASIこ読み込むために、フォルダを SAS上に呼び出 し設定するところは、イメージとしてつかみにくい。なにかたとえ とかあるとわかりやすいかなあ?? ' SASではおなじみの「永久データセットの保存方法」で、すが、意 外と初心者の皆様には分かり難いようです。参考までに、授業 におけるやりとりを見て頂いたら納得されました 170

172.

I S 符ユーザ竺:総会吋‑吋 了 m L ibnameの考え方 ( 1 ) 01 ところで、今 SASを閉じてしまった場合、 Work上!こ作成した fOATA1J はどうなってしまうのでしょうか? A1・もちろん無くなります。 SASにおけるフオル夕、 fWORKJは、一時データ セットですので、 SASを閉じたらそこにあるデータの全てが失われます 02:0ATA1を使って色々な解析をしたかったので、すが、また Excelから読み 込み直しですか? A2 その通りです。頑張って下さい 1 03・そんなの面倒です!もっと良い方法は無いのですか? A3:もちろんあります。では、永久データセットとしての保存と呼び出しをしま しよう! . : : L ‑ 1 T ̲ ̲ ̲ * SAS 7:IJfl,7ffl./a~&,IJ~'_'ß:.i二 ~ユーザー B 会 7腕E ゆ&ツb→ φ泊ン 三日 WIJ~l L ibnameの考え方 ( 2 ) 1 . 2 . 3 . 4 . 5 . 願わくばデータセットを毎回読み込むような手間を省略したいのです が?今永久データセットの作成をするにはコ では、現在の住所不定を解消するためには? まずはデータを格納する「番地」を設定しましょう!例えば、この PC全 体が愛知県だとすれば、フォルダ fSASTRAINJは名古屋市、 fDAT AJがご自宅だと考えるのです。 Workfま職場なので す その fDATAJフォルダ│こ永久データセットを置くには? 下記のような libnameステートメントで SAsl二番地を認識させましよう libnameDATA" C : ¥U s e r s¥講義用¥ Desktop目 的 TRAIN¥DATA 勺 171

173.
[beta]
│
品S

ユーザー総会対再開J

L
ibnameの考え方 (
3
)

Oa!aフォルダ!こ番地を認識させる f
l
i
b
n
a
m
e
Jです。直後のフォルダ名を忘れずに
フTイJ
I
.
C
f
.
) 極 集(
f

J
γ一
一
一

「ライブラリ」をクリックして、 OATA
フォルダが出現すれば OK!

.~絶対にWindo…AS …の有無
を確認して下さい!)

,
…

フ
ァ
イ
ル
{
日 編集む

表正 o
f
) お間よ入り坦} ツ、‑),⑦

OATA
フォルダの中に SASOa!aSe!

ヘ
ル1
(
H
)

,
.
,
、
竹
町

fOATA1Jができていれば OKです!

J いむ心 C 陥別府間副s. u 吋 ~VWATARU O
H
A
S
H
I
Y
冊 以X"'
両 J
j,
?
"X

二ライ^J
I:i二二これで、 SASを終了してもデータ i
ま失われ

!
6i
i̲
.
…

3
2
1
:
:
ロ
:
:
;
:
:
ま
せ
ん
35四

MlUosoh[
)
‑
c
e

1
7
'
:
8 S岨",,,s.,

自由凶

Windows上で確認することが重要!

│制守ー山
ザー総会加拘ト山…

I

L
ibnameの考え方 (
4
)
たとえば W
ork上の SASデータセットをコピーしても、直接
Windows上のフオ jレ夕、に貼り付けることはできない。やはり、こ
のl
i
b
n
a
m
eの考え方は理解しなければならないと思った。でも、
凄く理解し難い!

•

自宅と職場・・・ SAS
の宿命である r
W
o
r
k
=一時作業場」の考え
方は、案外難しいということです。かなりページ数割きましたが、
皆様はどのようにご指導されておられますかお教え願います

172

174.

I 1 1 1 十 絵 舎 で. . で.心 201I Procedureの意味 プロシジャー覧は難しすぎる! (私が統計学を知らないだ け ? ?)そもそもみんな「プロシジャ」自体の意味がわかるのか なあ??恥ず、かしながらわかりませんでした.ー。 • 私も含め、全てを理解されている方は恐らく皆無であると思わ れます。確かに一覧を用意しましたが、これはあくまで「全てを 知っていて下さしリと言う意味ではございません。著者による説 明不定でした 当初心者用の教本において、多すぎる情報は混乱を招きかね ないということですね。反省します S~ユザー鈴だヤ→iーや-加ra U n i v a r i a t eとf r e q 第 7章、第 8章は例があってわかりやすい。統計学をわからない 手ムでも E 里角写できる! レ . 平均値信仰の危険性や、カテゴリデータの平均値や標準偏差 を求めるなどの誤用例を提示させていただきました。基本的に はSASのオペレーションのみの教本にしたくなかった・・・という 著者の気持ちではあります コありがとうございました! 173

175.

1 1 s ュザー総会対号rliiiI門戸ンゲゲ 川 ‑ のような感じで・.. 現在学習中です。ユーザー会の日まであと 1ヶ月以上あります ので、引き続きレポートさせていただきます。当然、大橋さんの 書籍の売上が落ちることになったとしても、忌樺のないレポート をさせて頂きます! 。 厳しいツッコミを期待しております。既に慣れてしまったユー ザーにはなかなか気付かない部分を、本当の意味での「初心 者ユーザー」による目線からのレポートを、皆様もご期待頂け ればと存じます Im ーザー総会……リユ一泊ンセツ泊ン S p e c i a lthanksf o r """ , A thet r a i n e e! Ms.M. t h es t u d e n t so fTokyoM e d i c a landD e n t a lU n i v e r s i t y , GraduateSchoolo fH e a l t h c a r eSciences! 1 7 4 W J g

176.

(財)日本科学技術連盟における 「臨床試験セミナ一統計手法専門コース」と SAS教育 奥田英樹 1) 池田敏広 2) 永田均羽 田辺大樹 4) 坂井絵理 5) 1 )株式会社デンソー 2 ) 株式会社ベル・メデイカルソリューションズ 3 ) 株式会社ユートラム 4 ) 扶桑薬品工業株式会社 5 ) 塩野義製薬株式会社 CLINICALTRIALSEMINAR:BIOSTATISTICSADVANCEDCOURSEANDEDUCATIONONSAS BYUNIONOFJAPANESESCIENTISTSANDENGINEERS H i d e k iOkuda1) T o s h i h i r oI k e d a2) H i t o s h iN a g a t a3) D a i k iTanabe4) E r iS a k a i5) 1 ) DENSOCORPORATION 2 ) B e l lM e d i c a lS o l u t i o n si n c . 3 ) uTRAMC o r p o r a t i o n td 4 ) FusoP h a n n a c e u t i c a lI n d u s t r i e s,L t d . 5 ) S h i o n o g i& c o .,I 己目 要 1 9 8 9年より一般財団法人日本科学技術連盟において生物統計における実務経験者養成のための統計 手法専門コースが行われており,著者らは本コースの修了生である.本稿ではこの統計手法専門コース について修了生の立場から統計手法専門コースが医薬品・医療機器開発等行う上で企業にとって有用な 場面を示す.また統計手法専門コースにおいて SAS教育が行われているがこれによって,実際の業務の 場面においてどのような役割を果たしているか省察する. キーワード:医薬品開発,医療機器開発,統計教育, SAS教育,生物統計家,試験統計家 175

177.

1.序にかえて 医薬品・医療機器開発,において生物統計家は重要な役割を担っている.医薬品開発では l C H (日・ 米・ EU 三極医薬品規制調和国際会議)において l CHE9 r 臨床試験のための統計的原則」が整備され, そこでは「試験統計家が本ガイドラインに明確に述べられた原則を実行するために十分な理論又は実地 の教育及び経験を併せ持つべきである Jとしている. また 1 9 9 9年に日本製薬工業協会より「生物統計 家の教育・育成についてー製薬企業の立場からの提言 」が発表され,生物統計家の積極的な関与の必要 性に対する認識が高まっているにもかかわらず,専門性の高い人材が不足していることが指摘された. また医療機器開発では 1 9 9 9年に「医療用具の承認申誇に際し留意すべき事項について」の通知がなされ, ここでは r 2ヶ所以上の医療機関において集められた一医療機関当たり少なくとも 3 0例以上とする」と 0 0 5年に「医療機器の製造販売承認申請 しており,これに準じた計画での臨床試験が行われていたが, 2 に際し留意すべき事項 Jの通知がなされ「症例数は,当該医療機器の有効性,安全性を証明するに足り る統計学的に評価可能な症例数とする」としており,このころより医療機器開発においても生物統計家 の需要が急速に高まった.今日においては,医薬品・医療機器開発において生物統計家が広く求められ, 人材育成のためさまざまな取り組みが行われてきているが,臨床試験の複雑化,統計手法の進化,コン ヒユータ技術の発展に伴い生物統計家の果たす役割も年々増加しており,人員の確保に加えて,確保し o た人材の早期戦力化が必要となっている. (財)日本科学技術連盟における「臨床試験セミナー・統計手法専門コース J (略称 B i o S )は , 1 9 8 9 年に設立された医薬品・医療機器開発を行う生物統計家育成のための教育コースの一つである. B i o Sは 上述のような時代のニーズに合わせて,教育体系を変化させ 2 0 1 3年 3月までに 2 3回のコースが開設さ , 2 0 0名以上の修了生を輩出しており,医薬品・医療機器開発における生物統計家育成の一翼を担っ れ , 1 3W lBioS ( 2 3 B i o S ) の修了生であり,ここで学んだ内容が礎となっている.また医薬 ている.著者らは 2 品・医療機器開発の実地において統計ソフトとして S ASが広く浸透しており, B i o Sの中でも医薬品・医 ASの教育も行っている.さらに通常のコースに 療機器開発に必要な統計手法に加えて,必要とされる S 加え,希望者に対しては S ASによる統計解析コースを予備コースとして設定しており,受講生の水準, 要望に応じたカリキュラムを設定している. B i o Sについては,酒井ら ( 2 0 0 7 ) により講師の立場から本 i o Sの生物統計家養成 コースによる生物統計家の育成等が示されている.本稿では受講生の立場ーから, B ASを用いた教育についての意義を示す.はじめに B i o Sにおける統計教育および SASの の役割および S ASを用いた講習を取 教育について述べ,本コース受講者および企業側が享受する利点を示す.最後に S り入れることにより,医薬品・医療機器開発においてどのような役割を果たしているかを示し,結びに かえるー 2 .B i o Sにおける統計と SASの教育 B i o Sでは,試験統計家養成のための「本コース」とそれに付随して r 予備コース j が設定されてい る.医薬品・医療機器関連企業の統計部門に所属する人員は,必ずしも大学において統計を専攻してお ASを十分に使いこなせる環境にない者も所属する.そのため「予備コース」では,企業側 らず,また S のニーズ に合わせて「統計基礎コース J , r S A Sによる統計解析コース」が設定されている.統計基礎 176

178.

コースは,理数系出身者以外の人員のため B i o Sf 本コース Jを受講する前に数理的基礎を習得するため に,微分積分,線形代数等の講習を行っている. 本コース J カリキュラムを表 Iに示す.本コースでは,ひと月に 2日の講習が設定され まず 23BioS f ており,医薬品・医療機器開発に必要な統計手法が組み込まれ,より実践に則した内容となっている. SASは医薬品・医療機器開発の統計解析において用いられる主要な統計ソフトであり,必要に応じて SAS を用いて実習を行うものもある.他の分野における統計教育においても同じように分野ごとの特性に応 じた教育がなされているが, B i o Sの特徴として総合実習がある.これは実際に模擬的な臨床試験を実施 し,最初の計画から総括報告書の作成までを行うことになる.総合実習の詳細は,酒井ら ( 2 0 0 7 ) ,上 2 0 1 3 ) に示されている. 野ら ( 本コース J カリキュラム 表 1 23BioS f 4月 オリエンテーション,臨床試験と生物統計学,臨床試験デザイン,ガイドラインについて, 総合実習,入学試験 5月 割付,統計的推測 ( 1 ) ,評価尺度の信頼性と妥当性,健康アウトカム評価i l ,総合実習 6月 統計的推測 ( 2 ) ,2群の比較 ( 1 ) ,2群の比較 ( 2 ),総合実習 7月 統計的推測 ( 3 ) ,医薬品開発における倫理的問題,多群の比較,分散分析 ( 1 ) 総合実習 8月 統計的推測 ( 4 ) ,相関と回帰,総合実習 9月(合宿) ベイズ統計学入門,分散分析 ( 2 ) ,総合実習,中間試験 1 0月 カテゴリカルデータ解析 ( 1 ) ,サンプルサイズ設計,薬物動態解析の基礎,総合実習 1 1月 共変量による調整と統計ーモデ、ル ( 1 ) ,カテゴリカルデータ解析 ( 2 ) ,総合実習 1 2月 経I I 寺データの解析,共変量による調整と統計モテツレ ( 2 ), 中間評価と解析・メタアナリシス l月 2月 総合実習(模擬臨床試験結果発表会) i l l i,抗悪性腫療の臨床開発と臨床薬理学, 安全性評 { 第 I相試験の計画とクロスオーバー試験,総合実習 3月 共分散,調整,生存時間解析,総合実習,卒業試験 次に, 23BioS fSASによる統計解析コース」カリキュラムを表 2に示す.講習開始時には要約統計量や データクリーニング実習などの基本的な内容から実施されている.医薬品・医療機器開発においては, 必ずしも正規分布するデータばかりでなく,要約統計量の理解は重要な位置づけとなり,また通常の実 験計画とは異なり,欠測や異常なデータを扱うこともあることから,データクリーニングによって問題 点を抽出することも重要な技術となる.その後,実践的なカリキュラムに移行していき f 木コース J で SASを用いた演習が行なわれる場合には,先に fSASによる統計解析コース j においてその裏づけと なる数理統計的な教育が行われ f 本コース」において統計中心の教育がなされた場合には fSASに よる統計解析コース」において「本コース Jで・扱った題材に関する演習が行われるような形式となって し、る.このことによって, SAS初心者のための導入教育に留まらず 1 7 7 f 本コース」の理解を深める役割

179.

も果たしている.また SASの扱いにある程度慣れてきた段階で SAS/IMLを用いた講習が行われ,より数 理的な手法も学習することができるようになっている.次にこれらの教育が受講生の立場から日常業務 を行う上での利点を示す. 表 2 23BioS ISASによる統計解析コース j カリキュラム 4月 SAS入門,データの記述とグラフ化・予備的解析,相関係数と散布図,検定入門 5月 データクリーニング実習 6月 サンプルサイズ設計 7月 SAS/別 SIGHTによる検索的データ解析入門 8月 分散分析入門 1 0r J 多重比較の基礎 I I月 対比の最大対比法 1 2月 カテゴリカルデータ解析 l月 最尤法入門 2月 SAS/IMLによる回帰分析入門 3 . BioS受講の利点 著者らを含む BioSの受講者は,日常的に医薬品・医療機器の臨床試験,製造販売後調査,臨床研究 等において,主に統計解析,データ管理など.の業務を行っている.このため受講者の BioSに対して求め るものは, I 実地で活用可能な知識の習得」である.このような観点から受講者は, BioSの受講に際し て以下のような利点があるものと考える. 利点①:医薬品開発・医療機器開発に必要な基礎から応用に至る統計知識を習得できること 利点②:実際の業務で即応可能な講習を取り入れていること 利点③ー模擬臨床試験で日ごろ経験のできない実戦経験を積むことができること これらの点については,以下に詳細を示す. 利点①:医薬品開発・医療機禄開発に必要な基礎から応用に至る統計知識を習得できること 前述に示した通り,講習当初は,基礎的な内容が多く含まれている.またこれに加え,数理の理解に自 信のない受講者に対しては,講習 W I聞を通じて任意参加の補講が行われる.補講にあたっては毎月宿題が 設定され,次月までに各自自習することで理解を深め,補講時には疑問点について他の受講生や講師に質 問することが出来る.これらによって,必要な基礎知識を習得することができる.そして,講習の途中よ りカテゴリカルデータ解析やサンプルサイズ設計,統計モデ.ルによる解析等,医薬品・医療機器開発に必 婆な応用分野の講習へと次第に移行していく.またこれらの講習においても基礎的な背景や,必要に応じ て導出のための算出式等が別途健示されている.これらの講習を通して, 点や理解できていない点についても補うことができる. 178 日ご、ろ業務で、疑問に思っていた

180.

利点②:実際の業務で即応可能な講習を取り入れていること 利点①でも触れているが,講習では受講生らが日ごろ業務で接するような事柄を題材とした講習が多 く取り入れられている.また,講師の中には臨床試験に携わっている熟練の経験者が多く,実地での経 験を多く積んでいることから,個々の講習においても教科書的な話題に留まらず,受講時の最新の情報 が多く取り入れられた実際の業務に応用できるような実践的なものとなっている.また講習においては 多くの資料が提示され,必要な文献も配られ,多くの参考文献が示される.これらには,統計の礎とな るものや最新のものまでが提示,あるいは紹介がなされる.日常業務においても日々文献の検索等を行 う必要があるが, BioSの修了生は,まず受領した資料から探すことができるようになる. 利点③:模擬臨床試験で日ごろ経験のできない実戦経験を積むことができること 模擬臨床試験では,複数の班に分かれて各班で市販の健康食品を使って試験を行い,結果を解釈し,総 括報告書にまとめる.ここでは l年を通じて各班で臨床試験に向き合い,試験計画,統計手法に加えて割 付,登録,モニタリング,データマネジメント, QC,症例検討会等,臨床試験における一連の業務を経験 することとなり,日ごろ業務では実施しないような臨床試験業務を経験することができる.また l年間, 各班において│臨床試験に必要な業務について頻繁に議論することとなり,ここに目標を共有することにな る. 当然ながら班に属するものは会社が異なるために,統計に関する考え方, 日ごろの業務内容,会社 における文化,開発品目に至るまで各社各様である.総指報告書作成という一つの目標の局面においては, 個々の知恵を出し合い各々の技術を結集する必要があるため,個々の相談や情報の共有を通じて,自社に ない新たな発見や活用方法を学習することになる. また新規参入を目指す企業にとっては,極めて貴重 な一連の実戦経験を通じ,多様な先行企業の考え方に触れることで,自らの仕組みを構築する助けとなる. このように, BioSは,受講生の「実地で活用可能な知識 J を習得できる場であると考える. 4 . BioSにおける SAS教育の効用 今日, SASは多くの医薬品・医療機器分野において最も多く運用されている統計ソフトであり, BioS においても多くの時間を SAS教育に費やしている.本節では, BioSにおいて SAS教育が取り入れられて いることによる効用を先述した BioS受講の利点に関連づけて示す. BioS受講利点①より BioS受講時には,統計教育とともに多くの SASの使い方を学ぶことができる.当初はデータハンドリン グから始まり,日ごろ業務で扱うようなプロシジャを学んだ後に, SAS/IMLを用いて,尤度や回帰分析に ついて行列計算を用いた講習も行われる.ここに日ごろ業務に携わる上で必要なプログラム技術を磨くこ とができるー また SASは大変便利なツールであり,特定のプロシジ、ャを数行記述することにより,高度な統計手法を 取り入れることができるが,一方で統計的背景が理解できていないために,意図しない結果を導いたり, 算出不要な統計量や p値を算出したりしてしまうことがよくあり,ここに統計手法の誤用の可能性が出て くる. BioSでの SAS教育では日常業務に関連づけて講習が行われており,また単なるプロシジャの使用方 法だけでなくプロシジャを使う上での統計的背景についても説明がなされるため, SASの実装においても 1 7 9

181.

誤用を防ぐことにつながっていると考えられる.ここに日常業務における質の向上にもつながっているも のと考えられる. BioS受講利点②より BioSでは,多くの資料,文献が提供される.当然ながらその中には,多くの SASに関する文献および手 法が示されている.日頃の業務において SASの使い方が分からず,調べなければならない局面が多くあり, このような局面では,緊急を要することが多くある.このような状況において, BioSの修了生は,まず講 習で用いた資料,文献を調べることになる.これらの資料には,用量反応,経時データの解析,サンプル サイズ設計,割付等,書!苫で販売されている文献には詳細に記載されていないものも多く含まれており, 即実装可能である.また通常のプロシジャでは含まれていないような手法においても,解析する方法が示 されている場合もあり,効率的に業務を遂行することができる.ここに日常業務における効率化に貢献し ているものと考えられる. BioS受講利点③より 枝一擬臨床試験を通じて,講習で学んだ手法を実践する場が与えられるため,講習の内容の理解を深める ことができ,幅広く臨床試験を経験することから,自社の業務では実施しないような使い方も実施するこ とができる.また模擬臨床試験を i i l lして,班員は仲間意識を持ちひとつの目標のために,各々の知識や技 術を出し合う.この過程で日ごろの自社業務では経験することのないプログラム方法を共有することもあ る.そしてこの班員との交流は,一年間の BioSが終了した後も続くことが期待できる. また, BioSに参加する者には,日ごろ SASを扱っていないが,企業の新規参入のために受講する者もい る.すでに SASは医薬品・医療機器業界では広く浸透しており,例えば CROなどの受託機関の場合,経 験がない状態での参入は難しい状況もある.このような状況においても,受講者は模擬臨床試験を通じて, 実践を経験することができる.さらに,同じ班員の中の SAS受講者は,同じ仲間意識のもとこのような初 心者に対して教育することもある.初心者ほど講師には質問しにくいが, { t f t問には質問するものである. この点において,新規参入を目論む企業から既存の企業まで,日ごろ実施することのできない業務を経験 し,個々の技術の向上につながっているといえる. 5 . 結びにかえて 木稿では,医薬品・医療機操開発における教育を示し,その講習の一つである BioSにおける統計教育お よび SAS教育について示した.また BioS受講による受講者側の利点を述べ, BioSは「実地で活用可能 な知識の習得」に寄与していることを示した.医薬品・医療機器の臨床試験の現場では,今でも生物統 計家は不足しており,各社とも人員確保に奔走しているのが実情であり,早期の戦力化が必要とされて いる.また SASは,医薬品・医療機器開発において多くの企業で使用されている統計ソフトであり,早 期の上達を必要とする.このような状況において BioSは,企業ニーズにも則しており企業に必姿な知識 と経験を提供している.また SASを教育に多く取り入れることにより,医薬品・医療機器開発の質の向 上,効率化,経験に基づく技術の向上に寄与していると考えられる. BioSの終了生は 1 , 200名を超えて , 200名以上輩出されたことになる.また 20年を J 也 いる.言い換えれば,実地の知識を習得した人員が 1 えた現在においても多くの受講希望者があり,さらなる貢献があるものと思われる.現在医薬品開発の 180

182.

現場では,早くよりよい医薬品を市場に提供することが求められている.また医療機器開発の現場にお いては,積極的な国内での臨床試験の実施を通じた革新的な医療機器の創出が期待されているーその中で, 実地で活用可能な知識の習得は,このような市場のニーズ、にも回答することになり,受講生や企業の利 益だけでなく,最終的には医薬品や医療機器の消費者,すなわち患者の利益に繋がるものと考える. 謝辞 23BioSでは,講師の皆様・(財)日本科学技術連盟の皆様に大変お i 止話になりました.ここに御礼申し 上げます. 参考文献 山厚生省医薬安全管理局審査管理課 ( 1 9 9 8 )1 . 臨床試験のための統計的原則.医薬審第 1 0 4 7号. [ 2 ) 厚生省医薬安全局審査管理課 ( 1 9 9 9 ).医療用具の承認申請に際し留意すべき事項について.医薬審第 1 0 4 3 仁T ア]. [ 3 ) 厚生労働省医薬食品局審査管理課医療機器審査管理室 ( 2 0 0 5 ) 医療機器の製造販売承認申請に際し留意 216001号. すべき事項について.薬食機発第 0 2 0 0 7 ) .(財)日本科学技術連盟 [ 4 ) 酒井弘憲,佐々木秀雄,大橋靖雄 ( 医薬品データの統計解析専門コース l i n i c a lS t a t i s t i c i a n s / C l i n i c a lS c i e n t i s t sの養成.臨床研究・生物統計学研究会 総合実習プログラムを通した C 誌 ,2 3, 1 , 6 ‑ 1 4 [ 5 ) 日本製薬工業協会 研究開発委員会 ( 1 9 9 9 ) .生物統計家の教育・育成についてー製薬企業の立場からの提 言ー.臨床薬理, 30 ム801‑804 [ 6 ) 大橋靖雄 ( 1 9 9 9 ) 生物統計家の教育・育成についてー製薬企業の立場からの提言ーに寄せて.臨床薬 理 , 30ム8 0 1 ‑ 8 0 4 [ 7 ) 上野真治,大竹優哉,奥田英樹,永田 均,田辺大樹,高畑隆之,笹川佳則,坂井絵原,池田敏広,吉 ハl 俊博 (2013). (財)日本科学技術連盟 臨床試験セミナ一統計手法専門コースの総合実習フ。ログラ 0 1 3 . ムを通した生物統計家の養成ー受講生の立場からー. SASユーザー総会論文集 2 181

183.

(財)日本科学技術連盟 臨床試験セミナー統計手法専門コースの 総合実習プログラムを通した生物統計家の養成 ‑受講生の立場から‑ 上野真治 1) 大竹優哉 2) 奥田英樹 3) 永1 1 1均 4) 田辺大樹 5) 高畑隆之 6) 笹川 l 佳員16) 坂井絵理 7) 池田敏広 8) 吉 川 俊 博 9) 1 ) ACメデイカル株式会社 4 ) 株式会社ユートラム 2 ) 株式会社ジャパン・ティッシュ・エンジニアリング 5 ) 扶桑薬品工業株式会社 6 ) シスメックス株式会社 8 ) 株式会社ベル・メデイカル・ソリューションズ 3 ) 株式会社デンソ‑ 7 )i 荒野義製薬株式会社 9 ) 小野薬品工業株式会社 NURTURINGOFBIO‑STATISTICIANTHROUGHPRACTICALSIMULATEDCLINICALTRIALS INCLINICALTRIALSEMINAR:BIOSTATISTICSADVANCEDCOURSE BYUNIONOFJAPANESESCIENTISTSANDENGINEERS ‑FRO恥1A PERSPECTIVEOFSTUDENTS S h i n j iUeno1) YuyaOhtake2) H i d e k iOkuda3) H i t o s h iNagata4) D a i k iTanabe5) T a k a y u k iT a k a h a t a6) Y o s h i n o r iSasagawa6) E r iS a k a i7) T o s h i h i r ol k e d a8) T o s h i h i r oYoshikawa9) 1 )ACMEDICALINC . 2 )J a p a nT i s s u eE n g i n e e r i n gC o .,L td . 3 )DENSOCORPORATION 4 )uTRAMC o r p o r a t i o n 5 )FusoP h a r m a c e u t i c a lI n d u s t r i e s, L td . 6 )SysmexC o r p o r a t i o n 7 )S h i o n o g i& c o ., l t d . 8 )B e l lM e d i c a lS o l u t i o n si n c . 9 )ONOPHARMACEUTICALCO., LTD. 要旨 医薬品・医療機器開発において,データを科学的かっ論理的に解釈する上で,統計学の役割は重要で あるが,国内において統計学を体系的に修得できる教育機関は限定的である.その中で. (財)日本科 学技術連盟が主催する統計手法専門コース (BioS) では,統計手法の理論の修得にとどまらず,データ をどのように集め,解析し,解釈すべきかについて,実務経験豊富な講師障から学ぶことができる.こ の BioS の特徴のーっとして総合実習があり,健康食品・器具の効果を検討するための試験(模擬臨床 試験)を受講生が自ら企画立案し,実施し,最終報告書にまとめて発表・報告する.本稿では,模擬臨 床試験の企画立案から,最終報告書にまとめるまでの l年間のスケジュールを提示し,受講生がどのよ うな教育を受け,その実践にどの程度の時間をかけたのか,受講生に対するアンケートに基づいて報告 する.併せて,そこから享受できるもの及び医薬品・医療機器開発分野における貢献について省察する. 也教育 キーワード:医薬品開発,医療機器開発,臨床試験,生物統計家,試験統計家,統計教育,実 i 183

184.

1.はじめに 医薬品・医療機器開発において,臨床試験にてその有効性・安全性のプロファイルを確立するにあた り,臨床成績を科学的・論理的に解釈する観点から,生物統計家は重要な役割を担っている. 医薬品開発における臨床試験については ICH (日・米・ EU 三極医薬品規制調和国際会議) E9ガイド JJ (こて,医療機器開発における臨床試験については 2 005年の「医 ライン「臨床試験のための統計的原則 J[ 療機器の製造販売承認申請に際し留意すべき事項について」の通知 [2Jにて,その計画時点からの生物統計 家の参画への要求が明言あるいはその必要性がそれぞれ示唆されている. 2 0 1 3 )[ 3 Jに示されているが,これらのガイドラインや通知を契機に,医薬品・医療機器開発に 奥田ら ( おける臨床試験への生物統計家の参画の必要性に対する認識及び需要は急速に高まった.一方,必要性 に対する認識や需要が高まっているにも関わらず,生物統計家の供給は不足している状況であり,この ことは酒井ら ( 2 0 0 7 ) [4Jも指摘している. ICHE9ガイドラインによれば,試験統計家とは「本ガイドラ インに明確に述べられた原則を実行するために十分な理論又は実地の教育及び経験を併せ持つべき」者 であるが,囲内において統計学の「十分な理論」を体系的に修得できる教育機関は限定的であり r卜分 な経験」を積むことについては,それが可能な教育機関は更に限られる. (財)日本科学技術連盟主催の「臨床試験セミナ一 統計手法専門コース J (略称 BioS) は , 1989年 に設立された医薬品・医療機器開発に携わる生物統計家育成のための教育カリキュラムの 1つで、ある. 時々のニーズを鑑み,教育内容の改定を重ね, 2013年 3月までに 23回のコースが開設され, 1 , 200名以 上の修了生を輩出している.第 9回より,上述の「実地の教育及び経験 Jの部分を補うべく,健康食品・ 器具を用いた模擬臨床試験の総合実習 (BioS総合実習)がカリキュラムに組み込まれている. BioS総合実習は全受講生を 1 0名前後のグ、ループに分けて行われる.各年度とも運営委員会より指定さ れた健康食 l果1又は器具について,各クーループが「会社」として医薬品又は医療機器として承認申請する という仮想の下,受講生が自ら試験を企画立案し実施する r 模疑」という名を冠しているものの,試験 は倫理委員会の承認を受けており,独立モニタリング委員会・相談窓口を設置するなど,本物の臨床試 験と同様の枠組みにて行われる.また,本実習にて行う作業は,試験実施計画書の作成,被験者の募集, 同意説明・取得,モニタリング,データ収集,データマネジメント,統計解析,総括報告書:の作成とい った臨床試験において必須の手順が網羅されている.更に,本実習において実務経験豊富な講師陣より, 各月の実習冒頭に受講生全員を対象とした講義,及び実習中に随時各クツレープへ個別の指導・助言が行 われる.また,臨床試験に必須の手順が網羅されているため,自らの所属団体にて ont h ej o bt r a i n i n gなど により経験を積むことが難しい受講生にとって,本実習は貴重な経験の機会となる. 著者らは 23回 BioS (23BioS) の修了生で,同じグループにて総合実習に取り組んだ者たちである.本 稿では,本実習について受講生の立場より報告する.はじめに本実習の概要及び利点を示す.次に実習 にて経験した作業及びその工数,更に個々の作業から直接得られる以外の収穫について示す.最後にこ れらから見られる生物統計家の養成にあたり必要なもの及び本実習の医薬品・医療機器開発分野への貢 献について省察する. 2 . BioS総合実習の概要及び利点 1 8 4

185.

BioSは生物統計家養成のための「本コース」と,その内容を補足する「予備コース」で構成されてお り,総合実習は「本コース Jの中のカリキュラムである. 表 Iに 23BioS I 本コース Jのカリキュラムの概要を示す. 本コース」カリキュラム 表 1 23BioS I 4月 オリエンァーション,臨床試験と生物統計学,臨床試験デザイン,ガイドラインについて, 総合実習(講義.オリエンテーション) ,入学試験 5月 1 ) ,評価尺度の信頼性と妥当性,健康アウトカム評価, 割付,統計的推測 ( 総合実習(講義:総括報告書のガイドライン) 6月 2 ) ,2群の比較 ( 1 ) ,2群の比較 ( 2 ), 統計的推測 ( 総合実習(講義:プロトコルはどのように書くべきか,試験デザイン) 7月 統計的推測 ( 3 ) ,医薬品開発における倫理的問題,多群の比較,分散分析 ( 1 ), 総合実習(講義:試験計画立案上の留意点) 8月 4 ) ,相聞と回帰,総合実習 統計的推測 ( o 茸義:データの品質管理についての基礎知識) 9月(合宿) ベイズ統計学入門,分散分析 ( 2 ) ,総合実習(イベント:中間報告会) ,中間試験 1 0月 カテゴリカルデータ解析 ( 1 ) ,サンプルサイズ設計,薬物[l} J 態解析の基礎, 総合実習(講義:症例報告書 (CRF) に関する基礎知識,標準化,臨床試験データに関す る基礎知識,臨床試験データの点検) 1 1月 共変量による調整と統計モデル ( 1 ) ,カテゴリカルデータ解析 ( 2 ) ,総合実習 1 2月 経時データの解析,共変量による調整と統計モデル ( 2 ) 中間評価と解析・メタアナリシス,総合実習(講義 l月 総合実習(イベント:模擬臨床試験結果発表会) 2月 安全性評価,抗悪性l J 重療の臨床開発と臨床薬理学, 統計解析計画書作成上の留意点) 第 I相試験の計画とクロスオーバー試験,総合実習 3月 共分散,調整,生存時間解析,総合実習(講義 総評) ,卒業試験 次に,表 2に総合実習における著者らの作業スケジュールの概要を示す.尚,スケジュールや進捗に (こ共通するものである. ついてはクールーフc毎に異なるが,作業項目については全クソレーフ,O 表 2 総合実習における著者らの作業スケジュールの概要 時期 試験実施準備 実施月 4月 大項目 内容 背景情報収集 試験物質,評価項目に関する情報収集 会議 役割分担,文献調査の方針・目標の設定 (~5 月) 試験デザイン検討,実施計画書・症例報告書作成, イロット試験準備 ノξ 割付,データベース作成 5月 会議 6月 (~6 月) 役害I 1分担,試験デザイン検討 各チーム (Writing,DM/STAT) 毎のタスク検討, 会議 統計解析計岡害(案)レビュー 185

186.

データ入力,データクリーニング,解析用データ パイロット試験実施 7月 8月 9月 終 了 セット・統計解析計画書作成,試験結果解析 総括報告書作成 (~10 月) 会議 パイロット試験結果の解釈,本試験デザイン検討 中間報告会準備 (~9 月) 実施計画書骨子,プレゼンテーション資料作成 会議 中間報告会準備,タスク検討 会議 本試験実施に向けたタスク確認 実施計画書・同意説明文書・日誌・症例報告書・ 本試験準備 データベース作成 (~11 月) 10月 ドキュメント内容・データの詳細検討 会議 試験実施用資材作成,統計解析計一両書作成 (~12 試験実施準備 試験実施 1 1月 月) ,同意説明・取得,症例エントリー モニタリング,データ入力・データクリーニング 試験実施 (~12 月) (~12 月) 会議 試験の進捗管理 症例検討会 症例検討会実施 解析用データセット 解析用データセット作成 試験結果解析 試験結果解析 総括報告書 総括報告書作成 最終報告会準備 最終報告会準備・タスク検討 (~1 月) 会議 試験終了後のタスク確認 1月 会議 総括報告書作成に向けたタスク確認 2月 会議 総括報告書仕上げ,文書整理 1 2月 試験終了後 (~2 月) 本実習の利点は,まずそのカリキュラムの性質・構成により BioS受講生全員が享受できるものとして, 以下の 3点が挙げられる. i点目は, 10名前後のグループ編成であることで,パックグラウンドや得意分野の異なる者が協働で きることである.これにより,それぞれの強みを活かし,不慣れな部分を五いに補完できる.ひいては, 各々が不得手とする部分について,それに長じた人材の生の声や作業の進め方に触れることにより,教 育効果に寄与する. 2点目は,必要に応じて経験豊富な講師をはじめ,各方面の専門家の指導・助言を随H 寺,直接受けられ ることである.各作業の作法や形式について学べる機会は多いが,それらの根本的な発想を含めた必要 性についてその専門家から学べる機会を得ることほ少ない. 3点目は,講義も含めた BioS全体の構成によるもので,実習の進捗状況と,その時行われる講義の内 容が連動していることである.各月とも,その月に進捗が予想される総合実習の作業において留意すべ き内容を含む演題の講義が催されることが多く,総合実習の作業が先行する場合でも,行った作業に関 わる内容の講義が近い月に催される.この適時性あるいは即時性により,講義や指導により示された知 識や留意事項を即時に実践できるため,その活かし方も併せて学ぶことができる. 186

187.

また,試験の企画立案から総括報告書までの全ての作業を自ら執り行うことによるものとして,以下 の 2点が挙げられる. l点は,試験実施にあたり試験食品又は器具の開発コンセプ卜は与えられておらず,そこから自ら考案 することである. BioS受講生の多くは,自社において主として統計解析担当者として,既に開発コンセ プ卜が存在している品目についてそのプロファイルを確立する観点から業務にあたっている.著者らも, 開発コンセプ卜の考案については知識や経験が乏しく,故にこの段階の作業については必ずしも作業時 間の多寡のみでは推し量れない難しさを痛感した.これにより,臨床試験の計画・実施だけではなく「臨 床試験を実施する」という段階にこぎ着けることがまず大変なことであると実感できた. もう l点は,試験実施の流れについて,根本的な見直し,場合によっては再構築しなければならない 危機と常に隣り合わせであることであるー本実習では,仮説や論理展開も含め,受講生が自ら試験を計 画し実施する.従って,その仮説や論理展開が恨幹から崩れるような事態に陥ると,再び計画段階から 練り直すことが必要となる.著者らは幸いにして,ゼロから再構築しなければならない事態に陥ること はなかったが,随所で,特にパイロット試験の前後で仮説や論理展開の入念な見直しを行った.これに より,綿密かっ当を得た事前計阿を行い,上述のような事態に陥らないようリスクマネジメン卜する重 要性を改めて実感できた. 3 .B i o S総合実習における作業工数の要約 著者らは 1 1名編成のグループにて総合実習に取り組んだ. B i o Sの全カリキュラム終了後,ク♂ループ全 員に対してアンケー卜を行い,作業工数の定量化を行った.その結果を以降に示してゆく.但し,以降 寺に記録していたものではなく,振り返って確認した概算の数値である の表中に示す全ての数値は作業 H ことを断っておく. 寺聞の要約を表 3に示す. まず,総合実習における作業 H 総合実習における著者らの作業時間は,最も多い者で約 2841!寺問,平均で約 1 4 7時間で、あった. BioSの講義は i演題あたり 3I!寺問にて行われており 1年間のカリキュラムの累計は約 1 0 0時間であ 寺問の教育を受けており,グループ全員による延べ時間にすれば約 1 1 0 0 る.各々が座学としてこれだけの H H 寺問である.一部,作業I!寺問が座学の時間を下回る者がし、たものの,延べ時間で比較すれば,本実習に おける作業時間は, 5割近く座学の時間を上回った. 寺問の最大値,平均値について, 81 ! 寺 問1 1 日として平常業務に換算するとそれぞれ また,本実習の作業 H 8日となった.更に, 5日/週として営業日で換算すると,総、作業期間として多い者は lヶ 約 36日,約 1 J半,平均でも 3週間を超過する計算となった. 寺問及び送信メール数の要約を表 4に示す. 次に,月毎の作業 H 187

188.

表 4 総合実習における著者らの月毎の作業時間及び送信メール数の要約 作業 H 寺問 ( 1 1 寺間) 送信メール数(件) 実施月 合計値 平均値 合計値 平均値 4月 3 8 . 2 5 3. 48 1 7 1 .55 5月 1 3 2 . 0 0 1 2 . 0 0 216 1 9 . 6 4 6月 1 0 7 . 3 3 9 . 7 6 1 9 7 1 7 . 9 1 7月 1 1 3 . 2 5 1 0 . 3 0 1 4 7 1 3 . 3 6 8月 1 4 6 . 2 5 1 3 . 3 0 84 7 . 6 4 9月 6 2 . 5 8 5 . 6 9 50 4 . 5 5 1 0月 1 8 8 . 3 3 1 7 . 1 2 243 2 2 . 0 9 1 1月 2 7 8 . 6 6 2 5 . 3 3 640 5 8 . 1 8 1 2月 2 5 5 . 1 7 2 3 . 2 0 525 4 7 . 7 3 l月 1 9 5 . 8 3 1 7 . 8 0 274 2 4 . 9 1 2月 1 0 5 . 6 7 9 . 6 1 1 9 7 1 7 . 9 1 4月は最後の平日 2 日間が BioSのカリキュラムであり,そこで班編成が行われたことから, 4月中に 作業やメールによる連絡は殆ど発生しなかった.また, 9月はパイロット試験関連の作業がほぼ終了し, 本試験に関連する作業が本格化する前で・あったことから 他月に比べ,作業やメールによる連絡が少な かった 0 0 1 1 寺聞を越え,メールの総送信件数は 7月 , 8月 しかし,それ以外の月においては,延べ作業時間は 1 を│徐きいずれの月も 190件を超過した.特に,本試験の各種ドキュメント固定,試験実施,解析プログ ラムの作成が主たる作業となった 11 月 ~12 月の 2 ヶ月については,し、ずれも延べ作業時間は 25011寺問を 超過し,メールの総送信件数は 500件を超過した.また,同期間について平均値で見ると,作業時間は 2 0 1 1 寺聞を超過し,送信メール数は 45件を超過した. 4 .B i o S総合実習における作業項目及びその作業時間 本実習の利点の Iつは,知識や留意事項をその実践を以ってその活かし方も併せて学べる点である. 各々の基礎知識や留意事項について,座学にて頭で理解するのに至るのに要する時間と,実践及びそれ 寺聞は必ずしも同程度ではない. によりスキルとして習得に至るのに要する H 著者らの作業項目毎の作業時間の要約を表 5に示す.尚,表中の最ノj 、値が 0 . 0 0( 1 1 寺問)の項目につい ては,役割分担あるいは同一企業に属する複数名の受講生がいた関係で一部作業が発生しな方、った者が 寺W Jの「会議J とは,表 lに示した各月のカリキュラムにおける「総 いることを示している.また,各 H 合実習」及ひ汚1 [ 途設けた会合にて持った会議の実績であるが,個別の言及については割愛する. 表 5 著者らの作業項目毎の作業 H 寺問の要約 H寺 1~J I 大項目 188

189.

試験実施準備 試験実施 背景情報収集 6 2 . 9 2 5 . 7 2 2 . 5 0 9 . 0 0 パイロット試験 2 2 5 . 0 8 20. 46 4 . 5 0 41 . 58 中間報告会準備 51 .1 7 4 . 6 5 0 . 0 0 2 4 . 0 0 実施計画書作成 3 7 . 1 7 3 . 3 8 0 . 0 0 1 5 . 5 0 同意説明文書作成 3 5 . 1 7 3 . 2 0 0 . 0 0 1 4 . 0 0 症例報告書作成 3 5 . 0 0 3 . 1 8 0 . 0 0 1 0 . 0 0 データベース作成 3 9 . 5 0 3 . 5 9 0 . 0 0 1 2 . 0 0 統計解析計図書作成 6 9 . 1 7 6 . 2 9 0 . 0 0 4 0 . 0 0 試験実施用資材作成 3 2 . 6 7 2 . 9 7 0 . 0 0 8 . 0 0 同意説明・取得 5 0 . 6 7 4 . 6 1 0 . 5 0 1 2 . 0 0 会議 362. 42 3 2 . 9 5 31 .9 2 3 6 . 6 7 モニタリング 3 9 . 0 0 3 . 5 5 0 . 0 0 1 0 . 0 0 データ入力 3 5 . 3 3 3 . 2 1 0 . 0 0 6 . 0 0 データクリーニング 2 0 . 8 3 1 .8 9 0 . 0 0 症例検討会 2 1 . 5 0 1 .9 5 。 o 。 1 2 . 0 0 8 . 5 0 1 1 4. 42 1 0. 40 1 0 . 1 7 1 1 . 2 5 解析用データセット作成 1 7 . 0 0 1 .5 5 0 . 0 0 1 0 . 0 0 試験結果解析 6 7 . 0 0 6 . 0 9 0 . 0 0 4 0 . 0 0 総J 吉報告書作成 1 1 5 . 3 3 48 1 0. 0 . 0 0 3 5 . 0 0 最終報告会準備 5 1 . 5 0 4 . 6 8 0 . 0 0 3 2 . 0 0 会議 1 4 0 . 5 0 1 2 . 7 7 1 2 . 5 0 1 3 . 5 0 A 試験終了後 議 作業時間が突出して多かったのはパイロット試験である.これは,パイロット試験を本試験の計画のた めの情報収集の一環と位置付け,その中の詳細な作業を含め l項目に集約したことによる.その延べ作業 時間は約 225時間に及んだが,この作業 H 寺問の多さは,著者ら自らが被験者であることにより同意説明・ 取得を行わなかった点を除き,木試験と同様の枠組みにて行ったこと,また,本試験の計画のために卜分 な情報を得るという目的を果たすべく,幅広く検討事項を設け試験に盛り込み,更に試験後にそれぞれを 精査したことによる. 1 5時間に及んだ.これは仮 次いで作業時間が多ヵ、ったのは総括報告書作成であり,延べ作業時間は約 1 説・理論の再確認及び試験結果の考察を入念に行ったこと,また,全体の論旨や各項目問の整合,及び体 裁等について綿密な確認を行ったことによる. 上記 2作業を除き,作業時間が特に多かったのは背景情報収集,統計解析計画書作成,試験結果解析の 3 作業で,これらの延べ作業 H 寺問はいずれも 6 0時間を超過した r 生物統計家の育成」という B i o Sの腫旨 を鍛み,統計解析関連の作業には重点を置き,意図して多くの作業 H 寺 I nJ を充てた.また,背景情報収集の 作業時間は統計解析計問書作成あるいは試験結果解析のそれと同程度に及んだが,これは開発コンセプト の考案から行うにあたり,製 1 5 1プロファイルの理解や証明すべき仮説の設定及び理論構築に H 寺問をかけた ことによるー 189

190.

また,同意説明・取得も作業時間が比較的作業時間が多かった作業である.本実習では,著者ら自らが 被験者候補に同意説明を行ったが,その作業1 1 寺問は 5 0 1 1 寺問を超過した.実際に同意説明・取得を行うとい う,医薬品・医療機器関連企業の社員が通常は実施し得ない業務を. 1 1 寺聞をかけて経験をすることができ i o S受講生以外の社員もまた,臨 た.また,被験者候補も著者らが所属する企業の社員より募ったため. B 床試験の被験者になるという貴重な経験をすることができた. その他の作業については,いずれも延べ作業時聞は 4 0 1 1 寺間以内であった.これは,グループ内で得手不 得手及び知識・経験を考慮した役割分担を敷き作業毎に担当者を限定したこと,あるいは症例の推移や作 業の進捗において,大掛かりな対処が必要となるような想定外の事態が発生せず,概ね想定していた通り に試験が遂行されたことによる.これらは延べ作業時間よりも,主担当者の作業時間を考えることで,そ の所要時間について推察できる.表 5に示した作業時間の最大値がそれにあたるが,症例検討会を除きい ずれも 1 0時間以上の作業 H 寺間を要した. 4節にも示したが. B i o Sの講義は I演題あたり 3時間であり. I I名だと 1i 寅題あたりの延べI I E 、講時間は 3 3 1 1 寺問となる.延べ作業時間上位 6作業について,その延べ作業時間はいずれも 33時間を大きく上回っ ている.また,延べ作業時間が 4 0 1 1 寺間以内で、あった作業について,主たる作業者の作業時聞は引l 寺聞を大 きく上回っている.総じて,本実習にて座学にて得た知識を実践するのに,座学にかけるそれと同等以上 の時間を要した. 5 . BioS総合実習の個々の作業以外の収穫 本実習にて得られる収穫は,個々の作業の実践によるものだけに留まらない.著者らが実感したものと して,以下の 3つが挙げられる. ① 臨床試験の一連の流れにおける各業務の関連性への理解 ② 難題に直面することによる,問題解決能力の向上 ③ 所属企業等,異なるパックグラウンドを持つ者との協働による,発想・知識・技術の補完 ①について これは,開発コンセプトの考案から総指報告書作成に至るまで,一連の全ての作業を自ら執り行うこと i o S受講生の多くは自社にて統計解析業務に従事している者であり,統計解析業務の必要性・重 による. B 要性については各種ガイドライン・通知,あるし、は自らの業務経験から. B i o S受講前から既にある程度理 解しているところである.しかし,自社における平常業務では,統計解析という「点 Jにて業務にあたる ことが多く,臨床試験の一連の流れという「線」への認識は必ずしも常に持っていないことがある.一連 の流れを「線」として全て自ら執り行うことで,その中で、の統計解析業務の位置づ、け及び必要性・重要性 を再認識できた.更に,統計解析以外の作業を実際に執り行うことにより,その性質・必要性・重要性及 び統計解析との関連を認識することができ,統計解析以外の業務担当者と連携するにあたり留意すべき事 項を認識することができた. ②について 190

191.

BioS受講生の多くは統計解析担当者という立場上,自社において統計解析関連以外の問題の対処にあた る機会は少ないが,本実習では全ての作業について自らが問題発生時の対処にあたった.これにより,統 計解析以外の臨床試験全般の問題発生のパターンについてもその一端を知り,統計解析実施前の段階で対 策を講じられるようになり,臨床試験の一連の流れにおける問題解決能力の向上につながった. ③について 本実習はクマループ内で、所属が同じ者が少なくなるように配慮されており,著者らのクョルーフ。も 2名を除 きそれぞれ異なる企業に勤めており. 1 0社の異なる企業の社員で構成されていた.得手・不得手の相互補 完については既に 2節にて示したが,更にそれぞれの企業にて採用している作法・方法等を持ち寄ること もあり,それらを共有することで、グ舟ループ内で、相互に技術を高め合うことにつながった.また,著者らの グループには,異なる分野から医薬品・医療機器分野への新規参入を果たすことを目的とした受講生も参 加していた.当該受講生にとっては医薬品・医療機器開発の「実地の教育及び経験」を得る機会となり, 一方で医薬品・医療機器分野の受講生は当該分野の慣習や不文律について,その根本的な発想・意義を再 確認するきっかけを得た.この点において,本実習は個人間のみに留まらず,異分野間の技術の高め合い にも寄与すると考えられる. これらの収穫は座学だけでは得られない,実習ならではのものであったと実感している. 6 . おわりに 本稿では,医薬品・医療機器開発に携わる生物統計家育成のための教育カリキュラムの一つで、ある BioS 及びそのカリキュラムの一環である総合実習の概要を紹介し,その利点及び総合実習の作業に要した著者 らの工数を示し r 実地の教育及び経験」及びそれによるスキルの修得について省察した. BioS総合実習にて要する作業期間は,各企業における担当者の教育訓練と比較して遜色なく,平常業務 に換算して考えても長い部類である.また,その作業時間は,講義の~~茸により座学にて知識を習得する のにかける時間を大きくと回る.ガイドライン等の要求を満たす生物統計家の養成は座学のみで完結する ものではなく,そこで得た知識の実践という「実地の教育及び経験」が必要で、ある. BioS総合実習は「模 擬」ではあるものの. 1年間を通して臨床試験の細部にわたり,上述のように充分な時間をかけて取り組む ことができる実践の場を提供しており,生物統計家としての素養の修得に寄与していると考える. また. BioS総合実習では個々の作業の実践によるもの以外の副産物も得られるー臨床試験における全て の作業を自ら執り行うことによる「臨床試験の 速の流れ」の中でのそれぞれの作業への理解,異なる人 材・企業との協働による技術の高め合いなどがある.これらは BioS総合実習のカリキュラム及び運用の特 性によるものであり,通常の座学の研修等では得られない稀有なものであると考える. h ej o bt r a i n i n g等により「実地の教育及び経験 J を積むこ また. BioS総合実習は自らの所属団体にて ont とが難しい人にとって,貴重な「実地」である.このことは,医薬品・医療機器開発における実務者教育 の基盤を持たない新規参入の団体にも「適切な資格と経験のある統計家」の養成を可能とする教育機会を 提供していると考える 以上より. BioS総合実習は受講生のスキル修得に寄与し,更に受講生相互の能力開発や新規参入企業へ の裾野の拡張にも寄与していると考えられる.これにより,広く「実地の教育及び経験を併せ持つ J 生物 191

192.

統計家の養成に寄与し,医薬品・医療機器開発における生物統計家への需要に応えることにつながり,当 該分野の発展に貢献するものと考える. 謝辞 23BioSでは,講師の皆様・ (財)日本科学技術連盟の皆様に大変お世話になりました. ここに御礼申し上げます. 参考文献 川厚生省医薬安全管理局審査管理課 ( 1 9 9 8 ) .臨床試験のための統計的原貝[].医薬審第叩4 7 . [ 2 ) 厚生労働省医薬食品局審査管理課医療機器審査管理室 ( 2 0 0 5 ) .医療機器の製造販売承認申請に際し留意 すべき事項について.薬食機発第 0 2 1 6 0 0 1号. [ 3 ) 奥田英樹,池田敏広,永田均, f H辺大樹,坂井絵理 ( 2 0日). (財)日本科学技術連盟における「臨床試 験セミナ一統計手法専門コース」と SAS教育. SASユーザー総会論文集 2 0日. [ 4 ) 酒井弘憲,佐々木秀雄,大橋清雄 ( 2 0 0 7 ) .(財)日本科学技術連現 医薬品データの統計解析専門コース 総合実習プログラムを通した C l i n i c a lS t a t i s t i c i a n s l C l i n i c a lS c i e n t i s t sの養成.臨床研究・生物統計学研究会 3, 1 , 6 ・1 4 . 誌 ,2 1 9 2

193.

小標本のための 1 0 0重交差検証法のすすめ 新村秀一 成膜大学経済学部 1 0 0C r o s sV a l i d a t i o nf o rS m a l lSample S h u i c h iShinmura Depto fEconomics, S e i k e iU n i v . 要旨 統計は,すっかりデータマイニングから B i gD a t aへ流れが変わった昨今である. しかし,小標本を統 計分析し,現実に応用する重要性は変わっていない.本研究では ,I J、探本の'1' ) 1別分析を { } I Jにして日 i gD a t a 時代の新しい統計分析法を提案する. 筆者は 1 9 9 7年から紋小誤分類数 ( ¥ I i n i m u m可u m b e ro f ~isclassifications ,削M) を求める最適線形判 別関数を研究し, 2 0 1 2年末に考えられる全ての判別分析の問題を解決した.研究に用いたのは, ' 1 0件 か ら2 4 0件の 4種類の実データである このような小標本で,統計学の泰斗の F i s h c r卿が始めた判ルj分 析 に異議をとなえるためには ITff~ もが納得する検託法が必要で、ある そこで B o o t s t r a p法と k重交差検証法 0 0重交差検証法を考えた.これによって, SASや ] ¥ l Pの 解 説 書 [ 2 Jに用し、た「学生の成 を組み合わせた 1 績データ」という Toyデータが立派な研究データとして役に立つ 現実の研究や業務で統計分析したいデータは , I J、標本のことが多い.半J I別 分 析 に 限 ら ず こ の 方 法 を 用 し、れば,新しい統計分析の世界が聞けてくる. キーワード:小標本の統計分析,リサンプリング, 1 0 0重交差検証法 1 . はじめに 1 9 7 1年(こ大学を卒業し,幸いにも大阪府立成人病センターで「心電図の自動診断解析システム」の診 断論理H を判別分析などの統計手法で研究する機会:こ恵まれ,統計が自分の一生を支える学問になった. しかし,多変量解析を勉強し 32伯!の心電図所見を正常所見と 2群判別する研究を行ったが,プロジェク ト・リーダーの野村医師の開発した「フィードバックのかかった枝分かれ論理」にかなわなく,半1 1 別分 析に疑念、を持って一生の研究テーマになった. 1 9 9 7年ーから最小誤分類数 ( ¥ I i n i m u m¥ u m b e r0' 1¥ I i s c l a s s i f i c a t i o n s,M 剛)を求める最適線形判別関数 [ 5 J を研究し, 2 0 1 2年末に考えられる全ての判別分析の問題を解決した.研究に則いたのは, 4 0{ 1 ) こから 2 4 0 件の,1禄類の実データである 判別分析は,重回帰分析と異なり半Ij別係数の 9 5 %信頼区間や変数選択 j 去の a s s if i c a ti o n(分知)手法である.そのために,ーっとっておき法 ( L c a v cO n巴 ない准側統計学と無縁な cl 193

194.

Out, LOO)法が考えられた. しかし,データマインニングで大標木を分析する時代に入り, k重交差検証 法が提案され LOO 法は色あせてしまった. しかし,確率分布に基づく統計研究もやりつくし,その生き づまりを打開するために Bootstrap法が役に立っている.そこで以下のように Bootstrap法と k重 交 差 検証法を組み合わせた 100重交差検証法を提案する. 元データを SAS や ]~IP で 100 回コピーしたデータを作成する.一様乱数を発生し新しい変数とし, 2群 別に並べ替えて,標本数の同じ 1 0 0組の標本を作成する.このため 1 0 0組のクソレープを表す新変数に l から 1 0 0の識別呑号を付加し,この 1 0 0組の標本で 1 0 0重交差検託法を行う.これによって, SASや ]MP の解説書 i こJ I Jし、た「学生の成績データ」という Toyデータが立派な研究データとして役に立つ. I 日リ分析に限らずこの方法を用い 現実の研究や業務で統計分析したいデータは小標本のことが多い.半J れば,新しい統計分析の世界が附けてくる. 2 . 比較する判別関数 2 .1 統 計 的 判 別 関 数 Fisherは半J I 別される 2群の分散比(君主問分散/群内分散)の最大化から式 ( 1 )で示される線形判別関数 ( L DF)を提案した.これは制約式なしの非線形計画法になるが,式 ( 2 )のように分母を定数に置き換え て制約に取り込むことで, 2次計画法 (Quaclratic Programming, Qp)で解くことができる. m N b' ( xm xm ) ' b/b' 1‑xm 2) ( 1‑x2 二 阻 あるいは, MIN=b' ( xロl ‑ X m 2 ) ( Xm ' b; 1‑Xm 2) Eb ; b ' Eb=1; ( 1 ) ( 2 ) その後, 2群が Fisherの似説を満たせば,分散比最大化基準による LDFが,容易に 2群を表す正規分 布 N(m1 ,E 1 )と N( m 2 'E2 )の対数尤度比で式 ( 3 )のように定式化されることが分かった.この式の利点は, 分散共分散行亨I J Eから直接 LDFの計算式が定式化されることで,統計ソフトに取り入れられその後の分 散共分散行列による判別関数が広く普及した原因と考えられる.判別関数の評価には LOO法がある.ま た判別される 2群に 1 / ‑ 1のダミ一変数を与えて形式的に重回帰分析として変数選択法などの検定統計散 が利用できる. 十m) LDF:f( x )ニ { x一( m1 1( m1 ‑m2 ) 2/2)' E‑ ( 3 ) 21 干の分散共分散行列が等しくない場合は,式 ( 4 )の 2次判日J I関数 (QDF) が定式化される. f(x)=x' (E2‑1‑ E1‑1) x/2+(m1 ' El‑1‑rn2E2‑1)x+c ( 4 ) また式 ( 5 )のマハラノピスの汎距離を用いて,多群判別や品質管理の¥lT理論に応用されている. D二 SQRT ( ( x ‑ r n ) ' E 1 (x‑m)) ( 5 ) 分散共分散行列の逆行列を計算するだけで LDFや QDFや多群半J I 別が定式化されて現論展開しやすいが, 重回帰分析と異なり推測統計学的知見が得られないため,今日では役目を終えた LOO法で学習データと 検証データによる評価が必要であった. さらに分散共分散に基づく判別分析には重大な問題がある.そ れは分散共分散の逆行列を計算する必要があり,ある説明変数が一定値をとる場合はランク落ちして判 数が求まらないので,次のように分類して考える必要があるー 別院j 1 ) 2群のある説明変数が同じ値である場合は,判別に役立たない変数であり, LDFも QDFもこの変数を 分析から省くことは正しい. 2 ) 2群の説明変数がそれぞれ別の一定値をとる場合,この変数だけで判別できる.しかし LDFの 誤 分 類 数は必ずしも 0にならず, QDFはランク落ちして計算できない. 194

195.
[beta]
3
) 2群の一方が一定値をとり,他方がぱらつく場合は, 2
)に次いで判別に重要な変数である. LDFは計

算でき, QDFはランク落ちする.
これらに対して, SPSSは 1)2)3)に対応する変数をすべて分析から除外し, ]¥IPは 3)に対して QDFは正
しく対応していないので,利用に際して注意する必要がある.この混乱は

r
昨に属するデータは必ずぱ

らつき分散が 0である場合を想定していなしリことが原 I
t
lである.
式 (6)のロジスティック回婦は, LDFや QDFより誤分類数が少ないことが経験的に知られているので,
医学や経済の分野で利用されているーまた,一部の例外を除いて ¥
1刈 =0のデータを認識できる.
(
6
)

P=I/(I+cxp(‑bo‑bIXI"'‑bkXk))
2.2 数理計画法による線形判別関数

数理計画法を用いた判別分析として, SVMと筆者が開発した ¥
I
'
u
lを求める改定 IP‑OLDFを取り上げる.
(
1
) S‑SVM

式(
7
)のハード・ 7 ージン最大化 SVM(H‑SV¥I)は,線形分離可能なデータの判別を明確に示した点が重要
である.統計的判別研究で、は,線形分!月If可能という専門用語がないことが示すように,この判別は容易
であり重要と考えてこなかった. ¥
I
N
¥
I という筆者が提案した用語で初めて ¥
I
N
¥
I
=
O と線形分離可能が同意
義になるー
¥
I
I
N

三 ,

bI
i
e/2;

y;*(
xi' b+bo
)>=1

(
7
)

;

¥
1
1
¥ = ,b ie/2+c工e,
; y;*(xj' b+b,
)
>
二 l‑c, ;

(
8
)

し方、し,現実のデータはI,IN¥I=Oであることはまれである.その場合,幾つかのケースが SVの反対側に
く る 事 を 認 め , そ の 距 離 の 和 (L
:();)を最小化する.そして式 (
8
)のように,目的関数でマージン最大化

1
手ぶ重みで、単目的化して最小化する.
とL:C;の最ノト化という 2つの異なった最適化基準をペナルティ cと1
問題は最適化手法を使っていながら

c の決定が恋意的判断にゆだねられる点である.また ¥
l
N
¥
I
=
O のデ

ータに関して実際にその問題を取り上げていないことである
(
2
)整数計画法による附1M基準による最適線形判別関数
¥
I
N
¥
I基準による最適線形判別関数は,確率分布に基づく統計アプローチでは不可能で整数計画法(IP
)

で初めて定式化できる.
X
)= bo+bl*xl
+…+bp*xpの定数項が bo*O であれば, boで '
,
1
;1っても判月J
I規則 l
は影響を受
線形判別関数 f(
+…+bp*xp
+1 と考えることができる.そして式 (
9
) のように定式
けず定数項を l に固定でき f(x)=bl*xl

化したものが IP‑OLDFである

Ciは 0
/1 の笠数変数である. y,
*
f(x;)>
士 Oで あ れ ば e; =0で
,

y
;*
f(x;)< 0

であれば e
; =1 として y
;*
f(x;)>二 l という制約式が選択される. L
I的│長l
数はこの巴:の個数を最小化し
x
;
)ニOになるケースを厄しく扱っていなし、(判別分析の未解決問題).このためデータが一般
ているが, f(
位置にある場合は正しい ¥
I
N
¥
Iを求めるが,一般位置にない場合法正しい ¥
I
N
¥
1を求めないことがある.
¥
I
I
N二
工e
;
;

y;*(xj
' b+l)>二 ej ;

(
9
)

そこで正しく ¥
1
:
;
¥
1を 求 め る 式 (1
0
) の改定 IP‑OLDFを定式化した. boは線形判男J
I関数の定数項で,正
I別超平山の代わりに SVで判別す
にも負にも Oにもなる自由変数 2であり, ;b'辺の定数項に lを加えて半J
;*
f(x;)>=1 であればケース Xiは e
;二
O
ることにした. \1 は Big\l 定数と I~子ぶ大きな iE の整数値で・あり, y

として SVで正しく判別され, SVで判別されなし、 xiは e,=1 として y,
*
f(x;)>=卜 ¥
1 という制約式を選ぶ.

Iy;
f>Oであれば i
Eしく判別され,

yjfく0であれば誤判別される.

2 数理計画法では一般的に変数を非負と考え,その市I
1約のないものを自由変数と使い分ける.

195

196.
[beta]
目的関数は S
Vで半!j別されないケース数の和 0
:
:巴,)を最ノj
、化しているので, f
(
x
)=0になるケースがな
い場合のみ ¥
I
N
Mに等しくなる.ト 1
0
0
0
0のような大きな正の値を用いれば,

Y
i吋 (x)

二

9
9
9
9 という s
vの代わりになる超平面に引きずられ,

一

s
vで判別されないケースは

l<yi
*
f(
x,
)<1 の範囲にケースがな

いことを期待している.

¥
l
IN
=L
:ei
; Y
i
*
(
Xi
'b
+
bo)
)
=
I
‑¥
1
*巴 ;

(
1
0
)

PO
L
D
Fであり, L
Pで定式化できる. y
i*f(x))
=
1 であればケース
e を非負の実数にしたものが改定 L

xi
vで正しく判別されるが,それ以外の判別スコア f(x)は eが非負の実数であるために y
i*f(
x
)<
はs
j

P
L
PO
L
D
Fは
, M
N
Mの近
lであり判別超平面 f(x) Oにケースが来ることを避けることができない.改定 I
二

似値を高速で ~Iとめる線形判別関数である.l 段階で改定 LP-OLDF を適用し,

ei=Oになるケースを第 2

段階で正しく判別されたものとして 0に固定する.そして第 2段階でそれ以外のケースで改定 I
PO
L
D
F
を実行するー第 2段階で分析するケース数が少なくなる分,計算時間が短縮される.
これまでの判別関数は判別超平面上のケースを群 lと群 2のいずれに判別するかは未解決であった.

(
x
)が例えば I
f
(x
,)三 1
0
'9になり, 0と判定されるケースがなければ問題がな
少なくとも線形判別院]数 f
いが,ケースがあれば最大それだけ誤分類数は増えると考えるべきである.

3
. 試験の合否判定
2
0
1
0年から筆者は l年次必修の「統計入門(受講生は 1
2
0人から 1
4
0人程度)J を担当している.0t1
0
0問のマークセンス試験を行っている.授業で教えた内容を全て出題し,試
間試験と期末試験を 1
M
Pのグラフの解釈に用いるデータは毎回変えている.
験内容は同じであるが,計算に用いるデータと J
0
0聞を 4個の大聞に分けて,得点分布の 1
0
%,5
0
,
弘 9
0犯で, 3年間 6回
大学入試センタ一試験に習い, 1
Dの一環として行ってきた.試験の合否判定は,自明な線形分離可能なデータであ
の試験の統計分析を F
り誰もがすぐに手に入る良質な研究データである. 1
¥
N
¥
1
=
0のデータの判別分析の問題点を研究するのに

8個の合否判定で判別関数の評価検討を行う.
適している.本研究では,この 1

3
.1 統計入門の概要
授業は統計の入門科目として基本統計量,相関,単回帰,分割表を中心に教えている.テキストは [
4
J
を用い, (
xy
) =(
01
), (
11
), (
13
), (
23
)という 2変数叫件の簡単なデータで上記の統計量を説明
している.その後で 4
0件の「学生の成績データ」を用いて, HPの出力結果を用いて統計量の意味を説

xce1で相関係数と回帰分析
明している.ただし相関と単回帰分析では手計算で統計量を説明した後, E

n
s
c
o
m
b巴のデータを用いた宿題を課している
を計算する汎用シートの作成法を教え, A

分割表は手計算

の後,通常の独立性の検定に加えて, F
i
s
h
e
rの直接確率による p伎の計算方法も説明している.推測統
計学は高校数学でも教えられているが,文科系の学生に教えることは難しいと考えている統計の教員が
多い. F
i
s
h
e
rの直接確率は,唯一推測統計学の考え方を具体的に教えることができるので,入門科目と
して取り入れる内容であると考える. 2
0
1
1年は電力削減のため, 5週目に 1
1週に半減された. 1
0
0聞の

lは「基礎統計量の概念 JT
2の「統計
設問をセンタ一試験に習って大間 4問に分けた.中間試験の T
1
j
:の整数値から偏差,偏差平方和,分散,標準偏差などを計算させているが多くの学生
量の筆算」は,1{

がi
F.解する設問である. T3I
j
F規分布 J に関する設聞は,

zスコアが負の問題をだしているため

3

年間の分析で新入生にとって難しい設問である. T
4I
J
M
Pのグラフの解釈」である.

3年間の成績は,中間試験の 1
0
九点が 4
84
23
7点と 2
0
1
0年から 2
0
1
2年にかけて減少している. 5
0
%

1
9
6

197.

点は 66, 6 1, 6 3点 , 90%点 は 93,88, 88点であり, 1 0 犯と異なり経年的な下げ幅が小さくなっている. 期末試験の 1 0 弘点は 40,43,4 1点 , 50%点は 60,60,58) ; . ; . , 90弘点は 9 1,99,95点である.期末試験は, 中間試験で「授業で習った内容が全てでるなどの傾向が分かり,勉強法が分かつた」ため経年的な下げ 出水準のように大きくなっていると考えられる. 幅が小さくなるか 90 3.2 大問の合否判定 10 択 100 聞の正解/不正解を 1/0 の説明変数とした小間による合否判定と,大間 4 問の科 l?~ を説明変 数とする合否半J I 定を,得点分布の 1 0九 点 , 50目 点 , 90百点を合格最低 l\~ として合符判定を行う.改定 IP一OLDF と S‑SVMを LINGO [ 4,6 Jで , LDF, QDF,ロジスティック回帰を JMP[ 1 ‑ 3 Jで分析した. 土 , 1 0 九点の大問 4聞の合否判定の誤分類数である. i pJ ~IJ は,変数増加 I去で選ばれた説明変数の 表 1I 個数を示す. 2 列目の r V ar .J ~IJ は変数増加法で選ばれた説明変数を表す. ¥ I N ¥ I は改定 IP‑OLDF, Logi はロジスティック回帰, S V ¥ Iはペナルティ Cを lとした S‑S¥ I¥ I, pLDf o ' と pQDfo'は事前硲率を I I I現確率に 比例させた誤分煩数である.ただし以下では p の表記は省く. 表 1 1 0目点の合否判定(上段から下段は 2010年ヵ、ら 2012年,表の左は中間で右は期末) V a l ¥ 1 ¥¥ 1 T 1 6 2 T 2 2 3 T I P 13 。 L o g i 9 日V ¥ I 8 3 6 6 。 ヲ { 3 。 。 5 ¥ ' ¥ 1 p Q J Jド . l Jl pl 3 V a r ¥ 1 ¥1 ¥ T 2 9 1 7 9 / 1 1 2 。 。 。 9 s H 2 T,I 3 T I 。 T : l o V~l r n 2 T 2 3 T I T3 ¥ 1 ¥1 ¥ 。 。 。 I .o g i 1 / 1 L o g i 5 ¥ ' ¥ 1 8 p Ll J ド 日 2 T 3 . 10日i S ¥ ' ¥ I pl . l Jl p Q1 l1 、 1 0 2 7 1 2 1 3 1 3 i : 7 9 8 1 0 8 7 4 。 6 。 。 。 V a r ¥ 1 ¥ ¥ 1 1 2 T I 8 2 8 1 2 t T 4 t 6 s 6 13 2 。 4 。 3 T 2 pQDF 6 。 。 日 t T I r l p Q DJ ' 1 ' 1 . 0 ド ¥ 1 ¥ ¥ 1 i l 。 L o g i 。 5 ¥ ' ¥ 1 5 ¥ ' . ¥ 1 ¥ 1 ¥1 ¥ T I G 1 3 1 0 r l 3 1 0 日 T : l 2 t 1 T 2 。 L o g i 。 。 p Q Dド ロ 】 。 。 ¥ ' ; : 1 1 ・ pl . l J ド 2 p LI l ド 5 pQDF 8 1 0 9 G t 3 2010年度の中間試験は大間 4問で改定 IP‑OLDFとロジスティック回 I h f ;と S‑SI 'I ¥は合否判定できたが, LDFと QDfo'は訟分類数が 3と 2であり合否判定できなかった. 2 011年度は正規分布 ( T 3 ) が成績不振者 りで改定 IP‑OLDfo'とロジスティック回帰は合否判定できたが, S‑SI 'I ¥ 3と LDF と QDF には不要であり, 31 は誤分類数が!と 7 と 6であり合存判定できなかった. S‑SV ¥Iは他の結果でも見るように,合否判定で きる場合とできない場合がある. 2012年度はさらにTlも不要であり,改定 IP‑OしDF とロジスティック 回帰は大間 2問で合斉判定できた.このように改定 IP‑OLDfo'とロジスティック回帰の合否判定で大同が 要らないのは, 2 0 1 1 年と 2012年の 1 0 , 弘 2010年と 2011年の 90%の中間試験だけである.期末試験は 3 年間の 3水準全てで 4問が合奇に使われ, 50%では中間と期末の令一てで大聞が合否判定に利用されている のは,合格と不合格の学生の E答ノぞターンが多様化してくるためと考えられる. 32 011年 の 9 / 1と 1 / 1の 1は 判 別 超 平 副 上 に l個 の ケ ー ス が あ る こ と を 示 す . 197

198.

表 2は表 lの誤分類数を受講者数で割って誤分類確率にしている.LDFの誤分類確率(出)の範囲は [ 2 . 3, 1 6 . 7 Jである. QDFは [ 0 . 8, 1 0 . 8 Jと LDFより良い. LDFと QDFの 1 0 丸点では [ 4 . 2, 11 .9 Jと [ 0 . 8, 8 . 5 J, 5 0九点では [ 2 . 3, 4 . 9 Jと [ 2 . 3, 5 .o J, 90 百点では [ 3 . 3, 1 6 . 7 Jと [ 4 . 5, 1 0 . 8 Jである.やはり 50 弘点が一番 少ない.この結果をどう評価するかであるが,少なくとも医学診断やパターン認識の研究では LDFと QDF は,自明な~!;-.J~1=0 が認識できないので利用すべきでない. 表 2 LDFと QDFの大間 4問 の 誤 分 類 確 率 中 ! 日J5 0覧 中I H ]1 0弛 期末 1 0 首 0 % 中間 9 Q D F L D F Q D F 4 . 2 1 .7 3 . 3 4 . 2 6 . 7 1 1 .9 2 . 9 2 . 9 7 . 1 8 .7 6 . 3 2 .3 . ID F Q D F L D F Q D F L D F Q D F 2 0 1 0 7 . 5 1 .7 2 . 5 5 .0 1 6 . 7 9 . 2 2 0 1 1 7 . 0 8 . 5 2 . 3 2 . 3 1 0 . 5 2 0 1 2 9 . 9 0 . 8 4 . 9 4 . 8 1 3 . 6 期末 9 0 覧 期末 5 0 首 L D F . lD F Q D F 3 . 3 1 0 . 8 3 .6 3 . 6 8 . 6 2 .3 1 3 . 0 ' 1 .5 3.3 小 問 1 0 0聞 の 合 否 判 定 表 3(土,ノト問 100 個を説明変数とした合否判定である.各年度の上段は最初に ~!\~1=0 になった次元で, 2010年 度 の 中 聞 は 改 定 IP‑OLDFとロジスティック回帰は 6変 数 で 合 否 判 定 で き た . 下 段 は フ ル モ デ ル の 誤分類数で, 1 聞が全員正解のため 96 変数がフルモデルになる Logi は】lN~l=O の場合に多くの場合で 0 になるが, 90%の 3個でできなかった. LDFと QDFは 合 否 判 定 で き な か っ た . フ ル モ デ ル で は LDFは 合 否 0%点 で は 2010午の中間と 2 0 1 1年 の 期 末 以 外 の 4個 , 5 0覧点では 2010年 の 期 末 の l 判定でき, QDFは 1 個 , 90% 点 で は 5個 の 合 否 判 定 で , 合 格 群 が す べ て 不 合 格 群 に 誤 判 別 さ れ る と い う 異 常 状 態 に な っ た . 0 , 免 50%は省略, 90 出 ) 表 3 小門の合否判定(表の左から順に 1 P 6 96 中 1 2 間 98 6 1 0 0 1 2 9 9 期 8 末 9 7 1 0 9 7 MNM 。 。 。 。 。 。 。 。 。 。 。 。 L o g i LDF QDF P 2 l 1 3 1 0 9 96 1 0 7 9 1 0 7 9 8 1 1 4 1 5 1 1 4 1 0 0 1 1 1 1 1 1 1 1 9 9 4 8 1 1 0 9 7 1 1 5 9 1 1 5 9 7 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 2 7 5 4 3 M剛 。 。 。 。 。 。 。 。 。 。 。 。 Logi LDF QDF 4 1 3 。 。 。 。 。 。 。 。 。 。 。 。 。 。 6 1 1 1 3 9 9 1 2 1 2 6 1 3 4 1 3 2 1 2 6 1 2 1 2 1 2 表 4! 土 , 2 012年 度 の 中 間 試 験 の 小 間 の 合 否 判 定 で あ る . 合 否 判 定 で き る 最 小 次 元 は , 全 て の 説 明 変 数 0見 の組み合わせモテールで、検討していないので,ここで得られたものより少なくなることがある.一応, 1 9変数, 9 0見点では 1 5変数で J f : U ! = Oで あ り , ロ ジ ス テ ィ ッ ク 回 帰 で も 誤 分 類 以では 6変数, 50%点 で は 1 DFと QDFは こ の 次 元 で 誤 分 類 数 は 0でない.さらに Q l l Fは , 1 0弘点で 2変 数 ( X 8 5,X1 5 ) 数が 0になった. L の合奇判定で誤分類数が 1 1 4人 (=114/121*100=91 覧 ) , 50% 点の合否判定で 2 1変 数 の 合 存 判 定 で 6 7人 ( 5 5弘 ) , 90目点では l変 数 ( X 9 2 ) の合否判定で 1 2人 ( 1 0出)の合協群の全てが不合情群に誤判別された. 198

199.

表1 ( 2012年 度 の 中 間 試 験 の 判 別 結 果 ( 左 は 1 0見点,右は 90%点) VAR x85 ¥ 1l ¥M Logi 1 0 6 LDF VAR QDF 1 4 1 ‑ 1 1 4 6 6 3 Logi LDF QDF x92 1 2 34 1 2 1 2 1 1 ‑ 1 x42 8 34 8 1 2 1 1 1, x65 7 3 1 2 1 1 ' ] xl00 3 3 1 2 lJ r l x83 3 3 1 2 2 x15 5 x7 6 x32 7 x20 1 / ] x98 111 x l 1 5 x5 114 x62 。 。 。 。 。 。 ¥ 1¥ 1¥ 1 。 。 1 2 1 2 1 )で 2.!l干の分散文一分散の逆行列の計算が式中に含まれてい QDFが合格昨全てを誤判別する理由は,式 ( るためである J ¥ lPで は 分 散 共 分 散 行 列 が ラ ン ク 落 ち し て も 対 角 要 素 を 修 正 し 外 れ 値 な ど の ダ ー テ ィ な データの半J I別に対応している.しカ、し, 1 0%水 準 の 合 否 判 定 で は 不 合 格 群 が 全 て 不 正 解 で 0点をとり,合 格群が正解と不正解をとるような状況を必定していなカミったためであることが分った.これは統計の常 識として「データはぱらつくもの」という n~ 識があるためである. これを説明するために, LDFと QDFと 21 洋の平均の煮の検定で説明する̲ 2r,'(:のある変数が同じ一定値 o が異なった一定1 可 方の l i 4 1 ! (を と る 場 合 , こ の 変 数 をとる場合,統計ソフトはこの変数を分析から行く̲ r 1¥ 1¥ 1 = 0 になる̲ QDFや平均の差の検定は計算しない.今回の問題は,一方の群が一定値をとり, だけで ¥ 他群がぱらつく場合を J ¥ I P は想定していなかったように考える̲ LDF と平均の差は計算できるが, QDF は定式化どおりであれば計算できない. しかし,ダーティーなデータの判別にも対応するため, 2 群の 分散共分散行列の対角要素などを全体の分散共分散行列を;参考にして修正しているものと思われる.ま た正則l 化法でもこのデータを正しく半J I別できなカ、った. この問題の解決は,一定 1 症に¥1( 0,1 0 ‑0) ぐらいの小さなばらつきを与えるだけで解消できる̲ 1 0 丸長の X15でこれを試みると, QDFの誤分類数は, 1 4→ 28→ 28→ 28→ 9→ 3→ 0に な る . ま た , マ ハ ラ ノ ビ ス の 汎 距離を使う m押.論で基)夜空間のある変数の分散が 0の場合は,それが判別に役立つか否かは別途検討す る必要がある.また伝統的な統計の考え方に従えば, LDF, QDF,ロジスティック回帰は 2群 が 等 確 率 を デ フォルトとすることは j ]ミしいが,出現頻度に比例させた方が一般的:こ誤分類確率は少ない.また異なっ た出現頻度のデータを集めたことには意味があるので,こちらをデフォルトにすべきであろう.また判 別分析は,最終的に誤分 m数で評価されるので,半JI別結果の分実JI表にどの判刀IJ境 界 を 選 ん だ の か 表 示 し ないと分析結果の解釈に悦乱を坐む可能性が高い. 4 .2 0 1 2年の中間試験の 1 0 0重交差検証法による検討 2012年 J . %の中間試験を冗データとして,合格群と不合格君、(に 1/ー lの ダ ミ 一 変 数 を 目 的 変 数 と し て 重 回帰分析を行い,変数選択の検定統計量と比較する判日J I関数の誤分類数を,1 1 ‑算し,モデルの選択を行う. そして,このデータを疑似母集団とした復元掛けれで 100組 の 標 本 を 作 成 し 100重 交 差 検 証 法 を 行 う . 検 ~iE t~ 木で平均誤分類確率最小のモデルとえデータで検討した結果を比較する.また,各判別関数ので一均 ;呉分 J f ! i 確 率 か ら 改 定 lP‑OLDFのそれをつ│し、て,改定 lP‑OLDFの優れていることを示す. ( 1 )大 間 の 分 析 (10潟水準) 表 5は 10%水市の 2変 数 以 kの大間の合否判定結果である̲ AICと BICは 2変 数 (T2,T1)を, Cp統計 199

200.

量は 3変数(Tl, T 2,T 4 ) を選ぶ LOO主 ' IJは 3番と 5番のモデルが 11 と一番少ないので,このモデ ルを選 ¥ I Pの 1 1 と異なっている. \IN~I は 2 変数 (T2 , T 4 )で 0 ぶ. 10番目のモデルの 15は SPSSの誤分類数で ] であり,この 2変数を含む(Tl, T2,T4) , ( T 2一 T 4 ) , (Tl -T4) も ~IN\1 の単調減少性から Wi\I=O になる. 2 変数 ( T 2,T4)でロジスティック回帰, S‑SV¥1 (C=10000を SV¥14 と表記)も誤分類数は 0になるが, ¥IN¥I=O の 4モデ、ルで, LDFの誤分類数は 11 と 12, QDFは1, 8, 5,9であり,問題点がより明確になった. 表 5 10覧水準の元データの分析結果 (SV~14 は C=10000 を表す) LDF QDF Logi MNM SVM4 5 。 。 。 。 。 。 。 。 。 1 4 12 1 3.2 1 3 1 2 8 162.3 3.3 1 1 1 1 160.0 173.6 14.7 1 5 15 6 2 2 3 3 163.8 177.3 18.7 1 6 1 6 9 6 4 6 1 .5 1 1 1 1 9 。 。 。 T 2, T4 2 146.7 157.7 T1 , T4 2 1 5 8 .1 169.0 13.0 1 6 16 9 6 3 6 T4 T 3, 2 161 .1 1 7 2 .1 16.2 1 4 1 3 8 3 3 4 18.9 1 8 1 7 1 5 1 2 7 7 モデル p T 1‑T 4 4 150.6 166.8 5.0 T1 , T 2, T4 3 148.6 162.2 T 2‑T 4 3 148.7 T1 , T 3, T4 3 T 1‑T 3 Cp BIC AIC LOO T1 , T2 2 163.6 174.6 T 2, T3 2 1 6 8 .1 179.0 24.0 1 6,1 5 1 1 1 4 1 1 6 1 1 , T3 T1 2 178.2 1 8 9 .1 3 6 .0 22 2 1 1 6 1 5 7 1 0 表 6は 100重交差検証法の結果である.元のデータで‑モデ、ル 1,2,3,6が ¥ I N ¥ I = Oになった.改定 IP‑OLDF は 4個のモデルの学習データで M洲 =0であるが,検証データではモデ.ル 2 と 6だけが 0になった. SV¥ l 1 はモデル lの平均誤分類確率が 3 .22%と最小である. SV¥ l l(C=I)は 11 個すべてのモデ、/レで、モテツレ l と同 じ結果になり不合格群が全て誤判別された.表 5で SV¥1lの結果は省いているが SV¥14 と比べ問題なかっ たが, 100重交差検証法で C が小さいと SVMが役に立たないことが明らかになった. LDFは 6番目のモ デル,ロジスティック回帰は l番目のモデルの平均誤分類確率が最ノl 、である.すなわち ¥ I N ¥ I = Oになるモ デル 1, 2, 3, 6 のいずれかが最良モデ、ルとして選ばれた. SV¥14 の改定 IP‑OLDFの学科と検証データの 平均誤分類確率の差の範囲は, [ l .15,5.56Jと [0.83,4.05Jである. LDF は [7.98,11 .34Jと [6.23,10.55J であり 6 .2時以上 ¥ I N ¥ 1より悪い.ロジスティック回帰は [ 0, 3.14Jと [0.39,1 .62Jであるが,学科データで 誤分類数は 0であるが,検証データでは最大 1.62%だけ誤判別された. 表 6 100重交差検証法の結果 (2! > i J Iから 4手I J!土学習, 5! > i J Iから 7! > i J Iは評価,差は 7! > i J Iと 4! > i J Iの差, 9手 J Iは 4! > i J Iの平均誤分類確率と刻応する ¥ I N ¥ I との差, ¥ 1 ¥ ; ¥ 1 ¥ I I N 2 4 ¥ I A X ¥ I E M I ¥ I I ¥ 10列ば検証データの差,モデル 7以下は省く) ¥ I A X ¥ I E A ¥ Z さエ 立 ニ 0.00 0.00 0.00 0.00 1 .6 1 0.07 0.00 0.00 0.00 0.00 。 o .07 0.00 .00 0.00 3 。 .00 0.00 o .00 0.00 2.42 0.03 0.03 4 0.00 2.42 o .79 1 .6 1 1 . 8 ' 1 2.44 1 .65 5 0.00 5.65 2 .25 3 .23 8.06 4.64 2 .39 6 o .00 o .00 0.00 0.00 O .00 0.00 0.00 LOO法 は SPSSで計算した. 200

201.

5 V . ¥ I 4 . ¥ 1 1 ¥ . ¥ I Ei ¥ i ' ¥ . ¥ I A X ¥ I I N ¥ I A X . ¥ I E A N 日E A可 差 . ¥ I A X 1 .6 1 9.68 3 .1 9 1 .6 1 7.26 3 .2 2 0.02 3.19 3 .1 5 2 2.42 8 .06 ' 1 .80 1 2 2 ., 7.26 4 .27 4.80 4.27 3 1 .6 1 8.06 3 .1 0 1 .6 1 8.06 3 .26 3.10 3 .23 4 1 .6 1 8.87 3 .9 4 2.42 7.26 4.20 o .52 o .16 o .26 3 .1 5 1 .76 。 5 .65 9.68 7 . 8 1 6.45 9.68 7.73 0.08 5 .56 3 .0 9 6 2.42 8.06 ' 1 .40 2.42 I.26 4.05 o .35 4.40 4.05 . ¥ I Ii ¥ 5 V . ¥ I I . ¥ I EI I 1 、 ; ¥ I A X 8.06 8 .06 . ¥ 1 1可l 8 .0 6 . ¥ I A X 8.06 . ¥ I E A N 8.06 . ¥ 1¥ iX 1.03 1 6 .1 3 9.6/ 1 6.40 12.82 1 0 . 5 4 2 4.03 16.94 9 .8 9 8.01 12.82 3 ' 1 .03 1 6 .1 3 9 .. 1 8 8.00 ' 1 .84 17.74 .'H 11 : J 5 .65 2 0 .1 6 6 . 103 li.74 . ¥ 1 1 ¥ . ¥ I A X L o g i . ¥ I E M ¥ . ¥ I lN ¥ I A X o .00 8.06 . ¥ 1 1 ¥ LDF . ¥ I E A N . ¥ I E A ¥ 差 . ¥ I A X 8 .06 MEI ¥ ' ‑ i 差平均 7.99 . ¥ I A X 9.64 1 0 ., 1 7 10.55 o .90 o .66 9.89 10.55 13.60 10.09 0.61 9 .48 10.06 7.96 16.84 12.04 10.65 9.60 12.36 9.62 15.19 12.68 o .60 o .32 1 0 .1 1 8 .0 5 日. 54 8.00 13.60 9.91 0.37 9.54 9 . 9 1 ¥ ¥ . ¥ I EI . ¥ I l ¥ ¥ I E凡N 日^ X 差平均 . ¥ I A X ~IEA\ 0.00 0.00 。 .00 0.00 1 . 8' 1 O .i 7 O .7 7 O .0 0 O .7 0 2 0.00 0.00 0.00 0.00 3 .23 1 .09 L0 9 O .00 1 .09 3 0.00 0.00 O .0 0 0.00 ' 1 .84 O .8 5 O .8 5 0.00 0 . 8 1 4 0.00 5.65 1 .59 l .6 0 4.84 2 .83 l .2 4 0.80 O .3 9 l .3 4 1 .87 0.82 0.91 0.00 0 . 9 1 b 0.00 .29 Il ' 1 .1 2 3 .2 2 8.03 1 6 5 ., 6 0.00 O .0 0 O .00 0.00 ー 1 .84 0.91 ( 2 ) 小 間 の 分 析 (10潟水準) 表 7は ノj 、聞の合否判定で,変数地 J J I l 法 で 7変数モデ、ルを選んだ. AICと BICと Cp統 計 量 は 7変 数 を 選 んだ. LOO法は 6 と 7変数を選んだ. ~I\\I は[)変数と 7 変数で ~I刈二O になるー LDF ,ロジスティック回帰, S V ¥ 1 4 も誤分類数は 0になるが, QDFは Xl5が 2変数日にモデ ルに取り込まれると合格群の 114名 全 員 が l ' (の Xl5が 全 員 不 正 解 で 0 という一定値をとることで、起きるこ 不合陥併に;呉判別された.これは不合格 j 0,1 0 .5)の よ う な 小 さ な ば ら つ き を 加 え て や る と 修 正 欄 で 示 す 訟 分 類 数 とが分かつた.そこで X15 Oに'J( 二 になった. ^ I N ¥ Iに比べて QDF以外の 1 3 i分 類 数 は 最 大 4個増えるだけである. 表 7 10%水 準 の 元 デ ー タ の 分 析 結 呆 モデル p x 8 5 L D F Q D F L o g i M州 S V M 4 AIC B I C C p 1 6 9 . 3 1 7 7 . 5 9 4 . 5 1 4 1 4 1 4 1 4 1 4 1 0 6 L O O 修正 x l 5 2 1 5 3 . 5 1 6 4 . 5 6 7 . 7 1 4 1 4, 6 1 1 4 2 8 6 x 6 8 3 1 3 8 . 9 1 5 2 . 5 4 6 .1 8 8 1 1 4 2 8 6 x 4 7 1 3 0 . 3 1 4 6 . 5 3 4 . 6 8 1 1, 1 1 4 2 8 x 7 1 2 0 . 4 1 3 9 . 2 2 2 . 8 4 9, 1 1 4 9 x 3 2 1 1 2 . 3 1 3 3 . 6 1 3 . 9 ~ 1 1 4 201 1 0 3

202.

X20 ¥ 山 1 130.2 ! ! . : . . Q¥ U 0 1 1 4 0 0¥ 0 0 1 0 0重交差検証法の結果は,改定 IP‑OLDFは線形分離可能な 6と 7変数モデルの学習と検証データで 削 除 0である.ロジスティック回帰は学習データの 2個のモデルで誤分類数は 0であるが,検証データ では 0でなくモデル 6が最ノトになった SVM4と LDFはモデル 7の平均誤分類確率が最小値である. SVM4の改定 IP‑OLDFとの差は, [ ‑ 0 .1 7,1 .0 4 Jと [ ー0 . 3 5,2 . 0 4 Jである.学習データで, ¥ I N ¥ 1は理論的な 下限であり,負になるのは判別超平面上にケースがあるためである. L DF は[1.8 4,6 . 6 1 Jと [ 2 . 6 3,7 .2 9 J で,ロジスティック回帰は[一 0 . 5 2,o Jと [ ‑ 0 . 5 0,1 .1 2 Jで あ る . ど の 判 別 関 数 も 検 証 デ ー タ で 元 デ ー タ で 削 除 Oであったモデル 6か 7を選んでいる.しかし ¥ I N ¥ 1との差は S V ¥ 1 4ではモデル lから 4の変数選択で 選ばれないモデルで最大 0.32%だけ S V ¥ 1 4がよい.変数選択で選ばれるモデル 6と 7は O .68%から O .68% 悪い. L DFは全てのモテールで改定 IP‑OLDFより 2 . 1 3目以上悪い.ロジスティック回帰は,モデル lから 6 までで S VM4の方が O .0開から O .5 弘良く,モデル 7で O .1 5偽悪い. 5 . まとめ(新しい統計解析のすすめ) 1 2 0人前後の試験の合否判定で, LDFや QDFは合否判定できないことを示した.そして分散共分散行手J I に基づく判別関数は,群に含まれるある変数の値が 定値をとる場合,統計ソフトは正しく対応してい ないので注意することが分かった. 多くの統計ユーザーは大標本の統計分析をしたいわけではない.このとき,分析結果の妥当性の検証 ASや J ¥ I Pで分析したいデータを疑似母集団として復元抽出を簡単に行い, に行き詰る.そこで S リサン プリング標本から分析したいデータと同じ 1 0 0組の標本を簡単に作成する方法を考えた.そしてこれを 用いて 1 0 0重交差検証法を行うことで,より深い分析が行える.例えば, S ‑ S V ¥ 1で一般的にペナルテイむ = 1のような値が用いられている. しかし元データでは尤も の最良な決定方法が検討されていないので C らしい結果が出たが, 1 0 0 重交差検証法では教師データと検証データで全く利用できないことが分かつ た.また,改定 I P‑OLDFという新しい方法を,平均誤分類確率で LDFとロジスティック回帰と S ‑ S V ¥ 1で 比較し,明確に既存の判別手法の平均誤分類確率が検証データでも悪いことが分かった. SV~1 の研究者は, L OO法で モデルの検証を行っている例が多い.しかし, L OO法と 1 0 0重交差検証法の 結果をみれば LOO法が劣っていることは一目瞭然である. LDFとロジスティック回帰の 1 0 0重交差検証法は, J~IP 事業部の援助を受けたので謝意を表したい.利 用したいユーザーには,連絡いただければ無償で送付します.ただし検証したいモテ、ル数によるが,数 0 0重交差検 H I E法は, 時間かかる場合もある.小標木の統計分析はあっという聞に終わることが多いが, 1 P Cの能力を十二分に活用できるので知的生産性を高めてくれる. 文献 . C r e i g h t o n and A . L e h m a n ( 2 0 0 4 ) . JMP を用いた統計およびデータ分析人ド~ (第 3 :J 坂). (SAS [ I JJ . P . S a I I,L u新村秀一監修 J . I n s t i t u t eJapan株 ( 2 0 0 4 ) .JMP活用統計学とっておき勉強法.講談社. [ 2 J 新村秀一 ( [ 3 J 新村秀一 ( 2 0 0 7 ) .. J M Pによる統計レポートの作成法.丸善. [ 4 J 新村秀一 ( 2 0 0 7 ) .E x c e lと LINGOで学ぶ数即日十回法.丸善. [ 5 J 新村秀一 ( 2 0 1 0 ).最適線形判別関数.日科技述山版社. [ G J 新村秀一 ( 2 0 1 1 ).数 B H計画法による問題解決法.日科技連山版社. 202

203.
[beta]
一般化加法モデル (GAM)によるイベントヒストリー解析
。田中祐輔'
e

辻谷将明日

イーピー工ス株式会社臨床情報本部データサイエンスセンタ一統計解析 2部
日大阪電気通信大学情報通信工学部

EventHistoryAnalysisUs
i
n
gGA M
T
s
u
j
i
.
t
a
l
l
if
¥
'
1asaaki."

Yusukf' Tanak
<
l
・

.
.C
l
i
l
lI
ca
lInfurm川 i
O
f
lD
i
v
i
s
i
!
)1
lD
at礼 Sd刊 I
C
(
!C聞は円 St.ati~刊 ics AI
la
l
y
s
i
sD(-~partmellt 2,EPSCorpm削 l
O
l
l
山 Dcp山 t Jl1~llt o
fEllgincprill~ I
n
f
orJl
Jat
i
c
s,05'ukaE
l
cC
'
t
.r
o
‑
C
O
m
I
1
1
1
1
1
】I
C(lt
i
o
nU
l
l
i
v
c
r
s
i
t
.
y

要旨
i
i
i
I
f
I
ミ
は
仁1
1
(
1l病の移 f
t
I
'
‑
f
.H
i
:
i
l
;カ>
¥
i
I
B
1
J
i
{され、付 !
b
l
i移納が (
:
:
j
))
な治療法になってきている。しかし子術に成功しても、

その後、種々の病状(イベント)が発症し極めて生存率が低いことが知られている。このようなイベントヒストリー
l
lされてきた
解析では、 Coxの比例ノ、ザードモデルが広範に活 J

u

しかし、共交 1
1
1
.の絡がlI:tI日!とともに変動する 1
1
:
'
1
1
1
¥
1

依存引データが合まれる初台、ベースライン生白{立Jt'iやベースライン崇般ハザード防数の推定などに問題点が残さ
れている p 本稿て‘は、一般化加 11 モデル 'i!: 援用した非線形解析を提案し、;;1~料分析、モデルの迎合 l全検定そ通じ、

イベントがずt
'
f
:
.
し
たH
寺点での i年後の条{'I:付き'f:jr:本を予測する。また、従来の線形モデルとの比較も試みる c 更
に、スプライン関数による H変 f
i
iの可視化を試みる心これにより、 生
1
ミ
主宇
J
存
f1
時
時
i
寺
問似
1
1
!
町
f{そのものの 非
j
!
後
圭
ど4
れ1くらい生 作
t
存
'
:
j
字
}
子
:
て
で
、
き
る
の
カ
か
、
、
安
定j
l
f
lはいつごろからなどそ視覚的に把阪できるようになる。
移植f
キ

ワ

ド:比例ハザード モデル、 J
¥
l
l
l
J
t
i
‑
s
t
a
t
eモデル、一般化力1法モデル、平滑化 J¥ラメー夕、クロス・バリデー
v

ション、適合度検定、:*~智分析、生存率一);i!!ll

l まえがき
従来、

'Uiデータ解析では、 Coxの比例ハザードモデルが広範に活則されてきた(大焔浜 1
1
1(
jリ(
5
),中村 (20t)j,
)Kalbf
!eish

e
l
l
l
d Preuti刊 (2002)Ju
、
i
口 a
l
l<
1:'do('schhcrgcr(200J))。比例ハザー Fモデルでは、 l伽j の!~変量をもっ生与 11寺n\J (
傾i
J
lI
I
寺点 )
1の

、ザード関数在

F

)
‑
I
(

…)惜

h
(
x

と表すとただし、ベースラインハザード/1¥1
数入 0(1.)は初日[l
l
l
寺点 1の
1
1
¥1
数であって、共変 .
:
1
1X = (
:
1
"1
0・
ー
..
:
t
:
!
)こ
((
{
cれよしない。
イベン卜ヒストリー解析では、 Jt変 f
Rの 1
而がイベント (
s.
t
ate) ごとに、変動する時間依存型データが合まれる。その場合、

I
1larllhini山,, 1Valsecehi(IDリ
ら ).Kalb日e
iぉha】]
(
1P
r
p
l
l.
1i
C
f
,(
2002),
C
o
l
l
p
t.
t
(
2
0
0
:
3
)が指摘しているように、各思(:;.にあI
する生存関
数はベースラインハザード II\Jli~ のみならず Jl、変祉の備にも依イ7 し、厳?干i にはペースライン ι1-: {y:関数のベキ乗の形式では表現でき
ないc

また、ベースライン生存関数は、 IljJfi距で有効な向1~釈をもたなし、

共変 l
i
tの組が1年JllJとともに変動する時I
J
:J依存 1
1
1
1データが含まれる場合、その近{以解 t
ょとして :‑‑Imtaughe
t al
.
(J
日山)の ilhyo
1
edモデルや Chris.
le
l
l
S
(
'
l
le
tal
.
(1リ自(;,]9円:
1
),
;
¥
1
1llHl 川 l
dDeStavoi
>
、
(j!
J
!
)
,J
)のヨーロッパ l
l
P¥¥, v
(
'
r
.
:
‑
;
1り日モデルが 1
1
;犯に
l
l
p
d
a.

活 mされてきたひ更に、 T同 l
j
i
.
t
a
l
l
i札 n<
lSak川 1
(
2
t
ll
]
円
)
は 1与n
依存型の典型[J
l
lと
し
て
f
i
J
l
f
.f
l
rされてきた PBC(J.反発性1日il性 IIf側変}
げ、ニューラルネットによる J
I線形モデルを j
:
J案した。
データな取 k
C
j標事象(生 f
了あるいは HJ
;
l
Jり)まで、極々のイベント (rnulti‑state)
イベントヒストリーデータでは、観測開始から最終の f

が発生し、その時!日lと共変 ;
1
1の仙が記録される。本稿では、J<l
e
i
nand M川 町 hbergeγ(200
;
;
)
の 1
:
l
(
i1
9
リから 1
1)(る竹節移舶データ
s
t Disea:;e) は移 ~fi 片対的主性病を意味
を解析する。イオ髄移舶は図 lのような経過を辿ることが多い。 GVHD(Graft‑Ver凱日ー1‑Io

する F 近年は仁 l
l
i
n病の移納 rWii
去が盤的1され、骨髄移 MiJ
ミ
一
千i力な治 f
f
u
i
;
(こなってきている弓しかし 'HI:i
(ζ成功しでも、その後、
純守の病状が

m主し側めて生存率が低いことが知られている 例えば、足、白 #112はi12のような只 taい な 終 て lt1終的に九41 円
望

G

203

204.
[beta]
開
一
出
一
口μ

⁝
釦

急性G
V
H
D
(
2
1日)
一 一γ 一
ー 一
一
一
ー
ー
A

一日目
014
⁝ 4
﹃
ノe
︒
⁝6
r
‑マ吋
発亡
再死

V
H
D
(
1
0
0日)
慢性 G

4J

立
[[
2 患者 #112の m
u
l
t
i
‑
s
孔
.
tt
p
:
( )内の伯は発生日数

l
究
[1 骨鎚移植の m1
l1
t
.
i
‑
s
t
a
t
cモデル例

表 ] 患者 #112の入力データ

。
。
。
。

100

。。
。 。
。

2G8

1

Cen8 Time
1
7
21

。
。
。
。
。

(
/ Zc Zp Zl Z2 Z3 Z4 Z5 ZG Z7 Z8 Z9 ZlO g
/
Je
l
t
a
3 Z
り

l

1

1

341

20 23 り
20 2
:
3
:
J
20 2

I
20 2:~
20 23

1
8り

o

。
。
。

1

180
1

1

180
180
180

3

3

つ
を
J

3

f
c
H
こ死亡している。
ml
1l
t
i
‑
s
.
t
a
t
p,こ影符を与える共変:.::として

Tin凹・発生 L
I数 1
(
待問依作型)
Delta3=1:再発 (
1
1寺
!
品l
依
存
1
.
¥
'
/
)
Za二 1:急性 GVHD発症(時間依存型)
Zc=1:慢性 GVHD発注(時間依存型)
Zp=l:r
l
l
l小板凶復 (
1
時間依存型)
ZI:!
!
'
:
、
者
年
[
除
Z2・F
ナ一年約
Z3 患者の性日J
I(
1
‑男性, 0
‑女性)
Z
'
1:ドナーの性別(1
一男性, 0
一女性)
Z5:!
1
1
者のサイトメガロウイルス (C¥IV)の免痕状態(1
‑
[
場刊 .
0ー陰性)
Z
f
i・ドナーの CM¥
・
(1
‑
1
揚
[
'
I
:.
o
‑
[
:
!
tl
:
)
Zi:移植までの待 H
主問
Z8:Fn
、
1
1
l:
h
‑
A
l
l
l
c
r
i
e
a
n
‑
B
'
l
i
t
.
i
s
h
(
F
:
'
¥
B
)基準の分知
(
ト FAs分額で 4か 5で A¥lL1
利夫 .
0それ以外の痕状)
z
n・ 1
たi
淀 (l‑OSU.2‑AH,
3‑SVH.4‑HU)
ZlO:GVHDi
坊止栄として ?
¥
I
T
X
(メトトレキザート)の使用
(
0
ー使用しなかった, 1
‑使JI1)
g:病状グループ

(
1
‑急竹リンパ.n球性ドl
l
(
n病 (ALL),2
‑念
、
1
"1
信髄!阿白血病 (A¥
1I
L
)低リスク.:~-A Ì\.J L I\~j リスク)
を取 i
げる

ζ

なお、イベントヒストリーに影響をりえる共変量の中で、時間経過とともに数値が変わる要因を特に時間依イ7型変数

と呼ぶ。移植後どれくらい生存できるのか、安定期はいつごろからなどを視覚的に担促するため、 Jt変 11: “ Tinle~) の ~r'線I!;性を IiI

純化する。更に、宇'
J
1
I
i
i
f
移植 i
こ!対する 1年後の条件 I
;
Jき生存率の予J
i
i
J
J
1t試みる(1(1
町 I
Ie
ta.
l(
1!
J
!
J4
)
.
h
:
Je
i
n
(
2
0
0
2
)
)。

f
ぷ者 #112の場合、人 )
Jデータは表 lのようになる

M

応、符変数(打切り指標) C
C
l
l
S
"
!立
、 l
時点 :
)
.
1
1I
J日に死亡しているので 1を

t変 i
立
,
.De
I1
.
>
>
:
1
"主
, 1を l
f
:
(る。一人の患者 (#112)が 5つの観 i
J
!
l
J
伯を生成して
取る。 2G8日同に再発しているのでその時点、以降、 J
3
G日
:
fj
で、合計 :
.
l
8
3伺の観 i
J
!
l
J
M
fから成る。
し、る。本稿でのデータの総患省数は 1

2 一般化加法モデル (GAM)
従来の比例ハザードモデルでは共交盆の手1意性の検定はできたが、 l年後の条件付き生存率 1
)
)予測などはできなかった。更に、
イベントヒストリー解析は線形モデルが採nJされてきたっしかし木稿では、共変 :I~: ;'Ti l11f~のロH見化を íi うため非線形モデルノE

i*肘する。 Cox(197D)や E
f
r
o
n
(
1
9
8
8
)の部分尤皮に息づく部分ロジスティックモデル PLM(Pal
'
t
.i
a
lL
o
g
i
s
.
t
i
c?
v
l
o
d
e
l
s
)を拡張す

204

205.
[beta]
,

,

る。生存時間を表す非負のIift率変 VTについて、時間区間 lの一定時点 tにおける患者 #dの離散ハザード比

h(d>=Pr{T=t
l
l
Tどん,
}lニ 1,2,
.
.
.
,l
d;li=1 2司
.
.
.
,n

(
2
.
1
)

噌

に対する PL
!
dは
I 1 くd
> ¥
Illl~って 1= 臼 +βoTirne("> +i
3Deltα3
;
r
l
>+ゐ ZU(d>

¥1‑

,

h
;
a〆 /

+/hZC(d>+β4Zp(d>+β5Z1(d>+.
1
1
6
Z2(d>
+
β7Z3(d>+;
1
"Zザd
>+(
3
9Z5
f
i,
<d>
(">+βlOZ

,

+
.
311Z7(d>+s12Z8(d>+.
s3ZD(d>+ βI~Zlü(d>
+
.
31
9
(
d
>+βJGZ1(d>X Z2(d>+β17Zp(d>X 9/<d>
50
+
βISZp(d>X Zl(d>+β叩 Zp
,
<d
下 X Z
2,
<d
>
と書ける。ここに、 η は患者数、んは患者 #
r
lが生成している観測値の{同数で、。は定数項、,t3n

(
2
.
2
)
t
"
.
,
.
.
J

β
1
9は同制係数である。観測

されるのは最終日寺点までの 1時間 ~"TiI Il C:' と打切り指標“ CClIS"

O
,
<d>=
1

‑

J:!~\一斉 #d が時間区間 Jて死亡
iu
:その他

である。
近年、 H 変量の f引を~型を表現する極々の技法が開発されている。

平滑化スプラインに基つく一般化加法モデ

l
レ
GA:¥I(G印 刷 a
l
i
z
e
o Addi
.
t
iw :
v
l
o
d
e
l
s
)
(
H
a
s
.
t
i
e and T
i
h
s
h
i
r
a
l
l
i
(
H
I
(
)
O
),
Ha
.
<
t
i
ee
t al
.
(
:
2uOl)辻谷ー竹浮 (20m) 第 5
jレ
GLM(Gl'lIc
r
a
l
i
z
c
dL
i
n
e
a
rl
v
lりくl
e
l
s
)(
l
¥
‑
l
c
Cl
l
l
l
a
g
h仰 に INelder,
lDSD)の線形予測子を
l
.
<
d
> ¥
lll(~で7
丈て
u+s
釘
川
バ
1(
引
T
守
i
'
川

式
全
)
)
は
、 (2.2)式の一般化線形モテ
I

1
=

¥1一hγ
<
U
'
'
;
>)
l

t

+
β3
{d>+ !3.J Zp;~d> +82(Z1(d>)+ 83(Z2,
<d>)
ZC

,

+
β Z
:
3
(
:
<
I
>+;
1
8Z4,
<d
>+θnZG(d>+/
'
h
u
Z
(
)
;
t
{
>

+s
,, (
Z7,
<d
>
)+βl1Z8,
<d
>+β12ZH
ア1>+β1:lZlO,<d>
+
.
i
]
,
.
J
!
.
II
<
d
>+β1
5
Z
1,
<
>
I
>X Z2,
<d
>+3
,
刊
GZ[
十

r
1
九
i
げ7
Z[
ρ
'
J;
d>X Zl(r1> +β凶 Zp(d>X Z2,
<d
>

(
2
.
3
)

と拡張して表現される。 (
2
.
3
)式のスプライン(平滑化)関数は

1
(
T
i
lηεfd>)=21Jj!(11nMfd〉 )βJ

‑
S

J=1

を (Zl(d>)九 寸
(Z2(d>)ニ
を bJ3(Z2,
<わ)九+叩
=

勾 (
Z1,
<
"
>
)

UJ2

j=!

内

内 (
Z7,
<d
>
)=

4
)
(
2.
J

LbJ (Zi,
<d
>
)í;町村'l';' lJ:~+J
.
J

と書けるョただし、 b
b
"
J
J,
V
j
4は Bースプライン基底で、それぞれ1]1
・ω ω ω n
円の基底をもっ。
J
1,
J",
ー

]
[
)
(
[
i
l
j/について
さて、患者 #dのH祁 ¥
A

くd
>ー ,11 患者#r1が時!日j区
!
日j/で打切り
‑ i 0 その他

UI

v;-- (L.~~

,く

"
1

l
> ‑.:'<.1、
¥
、
←
くd
、
、
、
町
くd
>
くr

=(
6
;
‑
‑
"
.
.
.
.
:61

,
<d> /<rI>
芦
、

=l"ld>,0ε1 d>、
)

d
>

ぐ

く

と定義する c ただし、官庁 d
> は患者 #dの !
i
i初の H
キ間以 1
m1
‑
1までの死亡あるいは打切りに関する!厄!涯で (0,0,.パ))となる c

"
1d> (v/<t凧 d?I>)は、 dfd〉が含まれるまで vfbを拡張した混で (0,u,"
'
,0
.
0,<'勺である。
く

二

くd>が
vfl〉が与えられたとき、 OI<d> はベルヌ一イ分布 β ,(
1,ん
h
ア
「
f d
勺;に川
d
己
有
従
Lう 匂V1
カt与えられたとき. I
i
可
;
く d> はある 3
分
I布
Iバ(μ(ω6
, 可;〈 d内川>汁,つ|同旬;アくイ山吋
市
~d
凸
d1>勺) こ
に
,f
依衣作するが、凶帰州f
係
系
砧
数t
z
β には{依衣作しないと仮定する..
忠
.
1
心
[
¥
千
巧i
動
#
dに対する μ
(
5
rfd>.寸
a
I
3

咽

ァ

と
,

afd〉
勺)=(0.0‑ ‑0.qbd; >)の分布は
(
1 ‑ h~d>)p(li;

くわ

1 ‑ hi'勺 p( ιくれ|匂~ <d>) X
!,, ;<d>) x (

1‑d

h
(
;
/
>
)

205

ー

1ー
x(

~<, f>

"
<
r
l (1‑
hí~/~~ )1'(<5九了~il'v寸_di) x (h乙 わ )

206.
[beta]
となる司すべての患者に対する対数尤肢は

(
2
.
5
)

I"L= InL(β)+ZZlIip(44〉 lu;ω)
d
=
l1
=
1
となる。ただし

lnL仲
とする。よって、独立なベルヌーイ J
I布の部分対数尤度 (
2
.
6
)式を最大化すれば β が抑定される。詳細は、 Cox(19i5)、
E
f
r
o
n(
1
(
8
8
)、TS¥lj
i
t
a
n
iandSakon(200D)を参照されたし o I
n
L
(
β
) は対数JL:度ではないが、かなり広範囲な条件の下で通
常の漸近特性を令ーする (
Andcr
即 日 山 dG
i
l
l(
l
<
J
R
2
),
A
l
l
d白 山ne
tal
.(
I!
JD
3
)
)。従来の時間依住型データの解析として広範に活用さ
e四 i
O
l
lモデルや '
i
v
1a
yol
l
p
r
l
a
t町 iモデルでは、問視1
]
)
与lIi¥l主体を考慮に入れるため、一人の患者が復数制
れてきたヨーロヴパ npwv
l
i
J
!
i
i
l
iIIを生成しているにもかかわらず、互いに独力として従来の時間固定 (
t
.
i
l
t
lE'‑
f
i
x
e
d
)犯の比例ハザードモデルで解析してい
の1u
る。そのため、あくまで近似 riJ"~である。提案法では部分尤度を援用することにより、この独立性を回避している.よって、ヨー

ロッパ newv
e
r
s
i
o
nモデルや]'v)a.
yol
l
p
r
l
a
t
e
r
lモデルのようなベースラインハザード関数が一定の仮定が不袋である。
当てはめ過ぎを避けるため、ペナルティ付き対数尤度

山
h
1

→
+
i
主
入
/
山
{
卜S
ω
州戸l

(
2
.
i
)

をt
:
;
:J
lI
する。ここに I側の J
t変討について、入=(ん.入:!.....入 1
)(土当てはめの良さと平滑化のトレードオフをコントロールする
平滑化パラメータで、 s
;
(
z
)はスプラインI¥¥l
t
iである。
モデルの当てはめに閲し、

:つの問題がある c 平汁i
化パラメータ入 eの選択、および 4節で述べる当てはめの検証である。

CI
¥1
1
'
1では Zhang(1!)!J:~)の一例消去クロスヴアリデ ション L
O
O
C
V
(
L
(
'
"
v
i
l
l
g
‑
0
1
1
(
'
‑
(
)
U
ICros
ぉ1
勺l
i
d
a
.
t
i
o
n
)の近似解である
¥Voo!
c(
2
0
0
4
.
2
0
0
(
;,
2
0
0
8
)の GCV(Gp
.n
e
r
n
l
i
m
c
lCro
日 1
抗l
i
d
a
t
i
o
n
)が広範に}甘いられてきた。しかし、イベントヒストリー解析
では表 lのように 1 人の忠者が総数個の観測怖を ~I二成しているじ本稿のデータでは]:J fi 人のjよi者が合計 383 f
固の観 i
H
ll
f
l
7,[を生成す
ることになり、この 3
8
.
1~bI一つずつ除去する LOOCV 法は妥当ではない。例えば、表 l の;) f
l
A
jの観測値は患者 #ll2から生成さ
れた似であり c
v法は忠苔単伎に行うべきである。イベントヒストリー解析の 1f
l
i
J
i
f
'
i
去の 例"は I人の 患者"に相当すると与え
る。本稿では、 ・人の!.!.!荷が桜数日月の観iIl
l
j
f
i
円を生成しているので、滋者時l.f
f
Uこ基づくり‑
i
l
lCV法を提唱する(変形ト重 C V法と
名付ける)。通常の γ 重 CVi.
とは f
jイズが i
'
J
i
走
な1
辺り等しくなるようにランダムにデータを υ似のグループに分割する。グルー
プの個数は C
b
患でその偶数によって結栄が'J
U
なる。本稿では v=n とする c すなわち、患省(ごとに異なった個数の観測値をも
っ)i
j
i伎にじV 法を実施するため、グループの分吉1](:1: .
怠i
己決まる。手順は下記の辺りである u
手順 1
.初期標本 x= {X<I>,
....X<<
i>
.....X<">}そ n似のグループ x= {
X<I>I...IXくの│ │X〈,〉}に分割する。
ただし、 X M
〉={ffd〉 zri〉

d〉

2fF};:;d とする c

手1
1
頂2
. 初期棋本から d
‑番目の標本を除去した x
'= {X<I>I...iX<i
<
‑I>IX<d‑i‑I
>
I
.
.
.
I
Xくの}へ (
2
.
i
)式が刷、になるモ
デルを当てはめ、除去された ι 需日のt:;{本 X くのに対する h~d> を予iJ!IJする。

手順 3
. 手順 1
,2をrI= 1
,
2
.
.
.
.
.刊について繰り返すc そして CV値

肝ト
C
v ニ一」ヨ 2ε=~2ε: 州一 ÎI~'勺÷刊ð[<dの
d>lllÎl♂「
rf
fed,〉+吋州
ア
(ο1 ‑ri~ <i勺
1
dニ 1 l ,~】

4
そ
;
:
‑
t
釘
)
:
刊
l
山
け
H
ハ
i
i
す
す
‑
る

G

(
2
.
8
)
j

ここに、 I
l;
=
d
>は (
2
.
1
)式の凶tI汝ハザード比の推定 i
dである G

手順 4
.すべての平i
1
Ht
/¥ラメータの組台せについて CV備が l
u小になる併を I
a
;
也とする。

S九SV,
円
円.
2(STATD.22)の PR
.
OCG入1
.
.
1では。 PROCLOGISTIC等に実装されている WEICHTステートメントを手J
I
J
lI
できない。そのため、データハンドリング (ι 番白の桜本にフラグを付与(\V EIG=I) した 1:~G パターン (136x :
1
8
3レコード)

のデータセットの作成)そ行い、 sY‑SCOREステートメントを代用して、変形作重 CV法{こ基く自由度(平滑化パラメータ)の
長@化在行う G なお、 GCV 刻 i\~ に犠づく方法は、]'v! ODEL 文のオプションで lvlETHOD=GCV を指定することて'flJ) IJ できる。
下 !Jc に共変 ~Ltwl'iln('~' ,こスプライン l
主W
iをi
即日した場合のプログラム!日j
を示す。

206

207.
[beta]
%
l
¥IACROGAl
¥LCV(
J
J
¥
'OS
,OFl);
/材*白山度j
立摂: 1
m始 以 ホ /

01
¥T八 RESULT;OELETE;RUJ
¥
'
;
%001=2%TO&DFl
.
:
1
*ロク 出 j]• j
D八TA̲NULL:PUTLOG OF1=&I
.
'
・
;RUJ
¥
'
:
/科卒アウトプットへの 1
:
H
力 Wi
I
:
仲*
j
円

OOSJ
¥
'ORESULTS:
OOSLISTINCCLOSE
/
村
本 !
e
a
v
i
n
g
‑
o
n
e
‑
o
l
l
t
‑
C
V
:I井I~t;判 *j
ODSOUTPl
I
1
'l
t
,
t
'r
SlIllllnary=OEVOUT;
PROCGAMOATA=&INDS.(WHERE=(WEJGNE1
)
)
GYMOOEL̲ID:
句

;
;Z
(
iZRZ0Z10日;
CLASS0
(
'
!
t
a
:
3ZaZ"ZpZ:~ Z4Z
i¥IODELCcns(EVEJ
¥T='死亡・)=
1Z
.
IZ5Z
(
iZiZ8Z!
1Z10;
r)
PARAM(D
c
l
t
a
;
lZaZcZpZlZ2Z:
SPL
lNE(Time,OF=8
r
.
1
.
)
jL
1'‑!K=LOGJTD1ST=sJJ¥u:'
dJAL
SCOREDATA=&JNDS.(WI
lERE=(W巳JGニ 1
)
)OUT=]{ESULTO;
RUN:
OOSOllTPUTCLOSE:
/
紳
:
+
:l
e
a
v
I
n
g
‑
u
l
l
(
.
'
‑
u川 ‑CV:終 了 件 *
j
唱

O
.
'
¥1
'
A RESULTO:SETRESULTO:
DO= ‑2*LOG((
P̲
C
c
l
l
s
*
"
C
e
n
s
)本 (
(
l
‑l
'̲
C
e
n
s
)
*ド
(1
一C
<
'
I出
)
))
;1
*CVI
!
1
'
j(
(
2
.
8
)式)の野山 V
RUN:
PROCl
¥
l
EAl
¥
'SDATA=RESULTll'WPR
lNT:
VAR00:
OCTPUTOUT=OUT̲CVSlsJニ CV:
RじN

DATAOU'LCV;SETOU'LCV:
OF1ニ
&
:
1
.
:
DROP̲TYPE̲̲FREQ̲:
HじN:

OJ
¥T
}
¥RESCLT;SETRESULTOUT̲CV;
RじN.

ODSRESじLTS:
OOSLJSTJNG:
/本件アウトプットへの出})再開特権/

%ENO:
/件*白 r
l
1
1
主選択:終]' ,
.
*
ネ
/
%l¥I
E;
‑
‑
.
JO G
A:'¥LCV:

先行研究(辻谷・ '
I
'
t
j
:.I
I
!<
1
'(
2
1
)
!
:
J 投稿1
',
):K
l
e
i
nanI
rIV!ocsch1 川宮内・ (2003.Spc. 9.2) と同様の尤度比検定に;~~っく変数選択
(省意水準 1
5%))より、最終モデルとして
/ ム <d> ¥

,

,
l
J

1
1
1( ̲
'
̲
'
1で , h 1
二 位 + ♂(
i
'i
l
i
l
e<d>)+d dl
ιl(d>+ ~'hZC(d> + ihZp;くd
〉 +
LflZlfd〉
¥1‑ h
'
[
"
'
>)
+
(
J
5Z2/
<,[> +β'GZR;'d> +/
J
,.
I
U
くd
>+.
:
J
t
:Z
p
;
‑
d
>X fh<d>+.!-j~JZ1:tl> xZ '2 ~d>
+{)IQZp(d>xZl
/
<
d
>+βIIZp(d>X Z2(d>

(
2刈

を採1-1 1 する。なお、交互 ('FI 日支1)* が有怠になった場合、対応する主芦)j~~もモテ、ルに l[xiz,んでいる。このモデルに対する民i也 f1 E
t
l

度は OF=6.Sとなり、 CVii
向
=
・l
0
3
.
2
6
!
)、逸脱皮 =250.6:1,
1となった。なお、自十1度 は 小 数 点 以 下 第 l伎の純[Jf
J
をグリッド検索

した。

207

208.
[beta]
2 J
t変量の回帰係数とl'値
̲uホ同

7~3ζ 旦1

同研五r;t直

再発のイイ無 (
Df
'
lt
(
l
.
:
3
)

0
.
5
0
8

慢 性 GVHD(Zc)

‑
1
.
0
6
9

0
.
0
0
3

JfIl小阪!日 li~ (
2
p
)

8
.
7
D
3

0
.
0
0
1

W~?lòìir市 (Z1)

‑
U
.
8
0
a

くU
.
0
0
1

ドナ一年齢 (
2
2
)

OAS~

0
.
0
0
2

;
1
j
g(
Z
8
)
FAsJ
;J

0
.
6
2
3

0
.
1
6
8

病状グループ (
9
)ALL

ー
l
.
i9
6

0
.
2
0
4

病状グ、ループ (ωAivJL高リスク

4
.
D
G
9

0
.
0
0
3

0
.
1
6
7

f
l(Zp)x病 状 グ ル ー プ (
g
)ALL
J
i
n小 板 凶 i

2
.
7
:
n

0
.
1
0
3

I
血小板同復 (
Zp)x病状ク ルーフ勺 (
g
)MdL高リスク

0
.
7
4
7

0
.
0
0
1

患者午前日 (
Z1)x ドナ一年齢 (
Z
2
)

U
.
U
0
4

U
.
O
O
g

i
i
l
i
隻 (2J
l)
x忠 信 年 齢 (
Z
1
)
n
n小 板 l

0
.
7
2
80
.
0
0
1

J)
X ドナ一年齢 (
Z
2
)
J
i
l
l小 板 回 復 (Z]

一0
.
.
5
8
3

く

oo
り
]
ー

3 影響分析
内

ムDeV[dj= Dεv‑D引 '
J
d
Jさ 0

j
l
(J

~f~ 持分析とはモテルに当てはまらない影響観 iJ!IHi1fを検出する方法で、

を採 m
する。 TJcvはすべての J
t変宗を Y
I
Jいたときの逸!li1
度
Del'=2
(lnL "‑lnL
c
)
.
川

nL,; は必定したモデルの応大対数尤皮 (
(
2
.
G
)工
に
)
、 1
nL
であるっここで l

f))(lT

(
:
3.
2
)

は飽和モデルに対する対数尤j
立で Oとなる。 GAM

4ミ

1
(

ム
ィl
.
f
.
[
,
,
, =t
l.
f
.‑d.
f
.[
r
l
J

)
1

の逸脱皮(:3.
2
)式の漸近特刊につい日立 W
o
o
d
(
2
0
0
G
.
S
e
c.
4.
1
0
)に洋しい o D
e
v
i
r
l
Jは d 番目の!!~者を取り ji幸いたときの逸脱皮に
なる。(:3.1)式は白山度

•

のプJイニ乗分布に従う。ただし、 d
.f
.および d.
.
f
.
[
dJ はそれぞれ!
:
U
i
:
Eしたモデルの全データおよび #
r
l番目の患者を除去したとき
の対数x.度に対する白山度である c
その結果、怒者 #
3
G
.G
!
}
.S
O
.1
0
8が影響観測節となったョ患者 #3G,1
0
8は観 i
J
!
I
1
侭が H
biの症静1
1
である。患者 #G
f
J(
土
、 1
2日
目に IÚl 小桜阿倍し、長期間生存 (220~ 日)したにもかかわらず死亡したことに起凶すると考えられる。それに対して、患者#加

は
、 1
2L
I日に I
l
I
l
小阪数が凶復した後、早期 (
1
8J
J
)に死亡している。影響観測怖を除去後の最終モデル (
2
.
D
)式に対する cv何

=258ろO
G、逸 iW
主=
2
1
i
.
3自7となり、全データを採用した CV舶の 3m.26!Jよりかなり小さくなる。
GA¥1プロシジ、ヤより推定された共変況の回帰係数と p 値を表 2,こ示す a 表 2の回桁係数 f
砲を見ると共変量 "
l
J
l
l
小松向復'
が負になっている a よって、ある時点で血小板が凶復した忍者は凶復しなかった怒者より坐「子する確率は大きし、 (
K
l
e
i
n札口d
l'vJ()('~cllberger , 2 1ì 0:1 , Sec. 仏 2)0 "再発の有!
i
現行の係数値が止であることから、再発すると死亡する{,(I[率は i
Zくなる。また、 J
t変京
8
(1
'im
ε
)は尤度比検定において p値 <0
.
0
0
1と高度に有意となり非線形 f
tが認められた e
閃 3 は全!!t芋i を採Ifl した tX,~ ~l'のスプライン関数 s( 1';17I e) である。同図の償制!I(止 U 数(1";'川,)で、縦事I!I は (2. rJ)式の s( 1' ime)

の簡を表山、るo (
2
.
9
)i\ の左辺的分かるように , (Timc) の{直が対い、すなわち 123(4L) の値以~(:T~l ,;r h
;
"
'
>
が大きく、死亡の可能性が高いことをなi
沫する。患者 #
:
l
G
A
J,
8
0,
1
り8を除去すると !
>
g
!
4のようになる。外れ値 #
(
;
9は長期Ii¥J
生
存(
2
2
0
4F
1)したにもかかわらず死亡したことに起因し、図』では l
S
0
0H後の生存率が平 l
E!になっている c 図 4から、移 M後
2{l'を過ぎると生存の l
可能性は布くなることを視覚的に犯!偲できる。これは、ニコーラルネットによる非線形解析では不可能で

あった。 4
J
i案 i
tが非線形性の i
:
I
t
l
t化の観点からも威力を発揮している。
j
tを係用すると収東しない。イベントヒストリー解析のような 1
時間依作型データの均
なお、このモデルでは SAS0)GCV規i

ヅ¥の!l¥椅が絞数似の i
i
f
i
i
W
1f
1
[
i
を生成している そのため、間測侭(忠者単位ではなしっそ一例ずつ消去する LOOCV法の近
{以内干である GCVより、本稿のような患者単位の変形lJ‑.;f(CV法が有効になる。
台
、

208

209.
[beta]
割
引
̲
.
.
:
.
.
‑C.".

S事̲'"酬白

S町幽・z
ふ綱軍 C

"“‘.~,

/~_.,..

.I

/'",

.
c
・
・
唱
‑
・"
'
1
.
.
.
.C
.
.
.
.
"
" 日閣

.
.
.
.
̲
、

./¥)ヘ
j.
,
/

~ ,
.t
F

¥

A

ヘ

i ¥ ¥ /

¥

明
8醐

f同

、
・ι官官~ "'1'包;'~'

3咽

出

.宝ロ・II:~.嘗楓卯乞,

ば1
4 影響飢 i
J
!
I
H
直(忠者 #
:
l
t
i,
(
i!
Li
‑
i
I
l
,1
0
k
)除去後のス

関 3 全!
1
¥者を用いたスプライン 1
M
!数 s(Time)のグラフ

Timc)のグラフ
プライン│見]数 ,,(

Freq

80
70
60
50
40
30
2
0

吋 叩

1
0
0

140

160

1
8
0

200

220

240

2
6
0

280

∞

3

Oevi<
ln
c
(
!

I~:;

ρど♂のヒストグラム

4 適合度検定
三つ 1
‑
1の問題は、モデル当てはめの検証である。変If;I
J
‑
l
f
t(
'
Vi
土でギ滑化パラメータそ決定した後、逸脱皮 (
:
1
.
2
).工~~i1 j し、て
適合度検定を行う。しかし、 C
o
l
l
e
t
t
(
2
0o
:
l.
Chap.:l)が指脱しているようにグループ化されていない 2ft!iデータ 0)勾合, (
:
1
.
2
)
式
の逸脱皮に対する漸近カイ二乗性は成立たない.犯に、;よi
者 l人が惚数{同の観 i
J
!
I
川l
i
'
[を生成しており、 H
i
l
l度が計算できない。そ

fronandT
i
b
s
h
i
r
a
n
i
(
1
9
9
a
)や T引
I
ji
t
a
n
iandKoshiJlli
z
u
(
2
0
0
0
)のブートストラッフ法{こぷづし、て、逸脱皮の棄却1
.
s
{
を
こで、 E
算出する:
手順 1
.

初 期 標 本 X = (X<I,
> X<三 〉 一 一 X<d>..... x<川 > ) か ら リ サ ン プ リ ン グ ( ベ ア ・ サ ン プ リ ン グ ) こ
(

(X<1>.,
X<2>.....,
Xく 山 つ を '
1
:成司る。ただし、 X 0)成 分 X<d> は

より H 組 の ブ ー ト ス ト ラ ッ プ 燃 本 X.
X くわ

f
(Xr'ぺ Ó~d> ,
d
:
{
‑
r
l
>,
•••. at
:勺 で あ る ョ

cl
手1
1
頃2
.h
(
=1,
・
・
・,
B)1
l
i
'l
のブートストラソプ桜木を Xhとし、逸 W
I
I
主

叫 (
n
Lf ‑1
D"
,, (
h)=2{l
xi
,
:
/
j(
X
;
;
)
)
}

i

j
l

(

=‑2111L(X~; ,â (X&))
を計算する。ここに、対数尤度 InL(X 7, :β(X~)) は bmll のブートス卜ラ・ソプ燃本 X i, から算出される対数尤l立である。

手1
1
頂,
'
J
. D
C
I
J~ De".なら、有蕊水準日でモデルは妥 f
iでないとみなす。ここに、 ρ仰は初期限木に対する (
3
.
2
)式の逸 1
M
度で、
Dc
'1'禽= ])",,(/))を小さい II~iI ι 並べたときの/需 1-1 の {fl'し日二 1- .i /(8+1)

とする J

i
窓乃は、 B ~ 400としたときブートストラ・ソプで生成された Du!.のヒストグラムである。!司 l
'
i
!l
より、

,く
,

]
)
el.' = 2
1.
:
1
8

2:
i(
i
.
7
Z
dニ DH'"

ノ日号、何万;水準ら%でモデルは妥当とみなせる e

20
9

210.
[beta]
表 3 患者 #
1:f
生存」

表 4 患者子学 1
8
:1
再発→死亡」

1 1年 後 の 条 件 付 き 生 存 率

S
L
a
t
e(発牛ー日)
l
復 (
1
:
3
)
血小仮[i'i

S
t
a
t
e(発生日)

1年 後 の 条 件 付 き 生 存 率

CAi'd

線形

GAlvI

線形

。
.
49
0

0
.
9
3
3

2
0
)
血小板同復 (

0
.
5
5
6

0
.
9
4
7

急 性 GVI
‑
I
D(
2
8
)

"
)
0
.
5
4,

0
.
9
4
7

再発 (
1
0,
)
)

0
.
:
3
2
2

ー
。7
12
:

死亡 (
1
5
6
)

(
)
.
:
3
(
)
(
)

υー
i
l
υ

急 性 CVHD(67)

0
.
4
1
3

0
.
9
3
3

慢 性 GVHJ
コ
(
12
:1
)

0
.
6
1
6

i0.888

打ち切り (
2
0
8
1
)

1
.0
00

f
l
I
!
l
小
仮
I
i
l
li
l
i
lなし」

!li者 #7.~:

表
.
:
,

S
.
t
a
.
t
e(発生日)

1

急 性 CVHD(18)

1年 後 の 条 件 付 き 生 存 率
GAI
¥
[

*
.
J
;
U
杉

υ
.
1
7
0

0
.
8
2
1

急 性 GVHD(100)

O
.
2
7!
i
.

0
.
7
22
:

死亡 (
2
8
8
)

(U28

υ
./1.
5

5 生存率の予測
患者 #d の;.!~院l侍!日] (
観i
f
i
l
i
待点)1.アヘー Jfd
〉・・・・ 4d
下について、ハザード関数 h
'
(
d
>をj郎、ると生存開放は

叫ん)=日

(
1‑h;;d>)

(
.
5
.
1
)

lくん <1

一︿

h
v
一

tT

)
﹄
tm
ム一)

大昌一

ム

)
f

f
‑

+

︿

t
(
h

HD
t
(
一

となる。よって、 tfb まで生存した患者が、次の短期 I
Jムf後も生存する条件付き生存率は、 (
5
.
1
)式から

(
5
.:
2
)

と予 i
l
!
l
できる c
本稿の有 ;:-"))'~Iーを示すため、線形モデル
f

、ぐ

d> ¥

111(fF7)ニ 日 十 Time;‑d>+/
3,
Ddta:3;‑d>+ihZc(d>+柏 戸 >+/
3
.
.
Z1
;
'
d
>
+3
九Z
2
;
‑<l> +/
3
oZ8;'d>+β792 d +/
3
8Zp(<I> X .
(
}
J
<d>+.
s
o
Z
1
;
‑<l> X Z2;'d>
+
.
3IOZp;'d> X Zl;くd>+/
3,
Z
l
'
(
d
>
X
Z
2
;
'
d
>
1
〈

ラ

(
;
)
.
:
1
)

とJ
t鮫する。各イベントが先生した時点で、の I年後の条件付き生存率を算出する。すなわち移植後、極々のイベント(血小板阿
復、 ~vl'l: GVl
ID
.t
.
1
:
!
'
I
'
1
:GVHO.再発など)が発生した H
キ点で、 I
I
I者がその後 l年生 1
7できる可能性(確率)である。
表1
:の2
塁
手
ミ #1は f
血小板阿復」→ f
急性 GVHD発症」→「慢性 GVHD発症」の典型的なパターンである。骨髄移植て1
立
、
血小似同 f~ 7J~子件!の )J~ 台を決定廿る大きな指標となり、同復しない陽台は骨髄がうまく適合していなし、ことになり危険状態であ
る。また、術後すぐに GVIIDが起きることが多い。 il!Iu1 、板凶復」後は OA!JO、 r~t性 GVHD J
!
f
1
主Ji去は Oι11:1、そして、 !t~H'1
GVHD 発症 j したlI~r)点では O.(ì 1(i となり 2081 日付に打ち切りとなっている R 線形モデルのもとで予測すると GAIVI よりかなり
大きくなってしまう G

表
,1
の:
t
¥者 #18は f
r
[
1l小仮凶似」→「急性 GVHD発症」→「再発」の典型的なパターンである。 GA
'
l
v
lを採用して I年後の
条件付き生存率を予 iW1 すると、 f 血ノj 、板同 i\i J 後は O..~5(; 、「急性 GVHD 発症」後{ま 0.54.5 、そして、 ff耳発」した時点では 0.:322

1
となり 1
5
6I
1日l
こ死亡している。ノ L
o作!
1
1
#1と比較して、再発の先生時点てイ:
1作之容が大きく下がる。
I
f
l小板凶復」しなかったパターンである" GA孔1,を採用して l年後の条件付き生存率を予測すると、「急
表 5の;忍者 #75は f
性 GVHD発
I
l
U1
I
!
i
)
ぷ
て
、0
,
1
7
0とf
尽く、「慢性 GVHDl
(
!
j
E
J1
創
立
1
)
,2
7
Dとなり 2
8
H日付に死亡している。線!f;モデルのもとで予
j
則すると G
;
¥
:
¥
Iと比校して生 (
j
'ネに大きな差が見られる o

表 :h表弓から i
何らかなように、 J
t変 !
i
iTimc"のみにスプライン関数を適 I
I
Iするだけで l午後条件付き生存率は大きく変化
ζ 対する C
V
{
I
白は :
3
2
9,
2
0
5となり、 G
A
1
¥
1の場合よりかなり大きくなる。
する。ちなみに、線形モテ ル {

次に I
(
n小板 1
'
1
1
1
8のあったIiE例を対象とし、病状グループメは I
f
l小限数の位l
復│時期について別別したときの (
1
1l小仮凶復 H
寺
}
,
'
5
,
で
の l
午後条件付き生存率を算出する。

210

211.
[beta]
生存率
(
1年後 i
1..

0
.
9
0
.
8 .•

0
.
7・

中
一
一
}

0
.
6 .~

0.
5
0
.
4
0
.
3•

0
.
2
0
.
1.

。白山………
死亡

打ち切り

A
L
L

死亡

打ち切り

AML低リスク

死亡

打ち切り

AML高リスク

似'
I
s 病状グループと予後に閲する l午後条件付き生存率{血小板同{短時点)の 1
百ひげ│長i
生存率
(
1年後)
0
.
9
0
.
8c

0
.
7,

0
.
6

吟

J
i
l
i
‑
‑
:
:
:
生
時

0
.
5e
'
0
.
4↓
0
.
3

0
.
2

吋

0
.
1

川

o;
一一一,一一一一一一一 一
一
一
A
l
l
A
M
l低リスク A
M
l高リスク

A
l
l

A
M
t低リスク

3週以下

l
1

Ar
. 高リスク

3週 超

l
河 7 病状グループと同 1
!
‑
1
時
期l
こ関する l午後条件付き生存率 (
I
f
n小似問{短時点)の l
T
Iひげl
泌
女
[1
(
;i
こ手俳:
j
J
I
.
j
点の病状グループとその予 f
去について回目J
Iした 1
m小似阿 l
U
J
I
主点での 1午後条件付き生存率の箱ひげi
対を示す e 病

¥I
L高リスクと判定された!,l:者の宅存率か最も低くなる
状グループが Al

u

ぞれに対して、 A
:
¥
I
L低リスクの忠拐の生作率が h
iも

i
f
Eい。病状グループによって、 f
I
I
l
'
ト
板1
"
1復 J
I
i
i点、での生存率 k
i
手があることを!確認できる。なお、予後について、全てのグループで
死亡耐J
!
の生存不が{尽くなってしる
図 I
Iこ血小板数の回復時lV
ζ
H ついて}('i)j
I
Jした場合の 'U
下3
存O
)
f
:
j
j
ひげ凶を示す。手術後 3週間以内に I
f
I
l
'
J
、仮回復があった症例は、
G

それ以降に ~'llV:した症例と比べて生存率がi吉;くなる。また、全ての病状グループについて、 [HJ 峨の傾向が認められる。

6 まとめ
イヘントヒストリー解析のように、Jt変~ !
l
.
のι
Iが時 1
mとともに変化するlI.
'
i
l日
i
依存 1
1
1データが含まれる場合、従来の Coxの比例

こは、ベースライン '
1
:
{
了間数やベースライン崇 h
ν 、ザード L
I
U叙の f
j
f定などに W
d
M
.
!
J}
.
l
.
lカザEされてし、る。この};'J.を踏
ノ、ザードーモデル l
まえ本稿では、 G A:\I に広づく非線形モデルを提案し、 ff髄移柿データの解析を通じ、 H~~l.t の白効性を不したわ

具体的には、ょi
?
!
;
1‑d'単位による変形ト

mCVilA犯'
d
fし
、 G
A
'
.
Iの平滑化パラメータの沿 i
iN選択が d
I徒になった、日)従来、

Uデータの解析として広範に活月!されてきたヨーロ yパ 附W
H
寺
1
/
¥
1
依
作F

t
f
¥l全体を考目立に入れるため、

¥
'
f
!r
SlOlIモデルや }Iayo¥lλ
lI
a
t
.e
dモデルでは、観測

M

人の!1\者が tti!;~ ~~I の視 iJ!I1 似を生成しているにもかかわらず、":いに独立として従米の時 mJl;lòj 定

(
t
.i
m
e
‑
f
i
x
e
d
)烈の比例ハザードモデルで解析しているつそのため、従案 i
1;では郊 J
}
'尤!支 Id
妥刑することにより、この独立性を i
可避
している、川)生存l
時間航そのものを利用することにより、その非線形性を可視化でき、移楠後どれくらい '
Hiできるのか、安定

I
Y
Iはいつごろからなどを視 '
W
I
'
.
!に a
t
r
i
!できるようになった、

i
m

;
I
J
) 影響的i
I
!
l
l
f
i
'
i
i
の検出により、モデルを f
,
ド1
徒に l
. できるようになっ

ょによりモデルの妥"ii'
1を検 況できる、などの手I
J
}
去を有す一る c
た、りブートストラップi
I

参考文献

[
1
]
[
2
]

Altn川 1
.
D
.
G 川 d DοS
.
t
a
v
(

、
.
¥
'
ih pd d

t
. ¥
l
凡
t
.
f
' III円1.'-'11γ(>n}(~llts o
f.
11
附 C
OV
れr
i
a
.
U百 . ,
c
.
.
'
t
ot
̲j
もr
"
r
l
.
.
1
:
{
.九
1
I1
‑
:l
<
Il
.
A川 町 田 口 P
.
K
.and G
i
II
.H.D.(HlI
l2
)
.C
o
x
'
sn
叩
'
巴
引
gr
e
日旧
i
ο日川
】
1
ο
向d
怜
川
ο
叶Ir
γ
οC
υ
ω
1
1
川
日
I
I
t
l
山
日
1目 1
)
r
山
o
《
じ
凹
:
f
ο
何
'
お同
S λ lし1川叫:1
" 叫1 }日~e s
剖
a
削
日
山
叫
"
1
ν,
I
eδ
st.f叫..4川
η7
η
J
匂

S
l
l
l
l
i
川巧1.. 1
0
.1!()(J‑
1
1
2
0
.

211

212.
[beta]
ロ
] Anders(ηず I仁 Borgan,
[
‑
1
]

G
i
l
l,
R
.D
. a
l
l
d K
e
i
d
i時, N
.
(
H
J
9
3
)
.
8
t
αt
i
s
t
i
c
a
l
. Models Ba
.
.
5e
d ο
η

C
:ouη.
t
i
n
g Pm‑

c
e
s
s
e
s
.
S
p
r
i
n
g
p
r
.
C
h
r
i
s
t
e
r
日 l
,E S
c
h
l
i
c
h
t
i時 1
0
.,Anuc
悶
n,P
.
K
.,F
a
u
c
r
l
叫 ι
l
l,L
.,Schou,G.,Peuc
問 1
,s
.V.,J
.uh
l
.E
.,1
0
0
山 e
u
.
ヲ

H Tygstrup,N.a
l
l
dCopcllhagenS
.
t
udyGroupf
o
rL
i
v
e
rD出 日 目e(
1!
l8
6
)
.Upda
.
t
i
n
gp
r
o
g
n
o
s
i
s凶 c ] t
.
h
e
r
a
p
e
u
t
i
c
含

1
"
e
c
te
v
a
.l
u
a
t
i
o
ni
nc
i
r
r
h
o
s
i
swith C
O
)
(
' Sl
l
l
u
l
t
i
p
l
er
e
g
r
e
s
s
i
o
n model f
o
rt
i
l
l
l
e
‑c
1e
penden
.
tv
a
r
i
a
b
l
e
s
. Scand. J
.
e
f

G
l
l
s
t
T
o
e
n
t
c
T
O
l
o
g
y,21,
1
6
3
‑
1
7
4
.
沿
同
邑
斗
]
i

Chr
悶‑
PβC2T
町
r
、
r
巾
i
i
住
凶
叫
a
泊
dg
凶 r
r
加 p
s
(
H
J
9
:
幻
3
)
.じp
c
l
a
l
i
n
gp
r
o
g
n
o
s
i
si
nprimaryb
i
l
ia
.r
yc
i
r
r
h
o
s
i
su
s
i
n
gat
.
i
m
e
‑
d
e
p
e
l
l
d
e
l
l
tCoxrepピs
s
i
o
l
l
l
T
o
e
n
t
e
r
o
g
y
・105,
1
8
G
.
5
‑
1
8
i
6
.
model
.G
αs

[
(
;
]

C
o
l
l
e
t
LD
.
(
2
0
0
3
)
.Modellin!
JS1/.T'l'
i
l
l
a
lDalai
nMedic
a
.lResear
.
r
h,
2nded Chapman&
:Hall;CRC.

[
i
]

.
(
2
0
0
3
)
.Modelli吋 Bi
口
η
川
7
川
u
f
C
o
l
l
e
t
lD

(
叫
8
]

Cox D.
l
主(
1
9
7
5
)
ト
.
1
0
1
れ
削
l
.
r
l
川
t
i
川
a
1
1
1
i
k
印e
う
l
i

{
伊
問
叫
91

Ef
白
I
口n
,B.
イ
(
υ
H
l
8
め
8
)
.L口g
i
s
坑山
t
l
児C 問
1
肝
匂
g
♂
巾r
e
伺5
臼S
旧川n
.只日叩u
rv
i
v
a
la
n
a
l
り
5
戸阿
S
剖l
瓜
E
414425

日

宅

竜

、

司

i
江
1
吋
0
]

Efn
叩 .B
.出a
叩n
日 dT
i
沿
b
以
凶
〉
5
好
1
陥
山
刈
h
叫i
日川
r.

[
1り
]
J
[
1
2
]

J
‑
l白桔
S
叫
凶
t
i
怜
台
札
.T
..
J
.剖
a吋
H
l
仁
C
ITi
ぬ
h
活S
討h
吋i
r
a
乱剖
l
I
日
I
I
i
,R
.,
J
.(
υ
i甘
似
凶
9
川
的
的
0
)
.ι
Ge
印η
行α
昨
Tl
悶 r
lA
r
ω
ル
l
l
d
i
付
1
訂
M
叩l
Ieル
A
M
イ
f
ん
O
町
ω
fl
お
S,
仁
Ch
】a
戸
pl
n
a
日 &
:Hal.
l
.
J
.,T
i
b
s
h
i
r
a
n
i,H
..
J
.n
lHl
Fricdman,.
)
.
(
2
0
0
1
)
.1
'
1
防止、/ementso
JS
t山 s
t
i
c
a
l
.Lf
:α
7
"
l
l
i
n
g
:Dα
t
α J
1
.
I
ining
,1f
l
J
eI
ー
I
I
a
s
l
i
e,T

。

.
r
e
. ηdP
r
r
:
d
i
c
t
i
oη S
p
r
i
n
g
'
ぅ
r

れ7
1

可

[
l
:
3
] l~albfl田町 h , J.D.a
n
c
lf
'r
e
lt
.
i
c
e
.rU.(2002). 1
'
heS
t
a
t川 町U A
l
l
a
l
y
s.
i
so
f
.F.
ai
l
川、eT
imeDatα2uue
d
.
.Johu¥vi
l
p
v
[
14
] K
l
0
i
u, J.
1
'.
(
2
0
0
2
)
.!
¥
'
l
u
l
l
i
‑
s
a
t
e日山i肌ι
山
0
)c]出
c
i
お
sf
o
rb
O
l
川
l
山
c
】

1
1i
‑
1
:
N

[
1
:
;
弓
] Kl
凶
e
日
凶
l
口
叩I
口
1J
.
P
.
. Ke
町i
d
i
川
l
】g
,N. 加
a日 C
J Cop
刈a
則:孔 E
.A.(HI!
J4
)
ト
.f
'l
c
仁州 1
日l
暗 s
印u
叩n
1
n
l
雪

】t
礼
¥
1
>
吐
刈
i
日
l
i
t
i
e
so
fr
e
l礼p
s
e礼
叫12
山
刈
dC],山ロ
Y
a
此t
hi
ur
e
凹
1
'
】
l
1:
i
吋
昔
古
s
i
o
l
lf
!
位
(
)
口
〉
丸r
o
u
u
叩
(
(
,、
I
日l
l
u
r
r
o
w.
t
I
はl1s
p
l
a
l
l
t川.iO
l
lpa
.
t
i
e
u
l
s, S
t
s
t
i
s
l
.'
;
1
/
.l
¥
Je
d
.
.13
e
l
s
:
P
r
o
b
2
:
{1
:
;
‑2:3 ;~2

[
lG
] K
l
e
i
n,
J
..
P
.a
.ndMoesehberge
,
rI
V
!
.
L
.
(
2
0
0
:
1
)
.8
1
1
1"
'
;
1
1
0
/A
nalysは 2nde
d
.,
S
p
r
i
u
g
e
r
[
1
7
]

,

l
!l
a
r
u
b
i叫 E 山 ]
(
1V礼
,l
s
e
c
c!
l.
i'
I
d
.
G
.
(
H
H
l
.
5
)
.;
l
,w
l
y
s
i
l
l
gS
l
l
l川 町 1Dalaf
r
om.C
l
i
n
.
;
m
lT
r
i
a
/
sandο
b
s
(
o
7
"
'
V
(
山 ο
n
α S
f
(
山叫
,
)o
h
l
l¥
V
i
l
e
v
.

[
1
8
]

!
I
IcC凶 agh,P
.auc
JN
elde
,
rJ
.
A
.
(
1
U
8
9
)
. General
ぽ dL
ine
a7 λ
j
a
d
e
l
s,
2nde
d
.
.C
h
a
p
l
f
l
a
n& H
a
l
l

司
)
ヰ
]
[
1
!

仙'
I
川
u
l

M

C.H.
べ
(
υ
1
9
似
¥
)
川
め
4
川
)
.f
'r
imaryb
i
l
i
a
r
yc
i
r
r
h
o
s
iぉ:f'問d川 i
o
no
f只h
o
r
t
‑
t
e
r
ms
n
r
v
i
v
a
lh
a
.
"
,
donr
e
p
e
a
t
e
dpa
.
t
i
e
n
tv
i引い .H
αpa・
l
o
l
o
g
y
,20,12G‑134.

[
2
0
]

2
0
0
1
), ~C山比例ハザードモテ、ル』朝倉吉I占.
'
1
'村 附 (

[
2
1
]

大儒靖

;戸
叫
~2
斗]

[
2
:
勾
1
可
]

m

,i
兵1
I
1和
夕
、
!
.
t
.
)l
H
I
(
l
5
)
. r
生存時 r
m解 析j *大:!', HI~
T討剖山l
l
j
i
t
.
山
a
山】
u
叫
i

T刊叩I
j
i
比
t
九山川
u
吋
し
i
.主
!
I
'
!
.山an
叩 dS
ηk
口九 !
I
川2
引o
川
(
)
C
)
幻
)
. An
乱
叫
J
μ
戸
y
引
吋
討
叫
山
i
s
.0
'
1剖
s
剖
削
1
I
I
円
、
山
,
叫
川
a
1
リ
Jdatah
】a
v山 gt
i日山」吋叶
d
ル
ep円1
吋
d
巾e
日此 ∞
CO
V
3
川町
na
九匂
F
e
引n
T
叩
I
α
〈
uん
N
e
t
.
u
肌
人
,
.
.2
0
.3k!
J‑
:
3!
J
.
]
司

[
2
,
1
]

辻 谷 将l
別.竹深刻1
夫 (
2
0
D
9
)
. fRで学ぶデータザイエンス 6マシンラーニングJj
b立出版

[
お
2
判
口
司
]

T ,1
リ
J
川
i
比
t
a
企
出
1
山叫
叩
n
1
只
何
刊
刊
刈
:
口
尺
吋

、

也
Zf
"【
C
C
Ja
d
d
i
礼
t
.i
¥
v
e1
m
日】
日10
正
c
1e
l
s
ヨ
3
. C印
o
I
山Ilp
u
t
a
t
i
o
u
】a
1剖audMa川
t
t
は
h
閏e
町I
】
日l
a
t
i
c
叫
a
t
l
.
五
Melhodsi
ni
'
v
、
レ
吋
'
l
I
e
d
i
c
i
l
悶 ,2
0
1
2
.AI
礼t
i
c
l
eIDD8GI76
i

[
2
(
;
]

i
t
a
n
i,
1
¥
1
.andTa日 出 札 Y
.
(
2
0
1
a
)
.九i叫 l
y
s
i
sL)fl
w
a
r
t.
t
I
<
I
]I
S
I
山 川 計 u山 礼1
dat札 口封i
叫 g
e
n
e
r
a
l
i
z
刊i
山I
d
i
.
t
i
v
eII!O山 l
討
TSlIj
Comput
,
a
t
i
o
n
a
land九l
a
t
h
e
l
l
l
a
t
i
r
a
l¥
l
e
t
h
o
d
si
uM
e
d
i
r
i
n
e
.:
2
01
:
3
.A
r
t
i
r
l
pIDo
O
¥
)
8
f
,
i

[
2
7
]

辻谷将問、中井崇人 .
1
1
1中祐輔 (
2
0
1
:1
)
..~t悩移 Mデータに!則するイベントヒストリー解析,絞141 中

ロ
{
28
]
iド:~約叫
町]
O

¥V
o
o
d
.S
.
N
.
(
2
0
D
4
)
.Sr
.
,
同
a
】b
l,a
剖山
川
u
1
J
.A 附
m
l
附
¢
e
引
γ
『
7
れ
肌
'
. S
t
ω
a
ω
f
4
れ
7
叩8
1. AS
剖
9
弘叩
80
閃c
.
.9
9
.o
7
:
3
‑
t
i
創
8G
.
2
羽0
0
山4
.
¥V
ood,S
.
N
.
(
2
0
0
G
)
. GencmlιedAd
d
i
l"
'
fMo
c
le
t
.
,
:A71 r
山 υ
ducfionwifhR
.C
I凶 p
l
l
l
a
l
l&
:l
Ia
J.
I
九
w
,桁
r
(
り
}
川
(
)
町
吋
)
(
l
.S
.i
¥
'.
(
2
0
0自)
.F
吃d
川
,l
じ
凶
s
t討
は
山
t
れ川
a
I
汁
山
h
】1
,
)
、d
i
口
削
r.

[
3
1
]

Zha時 P
.
(
H
J
9
3
)
.l
v
l
o
d
ds
l
'
l
(
引i
O
l
lv
i
a1
1
1山 i
f
o
l
d<
:
r
りおお v
a
l
i
d
a
t
i
o
l
l
.Ann.S
l
a
t
i
st
.
.2l
.2
9
f
l
‑
3l
:
l

J
]
[
2!

号

S
五
f
;
う
'
ta
t
日
,
8t
.Soc
仁,
.B70AD与
5
‑
, 18

212

213.

I 山 ¥ T …, 鮎 ユ ー ザ ー 触叶m .NJI …内リユ S 隠れマルコフモデルにおけるベイズ推定 稲葉洋介/株式会社新日本科学 宮岡悦良/東京理科大学 Bayesiane s t i m a t i o nf o r HiddenMarkovModel YosukeInaba/ShinNipponBiomedical L a b o r a t o r i e s EtuoMiyaoka/Tokyou n i v e r s i t yo fscience │山手一千食喜一…←I 一 一 一 :2 白 州l コ 要旨: ベイズ推定による隠れマルコフモデルのパラメータ 推定を SAS/IMLを用いて実装し、実際のデータに適 用した。 キーワード隠れマルコフモテゃル、 HMM、H i d d巴n MarkovMod巴l 、ベイズ推定、 MCMC、フォワード・パッ クワード、ギブス・サンプリング、 L a b e ls w i t c h i n g 213

214.

隠れマルコフモデルとは ー観測不可能なマルコフチェーンの状態列 ( P a r a m e t e r P r o c e s s )、及び各状態をパラメータに持つ確率分布から の観測可能な出力により構成される確率モデル 日 状態(観測不可能) 一 〉 P a r a m e t e rp r o c e s s 2 1 4 ・ ・

215.
[beta]
:地震データへの適用
Major earthquakes(magnitude 7 or greater)

一58
'0 む出'-'叩

1 9-1'

喝。

1~0)

1070

1~1針。叩

2叩川

year

※ デ タ はU
.
S
.G
e
o
l
o
g
i
c
a
lSurveyの ホ ム ペ ー ジ
(1、一:Wi!品~~~tb.gq.~.k~.:~.~g~:..g主主L~mbg~l~k説明 }rこ卜'ÍY_ÇéÎ)より取得
静 5

例:地震データへの適用
Earthquake dataandPoisson
D
i
s
t
r
i
b
u
t
i
o
n

•

008

•

006

.
•

且"

004

002

。
。
。
"~ v

J
出 I
r
幽
v' .
,
f O
'.
)
'‑
s
' <)

"
0
"
"~ぜ".f.;> "
.
.
.
.
'
4"
6
"
"
.
>
"
6
>
'
$♂o
'
=
>
,
♂
J守コJθ、r~..r'"(σJノ J巳f> .-:ç"o.;>... ..ç,~ず..i'J""(σ ~7J'

・
c
o
u
n
t

1
口 印 刷H

POU
5$Of¥ D
Ui出 回 │

静 6

21
5

216.

例:地震データへの適用 PoissonQ‑Q Plot ︒ 40 。 ︒ ︒ ︒ ︒ ︒ ︒ ︒ ︒︒ ︒ ︒ 000 0 0 ︒ao ︒ ︒ ︒ ︒ ︒ 0 0 0↓ 叩 0 00 1 0 ︒ ︒ ︒ ︒︒︒︒ gm " 25 20 JO PoissonOu a n t i l e s . .7 例:地震データへの適用 ー以下のモデルを考える。 ,ポアソン分布のパラメータは年毎に変化する ,パラメータは、前年度の状態のみに依存して、一定の確率で 推移する 田園砂 隠れマルコフモデルの 適用 静8 216

217.

定義:マルコフチェーン ( 1) トc (の={C{ε{l, . . ,m ) 1日 N}:離散確率変数列 ト 任意の tεNに対して c(ゆが以下を満たす時、 c(のをマ ルコフチェーンと呼ぶ。 pr(C什 1 1C( の )=Pr(Ct+1ICt) ーマルコフチェーンのパラメータ ト Yij:= P r ( C s +t= j l Cs= i ) :推移確率 ー(特!こYリがs lこ依存せずに決まる時、このマルコフチエー ンを homo民 niousと呼ぶ。) ー f : = ( Y i j ) :推移確率行列 ー 10 217

218.

定義:マルコフチェーン ( 2 ) ー δ:=( P r ( C1 = 1 ),Pr(C1 ニ 2 ), … ,P r ( C1 = m)): 初期確率 ー※ 1ニ ( 1, … ,1 )として δl'=1 ト特に δf=δ の時、このマルコフチェーンを皇室血 { s t a t i o n a r y )と呼ぶ。 ー 11 定義:ポアソン分布 ト定数 λ>0に対し、自然数を値にとる確率変数 X が以 下を満たす時、 X はポアソン分布に従うと言う。 、 τ 「 ke λ p(X=k)= ト以後、平均 Jのポアソン分布を Poisson(λ )と表記する。 ト性質:ポアソン分布は再生性を持つ。すなわち X ‑Poisson( λ ),Y‑Poisson(μ) =宇 ~ x+Y‑Poisson(λ+μ) 1 2 218

219.

定義:ポアソン隠れマルコフモデル ーc (の:マルコフ性を満たす 'ParameterProcess' ーx (の :c (のからの出力 ーこの時、 { c ( t ),X(の)が以下を満たす時に隠れマルコフモ デjレと呼ぶ。 り 早 Pr(CtICt ‑ 1) ι C P r ( C ( I C ベ θ C)=P P Xr ‑ IX ( t ‑ 1 ) ,C r ( X t I Ct ) ー特に X (のがポアソン分布に従う時、ポアソン隠れマルコ フモデルと呼ぶ。 ー 13 ポアソン隠れマルコフモデルのパラメータ は : = ( λ v, . Am) 各状態のポアソン分布のパラメータ げ:=( Y i j ) 推移確率行列 バ:=( 01, δ 2 '… , Om) 初期確率 ー上記パラメータの推定が本発表の主目的である。 静 1 4 219

220.

隠れマルコフモデルのパラメータ推定方法 ー D i r e c tm a x i m i z a t i o n アルゴリズ、ム ー B aum‑Welch ーベイズ推定 e t c 酔 [ 5 隠れマルコフモデルの尤度関数 J 1 i ( X )・ =Pr(Xt= xlCt= i ) イ P(x ーとして、尤度関数 LTは以下となる。 L T:=p r ( X(T)ニ x(T ) ) エ刊の= 町 X( T ) .C( T )= c エ り =δp(x1 )rp(xZ)rp(X3)…rp(xT)11 . T [6 2 2 0

221.

前向き確率 ( f o r w a r dp r o b a b i l i t y ) ー前向き確率 α tを以下のように定義する。 αt. 二 δ P(x1)fP(x2)fP(x3)…fP(xt) t E { , l… ,T} ーこの時、以下が成り立つ。 LT= αT 1 ' αt‑ α tー lfP(xc ) t J=X( αt U )=P r ( Xl t ) , Ct =j ) ー [7 後ろ向き確率 (backwardp r o b a b i l i t y ) ー前向き確率と同様に、後ろ向き確率を以下のように定義 する st:=fP(xt+1)fP(xt+2)…fP(xT) 1 ' t E { l,…,T‑1) O ーこの時、次が成り立つ。 s t ( i )=Pr(X~:)l =x~:)lICt =i ) ー [B 2 2 1

222.

前向き‑後ろ向き確率について ~ t E { l, …, T }について、以下が成り立つ αt Ci )品( i )=Pr(X(T)=X(T),Ct=i ) αtβ~ = P r ( X ( T )ニ X(T)) = LT ー 19 2 2 2

223.

ベイズ推定について ,ベイズ統計学の考え方に基づき、観測事象(観測された 事実)から、推定したい事柄(それの起因である原因事 象)を、確率的な意味で求める事 砂主観に基づ、きパラメータの事前分布 ( P r i o rd i s t r i b u t i o n )を仮定 する L i k e l i h o o d )から事 砂ベイズの定理に基づき、観測事象の尤度 ( 前分布を更新し事後分布 (Posteriord i s t r i b u t i o n )を構成する 砂事後分布の代表値(平均、最頻値等)をパラメータの推定値と して採用する ベイズ推定=参事後分布の形状が主な興味 ー21 ベイズの定理 p パラメータ 0 が事前分布 π ( 8 )に従う時、データ d が観 測された時の事後分布rr(司のは以下で表わされる。 P 事後分布民尤度×事前分布 事後分布 l / イ /" 尤度 町一│ 門C門Cの 手J I用 静 2 2 223

224.

共役事前分布について ー尤度関数として分布 P ( d I 8 )を選ぶと事前分布 π(θ)と事 後分布n{D1めが閉じ確率分布族に属する(関数形が同じ になる)時、 π(θ)を確率分布 P ( d l θ )の共役事前分布と呼 ー共役事前分布の種類: 室 歪 彊 酒 ・ ・ ・ ・ ・ ・ ・ ・ ・ E 7 Ei軍~l.iJt己~t司fi~圃・・・圃・園田富 )二項分布 ベータ分布 多項分布 ディリクレ分布 ポアソン分布 ガンマ分布 静 2 3 ディリクレ分布について ー密度関数: t v:=(Vl>… , VK) パラメータベクトル、 t x: (x1, …,XK)データとして、 二 ・ 1 Di γ(X=x ;v)=~ ーここで、 n 日 K i‑1 XiV I (X‑Di γ( v )と表記) │ ガンマ関数│ =培技j,G亡了子 tt九 t い ゆi=1,vi>0,Z X ー※ディリクレ分布は多項分布の共役事前分布 2 4 ー 2 2 4

225.

ガンマ分布について ,密度関数:尺度母数 a、形状母数 bを用いて と 二 !(X=x;a ,b)= x α le‑bx f ( α ) ーまた Gamma(α,bj と表記する o i : '平均 、分散:会 ,※ガンマ分布はポアソン分布の共役事前分布 ー25 MCMCについて 炉 門 C門 C= 門a r l くo vChain門 onteC a r l o 興味の対象の確率分布に対し、その確率分布に収束するマ ルコフチェーンを生成してサンプリング、を行い、分布を推定す るアルゴリズムの総称 砂今の場合、事後分布の積分を直接算出する事は難しい場合 が多い(分母の積分が計算が難しいため) →サンプリングにより事後分布を近似的に構成 → 門 C門Cの利用 b , • 2 6 225

226.

MCMCについて ,ベイズ推定で利用される門 C門Cのサンプリング方法は 主に以下の 2種類 砂メトロポリスーへイステイング(門巴tropolis‑Hastingalgorithm) b 提案密度 ( p r o p o s a ld e n s i t y )と提案された候補の棄却方を用いてマル コフチェーンを構成する ーギブス・サンプリング (Gibbssampling) の特殊な場合(棄却を行わない) 1 ・ 門 ・ Ha l g o r i t h m b 収束は門・ Ha l g o r i t h mよりも早いが、対象となる確率分布のパラメー f u l lc o n d i t i o n a ld i s t r i b u t i o n s )が分かって タの完全条件付確率密度 ( いる事が必要 ~ 27 ギブス・サンプリング詳細 ( 1 ) ー e : =( θ 1, … , θπ)をパラメータベクトル、またパラメータベ クトルの各要素の条件付確率分布を π1( ( 1 1 1 82 , … , 8, ふ π2(θ21θl'θ3', …θ yふ …, πη(θη│θ2', … θn ‑ l ) ,とする。 ー 28 226

227.
[beta]
ギブス・サンプリング詳細 (
2
)
P アルゴリズム詳細:

パラメータの初期値仰:ご

l

(
θ
j
O
L ,f)を与える。

2
. 以下を j‑
=
‑
0,
1,
…,M について繰り返す

)ング
(
e
i
ヤ;j),.
J
Y
)
)から θ
j
川をサンプ 1
川, θ
,
〉 A
;
j
j
)
)からり川をサンプリング
zh(θJj〉│
9
1

π1

、

ぶ

・
・
・

θ
j
ヤij+1), J;21})から θjj+1)をサンプリング
πn (

3{
θ
(
1
),… ,e(M)}を返す
,

島 2
9

ポアソン隠れマルコフモデルでのベイズ推定
~ {
C
(
l
),
X
(
l
)
} ポアソン隠れマルコフモデルのパラメータ
λ=(
λ
l
'~..λ川)
各状態のポアソン分布のパラメータ

,

~ r= (
y
ρ
シ

推移確率行事J
I
前向き確率
η:=,
1
j‑ ,
1
j‑1 各イの増分 λ
(

α
t

。
=0)

,

推移確率行事J
Iのr行 成 分

、ち ‑Gamma(α
j,
bj) と仮定する。

砂アイデア;
曽
分
(
・1
~ Xfを、イの各 i
lme・)からの寄与 (
'
r
e
g
i
m
ec
o
n
t
r
i
b
u
t
i
o
n
s
'
)に分解
モg
する。

X
,
=L
.
X
l
t(
X
;
,
‑POisSon(r,
)
)1後述する・凶 elSwi山 19の問題を
,

I

砂ここで c(t) = iの時、 Xj,
(i<j<m)1才 i
n
a
c
t
i
v
e
'
静 3
0

227

回避する為

228.

Labelswitchingについて ー λ=( λ l '…λ 1 1 1 )r こついて、)1慎列を保持せずにサンプリン グを行うと、構成した各要素の事後分布が一致してしま う問題 ー31 Labelswitchingについて ー平均 :μ=ωl'J . l .Z )の2状態 Gaussian隠れマルコフモデル での門 C門C実行結果 C S c o t t ( 2 0 0 2 )P342より引用) j 言 富 日 z t pz Q F 宕 s 日 ‑ 0 . 0 2 0 . 0 p " 0 . 0 2 0伺 0 . : : ) 2 0 . 0 口口2 P町富陀司,,~ 胴脚『 J ll く μ 2 制約無し ー 32 228 0 . 0 4

229.

隠れマルコフモテ、ルへのギブス・サンプリング の適用 ト F、τの初期値を設定 2 . 状態列のサンプリング x 出力 (T)と現在のパラメータ推定値r 、A から状態夢IJのマル コフチェーン c (のをサンプリング X(T)を分解 3 . 2で、サンプ 1)ングした状態列 C(I)を基!こ , X(T)を各 T毎 の'regimecontribution'l二分解 各 1¥ラメータの分布を更新 4 静 と3で c ( ω 1 ) u υ )の分布を更新 更新した分布から各パラメータをサンプリング 2に戻る(繰り返す) 5 6 . 静 33 状態列のサンプリング 1 . CTをサンプリング Oをパラメータ推定値として、条件付確率分布は CT, X ( T ) I O ) α t(Ct ) Pr( pr(CTlx(T) , O)== 一~ C( (Xt (C ) t Pr( x ( T ) I O ) LT P ここで、 2 . CT‑2, … , C1をサンプリング、 条件付確率分布は P市 t x( I x( T ) ,C [ + l '0)αPr(Ct I x ( T ) ,O )pr(x[+バ[+1l t ) , Ct , 0) T ) , O)Pr( Ct +11C )pr(X[+l'C[+zlx(t ) , Ct , Ct +1, 0) αPr(Ct I x( t + 1I Ct , 0) は α t(Ct )Pr(C t • 3 4 229

230.

xのを分解 ー定理 1 : ~ (Xlぃ ,Xit)の条件付確率分布は Xr, 住 . . . , Ti) をパラメータ に持つ多項分布に従う。 Li~l 勺 砂多項分布の確率関数: P r ( χ l ' , …χk;n,p1'…,Pk) ! 訂 元: p f 1 fn nL ) ,P1 ••• p" VVlII:OlI / . A .k 一 multi(x, p) と表記する。 ー ー 35 各パラメータの分布を更新 ( 1) ー T :=( t i j ) 現在の C(T)で 、i からj への推移の発生回数の r a n s i t i o nc o u n t s ) 行列 (matrixoft ~ T 行成分 r : T のr ーこの時、 fr の分布は Dir(vr+Tr)に更新される。 ~ 36 230

231.

各パラメータの分布を更新 ( 2 ) ~ Nj: # {CtI Ct>j}として、可の分布は 二 cαmmα(αj+ZtJ p に更新される。 p →各パラメータの分布からパラメータをサンプリング 静 37 Reference ~ ~ W Z u c c h i n iandLL .MacDonald(2009).HiddenMarkovModelsf o r TimeS e r i e s,CRCP r e s s . RDurbin, SEddy , AI くo rgh, andG M i t c h i s o n (1 9 9 8 ) .B i o l o g i c a l SequenceA n a l y s i s : P r o b a b i l i cModelso fP r o t e i n sandN u c l e i cA c i d s . CambridgeU n i v e r s i t yP r e s s . ~ Baum, L .E ., P e t r i e, T . ,S o u l e s, G.andWeiss, N.( 1 9 7 0 ) . Amaximization t e c h n i q u eo c c u r r i n gi nt h es t a t i s t i c a la n a l y s i so fp r o b a b i l i s t i c f u n c t i o n so fMarkovc h a i n s .Ann.M口t h .S t 口t i s. t4 1,1 6 4 ‑ 1 7 1 ~ S c o t t , S .L .( 2 0 0 2 ) .B a y e s i a nmethodsf o rh i d d e n門 a r l くo v m o d e l s : R e c u r s i v ecomputingi nt h e2 1日 c e n r u r y .j .Amer.S t a t i s t Assoc.100,359‑369 ~ Chib, S .( 1 9 9 6 ) .C a l c u l a t i n gp o s t e r i o rd i s t r i b u t i o n sandmodal e s t i m a t e si nMarkovm i x t u r em o d e l s .j .Econometrics75,79‑97 b 小 西 貞 貝1 ],越智義道,大森裕浩.計算統計学の方法朝倉書庖 静 38 231

233.

名簿の住所情報を市区町村名で自動分割する S A Sプログラム 安井浩子 周防節雄 (公財)統計情報研究開発センター 兵庫県立大学・名誉教授 研究開発部 TheSASProgramt h a tSeparatesJapaneseAddressI n f o r m a t i o nW r i t t e ni nK a n j ii n t o TwoPa同s ;P r e f e c t u r eandW a r d / C i t yl T ownNil l a g e,andt h eRest H i r o k oY a s u i SetsuoSuoh S t a t i s t i c a lI n f o r m a t i o nI n s t i t u t ef o r TheU n i v e r s i t yo fHyogo C o n s u l t i n gandA n a l y s i s P r o f e s s o rEmeritus R&DD i v i s i o n 百干干ヒ二a :久ー日 エクセルのファイル形式で入力された名簿の住所情報を「行[烹: 1 1 1 ] 一村名で自動分割する S A S プログラムを開発した。住所情報のセルの中に都道府県名が一緒に含まれている場合と、 分離されている場合のどちらでも処月!が可能である。更に、都道府県名のセルに誤って市 名が入力されていても対応できるようにした c キーワード:郵便住所、 p r o c川 p o r t、 p r o ct r a n s p o s e、 m e r g e文 、 引 l l CI u d e文 階層構造のデー夕、データハンドリング l はじめに エクセル形式の住所名簿の情報を、市区町村名の前後で臼動分割する S A Sプログラムを I 立を認めたので、 作成した。処理対象になるエクセルファイルには最大限の構 J岩上の自社I ユーザにとっては使いやすいシステムになった c 本システムを使えば、ヤー b . 見の大合併等で L I住所の検出も容易にできる。 住所表示が変更になった I 本論文の解説に使用したデモ用の名簿ファイルの住所情報は、「何丁目何番地や「ピル、 マンション名 Jの部分には全て変更を加えたが、 0市 xI ! I J J レベルまでは実在する(ある いは実在した) (t所哀一示であり、本システムの作動確認には影符しない= 2 システムの概略 処理できるエクセルファイ J [ "の f i l i造は表 lに示すように、間;道府県名とそれ以外の住所 l t lわらず適用できる c 更に、都道府リL i名が分離済みの場合には、 が分離済みであるか否かに I 1 i ' i r 、 , i j t L,府」、「県 j の文字がな〈ても、付加して〈れる。 郎道府県名欄に i 235

234.

表 l デモ用名簿 ( 5 3 4件)の 3種類のデータ構造 A S変数名を l行目に入力 処理対象の住所情報ファイルには、以下に示す@または@の S しておく必要がある。 ① 部 道 府 県 名 と 市 区l 町村名以下の住所情報が既に分離消みの場合 ( id ), zi p ,p r e f, a d d r e s s, ( b ui I di n g ), ( n a m e ) ②都道府県名と市区町村名以下の住所情報が分離されていない場合 ( id ), zi p ,p r e f̲ a d d r e s s, ( b ui I di n g ), ( n a m e ) 折弧で閉まれていない変数名とそれに対応するデータは必須℃ある c f t ; i 弧で I I Hまれた変数名とそれに汁応するデ ‑ 9はなくても長い エクセルファイル内でのこれらの変数の順序は わなし。 l ' i ; l 道府 I P 、 分m l i型では北海道の一道」はあってもなくてもよい】 r m v [ S A S変数の説明] ' :わない) 1 ) ( i d ) :i d醤号(数値引、文字型は I~ J f 2 ) zi p:郵便番号(前半 3桁と後半 4桁の問のハイフンの令 1 n ,は問わな L、 c また、郵便番 号がハイフン無しで 7桁の数字で入力されている場合に、先頭の数字が Oであるために エクセルファイルで保存した際、その Oが欠吊していても桝わない。) 23 6

235.

3 ) pref:都道府県名 ( i都 i 、「道」、「府 J 、「県」の文字の有無は問わない) 4 )a d d r e s s :都道府県名以外の住所情報(先頭に都道府県名が含まれていても可) 5 ) pref̲address:都道府県名を含む住所情報(都道府県名は省略も可) 6 ) ( b u iI d i n g ) 住所情報の最後にあるピルやマンションなどの情報 d d r e s sや p r e f ̲ a d d r e s sと一緒になっていても可) (この情報は a 7 ) ( n a m e ) 宛名情報 [ j ' f報かフゾイルに含まれていても、シ なお、表 iの「補足情報 Jのように、これ以外の ' ステムの動作には影響しない。 A Sプログラムから I j xるc 本システムは以下の①から④の 4つの S ① h o k k ai d o .s a s:北海道の i (総合)振興局 解説する 名と l t l i名の対照表を作成する。詳細i は次節で L n ② m a k e ̲fi n aI ̲ k e y .s a s:① h o k k a i d o .s a sの た ; J ‑c̲表を利用して、北海道の i (総合)振興局一 名を官 [ i名に変換して、最新の全面市医町村名 ( ] 9 0 3(![:)から成る S A Sパーマネントデータ )を作成する。 セッ卜(表 2 表 2 最新の全国市区1lI]村名(] 9 0 3件)の全 J ) ス卜から成る S A Sパーマネントデータセット 市区 町村名 文字到 の長さ 市区町 I1 村総数 このプログラムを一度実行すれば、① h o k k a i d o .s a sも九 i n c l u d e文によって自動的に実行 A Sデータセットはパーマネントデータセソトとして保存さ される。その結果作成された S れるので、全岡市区町村名の変更がない限りはこのプログラムの再実行は不必要となる。 r e a t e ̲ o r i g i n a l ̲ d s .s a s 分割処理したい佳所情報(エクセルファイル)を S A Sデータセ ③ c ッ卜に変換する ο ④ fi n aI ̲ r e s uI t .s a s:これを実行すれば③c r e a t e ̲ o r i g i n a l ̲ d s .s a sは引 n c l u d e文によっ A Sデータセットの住所情報を、② m a k ef i n a l て自動的に実行され、その結果作成した S k e y .s a sでパーマネント S A Sデータセットとして保存されている市区町村名を使って分 割処理が行われ、分割成功と失敗の 2つのファイルが C S Vファイルとして出力される。 3 . 最新の全国市│丘町村名の名簿ファイルの整備 if 5 < . I nJ村名で分割するには、全国の全ての市医町村名のデータベースが必要 住所表記をr! t i Tl 守(統計基準担当)・統計研修所』のウェブサイト になる。『総務省統計局・政策統r ( h t t p : / / w 州 .s t a t .g o .j p / i n d e x / s e i d o / 9 ‑ 5 .h t m ) に、「統計に!日いる標準地域コード(平 237

236.

成 25年 : 1月 28日吏新 ) J の全国版が c s vファイルでアップロードされていた。これを、 A S変数用に修正して、エクセルファイルに保存(付録1) 表頭のローマ字表記の項目名を S した後、 p r o ci m p o r tで S A Sデータセットに変換した。 [問題点]この「統計に用いる標準地域コードーには、付録 lに示すように、北海道のみ (総合)振興局 郡部名の表記がなく、代わりに i の名称があり、これは郵便の宛名として は使えないので、'I t 日部名に変換する必要がある。 [対策 1i (総合)振興局」名と郡部名の対応表が「市 I I I T村コード一覧表 (総務省地方公共団 0 1 3午 2月 l日現在)として h t m l形式で以下のサイトにあった(付録 2)0 体コード一覧表:2 h t t p : / / w w w . t t . r i m . o r . j p / ‑ i s h a t o / t i r i / c o d e / c o d e . h t m (ただし、このサイトは正式な 公的サイトではない。) このサイトには部道府県 V I J I二市区 H庁村ファイルがあるので、そのうちの北海道の部(付録 2参 照)のみを c s vファイルとして保存した。付録 2に手すように、このファイルは階層構造をして おり、一旦そのままで S A Sデータセットに変換した。このうち直接処理に関係する部分を示 したのが図 lの右端のリストである。町村名に「振興局 の文字列を含むオブザベーショ ンと、市町村コード欄に「本料}があるオブザべーションに注目して、図 lの lド央に示すよ (総合)振興局名 + 1 1 1 1部名+町村名 うに、北海道の i の対応表を S A Sデータセ、γ 卜として 作成した。ここまでの処理は h o k k a i d o .s a sで行った c 北海道の 図 l 北海道の(総合)振興局名を郡部名に変換 238 市町村コード一覧表

237.

この対応表のファイル 1 ( 玄1 1 中央)と、先の.~田市医町村名の名簿ファイル(図 l 左)とマ ッチ・マージして、北海道の郎部名を付与して、全国の市 I KI !J 村名を S A Sデータセット ( 1 変数、 1 9 0 3オブザベーション)として保存した。ここで言う I F ! i医町村名」は、区政を敷い I I J )村の場合は、「郡名+町/村名」を指すc ている市では「市名+区名、 I その S A Sデータセットに p r o ct r a n s p o s eを施して、全国の全ての市区町村名 ( 1 9 0 3件) 9 0 3個の変数に保存して、 lオフザベーションから成るパーマネン卜 SASデータセット を 1 ( 表 2参照)を作成した。その際、件数の値 1 1 9 0 3 J 及び、各市区IlIr 村名の長さ(ノ tイ卜数) A S変数として保存した。この処理は m a k e ̲ f i n a l ̲ k e y .s a sで行った。 もS A Sデータセットを、分割するための区切り↑i s j報として利用して、以 このパーマネン卜 S 下の子 1 ) 債で、住所情報を市区 I I I J村名の前後で、分割した c 4 . 分割対象の名簿ファイルを S A Sデータセソトに変換 c r e a t e ̲ o r i g i n a l ̲ d s .s a sの ' 1 'で p r o ci m p o r tによって分割対象の名簿情報を S A Sデー タセットに保存した。この時、最後に元の 1 1 1 f t序に並べ替えができるように、IlIEi番号 ( i d n o )も付した。 5 . 名簿ファイルの S A Sデータセヴ卜を市区町村名で自動分割 最終目的である名簿ファイルを市区町村名で自動分割する処 i fj!を、以下の手順により、 S A Sプログラム f i n a lr e s u l t .s a sで行った。一連の処理は付録 3に図解している。また、 付録 4に本システムの 4つの S A Sフ ログラム lをJ t j,賊したっ q 型か一体型かを'F J I別して、 ①分割対象の名簿ファイルカワ節で述べた「郎道府県分月H 一体型の場合には、まず分離型に変換する。 ②名簿データセソ卜と分割問情報のデータセットをマソチングして、市区町村名の前 後で分割した。分 ~ilJ に成功したオブザベーションと失敗したオブザベーションをそ れぞれ別のデータセヴト仁保存した。 ③ 分1 i l Jに失敗したオフザベーションのうち、 I JJj復できる入力エラーについてはリカバ リー処理を施した後、もう ー度①を実行し、成功、失敗のオブザベーションを①と は一旦別のデータセットにそれぞれ保布‑したこ ④①と②で作成された;つの成功のデータセットと二つの失敗のデータセットを、そ れぞれ s e t文で一つのデータセットにまとめたっ ⑤成功のデータセットと、失敗のデータセットに対して、 t 1 i 初に名簿データセソトに I I H番一号 ( i d n o )で、ソートをして、元の順序に投べ称えた c 付与した I ⑤成功・失敗のデータセソ卜をそれぞれ C S Vファイルとして出力した。 I 付録 4に JtjiJ有した 4つの SASプログ弓ムは F J人も何人的に使用するのは悩わないが、辞作権は本論文 の符告にある c 239

238.

6 . 分割失敗の原因 本論文の解説ではデモ用の住所名簿を使ったが、いくつか試みた実際のデータに対して 本プログラムを実行して出現した分割失敗例を綿密に調べた。その結果、正常に分割でき ない主な原因を以下のように分煩することができた。 ① r b区町村名が抜けている ② 新規の政令都市指定による新区名が抜けている ③市区町村合併による市区町村名の変更 ④ 市 区1 1 1 ] '村名に異字体が使われている 例えば、「鯵J(アジ)と「鯵」、「渡辺 J と「渡遺J ⑤似た漢字の間違い、例えば、「鳥ー(トリ)と「島J (シマ) ⑥漢字変換ミスと忠われるエラー。例えば、「長」を 1 1 1 1 ] 'J と誤変換。 ⑦ 「 ケ j を「ヶ j で入力。例えは、被浜市「保土ヶ谷区」を「保 Lヶ谷区 J ⑧ 元の名簿が都道府県分離型の場合、住所表示部分に余分な都道府県名が あるために、正常に分害J Iできない c (ただし、この入力エラーは 1 5節の②J で自動的に回復処理ができるように改善済み) 7 . 結果とまとめ C S Vファイル)を、見やすさのためにエクセル形式で 都道府県分離型データの処理結果 ( 表 3に示すc 同表の(1 )1 デモ用名簿ファイル J(534 (*)は市区町村名で分割したい元デー 夕 、 ( 2 )1 最終結果住所ファイル Jは分割に成功した住所表示、 ( 3 )1 住所分割失敗」は失 敗した住所表示である。黒地に自字で示した 3f 斗[表 3の ( I ) Jは市町村合併で住所表示が変 わった結果、現在は実在しない住所表示のためにエラーとなった c 表 3の ( 3 )にはエラー原 l 羽も表示した。 また、第 2節で示した S A S変数以外の情報(たとえば表 3(1) の IfíH}~情報 J )は結果のフ ァイルには含まれな L 。 、 郵便番号は前半の 3桁 ( zi p1 )と後半の 4桁( zi p 2 ) (二分離したものも表示した。実際には C S V ファイルなので、前半部や後半部がゼロで始まっても、実際には必要な数だけ 0 がファイ ルに含まれている。 1 1 ] '村名て、分割することであったが、結果的 本システムの当初の目的は、住所情報を市区 1 には、市区町村合併や[夫政移行による!日住所やデータ入力エラーも検出できたことになる。 つまり、膨大な住所情報に対して、日視による住所表示のチェックを逐ーする必要がなく なるということになり、それだけでも業務の大幅な省力化をもたらす結果になった。 昨今、「ビッグデー夕日というキーワードが流行しているが、そういうデータの処理には A Sには高度なデータハンドリン し、わゆる「データハンドリングが必ず伴うことになる。 S グ機能が備わっており、今凶作成した一連の S A Sプログラムでも、 S A Sによるデータハンド リング機能を最大限に活用した c 全ての S A Sコードを付録 4に抱載している c 付録 3には 本システムの全ての流れを示している c この付録 3と 4を一緒に参照することによって、 これから S A Sによるデータハンドリングを学ぼうとしている S A Sユーザの持さんの参考に ない幸せである c なれば、著者としてこの t 240

239.

表 3 デモ同名簿ファイルの処I'f!.結果 ( 1 )デ モ 用 名 簿 フ ァ イ ル ( 5 3 4件の冒頭部) ( 2 )最 終 結 果 住 所 フ ァ イ ル ( 4 5 7件の冒頭部) Z l p z i p 1 z i p 2 p r e f a d d r e s s 1 i d n o i d 3 1 北海道 札幌市北区 1 1 47135001‑0031 4北海道 札幌市厚別区 2 1 47167004‑0004 4 3 1 50019010‑8622 1 0 1 8622秋田県 秋田市 4 1 50033011‑8677 1 1 1 8677秋田県 秋田市 1 2 8502秋田県 湯沢市 5 15 0 1 7 1012‑8502 6 1 50156013‑8504 1 3 8504秋田県 横手市 1 6 18 6 0 1秋田県 能代市 9 1 50097016‑8601 1 0 1 50058017‑8686 1 7 1 8686秋田県 大館市 1 1 14 9 4 1 1020‑8677 2 0 8677岩手県 盛岡市 1 8604岩手県 一関市 1 2 49474021‑8604 2 3岩手県 大船;度市 1 3 49499022‑0003 2 2 5 8602岩手県 花巻市 1 5 1 49435025‑8602 2 6 5 2岩手県 釜石市 1 6 1 49517026‑0052 2 1 7 1 49532027‑8504 2 7 8504岩手県 宮古市 1 岩手県 久慈市 1 8 49556028‑0051 2 8 5 戸市 1 0 1岩手県 1 9 14 9 5 7 1028‑6101 2 86 a d d r e s s 2 北一十一条西 8‑2‑1 厚見] 1 東四条 2 ‑8‑8 中通 7‑7‑1 土崎港中央 7‑8‑12 大工町 1番 21号 b u i l d i n g 厚耳] 1 別館 旭)11 1 7‑8 ← 能代ピル 末広町 2番 1 0 号 赤館町 1番 17号 本町通 2‑8‑28 田村町8番 1 8号 1 盛町字下館下 8番 地 1 0号 材木町8番 1 小佐野町 2‑8‑12 宮古ヒル 小山田 1‑1‑1 号 川崎町 17番 17 福岡字八幡下 17番 地 e n a円l 顧客名 1 顧客名 2 顧客名 3 顧客名 4 顧客名 5 顧客名 6 顧客名 9 顧客名 1 0 顧客名 1 1 顧客名 1 2 顧客名 1 3 顧客名 1 5 顧客名 1 6 顧客名 1 7 顧客名 1 8 顧客名 1 9 ( 3 )住所分割失敗( 7 7件の内の官頭部) 表j 主ここに表示した f t所 分 ' I ; [ ]失敗 Jのケースには、変数 b u i l d i n gは全て欠如他であったので、その 12側にエラ ー!京│刈をぷ示しておいた 2 4 1

240.

付録 1 全国市区町村名リスト ken shichoson code code c h i i k i ken code 1000 北海道 。 100 1100北海道 101 1101 北海道 102 1102 北海道 shichoson1 yomJ shichoson2 shichoson3 l まっヵ、 L 、どう さっi まろし 札幌市 札幌市 札幌市 中央区 北区 ちゅうおう〈 きたく 中略 107 1107 北海道 108 1108 北海道 西区 厚別区 手稲区 ;青田区 札幌市 札幌市 ていねく 109 1109 北海道 110 1110 北海道 202 1202 北海道 函館市 i ま」だてし 203 1203北海道 小織市 旭川市 おたるし 204 1204 北海道 205 1205 北海道 206 207 1206 北海道 札幌市 札幌市 l 、 し く あつへつく 1207 北海道 きょたく あさひかわし むろらんし 室蘭市 釧路市 帯広市 くしろし おぴひろし 中略 229 1229 北海道 富良野市 ふらのし 230 1230 北海道 登見1 [ 市 のi まりへつし 231 1231 北海道 恵庭市 えにわし 233 1233北海道 伊達市 だてし 234 1234 北海道 きたひろしまし 235 1235 北海道 236 1236 北海道 ゴヒ広島市 石狩市 北斗市 300 1300 北海道 303 1303 北海道 304 1304 北海道 330 1330北海道 331 1331 北海道 332 1332 北海道 333 1333 北海道 334 1334 北海道 337 1337 北海道 343 1343 北海道 345 1345 北海道 346 1346 北海道 347 1347 北海道 石狩復興局 石狩振興局 石狩振興局 2 豊島総合憲興局 B:A総 会 復 興 局 当> > 1I I T 新篠型車村 いしかりし l まくとし いしかりしん」うきょく とうベっちょう しんしのつむら おしまそうごうしんこうきょく 松前町 福島町 知肉町 まつまえちょう B:.総合.興局 渡島総合撮興局 量産島総合復興局 量産島総会復興局 渡島総合娠興局 量産島総合復興局 B:島総合豊臣興局 量豊島総合復興局 木古内町 七飯町 鹿音宮町 議町 八雲町 長万鶴町 き」ないちょう ふくしまちょう しりうちちょう ななえちょう しかベちょう もりまち ゃくもちょう おしゃまんべちょう 中略 47 340 47340沖縄県 47 350 47350 沖縄県 島尻郡 島尻郡 島尻郡 47 348 47348 沖縄県 47 353 47353 沖縄県 島尻郡 47 354 47354 沖縄県 47 355 47355 沖縄県 47 47 47 356 47356 沖縄県 357 47357 沖縄県 358 47358 沖縄県 47 359 47359 沖縄県 47 47 360 47360沖縄県 361 47361 沖縄県 47 362 47362 沖縄県 47 370 47370沖縄県 島尻郡 島尻郡 島尻都 島尻郡 島尻郡 島尻郡 島尻郡 島尻郡 島尻郡 宮古郡 47 375 47375沖縄県 47 380 47380沖縄県 381 47381 沖縄県 382 47382 沖縄県 47 47 しまじりくん 与那原町 南風原町 渡嘉敷村 座間日正村 よな 1 ; 1 : る ち ょ う 粟国村 渡名喜村 南大東村 北大東村 伊平屋村 伊是名村 久米島町 八重 j 瀬町 あぐにそん i まえ 1 ; 1 : る ち ょ う とかしきそん ざまみそん となきそん みなみだいとうそん きただいとうそん いへやそん いぜなそん くめじまちょう やえせちょう みや』ぐん 宮古郡 八重山郡 八重山郡 八重山郡 多良間村 竹富町 与那国町 242 たらまそん やえやまぐん たけとみちょう よなぐにちょう

241.

付録 2 北海道の(総合)振興局と郡部名の対応 市町 コード 改廃 支庁市郡 札幌市 1 1 100 中央区 北区 │東区 1 1 101 1 1 102 1 1 103 1 1 104 1 1 105 1 1 106 白石区 豊平区 │南区 西区 1 1 107 ふりがな 区町村 さ っi まろし ちゅうおうく きたく ひがしく しろいしく とよひらく みなみ〈 変更 1 9 7 2 . 0 4 0 1 新 設 政令指定都市 I~しく 1989.1106 分 続 ー白石区 1989.1106 分 離 ー西区 1997.1104 分 厳 ←豊平区 1 1 233 恵庭市 伊達市 あっベつく ていね〈 きょたく l 孟」だてし おたるし あさひかわし むろらんし くしろし おびひろし きたみし ゅうばりし いわみざわし あぱしりし るもいし とま二まいし わっかないし びばいし あしベっし えベっし あかびらし もんベっし Lベっし えよよろし みかさし ねむろし ちとせし たきかわし すながわし こしないし うf ふかがわし ふらのし のぼりベっし えにわし だてし 1 1 234 北広島市 きたひろしまし 1 9 9 6 . 0 9 0 1 改 称 {広島町が市帝'I.l! O 日改称) 1 1 235 1 1 236 石狩市 北斗市 有狩緩興局 いしヵ、りし l まくとし いしかりしん」うきょく いしかりぐん とうベっちょう 送車i 町 しんしのつむら おしまそうごうしん」うきょく まつまえぐん まつまえちょう 経 前 田T ふくしまちょう 福島町 かみいそく'ん しりうちちょう 知内町 本吉闘賞 き』ないちょう かめだく・ん ななえちょう 七飯町 かやベぐん しかベちょう 鹿鶴町 もりまち S 華町 やま二しぐん 長 万 留 置T おしゃまんべちょう 品、たみぐん ゃくもちょう 八雲町 1 9 9 6 . 0 9 0 1 新設 石狩町 2006.0201 新 設 ←上磯町,大野町 2010.0401 改 称 石狩支庁 厚 ~IJ 区 1 1 108 1 1 109 手話区 清田区 1 1 110 1 1 202 1 1 203 1 1 204 1 1 205 1 1 206 1 1 207 1 1 208 1 1 209 1 1 210 1 1 211 1 1 212 1 1 213 1 1 214 1 1 215 1 1 216 函館市 小得市 組I 1 1市 室蘭市 自1]路市 帯広市 l ~t 見市 夕張市 岩見沢市 網走市 留買高市 苫小牧市 稚内市 美E 員市 戸 ~IJ 市 1 1 217 j工 ~II 市 1 1 218 1 1 219 1 1 220 1 1 221 赤平市 紋見J I 市 土克J I 市 名寄市 一笠市 線室市 千鹿市 滝川 l 市 砂川市 歌志内市 深川市 富良野市 1 1 222 1 1 223 1 1 224 1 1 225 1 1 226 1 1 227 1 1 228 1 1 229 1 1 230 1 1 231 登 ~IJ 市 1 9 7 0 . 0 8 0 1 新設 登別町 1 9 7 0 . 1 1 0 1 新 設 ←恵庭町 1 97 2 . 0401 新 設 ←伊達町 広島市 1 1 300 1 申申本 石狩郡 1 1 303 1 1 304 1 1 330 1本 本 本 2 豊島総合掻興局 松前郡 1 1 331 1 1 332 1 牢牢牢 上磯郡 1 1 333 1 1 334 1牢 本 牢 亀田君事 1 1 337 1本 牢 本 茅音事郡 1 1 343 1 1 345 1牢 牢 牢 山越郡 1 1 347 1本 本 牢 ‑海認 1 1 346 1 9 8 3 . 1 2 0 1 町 制 一鹿部村 2 0 0 5 . 1日0 1 新設 八雲町の区援 2 0 0 5 . 1日0 1 新 設 ー八雲町.熊石町 以下略 ( 市 田l 一村コー I C一覧表 243 北海道の部)

242.

付 録 3 市区町村名で住所情報を分割する SASプログラム概略図 -(Ð;4:\{~~塁冨 「北海道市区町村コード x t J 一覧表北海道 t (北海道のみの住所名簿) • 「住所分割前データ x l s x J (元の住所ファイル) l … p o r l lfina 凶 u l t . s a s マクロ変数の設定 I : 罰繭碕置置爾爾置属 hokkaido code 振興局名と郡名の対応表作成 1 . 順番号(id n o ) .付加 川町︐帆一直一時⁝湘 γ::: IE I8 s3 i・; q ・LL U郎副町一肝 または . ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ A 体⁝ 県日 府⁝ . J 全国市区町村名簿 p r o c r a n s p o s c 圏圏 k i r i t o r iv a r ( 1o b s e r v a t i o n ) P e r m a n e n tSASd a t a s e t S .idnoで並べ替え lm 圃 (扇 244

243.
[beta]
付 録 4 市区町村名で住所情報を分割する SASプログラム

い
① hokkaido.s白川
options nocenter nodate nonumber;
村ヒi
毎道の振興局に属する町村に郡名を付与する.
f
il
e
n
a
m
ei
n
1
半20日
半SAS総会 20日発表資料半報告用住所名簿データ半全国住所データ半
"
C
:半SASForum
市町村コード 覧表:北海道

T
x
r
;

向
︑v

門
υ

門
υ

nH

pb

‑

﹂HH
pu

pb

しV

J
v

thH

︑
伸
a'
ρ

ハHVLnH

m川 ・ ' 円 υ

ι
可}

引
M 凶
vvpu
D
s
n一
50
15

門

︑
︾
俗
︑ VLnH
p
﹂U p b

︑uFhupu
q
ヱ
1t

し

'ripbρU

υ
t
n 作品
50

ρ V 1 1ハ
υ U

︐
AHUF?lthHパ
ハu
nupup‑ ︾
FU 司
t
a
‑
‑
‑
' 一

しt
v
hH

nHhHnH

﹄

J門
ubk

ー

1UA?﹄ 門 udHU
UFTlnHn

一
Ol
se
ιρ
+L+L
atl
ド
hハH
en
in
l
i

J門U

+IL

a
a

r
u
n
;
p
r
o
c print data=hokaido code (
o
b
s
=
l
O
O
)
; title "

北海道:市区町村コ‑f
:
'
'
'
;r
u
n
;

data hokaido̲code;
retain k
y
o
k
u
;
s
e
t
:
i
f kindex{shichoson1,"
1
辰興局") NE 0 then kyoku=shichoson1;
r
u
n
;
u
n
;
proc print data=hokaido̲code (
o
b
s
=
l
O
O
)
; title "振興局" r
data hokaido̲code;
retain g
u
n
;s
e
t
;
i
f shichoson codeニ"キキキ" then gun=shichoson1;
r
u
n
;
proc print data=hokaido̲code; title "全リスト" r
u
n
;
data hokaido̲code;
e
l
e
t
e
;
s
e
t
;i
f shichoson̲code="キキ*" OR kyoku=shichoson1 then d
r
u
n
;
";
proc print data=hokaido̲code; title "全リスト 2
var shichoson code gun shichoson1 k
y
o
k
u
;
r
u
n
;
);
data hokaido code{dropニ t
rename shichoson1=shichoson3
kyoku=shichosonl;
s
e
t
:
f tNE 0 then gunニ substr(
g
u
n,,
1t
‑l
);
t
=i
ndex{
g
u
n," ("); i
r
u
n
;

nH
Hu
rl

proc print data=hokaido̲code; title "全リスト了;
var shichoson̲code gun shichoson3 shichoson1;
data xhokaido̲code;
drop shichoson1 shichoson3;
s
e
t
;
l
e
n
g
t
hv
a
r
1 $20 var3 $ 1
4
;
var1=shi
choson1;
var3=shichoson3;
r
u
n
;

nH

﹁

︐
.HU

proc print data=xhokaido̲code (
o
b
s
=
l
O
O
)
; title "長さ変更後"
var shichoson code gun var3 v
a
r
1
;
data hokaido̲code (drop=ken̲code shichoson̲code);
5巴t
;
renam巴 var1=shichoson1 var3ニshichoson3;
r
u
n
;
村ヒ海道市町村コードデータセット作成終了.
options I
s
=
8
0 ps=60 nocent巴rnonumber;
s 1ibrary=work; cont巴ntsdata=hokaido c
o
d巴 r
u
n
;q
u
i
t
;
proc datas巴t
o
b
s
=
5
0
);
proc print data=hokaido̲cod巴 (
t
i
t
l巴" (
f
ir
s
t1
0
0 observations o
f 'hokaido cod巴')";
r
u
n
;

245

244.

両 否 両 色Tln 白I ̲ k e y .s a s*~ キこのプログラムは日本の「住所データ」の住所情報を(l)市区町村の部分と ( 2 )それ以下の部分に 分割する処理のために使われる前処理用プログラムです。この処理結果は SASパーマネントデ タ セット r ki ri t o ri ̲ v a rJ に保存されます。全国の住所表示の変更がない限りはこのプログラムは 再度実行する必要はありません。 SASパーマネントデータセット r k iritori̲varJ だけ保存して おけば十分です。 宇その SASパーマネントデータセットの保存フォルダを以下で指定して下さい; 百l 巴tkiritori var=C:半SAS Forum 半2013半SAS総会 2013発表資料半報告用住所名簿データ; 宇全国住所表示データのエクセルファイル名を指定して下さい; 百 │ 巴toriginal̲address̲fi1 巴=市区町村名一覧.x l s ; 宇そのエクセルファイルの保存場所のフルパスを指定して下さい。; 百 │ 巴tfu1l̲path=C半SAS̲Forum 半20日時AS総会 2013発表資料半報告用住所名簿データ半全国住所データ; 1i bname ki ri t o ri"&ki ri t o rivar " options symbolgen; nH ﹁ ︐ .HU proc i m p o r t dbms=EXCEL out=original̲shikuchoson datafil巴="&full̲path半&original̲addr巴ss f i1 巴 " 巴 「place; sheet="市区町村名 覧(変数名変更)"; rl Hu nH data original̲shikuchoson; s e t ; seri a1 NO+1; proc print data=original̲shikuchoson ( o b s = 1 5 0 ) ; ti t1 巴"修正前の市区町村名 覧.xls"; r u n ; 宇 一 一 一 一 一 一 一 一 一 一 一 一 一 一 ー ー ー ー ー ー ー ー 一 一 一 一 一 一 一 一 一 一 一 一 一 ー ー ー ー ー 一 一 一 一 一 一 一 一 一 一 一 一 一 ー ー ー ー ー ー ・ ー ー ー ー ー 一 一 一 一 一 一 一 ー ー ー ー ー 一 一 一 一 一 一 一 一 一 一 一 一 ー ー ー ‑ options I s = 8 0 ps=60 nocent巴rnonumb巴r ; proc datasets 1ibrary=work; contents data=original̲shikuchoson; r u n ;Q u i t ; proc print data=original̲shikuchoson ( o b s = 1 0 0 l ; 巴 "( fi r s t1 0 0 observati ons on1 y ) "; ti t1 r u n : キ %includ巴" C :半SAS̲Forum ¥2013半SAS総会 20日発表資料半hokkaido.sas"; キ二つのデータセット original̲shikuchoson と hokaidocod巴を 2変 数 shichoson1 と shichoson3でマッチマージし、前者に北海道の郡名を与える。ー proc sort data=original̲shikuchoson; by shichoson1 shichoson3; r u n ; byshichoson1 shichoson3; r u n ; proc sort data=hokaido cod巴 data shikuchoson2; merg巴 original̲shikuchoson(in=in1l hokaido̲cod巴 byshichoson1 shichoson3; i fi n 1 ; r u n ; proc sort data=shikuchoson2; by serialNO; r u n ; / キ proc print data=shikuchoson2 ( o b s = 1 0 0 l ;t i t l巴 "shikuchoson2"; r u n ;キ/ HU nH ﹁ data shikuchoson; i a l N O ; drop gun s巴r 5巴t . i f shichoson3=" " t h巴nd巴l 巴t 巴 ; i f gun N E ' , then d o ; kyoku=shichoson1; shichoson1=gun; 巴n d ; /杓 r o c print data=shikuchoson ( o b s = 1 0 0 l ;t i t l巴 "shi kuchoson最終版 1 " ; run;*/ data kiritori; l e n g t h kiritori $3 0 ; s e t ; kiritori=compr巴ss(shichoson1 1Ishichoson3l: 246

245.

キ変数 k iritoriの長さのチェック; i f shichoson1=" " t h巴n 1 巴n gth1=0; 巴I s巴│巴 n g t h 1 = 1巴ngth( s hi choson1 ); ! 巴n g t h 3 = 1巴ngth(shichoson3); l e n g t h = 1巴ngthl +1 巴n g t h 3 ; i f1 巴n gth=4 t h巴nput k 巴n =shichoson1= shichoson3= kiritori=ー LnH 門 u u nH Pu ︐ . +L ︑ qu LnH + I L 門 u d nH PU ー nH し +L 門 u d nH PU 4 門u nH ハ u P I切 qu ハU H ﹂H ﹄ ︑︑ ︑ ︐ ﹄a 'LnH' nH︾ qd" 4u nu︾ 門 11 i nH = n Hハ u qd ハU p a Lnupa ハU ハU ハULnH t LnHPIM FUI' ltot‑LnH r‑‑nHpb o s + +LT lfBnH rIr o nH‑n +LPU nHLkpu ‑‑nuqu LK+Lnu tlLnH 勺 orlpu +LI‑‑s 内l d υ 県内lnH Aupa rrt nド内 J O ‑ ‑ v t plw' rlHu n u﹁ ハυ n H ・ = r u n ; rl proc m e a n s ; var 1 巴n g t h ;r u n ; data k i r i t o r ik 巴y ( k巴 巴p =kiritori); s e t 巴nd=last̲obs; i fl a s t obs t h巴nc a l1symput("kiritori̲k巴y ̲ o b s ̲ n o ",̲nー ); r u n ; 出│巴 ts hikuchoson̲no=&kiritori̲key̲obs̲no; ヰ全国の市区町村数を設定する. proc print data=kiritori̲k巴y ( o b sニ1 0 0 ) ;t it l巴 "d a t a = 1 くi r i t o r ik 巴y " ;r u n ; proc transpose d a t a = 1 くi ritori̲k巴yo u t = 1 くi r i t o r i ̲ v a r ; var kiritori; r u n ; ヰ / procprint d a t a = 1 くi ri t o riv ar ; ti tI 巴 "d a t a = 1 くi r i t o r iv a r " ;r u n ;キ / data kiritorしkiritori̲var ( d r o p = i ) ; s e t ; array c o l $coI1‑col&shikuchoson̲no; array 1 巴n I 巴n 1 ‑ 1巴n&shikuchoson̲no; nH ﹁ ︐ .HU do i =1t o &shi kuchoson̲no; 1 e n[ i }=1 ength( c o m p r e s s( c o[[ i ))) ;e n d ; shikuchoson̲no=&shikuchoson̲no; proc print data=klritorl.k l r l t o r lv a r ; title "data~く iritori var+le げ r u n ;つつつつつ h 同③ c r e a t e ̲ o r i g i n a l ̲ d s .s a s叶 ヰこのプログラム i 立 、 r f i n a lr 巴s u1 t .s a s J の中で目 i n c l u d eによって実行され、 キ分劃したい住所ファイル名はそこで指定するので、ここではする必要がありません。; 一 一 hfhf ﹂ナ司ナ 済聖 離体 分一 県県 府府 ノ nド ‑'nu 3J →'米白‑' ' ψ ﹂ ylln L+IL = = F O HHLnH PIMPU +L+︑ L 7l‑TlLnH tF・ w WC OFOQM+IL uu"+IL 門 EE‑'nHρuw" 一ρupbqd 1 lいH 1 1 内 +LPU" d nHLnH ・1 1 " p l w 川 ︑ ︐ 一 m +Ivy 干 riqdww nupapa ρu" f +LrE ρUAU+L qdJ円U H U 2un ド Ilpu ヲ+ 1 2 u qG JHU a +L ‑iρuqu i r‑‑ unp HIll p r o ci m p o r t dbms=EXCEL out=original̲1i s t d a t a f il e = " & f o l d巴「半品。 r i g i n a l addr巴s s ̲ d a t a " 「 巴p l a c e ; 巴 tn a m e " sheet="&sh巴 r u n ; r u n ; data original̲list ( d r o p = p r巴f ); l e n g t h xpref $8 ; 宇都道府県欄に「都/道/府/県」の文字がない場合の対処, s e t ;i dno+1; i f &switch=l t h e n xpref=pref; 宇都道府県名と住所情報が既に分離されている場合. r u n ; n a l ̲ 1i s t( d r o p = x p r巴f); d a t ad a t ao r i日i s e t ;i f& s w itch=1 t h巴npref =xpr巴f ; r u n ; 247

246.
[beta]
レ宇性) fi
n
aIr
e
s
uI
t
.sas*
1
1
宇・分割したい名簿情報の(1)E
x
c巴│ファイル名と (
2
)s
h
e
e
t名を指定して下さい;
riginal̲addr巴ss̲data=全顧客名簿.xI
s
x
;宇
(
1
)E
x
c巴│ファイル名;
引巴 to

h巴 tname=
府県分離済データ;
宇(
2
)E
x
c巴│ファイルの s
h
e巴t名;
百
│
巴 ts
柑i
巴ts
h巴 tn
a
m巴=府県分離済(府県文字なし);
宇(
2
)E
x
c巴│ファイルの s
h巴 t名;
h巴 tn
a
m巴=府県一体型,
宇(
2
)E
x
c巴│ファイルの s
h巴 t名;
柑│巴 ts
h巴 t
二nam巴=
i
d
.b
u
iI
d
i
n
g
.n
a
m巴なし;
宇(
2
)E
x
c巴lファイルの s
h巴 t名
,
柑│巴 ts
宇・上記のファイルが保存されている場所の f
u1
1p
a
t
hを指定して下さい;
制巴 tf
o
l
d巴r
=
C
:半S
A
SF
o
r
u
m
半2
013
半S
A
S総会 2
0日発表資料半報告用住所名簿データ;

ASパーマネントデータセットを保存するフォルダを以下で指定して下さい;
宇・前処理用の S
百l
e
tk
i
r
i
t
o
r
i var=C半
・S
ASF
o
r
u
m半2
0日半 S
A
S総会 2
0
1
3発表資料半報告用住所名簿データ;
宇・このプログラムを実行すると、次の (
a
)と (
b
)の二つの c
s
vファイルが出力されます。
(
a
)正しく分割された住所情報は「最終結果住所ファイル C
S
V
j
S
V
j
(
b
)住居表示に何らかのエラ があり、分劃処理できなかったものは「住所分離失敗.C
宇・この二つの出力ファイルの保存先の完全パスを以下で指定して下さ~ ¥
;
ts
a
v
e
̲
o
u
t
p
u
t
=
C
:半SASForum
半2
0
1
3
¥
!
S
A
S総会 2
0
1
3発表資料半報告用住所名簿データ半住所分劃結果;
引e
宇・このプログラムを保存しているフォルダを以下で指定して下さい.
時l
巴ts
a
v
e
̲
p
r
o
g
r
a
m
=
C
:半SASF
o
r
u
m半2013
半S
A
S総会 2
0
1
3発表資料;
宇

ー

一一一一ーーーーーーーーーーー

一一一一一一一一一一一【ーーーーーー

ーーーー‑

fi
1
巴n
a
m
eo
u
t
1 "&save̲output半住所分害J
I
失敗 c
s
v
";
s
v
";
f
il
e
n
a
m
eo
u
t
2 "&save̲output半最終結果住所ファイル.c
e
r
m
a
n
e
n
tSASd
a
t
a
s
e
tが保存されている;
1
i
b
n
a
m
e ki
ri
t
o
ri"
&
ki
ri
t
o
ri
̲v
ar
";宇住所切り離し用の P
宇

‑̲‑ーーーーーーーーーー

ーーーーーーーーーー

ーーーー一一一一一一一一

宇下のプログラムで元の住所情報を S
A
Sデ タセット o
r
o
gi
n
a11
i
stに i
m
p
o
r
tし
、
A
S変数の長さを 8バイトに設定;
かつ、各オブザベーションに 1;から順番号を振り、都道府東名の S
%include"&save̲program
半c
r
e
a
t
e
̲
o
r
i
g
i
n
a
l
̲
d
s
.s
a
s
"
; 宇貴マク口実行;
時m
acrop
r
e
f
̲
a
d
d
r
e
s
s
;

宇============================================================================
宇都道府県名と住所表示が一緒のセルに格納されている場合の前処理。
住所表示から都道府県名を切り離す。;
d
a
t
a̲
n
uI
I
̲
; 宇住所情報の最大文字数 (
m
a
x1
e
n
g
t
h
:I¥イト数)を探す;

s
e
to
r
i
g
i
n
a
l
̲
1i
s
te
n
d
=
l
a
s
t
̲
o
b
s
;
;
i
f n=
1t
h
e
nm
a
x
l
e
n
g
t
h
=
l
e
n
g
t
h
(
p
r
e
f
̲
a
d
d
r
e
s
s
)宇2
l
e
n
g
t
h
=
l
e
n
g
t
h
(
p
r
e
f
̲
a
d
d
r
e
s
s
)宇2
'
i
f maxlength < l
e
n
g
t
ht
h
e
nm
a
x
l
e
n
g
t
h
=
l
e
n
g
t
h
;
i
fl
a
s
t
̲
o
b
st
h
e
nc
a
l1s
y
m
p
u
t
(
"
m
a
x
l
e
n
g
t
h
"
.
m
a
x
l
e
n
g
t
h
)
;
r
u
n
;

︐
.

し
︾

内

し
︾

ド

一
一
)
'
n
口
)
‑
ODyl‑︐

内

﹁

‑‑)
1IRucd
・5 5
QUρ ρ
5 ﹁﹁

f

﹄

puAUAu
r‑‑nulnu
AU d d
AU‑‑

内

t

ぺ
d

dεlεl
‑
ee
p+lFIr‑
ρunu n
︐ s
r
l
+
IL
・
︐nul+rLl︑
︑
F+l
︐
︑e
﹁
5
+LLnu?1
5
u=
hU55

puAu

rt

Hupa
.
A︐
URuρu
nH=rl

n
u﹁

r
u
n

ρUF十E A U

"

•

円
ν
A
H
u

)

一求 a
引一 同口

県
"
.
胃
︐
︐
︐
︐
︐

子
7h{

旧日

弘文
4

内

J
n
u内
い
dJ'h

tら

E

官
︑
︐
︐
︐
︐
︐

n
v ・米自

問先

HU

QU

﹂HM

︐
︐rl
+L

(QU

t首

UT

nH
pu

'hH

f一頭

d
a
t
ao
r
i
g
i
n
a
l
̲
1i
s
t
(
k
e
e
p
=
i
dz
i
pp
r
e
fa
d
d
r
e
s
sb
u
iI
d
i
n
gi
d
n
on
a
m
e
)
;
s
e
to
r
i
g
i
n
a
l
̲
1i
s
t
;
m
a
x
l
e
n
g
t
h
;
l
e
n
g
t
h address $&
x
=
s
u
b
s
t
r
(
p
r
e
f
̲
a
d
d
r
e
s
s
.5
.2
)
; 宇住所情報の先頭から 3文字目;
s
e
l
e
c
t
;
when(
x
=
"県" o
rx
=
"都" o
rx
=
"府
町 o
rx
=
"") d
o
;p
r
e
f
=
s
u
b
s
t
r(
p
r
e
f̲
a
d
d
r
e
s
s
..
16
);
16
)ニ'
s
u
b
s
t
r(
p
r
e
f̲
a
d
d
r
e
s
s
..
a
d
d
r
e
s
s
=
l
e
f
t
(
p
r
e
f
̲
a
d
d
r
e
s
s
);

e
n
d
:
otherwise a
d
d
r
e
s
s
=
p
r
e
f
̲
a
d
d
r
e
s
s
; 宇この場合 l
まp
r
e
f1
ま欠損値になる;
e
n
d
:

宇~-~----ニニニ住所表示から都道府県名を切り離し終了=============================ニ,
首m
e
n
dp
r
e
f
̲
a
d
d
r
e
s
s
;

百m
acros
k
i
po
rn
o
t
; 宇マクロ変数 s
w
it
c
h1
ま f
c
r
e
a
t
e
̲
o
r
i
g
i
n
a
l
̲
d
s
.s
a
S
j で設定済み;
首i
f&
s
w
it
c
h
三 時t
h
e
n%
p
r
e
f
̲
a
d
d
r
e
s
s
; /宇府県一体型のみ貴マク口実行する宇/
国m
e
n
ds
k
i
po
rn
o
t
;
国s
k
i
po
rn
o
t
; 宇女マク口実行;

d
a
t
ao
r
i
g
i
n
a
l
̲
1i
s
t(
d
r
o
p
=
l
e
nx
l
e
nx
z
i
p
)
;
s
e
to
r
i
g
i
n
a
l
̲
l
i
s
t
;
村ヒ海道等の蔀便番号の先頭の O又は 0
0が s
u
p
r
e
s
sされている場合は復元しておく;

248

247.
[beta]
キ例えば、札幌市北区の r
1
0
0
3
1J を r
0
0
10
0
3
1J に修正する;
キ更に、郵便番号の前半部 (
3桁)と後半部 (
4桁)を分離する;

i
fi
n
d
e
x(
zi
P
."
̲
"
)=
0t
h
e
nd
o
; xI
e
n
=I
e
n
g
t
h(
zi
p
);
h
e
nd
o
;x
z
i
p
=
z
i
p
;z
i
p
=0
0
0
0
0
0
0
";
i
fx
l
e
n<7t
s
u
b
s
t
r
(
z
i
p
.
8
‑
x
l
e
n
.x
l
e
n
)
=
x
z
i
p
;
e
n
d
:
.3
)
;z
i
p
2
=
s
u
b
s
t
r(
z
i
p
.4
.4
)
;
z
i
p
1
=
s
u
b
s
t
r(
z
i
p
.1
zi
p
=
c
o
m
p
r
e
s
s(
zi
p
11 "
̲
" 1 zi
p
2
);
e
n
d
e
l
s
ez
i
p
1
=
s
u
b
s
t
r(
z
i
p
.1
.
3
)
;z
i
p
2
=
s
u
b
s
t
r(
z
i
p
.5
.
4
)
;
司

ヲ
匂

な日

P

によド

直‑問

損

欠引
立山

ヨR n A U

名)

2Jen
l
e
Jn
府

ハじみ IL

rlnc

5u

理
nkμP3rl

車台

合出﹁

場伯

ヘノrt‑"
〆U+L=

こ出ぱ

︑

Hurl
︑ " P 3 nド

元市h

βU

EFt

F
十

J門

一ヨ民"︒u t'
F
ヒ=rlpb
J
u
︑ノ︑s'nド C

V
・R

nυη

a'巴︐︑119lal門u

﹄
〆
・
‑
・

au

︐
j.

︐︑MOUOui‑‑

dT引リ引り 1 l

︑
‑

﹁﹁

‑41

e

FhIJnulnU141
4du︐t︑rt ρu
f
﹂
H﹁
い
・4'hCJU+Lnド

名川町旬以

司副刊︐l ρ u m川

MMVOUCJU
﹂同
4H川 ρullou
‑‑rー・=rl

[L
Knp
︑

剖骨 t 3 1 0

ヘ
ノ Fすl p l v
nuou・︐=

パイ r t A U 5

アコ 1 1 0 5

244‑︑rlou
'tn ﹁

叩

﹄斗叶
JCJUOUAu
n阿川'hU﹂H A U

道剖ta
都f

←→ヨ It

宇都道府県名の欄の末尾に「都/道/府/県」の文字が欠落している場合には付加する:
i
fp
r
e
f
=
"東京都" o
rp
r
e
f
=
"京都府" t
h
e
nr
e
t
ur
n
;
h
e
nr
e
t
u
r
n
;
i
fk
i
n
d
e
x
c
(
p
r
e
f
.
"道府県") >0t

s
e
l
e
c
t(
s
u
b
s
t
r(
p
r
e
f
.1
.
4
)
)
;
r
e
f
=
k
c
o
m
p
r
e
s
s(
p
r
e
f
w
h
e
n("東京") p
r
e
f
=
k
c
o
m
p
r
e
s
s
(
p
r
e
f
w
h
e
n("大阪") p
r
e
f
=
k
c
o
m
p
r
e
s
s
(
p
r
e
f
w
h
e
n("京都") p
r巴f
=
k
c
o
m
p
r
e
s
s
(
p
r
e
f
w
h
e
n("北海") p
w
i
s
e p
r
e
f
=
k
c
o
m
p
r
e
s
s
(
p
r
e
f
o
t
h巴r
e
n
d
;
h
e
np
r
e
f
i
fp
r
e
f
=
"県" t
r
u
n
;

"都");
"府");
"府");
"道");
"県");

二句"

一
ー
‑

宇

o
p
t
i
o
nm
t
r
a
c
em
a
c
r
o
g
e
n
;

d
a
t
a n
u1
s
e
tk
i
r
i
t
o
r
i
.k
i
r
i
t
o
r
iv
a
r
;
c
a
l
ls
y
m
p
u
t
(
"
s
h
i
k
u
c
h
o
s
o
n
̲
n
o
"
.s
h
i
k
u
c
h
o
s
o
n
̲
n
o
)
;宇全国の市区町村の総数;
r
u
n
;
制e
ts
h
i
k
u
c
h
o
s
o
nn
o
=
&
s
h
i
k
u
c
h
o
s
o
nn
o
; /宇右辺のマクロ変数の値の先頭の余分な空白削除キ/
ー

ν

︐
J
ア

離一
分デ

フ
象.︐
対タ

トh

間市分

は村功
川町成
!一区離

行
一
一
一
一

内

一5

'+L
+LCJU
P311

i
→

11lt

11 d ! i
a
n
nHjι119

内
udftnH
efBri‑‑‑
rl ハ
USl
nu ← 小 ← →

193

ρU
門
u
d

ou

m山

内

FU

LnH

m川

+L
d

内

pu
d

ハ
u

hM

d
a
t
a&
f
i
n
a
l1
i
s
t
(
k
e
e
p
=
i
d
n
oi
dz
i
pz
i
p
1z
i
p
2p
r
e
fa
d
d
r
e
s
s
1a
d
d
r
e
s
s
2b
u
iI
d
i
n
gn
a
m
e
) /宇分離成功宇/
e
r
r
l
i
s
t
(
k
e
e
p
=
i
d
n
oi
dz
i
pz
i
p
1z
i
p
2p
r
e
fa
d
d
r
e
s
s
b
u
iI
d
i
n
gn
a
m
e
)
;
/ヰ分離失敗キ/
m
e
r
g
e&
o
r
i
g
i
n
a
l
̲
1i
s
t(
i
n
=
i
n1
)k
ir
i
t
o
r
i
.k
i
r
i
t
o
r
i
̲
v
a
r
;
s
l $3
0
; 宇市区(郡)町村名部分;
l
e
n
g
t
ha
d
d
r巴s
l
e
n
g
t
ha
d
d
r
e
s
s
2$1
0
0
;宇残りの住所部分,
a
r
r
a
yc
o
l $c
o
I
1
‑
c
o
l
&
s
h
i
k
u
c
h
o
s
o
n
̲
n
o
;
a
r
r
a
yl
e
n l
e
n
1
‑
l
e
n
&
s
h
i
k
u
c
h
o
s
o
n
̲
n
o
;
a
r
r
a
yx
c
o
l$
3
0x
c
o
I
1
‑
x
c
o
l
&
s
h
i
k
u
c
h
o
s
o
n
̲
n
o
;
r
e
t
a
i
n
x
c
o
I
1
‑
x
c
o
l
&
s
h
i
k
u
c
h
o
s
o
nn
o
;
a
r
r
a
yx
l
e
n
r
e
t
a
i
n

x
l
e
n
1
‑
x
l
e
n
&
s
h
i
k
u
c
h
o
s
o
n
̲
n
o
;
x
l
e
n
1
‑
x
l
e
n
&
s
h
i
k
u
c
h
o
s
o
nn
o
;

h
e
nd
o i1t
o&
s
hi
k
u
c
h
o
s
o
n
̲
n
o
;x
c
o1
{
i
}=
c
o1
{
i
}
; x1
e
n{
i
}=1
e
n{
i
}
;e
n
d
;
i
f nニ1t
こ

d
oi
=
lt
o&
s
h
i
k
u
c
h
o
s
o
n
̲
n
o
;
1
e
f
t
=s
u
b
s
tr(
a
d
d
r
e
s
s
..
1x1
e
n(
i)
);
.1
.x1
e
n(
i
));
r
i
g
h
t
=
s
u
b
s
tr(
x
c
o1
{
iJ
i
fl
e
f
t
=
r
i
g
h
tt
h
e
nd
o
;a
d
d
r
e
s
s
1
=
l
e
f
t
;
x
a
d
d
r
e
s
s
=
a
d
d
r
e
s
s
;
n
d
;
d
oj
=
lt
ox
l
e
n
{
i
J
;s
u
b
s
t
r
(
x
a
d
d
r
e
s
s
.j
.1)="" e
e
f
t(
x
a
d
d
r
e
s
s
);
a
d
d
r
e
s
s
2ニ 1
o
u
t
p
u
t&
f
i
n
a
l1
i
s
t
;r
e
t
u
r
n
;
e
n
d
;
e
n
d
;
o
u
t
p
u
te
r
r
̲
1i
s
t
; 宇例外処理(入力デ

タに規則違反のデ

249

タ有り);

248.

r u n ; 国m endmatch̲merge; 宇以下で、 o roginal̲1i s tと final̲keyのマージをして、市区町村名を切り出す, 国match̲merge(original̲1i st.final̲list); 宇女マク口実行; 杓r i g i n a l ̲ 1ist=市区町村分離対象データ; 宇f i n a1 1i 訂 =分離成功データ; 判 err 1 i s t ) =分離失敗データ. キ上記の処理で分離に失敗したデ タの内、回復可能なデ タの救済処理を次に行う; data recover /宇「府県名分離済み」の住所情報に余分の都道府県名があるデータキ/ f i n a l 巴r r;/宇それ以外の種類のエラーのあるデータ(女三れ以上修復不能データ)宇/ set 巴r r 1i s t ; 本分離失敗データ(入力データに規則違反のデータ有り)冒 │ 巴n gth=length(pref); i f substr(pr巴f ,1 ,1 e n g t h )=substr( a d d r巴s s,. 11 e n g t h ) ,1 e n g t h )= "" . t h e nd o ; substr( a d d r e s s,1 address=left(addr巴s s ): output r e c o v e r ; e n d ; 巴I s eoutput f i n a l 巴r r ; r u n ; Hu nH r﹄ ‑ ‑ キ再度、市区町村名を切り出す; 国m atch̲merge( r e c o v e r,r 巴cover ̲ Ii st );卒女マク口実行; ecover ‑市区町村分離対象データ. 宇r キr ecover 1i s t=分離成功テ. タ; r 1i 言t ) =分離失敗データ; キ ( 巴r キーーー ー 一一一一一一一一一一一一一ー 一一一一一一 ‑ data fi n a1 1i s t ; キ今回分割に成功したデータを fi n aI ̲ Ii sに追加する; s e tf i n a l 1i s tr 巴c over 1i s t ; proc sort out=final̲list: b yi d n o ;r u n ; 本元の順序に並べ替える; data ̲null̲; 本分離成功データを c s vファイルに出力する; f il e out2 d s d ; 本最終結果住所ファイル c s v : s e tf i n a l 1i s t : d,zi p ,zi p1 ,zi p 2,p r e f,address1 ,address2,b ui1 di n g,n a m e "; i f n= 1t h e n put " idno,i p u t i d n oi d zip z i p 1 zip2 pref address1 address2 b u iI d i n gn a m e ; r u n : 本一一一一一一一一一一一一一 ー ー ー ー ー ー 一 一 一 一 本分離失敗の 2つのデータセット r f i n a le r r J と「巴 r r 1i s t J をまとめ、 i d n oでソートした後、 CSVファイルに出7Jする; data f a il u r e ; s巴tf i n a l 巴r r 巴r r ̲ l i s t ;r u n ; proc s o r t ;b yi d n o ;r u n ; r﹄ nH ︐ . u 川 data ̲null̲; 本分離失敗データを CSVファイルに出力する; f i1 巴o u t 1d s d ; set f a il u r e : i f n= 1 then put "idno,i d,zip,z i p 1,z i p 2,pref,a d d r巴s s,b u iI d i n g,n a m e "; put i d n oi d zip z i p 1 zip2 pref a d d r巴s sb u iI d i n gn a m e ; 250

249.

TUTORIAL 市区町村名で住所情報を分割する SASプログラムの作成方法 周防節雄 兵庫県立大学・名手十教俊 Howt o W r i t eaSASProgramt h a tSeparatesJapaneseAddressI n f o r m a t i o nW r i t t e ni n K a n j ii n t oTwoP a r t s ;P r e f e c t u r eandWard/City l T ownNillage,andt h eRest SetsuoSuoh TheU n i v e r s i t yo fHyogo P r o f e s s o rEmeritus 要旨 エクセルのファイル形式で、入力された名簿の住所情報を市 1, iI Jr 村名で自動分割する SASプ ログラムを開発した。このチュートリアルで、このプログラムの作成方法を 1寧に解説す る。まず、とりあえず与えられた名簿データ「だけ」に対して作動する初期ノくージョンの SASプログラムの解説をする。更に SASマクロを駆使してこれを汎用化して、 SASを知らな し、ユーザで、も自分の住所情報ファイル名を指定すれば使えるようした。 SASを使い始めたば かりのユーザには、 SASでデータハンドリングをするということはどういうことかを理解し てもらえるように解説する。特に他の汎用言語をこれまで、使ってきて、最近になって SAS を使い始めたユーザや q ̲ 1級レベルのユーザ l こも卜分参考になる内容を峨り込んでいる。 キ ー ワ ー ド : 郵 便 住 所 、 proc import、 proc transposc、 mcrgc文、 %includc文 階層榊造のデー夕、データハンドリング、 SAS‑<クロプログラミング 1.はじめに エクセル形式の住所名簿の情報を、市 r~: 田]村名の ïìÍj 後て、i' 11YJ 分割する SAS プログラムを 作成した。処理対象になるエクセルファイルには最大限の構造上の自由度を認めたので、 ユーザにとっては使し、やすいシステムになった。本システムを使えば、平成の大合併等で 住所表示が変更になった住所の検出も容易にできる c このシステムの詳細については、本論文一集に所収の安井一・周防 (2013)を参照されたい。 その論文には汎用化した完成版の SASプログラムを付している。本チュートリアルでは、 汎用化される前の初期段階のプログラムを解説し、それをいかにして汎用化していったか の過程を順次説明してし、く。 SASプログラミングではサブプログラムやサブ、ルーティンとい う概念、は本来備わっていないが、実質的には同様の仰jきをするツールを、 SASマクロなどを 251

250.

使って作成した。これによって、 S A Sプログラムの構造が筒潔に、かつ、読みやすくなった。 2. 本プログラム(完成版)の特徴 ( 1 ) 元データ(エクセルファイルの名簿)のフォーマットがかなり自由 ( 2 ) 元データの不備も修正できる(郵便番号、「都」、「道」、「府」、「県」の欠落文字追 加等) ( 3 ) 平成の大合併などで古い住所表記になったデータの検出ができる 3 . 全国市区町村名の S A Sデータセット 1 9 0 3件)から成る S A Sデータセットを作成した c このデータセッ 最新の全国市区町村名 ( トを、住所情報を市区町村名で分割するための区切り情報として利用した。 表 1 J 在新の全国市区町村名の S A Sデータセット 市区 町村名 文字削 白星さ 4 .S A Sによるデータハンドリング S A Sではデータセットの作成・加工・ Mや横の併合によって情報が処理される c 周防節雄 2 0 0 9 )では長期間に Eる大容量の政府統計を対象に、大規模なデータハンドリングを行 他( A Sは最適なツールと確信している。 った。ビッグデータの時代に、 S このデータハンドリングの際に部品となるのが、 dataステップと procステップである。 これらのステップ聞は、 S A Sデータセットの形で情報のやりとりが行われる。見ノ1;‑を変える と、こうしたステップは、従来型のプログラミング言語で言うサフツレーティンと同様の機 A Sデータセットである。 能を果たしているとも言える。その際、引数の役割をするのが S ただし、通常のサブルーティンと違い、同じ dal日ステップや procステップ、或いはその 与は、 組み合わせを同じプログラムの別の場所で、或いは別のプログラムで再度使いたい u 通常は、コピー・アンド・ペーストした上で、データセット名や変数名をエディタで変更 するしかない c これでは、 dalaステップと procステップ、或いはその組み合わせの命令の 行数が多くなってくると、 I s J遣う可能性が高くなり、また、何よりも大変読みにくいプロ グラムになり、当然、パージョンアップまたは、処理の一部変更をする際には事故が起こ りやすい。そこで、以下に挙げる「サブルーティンの代用品」が役に立つことになる。 (1)まとまった処理をする「独立した別の S A Sプログラム」を見 in c lu d e文で使う r dat日ステップや procステップから成る一連の処理」をマクロ化する ( 3 ) r 独立した別の S A Sプログラム J を再帰的 (rccursiv e )に使う! ( 2 ) l この手法は SAS プログラミングではほとんど兄られな~ ¥̲,これを使った例としては、 S u o h .S( 2 0 1 2 ) や 周 防i a i W・知 平菜美子(2012)の数独を解く SASプログラムがある ι 252

251.
[beta]
5. SASマクロ言語を使ってデータステップなどの繰り返しとスキップの方法

通常の SASプログラムで、 dataステップ、 procステップ、或いはその組み合わせを、或
る条件が成立、又は不成立した時だけ実行する、又は実行しないという処理は大変やりづ
らい。この様な場合、対象となるデータステップをマクロ化(覧macro,見mend)すれば、必
袋に応じて何度もそのマクロを実行すればよい。或る条件の場合に実行したり、しないの
であれば、 SASマ ク ロ 言 語 の ゆ if‑%thon一恥 ls巴」を使って、マクロの実行を制御すること
によって、特定の dataステップ、 procステップ、あるいはそれらの組み合わせを実行した
りスキップしたりできる。今回の我々の住所情報分割システムでも、完成版ではこれを使
い、場合に応じて、プログラムの一部をスキップさせている。

6. マクロの定義音¥
1
分の作成ノら?去
SASプログラムを書く際、最初からマクロ定義して部品を造り、それを使ってプログラミ

違いも起こりやすい。最初はマクロ言
ング作業を続けるのは、大変繁雑な作業になり、!日i
寺に初めてマ
語を使わない普通のプログラムをさいておき、再度その部分が必要になった H
クロ化するのが能率的である。マクロ言語を使わない普通のプログラムの段階で動作を確
認した後で、必要に応じて変数名やデータセット名をマクロ変数化すればよい。実行時に
マクロ部分が正常に展開 (roso1vo) されているかどうかを健認するために、 options文で

O
Gi
i
I
i
面に展開結果を表示させることができる。
以下のオプションを適宜使って、 L
(MPRINT,MACROGEN,MTRACE,SYMBOLGEN,MLOGIC,MFILE)

7. 4:システムで使用した S
¥
iSの主な命令文や関数
本システムで使用した SASの命令や関数を以下に示す。
i
n
f
i
l
e日
,l
e,
k
i
n
d
e
x関数, k
i
n
d
e
x
c凶数, i
n
d
e
x関数, s
u
b
s
t
r関数, l
e
n
g
t
h関数 procimport,
f文
, procp
r
i
n
tの (
o
b
s
=
),[
[(concaLenation),end=,c
a
l
lsymput,
サブセット i
proctranspose,d
a
t
a̲
n
u
l
l
̲,select‑when,merge,̲
n
̲,dsd,explicitr
e
t
u
r
n,r
e
t
a
i
n,d
e
l
e
t
e

ここで注目して欲しいのは r
explicitr
e
t
u
r
n
J ~である。 return 文は通常の SAS プログラム
では使わずに済む命令文である。 expliciLreturn (見える return文)の他に、 impliciLreturn(
見
えない return文)がある。 implicitreturnは必ずデータステップの最後にあることになって
し、るが、見えない return文の名の通り、

r
r
e
t
u
r
n
;J はなくてよいが、わざわざ入れても構わ

ない。要するに、どちらの relurn文でも、実行されると、次のオブザベーションに制御が
飛んで、その下にある全ての命令文は無視される九。この機能はプログラムの制御をする上
で、極めて便利である c
2L
'
x
p
l
i
c
i
tr
e
t
u
r
nがよく使われる今ひとつのケース{土、 f
l
i
n
k
‑
r
e
t
u
r
n
J である。この場合{土、 r
r
e
t
u
r
n
;Jが実わされる
と、対応する l
i
n
kj(の次の命令文に:I
l
i
Ji仰い移る e この l
i
n
k
‑
r
e
t
u
r
nはデータステップ内で、 r
l
剥いたサブ〉レーティン j と同
じ概念で使うことができる一

:1 1!~ 近では S t\S で goto j
(
i
)
>
(
主われることはほとんどなくなったが、不 j
礼立に使うと、とんでもない制御になりかねな

いので注立が必要であるご

253

252.

8. 初期ノくージョンのプログラム 本システムの初期ノくージョンは 3つの SASプログラムから成る。 ( 1 )hokkai d o .sas gi naI ̲ d s .sas ( 2 )create̲ori ( 3 ) shi kuchoson.sas このうち、 ( 2 )と ( 3 )を付録 1に載せておいた。 ( 3 )にはチュートリアル用に、説明用のコ メント文を入れておいた。このうち、コメント文で「女前半部」と「女後半部」と記した 箇 所 は 完 成 版 で は 、 そ れ ぞ れ make̲final̲key.sas、 final result.sas として独立した SAS プログラムにした。(1)は安井・周防 (2013)に所収されている。 9 . 完成版の非マクロ化プログラム 安 井 ・ 周 防 (2013)に所収されている完成版のプログラムは SASマクロ言語を使って作成 したが、そのうちの final̲result.sasだけを、マクロを使わずに書き直してみた(付録 2)c 初級者にはこのみの t理解しやすし、かも知れない。このプログラムで、使った市区町村名で分 割 す る 方 法 は 、 関 数 kindexを使い、表 lで示した全国の市区町村名の文字列があるかどう かを調べている。この方法を使えば、名簿ファイルが都道府県名の分離型データでも一体 型データでも、同じプログラムで処理できる。一体型の場合、ヒットした市区町村名で分 劃すれば、前半は都道府県名、真ん中は市区間 J 村名、後半は残りの住所表示に自動的に分 割される。 参考文献 ( 1 ) 安井浩子・}lE,j 防節雄 (2013) 名簿の住所情報を市区町村よれで自動j分割する SASプログラム、 SAS総会論文集 2013 ( 2 ) Suoh,S ( 2 0 1 2 ) Sl Id okll‑SolvingSyst巴mbySAS@,t h巴 digita1Proce巴dingsofSASG1oba1 ド 1orida, US , ¥ i Apri1 2012, ( Invited Paper) Forum, (http://support.535.com/resourc巴s/pap巴rs/proc巴edings12/225‑2012.pdf) 2 0 1 2 ) I 進化する数独解法制Sプログラム j、SAS総会論文集 2012 ( 3 ) 周防節雄、知平菜美子 ( ( 4 ) 周防節雄他 ( 2 0 0 9 )I 法人企業統計調査と事業所・企業統計調査の統合データによる企業デー タベース: 1983~2005 年 J ~統計数理』 第 57巻第 2号 pp.277‑303、2009/12 付 録 1 市区町村名で住所情報を分割する SASプログラム(初期バージョン) /*巳) c r e a t e ̲ o r i g i n a l ̲ d s . s a s 1 * / 本分割したい住所ファイル名を指定して下さい, 引e to r i g i n a l ̲ a d d r e s s ̲ d a t a =全顧客名簿 x l s x : *上記のファイルが保存されている場所の fullpathを指定して下さい; 引e tf o l d e r = C :平 S A SF o r u m 平2013平S A S総 会 2 0 1 3発表資料平報告用住所名簿データ; o p t i o n ss y m b o l g e n : p r o ci m p o r td b m s = E X C E Lo u t = o r i g i n a l ̲ 1i s t e="品f oI d e r平 品o r i g i n a l ̲ a d d r e s s ̲ d a t a " d a t a fiI r e p l a c e : s h e e t = "府県分雛済データ". r u n . d a t ao r i g i n a l ̲ l i s t :s e t :i d n o + 1 :r u n : 254

253.

1 *段)shikuchoson.sas1 * 1 本このプログラムは「府県分離型データ」にのみ対応している; 本女前半部:市区町村名で分離するために必要な全国の市区町村名から成るデータセットを作成する; 引e tdata̲kensu=534: 本元の住所リストの件数を指定する; 引 et shikuchoson no=1903: 本全国の市区町村数を指定する; nH Hu r proc import dbms=EXCEL out=original̲shikuchoson datafile="C 平SAS Forum平2013平SAS総会 2013発表資料平報告用住所名簿データ平全国住所データ平市区 町村名一覧 xls" replace: sheet="市区町村名 覧(変数名変更)": data original̲shikuchoson: s e t : seriaINO+l: 本後で元の1 1 慎序に戻すための情報; r u n : proc print data=original̲shikuchoson ( o b s = 1 5 0 ) : title "修正前の市区町村名 出i nclude 覧.xls": r u n : " c平SAS̲Foru耐 2013時 前 総 会 2013発表資料平 hokkaido.sas": 本二つのデータセット original̲shikuchoson と hokaido codeを shichosonl と shichoson3でマッチマ ジし、前者に北海道の郡名を与える。, proc sort data=original̲shikuchoson: by shichosonl shichoson3: r u n : proc sort data=hokaido̲code: by shichosonl shichoson3: r u n : data shikuchoson2: merge original̲shikuchoson(in=inl) hokaido̲code: by shichosonl shichoson3: i fi n1 : run, 、 proc sort data=shikuchoson2: by serialNO: r u n : 本元の順序に並べ替える; proc print data=shikuchoson2 ( o b s = 5 0 ) : title hikuchoson2": r u n : data shikuchoson: drop gun serialNO: s e t : 本後の処理で必要な変数は shichosonl と shichoson3であるが確認のための変数も残した, i f shichoson3=" " then delete: i f gun NE " " then d o : kyoku=shichosonl: shichosonl=gun: 巴n d : r u n, proc print data=shikuchoson (obs=100): title "shikuchoson": r u n : data ki ri tori: │ 巴n gth kiritori $3 0 : s e t : kiritori=compress(shichosonl 1 1 shichoson3): 本変数 ki ri toriの長さのチェック(以下の 5行の statementはなくても良い): 本 / i f shichosonl竺 " " then lengthl=O: else lengthl=length(shichosonl): I ength3=I ength( s hi choson3): length=lengthl+length3:本市区町村名(郡名含む)の文字列の長さ; i f length=4thenput ken=shichosonl= shichoson3= kiritori=: 本漢字 2文字の市区町村名を確認, 本/ r u n : proc print data=kiritori (obs=300): var ken kiritori shichosonl shichoson3: title "shichosonl+shichoson3": r u n : data ki ri tori ̲key (keep=ki ri tori ): s e t : r u n, 255

254.
[beta]
proc p
ri
n
t data=ki
ri
t
o
ri
̲key (
o
b
s
=
1
0
0
)
; ti
tI
e "data=ki
ri
t
o
ri
̲key"; r
u円
;
proc transpose data=kiritori̲key out=kiritori v
a
r
;v
a
r kiritori; r
u
n
;
proc print data=kiritori v
a
r
; title "data=kiritori v
a
r
'
" r
u
n
;
data kiritori̲var (
d
r
o
p
=
i
)
;
s
e
t
;
o
;
array c
o
l $coI1‑col&shikuchoso円 n
len1‑le円&shikuchoso円 n
o
;
array l
e円
do i
=
l to &shikuchoson n
o
; len[i}=le略 的 (compress(
c
oI[
i
}
)
);
巴n
d
; 本市区町村名文字列の長さ;
r
u円,
proc print data=kiritori v
a
r
; title "data=kiritori var+le円". r
u円,
data final̲key (
d
r
o
p
=
i
)
; 本後半部で一対ーのマッチングをするために住所件数分をコピーする,
set kiritori v
a
r
;
do i
=
l to &data̲kensu; output; e
n
d
;
r
u
n
.
本名簿の住所情報と全国の市区町村名をマッチングする準備が整った;

本女後半部

名簿の住所を市区町村名で分離する;

s
tに importする,
本次のプログラムで元の住所情報を SASデータセット oroginal̲1i
出include "C 平SAS Forum平2013平SAS総会 2013発表資料平初期パージョン平create̲original̲ds.sas";

*以下で、 oroginal̲1i
s
tと final̲keyのマ

ジをして、名簿の住所を市区町村名で分割する;

f
ilename o
u
t
1"
C
:平SASForum平2013平SAS総会 2013発表資料平初期パージョン平住所分割失敗 csv";
fiI
enameout2"C 平SAS̲Forum平2013平SAS総会 2013発表資料平初期パ ジョン平最終結果住所ファイル.csv";
data final̲1i
s
t(
k
e
e
pニi
d
n
oi
d zip pref address1 address2 b
u
iI
d
i
n
g
)
;
fiI
e out1d
s
d
;
merge original̲list final̲key; *同じ件数のデータセットをマッチマージする,
l
e円gth addr巴s
s
l $3
0
; *分離した市区町村名.
$100; *市区町村名を切り取った残りの住所情報;

!日円 g
th addr巴ss2

array c
o
l $coI1‑col&shikuchoson n
o
;
array l
e円
len1‑len&shikuchoson n
o
:
do i
=
l to &shikuchoson n
o
;
I
eft= substr(
a
d
d
r
e
s
s
.1
.I
en[
i
}
)
; *名簿住所の先頭部(長さ I
e
n[
i
}分);
right=substr(col[
iJ
.1.len[i}); *全国市区町村名;
i
f left=right then d
o
; address1=left; *分離した市区町村名を変数 address1に保存,
xaddress=address;
)
=
""
;e
n
d
;
d
oj
=
l to l
e
n
{
i
}
; substr(
x
a
d
d
r
e
s
s
.j
.1
address2=left(xaddress);本市区町村名切取後の残りの住所情報;
output; 本分離成功したのでデータセット f
i
n
a
l Ii
s
tに保存;
r
e
t
u
r
n
; *安次の observationの処理に行く,
e
n
d
:
e
n
d
;

本住所分割失敗の出力*ここが実行される時は、全国の市区町村名のどれにも該当しない時に限る;
put i
d
n
oi
d zip pref address b
u
iI
d
i
n
g
: *filename o
u
t
1に CSV形式で出力する,
r
u
n
.
data 円u
l
l
f
il
e out2 d
s
d
; *分割成功した住所情報だけを fiI
ename out2に CSV形式で出力する,
s
e
t
:
put i
d
n
oi
d zip pref address1 address2 building:
r
u円
,

256

255.
[beta]
付録2 市区町村名で住所情報を分割する SASプログラム(非マクロ化完成版)

1
*庁i
n
a
l
̲
r
e
s
u
l
t
x
x
.
s
a
s
I*
1 *非マクロ化した完成版プログラム;
x
c
e
l ファイル名と (
2
)sheet名を指定して下さい;
*・分割したい名簿情報の(1)E
x1
s
x
: *(
1
)E
x
c
e1ファイル名,

引巴 to
riginal̲address̲data=全顧客名簿

引e
tsheet name=府県分離済データ
*
(
2
)
E
x
c
e
l ファイルの sheet名;
時l
e
t sheet̲name=府県分離済(府県文字なし): *(
2
)E
x
c
e1ファイルの sheet名
,
内l
e
t sheet name=
府 県 一 体 型 *
(
2
)E
x
c
e1ファイルの sheet名
,
*
出l
e
ts
h
e
e
tー n
a
m巴=id,b
u
iI
d
i
n
g,nameな し *
(
2
)Exce1ファイルの sheet名
,

*・上記のファイルが保存されている場所の f
u
l
l pathを指定して下さい,
引巴 tf
o
l
d
e
r
=
C
:平SAS̲Forum
平2
013平SAS総会 2013発表資料平報告用住所名簿データ;

*・前処理用の SASパーマネントデータセットを保存するフォルダを以下で指定して下さい,
引巴 tk
iritori̲var=C:お A
SForum
平2
013お A
S総会 2013発表資料¥報告用住所名簿デ タ;

a
)と (
b
)の二つの c
s
vファイルが出力されます。
*+このプログラムを実行すると、次の (
(
a
)正しく分割された住所情報は「最終結果住所ファイル.c
s
vJ
s
v
J
(
b
)住居表示に何らかのエラ があり、分割処理できなかったものは「住所分離失敗 c
*・この二つの出力ファイルの保存先の完全パスを以下で指定して下さい;
%Iet save̲output=C:¥SAS Forum平2013
平S
AS総会 2013発表資料平報告用住所名簿データ平住所分害J
I
結果.
*・このプログラムを保存しているフォルダを以下で指定して下さい,
引巴 ts
ave̲program=C平SAS̲Forum
平2
013平SAS総会 2013発表資料,

*

ー
ー
ー
一
一
一
一
一
一
一

一
ー
一
一
一
一
一
一
一
一
一
一
一
一
一
一
一
一
一
ー
ー

一
一
一
一
一
一
一
一
一
一
一
一
一
一
ー
一
一
一
ー

ー

一
一
一
一
一
一
一
一
一
一
,

f
il
e
n
a
m
eo
u
t
1 ‑&save̲output平住所分割失敗 csv ,
f
il
e
n
a
m
e out2 ‑&save̲outputV最終結果住所ファイル.c
s
v,
1i
b
n
a
m
ek
i
r
i
t
o
r
i ‑&kiritori v
a
r勺*住所切り離し用の PermanentSAS datasetが保存されている.

*
‑
‑
‑
̲
̲
‑
一
一
一
一
一
一
一
一
一
ー
一
一
一
一
一
一
一
一
一
一
一
一
一
ー
ー

ー

ー
ー
ー
一
一
一
ー
一
一
一
一
一
一
一

*下のプログラムで元の住所情報を SASデータセット o
r
o
g
i
n
a
l
̲
1i
s
tに i
m
p
o
r
tし
、
かつ、各オブザベ シヨンに 1から順番号を振り、都道府県名の S
AS変数の長さを 8ハイトに設定;
n
c
l
u
d
e ‑&save̲program平create̲original̲ds.s
a
s
'
ぺ*女マク口実行;
出i

data original̲1i
s
t(
d
r
o
p
=
l
e
n xlen x
z
i
p
)
:
s
e
t original̲1i
s
t
:
*北海道等の爵便番号の先頭の O又は 0
0が supressされている場合 i
ま復元しておく;
*
0
1
Jえば、札幌市北区の r
1
0
0
3
1J を r
0
0
1
0
0
3
1
J に修正する,
*更に、郵便番号の前半部 (
3桁)と後半部 (
4桁)を分離する;
i
fi
n
d
e
x(
zi
p,‑
ー
づ
竺 then do: xlen=1巴ngth(
zi
p
):
o
:x
z
i
p
=
z
i
p
: zip=‑OOOOOOO‑:
i
fx
l巴nく 7then d
substr~ip , 8-xlen , x
len)=xzip:
巴n
d
:
zip1=substr(
z
i
p,1
,
3
)
:z
i
.
p
2
,
;
,s
u
b
s
t
r(
z
i
p,4
,
4
)
:
zi~=compress(zip1 1
1‑
‑
‑1
1 zip2)。
巴n
d
:
u
b
s
t
r(
z
i
p,1
,3
)
: zip2二 s
u
b
s
t
r(
zi
p,5,4
):
else z
i
p
1三 s

o

*都道府県名の欄に市名があるデ タの復元、この場合、都道府県名 l
ま欠損{直になる;
i
fsubstr(
1e
f
t(
k
r
e
v
e
r
s
e(
p
r
ef
)
)
, 1
,2
)=‑市"
then d
o
: 1
en=1
巴n
gth(pref): i
f pref=substr(address,1
,1
巴n
) then p
r
e
f
=
'
1 address): pref=‑‑: return: 巴n
d
:
address=compress(pref 1
*都道府県名の欄の末尾に「都/道/府/県」の文字が欠簿している場合には付加する,
i
f pref=‑東京都‑ o
r pref=‑京都府‑ then r
e
t
u
r
n
:
e
t
u
r
n
:
i
f kindexc(pref,‑道府県づ> 0then r
,4
)
): ー
s
e1
e
c
t(
s
u
b
s
t
r(
p
r
e
f,1
when(
γ
‑東京づ pr巴
e
f
功
=k
口
c
∞m
叩p
r巴s
s(
ω
p
r巴
e
f1
1
w
州h
巴
伺
n(仁‑大阪づ p
肝「巴
e
f
=
k
μ
口
c
∞ompr巴s
s(
ω
p
r巴
e
f
‑府‑):
w
州h
巴
朋
n(仁‑京都勺 p
r巴
ef
吋
=k
∞
co
叩
mp
r巴s
s(
ω
p
r巴
e
f
府‑):
when(
ぱ
0t
h
加巴「仰
wis
臼
巴
p
r巴
ef
吋
=k
∞
co
叩
mp
r巴s
s(
ω
p
r巴
e
fハ
I
I‑県')ド'
巴n
d
:
i
f pref=‑県‑ then pref=

1
1
1
γ
‑

r
u
n,

*

ー
ー
ー
一
一
一
一
一 ー
一
ー
一
一
一
一
一
一
一
一
ー
ー
ー

一
ー
一
一
一
一
一
一
ー
ー
一
一
一
一
一
一
一
一
一

ー

data n
u1
1
s
e
tk
i
r
i
t
o
r
i
.kiritori̲var:
、 hikuchoson̲no‑,shikuchoson̲no):*全国の市区町村の総数.
c
a1
1 symput(
r
u
n,

257

一
一
一
一

,

256.
[beta]
引e
t shikuchoson̲no=&shikuchoson̲no; 1
*右辺のマクロ変数の値の先頭の余分な空白削除 *
1
町 ri
gi
n
aI
̲
Ii
s
t=市区町村分離対象ファイル.

*final 1i
s
t

‑分離成功データ;
‑分割失敗データ;
data f
i
n
a
l 1i
s
t
(
k
e
e
p三i
d
n
oi
d zip z
i
p
1 zip2 pref address1 address2 building n
a
m
e
)1
*分 離 成 功 *
1
e
r
rl
i
s
t
(
k
e
e
己
=idno i
d zip z
i
p
1 zip2 pref xaddress
b
u
iI
d
i
n
gn
a
m
e
)
;
1本分離失敗 *
1
merge original̲1ist(in=in1
) kiritori.kiritori̲var;

内 r
rl
i
s
t

本本本

分存
部・保
名分報
村部情
町所所
的住住
河川の用
区り業
市残作

︐nunu
nunurb
quTlTl

俗︑ ψ俗︑ ψ俗
︑ V

FOFOFO
Fbpoρu

4
l
i
e
n
J
L
e
A
U

OVA

内

eer

d

勾

VIv‑‑門u
t門
ut門
ut門
u
tu
門 tU
門
勾
d

s

lhHlhH n
H

n6nら 円
nHnHnH
ououou

・
+L+L
+L

array c
o
l $coI1‑col&shikuchoson n
o
:
巴n
1
巴n
1‑len&shikuchoson n
o
:
array 1
array x
c
o
l $30 xcoI1‑xcol&shikuchoson n
o
;
「
巴t
ain
xcoI1‑xcol&shikuchoson n
o
:
array xlen
retain

xlen1‑xlen&shikuchoson n
o
;
x
l日n1‑xl巴n&shikuchoson n
o
;

l
e
n
g
t
hp
r巴v̲kanji $2
:
i
f ̲n
一=
1 then do i
=
l to &shikuchoson̲no: x
c
o
l{
i
J
=
c
o
l{
i
J
: xlen{iJ=len{iJ: 巴n
d
:
s二 p
r巴f̲address:
i
f &switch=2 then xaddr巴s
else xaddr巴ss=addr巴s
s
:
do i
=
l to &shikuchoson n
o
:
p=ki
ndex(
x
a
d
d
r
e
s
s
.substr(
x
c
o1{
iJ
.1
.x1
e
n{
iJ
)
):
i
f p=O th巴ngoto r
巴p
e
a
t
:
本マッチした時、修J
Iえば山形県村山市と東京都東村山市の半J
I別必要,
i
fp
=
l then goto O
K
; 本分離型データの場合、 xaddressの 1文 字 目 あ る 時 は O
K
;

)
本2
‑
1
.
2
):
i
f p)=2 then prev̲kanji
=substr(
x
a
d
d
r
e
s
s
.(
p
‑1
本2文字目以降!こあった時は、その直前の漢字をチェックする;
本分離型で誤って都道府県名が住所と一緒になっている場合、文は、一体型の場合:
i
fp
r巴v̲kanji N
E "県" A
N
Dp
r巴v̲kanji N
E "都" A
N
D
prev̲kanji N
E "府" A
N
D prev̲kanji NE"道"
th巴ngoto repeat: 本ミスマッチのためマッチング作業継続;

i
fp
r巴v̲kanji = "県" OR prev̲kanji = 都" OR
prev̲kanji = "" OR prev̲kanji = "道
then pref=substr(
x
a
d
d
r
e
s
s
.1
.(
p
‑1
)*
2
):本都道府県名ゲット;
O
K
:;本分割成功.
address1=xcol{
i
J
: 本市区町村名;
substr(
x
a
d
d
r
e
s
s
.1
.(
p
‑
1
)本 2+xlen{iJ)=" "
:
addr巴s
s
2
=
1巴ft(xaddr巴s
s
):本残りの住所情報;
output final̲1i
s
t
;r
巴t
u
r
n
: 本次の observationの処理に行く;
repeat::本マッチング作業継続;
e
n
d
;
本ここに制御が移る時は、マッチする市区町村名がなかった時,
output err
̲
Ii
s
t
: 本例外処理(入力データに規則違反のデータ有り);
r
u
n
.

data ̲nu1
1一'本分離成功データを c
s
vファイルに出力する;
f
i1
巴 o
ut2 d
s
d
:
set f
i
n
a
l 1i
s
t
;
s
l
.address2.b
u
iI
d
i
n
g
.nam巴".
i
f n=
1 then put "
i
d
n
o
.i
d
.z
i
p
.z
i
p
1
.z
i
p
2
.p
r巴f.addr巴s
put i
d
n
oi
d zip z
i
p
1 zip2 p
r巴faddress1 address2 building n
a
m
e
;
r
u
n
.
s
t(
k
e巴p=id zip z
i
p
1 zip2 p
r巴fI
句 d
dress本 Ixaddress b
u
iI
d
i
n
gi
d
n
o nam巴) :
data x巴rr 1i
本分害J
I失敗の住所表示(一体型デ
タ)から都道府県名を切り離す;
i
f &switch=l I
本貴分離型データなら、この data s
t巴pを実行しない肯本Ithen s
t
o
p
:

258

257.

s e te r r1 i s t ; x = s u b s t r ( x a d d r e s s,5 ,2 ) ; 本住所情報の先頭から 3文字目; s e l e c t ; w h e n ( x = "県" o rx = "都" o rx = "府" o rx = "道づ d o ;p r e f = s u b s t r( x a d d r e s s,1 ,6 ); s u b s t r ( x a d d r e s s,1 ,6 ) = x a d d r e s s = l e f t ( x a d d r e s s ); e n d ; w h e n( s u b s t r( x a d d r e s s,7 ,2 )="県勺 d o ;p r e f = s u b s t r ( x a d d r e s s,1 , 8 ) ; /本先頭から 4文字日本/ s u b s t r( x a d d r e s s,1 ,8 )= ' x a d d r e s s = l e f t ( x a d d r e s s ); e n d ; o t h e r w i s e ; 本この場合は p r e fは欠損値になる, 巴n d ; r u n, CJVCJV ‑ ︐ . +﹂+L VA 一 一 rr r r e E oupM edcd + ﹂ + ﹂ nHpu pucd ιH11a V te ‑ e''hH 札 一 + ﹂ 戸 し‑ S +﹂ qd ρ v ︐ +l law 一 S V 1 0U ﹁ qG ﹂ + JU r u n, d a t an u1 ;*分離失敗データを c s vファイルに出力する, fi 1 eo u t1d s d ; t : s e te r r1 i s i f n= 1t h e np u t" i d n o,i d,z i p,z i p , lz i p 2,p r e f,x a d d r e s s,b u iI d i n g,n a m e " ; p u t i d n oi dz i pz i p 1z i p 2p r e fx a d d r e s sb u iI d i n gn a m e ; r u n ; 259

258.

S A いや蝕…畑山い地勧地イ ~I MIProcedureによる多重代入 SASv e r9 . 3における新機能の紹介 多国圭佑 イーピーエス株式会社臨床情報本部 データサイエンスセンター統計解析 1 部 M u l t i p l eI m p u t a t i o nbyMIProcedure I n t r o d u c t i o nt oNewMethodf o rSASv e r9 . 3 KeisukeTada EPSC o r p o r a t i o n C l i n i c a lI n f o r m a t i o nD i v i s i o n DataS c i巴nceCenter S t a t i s t i c sA n a l y s i sDepartment1 I縞 ユ + 蝕 一 … 一 … 201I ‑要旨: MIProcedure!こVer9 . 3から新たに追加された FCS( F u l l yC o n d i t i o n a lS p e c i f i c a t i o n ) methodについて紹介する。 圃キーワード: 欠損、欠損メカニズム、 MIProcedure、 MIANALYZEP r o c e d u r e 261

259.

. ← ザ ー 総 合 同 一 一 圃アウトライン 》製薬業界における欠損データの扱い 》欠損について .欠損のメカニズム .欠損データの構造 》欠損データの様々な解析手法 〉多重代入が有用な事例の紹介 • MIP r o c e d u r eの コード、 ・出力結果 〉まとめ I~ユーザー倣一……… l E l ]I ‑製薬業界における欠損データの扱い ?2010年に FDAが欠損データに関するガイドラインの基 となる報告書 (NAS報告書)を発出した。 ?2010年 i こEMAが欠損データに関するガイドラインを公 表した。 ?2012年!こ NewEnglandJ o u r n a lo fMedicineで総説論 文が報告された。 262

260.

I~ユーザー触 tiUMJj_j……~ 201I 園欠損メカニズム 欠損データモテ、ル Pr(R]Y ) obs!Y misJψ Yobs :晶 君 巴rved ~ Y竹 町 :m. I 'B sing 日 I1:008εrued 10:1n1S8ing ψ:p a : r αmeter 1 . MCAR(MissingCompletelyA tRandom) Pr(R= OlY 1 ψ ) o b s 1Ymis • ψ) = Pr(R=0 2 . MAR(MissingA tRandom) )ニ Pr(R=O Pr(R=O l Y IY , 伽2 ψ ) a h l l 1丸山, ψ 3 . MNAR(MissingNotA tRandom) Pr(R=Ol}~ , Y , 胸 , ψ)= Pr(R‑O IY obsl丸 山 ψ) │山一ザ山蝕 口附吋s 口 Oωb s e ed ‑欠損データの構造 到l 凶 凶同 日仰町 問 W… 吋 Y1 Y2 Y3 Y4 Y1 Y2 Y3 Y4 MONOTONE NONMONOTONE ( A R B I T R A R Y ) v i s i t1 v i s i t2 v i s i t3 v i s i t4 v i s i t5 v i s i t6 v i s i t7 263

261.

~I ぬーザー総会……一世叫 圃現在提案されている解析手法の例 》欠損値を伴う症例を除いた解析方法 (Complete‑caseA n a l y s i s ) 〉欠損値のみを除いた解析方法 ( A v a i l a b l e ‑ c a s eA n a l y s i s ) 〉欠損値を補完する解析方法 . S i n g l eI m p u t a t i o n ・ M u l t i p l eI m p u t a t i o n ←今日はここの話 〉欠損値を伴うデータでも解析できる方法 M L .REML.ベイズ法) ‑尤度に基づく方法 ( ・モーメントに基づく方法 (GEE.IPW法) ・ セ ミ1 ¥ラメトリックな方法 (Cox比例ハザードモデル) │川三 脚ユーザー紘一~則一… 圃 M u l t i p l eI m p u t a t i o n I夕、・ . ‑ E ‑ = = 2 6 4 ~I

262.
[beta]
.:J.‑+1‑触…一一勾

SAS
•

I
D

Ver9
.
2で使用可能な MIProcedureのMethod

RecommcndedMe白 叫s

f
J
'
a
U
e
r
no
f Typeo
M M nJ
.
.
'
s
I
'
5
:
S l
mputedV
a
r
l
3
b
J
e

r
.
.
l
o
n
o
t
o
n
e

C
o
n
l
i
n
u
o
u
s

• RC' gres~jon

•r
r
o
o
i
c
t
e
d問 飢 m
a
t
c
h
i
n
g
P
r
u
p
e
n
s
i
l
y回 胆

・

・Lo
g
.
i
¥
t
i
cr
e
o
g日 &
&
i
o
n

Monoton
C
'

C
l
a
s
&
I
l
i
c
a
t
i
o
nイOr
d
i
n
a
l
)

Monotone

C
l
a
s
s
i匝c
a
t
i叩 (Nomin3
lJ

・
D
i r
i
m
i
n
a
n
tf
I
四c
t
i
o
ome
出叫

Arb
i
l
r
a
r
)
'

Conlim
民 地5

‑恥1CMCf
u
J
l‑
d
a
t
.
ai
m
p
u
l
週l
i
o
l
l

M
:

• MCMCmollOl
o
n
e
.
d
a
l
ai
r
n
p凶t
a
t
i叩
S
A
S
/
S
T
A
T9
.
2U
s
e
r
'
sg
u
i
d
eよ
り

│臥嚇………地mJ
•

Ver9
.
3で使用可能な MIProcedureのMethod

t
P
a
l
l
e
r
no
1
1
1
1
日加宮"""可

T
y
p
eu
f
1
m
p
"
l
L
'
C
I
、t
"
r
b
hl
t
>

"
I
y
p
e(t(
仁

A
V副J
a
b
l
e:
'
Il
t
t
b
o
o
s

o
'
¥
'
:
u
1
a
t
回

A甘沼甘耳、a

A
r
l
元同庁

A
r
b
i
l
r
a
.
r
¥
'

・I'C
S
l
e
君m詰 民 間

Arh
i
t
r
a
r
)
'

・FCSI
O
l
l
i,
t
i
c g
a
s
l
J

.I'C5 戸edir~d m
eanm
a
t
d
u
n
g

A
r
b
il
T
:
l
l
)
'

C
I
:
m
i
f
l
(
a
t
i
o
n(
o
T
d
i
n
a
l
l

A
r
l
苅tT
:
u
)
'

C
l
a<s.
t
iC!ll
i
c
旧 (
n
o
‑
mm
a
J
} A
r
b
i
l
r
a
r
y

陀

聞

・
ιCSd
i
s
c
r
i
m
i
n
a
n
lr
u
n
r
l
i
o
n
.
3U
s
e
r
'
sg
u
i
d
eよ
り
S
A
S
/
S
T
A
T9

265

263.

.mg │ ωユ ー ザ ー 触 一 … … … 圃 M IProcedure適用事例の紹介 》設問ごとに 1‑10の得点をつける調査票を実施。 》各設問の得点の合計(スコア)を算出したい。 》時系列データである。 》欠損を0で補完すると明らかな過小評価につながる。 │ ωユ ー ザ ー 総 合 問 問 ‑使用するシミュレーションデータ①(欠損なし) V I S 訂 九 吋 1 q 3 4 1 q 2 4 E E おお芯出口}担 E E Z 266 同 2 4 喝ι& " 3 4609A63306ミ 4 、 , ' 2 46666S64645 ツ コ 797554453HJ33 5237b74 ー 1 1 1 1ヨ 2 2 2 3 河 辺 3 4 4 4 1 5 b 5 5 E

264.

両I ~I ユーザー総会……一地 ‑使用するシミュレーションデータ②(欠損あり) V芯打 I Y 1 ;亡二二手 ヒ二コ 7 0ー4 6 6 a h O 0 6 £ 6 4 5 l 3 3 1 1 2 ヲ 2 2ヨ 8 3 3 3・ 4445555 回 : ! C E二3 担 6 33 " 2 古 ユ 『 ザ ー 触 開 会 一 … ‑ 一 臥s • M IP r o c e d u r eコードの説明① 》欠損を補完する際、前後の時点の情報も使用するため、 PROC TRANSPOSEによって全ての変数を横に並べる。 PROCM IDATA= DS M I S STSEED= 1 2 3 4 5ROUND= 0 . 1 1 0OUT= O U T M I ; 乱数のシード 補完値の桁 NIMPUTE= 補完する回数 FCSREG; ( Y12= Y13Y14) V A R Y : ; ※モデル式を入れることも可能 モデルを指定 RUN; j 主 FCSステ トメントは評価版であるため以下の NOTEが出る。 NOTE:TheFCSstatementi sexperimentali nt h i sr e l e a s e 267

265.
[beta]
::漁民投脅しみが.み-k")l~II:"

20I

• MIProcedureコードの説明②

>FCSステートメント
.OISCRIM
判定1関数を使った方法(名義尺度)

・
LOGISTIC
ロジスティック回帰を使った予測()I自序尺度)

.REG
回掃を使った予;Jt
J
I(連続変数)
.REGPMM(連続変数)
推定後、最も近い値を補完
'OUTITER
反復計算中の値を全てデータセットに出力

…
…
… 二三mI

I‑

ザ山総会 7"'n7'17'
l

‑MIProcedureの出力結果①

挙手当吋品沼山

U

げゐ

‑
‑
ー
一
一
一
一
一一 一
一一.
ι
.一一一一・…ー
日 制

・ー酬.‑ー齢ー叩
」

.• . ・ ・

al.hJ
色.

J
事五i7iii実写ナ

よ ミ 芸 手 芸1
ミ

掛 馳

2
6
8

266.
[beta]
P
.
{
I
I
J
I

SA
やや緯合間切手…りー…
• MIProcedureの出力結果②
1

.
.
田
,
.

'i1)

f

V1
‑
4 't!1 V'J'f 1 、~~

Y
.
tt 別 刷 判 官

…
一
ぜ"写"調。

x

x

x

x

x

X

1
)
.
:

X

X

X

:
)

x x ;
)

X

(
:

X

X

X

A

,
(
.

λ.‑.

X

A

.
.

).・

X

).・

.,

ι ) (

x

月
,
:
.
,
.

~

GA

;.:、

X

1x

X

:
.
;

l
i
I

...",:

1
.

X

~注.<

.
l

;
:
J
;

r
,
c司 r
.
.
.
.
‑
c
"
'
.
1

、'3)

' γ x

:
J

x

V刊 官

l
j

10J
国

t
l

n凶

2 'f.

X

) i 説 、

疋,混

v

、 , 、

i

X

X

~

X

~

~

x

J

)
(

X

X

)
t

:
.
;

x

x

x

て 型

0
(

1
.

1
:

命耐

宅

'
0
。

K

l
H
o
O

w

、
"
宅

~.

…
…
一
:
l
;
x
:
X
X
i.l,
X : .一
::()().X

輸

'00

︒

υ

zhvv

t

一﹂⁝

Ah

一

‑LV

︑︑

F

'
n
︑
ハ
刀
s
n
︐
.
L
'
H

u

な
ま
で一
と
N

:州

υ

の
ん

︑N
VJ
O
M

201I

│卵子ザ嚇町一ー&……
• MIProcedureの出力結果③
'(H

盲目

'
1
?1

'nl

'
r
:
Il

百 . " ,

……
聞記一一…
一一一
一
.
.
…
…
・
…
・
…
一
・
…
'
即
時一
一
.
.
:
r
.
'!l~ I
:
j

ベ

~:“~.:"ヨ)~, 1C ! ; 目 的 利 刊 ; ヲ t
.
1'
̲

"1""11

'f~rírr.

‘

• :~l'u
.
.
,
.
.
.
.
.
.
.
,
. ,
へ
のm

lua ‘、,.,柚,~>(.

~n刊円

刊-~.

.
"

n ,山、官、~., :II ・

2

I
.
JH H :

:
:
;
)
n
r
o

, ,脳同

3明 日 111n

山口矛山 ~," j

印、町署
~,II:",書

偽
沼
町
・
" !UUII! "脚"副・ !U!

;oo~(.(':

‘ ocor.x

川 … 4 . l )~,~

)

o
o
e
t ~四~

e

附 ヲ '
"1811

flllUI

,
担
問
…

町
'
崎
署
.
、
"
.
・
,
=
>
,
・ 1111・
別
勘 nlf'"

1

一
一
一
ー
一
一
一
一
一
一
寸
'
'
'
'
2
1 "';1 '
I
1
i
"
J
4
i11
ì'~
Y11 η パ
』…一一一一1一
…
一
; s
r
o 一一一一一
:0?
1': .
.
f

1曲 χ四 日X< X 河 崎 間 随 《 α
:0000岨耳侃ち'"ぼ'0<苫Il:l))e
誕
) H' O : 回 争 叩XUjO

"N

欠損の有無のパターン及
びパターンごとの各変数
の平均値が表示される

"
J
'
1
1

".~-'-ー…一一
刊 ;;s.;:
曲 川

一山叫一一一一一一 …
,
… ・
…
,
…
…
……
一
…
…
一
一一一一 一
一時
(
ー
ち一
一
宅一
て
:
,
:
.
o
o
o
o
c
,
吋……
コ・ ……
弓

日 制 い , 師

・~"::HJ

岬,

,日おれ~

6n~tl~

[f9~&t~

,
,
o
c
o
:
n
y
; 'u::n・ 一 一 t… " 叩 ? 手 間 配
,
.
.
..

戸、吋宅…

~r.-.'.-'''''.

1:(,~'V'N>rO

ピ C:;~ !ï'"

叩3.11

:;一一'日嗣

.H~附

5:~:.}

日間 7

elXJXO,) ~ JJ}山

".
.
.
.

'HC4H

2 日おお》

(COXJ))

n

"C‑Xl:
.
:
'
J

E

!O oco:D~

t
一 一

m

~.:o::oXl

~Lan:..::

..~

.
r
.
.
y
.
.
.
.
.
.
.
. ';‑f"C o n

269

:.叫刃"""""

267.
[beta]
I

P
I
I
l
J

│鮎釦ーザー総会一川ト品川一…

‑出力されるデータセット
補完された各データセットが縦積みにされて、
IMPUTATIONという変数が追加される。

、 手 恵
三

, ,
,

亡二平

5

勺

? 叉

"

" 、s
: 訪 む

亡二二百

;:;3

,
,

川
一

,

,
,

‑vdJS2'cbJ︐ a‑p‑P5853a

,
,

12‑一宮︑

明よ~

m
︑

主じ~

MPUTED!!
明寸¥'N

YJ1

;c
二=当

;亡二ご宇

201I

制ユーザー総会加ilü:?H'=~地…
• MIProcedure結果①
〉補完された 1
直を持つ被験者を表示。
〉設問 5っと各時点の点数
の平均を算出。欠損のな
.
5
!こ近い値
いデータでは 5
である。欠損があるデータ
では 5
.
5より下がる傾向に
あるが、欠損を補完した平
.
5
1こ近い値を再現し
均は 5
ている。

E

4
7
9
11
‑
16
W

E皇 陛 必E旦
旦 t
t
l
J3ゑ必E
且!:L 型 E
必E
旦旦̲j
5.
5
L.
9
5
5A2
‑1QS

,. 7S

~~G

!
:
TDC
;

0>>

:
J
:
:
;

~!:>

bこ
l
'
o

(
j
̲
JG

. " , 針3

:
‑
'
1
1

uA4

n

、
労

so

ss
弓

Rれ
て
〉

"
:
!
7
T
、
官

uL

(
i2[
j

(
i.
4(
i

Aよ只

d

..0

:
;
4

bnb

b
o
.
:
.
!
b

b
t
υ

35

5.
‑
1

525

51
:1

4i

h:‑
l

3i

5.1
6.
0
6
.
1
5
.
1

;
;
,
:
a

30
43

""

‑
15
47
亡
D

270

GDC
i

R
G21
O.
E3
b主 U

>
t
‑
"
5.
55
.s. 3~

!
:
i
.
.
9
:
:
J

~:J

h~A

55

5./?
6
!
:

5A
595
55

'5
51
4マ

:
;
s

,.
d
.
'
'
6.13
5
.
1
‑
5
/
11

.
s
.
.
s
:4
Gε8

268.

・z 却 九 日 3 n z日 日 計 日 M A h弘 3 P H 3 3 3 3 3 時一吉 U Z M 四 一 色日明﹂ E山一 福 一 Hmw笠 UA幻 円 主 NETuw お Mdnn 伝 記 問 主 同 日 rnmuEm 寅 一 言 万 羽 沼 nHm倒a n お 目 甘 百 万 四 日 泡 宿 泊 担 円 包 討 ち 伺 函 一 AO 201I │凱民ーザー触同一…一… 一 2 7 1 訴 一 町 一 〉まとめ 多﹂亡 ‑まとめ 25 〉多重代入が有用な事例の紹介 • MIProcedureのコード ・出力結果 串 山 町 "Im 〉欠損データの様々な解析手法 企口一︒一 》欠損について ・欠損のメカニズム .欠損データの構造 29aJ352 2 百 3 32: 日間 泉三 4 の 占 山 町民吋 官以 タの扱い 〉製薬業界における欠損テ、 で 時 の 者 ゐ央 え寸 つ 直 を た 白冗 大 ﹄ れ ¥ 戸 中南問 〉各時点における設問の合計 得点(スコア)を算出。補完され た値から算出したスコアはもと のデータにかなり近い値を示し ていることがわかる。 ~I │ ωユーザー蝕~…りー… • MIProcedure結果②

269.

│ ωユ ー ザ ー 総 会 一 … … … ~I 圃参考文献① 岡 .‑咽困輔晦剛圃唖圃圃.:; [ 1 ]不完全データの統計解析 岩崎学著 I [2]FlexibleImputation ofMissingData StefvanBuuren 融問ふ?…一地 .mI ‑参考文献② •[ 3 ] S t e fvanBuuren,2006, F u l l yc o n d i t i o n a l s p e c i f i c ロt i o ni nm u l t i v a r i a t ei m p u t a t i a n •[ 4 ] S t e fvanBuuren, 2007, M u l t i p l ei m p u t a t i o na fd i s c r e t eandc o n t i n u a u sd a t abyf u l l y ロt lOn c o n d i t i o n a l s p e c i f i c •[ S ] T h e r e s eD .P i g o t t ,2001,AR eviewofMethodsfarM i s s i n g0ロt ロ ' [ 6 ]治 験 の 統 計 解 析 理 論 と SASによる実践 A l e xDmitrienko,GeertMolenberghs他 著 森) 1 1馨 田 崎 武 信 監 訳 ' [ 7 ]臨床試験ハンドブ、ツク デザインと統計解析 丹後俊郎・上坂浩之編集 チ G.Verbeke, ' [ 8 ]医学統計のための線型混合モテ"ル ‑sAslこよるアプロ G.Molenberghs 編 松 山 裕 ・ 山 口 拓 洋 編 訳 . [9]SAS/STAT9. 3U s e r ' sGuide ・[ lOjSAS/STAT9 . 2U s e r ' sGuide ・ [ l 1]SAS/STAT9 . 1U s e r ' sGuide ・[ 12]SAS/STAT8 . 2U s e r ' sGuide • [13]SAS/STAT8 . 1U s e r ' sGuide 2 7 2

270.

. ユ ー ザ ー 蝕 … … r 河川市レ ご清聴ありがとうございました。 2 7 3 ~I

271.

1 鮎Sユーザー総会 I伊丹………~ PLMプロシジャによる 回帰分析と予測の分離 関根暁史 株式会社 ACRONET/生 物 統 計 部 大 阪 グ ル プ ThePLMprocedure S a l o s h iSekine ACRONETC o r p ./B i o s t a t i s l i c sDep . tDalaScienceDivision I A s ユ ー ザ ー 蝕 均 一 一 … … 201I 要旨: SAS9.3より PLMフロシジャが実装され、 回帰分析工程と予測工程が分離できるよう になったので使用方法を紹介する。 キーワード:アイテムストア, PLMプロシジャ 275

272.

l組 Sユ ー ザ ー 総 会 問 問 ノ ロ ト & … … m はじめに SAS9.2以前では回帰分析工程と予測工程が一体となっており、当初予定し ていなかった予測値を算出するためには再度回帰分析から行わねばならな かっ T 。 ニ SAS9.3以降ではパラメータ推定の情報をアイテムストアとして残しておけば、 何度でもその結果を PLMプロシジャで展開して予測値を算出できるように l m s e l e c t以外は SAS9.22から使用できたが、多くのユー なった(実際には g ザーが使用していると思われる SAS9.3からとさせて頂く)。 すなわちオブザベーシヨン数や変数が多いデータの使用で回帰分析に長時 間を要すると思われる際、一度アイテムストアに保存しておくことで時短が 図れる。本発表では PLMプロシジャの便利な使い方を紹介する。 以 !s ユ ー ザ ー 総 会 対 … …h一 地 m 1 Jg SAS9.2以前の回帰分析 SASによる回帰分析東京大学出版会 p.4 本のページ数と価 格との関係'データを用いて、 S A S 9 . 2以前の回帰分析と予測が どのようなものであったかを解説します。 27 6

273.

p m l I 11ユーザー蝕…;D~…… SAS9.2以前の回帰分析 例えばデータセット BOOKで 、 200ページでの予測値が欲しい時は、 PRICE を欠損として回帰分析を行えば、 PRICE= かつ PAGE=200のレコードは回 帰分析には使用されず、予測値のみが獲得できます。 テ、ータセット BOOK PAGE p r o cr e gdata=BOOK; PRICE modelPRICE=PAGE 167 2700 432 4300 1372 13000 o u t p u tout=PREDp=PREDICTED Iclm=LCLM uclm=UCLM t r u n ;qUl; 200 捻 … … 一 … ー 201I S~ユ. . SAS9.2以前の回帰分析 T ータセット PRED PAGE 167 432 1372 2 0 0 1 . LowerBound UpperBound 0 1 0 1 予 ;~IJ 値 PRICE PRICE 95%c . 1 .for 95%c . 1 .for Mean Mean 2700 3253.13 2052.87 4453.39 4300 47 4657.52 6243. 43 5450. 13000 13244.82 3526.76 11144.34 2389.01 1 5 3 4 5 . 3 1 95%信頼区間もオプション指定してあるのでデータセット PREDIこ追加されます。 277

274.

│ ωヰーザー総会~…… ~a SAS9.2以前の回帰分析 ここでPAGE=300での予測値が欲しい時は、データセットBOOKfこ PAGE=300となる行を追加するなどして、再度回帰分析の工程からプログ ラムを回さねばなりませんでした。 プ、ータセットBOOK PRICE PAGE 167 2700 432 4300 1372 13000 200 300 [総ユーザー蝕加初ル山一知 ~a SAS9.3以降の回帰分析 BOOKのような小さいデータセットならば、再度プログラムを回 したとしても時間的な影響はさほどないが、オフ、ザベーション数 や変数が多いデータなどでは回帰分析に長時間を要すること があると思います。 そこで SAS9.3以降ではパラメータ推定の結果をアイテムストア として残しておいて、何度でもその結果を PLMプロシジャで、展 開できるようになりました。 278

275.

2 013 201~ SAS . : : L ‑ ‑ I T .•ti7~';å"/~J9~&.~I)~_'AI:d!.rAl:S~ユーザー鰍:均台Vfpea.,t8îシ問ン SAS9.3以降の回帰分析 REGプロシジャにはアイテムストアを残す機能がないので GLMプロシジャで 代用します。 SASPLMという名前のフォルダ!こ REGという名前のアイテムストア(拡張子 sas7bitm)を残します。 libnameSASPLM ‑URL‑¥SASPLM"; procglmdata=BOOK; modelPRICE=PAGE s t o r eSASPLM.REG; r u n ;qUl; t ふ 名前 更新ヨ詩 理1 主 Ln 匂 日 s7bltm J、 1 210.1017.14 SAS73 ゐ 7~' フヲ と ~&.~IJ~_'AI:"~~ Sa :3ユーザ唱会ii IiI均 一l1li… ザイズ 96KB 2 013 ~~ SAS9.3以降の回帰分析 procplmsource=SASPLM.REG; s h o w a l l ; r e d = p r e d i c t e dI c l mu c l m ; scoredataニBOOKout=PREDp r u n ; アイテムストア REGをPLMプロシジャで展開し、予測させたいデータセット (例えば BOOK)を提供すれば、 6ページ目のデータセットと同等のものが出 来ます。 showallでアイテムストアの中身を全て見ることが出来ます。 ここで PAGE=300での予測値が欲しい時は、 PAGE=300となるデータを PLMに提供するだけで予測値は得られます。 既にパラメータ推定の情報はアイテムストア REGfこ蓄えられており、再度回 帰のプロシジャを回す必要がないので時短が可能となります。 279 1 0

276.
[beta]
mI

. .
ーザー総会加r7æル&~IJ:I.-".;!I:'- i!ゅ

SAS9.3以降の回帰分析
但し、 GLM
プロシジャには変数選択を行う機能がないので、変数選択を行う

LMSELECT
プロシジャに代替しなければならない
回帰分析を行う際は、 G
でしょう。

プロシジャの特性

REG
アイテムストアの保存
変数選択機能

GLM

X

。

。

GLMSELECT

X

。
。

1
1

I

綿ユーザー総会加……一…

~I

パラメータ推定値から予測値を算出
S
A
S
9
.
2以前のバージョンにおいて、パラメータ推定値の情報さえ小まめに
保存しておれば、予測値の算出はパラメータ推定値を用いてデータステップ
で行うことはできます。
パラメータ推定値の情報の保存には以下の 2つの方法が考えられます。

(
1
)永久 SASデータセットとして保存
(
2
)
o
d
sd
o
c
u
m
e
n
lnameの利用

1
2

2
8
0

277.

l SAS .:::L‑of/‑や仏 s i j ユ ー ザ ー 総 会 加 古 子 宮 ! ' l ! l … 一 . 中 :2013 パラメータ推定値から予測値を算出 ( 1 )永久 SASデータセットとして保存 odso u t p u tParameterEstimates=SASPLM.PARMS F i t S t a t i s t i c s = S A S P L M .FI T : procr e gdata=BOOK; modelPRICEニPAGE; r u n ;q U l t ; 1 1 5 J えば永久 SASデータセット PARMS、FITを作成しておき、 PARMSの回帰 係数の情報を基にデ タステップなどを用いて予測値を求め、 FITの Root MSE(se)の情報を用いれば 95%信頼区間は求めることは可能です。 1 3 十 ど何日 S~ユーザー総会加"MJr:J~&"J:L_'AI::' … 1 1 │ パラメータ推定値から予測値を算出 ( 2 )odsdocumentnameの利用 odsdocumentname=SASPLM. DOC; procr e gdata=BOOK; modelPRICE=PAGE r u n ;q u i t ; odsdocumentc l o s e ( 1)の永久 SASデータセットを作成する代わり!こ、 odsdocumentnameを用 いて回帰分析の OUTPUT画面の情報を丸ごと残したアイテムストア DOCを 保存することにより、 (1)よりも予測値算出に必要な情報の残し忘れを減ら すことができます。 14 281

278.

│ 鮎Sユーザー総会加 i 7 & 1 1 . p ; : ? ! リリーフゆ l I Pm パラメータ推定値から予測値を算出 ( 2 )odsdocumentnameの利用 odso u t p u tParameterEstimates=PARMSF i t S t a t i s t i c s = F I T ; p r o cdocumentname=SASPLM.DOC; r e p l a y ; r u n ;q u i t ; 次に document プロシジャを用いて、先ほどのイテムストア DOCの情報を 1 ) プレイし、予測値算出に必要な情報をデータセット!こ落とすなどしてから予 測値をデータステップなど、で計算できます。 1 5 │ ω ユーザー蝕… パラメータ推定値から予測値を算出 それで、もパラメータ推定値を用いてテ ータステップで計算させる方法では、 φ 変数の数が多い時、変数選択を行う時、ロジスティック回帰式に当てはめて 予測値を算出する時などにおいて、 PLMプロシジャを用いるよりも大変な手 聞がかかってしまうでしょう。 16 282

279.

I~ユーザー総会………… 日m1JI PLMプロシジャ使用例 ( 1) ある GOT(血液成分)データ(人工データ)を用いて、男女別の変数選択を 伴った重回帰分析を行ってみます。 デ タには性別、年齢、 G O丁、体重の情報があります。 f 血液成分人工テ. タGOT1' / d a t aGOT1 i n p u tSEX$AGEGOTWEIGHT@@; cards M 302050M 534370 M 704370F603540 F723550F251860 F382 155M 222255 F432750M 3 12460 M 453265M 594375 F333040F643738 F4 12545F603250 F5 13960M 252160 M 373070M 503270 F653145F402555 F382465M 483260 F573845 r u n ; [鮎 17 mI aー ザ ー 蝕 … … 一 … PLMプロシジャ使用例 ( 1 ) f 性別の重回帰分析 V p r o cs o r tdata=GOT1;bySEX;r u n ; p r o cg l m s e l e c tdata=GOT1; modelGOT=AGEWEIGHT/selection=stepwises l e = 0 . 2s l s = 0 . 2s e l e c ! = s l ; ,selec!=slと記述すれば従来の regプロシジャと同じ変数選択法となる, bySEX; s ! o r eSASPLM.SELECT; r u n ;qui ! ; BY変数により性別の回帰分析を行ったところ、 41'AGE+0.37WEIGHTとなり、 男性の回帰式は GOT^=‑9.97+0. 合 女性の回帰式 i まGOT^= 11.66+0.37AGEとなったとします。 会 この時アイテムストア SELECTには、両方の回帰式の推定パラメ 蓄えられています。 タ情報が 18 283

280.

I ωユーザー総会加ート山一知 ~I PLMプロシジャ使用例 ( 1) f 予測のためのデ タセット PRE* / d a l aPRE; i n p u lAGEWEIGHT; c a r d s ; 3050 r u n procplmsource=SASPLM.SELECT scoredala=PREoul=PREDp r e d = p r e d i c l e d ; r u n ここで予 ; & 1 1させたいデータセット PREIこ は、 BY変数で、指定していた SEXは必 ずしも入力されて必要はなく、 AGE.WEIGHTさえ入力されていれば、男性な らばどのような結果になるか、女性ならばどのような結果になるか PLMプロシ ジャは男女別に当てはめてくれます。 1 9 11sュ千絵…ト制,,--~~ i!?~ 2013 PLMプロシジャ使用例 ( 1) このようにカテゴリー区分ごとの回帰分析を行う場合、 PLMプロシジャは便利 です。もちろん女性であればAGEだけ用意しておけば当てはめてくます。 τ 、 戸 タセット PRED SEX WEIGHT AGE Predicted Va[ue F 3 0 5 0 2 2 . 7 4 0 5 M 30 50 2 0 . 6 9 9 9 20 284

281.

1 1 1 川 悦 川 市 ワ S~ユーザー総会期的~EC'!i'P.E均二 主 川 D I PLMプロシジャ使用例 ( 2 ) 先ほどの GOT1データを用いて、 GOTを目的変数、 log(AGE)を説明変数とし た(女性のみの)回帰分析を行ってみます。 44 log(AGE)となるのですが、×軸が対数変 回帰式は GOT^=‑37.37+17. 台 換された年齢のまま線形関係をグラフ化しようと思っても、直感的に×軸の意 味が判り!こくいク、、ラフとなりましょう。 そこで×軸は AGEとしたままで GOT^を折れ線で、つないだグラフを作成して見 ます。 2 1 I綿ユーザー給対問問吟&山一… 201I PLMプロシジャ使用例 ( 2 ) 実浪I]AGEデータが存在する GOT^のみを折れ線で結んだグラフでは、 Xデー タが存在していない部分には線が引かれず、また Xの値が連続的でない部分 は直線的な表現となります。 G O T 5 0 4 0 3 0‑ 2 0 1 0 2 0 6 0 4 0 8 0 年齢(箆) " 285

282.

s . ユーザー総会加問 口 一 一 … J mI PLMプロシジャ使用例 ( 2 ) このような時、連続的な×を用意して、 PLMプロシジャによって細かい予測値 を算出させて、その予測値を折れ線で結んでみてはいかがでしょう ( 0 . 5歳刻みに予測値を滑らかに結んでいる例です)。 G O T 5 0 4 0 3 0 2 0 1 0' ; 2 0 6 0 4 0 8 0 年齢(歳) 23 I 鮎s ユ ー ザ ー 蝕 加W H J . l tVJIS 均的吟 ~I PLMプロシジャ使用例 ( 3 ) ( 1 )回帰分析の工程と予測の工程 SASによる実験データの解析東京大学出版会 p. 4602データを用いた GLM プロシジャのステートメントにおいて、回帰分析の工程と後工程とをさ、っくりと 分割してみました。 :p r o cg l md a t aニ 0 2 ; c l a s sAB : i . .. r : r : 19 . J c . e . l Y . 三J 氏 s . . . A :段、. I s m e a n sAB/ p d i f f ; i破線で囲んだ m o d e lステートメントの部分までが :回帰分析の工程であり、実線で囲んだ I s m e a n sと i 対比の部分が予測の工程でです。 目前工程はGLMで行い、 c o n t r a s t" ( A 1 + A 2 + A 3 ) : ( A 4 ) "A‑ 1‑ 1・13 ; 後工程はPLMIこ委ねることができます。 r u n ;q U l t ; 24 286

283.

I必ユーザー蝕加~……シー 201I PLMプロシジャ使用例 ( 3 ) ( 1)回帰分析の工程と予測の工程 先ずは GLMだけを実行します。アイテムストアは work内に置くことも可能です (もちろん SASを終了してしまえば情報は消えてしまいます)。 p r o cglmd a t a = D 2 ; GLMにおいて特!こ I s o l u t i o nオプションは加え c l a s sAB ; なくても、 PLMIこて同様の情報を取り出すこ ; modelY=ABA B 合 とはできます。 s t o r ework.GLM; r u n ;q U l t ; ※ 02 デ ‑5(後着剤の強度試験デ 5 ) A : I 圭着膏i)の種類 ( 4種類)と B前 処 理 ( 3種類)の 2 元配置デ ‑5 1 1 ユ ー ザ ー 総 会 7 1 J T a! T ' J . l r : J … 叩 … 7 2 5 ~I PLMプロシジャ使用例 ( 3 ) (2)LSMEANS LSMEANSは後工程です。 多重比較の方法の選択も PLMの中で何度も実験的に行うことができます。 procplmsource二 work.GLM; , IsmeansA B/ d i行 IsmeansA B/ d i行 adjust=bon; IsmeansA B/ d i行 a d j u s t = t u k e y ; r u n ; 26 287

284.

mI I n ユーザー総会加問一一… PLMプロシジャ使用例 ( 3 ) ( 3 )ESTIMATE 対比は平方和を分解するだけなので後工程です。 GLMにおける対比平方和 に対応する P値を算出したければ、 PLMにおいて estimateステートメントを用 いれば獲得できます(但し PLMIこは contrastステートメントはこεさeいません)。 対比係数は後工程で自在に変えられます。 崎川 ラ a m l2 )) ζ 合合 41 32 一 一 一 一 ﹁﹁ // OO A Mh eS lS l RJ L lV lV Gdd 1 2 ‑325 P r)o ! l j 00 面9 内 一 いV 一 欣3o o ‑‑ =4141 ρu‑ A‑ し 閃 1 2 AA mm hbρvρu 山 m ポポ 凶 : 11 α55 rlρuρ P t憧 自白血 値定 ラベル Row1 r u n ; I l 定 纏定・ ・担割霊 36722 11292 組定・ ・...量 ‑ 05333 t1 9 7 7 自由度 1 2 2・ P r " ' ! t ! ‑ 045 0 刷 。 27 ISASユーザー蝕加問~リー… mg プロシジャ使用上の注意点 (1)ANOVA統計量等の保存 回帰分析のプロシジャより storeステートメントにて出力されるアイテムストア の情報は、あくまでも予測に関する情報のみであり、 ANOVA統計量(分散分 析表)や(決定係数などの)モデルの当てはまりに関する統計量は一切残され ていないので、帳票などで必要な時 i ま 、 月1途情報の保存が必要です。 ANOVA 統計量等の保存法としては、永久データセットではなく、先ほど紹介 した odsdocument nameによる方法はいかがでしょうか。 f アイテムストアの削除の仕方を念のため紹介します V p r o cd a t a s e t slibrary=SASPLMm e m t y p e = i t e m s t o r ; d e l e t eDOC: q u i t ; 28 2 8 8

285.

|ωユーザー蝕均一ロ…iIIiiシ~ 201I プロシジャ使用上の注意点 (2)PLMプロシジャとしての情報量 例え f ; J :GLMプロシジャにおいて、 contrastステートメントを書けば対比の平方 和が出力されますが、 PLMプロシジャの estlmateステートメントでは P値しか 取得できません(対比平方和が獲得できません)。 もしどうしても対比平方和の情報が必要な際は、回帰分析のプロシジャを再 度回し直さねばならないでしょう。 29 I A S . : : L ‑ . . , ‑ a 会 均 一 … … ユ ー ザ ー mI アイテムストアが保存できるプロシジャ アイテムストアが保存できる(すなわち PLMプロシジャが活用できる)回帰分 析のプロシジャを下記に列挙します。 .GENMOD fMMIX .GL .GLM .GLMSELECT .LOGISTIC .MIXED .ORTHOREG .PHREG . SURVEYLOGISTIC .SURVEYPHREG .SURVEYREG 30 2 8 9

286.

Iゃ→i総←一一一…~~ 2013 おわりに PLMプロシジャの活用によって時短を図ることができます。 回帰分析の工程と予測の工程との分割によって、回帰分析のプロシジャにお けるステートメントが何を担っていたのか、改めて再認識することにより、回帰 分析の学習にもなります。 参考文献 ‑竹内啓監修 ( 1 9 9 6 ) .SASによる回帰分析,東京大学出版会 1 9 9 1 ) .SASによる実験データの解析,東京大学出版会 ・竹内啓監修 ( 31 290

287.

: I 鮎釦ーザ一昨持品開J 冒ム…三 I 国立循環器病研究センターにおける T基盤整備と SASの活用 臨床研究 I 山本景一 独立行政法人国立循環器病研究センター 情報統括部臨床疫学データベース室 研究開発基盤センター予防医学・疫学情報部レジストリ情報室 Developingani n ‑ h o s p i t a lc l i n i c a lresearchI T i n f r a s t r u c t u r eandSASi nt h eN a t i o n a l C e r e b r a landC a r d i o v a s c u l a rCentero fJapan K e i i c h iYamamoto N a t i o n a lC e r e b r a landCardiovascularCenter .位十総会加r7m… 要旨: 臨床研究の効率化のために、電子カルテを含む様々な診療情報を 活用することは必須である。しかし医療機関における臨床研究 I T基盤 整備は十分ではない。当センタ のSAS利用を含む臨床研究 I T基盤 整備の取組を紹介する。 キーワードー 臨床研究、電子カルテ、 I T基盤整備、仮想化技術 291

288.

.. ユ ー ザ ー 総 会 加 抑 … ム ー ン 仇 ン mI z 当己 E呈 同ー尽 .臨床研究の効率化のために、電子力ルテを含む様々な 診療情報を活用することは必須である。 ・しかし、医療機関における臨床研究支援のための I T基 盤整備は、未だ十分ではない。 ・研究所と病院を併有する当センターでは、研究に患者 の診療情報を取り扱うことが多いため、より高度なセ キュリティを実現する必要がある。 ・診療業務や臨床研究に必要な機密情報の管理につい ては、端末やサーバ、あるいは利用者の運用だけに委 ねることなく、より根本的な「ネットワークレベル」で、のセ キュリティを実現する仕組みが必要と考えられる。 │ 以Sユーザー総会~……… m t Jg 目的 ・本発表の目的は、当センターの臨床研究 I T基 盤整備の取組を紹介するとともに、医療機関 に存在する様々な診療情報を臨床研究で安 T基盤整備 全かつ効率的に利用するための I のあり方について議論を行うことである。 292

289.
[beta]
S
ユザー総会……?……

SAS.:l.....;;."!7~.* 71Jfl71"JR~&~jJ,""_'.-a
:鮎

~D

方法
・院内ネットワークを情報の機密度に応じた4つの階層に分割し、
それぞれのネットワークで適切な情報管理を実現するための仕
組みを導入する。
・ネットワーク階層を超えて情報の利用を行う必要の生じた場合
には、シンクライアント基盤技術を活用し、機密情報を本来の
ネットワーク階層内に留めたまま、 PCの画面情報だけを外部階
層ネットワークに提供することで情報漏洩のリスクを最小限に
留めるシステム設計とする。
‑シンクライアント基盤技術により、複数システムの端末機能を 1
台の端末に集約する。これにより、端末管理にかかるトータル
コストの削減を実現し、センター移転時のシステム移行を円滑
に行うための4盤システムとして利用可能となるよう設計を行う
.上述の情報基盤上に、臨床研究の効率的な遂行を支援するた
めの各種アプリケーションの導入を行う。

l鮎 む ー ザ ー 総 会 時 開 …

4階層院内ネットワーク
.第 1層:緩衝ネットワーク
‑E
l
e
c
t
r
o
n
i
cD
a
t
aC
a
p
t
u
r
e
(
E
D
C
)システムを配備し、
外部接続を行う階層

.第 2層:インタ‑ネット利用可能ネットワーク
‑従来の事務 学術研究用ネットワークの階層
E

・第3層:高機密ネットワーク
‑臨床研究デー夕、文書等を扱う階層

.第 4層:最高機密ネットワーク
一病院情報システムの階層

293

0

290.
[beta]
ぬ.二ザー総会アふーん…一一一~:-

201D

臨床研究支援アフリケーション
• 2
種類の E
l
e
c
t
r
o
n
i
cD
a
t
aC
a
p
t
u
r
e
(
E
DC
)S
y
s
t
e
m
‑多施設調査・アンケート用
・日本循環器学会施設実態調査 (JROAD)

‑多施設治験・臨床試験用 (REDCap)
・末梢動脈疾患の血管内治療に関する多施設前向き観察研究
(
J
‑
P
a
s
s
i
o
n
)

・規制適合のためのコンビュータシステムバリデーションの実施

• S
A
Sによるデータ活用環境
・メール臨床試験被験者動的割付システム
・電子力ルテ二次利用臨床情報データウエアハウス
.バイオバンク支援システム

I ー
総
会
一
一
…
…

~I

ω

多施設調査・アンケート用 EDCシステム
.日本循環器学会循環器疾患施設実態調査 (JROAD)
...厚相蝉画期酌

ω

コ目.叫叫イ叫叫 咽町悶 酔 町 副

3
げ山フ,.何
愉叫晶a
且他

圃 目 町 回 , ‑ 咽 酎 晶 怯ζ

40
1
:

"
"
'
.
.
.
.
J
)
l
'
t今
l

.."<鍵@鋼電"さβ ・6 ・・4・・後急、:,.;~,

_k~O,;S._

働

‘ ι~-

̲
.
.
.
総

、

UZT'E:守ず .
.
r
,
1.
.
担 陣 。嗣胴陥

4
謙
訟

叫 椅

血 品

a晶 噌 帯 .

…
. ・
嚇

P

創

4

1

一
一
一
}

(~,慰霊費是認憩群

.
.
.
1
t
1
U
.
¥E2
伝書讃絹字企

‑
・
・
・
・
・
‑
,

.
.
.
.
1
1
1
.

1

・‑唱
.
、
r

...恥'l!'l l)~

.
,
・
・
魁
'
四
回a・
..宣匂リU
ηuζ'!)
,
;
,
.

ニニニ竺.~ー艦波紋縫詰
t~ll・!1~f. ll

‘

.<::I!''':r.),Il~'‘官四_..巴・温咽一~

~',

a

d

h
t
t
p
:
/
/
j
r
o
a
d
i
n
f
o
.
n
c
vc
.go.jpjε

2
9
4

291.

主情:‑1遣社団法人日本循環器学会学術委員会 担 当 世 話 人 : 小 室 一 成 欄 間 掴 阻j 4J 小1 1 1久雄(窓智窓 PROGRAM 啄..冨 同I ー ヂ 尚 一 一 … 一 一 一 ふ ー んγ2 仇g REDCap • REDCap:ResearchflectronicD a t aCapture ‑米国 Vanderbilt大学が開発・運営する EDCシステム • REDCapコンソーシアム 一世界 56力園、 671の施設/団体で構成され、 70, 000以 上のプロジェクトが稼働中 ( 2 0 1 3 . 6 . 1 4現在) ‑REDCapConsortium b t t p: Jj p r o i e c t ‑ r e d c a p . o昭/ ・コンソーシアムメンバーにソースコードを無償で 提供 0 295

292.

│ぬユーザー蝕加?ム……ンセッ均一 2 引g 対象研究 ‑研究題目 ‑lapanE e r i p h e r a l且r t e r yd i s e a s e :endova~cular reva~cularizatlON m u l t i c e n t e ro b s e r v a t i o n a lstudy ( J ‑ P a s s i o n ) 末梢動脈疾患の血管内治療に関する多施設観察研究 .目的 ‑下肢末梢動脈疾患に対する全国多施設・前向き登録を 行い、本邦における問歌性披行と重症虚血肢の治療 実態と予後を明らかにする。 ・代表研究者 一国立循環器病研究センタ一心臓血管内科河原田修身 4 S~ユーザー総会対的……ツゆ ~.lllJ g コンビュータシステムバリデーション .バリデ‑ションモテ、ルに準拠して仕様書を作成し、 REDCapシステムの設定およびテストを実施した。 検証 検証 インフラ仕様書 検証 296

293.
[beta]
1

純一ザー総会対的問ト山一…

m
t
I
g

S
A
S
:利用者に合わせた 3種類の環境
"
'
‑‑‑.
ー
ー
・
・・
・ .
・
一
4

.
・

ー .‑

‑

;
‑ "
.
:
.
. 一一

時、.“・~--_.

SASE
n
t
e
r
p
r
i
s
eGuide

{専用アプリケーシヨン}

SASAdd‑inf
o
rMS‑Office
Word,
PPT)
(
E
x
c
e
l,

SAS言語をはじめ、
SASの
フル機HEを利用

使い慣れた MS‑Office製
品力、らSAS
機H
Eを利用

l 鈴 Sユ ー ザ ー 蝕 ホ 初 m v =
.W
ECO')l…

Web
ブラウザを利用した
レボ卜作成

m
m

メールによる臨床試験被験者動的割り付けシステム
‑当センターでは、臨床試験・治験の被験者に対して
無作為に治療群を害]
1り付けるシステムを従来から
FileMakerや SASで実現し運用してきた。
・従来の運用では、他施設からの割付登録票の受付、
割付操作、割付結果の連絡、等の業務に人手が必
要で、 24時間対応がで、きない問題があった。
‑なるべく人手を介さず割付業務を実施できるように、
電子メールで害]
1付登録票を受付し、自動的に S
ASで
割付を実行し、その後自動で割付結果票を返信す
る被験者動的割付システムを開発した。

297

294.

川 ! ? t i i i I i i i i i 一 総 会 1 1 1 吟 i I ー シ ヨ ン ? ケ 三 山 引 1 1ア カ デ 2 0 . 1 3 r i l J l C 1 電子力ルテ二次利用臨床情報データウエアハウス .電子力ルテを効率的に臨床研究で二次利用する ために、臨床情報データウエアハウスを構築する 0 .対象: ‑患者基本、予約、入退院、食事、処方、注射、処置、検 体検査、画像生理検査、病理検査、手術、輸血、リ 1¥ビ リ、栄養指導、透析、指示、クリニ力ルパス、看護、医事 統計、 DPC、カルテ記録、テンプレート ・症例数:約 24万症例(約 2, 400万件) ・院内の様々な情報と組み合わせてデータ検索・分 析を行うために、 S A S技術を利用する。 1 1 s ユ ヲ ー 鈴 加 問 口一一セ均ン J 日 m m 臨床情報データウエアハウスコンセプト(処方薬剤情報) 電子カルテ 臨床情報データウエアハウス 圃患者情紐 《処方iE網情報》 患者番号 性別 生写月 B 写齢 草剤コード 韮剤名称 用珪 用量 単位 実盟国 人外巨分 量規制4 オーダ寄号 2 9 8

295.

ω l←ザー総会均一千 2013 結果と考察 ・本臨床研究 I T基盤を利用し、既にいくつかの 臨床研究を実施中である。 T基盤整備の取組は、 ‑われわれの臨床研究 I 安全かつ効率的な臨床研究の実施に貢献す ることが期待される。 ユ ー ザ ー 総 会 内 需 ‑ … 一 一 l鮎S mm J 共同発表者圃謝辞 ・独立行政法人国立循環器病研究センター ‑研究開発基盤センター先進医療・治験推進部山本晴子 ‑研究開発基盤センター予防医学・疫学情報部宮本恵宏 病理部・バイオパンク長植田初江 ‑情報統括部・病院医療情報部桑田成規 一心臓血管内科安田聡 ‑副院長小川久雄 299

296.

1 1 鮎‑ザプ総会…一一 三 川 山 ぺ 一 2013 SASを使った情報管理事例 そしてリスクをやっつけろ 惟高裕一,藤原正和,北西由武,吉田祐樹 塩野義製薬株式会社 I n f o r m a t i o nM a n a g e m e n tbyu s i n gSAS ‑M I N I M I Z ETHER I S K‑ Y u i c h iKoretaka,MasakazuF u j i w a r a,Y o s h i t a k eK i t a n i s h i,Y u k iYoshida . tSHIONOGI& CO.,LTD B i o s t a t i s t i c sDep │三内十円存会………ふんー fmjl 日 要旨: 機密情報管理のためにフォルダのアクセス権設定を行うとき, SAS に精通していない方でもアクセス権設定が行えるようなSASプログ ラムを開発しましたその方法をご紹介します *本報告は SAS9 . 2,M i c r o s o f tO f f i c e2010,Windowss e r v e r 2008R2standardでの設定を前提としています キーワード情報管理,コマンド、プロンプト, x コマンド, PIPEエンジン, ク、、口ーバル化 301

297.

[ミムミユーザー総会 内容 ・アクセス権管理の必要性 i鮎純一ザー蝕pm7mロト…ンセ均ン I P I i l J 医薬品業界の現状 。 開発のグローバル化 t c ー多極同時開発,国際共同治験 e 富 d 開発に関わる人の増加,多様化 ー海外子会社,提携会社, CROe t c 易 臨床データや解析結果など機密性の高 I . . . . . . い情報管理の重要性が増している l 司置' ーコンブライアンス違反のリスク ,~q,C1_, 情報漏えいのリスク I 1 ‑. 302

298.

I P M l l 鮎 Sユ ー ザ ー 総 会 問 問 u ! l … 一 泊 ン シオノギの解析環境(これまで) 画監言 ~雪喫曹F 各極で独立したサーバーを持っていた 作業も独立で、行っていたため,情報管理は比較的容易であった 1 1 1 ーザー総会内町一ソリユー泊ン シオノギの解析環境にれから) 本社と子会社でドメイン聞の信頼関係を結び,ユーザーアカ ウントの一元管理が可能となった 一方で,役割も多様となり情報管理も複雑になっている 303 ~I

299.
[beta]
2
│
~g

SAS.:1......~-.e 7:1lT,,71:;-~)Il~&"J,,":- -t!~~:"
SASユーザー総会対デミ/予何日ソ~ンセ泊ン

乍

シオノギの解析環境にれから)

望
参

円内での情報管理
‑ STAT,D M,Programm巴「によって作成・閲覧すべき情報が異なる

• P
J外での情報管理
円外の人には,機密情報にアクセスさせるべきでない
機密性の高くない情報は円外の人にも参照可能としたい
.統計解析計画書 (SAP),各種仕様書 (spec類}など
‑ノウハウの蓄積
• P
J外の人も参照可能となるよう!こViewerという役割を追加した

同一一千飴…

Jロ 日 ツ リ ー …

シオノギの解析環境にれから)
STAT

DM

当該刊の統計家
ー解析計画書作成
当該刊の D M
‑SDTMspec作成, SDTM作成

Programmer

当該刊のプログラマー
‑ADaMspec作成, ADaM作成,解析資料作成

Viewer

当該円以外の人
ー他の刊の機密でない情報は閲覧可能

業務プロセスごとに編集可能,閲覧のみ,閲覧不可,

といった具合に権利を付与する

304

~I

300.

~I ユーザー総会……ーわゆ 以 S シオノギでの主なプログラミング業務プロセス DM D M, Programmer 叩 … 1 f叩… STAT. P " ' " ヨ = 詮 議 主 主 甲j RawData SDTMS r H ! I : D M以外編集 権は必要な い 司3 SDTMData i 五 ADaMData ,A O"MSp包C SAP Programmer, Prograπ1打 l e r, Programmer D Mは編集権 STATは編集 が必要 権が必要 D Mは閲覧で 良い は編集権が 必要 STATは閲覧 で良い STATは閲覧 で良い 令 : P ファイルの誤編集などのヒューマンエラーを防ぐ必要がある Viewerは Data類は閲覧で、きないが. spec類は閲覧で、きる |ωsユーザー総 ~.þl;::::Z]ソ…均ン I P I I ] eCTDへの対応 l F 両 tbb で が るi ぷdule5の 構 言 ; シ オJ ギ的手っf i 示 ぷ 言 語 孟 一 一 一 一1 ‑ 万二~mS ‑ = C W由 回 出 ご Q 9MS07 .出 2 ‑U'" 百 γ田 ご込J同 区V 。由回目 。区宮市町 • FDAが提示した構造に加え, TLFや SAP,TLFshellsを格納す . . . るフォルダを追加した社内独 自のフォルダ構造を構築した 今フォルダを template化 ( 全 115folders) ‑上記で構築したフォルダ別, 役割別にアクセス権を細かく 定義していった 出典 [ l J 二::l由也且" 心"''''T四 305

301.
[beta]
W
J
I

ユチ倣一………

品 S

シオノギが作ったフォルダ構造(例)
~:.-O~ ぞ-,ユー

1

P'合~:.l Ct
;::r:::: t. c~c _;,_
d~;:;~

s
t
a
t
!
C
.1
ご
;
:
, !!Ç~:::
~ð:=

C~~,

~P'!:::

t
.l
: ~:çc:,::

c
:
:
:
;三
‑
.
;
,
;τ.
:
.
c
.r
;
.
I:
:
<
!
.
l.
,
,
,
,
,
.
:
.
:
:

三^'呈~~':;!l

p主
c
‑cr乙 屯s
~t C'.;:'抗日日
~<:!t;:;,:::c:::a::‑..!:

R

ReadOnly

N

CannotAccess

川下

Sr.:.~ユーザー総会対的問か&.')1):.. ーーツ泊ン

人

201~

アクセス権管理の具体的方法
円と役割に応じてユーザーグループを作成する (
e
x
.円名 ̲STAT)
役割に応じて,フォルダごとにユーザーグループのアクセス権
を設定する
̲ E
x
.
)ADaMspec. TLFspec格納フォルダは Viewerが閲覧可能で、ある
‑ E
x
.
)TLF出力フォルダは View巴r
は閲覧すべきでない

アクセス権管理が複雑になってしまうことは不可避であった
円メンバーの追加,異動による変更には機敏に対応する必要がある

ー
[
手
動
で
、
のF
Z
里には限界ず与るたゑ国勢集L
7
4
?
"
し
E

306

302.
[beta]
Y
:
̲
.
〉三
ユ
ー川
ザー
総
会均宍mm

九ツS戸 A 山 知

7
"
}
)
"
F
a
YI
'
T
I
J
/
:
r
F'

SAS

以
I
m~

山川

アクセス権管理の自動化
‑ アクセス権設定を容易に行いたい
‑複雑な設定に対応した 005コマンドで行う
サ‑1¥‑管理者,ユーザーの使いやすさも重視したい
各円主担当者がアクセス権設定の申請を行う手 j
慣が複雑になると不便で
あるため, Excel!こ数個の情報を入力してもらうだけにした
サ‑/¥ー管理者が S
A
Sや 005コマンドに精通していないことを想定した

アクセス権設定の変遷も辿れるようにしたい
‑有事の際に参照する必要があるため,ログを出力し管理を行う

、
.
!
.
.
,

i それら
即ー!?、ら情報?れ:"t-=~7?-t!ス権を設定し;
G管!!Ilログを出:t.J1f"9る必要があった
;
r

¥
l
l
‑

匂込マザ

騨綴露顕諸島

時轍議匂揮懸念。語録時齢、

;

‑
‑
司
司
司
.
.
.
.
.
.
.
.
.
.
.
.
.
.
‑

f
F

!?ータハンドM

が容易で他の刀?との連携吋な

I
S
A
Sで管理することとした

' 銭 《 命

噛議蝿議織委

ゆ

{

尊
重

似趣鱒視聴

.ゃーザー倣対如何ー&ソヨユ→ヨン…

弘

2

そら

~I

内容

• SASプログラムによる管理方法
‑SASプログラムの役割
‑SASプログラムのポイント

l:~

3
0
7

303.

制ユーザー総会………ツ泊ン ~g S A Sフ。ログラムによる管理体制 3 融明日 ゾ 喜 一 申請書 1 . 門主担当者が.P J名,プロトコル名,ユーザー名と役割を申請書 ( E x c e l )に入力して サ‑J' i‑管理者に依頼 2 . サーバー運用責任者が不自然な申請がないか確認,サーバー管理者に実行を指示 3 . サーバー管理者が E x c e lから S A S プログラムを実行.E x c e lの情報が抽出される 4 .S A Sプロク検ラムがコマンドプロンプトを実行 5 . コマンドプロンプトの実行司'をテキストに出力する 6 . 司マ宅ノドプロンプト実行後の ク‑frス権の状況を出力する蹄 7 .S A S プログラム自体の実行ログを出力する φ 胡 │ ω ユーザー総会同町一ソリユ均的泊ン P A I 1 1 g E x c e lの申請フォーム サ‑/¥一運用責任者が入力内容を確認して, サ‑/¥‑管理者が実行ボタンを押すとプログラムが走る 308 1 ム

304.
[beta]
│
ωユーザー総会時現………一

三

m
m

SASプログラムの役割 (
1
/
2
)
templateフォルダのコピーとユーザーグループのフォルダへの

アクセス権付与
J
ヨ延辺町、0
1,由

白にコ legacy

[
‑
*
1
‑
‑
て品

匂r
o
j
e
c
t
.

Oda
回日也
心 w時 間
匂包出恒

e

記
.
:
:
J"'O~回
国立コ臨血回想

t
二主句a
町
ぬ 酢 日S
.
(
)
町

活必 m町 宮
8 巳』剖制
中由国副

主
主
"
'
'
'
'
'
間

酬帳初・・

J 恒也事

&project.‑&protocol

企

ヰコ ~ofile~

ヨヰコ t
血血bOn$

Usd加

(
全 115f
o
l
d
e
r
s
)

フォルダごとユーザーグループごとにアクセス権を割り当てる
x"
i
c
a
c
l
s一
.J&project
.‑
&
p
r
o
t
o
c
o
l
.
/
a
n
a
l
y
s
i
s J
g
r
a
n
t
:
r&
p
r
o
j
e
c
t
.
̲
P
R
O
G
:
(
C
I
)
(
R
γ
;
x"j町長…/旬開j側委 p
r
'
1
.
智 coUtab内tionsJgrant:r&proje訟
でEM:(CI)(R)"~

L

…

l SASプログラムの役割 (2/2)
ユーザーグ、ル…フへのユーザーの割り当て
申請フォームの情報をマクロ変数&データセット化する
矛盾する申藷{グループに割り当てられていないのに削除 etclがあればエラー存出力
U詮 J‑ gr‑oup

USB(Na
me

598765STAT

金笠生主笠‑
598765V!EWER
598765~ROG

ID1113

D
e
l
e
t
e

ノd
e
l

lD1114

Dde!e

ノd
e
l

乍

る

数

を

lu

変
た

納行

ド b︑
ド
'

格実
をで

ンン

∞占︐

マ
マ
臨
コ
コ
Edx

1
8

309

305.
[beta]
:ザー総会拍手?の一一ンi!7~:-

2013

SASプログラムのポイント {
1
/
3
}
E
x
c
e
lからの SASプログラム実行

i
v ,SASI¥ッチ実行!
臥

r
e
t
v
a
l=S
h
e
l
l
(
"
[
S
A
S
.
e
x
eファイルのパス)‑
c
o
n
f
i
g
D: ¥ Progra~l¥ SAS¥ SAS9.2 ¥ SASFoundation ¥ 9.2(32-

bit)~nls¥ ld ¥SASV9.CFG s
y
s
i
n[
S
A
Sプログラムファイルのパス]
ー!
o
g[保存するログのパス]")

│指定した SASプログラムを実行してそのログを指定したファイル名で残すことが可能│

ッ
ー
…

;
1
1
1
ザー総会問

WO1
.
t
s
.
!

SASプログラムのポイント {
2
/
3
}5ASからのコマンドプロンプト実行
lxコマンド, i
c
a
c
l
s,robocopyなど l

フォルダへの指定したグループに編集権限を与える
x"
i
c
a
c
l
s[フォルダ名) /
g
r
a
n
t
:
r[グループ名 )
:
(
O
I
)
(
C
I
)
(
M
)/
T/C";

フォルダ自体のアクセス権継承機能を無効にする
X 勺c
a
c
l
s[フォルダ名)/
i
n
h
e
r
i
t
a
n
c
e
:
d
";

フォルダ templateのコピーは下記のコマンドで行う
x汁 obocopy[
f
o
l
d
e
rp
a
t
h
l
)[
f
o
l
d
e
rp
a
t
h
2
)/
E/COPYALL/MIR'
勺
t
e
m
p
l
a
t
eフ
ォル夕、

作成する P
J名.p
r
o
t
o
c
o
l名のフォルダ

310

I

306.
[beta]
I
E
J
J
g

II

ユーザー総会一一ン

SASプログラムのポイント (
3
/
3
)
.ユーザーグループの情報などを取得

i
P
I
P
Eエンジン,附 1
0叫 roupなど│
現状のユーザーグループを
確認する場合
filenamedatalP
I
P
E"netlocalgroup" ;

」 判1

→
Hおおい
ー
̲
̲
̲
̲
.
.
圃
.
.
2
2
1
t
T

data temp
i
n
f
i
l
edatald
l
m
=
'
0
9
'
x;
l
e
n
g
t
hTEMP $100 ;
i
n
p
u
tTEMP$ ;

R

'
" 1
5
1
2
3
4
5
65TAT
一言l5234 PROG

え

.

-4-i:::~吹山

2
2 1
5
2
3
4
5
6
7VIEWER

プ 315234日 75丁目

"す

二互コ 53333 5TAT
刀
,

2
s 1
5
4
5
6
7
8
9DM

I n , nr~' "‑',, ,

‑4
←
→155445566778899SVIEWER

2
'
J
却

¥

l
(
IP‑
Eエンジン
1 P
'
"
‑‑‑ ̲‑

~l~L9①一「語

王山

G

結果を受け渡し│

い い? γ

、
3

…ー:三lIfI!l]g

fみ〉三

3
r
i
i
ユーザー総会内庁I
ゲm
am

引 ‑ 叩

γ

日

ログの出力

日間総間四日

⁝⁝一一一一昨

開発品フォルダ全てのアクセス権を PIPEエンジン, xコ
マンド、
などの機能を利用して S
A
Sで読み込み, E
x
c
e
lへ出力する
(
E
x
c
e
lで、あれば容易に管理可能と考えた)

'"IA
出 I
Del
e
t
e

Masa同 2U F
u
i
i
w
a聞
YoshitakeK比a
n
i
s
h
i
YukiYoshida

D
e
l
e
t
e
A出

盟豆呈出血工辺盟国
y"肌 h
iKnn
:
ot抽 2

アクセス権の変選を辿ることが可能│

工
、

311

.

307.

│ ω ユーザー総会問問。…リユーシヨンセツ泊ン ~lJ I 内容 ‑まとめ S I ユ ー ザ ー 総 会 問 売 ん …均 ン … h まとめ コンブライアンス,情報漏えいというリスク回避のためにも,誰が,いつ,ど の情報にアクセスできる状態にあるかを管理することは重要である 上記への対応としてアクセス権を設定とログの管理をすることとし,そのア ブローチとしてS A Sプログラムを利用する方法を考えた x コマンド P I P Eエンンン 複数、ノフトウヱアの連携が必要な場合でも S A Sを用いることで管理体制を容 易に整えることができた S A Sは,統計的な計算機能だけではなく幅広い応用が可能と言える ー 出 典[ 3 J 3 1 2 I

308.

ι ‑ 五 戸 / 人 辺 三 気 設 竺: γ 人 小 ‑ 1 1 ぷ 三7 Srnユーザ?総会対全土問時叫~ンセ.シ ; 子 WJg ご γ Reference [ 1 ]StudyDataS p e c i f i c a t i o n sv e r s i o n2 . 0,FDA(2012) [ 2 ]WindowsDOS/コマンドプロンプト辞典,飯島弘文,矧泳社 (2003) [ 3 ]FDASubmissionのための d e f i n e . p d f作成事例 SAS@によるファイル変 換の Automation化ー,豊泉樹一郎,北西由武,吉田祐樹,平井健太, SAS ユーザー総会 (2013) 313

309.

JMPC l i n i c a l4 . 0の日本での活用の試みと課題 0富 里 遼 太 , 1 幸田克彦 大鵬薬品工業株式会社 データサイエンス部 Ef T o r t st o w a r d st h eJMPC l i n i c a l4 . 0a p p l i c a t i o ni nJ a p a n,a n dl e s s o n sl e a m e df r o mi t R y o t aT o m i s a t o, K a t s u h i k oSawada c cDcpa口m c n t,T a i h oP h a r m a c c u t i c a lC o .L t d . D a t aS c i巴n 要旨 JMPC l i n i c a lは CDISC( C l i n i c a lD a t aI n t c r c b a n g cS t a n d a r d sC o n s o r t i l l m )形式に変換された臨床試験データを 利用し, JMPと SASが連携して効率的に安全一性データのヒ'ジュアル解析が出来一るツールとして開発されて来 e r s i o n4からは Phanl1a c o v i g i l a n c巴メニューも追加され,治験から市販後まで統括して安全性デ た.現行の V ータをマイニング出来るツールとして機能を拡充した.そこで今回日本における JMPC l i n i c a l の有用性を評 a t aT a b u l a t i o nM o d e l )に変換した臨床試験データならびに市販後の医 価する目的で, CDISCの SDTM(StudyD 薬品安全性情報データ(医薬品医療機泌総合機構 医薬品副作用データベース J a p a n e s eA d v e r s eD r l l gE v e n t l して JMPC l i n i c a lで安全性データ分析を試みた.今回の検討で確認出来た, JMP R c p o r td a t a b a s e,JADER)を使Jl 1 寺の留意点について報告する.また, JADERのデータを JMP C l i n i c a lで期待する出力を得るための SDTM変換1 C l i n i c a lで分析して活用するためには言語への対処,ならびに大規伎のテキストデータ分析のための対処が必 要であったので併せて報告する. l i n i c a l CDISC 医薬品副作JIlデータベース キーワード:JMPC ビジュアル角刊行 1.はじめに 製薬企業の自社医薬♂:リスク分析は l ご1 4 zにおいても臨床開発相,および i l i販後相を通して重要な課題とな っている 1) より能動的に Wi在的リスクの課題に刻処するためには従来の定型的な安全,tl~ データ解析に加え, 意思決定に関わる者が,蓄積された情報や経 I L ' f的変化を視覚的に捉え, リスク集団や要因を推定するための l i n i c a lは医薬品安令一性情報の分析者が必要とする様々 探索解析を実施出来る環境が有用と考えられる.JMPC な集計・分析が, JMP と SAS が連抗するギによりプログラムコード記述 !!l~ しで実施出来,データと連動する GUI を介して対話的なデータマイニングが実施可能とされる斗.このようなツールは医薬品リスク分析に有 川と考えられるが, 日本における JMPC l i n i c a lの利用実績の情報は一│分でJ!lr i ヵ、った.そこで今回,臨床開発 H l、 て JMPC l i n i c a lでの安全性データ分析を試み,有用性を評価 相,および市販後相のそれぞれのデータを J した. 315

310.
[beta]
2
. 方法
臨床開発相データ (CDISCSDTM)
JMPC
l
i
n
i
c
a
lで臨床試験データを解析するための標準データ形式とされる, CDISCの SDTM変換済みの臨
l
i
n
i
c
a
l にサンプルとして含まれる N
i
c
a
r
d
i
p
i
n
c
床試験データを準備した.必要な Domain については, JMP C
Study の SampleDataを参考にした.本臨床試験データが CDISCの SDTMI
m
p
l
e
m
e
n
t
a
t
i
o
nG
l
l
i
d
e (
v
e
r
3
.
1
.
2
)
3
)

に従って適切に変換されているかどうかの V
a
l
i
d
a
t
i
o
nについては, OpenCDlSCv
e
r
l.
34)を用いて行った.変

数名や変数ラベル, TerminologyC
o
d
e
l
i
s
tや文字コードなどの項目においてエラーが検出されないことを確認
したヒで,解析を実施した.
また,作成した SDTMデータセットを JMPC
l
i
n
i
c
a
lで解析するには, S
t
u
d
i
e
sメニューの AddStudyからそ
のデータセットが保存されたフォル夕、一先を指定することで, S
t
l
l
d
yを新規に登録する必要がある(1
).

部lId繍淘~感燃欄駅開鱒鵬鵬開照明園田園園田園・E議親譲襲
1
RJe国 t T
a
b
l

Rows' C拍 ∞ 正 帥 I y z
e Gr
a凶

邑

y
酋盟

C
l
明 日1 l
i
匝 由 陶w W
i
.
蜘 w

Help

1
:
‑
己亙「lz
G四 日 ぺ , . " "
一一一‑‑.,'

.
.
.
.
.
.
.
.
.
.

L2
竺,:;悶..•
F

~

週 間J
、乙問、

フ

呂

町
戊

bH

凹

一

PUB‑

生 ‑
O

同州一

白血一

m ゆ
一

初日 υ﹁

Ch
似 指ei

、ご亡

:1

sqyJ
剖割ETj斗刻4f

MedORAFclder

図 l Study登録 i
l
t
i面のイメージ

市販後相データ
九 1PC
l
i
n
i
c
a
lは v
e
r
s
i
o
n4
.
0から CDISCSDTM形式でのデータ分析メニューに加えて, P
h
a
r
m
a
c
o
v
i
g
i
l
a
n
c
eメ

ニューが追加され,こちらのメニューでは副作用自発報告型のデータを川いて報告不均衡に基づくシグ

ナル

指標 5) を利用した探索解析が実施出来る.今出の検討では医薬品医療機器総合機構が 20124月から公開を
r
l
l
gEventRCp0!1d
a
t
a
b
a
s
e (,以下 JADER) 的の 2012年
始めた医薬品副作用データベース JapaneseAdverscD
1
0月更新時データを利用し,昨年の本総会で広岡らが報告した方法 7
) {こ従い,報告例毎の副作用名と報告薬
9
1
1 オブザベーションの解析Hlデータを作成し
剤名(被疑薬および相互作用薬)の全組み合わせとなる 607,

た(2
)
. JADER(こ含まれている副作用発現円の情報は有用であるが,発現 Hを解析に利用する場合は欠浪J
I
や官1
1
分欠浪J
Iの問題で全体の約 8
0%程度の情報が利 J
T
l出来ると考えられる.

316

311.
[beta]
主J
A
D
E
R
2
0i
2i
i T
l
r
4. ;~;
己
主S
o
u
r
c
e

SUBJID
AETERM
607892:R
‑
1
1000453不整脈
6
0
7
8
9
3
.R
‑
1
1000453不整脈
607894:R‑11 0453不登脈
607895:R
‑
1
1
α児 453不整脈
607896R‑12oo0022i
R
股浮腫
607897.R‑12oo0022i
R
I
I
i
l
浮
腫
6
0
7
8
9
8
.R‑12ooo022眼険浮腫
607899,
R‑12 0022滴下投与吉川立科致宅
R‑12 0022滴下投与部位別居感
応 1
2
0
0 22;面下投与部位 ~II:'自感
R‑12
22動惇
1
2 0022 動 惇
1
2
0
0
0
0
2
2動 吟
1
2 0032好政E
判官力比全身症伏を伴う
R‑12 0090突発的睡眠
607907'R‑12
90突発町重眠
607908:R‑12 0090突発町重眠
R‑12ooo121 血圧低下
R
‑
1
2 0
1
2
1 骨髄機能不全
R‑12 0
1
2
1 貰血

出…

∞

r
2Co!um田 (
4
1
0
)
SUBJID
AETER
/
,
明
....AEONSET
畠 DG
ト
叫ME

,

∞
∞

∞

∞
∞

∞

∞
∞
∞
∞
∞
∞

∞

AEONSET

DGNAME

20120314力ンデサJ
IsンシレキセチJ
レ
20120314サルメテ口‑,舟シナ持量塩・フM 力、えグロピすン1
<
エステ J
,
)
;
;
l
e
合
商I
J
20120314:;ヒドロコデインエフIド1
20120314 ペポ9スチンペシ Jv晶~j.孟

川
は
K

回
n
en

巾岬

山中

印
L 刷 は

1d

20120420シ
アJコパラE
ン
20120420川 jうミド塩自主塩・チモローJRレ仁自主塩
20120420ピマトフロスト
20120420シアノコパラミン
20120420ドJ
レソヲミド塩1
1J
孟
.ーチモ口一J
レ
キ
レ
イ
ユl
i
J
.
孟
20120420ヒマトフロスト
20120420シアノコパうさン
20120420ドルソラミド塩白書塩・チモローJRレィ;品目孟
20120420ピマトフロスト
20110716アロフリノ ル
2
0
1
2
0
2
0
1エン灼;!¥:;
2
0
1
2
0
2
0
1フうミペキソーJ
J
,J孟自主塩水手口湖
2
0
1
2
0
2
0
1 レボドパ力J
レピドパホ手間却
2
0
1
1
0
2
0
1テガコールーギメラシJ
レオテラシJ
,
;
かd
ウム配合A
i
'
2
0
1
1
0
2
0
1 テガフづレ・ギメうシjレオテラシJ
レカリウム配合骨1
2
0
1
1
0
2
0
1テ刀フーJ
レーギメラシj
レオテラシJ
レか刀岨E
合昏l
l

図 2 JADERより作成した自発報告例毎の副作用と報告薬剤の組み合わせのリスト(抜粋表示)

JMPC
l
i
n
i
c
a
lは 3
2
b
i
tOS版を購入し,デュアルコア i
5・2
5
2
02̲5GHzRAM4GB のラップトップ PC (東芝)
にインストールした.データ解析は全てインストールした PC J:‑̲で実施した.

3
. 結果
臨床開発相データ (CDISCSDTM)
実際、に出力したい分析にどのような SDTM D
O
l
l
l
a
i
n データが必要であるヵ、については. JMP C
l
i
n
i
c
a
lの

S
t
l
l
d
i
e
sメニューにある

r
Check R
e
q
l
l
i
r
e
dV
a
r
i
a
b
ls
J を用いて惟認することが出来た.こちらを m
いて出力さ
巴

れた PDFレポート結果の一部を以ドの図 3に示す.

T~!tl
R~匁...eod V
adl
!
l
b
l
e
s
:R叩 o
r
t
SOTM/AO.I
I
40
ε1
.
.
3S~ts JMPC
おl
i
c,::"j.
wUtiue

No
t
e
:I
ng
e
n
e
r
a
l
.an.ADaMd
a
t
as
e
to
fanSDTMdomaint
a
k
e
sprec
をd
encei
nJMPC
J
i
n
i
c
a
L
No担:Shou}
;
jADSlbeu
n
a
.
.
.
.
.
a
i1
ab也 管 官 DMdomaind
a
t
as
e
tw
i
UbeusedI
n出 p
l
aC<!
ト
k
l
t
e
:Thef
o
l
l
o
w
i
n
gunavaiJab怯 由 m . 1!
n
sa
r
e5凹TYTl3r
i
z
e
.
dw
i
t
h
i
nt
h
i5 r
e
p
o
r
tf
o
r∞n平 副 を 同 日 ー SV

l
女1
3

Ch巴c
kR巴q
u
i
r
e
dV
a
r
i
a
b
l
e
sによる出力結果 (
D
O
l
l
l
a
i
n 覧)

317

312.
[beta]
支
!1
3の出力結果から, JMPの解析に利用できるデータセットとして, 11SDTMData(AE,C M,CO,D M DS
雫

EG,EX,
LB,
M H,
SV,
VS)と
, 1つの ADaMData(ADSL)であることがわかる.本臨床試験データでは, SVDomain

を作成していなかったので, SVDomain(
j
:"NoneAvailable"と表示されている.また,それぞ、れの解析出 )J(AE
図4
).
D
i
s
t
r
i
b
u
t
i
o
nAEN
a
r
r
a
t
i
v
e,など)に必要な変数についても,同様に確認することが出来る (

pr国間同~

T
e
s
t
l
R
e
Q
u
i
r
e
dV
a
r
i
a
b
l
e
sR
e
p匝 t
M
a
yN
o
tR
u
nC前 田 町 W抽 出 eFo
Il
o
w
i
n
gV
s
r
i
a
b
l
e
sM
i
s
si
'
lg

也O
OSYS B国 yS
y
s
t
途 冊 。r
Qrpn
M
t

C
I
a
掴

S
T
U
D
Y
J
O

・

yI
d
e
n
t
i
n
e
r
S加 d

I
.
t
u
詰M 田d d
a副 司i
s
加減y民 間 割 由 回
開祖

USU臥J
I
O

U
n
i
Q
u
eS
u
副首t
I
d
e
n
t
i
l
i
e
r

鰍 国b
e曲 晶d

AESEV

J1rr回s
i
t
y
S
e
.
e
r
i
t
y

W盟 g
枇 聞l
p
tt
ou
s
e

AESEV

S
e
.
町社v
J
1
n
t伺 S均

W薗a
枇 酬 柚t
t
o岨 @
A
E
T
O
X
G
R
i
f
r
r
白s
i
n
g
.

AESEV

町稔y
J
1
n
t
e
n
s
・
均
S
e
.

W置 a世 間 市tlo出 @

.
t
a

。明暗捻加がy
a
c
r
o
踊曲悼

AETOXGR背 剖S
副司S

A
E
T
O
X
G
R
i
f
r
r
曲曲事
E
G
S
T
R
E
S
I
I
Il
Iu
m
e
r
i
cR
e
s
u
l
t
l
F
i
田d
i
n
gi
n
S
!
an
d
.
r
dU
n
陶
E
G
S
T
R
E
S
I
I
I 1山 判 官i
cR
e
副
I
t
I
F
o
n
d
i
n
gi
n
廿Un
i
t
s
S
t
a
n
d
a
r
E
G
S
T
R
E
S
I
I
Il
Iu
m
e
r
i
cR
e
s
u
l
t
l
F
o
n
<
f
.
,gi
n
S
t
a
n
d
a
r
dU
n捻S
E
G
S
T
R
E
S
I
I
Il
Iu
m
e
r
i
cR
e副社IF
l
I
l
d
;
"
gi
n
S
t
a
n
d
.
r
叫Un
i
t
s
MHDECOO D阻 U凹.ry‑OerivedT
Wu
.att割 引 同 louM
町商

‑TERMlfmls
曲事

図4

CheckRequiredV
a
r
i
a
b
l
e
sによる出力結果(抜粋表示)

図 4 の例として, AESEV (有害事象の重症度)とし、う変数は, JMPの AE D
i
s
t
r
i
b
l
l
t
i
o
n,AE N
a
r
r
a
t
i
v
e,AE
R
e
s
o
l
u
t
i
o
nScreen解析を実行する上で必、要で3あることが確認出来る.しかし,これらについては Notcsに記述

されているとおり, AESEVが Missingであれば, AETOXGR (有害事象の毒性グレード)を代用して解析す
ることがげ1来る,ということも,このレポートから確認することが出来る.実際に本臨床試験データでは,
有害事象の重症度データとして CTCAEGradeを用いて評価していたため, AETOXGRとして重症度データを
l
i
n
i
c
a
lである解析を実行した際,もしその解析に必要なデータが
マッピングしていた.また,実際に JMP C

支
)5は
, S
t
l
l
d
y
V
i
s
i
t
s レポート
存在しない場合や不適切な形式である場合には, JMP実行時にエラーが出る. 1

を出力しようとした際に, SVDomuinが提供されていなかったため,エラーとなった例である.

jNet
;h
e
r1MSVnort~~ ADSVd
a
t
aS
e
te
x
i
s
ti
nt
hs
p
e
c
i
f
i
e
dS
t
u
d
ySDTMo
rADAMf
c
i
d
e
r
E1
S
l
u
c
tN
is
i
t
se
x
i
t
e
da
u
et
oe
r
r
o
r
s

0I
h
eSASl
o
gf
o
rf
u
r
t
h
e
ra
e
t
a
i
l
s
r
e
f
e
r15

JMP実行時エラーの一例

318

313.
[beta]
またその他に出力l
i
寺に作成される例として,

Process Variables

という S A S データセットから,各解析リス

ト名とそれに対応する S D T M変数のリストの一部(※全部で 28Process,延べ 327変数の一覧)を参照出来る
)
(
図6

,
町
田 sfilc;o.i:lIne

巨
1
)
,
、

l
!
l
!

ピ
"
"
.
I日
ピ
:
,
l
I
ピ
"

AEl
nCld
.
.
:
n
c
cSuc
.
"l
l
CS
C
!l
.
"c
n
AEJllt:lJl
AEJnndcnccS
C
!
C
C

ピ

l
!

図6

、
'AH

p

!
)
r
o
c
c
s
sName
AED
h
t
r
i
b
u
t
r
o
l
l
AED
i
:
.
t
r
i
b
u
t
i
o
n
ラU
!
I
O
I】
A
E
D
!
"
t
r
i
l
AEJ
)
!
,
;l
r
i
h
u
l
i
o
n
u
t
!
¥
)l1
AEDbl口b
AED
l
:
‑
t
n
b
u
l
l
(
!J1
1
AED
b
l
r
i
b
u
l
i
ol
AED
!
.
"
t
r
i
b
u
l
i
o
n
I
r
i
h
u
t
i
o
A
.D
I,
>t
r
i
b
u
l
i
ol
1
AF
AEDI~tnbllliotl
!
¥
E
D
l
s
t
r
i
b
u
t
i
o
J】
AED
i
s
l
n
b
u
l
1
0
AEJn (ld~'nç... S
c
ro.!l.'l
.
'S
ι"
:
¥
E
l
n
c
l
d
<
.
'
n
cl
A
E
l
n
C
l
d
<
.
'
n
c Su
(
!
cn仁1."S
C
!
"
:
C
AElncl
AEl
n
c
!
d
e
n
c
.
.
:S
"
:
!
'
:
C
l
l

AEDi~lnbution.sa:-

八 EBODSY
古

AEDi~tnbllt!\)n.sas

AEDECOD
AEO
Ul
AESER
ESEV

日

訂
"

AEDi 1
1
1
h
u
t
i
o
n
A
E
D
I
S
1
1i
h
u
t
i
O.
$
;
l呈
:
¥
E
D
l
s
t
l
i
b
u
t
l
Os
a
:
¥
E
D
i
.
.
.
l
r
i
b
u
l
1
0 a
s

l
!
l
I、
、
l
!

:\EDi~!ribllllon. ,> aち
AEDi~triblltlり n.~a~

l
!

AEDi<;llih \l !I()n.sa~

A
E
D
i
s
l
r
i
b
u
!
l
O!1.
s
a
s
AEDl~lnbllllon. ,; as

AElnl
.
:l
d
c
l
l
l
:
.
.
:
S
c
r
<
.
'
,
"n~;I~
A
E
l
n
.
.
.u
.
k
n
.
.
.
.
.
.
S
c
r
.
.
.
.
.
.
l
l
s
A
E
l
n
l
'
I
J
c
n
cS
c
r
己
,.
.
:
n

誌
日
、
I
;
,

A F. lncIJcnccS..:recll 主 a~

AEJn":IJc Il CCSÇfCCll.~;I"
:
¥
E
l
n
c
I
J
.
:
n
CS
c
r
C ~日、
A
E
l
l
l
l
'
!
d
c
n
c
c
S
c
r
C
AE
:l
n
c
i
d
c
n
c
c
S
c
r
c
c
n目白

"
.
I I
.
"
l
I
.
"
I
l
.
¥
;
l
、

ProcessVariables

AESTDTC
US
じBJID
ヘGE
ARf
RACE
SFX
SITEID
USCsJID
AEBODSYS
A日)ECOD
AEl
:
1
¥DTC
AF
.
5ER
AESTDTC
USLsJID
A
l
l
¥
1
USLUJ!
D

、

:
¥EDi~ I
l
l
b
u
!ion.sa~
AF
lJi
,
>l
r
i
h
u on<;.1<;

"
.
I

、,

oomaln
AE
AE
AE
AE
AE
AE
AE
D
:
‑
"
1
D
.
¥
1
D
.
¥
l
0
.
¥
1
mi

、

D~l

AE
AE
AE
AE
AE
人E
D
:
'
¥
'
1
口M

一覧(抜粋表示)

実際に,自社臨床試験データを用いて解析を行った結果, A EDistributiollや DemographicsDistributiollなど,
解析結果がビジュアル的に出力されることが確認出来た .!
Y
Z
!7は
,
A EDistribution

Sample Data

の NicardipineStudy に対する
面1
[
:
1
央
は

であり, j
i
!
l
j面左は有害事象 Dictionary‑DerivedTenn に対する群別のツリーマップ,

j
I
l
j
j

その集計表,さらに画面右側には背景情報等のフィルタが出力されている.このフィルタを利fIJする事によ
り,興味のある集団に対して容易にそのサブセットでの有害事象集計を対話的に位認することが出来た.
j
胡
,'
!
l
'
lt
r
'
k
.
lm
:
t
e
t
a
f判 明 出 e
ω
e
n
e
nCl町 a
ne‑iIl!1t

,
j
'
:
!
'
,O
o
r
t
aF
i
l
t
e
r

恒例 3 , eéαun!~ *
"
,

:
;
!
fi
:GraphB
u
i
l
d
e
r

~S"l回近 Show .
j
:!
n
c
h
r
o
<
;
!

O
i
c
由 n
a
r
y
.
O
e
r
i
v
e
dTenn
T
r
e
at
I
司e
n
lk1fP
e
l
i
c
泌刷
P

[烹~;

唱
.
I
I
n
:
n
e
I
l

N
I
C
.
1
5

同

a
ω切

空 S~n剖"時"'

亡=二玉コE二二三二二コ
﹄

F
6
44

﹀
5
1E
1
?︑
E

p
η NV
S)

以内副

}川町凶凶

R

一市町田

凶

淵
一U M 卸

山一相批咽

R
'
L
λ,TE00
2
5
i

さ
霊
堂
誌
i
i
<
J
C
i
i
i
i
i
i
i
L
J
叩 h:omeo~ 抑制e:...er~
---~._...._.

._~...­

REC 三、"ËRED~E~討α仁、Æ014.Q7ω

Fムτ"‑σ E
5
、
RECσ~'E;向 r lC目εSOl'.'lt.G!òB7)
r j('TRECσ'oIEREDJN~JτRESOLY司"

RECC定 Z
花 D飛e:SOlVEDW
河口守 SE

UトI
;
(
N
O
W
I
J
(
4
C
i
円

図 7

Nicardipine Study

?(3}

O
I
c
a!
1α'"
S
'
(
S
T
EI
.
I[.
n

-.",申 S向 11l~, <
)
1

O' ::U凹 arrÐ errJe<; ,I!f.'T1()fé ・ r,! j~τω3! Coun~ 何百αnαß <;i)

、,

伊
伊
、

臥 明 刊 い MPH,
s
.TC
~~......~向、崎、---

の A EDistribution 出 }
Jの一例

また, 玄
!1
8はある l 症 WIJの ProfileSubjects の出 }Jであるが,その杭例の Visit,治験薬のJl投薬状況,各有害
事象の発 4
見期間,各併 J
I
J薬の併 J
!
J期間,などが H年系列として視覚的に捉えることができた.向社臨床試験の
SDTM

形式データでも同様の出 }
Jが得られる事が確認出来た.

319

314.

一 一 一 叫白石語長正i i .d, S.~.~j!.竺,…… G" 一一一一一一一‑ 1 2 1 1 2 0 1 0 4~;Profile ~:'THnpïirtës i ! ) : D o m 3 i n s C~ . "1 0 0 同0 ' "ョτ a b l e s 向 " i α s p l a yJ o ' . o ! : 免f o r ‑" i n e !穆 Com~町田提4 1('N日 咽 lGEx同医副 ; : : : : ; : 宮 古 i ‑ iEヨコ ー寸一一一一 剛志剖 c,託。lnIan!Medl: r a t i o n s ーーー . ‑ 』則一一 て‑ ‑ 一 ・. ‑ ‑‑ 一 ‑一 L 吋 一 2 Honz.on 凶 ~U ‑ アー蜘 乞二ご L 司 ‑ 選W L ! ECGTestRes山事 ‑IFt ・ ‑ ‑ . 区1 8 炉 tTA‑ M 7・ 抑 制t es.b炉d:F d l叫 註竺亙; R 組 註 通j . 4炉‑ e a ‑ ‑ 回 空 一 , . , ヤ ! 竺 tN空 ; 町 界再空除良碍均r t ! 持 g N i c a r d i p i n eStudyの P r o f i l eS u b j e c t s出力の一例 市販後相データ l i n i c a lでデータ解析出来るかを検討した.データ文字コードを社 最初に JADERの日本語表記のまま JMPC 内の SAS環庇で利用されていた S h i f t ‑ J I Sから Unicodc(UTF8)に変換した後, JMPC l i n i c a lの Pharmacovigilance メニューで解析を試みたが,解析結果出力の日本語表記は文字化けを起こし, Unicode変換した場合において も JMPC l i n i c a lでは H本語表記データは利用不可能であった. JMPC l i n i c a lのパッケージに組み込まれる SAS は現在の所, E n g l i s he d i t i o nのみが動作検証されており, Unicodee d i t i o nSASで、の実施は検討出来なかった. そこで JADERデータの英語化について試みた.JADERの副作用名については MedicalD i c t i o n a r yf o rR e g u l a t o r y A c t i v i t i e s(MedDRA) 辞書,薬剤名については医薬 1日 iデータファイル(株式会社医薬情報研究所)に含まれる 英名表記を利用し,各々 JADER の日本語表記とのテキス卜文字完全一致を条件として該当の英名を特定し, I 名については 98.7%が個別の手作業に依らない英語化が可能であった.英語化 副作用名は全体の 100%,薬斉J l i n i c a lで分析可能にするには更に 2つの対処が必要であったため.以下, 1 ) 頃に記 した JADERデータを JMPC 述する. 1 ) P r o ct r a n s p o s eの文字数制限への対応 JMPC l n i c a lは JADERに報告された全ての薬剤と雇J I作 mの組み合わせについて報告不均衡に基づくシ ク。ナル指標 ROR,PRR,MGPSおよび BCPNNが一度に算出出来るがめ,結果の要約表示のためにシ クナノレ算出値の薬剤名,高J I 作川名によるデータの転置作業が必要となる.薬剤名や副作 H J名は 32 文 F 字を越える物も JADERには多く含まれている SASp r o ct r a n s p o s e プロシジャの byコマンドで生成 される変数名:こは 32文字の制限があるが, 32文字でカッ卜された場合に同ーの名称となってしまう I 名や副作用名がある場合,複数の同 薬斉J 名変数が生じる事になり, エラーとしてプロセスが中止さ れた. 2 ) 大規模データを取り扱うための計算ロジックの改修 当初, JADERのフルセットデータを解析に用いると Phamlacovigilance メニュー実行時にメモリー消 費 ' が3 2 b i t版 OSの実装日民である 4Gigab y t c s に至り,リソース不足によるエラーでプロセスが中止 された. 320

315.

これらいずれの問題についても SASI n s t i t u t e社より迅速に改修プログラムが提供され,解決する事が出 来た. 改修プログラムによる問題点への対処後は P h a r m a c o v i g i l a n c eの D i s p r o p oI 1i o n a l i t yメニューで JADERの 大規模データを一括して分析する事が可能となった 各副作用,薬剤毎に算出されたシグナル指標の集計 結果は JMPの GUIを利用して対話的にドリルタ手ウン出来,特定の薬剤や副作用に着目したシグナル指標値 ) .また面J [ 作 を容易に視覚的に捉える事が出来た(図 9 m発現日の情報を利 J目する事により,副作!日シグナ 0 ) .JADERのデータサイズが ルを年度毎,四半期毎などの経時的推移で視覚的に捉える事が出来た(図 1 大きいことから,発現日情報で、シク ナル指標値の経fI;¥'的変化を解析する際には,利)IJするシグナル指標を あらかじめ設定で限定してから実施する事が現実的な実行時間内(数分程度)で結果を得るために必要な 惜置であった. e ‑‑ AU‑‑ U C E n‑‑ 一 一 二 m 一 一 印﹁﹂ ⁝沼侶二 BMg ‑ w ﹃3f] nsm 回目一一一四百一﹂ 引同一計一 n E 一 d 匹防出二 泊料一向一円⁝さ nbm 一 一 今'ι?'MN れ暗躍蹄圃・示 8 q 特ぜ 河 ︒1 一 onυnυ 日 川 一 日3 2 五 ‑ 同2 7 g d 一 円 R ・ 司 ∞ 倒 的wg i 戸M nu内 ︒ フ ﹄ O‑ a ‑ ‑ v M一 CAV88gL 制 1:;:FrequencyCount~1521 "'DRGENG ACEMA[l( 4 5 ) 1 4 ) ACEMETAC肘 ( ACEM[N( 5 2 5 ) ACENOl(2) ) ACEPYRO侭4 5 1 相側冨 .~l/.!l 11棚田園掴勧a: ACETAMOX( 6 3 ) ACETATE( 1 6 ) ACETATEDRINGER( 1 5 ) ACETATEDR[NGER.SSOlUTION(W打 ACETAZOlAM lDESODIUM( 3 9 ) ACETEIN( 4 ) ACETOKEEP( 5 ) ACETYllEUCOMYCIN( 2 ) I~I 9 特定薬剤の全副作 mのシクーナル指標値 (ROR95%信頼 I 及[l日ド限値)ツリーマップ 321 コ C

316.

TimeTrendP l o t 伊 lCumulativeRORLowerL im i tf o rToxic Ann , ぐ ,F r e q u e n c yC o u n l 50 40 f ︿ Eコ包﹀﹀ O﹂ 3 0 20 1 0 3 i g n a lT h r e s h o l d Y2003 Y2004 Y2005 Y2006 Y2007 Y2008 Y2009 Y2010 Y2011 Y2012 Tim l 立110 特定副作用の莱斉l ば手のシグナル指標値 (ROR95%信頼区間下限値)の経時変化 (2003 年 ~2012 年) JMP C l i n i c a lでデータ解析を実施した際には,出力に利用される計算値は SASデータセットとして実行 1 ). ログと共に出力フォルダーに保管される(図 1 白̲ p 問 r 悶 圏d 白陪叩 p 閃a 問 旧 n 1 凶 a 山I sd ヨs 7 b 抽d 白a 剖1 酉h 官 e 芭削. 固 het m γa阿 m s 7 凶 b 凶d 抗 包 m L sas7bdヨ拭t 部酌 冶 主 . ' l 官 四 色 白 凶 ヨ 竹 ' , 誌 . ' l 民悶 川 白 PVDisproporti l i t y A n a l y s i sS c r i p t . j s l 口 t " l . ' l P ¥ fD i s p r o p白川 l 口n . ' ll i t yA n aI y si s l . O g l 鴎 通F 刊VD 固附町SLHllS 7 花b d 制ぷ . ' l お 主 自主ascl e a n. j s1 自 signa1 s a s7 b d . 討 し JStudyL口g.txt mtreer 図 1 1 . P h a r m a c o v i g i l a n c eD i s p r o p o r t i o n a l i t yメニュー解析実行後の出力ファイル 2 ), 計算されたシグナル指標値や信頼区間推定値などが SASデータセットとして保存されており(図 1 これらの値を二次利用して SASや JMPで、別途悶表作成寸る事も可能である. 322

317.
[beta]
Y
2
0
0
9

1 ROR
6U
n
s
l
r
al

4
7
.
4
3
9
9 6
.
0
6
2
7
2
7
6
9 3
7
1
.1
9
3
5
5
5
9

1 41
.2
5
5
9
6
14
7
.
1
4(
6
.
0
6
3
.3
71
.
19
4
)

Y
2
0
0
8

6U
n
s
t
r
a
t
i ROR

7
1
.
5
7
9
7 9
.
1
4
0
4
6
0
1
1 5
6
0
.
5
4
6
3
6
2
2

1 63.1026297159(91
.4
.
5
6
0
.
5
4
6
)

Y
2
0
0
9

6U
可,:;!rall ROR

7
9
.
6
9
2
6

.
17
25
1
1
0
.
1
7
2
3
7
9
' 6
24

70mB2 7
9
6
B
(
1
0
.
1
7
2
.
6
2
4
1
7
2
)

Y
2
0
0
9

6U
n
s
l
r
a
l
l ROR

1
.
6
9
4
0
6
7
5 7
32
.
7I
B
7
9
7
7
9
2
.
5
6
6 1

1 B
I
2
7
2
B
3
29
2
.
5
7(
11
.
6
9
4
.
7
3
2
7
1
9
)

Y
2
0
0
B

6 凶百I
r
a
t
i RQR

3
4
3
.
9
1
4 7
2
.
5
5
B
5
5
0
3 1
6
2
9
.
1
3
8
0
4
3

2
5
4
1
4
9
3
6
9
3
1
4
6
3
2
9
8
1
1
3
{
8
7
}
2
5
5
9

6U
n
s
t
r昌 t
! ROR

1
5
7
.
5
3
6 1
9
.
9
6
2
6
1
5
4 1
2
4
9
.
4
5
4
6
3
2

〉
9
8
6
3
.
1
1
3
9
2
6
9
7
8
1
1
5
2
4
7
9
5
4
4
5
{
5
!

6U
n
s
t
r
a
t
i ROR

1
3
1
0
6
2 3
5
31
.
6
1
1
6
4 4
B
6
3
B
4
8
1
8
7

Y
2
0
0
9

6U
n
s
l
r
a
l
l ROR

.
26
6
2
1
0
2
2
4
.
5
9
2
8 3
.
1
1
3
2
B
4
1
4 1
94

52646076913106192{)
3
5
3
1
6
1
2
4
B
6
3
B
.
4
B
1 2
0
3
5
3
6
7
42
4
5
9(
3
.
1
1
3
.1
9
42
.6
6
)

Y
2
0
0
9

6U
n
s
t
r
a
t
i ROR

2
0
7
32
.9

Y
2
0
0
9

6U
n
s
l
r
a
t
i ROR

7
72
4
3
2 9
6
2
4
6
3
6
0
4 6
9
1
7
9
9
4
6
9
3

324486572073296{73)
44563
1
2
4
7
5
.
3
7
.
2
4(
9
.
6
2
5
.6
9
1
7
9
9
)
1 6
0
1
3
7
2
2
77

Y
2
0
0
8

6U
n
s
l
r
a
t
i ROR

9.
13
7
9
9 1
0.
20
1
2
2
7
9
'9
1
9
.
5
5
5
6
6
4
6

1 7
1
.41751791
.
3
9
(
1
0
.
2
0
1
.
9
1
8
.
5
5
6
)

宮1
1
a
l
l RQR
6 リn

2
2
8
.
6
4
3 7
0
.
1
9
5
9
3
6
5 7
44
.
73
5
5
1
0
8

4 6
2
2
.
9
7
7
8
92
2
9
β
4(
70
1
9
6
.
7
4
4.
13
6
)

6U
m
l
r
a
t
i ROR

5
4
3.
19
7 1
1
9
.
8
7
7
5
5
7 2
4
9
7
4
6
5
3
2

2

3
4
4
5
6
2
8
3 1
2
1
7
5
.
3
6
7
3
9

内
向
^
" ..C^".... ・・司~

00

l
文112.

8
9
7
3
6
8
5
2
4
4
3
8
7
7
9
4
6
(
5
1
}
i
8
8
7
8

.
"
.
.
.
"
拘
.
.
.
.
.
.
.

34(
76
9
7
.4
5
79
)
5
9.

火
[[11 中の dispanaLsas7bdatの内容

4
. まとめ
以との検討結果から,

J M PClinical4.0 は臨床試験の C D
lS C標準化データについては,

J M P Clinical で解析

するのに必要な S D T M変換データを準備することで,一連の解析結果を出力することが確認できた.また,
解析に必要な S D T Mデータセットや変数についても,
ことで,確認することができた

J M PClinical の CheckRequired Yariables機能を用いる

‑)j, 日本の医薬品市販後高I
J作則の貴重な公開情報である J A D E R について

も市販のコード辞書を利用して英語化し,必要な改修を S A S社に対応してもらう事により,

J M PClinical が

副作)[]シグ ナルのマイニングツールとして利川出来る事が確認げ!来た.日本においても適切な形式へのデー
タ変換を標準的に行っておく事により,都度蓄積されたデータを用いてれ、在的リスク分析を含む安全性情報
分析を視覚的かつ効率的に実施する ~Jl が出来ると考えられる.
J M P Clinical でのデータ解析に使用する P Cの性能についてば臨床試験 CDISCデータについては特段の問題

は生じなかったが,大規模データである J A D E R を解析する!民実施途中でメモリー不足になる事もあり,今
後情報が継続的に J A D E Rにデータが蓄積される事を枇案すると,今凶の検討に万lし、た 32bit版 O Sでは}尽く,
64bit版 O Sに対応した J M PClinical を利用することを推奨する.現行の vcrsion4.0 に含まれる S A S は English
edition のみであるためデータの英語化が必須となっているが,

Unicode edition の S A S が J M PClinical で利用

可能になれば日本語を含む各国言語のデータの解析が文字コードの Unicodc 変換のみで実施出来ると考えら
れ , 今 後 の ルIPClinical の機能拡張に期待したい.

参考文献
1
) 厚生労働省

r
医薬品リスク管理計画指針 J (平成 24年 1
1 凡)

Mto://www.info.Dmda.go.io/ivakuifilc/h240411‑001.odf
2)

J M P Software‑J M PClinical

1
11
to://www.imO.comisoftwarc/clinical
!

323

318.

3 ) CDISC,SDTMI m p l el1le n t a t i o nG l l i d ev e r 3 .1 .2( 2 0 0 8年 1 1月) 1 I lo : l l w w w . c d i s c . o n u e x t r a n e t / i n d e x . o h o ? a = 1 2 0 9 1 4 ) OpenCDISC h t t p : / / w w w . o p e n c d i s c . o r g l 5 ) CIOMSWorkingg r o l l pV I I I( 2 0 1 0 ), P r a c t i c a lA s p e c t sofS i g n a lD e t e c t i o ni nP h a r m a c o v i g i l a n c e, Chapter7 6 ) 医薬品医療機器総合機構, 国J I作用が疑われる症例報告に関する情報 1 l t t o : l l w w w . i n f o . Ol1ld a . Q o . i o / f l l k l l s a v o l l / m e n l l f l l k u s a v o l l a t l e n l i o n . h t m l 7 ) 広岡 禎,山田 雅之, PMDAの「医薬品副作用データベース」を用し、た副作用リスクの評価,一自社 医薬品の副作用リスクのポジショニングへの活用 2 ) PMDAの「医薬品副作用データベース」の活 , ( 別 , SASユーザー総会 2012論文集. 8 ) 1M?C l i n i c a lO n l i n cDocllmcnt h t t p : / / w w w . j m p . c o m / sl Ip p o r t ldownloadslc li n i c a1 ̲d O C l ll1l巴 n t a t i o n / w w h e l p / w w h i m p l / j s / h t m l / w w h e l p . h t m # h r e f = C l i n i c a l S t a r t er .57. 2 7. h l m l 324

319.

RAND関数による擬似乱数の生成 0魚 住 龍 史 浜 田 知 久 馬 東京理科大学大学院工学研究科経営工学専攻 Is i n gRANDf u n c t i o n G e n e r a t i n gpseudo‑randomnumbersl R y u j iUozl Im i ChikumaHamada DepartmenlofManageme l 1 lS c i e n c e ,G raduu 山 S choolofEngineeri 昭 ,T o k y oU n i v e r s i t yo f S c i e n c e 要旨 ある臨床試験デザインに対して,予め見積もった症例数の妥当 a性を評価する lつの方法として,乱数 を用いたモンテカルロシミュレーションによる評価が挙げられる SASで は 擬 似 乱 数 を 生 成 さ せ る た めの関数として, V9カ 冶 ら RAND関数が 1 1:規版として導入された.本発表ーでは, RAND関数で利用でき る確率分布を整理した上で,それぞれの他率分布に従う擬似乱数を生成する方法について取りあげる. ,CALLSTREAMINIT,i / 在率分イf i,正規分布,テーフツレ分 キーワード:RAND,乱数, M e r s e n n eT w i s l巴r 布,モンテカルロ法,逆関数法 1 はじめに 乱数とは,ある特定の目立率分イ' t iを持つ数タJ Iである.モンテカルロ法とは,乱数を利 I I Jする技法の総称であ り,シミュレーションや確率計算においてランダムな要素を含むもの法モンテカルロ法の対象である [ 1 4 .1 6 J 例えば,医薬品開発において,ある臨床試験デザインに対する症例数を統計学的に見積もることが求めら J義水準を満たすことが : ; j とめられ,検出力を評価するための れる.このとき,見積もった症例数は検出力が t lつの H法として,擬似活 L 数を生成させて文一胞する,モンテカルロシミュレーションによる評価が挙げられ る.本ユーザー総会においても,症例数設計一法に対して,モンテカルロシミュレーションによる性能評価が 多く行われている [9J また,より複雑な臨床試験デザイン [~J に対する症例数設計をわう場合,モンテカルロ シミュレーションは非常に有If J である. SASでは,擬似乱数を生成させるための関数として, RANDI 基]数が提供されている.本稿では, RAND 関数で採用されている擬似乱数生成アルゴリズムについて述べる.そして, RAND関数で利用できる雌 率分布を整理した上で,それぞれの惟卒分布に従う j 疑似乱数を生成する方法について取りあげる.なお, .4J とし,多変量の他率分布については G e n t l e( 2 0 0 3 ) ある 本稿で取りあげる確率分布は単変量の場合 [1.J いは SASl n s l i l u l el n c .( 2 0 0 8 ) を参照されたいい 7 J 325

320.

2孔生ND関数による擬似乱数の生成 RAND関数は V8.2で評価販の機能として提供され, V9から正規版として提供されている. RAND関数が 提供される前は, RANUNI関数や RANNOR関数で擬似乱数生成の関数が提供されていた.RAND関数では, Mersenn巴 T w i s l e rと呼ばれるアルゴリズムに基づいて擬似乱数が生成される [ 6 J このアルゴリズムは, I 日来の RANU削 除j 数などで採 J I Iされている乗算合同訟に基づく方法と比較して,以下の点で優れている. 周期性 !日来の RANUNI関数などが生成する乱数の周期は 231ーIである一方,RAND関数による乱数は 219937ー!と極めて長い周期をとる. 統計的性質 生成された乱数は, 623次元超立方体の中に均等に分布する.これは,乱数を組み合わせて ベクトル形式で、使用したとしても,その乱数に偏りがほとんど見られないことを意味する. 生成速度 旧来の RANUNI関数などの関数と比べて,生成速度は同程度以上の速さである. RAND関数によるおf 似乱数の生成は,データステップ内で実施する. RAND関数の構文を図 iに示す. datarandom; Is t r e a m i n i t ( s c e d ) ;/*シードの指定安/ c al doi = lt o1 0 0 0 0 ;/ *' t ! i . えさせる i 疑似乱数のオブザベーション放 γ … x = r a n d ( ' d i吉t r i b u t i o n ', param‑l, , para1l1‑ k ) ; o u t p u t ; 巴n d; r u n ; 同 I:RAND関数の構文 RAND関数は,第 1 5 1数で確率分布を指定し,第 2引数以降で確率分布に対応する数のパラメータを指定 する.図 lのプログラムでは,データステップ内で RAND関数を用いることによって, 10000個の擬似乱数 を生成することができる.また,擬似乱数の満たすべき条件として,再現性が挙げられる RAND関数に加 え , CALLルーチン CALLSTREAMINITを記述することで,シードを指定した再現性のある擬似乱数を生成 することが可能である.なお,指定できるシードの範閉は 231 ‑ 1未満の整数である. 2 . 1孔久ND関数で指定できる確率分布 RAND関数において,第 13 '1数で指定できる確率分布のうち,離散型の確率分布について確率関数及び RAND関数の記述方法を表 iに示す.さらに, RAND関数で指定できる確率分布のうち,連続型の確率分布 について確率密度関数及び RAND関数における記述方法を表 2に示す. 326

321.
[beta]
1:RAND関数で利用できる l
i
l
tI
汝型の確率分布
確率分布

lW~11J関数における記述

I:._~'IIDJ 関数における確率関数

x=
RAND('BINOMIAL',p,11)

二項分布

ベノレヌーイ分布

x=
RAND('BERNOULLI',p)

f(x)=p'(
l
‑p
)
I
‑
', x=O,
1

ポアソン分布
f(x)=

超幾何分布
!(x)=

.
t
l
'exp(λ)

x=012,
.
.
.

x
!

(:J(:=~:J

(
:
J

x=
RAND('POISSON',λ)

x=
RAND('I‑IYPER',N ,R,1
1
)

,

m以 (O,
n+R‑N)三xざ min(n,
R)
x=
RAND('NEGBINOMIAL',p,k
)

負の二項分布

(kH
)
,
1
.
2
ラ
…
f(x)=1
, ー,1
l
(
l‑p)'p', x=0
k‑1

幾何分布

,
12
γ・
・
/い)ニ p(
l‑p)', x=0

x=
RAND('GEOMETRIC
'
, p)

テーブル分布市

f(
i)=p;, x=1
,
2,
.
.
, 11

x=
RAND('
T
ABLE',p
" P
2
'…)

((川

l
)
=
l
‑L
.p,

t
j
l
l
n庁:カテゴリカノレデータを生成

表 2:RANDI長j
数で手 I
J
)
I
Iできる辿ー続型の確 J存分干I
1

確率分布

[~I)J 関数における確率密度関数

正規分布

fル 一 九 ((
x

μ
)
'
) …〈∞

RAND関数における記述

μ

x=
RAND('NORMAL', ,σ)

.&σ2σ2

対数正規分布

f仲 x.&
x~exp(
̲
.
.
,
.
.
( 附2l
2

x>0

x=
RAND('
T
'
, v)

t分布

)
=
長
(
r
中
i
(
;
)
)
(
l
+
:
2
)
コーシ一分布

∞<x<∞

x=
RAND('CAUCHY')

=
よ
(
よ
)∞
1
+

ん)

X

<x<∞

C

J[ ¥

F分布

RAND('LOGNORMAL')
x=

(川)
r
(
'
i

r
J 2 )
I
,
'
¥"
~ t
',
:
'X
'
:一 oc<x<∞
f
(
x
)=
‑
'
‑
‑
‑
,
‑
,̲!̲
「
ヲ
, Ir ウ~ 1
(1'1+
I
ヘ)
(
'
;J J

x=
RAND('F',v
" v,
)

C

ガンマ分布

f
(
x
)=
~x"-' 巴却 (-x) ,
r
(a)

x=
RAND('GAMMA',白)

X>O

327

322.
[beta]
アーラン分布

x=RAND('ERLANG',a・
)

f(x)=~1 ,X‑Ie
却 (
‑x)' X>O
o

i
(
a
)

:a

整数

XニRAND('CH1SQUARE',v)

カイ二乗分布
f ( ) ‑ 2 2 i l ( x ) X〉 O

r(~)

指数分布

却

.
f(x)=exp(‑x), x>O

x=RAND('EXPONENTIAL')

XニRAND('WE1BULL',r,λ)

ワイプル分布

x
)=; [ 'exp{‑(1)} x>0

ベータ分布

/
(
,y)=r(0+b)X521
(
I
‑
x
)
b
l, O〈 X〈 I
i
(a
)
i
(
b
)

一様分布

f(x)=1
, 。 く Xく l

コ角分布

XニRAND('BETA',a,b)

x=RAND('UNIFORM')

x=RAND('
TRIANGLE'1
7
)

一
(
0x51
7
)
f(x)=h
1
7く X壬 1
)
2{l‑x) (
11
7

l凶 プ ロ グ ラ ム

理論式

datarandom;

LPi壬l

Istreaminit(20130718);
c
al
doi
=
lt
o1
0
0
0
0
;
000
.
2
)
;
o
l
l
t
p
u
t
;
e
n
d
;
doc
a
s
e
=
l
;x
=
r
a
n
d
(
'
t
a
b
1
e
d
',
doc
a
s
e
=
2
;x=rand('tabled二0
.
1,
0
.
1,
0
.
2
,
0
.
2
,
0
.
3
)
;
o
l
l
t
p
l
l
t
;
e
n
d
;

O
.
i
,
OムO.
3)
;
O
l
l
t
p
l
lじend;
doc
a
s
e
=
3
;x
=
r
a
n
d
(
'
t
a
b
l
e
d
',
end;

,
2,
.
.
, 17, r
[U)=Pi' i=1
(川 1
)ニ 1‑LP
,

Lp
,
2
:12,
.
・,
j~ 1, r
!
(
i
)
ニP
i
' i=1
(
j
)ニ I‑LP
,

r
u
n
;

│

│乱数のヒストグラム
1
0
0

Ta
b
l
e
C
O
,
4
.0
.
3
.0
.
2
)

O
.
1
.
0
.
2
.
0
.
2
.
0
.
3
)
Ta
b
l
e
C
O
.
1,

T
a
b
l
e
C
O
.
7
.0
.
4
.0
.
3
)

90
80

hoco
コU O﹂L

7
0
60
50

40

3
0
2
0
1
0
0

3

4

61

61

図2
: テープ、ル分布に従う擬似乱数の生成

328

3

323.
[beta]
制プログラム

I

理論分布

d
a
t
arandom;

ls
t
r
e
a
m
i
n
i
t
(
2
0
1
3
0
i
1
8
)
;
c
aI
doi
=
lt
o1
0
0
0
0
;
O
,
l
)
;
o
u
t
p
u
t
;
e
n
d
;
doc
a
s
e
=
l
;x
=
r
a
n
d
(
'
n
o
r
m
a
l
',

i
O2(/X

doc
a
s
e
=
2
;x
=
r
a
n
d
(
'
n
o
r
m
a
l
',
2
,
1
)
;
o
u
t
p
u
t
;
e
n
d
;

,
コ

5)
;
o
ut
p
ut
;
e
n
d
;
doc
a
s
e
=
3
;x=rand('normal 0.

/

e
n
d
;

"

一一‑';'2.1)

r
u
n
;

w.

/

ー匂ー..1'+(2
.
1
) ‑‑‑N::Z
.
O
.
S
l

目

乱数のヒストグラム
N(O.I)

N
(
2
.1
)

N
(
2
.
0
.
5
)

1
5
〉
、

O

3
i 10
コ
U
ω

L

LL

。

‑
5 ‑
4 ‑3 ‑2 ‑
1

5‑5 ‑4 ‑3 ‑2 ‑
1

i
玄1
3 │正規分布に従う擬似乱数の生成
ここで, ~!f日放型の確率分布に従う J品目以乱数の例として,テーブル分布に従う J疑似乱数 X ‑Table(p]'p"".,
p,
)
,
連続可lの確率分布に従う擬似乱数の(1
1
比して,

J
疑似 1
i
L数を生成させる SASプログラム,
示す

1
正規分布に従う疑似乱数 X‑N(μ,
σ 2)を考える.それぞれの

J
l
R
t
i
命分 ;
(
I
J・理論式,及び生成させた擬似乱数の分布を I
主1
2, 1
,,13に

なお,ヒストグラムの作成には S
GPLOTプロシジャを J
I
Jl、
た 110.11.1" I
J
J 理論分布・理論式を対照に

すると,求める疑似乱数を生成できたことがわカ、る.また,正規分布のノミラメータを指定せずに実行すると,
傑i
f
l
l規分布 X ‑N(O
,
I
)に従う擬似品 L
数が生成される

さらに,テーフ

ル分布のパラメータの指定を

エ

p,く lの状態の下,第 (
1
1+1
) ハラメータを指定せずに実行すると, f(I
1+
I)=1‑2.'>;を求めた 1
.で
,

X‑
T
{
/}
Jた(
P
I,
P"".,
P
",
l
十)に従う山
なお, RAND 関数で指定できる (í{~ "存分 ;
{
j
jのうち,確率(密度)関数を求めるための PDF関数を簡略化した
パラメータで定義されているものがある.例えば,各関数で定義されている指数分布及びワイフ、/レ分布の確
率街度関数を表 3に示す.表 3の場合, RAND関数でパラメータ入の指数分布に従う擬似乱数を生成させる

lつの )j法として,それぞれの確率分布間の関係、を活用することが挙げられる.一部の確率分布のfl¥J
には,
パラメータに特定の値を代入した特別な場合,変数変換,漸近近似などによって,関連付けられるものがあ
る 1
5
J

329

324.

表 3:指数分布及びワイフキル分布の確率密度関数 ︐ ︑ 一 A : x λ x L'/el‑‑¥ Mir‑‑fl ﹁L 灯 ︑ x一 ム よ 叩 E ' 一 U11 A x= RAND('EXPONENTIAL') ﹀︑ f 判即 JAU 側 f ( x )=e x p ( ‑ x ), x>0 A ︑liri‑‑J y y yV‑1‑‑/ ワイブ、ル分布 I ~関数 確率密度関数 mMl 寸 λ 四 y 一日 Z=吻= 引 dHA り 指数分布 ︺(︺( m fHf │確率分布 X>O X>O パ仰 X j 吋1 ) r=1コ h f 六 削併 ω 件 x 吟 ( か ) い ド = 起幾何分布 .雌 i 枚 1 ) ' 1 の確率分布 N . R . l l 、 ・ 、 p=RIN 、.i Vー今ヨう ‑ 辻i続押!の凶c 存分布 、ム 幾何分布 p ー ・ ー ・ 〉 ーーーーー歩 :漸近近似 s 変 数 変 換 01 特 別 な ケ ー ス ! /k=l .k→ 司 ' て 、.、・、, :n の二 !f~ 分布 レ ブ布 一分 ‑7 k, p t} n・米 2と異なる定義行] ) 1=0 σ=1 一供廿 一﹁ 一分 一 コ l 当 4:RAND関数で指定できる確率分布の関係、 間 4に , RAND民j 数で指定できる確率分布の!お係を示す.表 3の場合で考えると,指数分布はワイフ、ル分 布の特別な場合であるといえるーよって, RAND関数の確率分布として,表 3に示したワイプ、ル分布のパラ メータを指定することにより,パラメータ λの桁数分布に従う擬似乱数を生成することが可能である.その 他の確率分布についても,確率分布問の関係を活用して,民Ji生する異なった分布から J 品目以乱数を生成するこ 330

325.
[beta]
とができる.なお,図 4に お け る 引l
の確率分布は,表 l及び表 2で示した確率(密度)関数とは異なった定
義の確率分布で考えている 1
5
J

2
.
2 逆関数法による擬似乱数の生成
RAND関数では指定できない健三存分イi
lに従う擬似乱数の生成が必要な場合がある. このとき,解決策の i
っとして,逆関数 1
ょを H
Jしることが挙げられる.いくつかある手法のうち,考え方がシンプルな方法である
といえる.例として,対数ロジスティック分布を取りあげると,孔<
¥ND関数において,対数ロジスティック

i
'
{
i[$分布として含まれていない.そこで,逆関数訟を用いて, ワイブル分布及
分布は第 151数に指定できる l
び対数ロジスティック分布に従う擬似乱数を生成する方法を示す.
逆関数法 1
1
5
Jは,指定する碓率分イl
iの以積分布関数 F
(x)の逆関数

rl(y)= inf{x:F(x)三y},

0 三 y~l

が存在する場合, 図 5より,標準一様分布 UU(OI
)からの変数変換

x =rl(U)

,

として擬似乱数を生成することができる.なお, XF
(x) こ従うことは,

F1(y)~ X

y三F(x)

生二

より,

P(X三x
)ニ p
{r[(
U
)~ x
}= P{U~ F
(
x
)
}= F
(
x
)
でわかる.

戸一



川一////

1
1
‑
‑

主

l
主1
5
:i̲主関数法の原理
旦関数法によりワイフル分布
疑似乱数を J
I
Jし

て
, j
ここで, RAND関数によって生成させた‑様分布に従う J
に従う擬似乱数を生成させる.さらに, RAND関数における確率分布としてワイフずル分布を指定させて生成
させた擬似乱数と比較する

それぞれのプ1
7
y
l
;て生成させた擬似乱数のヒストグラムを医1
6に示す. これを見

ると,逆関数 i
去によって生成させた擬似乱数は, RAND関数で生成させた擬似乱数と同様の分布であること
が確認できる.

また, RAND関数においてサポー卜されていない縦率分布に従う擬似乱数の生成が必要な場合がある.例
5,
[
7
Jは第 1J
iI
数に指定できる確率分析7と
として, RAND関数の確率分布において,対数ロジスティック分布 1

して含まれていない

RAND関数で折定できる倣 本分布を用して, 対数ロジスティック分イiのような総本分
2

331

326.
[beta]
布に従う j
疑似乱数を生成させる方法の 1っとして,逆関数法を用いることが挙げられる.そこで,逆関数法
をH
Jし、て,対数ロジスティック分布に従う擬似乱数を生成する方法を,ワイフ、ル分布に従う擬似乱数を生成
する方法とともに表 4に示す.

表 4:各関数で定義されている指数分布及びワイブル分布の確率密度関数

去
シハ

."、 ~1-1

x
)= 〆
f
Xy
‑
一

F
刊ο
刷叶
X
か
)
い
=1

I
(
x
)=と こ ア
I+Ax'

イ(
1
J
}
'

。o

F(x)=l‑i‑, X 〉 O

口
x>0

1+λx
'

r
¥
x
)
=
H
(
古)
r
'
x
=
H
(
市
)
}
'
"

rl(x)=λ{‑log
(l‑U)r
"
X ニ λ(‑logUY
"

RAND
関誼

一一一一一一一一組艶一一

副

m
u
c
ωコ
σ WL比
︑

6

0

図6
: それぞれの方法で生成させたワイフずル分布に従う擬似乱数の分布

3 まとめ
本
1
'
1
%で
、
は
, SASで促 f
l
bされている, RAND関数で採用されている擬似乱数生成アルゴリズムについて,

,

}
̲と比べ,同期の長さ,生成速度,そして統計的性質の点から
旧来の RANUNI関数などで採川されている方 i
後れていることを述べた

i
欠に, RAND関数による擬似乱数生成方法ーについて, RAND関数で指定できる

確率分布及びそのパラメータを詳述した.また, RAND関数において, PDF関数とは異なったパラメー
タで定義されている雌率分布があることを取りあげた.さらに,対数ロジスティック分布のように,
RAND関数においてサポートされていない確率分布に従う擬似乱数を生成させる方法として,逆関数法

について取りあげた

以上より,医薬品開発で見積もった:庶例数に対する検出力の評価のように,モン

332

327.
[beta]
テカルロ j
去による擬似乱数を用いたシミュレーションが求められる場合, RAND関数によって生成させ
た擬似乱数をJlJ
し、ることは有Jl
J
であるといえる.

参考文献
[
リG
c
α
叩n
川
礼
1
川
t
l
cJ
E
.Ram{
口
,
mλ
N勺
1
川
J
[
ロ
閃
勾
2
]JohnsO
l
口1NL
,Kot
ロ
zS,B,山 k
r
i
の
σ
r
吋i
s
油
l
山
hn
立
anN.C仰oF
川 月 附0川 U
ω
P
川σ
F
印r
バ
'
i
σ
al
e
D
i
.
白
s
l
川
ゴ
.
バ
r
ル
i
b
l
川
t
げ
l
i
わ
0月s
,陥 1人 S
cc
∞
O
叩n
dE
d
i
れ
t
l
ω
o
n
.NewY
o
r
k
:John
1
WilcyandS
o
n
s
;1
9
9
4
.
a
l
a
k
r
i
s
h
n
a
nN.Co川 川υω U
n
i
v
a
r
i
a
l
eD
i
s
l
r
i
b
l
l
l
i
o
n
s,陥 1
.
2,SccondE
d
i
t
i
o
n
.NewY
o
r
k
:Joh日
[
3
]JohnsonNL,KotzS,B
九
N
iJ
cya
ndS
o
n
s
;1
9
9
5
.

,KotzS
.Ul1i
m
r
i
a
l
eD
i
s
c
r
e
l
eD
i
s
l
r
i
b
l
l
l
i
o
n
んT
h
i
r
dE
c
l
i
t
i
o
n
.N巴w Y
o
r
k
:JohnWileya
n
c
lS
o
n
s
;
[
4
]JohnsonNL,KempA W
2
0
0
5
.

T
.U
n
i
v
a
r
i
a
t巴 D
i
s
t
r
i
b
l
l
t
i
o
nR
e
l
a
t
i
o
n
s
h
i
p
s
.TheAlIIe
r
i
c
a
l
1S
Iσl
i
s
l
i
c
i
a
n2008;6
2
:45‑53.
[
5
]LcemisLM,McQuestonJ
i
s
h
i
m
l
l
r
aT
.McrscnncT
w
i
s
t
c
r
: A 623‑DimensionallyE
q
u
i
c
l
i
s
t
r
i
b
l
l
t
α
J UnifonnPseudo‑Random
[
6
] MatsumotoM,N
e
rGenerato.
rACM7
i
"
ansac/i
o
n
sonModelingωu
iC
O
l
l
l
p
l
l
l
e
l
・S
i
l
l
l
l
l
l
a
l
i
ol1 1
9
9
8
;8
:3
‑
3
0
.
NlIl11b
[
7
]SAS1
n
s
t
i
t
l
l
t
e1
n
c
.SAS/IML(R)9
.
2[
九e
r.
¥
:GlIi
d
e,
Cary
,NC,USA:SAS1
n
s
t
i
t
l
l
t
e1
n
c
;2
0
0
8
.
Im
iR,HamadaC
.AnAdaptivcSl
Ib
p
o
p
l
l
l
a
t
i
o
nS
c
l
c
c
t
i
o
nDcsignUsingTimc‑to‑EvcntE
n
d
p
o
i
n
t
s
.Abslr
αc
l
s
f
o
r
[
8
]Uozl

I
h
eXXVllh1
1
1
1
e
r
n
a
l
i
ol1σ1Biol11e
l
r
i
cC
O
Iげ
の
で
円 ce,2
6
‑
3
1 Al
Ig
l
l
s
t,2012,Kobe,J
a
p
a
n
.I
n
t巴m
a
t
i
o
n
a
lB
i
o
m
e
t
r
i
cS
o
c
i
e
t
y
(
h
t
t
o
:
/
/
s
c
c
r
e
t
a
r
i
at
.n
c
.
I
o
/
i
b
c
2
01
2/orogrammc.htm1
)
.ISBN978‑0‑9821919‑2‑7.
[
9
] 魚住能史,水 j
宰純基,浜問先1久馬.生存 H
寺問解析における Lakatosの航例数設計?去の有用性の評価 .SAS ユ

ー ザ ー 総 会 論 文 集 2009;19‑28
+
J知久馬.SG(
S
t
a
t
i
s
t
i
c
a
1G
r
a
p
h
i
c
s
)P
r
o
c
e
d
u
r
e
s による Kaplan‑Mcicr プロットの作成 SASユ
[
1
0
] 魚住龍史,浜 I

ー ザ ー 総 会 論 文 集 2011,185‑199
[
1
1
] 魚住吉E史 , 浜 田 知 久 馬 . が ん 臨 床 試 験 に お け る i
隠滅縮小効果の検討に有用なグラフの作成
SGPLOTプロシジャの最新機能を活月]ー .SASユ ー ザ ー 総 会 論 文 集 2012,151‑165.
[
1
2
] 日 浪 洋 平 .SGプロシジャと GTLによるグラフの作成と ODSPDF による統合解析 l懐禁の作成 ~TQT 試
験における活 JTJ 事例 ~.SAS ユーザー総会論文集 2011 , 201-219

[
1
3
]:
r
可決洋平 .SASと HTMLアプリケーションによる CDISCADaM形式の解析用データセットを別し、た有害

阪支・グラフ簡易作成ツールの開発事例 .SASユ ー ザ ー 総 会 論 文 集 2012,185‑205.
事象の解析l

l
n
n孝夫.モンテカルロ法とシミュレーション.J:斉風館, 1995.
[
1
4
]t
9
9
2
.
[
1
5
] 点京大学教養学部統計学教室.内然科学の統計学.東京大学出版会, 1
[
1
6
] 伏見正則.乱数東京大学出版会, 1989

瓦 2003.
[
1
7
] 設谷千風彦.健三存続計ハンドブック.似合書j

連絡先
E‑mail:1
1
0
ご!
1
mi
i
a
)m
s
.k
a
e
u
.
1
1
I
s
.a
c
.i
v

333

328.

トミふーザ千絡会一一向ーァムムーーlD C o n t i n u a lreassessmentmethod における MCMCプロシジャの利用 加倉井靖之浜田知久馬 東京理科大学大学院工学研究科経営工学専攻 浜田研究室 C o n t i n u a lreassessment methodu s i n gPROCMCMC YasuyukiK a k u r a i,ChikumaHamada Departmento fManegementScience,Tokyo U n i v e r s i t yo fScience 1 1 s ユ ー ザ ー 総 会 一 … … 引 ン … ー 要旨: C o n t i n u a lreassessmentmethodに おいて,モテ、ルパラメータを更新する 際に利用される MCMCプロシジャの 使い方について紹介する キーワード MCMC,CRM,MCMCプロシジャ 335 mI

329.

ム ユ ー ザ ーJ合会… ロ ト & … ー ン ~g J 発表内容 ロ本発表の背景と目的 ロ MCMC プロシジャの適用 ロ収束判定 ロまとめ │ 鮎Sユ ー ザ ー 総 会 問 刊 … 抗がん剤の第 l相試験 ロ第 l相試験の目的のひとつは,最大耐量 ( M a x i m u mt o l e r a t e dd o s e ;MTD)の決定 . "i 耐えられる最大量が最大効果をもたらす」と仮定 》許容できない毒性 ( D o s el i m i t i n gt o x i c i t y ;D L T )を 指標として, MTDを調べる DLT発現確率 目標 D口発現確率 φ樋ーーーーーーーーーー司 (T : lr g e tt o x i c i t yp r o h a b i l i t y ) 1 2 3 3 6 五11D.•• 8 用量

330.

γ . 川 │ PAS .:l.‑‑tf‑尚一ユi i 戸内 川 川 D 明 I 2つの用量探索デザイン ロ R ule‑basedデザイン シ事前に定義したルールに基づき,用量割付け ‑ ;e . g .,3+3デザイン ロ M odel‑basedデザイン 統計モデルによる毒性確率の推定 ベイズ流の推測 〆毒性発現の事後確率に基づく用量割付け e . g .,C o n t i n u a lreassessmentmethod(CRM) y y Q ' Q u i g l e yJ,e ta l .[ 4 ] γ . 人 川 . ユザザプ総会均台.片手rWJユザ:勧吟 1 1 1 吃 三7 川 日 ミ‑日日三日三点三 三.. CRMの概要 ロ用量と DLT発現確率の関係をモデル化 モデルパラメータに事前分布を仮定 投与情報が得られる度にモデルパラメータを更新 用量反応モデル パラメータの事前分布 CRMのデザインパラメータ 1 モデルパラメータの事後分布を推定(用量反応モデルを更新) 2 各用量の DLT発現確率を計算 3 自標 DLT発現確率に最も近い用量を選択 最終的に選択された 用量を MTDとする 3 3 7

331.

I 1 1 1 十鈴均一一…ヤンザご日主 IRI 用量反応モデル ロ用量と DLT発現確率の関係をモデル化 ロモデルパラメータに事前分布を仮定 ロ8 . g .,パワーモデル,口ジスティックモデル P r (巧 =1 )= ψ (Xilα) N o t a t i o n 第 t 症例の D日発現の有無(有:円‑1, 無 円 =0 ) X i 第 t 症修J Iに割付けた用量水準 ψ(Xi'α) :1‑パラメータモデル α :モデルパラメータ n 日 ン … SAS .:L‑川パ川 ? S WP.5X' r . : ! ; l ユ ー ザ ー 蝕 対 宍 町 三 吋 守 1 mJ 事前分布 ロ想定する分布は怒意的 p ガンマ分布,一様分布,指数分布など ロ既存の知見から事前分布を設定することもある が,多くの場合は無情報事前分布を利用 ChevertS .(1993) ロ無情報事前分布 事前情報が十分にない場合に利用 確率密度関数がフラットになるようにパラメータを 設定 338

332.
[beta]
司
会
長
守
二
信
長
:
一
一

‑
t
‑
ム

2013

.
I
o
:
:
;
‑
&
.
V
'
):L‑
'
s
:
'
‑

事後分布の推定
ロ事前分布と DLT発現確率に関する尤度関数
L(
い)二日

ω a)問 一 ψ(九 州
(
X
i
J

‑Yi)

N
o
t
a
t
i
o
n
Qη = {
(
X
i
'Y
;
)
}:
n例の被験者の用量水準と D口発現確率に関するデータ

:
f
2n が与えられたもとでの αにかかる尤度関数

L
(f
2n;α)

ロパラメータ αの事後分布
1
1 )g(α
)
L(

=fL(11n)g(α)dα

g(α
I1
1
n
)

n

N
o
t
a
t
i
o
n

g(
α
lf
2n) :f
2n が与えられたもとでの αの事後分布
g(α
) αの事前分布
ー

1
u

SAS.::L-~-.*
主三川
013
..
ユザヶ総会‑竹内
ツr
m
e
"点 主 2
初
用量選択
ロ次の症例に割付ける用量
片各用量水準における DLT発現確率先l を推定

か ψ
(削 )

l
a
2

智!レパラメータ αの事後平均

j

目標 DLT発現確率ゅに最も近い用量水準を選択
Xη+1 ニ

a
r
gm
i
n
̲
1町
jE(
j=l,
.
.
.
,k
)

φ
│

ロ MTDの決定方法
片試験終了後,全被験者の投与情報を用いて選択さ
れた用量水準を MTDとして選択

339

333.

初1] I │ γ ωユーザー総会対告がんか&ソ…… MCMCプロシジャのステートメント Hu rl n p r o cmcmcd a t a =くデータセット名〉くオプション>; p a r m sくモテ、ルパラメータの初期値>; p r i o rくモテ、ルパラメータの事前分布>; m o d e lく尤度関数>; ロ p a r mステートメント:く 1¥ラメータ名 初期値〉 ロ p r i o rステートメント:く 1¥ラメータ名 事前分布〉 ロ m o d e lステートメント:くデータ変数名 尤度関数〉 I l ωユーザー総会加問 P I I I l Jロ … … 均 ン procmcmcステートメントのオプション ロ頻用されるオプション オプション名 説明 デフォルト o u t p o s t 生成したサンプルを格納するデータセットを指定 nπlC 生成するサンプル数 1000 n b i B u r n ‑ i n数 1000 t h i n 生成したサンプルからの間引き間隔 n t u 各チュー二ング期間における反復回数 seed 生成する乱数のシード 340 500

334.
[beta]
│榔ユーザー総会
a
.f
7'b'Fa7!T'J1r
:l ~&')IJ::J.-".ñt:" ~~;:.,
e
W
?MEfリーゅ

t
a
]
I

町 三

投与情報のデータセット
ロ各被験者に割付けた用量水準と DLT発現の
有無の関するデータ
dataTREAT:
i
n
p
u
tIDDOSEY @@;
c
a
r
d
s
;/
本 20症 例 分 の デ ー タ を 用 意 本 /
110210320431
530 630 741841

rE

n
H

・

Hu

m
1
1I

|鮎sユーザー飴加問Ir:l~&' ……

MCMCプロシジャによる事後分布の推定
p
r
o
cmcmcdata=TREAToutpost=MCMCOUT
h
i
n二 5
;
seed=6789n
b
i
=
1000nmcニ 10000t
parma
l
p
h
a1
;
0
)
;
p
r
i
o
ra
l
p
h
a
‑
u
n
i
f
o
r
m
(
0
.
1,1
model=exp(‑3+DOSEa
l
p
h
a
)
/
(
1+exp(‑3+DOSEa
l
p
h
a
)
)
;
安

安

modely
‑
b
i
n
a
r
y
(
m
o
d
e
l
)
;
odso
u
t
p
u
tPostSummaries=OUT;
r
u
n

341

335.

I~ュ付ー蝕口九ggg … g MCMCプロシジャのアウトプット ロoutpost=MCMCOUTでイ午成されるデータセット ~ n m c = 1 0 0 0 0,t h i n = 5としたので, 2 0 0 0個の サンプリングデータ 1 0 9 8 1 109日 日 1 0 9 9 1 10996 15066 15066 17474 19838 ‑3027日 ‑27177 ー2日1 0 6 ‑145471 1 5 . 9 0 3 6 15. 2976 175749 186212 1日1082 30025 30025 31600 32979 ‑145日59 145859 145521 149263 一175日 日5 日5 175日 177122 一182241 mm │ ふsユザー総会加……一泊ンー MCMCプロシジャのアウトプット ロo d so u t p u tP o s t S u m m a r i e s = O U T ;で、作成され るデータセット N Mean 2000 16498 03468 1. 4082 16074 18585 ロモデ、ルパラメータの事後平均は, DLT発 現 確 率を推定する際に利用 a ) 食j ‑ψ ( d j, 3 4 2

336.

I a 符 s ユ プ ずγ 捨 会 均 一 ? 拘 一 ゲ た… a 1 ヰ { ヤ ? 伽 仲 ン ♂川‑ 川 川 川 引 川 主 ; ♂ : ♂ i 手川之弓川川川ι : 壬 川 川 : 冷 MCMCの収束 .定常性への収束 MCMCを用いて,興味のある未知パラメータ θの 事後分布からのモンテカルロ標本を得たいが・.. 命 母 ‑ ‑ ̲ . . . . . . . . . . . . ̲ ‑ ⑪ ̲‑(g(r+ll B u r n ‑ i n=今使用しない (初期値の影響を受けている) 実際に用いる標本 これだけで¥事後分布に収束しているのか? I … ‑ 十 MCMCの収束判定 ロデフォルトで以下を計算 y Geweket e s t > ‑Sampleautocorrelations yE f f e c t i v esamples i z e s > ‑MonteCarloerrors ロその他の判定法 ‑ >HeidelbergerandWelchdiagnostic y MonteCarlostandarde r r o r > ‑RafteryandLewisdiagnostic など 343 a

337.

mm I r.:I:Jユーザー倣加加……ン… MCMCの収束判定 ロGeweket e 5 t 0 . . . . . . . . . . 0 イのの ‑ jのの 」ー~ 実際に用いる標本を 2つに分割し 前半の平均と後半の平均が等しし、かどうかを評価 一←内会 W~ム…一 ~g MCMCの収束判定 ロ連鎖のプロットによる診断 D・t'fOs t ! e sf o r b t t a T O s : j i t j j j h i ι ,. ,. N t i JCO) K O : I : 。 柏 l O l ) 崎 ‑ G i J 日飽 き民 9 峨鴻 ) : 1 1 1 1刷 収束例 非収束例 生成されたマルコフ連鎖をフロットし,視覚的に 逸脱や非定常的な挙動をしていなし、かを確認 3 4 4 r ,

338.

1 1 飢ねプザ?総会問問 川 マ ; 三 ♂ ! 川 勺 タ . 4 . . ' 2 1 非収束時の対応 ロ nmc,n b iを変更 h i nを変更 ロt F 標本の自己相聞を減らす ロ n t uを増やす ロパラメータの初期値を変更 ロオプション propcov=を利用 , ̲ M arkovc h a i nを適切なスタート値から開始 1 1 1 ユ ー ザ ー 総 会 一 そ ん 2 0 1 3 I MCMCの収束 .収束の保証 MCMCを実施するにあたり, i この基準にこのよう にあてはめれば,十分信頼性のある値が生成され る」ことを無条件に保証することはとても困難 ‑シミュレーション実験でおおよその傾向を把握 ・実用にあたっては,時間が許すまで設定を変えて 何回か MCMCを実行 345

339.

" ' 9 川ゃーザー倣均売… まとめ 口 ンセ湘ン m CRMにおける MCMCフロシジャの使い方, 及び頻用されるオフションについて紹介 . , CRMの概要 戸 MCMCプロシジャの適用例 戸収束判定について │ 鉱Sユ ー ザ ー 倣 加 … … 一 … ~g 参考文献 CheveretS .Thec o n t i n u a lreassessmentmethodi ncancerphaseIc l i n i c a l t r i a l s :as i m u l a t i o ns t u d y .S t a t i s t i c si nMedicine1 9 9 3 ;1 2 :1093‑110 8 . O'QuigleyJ,PepeM,F i s h e rL .C o n t i n u a lreassessmentmethod:ap r a c t i c a l designf o rphaseIc l i n i c a lt r i a l si nc a n c e r .B i o m e t r i c s1 9 9 0 ;46:33‑48 SASI n s t i t u t eI n c . ( 2 0 1 1 ) .SAS/STAT(R)9 . 3U s e r ' sGuideTheMCMC ,NC:SASI n s t i t u t eI n c Procedure.Cary 346

340.

‑ a f A . . . 綿ユーザ ー 総 会前向… SAS . : t . ‑ ‑ 1 f S 7-hT1ii.71'fJ)11l~&.')1 MCMCプロシジャによる非独立データの解析 0矢田真城 1・浜田知久馬 2 1 株式会社 ACRONETデータサイエンス本部生物統計部 2東京理科大学工学部経営工学科 A n a l y s i so fd e p e n d e n td a t a u s i n gPROCMCMC S h i n j oYada1・andChikumaHamada2 1B i o s t a t i s t i c sDepartment,ACRONETC o r p o r a t i o n 2D epartmento fManagementScience,TokyoU n i v e r s i t yo fScience I~ユーザー総会問問…… m t Jg 要旨: 測定値が互いに独立ではないデータに対して, SASでMCMC( M a r k o vc h a i nM o n t eC a r l o m e t h o d s )を実施する方法の 1 っとして, MCMC プロシジャの J OINTMODELについて紹介する. キーワード MCMC,非独立データ, MCMCプロシジャ,オプション JOINTMODEL 347

341.

一 一 一 … … 一 発表内容 m m ‑本発表の背景と目的 • MCMCプロシジャによる解析 ‑適用例の紹介 ‑まとめ [ 凱Sユーザー総会加問…リ日ンセ如ン g P M l C o n t i n u a lReassessmentMethod(CRM) モデルの 更新 観察結果が得られる度に モデルを逐次的に更新し 次用量を決定 次患者集団の 用量を決定 348 用量選択基準 の適用 試験 中止 ※患者集団=コホート

342.

I I 二β J = 川 町 │ sA 崎 s ユザ‑噌総会会ぷア鳩お吟号拘J & ω Y γ … 凋 山 勾 や i I 子 . 主 ‑ 子 干 r D別 i H 釦 1 : ド ミ r 山 : 叩 目I 三 1 守 冷三 I 守マ守!ヲ 吟 白 砂 … ト 内 ト 三 一 . 一 片 有効性と毒性を指標とした CRM .有効性と毒性の同時評価 ‑想定したデータに対応するモデルの設定と, 設定したモデルに基つく用量選択基準の構築 .有効性,毒性いずれも2値データを想定 ‑シミュレーションによる検討 ・マルコフ連鎖モンテカルロ法 ( MCMC)による推定 ・SASV 9 . 3のMCMCプロシジャを使用 l 反応1 1 総 会I 与ルムヰー g 有効性と毒性を指標とした CRM .有効性,毒性いずれも 2値データ YE:有効性発現を 1 ,非発現を 0とする確率変数 YT:毒性発現を 1 ,非発現を 0とする確率変数 。:モデルに関するパラメータベクトル (以下「モデルパラメータ」と表記) x:投与量として, πT(x, 9 ) :毒性発現確率, η ( x, 9 ) :有効性発現確率 349

343.

I l 郎ユーザー総会対宍…ト[:YjI~:;ω WlJ 有効性と毒性を指標とした CRM .有効性と毒性の同時確率分布 PrσEニ α, ち =b)二 九 y{πT}b{ 1 πEr汁 ‑ πT} l ‑ b ‑ r{1‑π ‑ r ‑1}/ +(‑1)ωπEπT{1π E a T b l { eV l { eV +1 } 有効性発現をα=1,非発現を α=0 毒性発現を b= 1,非発現を b=O 有効性と毒性の関連性パラメータ V πE二 πE (χ 9 ), πr‑πr(χ 9 ) ラ ラ │ ωユ ー ザ ー 総 会 加 問 ロ ト 叫 叩 … 201I 有効性と毒性を指標とした CRM .用量反応モデル 毒性発現確率 : 2パラメータロジスティックモデル ・ 有効性発現確率 :3/¥ラメータロジスティックモ子、 jレ .パラメータの更新 .事前分布として,互いに独立に正規分布を仮定し ベイズの定理を用いて逐次的に更新 .更新されたモテ、ルにより次患者への用量を選択 350

344.
[beta]
I
!
!
ユーザーおわらん. ι 2 0 1 3
有効性と毒性を指標とした CRM
.有用性による用量選択
三三

f寺

10
.
8

̲
.
‑
ゅ

4 ̲

‑
" -~

発0
.
6
現
確 0.
4

‑
,
,
)
‑‑‑
̲
‑
ー
一

・有効性と毒性のバランス
(有用性)を等高線として定義
‑点 (
10
)からの離れ具合を有用性と
定義し,有用性を 高さ と見なして
等高線を描く

率0
.
2

。

‑許容可能な用量レベルのうち,
o 0.2 0.4 0.6 0.8 1 有用性が最も高い用量レベルを,
有効性発現確率
次投与量として選択

4つの用量レベルを 1
.
2
.
34と表示

;
.
ユ
ザ
岳
会
?
今
一
…
モ
?
セ
ツι D
有効性と毒性を指標とした CRM
.中止基準
・有効性が低すぎる

p
r
{
πE(X
舟)
<πcE}>PE
πcE: 闇値有効性発現確率 • P
E
:カットオフ値

.毒性が高すぎる

P市T(x,
9
)<J[c
T
}>PT
πcT: 許容毒性発現確率 • P
T
:カットオフ値

3
5
1

345.

│ ふ ミ ユ ー ザ ー 飴 … 。 吟 … ー ム :十I RJg シミュレーションによる評価 MCMCプロシジャによりパラメータ推定しモデル更新 モデルの 更新 予め規定した条件に 到達するまで反復 終了 次コホートの 用量を決定 SAS . : : L . ‑ " ' 1 ‑M 鉱 Sユ ー ザ ー 総 会一:伊川 均一… γmm MCMCプロシジャのステートメント procmcmcdata=<データセット名〉くオプション〉; parmくモデルパラメータの初期値〉; pnorくモデルパラメータの事前分布〉; Hu rl n modelく尤度関数〉・ • parmステートメント・・ベパラメータ名 初期値〉と指定 •p r i o r ステートメント・.く .1 ¥ラメータ名 事前分布〉と指定 • modelステートメン卜・・・〈データ変数名 尤度関数〉と指定 3 5 2

346.
[beta]
ι.
T
:
総会刊仇…引…
.
:
:
:
t
.
‑
二G

SAS

2
0
1
3
0
1
.

l
V
1CMCプロシジャによる解析

ト
‑

.有効性と毒性を指標としたCRM
1症伊JI1
オフ、サゃベーションとしてデータセットを作成
dataI
N
;
i
n
p
u
tPATIDCohortNoYEYTdoselevel@@;
c
a
r
d
s
;/
本 36症例分のデータを用意本/
110012100131001
421125200262002

r
u
n
;

I
*加 … 片I
川ペケ
制ユザ‑
ー8
倣
山
"
!
:
F

m

7"
b
'
n
1
.
7/'i:'J./r:J<川

l
V
1CMCプロシジャによる解析
.有効性と毒性を指標としたCRM
p
r
o
cmcmcdata=INoutpost=OUTseed=9641
n
b
i
=
1000nmc=10000n
t
h
i
n
=
10
;
parmbetaEO0
;parmbetaE10;"';parmp
h
i0
;
sdニ3
.
0
3
9
2
)
;
p
r
i
o
rbetaEO‑n(mean=‑4.0719,
sdニ3
.
0
2
6
6
)
;
p
r
i
o
rbetaE1‑n(mean=0
.
9
3
5
1,
s
d
=
1
)
;
p
r
i
o
rphi‑n(mean=0,

modei??;
r
u
n
;

353

g

347.

鮎 Sヰ プザー総会均…九一 l V lCMCプロシジャによる解析 .なにが問題なの? 有効性の有無と毒性の 1I 1 有効性の有無と毒性の + 1有無には関連がある 有無とを問時に評価 1 I 1 1 観測データの分布がよく知られた分布にならず, よって尤度関数を指定できない. S~ユーザー総会的r7ß!Zjロ…一… 2 0 1 I 問題解決のためのアプローチ • SAS/STATU s e r ' sGuideでキーワード検索 JOINTMODEL JOINTLL lK E e f a u l t, s p e c i f i e showt h el i k e l i h o o df u n c t i o ni sc a l c u l a t e d .Byd PROCMCMCassumest h a tt h eo b s e r v a t i o n si nt h edatas e ta r e independentsot h a tt h ej o i n tl o g ‑ l i k e l i h o o df u n c t i o ni st h esumo f t h ei n d i v i d u a ll o g ‑ l i k e l i h o o df u n c t i o n sf o rt h eo b s e r v a t i o n s,where t h ei n d i v i d u a ll o g ‑ l i k e l i h o o df u n c t i o ni ss p e c i f i e di nt h eMODEL . tWhenyourdataarenotindependent youcan statemen specifytheJOINTMODELoptiontomodifythewaythat PROCMCMCcomputesthej o i n tlog‑Iikelihoodfunction. 3 5 4

348.
[beta]
ミ
デ

γ

三三日川でバトミタ←‑ 三川三三千

ユーザー~総会アカヂ……ソリ刊行勾

γ
‑
‑
川子

「

I
I
I
I
H
!
D
]

問題解決のためのアプローチ
• SAS/STATU
s
e
r
'
sGuideで、キーワード検索
ModelingJ
o
i
n
tL
ikelihood
TheJOINTMOOELo
p
t
i
o
ni
n
d
i
c
a
t
e
s・ ・
.G
ivent
h
i
so
p
t
i
o
n,
t
h
eprocedurenol
o
n
g
e
rs
t
e
p
st
h
r
o
u
g
ht
h
ei
n
p
u
td
a
t
ad
u
r
i
n
g
.
, youstorethedataseti
na
r
r
a
y
sanduse
t
h
es
i
m
u
l
a
t
i
o
n
..
a
r
r
a
y
si
n
s
t
e
a
do
fd
a
t
as
e
tv
a
r
i
a
b
l
e
st
oc
a
l
c
u
l
a
t
et
h
el
o
g
l
i
k
e
l
i
h
o
o
d
.
g

TheARRAYs
t
a
t
e
m
e
n
ta
l
l
o
c
a
t
e
satemporarya
r
r
a
y(
d
a
t
a
)
.
・
.
, youusea00l
o
o
pt
oc
o
n
s
t
r
u
c
tt
h
ej
o
i
n
tl
o
gl
i
k
e
l
i
h
o
o
d
.

u
n
c
t
i
o
nnowt
a
k
e
st
h
e
Thee
x
p
r
e
s
s
i
o
n1
1i
nt
h
eGENERALf
v
a
l
u
eo
ft
h
ej
o
i
n
tl
o
gl
i
k
e
l
i
h
o
o
df
o
ra
l
ld
a
t
a
.

│
川川一以‑町一:己
;~ユーザーf総会内合アグ?ゲ日判ユーシ山ツ~:-

2
0
1
3
2
0
1
u

l
¥
I
1CMCプロシジャによる解析
l
o
g
f
(
yI
e
)手
工
仙 logf(y山 Ie)のとき
procmcmcdata=<データセット名>JOINTMOOEL;

ARRAYく配列名>;"@è~ljl こデータを格納;
parm<モデルパラメータの初期値〉;
p
r
i
o
r<モテ、ルパラメータの事前分布>;

do;問時対数尤度を記述;e
n
d
:
modelGENERAL(問時対数尤度の変数名);
r
u
n
;

355

349.

|鮎Sユザー総会加問Jロト[:YjJ~ン… I P I i l J l ¥ J 1CMC プロシジャによる解析 .オプション J OINTMODEL 1)用意した配列にデータを読み込ませる 2 )配列に格納されたデータを用い,プロシジャの中で 同時対数尤度を具体的に記述する ことで,マルコフ連鎖サンプリングを実行 尤度関数が SASでまだ完備されていないときに, このオプションを適用すれば, MCMCプロシジャで、 マルコフ連鎖サンフリングの実行が可能に ユマザー総会出向…均ン… SAS 鮎 S.::L‑ l ¥ J 1CMC プロシジャによる解析 .有効性と毒性を指標とした CRM 1)用意した配列にデータを読み込ませる a r r a yY̲T [ 1 ] / n o s y m b o l s ; a r r a yY̲E[1]/nosymbols; a r r a yd ̲ x [ 1 ] / n o s y m b o l s ; a r r a yp a i E [ 3 6 ];a r r a yp a i T [ 3 6 ]; a r r a yI p [ 3 6 ] ; b e g i n c n s t ; r c= r e a d ̲ a r r a y ( I I N ",Y一 巳" Y E " ) ; r e a d ̲ a r r a y ( I I N ",Y̲T,"Y T " ) ; r c= r c=r e a d ̲ a r r a y ( I I N ",dx," x " ) ; e n d c n s t ; 356 I

350.

1 s ιザ4 5 4 戸川九ソ三 2 0 1 3 I l V 1CMCプロシジャによる解析 .有効性と毒性を指標とした CRM 2 )配列に格納されたデータを用い,プロシジャの中で 同時対数尤度を具体的に記述する 1 1= 0 doi こ 1t o3 6 ; p a i T [ i ]ニ logistic(betaTO+betaT1* d x [ i ] ) ; 0 g i s t i c ( b e t a E O +…); ) p a i E [ i ]=1 I p [ i ]=l o g( p a i E [ i ] * * Y ̲ E [ i ] ) * . . . ) ; 1= 1 1+I p [ i ] ; end: modelg e n e r a l ( I I ) ; 三 │ 勺日午 〓 ‑ 日 三 F~ユーザプ総会ア腕初…Iiiー~!I i!';I~!I Y η :203 I 適用例:シミュレーション実験 .目的 有効性と毒性を指標とした CRMに対する評価 .評価指標 .各用量の選択率(%) 当該用量を選択した回数 シミュレ‑ション回数 ‑平均被験者数 357 x1 00 正 1

351.

ペm m I ふS ユ ー ザ ー 給 対 需 … 一 一1 1 シヨン仇ン 適用例:シミュレーション実験 ‑設定条件 • 4つの用量レベル,最小用量レベルから試験開始 こ1 段階ずつ .増量は常 l .闘値有効性発現確率 : 0 . 2 0 許容毒性発現確率:0. 40 .発現確率のカットオフ値 : 0 . 9 0 .最大症例数 : 3 6,コホ‑トサイズ : 3 .条件ごとに 1 000回のシミュレーション I I ユーザー敵対持… 適用例:シミュレーション実験 .シナリオ ・NO.1:用量レベル 1が最適 . NO.2:用量レベル2が最適 l l 06 206 確 0. 4 確 0. 4 2 手 0 . 2 之 手 0 . 2 。o J 3 性 0 . 8 . 1 e 性 0.8 A叶 五三 f号 ' ︑ 五三 f号 。 0 . 2 0. 4 0 . 6 0 . 8 1 0 0 . 2 0. 4 0 . 6 0 . 8 有効性発現確率 有効性発現確率 4つの用量レベルを 1 . 2 . 3.4と表示 358 1

352.

作 三 三 i三 ¥ 勺 小 ツ 三 ・ 川小川!ソ U. ユ ー ザ ー 総 会.. 竹内一一… γ 三 1 1 ' 1 : ' 1 1 u 適用例:シミュレーション実験 .シナリオ • NO.3:用量レベル 3が最適 王号 発一 現一 確 0. 4 f号 4 ・ 性 0 . 8 No.4:用量レベル4が最適 • 性 0 . 8 E 発一 現… " ' 一 伽 樹 齢 ー一一一一一「ア 率 0 . 2 。 。。 j ; ; ク〆:ジ; 半$ 0 . 2 0 . 4 0 . 6 0 . 8 O ' : j I,,~21/ fJ 1 有効性発現確率 有効性発現確率 4つの用量レベルを 1 . 2 . 3,4と表示 一 川 l 1 l i mm m ι i i i ユ ー ザー総会対ん…一… ‑ m て子 何 ? い 川 町 日 適用例:シミュレーション実験 .シミュレーション結果 シナリオ N o . 用量レベル Lv1 Lv2 9 . 9 71.8 1 選択率(%) 4 7.6 平均被験者数 24. 2 選択率(%) 平均被験者数 3 選択率(%) 平均被験者数 4 選択率(%) 平均被験者数 33.7 62.5 15.3 16.6 Lv3 Lv4 None 7 . 0 1 . 2 0 . 1 2 . 0 0 . 5 1 . 8 0 . 2 0 . 3 1 . 8 0 . 6 2.5 2.3 0 . 6 12.0 85.0 4 . 9 21. 3 . 5 6 2. 4 3. 4 0 . 0 35.6 61.5 3 . 5 1 1 . 2 18.3 0 . 0 3 . 5 359

353.

│側主‑ーザー総会一戸内……… 201g まとめ MCMCプロシジャのオプション JOINTMODELを 用い,測定値が互いに独立でないデータを解析 • MCMCプロシジャにおける標準仕様 ‑オプション JOINTMODELの適用場面 .シミュレーション実験への適用 ωユーザー総会加…… 主要参考文献 [ 1 ] C.P 口パート G .カセーラ著,石田基広・石田和枝訳 ( 2 0 1 2 ) . Rによるモンテ カル口法入門.丸善出版. [ 2 ] 中妻照雄 ( 2 0 0 7 ) .入門ベイズ統計学.朝倉書庖ー [ 3 ] SASI n s t i t u t eI n c . ( 2 0 1 1 ) .SAS/STAT(R)9 . 3U s e r ' sGuideTheMCMC Procedure.Cary ,NC:SASI n s t i t u t eI n c . ,, , . F . andCook J. D .( 2 0 0 4 ) .D o s e ‑ f i n d i n gbasedone f f i c a c y ‑ t o x i c i t y [ 4 ]T h a l lP t r a d e ‑ o 汗s .B i o m e t r i c s60,6 8 4 ‑ 6 9 3 . ,, , , , .F . Cook J . D . andEstey E . H .( 2 0 0 6 ) .Adaptivedoses e l e c t i o n [ 5 ]T h a l lP u s i n ge f f i c a c y ‑ t o x i c i t yt r a d e ‑ o f f s :I I l u s t r a t i o n sandp r a c t i c a lc o n s i d e r a t i o n J o u r n a lo fBiopharmaceuticalS t a t i s t i c s16,623‑638 360

354.

SASによる例数設計のシミュレーション 土居正明 東レ株式会社医薬開発推進室 SampleS i z eS i m l l l a t i o nbySAS MasaakiDoi TorayI n d l l s t r i e s, I n c .C l i n i c a lDataS c i e n c eDepartment 要旨 特に第 ll/I I I相の臨床試験において統計的根拠のある必要症例数を算出することは、試験の成功確率 や誤った判断をする確率を適切に管理するために極めて重要である。現在、主に用いられている方法に は、①理論式から手計算する方法、②専用ソフトや SASの専用プロシジャ等を用いる方法、③モンテカ ルロ・シミュレーションを用いる方法、の 3種類がある。本稿では、各方法の利点・欠点を整理した上 i )D l In nett で、シミュレーションを用いる方法について具体例を挙げながら解説する。具体例としては、 ( の方法による対照群と複数群の比較、 ( ii )欠測データが存在する経時測定データに対する線形(混合) モデ、ルを用いた 2群比較、を扱う。 In n e t tの方法、経時測定デー夕、欠測、 MMRM キーワード:例数設計、シミュレーション、 Dl 1.はじめに 例数設計とは、臨床試験の計画I!寺に対象とする症例数を決定することである。本稿では、統計手法を用い た例数設計の大まかな整理をした後、シミュレーションを m し、た方法に対して、用いるべき状況、利点・欠 点等について述べた後、具体例を解説する。なお、以下本稿では「例数設計 J という言葉で、統計手法を用 いた例数設討を示すものとする。 2 . 例数設計とは 例数設計にまず必要となるのが αエラー、 βエラーである。大まかな定義を表 iに示す。 表 l αエラーと βエラーの大まかな定義 真実の 1平間差 I 平間差なし 検定の 有意差なし 結果 有意差あり i 洋間差あり βエラー αエフー 統計手法を用いた例数設青│とは、試験の計画段階で αエラーと βエラーの大きさを設定し、主要評価項目に 361

355.

対する検定で設定どおりの値を実現するのに必要な症例数を計算することである。以下、 αエラーの起こる 確率を α、 βエラーの起こる確率を βとおく。また、実際に群問差があるときに、正しく有意差ありとなる 確率 1 (β )を検出力と呼ぶ。 例数設計の際、特に注意しなければならない点は「厳密な必要症例数の計算には『知りたいもの』の真の 2で等し 値が必要」ということである。たとえば 2 群の平均の比較を考える。簡単のため、両群の分散が σ く、既知である場合の z検定の例数設計を考える。両群の従う分布を正規分布とし、データは全て独立とす ると、有意水準 α、検出力 ( 1 β )の片側検定に必要な l群あたりの例数 N は N‑2σ2( Z α +Zp)2 ‑ / 1 L で与えられる。ここで、 • Za, Zp 標準正規分布の下側 ( 100.α)%点、(100.β)%点 ./ 1 :群問差の真の値 である。つまり、例数設計の計算に「群間差の真の値」が必要なのである。しかし、そもそも群問差の大き さが知りたし、からこそ試験を行うので、これは本質的に無理な要求である。そこで、現実的には「真の値の J や「希望する値(最低限この程度は効し、てくれなけ 入るべき場所」に「推定値(過去の試験や類薬の情報 ) れば薬にならない、という値など)J を用いる。このとき、上式で得られた例数は「代入した企の値が真の群 間差であった場合に、設定した検出力が得られる例数」となる。そのため、企に代入した値が真の値とずれ ていた場合、上式で求めた例数では、設定した検出力が得られないこともある。また、データの分布が想定 したものと異なる場合も、同様に設定した検出力が得られないことがありうる。そのため、例数設計は l回 計算して終わり、ということにはならず、いくつかの状況を検討した結果を総合して決定することが多い。 以下、例数設計の方法を整理する。統計的な方法による例数設計は大まかに以下のように分類できる。 1 . 数式による方法 (ア)手計算による方法 O¥ VE Rプロシジャ・ G U I P O¥ VE Rプロシジャによる方法 (イ)例数設計専門の統計ソフトや P 2 . シミュレーションによる方法 3 . 数式による方法 数式による方法の利点・欠点は以下の通りである。 (ア)手計算による方法 検定統計量の理論式と棄却限界を導出し、数式から例数を導き出す方法である。 [利点]理論を理解した上で計算するため、分布の仮定等を理解して使用できる。 [欠点]理論の理解ができていなければ使えない。また、計算ミスの可能性がある。 O W E Rプロシジャ・ G L M P O¥ VE Rプロシジャによる方法 (イ)例数設計専門の統計ソフトや P [利点]比較的よく用いる状況での基本的な例数設計は行える。 必ずしも理論式を完全に理解していなくても使用可能。 362

356.

[欠点]ソフト・プロシジャが扱っていない検定には全く対応できない.従って、データの分布 が複雑な場合などには対応できないことが多い。 解析方法と例数設計の前提・数値計算方法など、細かい設定が異なる可能性がある。 4 . シミュレーションによる例数設計 次に、本稿の主題であるシミュレーションによる例数設計を考える。 4 .1.シミュレーションによる例数設計の手順 シミュレーションによる例数設計の手順は以下の通りである。 1 . αエラー、 βエラー、全群のデータの分布を設定し、例数を lつ指定する。 2 . 1.の分布に従うデータを発生させ、プロシジャ(またはテ ータステップ)を用いて、データ解 析時と同じ方法で解析を行い、有意差の有無を調べる。 3 . 2 .を繰り返し、検出力=有意差がついた回数/繰り返し回数を求める。 4 . 1.で指定した例数を変え、 2 .と 3 .を繰り返し、検出力が 1 00(1‑β)%に(ほぼ) 致する例数 を求める。 4 . 2 . シミュレーションによる例数設計の利点・欠点 シミュレーションによる例数設計の利点・欠点としては、以下のものが挙げられる。 [利点] 1 . 何をやっているのかが分かりやすい。 2 . 1 9 [ J数設計の際に実際の解析と同じ方法で計算をしているため、プロシジャの細かい指定等も解 析時と全く同じ設定で行える。 3 . 統計解析手法の理論に精通していなくても実行可能。 4 . データの設定(分布の仮定・欠測の仕方等)を柔軟に設定できる。 5 . (複数の検定を行う場合)様々な検出力を同 H 寺に検討できる。 6 . αエラーの大きさも容易に検討できる。 [欠点] l 計算 H 寺問が長くかかることが多い。 2 . 理論の理解がおろそかになりがちになる。 3 . プログラムミスの可能性がある。 4 . 3 . シミュレーションによる例数設計が役に立つ状況 以上の利点・欠点を踏まえた上で、シミュレーションによる例数設計はどういうときに有益ヵ、を考える。 [シミュレーションによる例数設計が特に有益ではない状況] データの分布が大体分かっている。 データに欠測・外れ値はほとんどないことが想定される。 よく用いられる簡単な検定を用いる。 例数が十分多く、漸近論による近似が卜分に成り立つことが想定される。 363

357.

[シミュレーションによる例数設計が有益な状況] データの分布がよく分からない。 データに欠測・外れ値が比較的多く発生することが想定される。 比較的複雑な解析方法を用いる。 漸近論による近似精度が卜分によくない程度の例数になる可能性がある。 5 .シミュレーションによる例数設計の具体例 以下、 2つの具体例を用いて、実際のシミュレーションによる例数設計を考える。 例1. D u n n e t tの方法を用いた多重比較の例数設計 プラセボ群、低用量群,高用量群の計 3群を設定し、プラセボ群と低用量群の比較、プラセボ群と高用量 群の比較、を行う試験をそれぞれ考える。応答変数は連続値で、値が大きい程有効性が高いとし、検定の多 重性は D u n n e t tの方法で調整することとして、例数設計を行う。 Family‑WiseE r r o rR a t e (試験全体の α エラー の発生確率)を片側 2.5%とする。つまり、実薬群の平均の推定値がプラセボ群より大きく、多重性を調整し た両側 p値が 0 . 0 5より小さい場合を「有意差あり」とする。また、検出力は 80%とする。データの従う分布 として、以下の 4つのシナリオを考える。 シナリオ l プラセボ群 N(0, 1 )、低用量群: N(O幻)、高用量群: N(O刈) シナリオ 2 プラセボ群 N(0, 1 )、低用量群: N(0.3, 1 )、高用量群: N(0, 4 .1 ) (平均構造の変化) シナリオ 3 プラセボ群: N (0, 1 )、低用量群 N ( 0 . 3, 1 . 12)、高用量群 N(0. 4 , 1 . 22) (実薬の用量が増えるにしたがってばらつきが増える) シナリオ 4 プラセボ群: N (0, 1 )、低用量群: 1 ( 1 1 ) +0 . 3、高用量群・ 1 ( 6 ) +0. 4 (外れ値のあるデータ。 1 ( 1 1) の標準偏差は約1.1 ,市)の標準偏差は約1.2) 平均値 0 . 5 平均値 0 . 5 • 0. 4 < 0 . 4 。, . 3 • 0 . 2 0 . 1 0 . 1 0 . 0 , . ' 0 . 3 0 . 2 • ‑ ‑ J / ・ ブラセポ群 低用最群 0 . 0 高用量群 図1.シナリオ lの平均構造 プラセボ群 一 一 . 一 一 低用量群 高用量群 図 2. シナリオ 2~4 の平均構造 ここで、検出力について考える。複数用量で試験を行うのは、どの用量で、有意差がつくか、という見通し が卜分でなし、からである。また、高用量群では有害事象の発現割合も大きくなることが想定されることから、 有効ならば低用量での使用が妥当なことも多い。そのため、 最も有効性の高い群に有意差をつけたい 364

358.

ことに加えて プラセボ群より十分に有効性が高い群全てに有意差をつけたい と考えるのが通常である。また、 各群でどの程度有意差がつきやすし、か知っておきたい と考えるのも自然である。そこで、検出力として、 P o w e r ) 少なくとも l群で有意差がつく縦率 ( 各群でそれぞれ有意差がつく確率 (PowerL:低用量群, PowerH 高用量群) 2群とも有意差がつく確率 (Powcr̲b o t h ) を区別し、各検出力を計算する。ただし、最も重要視する検出力は「少なくとも I 群で、有意差がつく他率 (Power)J とする。シミュレーション回数を 10 , 000 固とした場合の結果を以下の表 2~5 に示す。なお、以下 1t 手あたりの例数を N とする。また、表中の下線部分は、 Powerが 80%に最も近い場合である。 表 2 シミュレーション結果(シナリオ 1 ) 表3 . シミュレーション結果(シナリオ 2 ) Power Power L H both 1 0 0 0 . 2 0 1 0 . 7 2 8 0 . 1 8 8 0 . 7 4 1 I I 2 1 0 5 0 . 2 1 8 0 . 7 4 9 0 . 2 0 3 0 . 7 6 ' 1 3 1 1 0 0 . 2 2 7 0 . 7 7 1 0 . 2 1 4 4 1 1 5 0 . 2 4 6 0 . 7 9 9 5 1 2 0 0 . 2 5 7 6 1 2 5 7 No N Power Power No N Power Power Power Power L H both 1 0 0 0. 46 1 0 . 7 3 0 0 . 4 0 3 0 . 7 8 8 1 2 1 0 5 0 . 4 8 8 0 . 7 5 0 0 . 4 3 3 0 . 8 0 5 0 . 7 8 4 1 3 1 1 0 0 . 4 9 9 0 . 7 7 0 0 . 4 4 9 0 . 8 2 0 0 . 2 3 4 0 . 8 1 0 1 4 1 1 5 0 . 5 1 4 0 . 7 9 1 0 . 4 6 4 0 . 8 4 0 0 . 8 0 9 0 . 2 4 6 0 . 8 2 0 1 5 1 2 0 0 . 5 4 8 0 . 8 1 4 0 . 5 0 0 0 . 8 6 2 0 . 2 5 9 0 . 8 3 0 0 . 2 4 9 0 . 8 4 0 1 6 1 2 5 0 . 5 6 0 0 . 8 2 6 0 . 5 1 6 0 . 8 7 0 1 3 0 0 . 2 7 3 0 . 8 4 8 0 . 2 6 4 0 . 8 5 8 1 7 1 3 0 0 . 5 8 0 0 . 8 4 2 0 . 5 4 1 0 . 8 8 2 8 1 3 5 0 . 2 8 4 0 . 8 5 7 0 . 2 7 5 0 . 8 6 6 1 8 1 3 5 0 . 6 0 3 0 . 8 5 6 0 . 5 6 3 0 . 8 9 6 9 1 4 0 0 . 2 9 6 0 . 8 7 5 0 . 2 8 7 0 . 8 8 4I 1 9 1 4 0 0 . 6 1 1 0 . 8 7 2 0 . 5 7 6 0 . 9 0 8 1 0 1 4 5 0 . 2 9 9 0 . 8 8 2 0 . 2 9 2 0 . 8 8 9I 20 1 4 5 0 . 6 4 1 0 . 8 8 2 0 . 6 0 6 0 . 9 1 6 シナリオ 1 ( 表2 ) で Power (少なくとも l群で、有意差がつく確率)が 80%に最も近いのは 1t t :115例のと o t h( 2鮮とも有意差がつく確率)は 2 3.4%となる。 1Jl:~ 1 4 5例に増やしたとし きである。このとき、 Powerb ても、 Powerb o t hは 29.2%のため、シナリオ lで 2群とも有意差をつける確率を高めるにはかなり多くの例 表3 ) では、 Powerが 80%に最も近いのは l群 1 0 5例のとき 数が必要となりそうである。一方、シナリオ 2 ( o t hは 43.3%である。 l群 1 1 5例で 46.4%になるため、同じ例数で比較した場合、シナ で、このとき Powerb o t hがかなり大きいことが分かる。次に、実薬の用量が増えるにつれてばらつきが増える リオ lより Powerb 表4 ) をみると、 Powerが 80%に最も近くなるのは 1t t :125例のときである。最後に、 ようにしたシナリオ 3( 1 表5 ) は、シナリオ 3 とほぼ同等であり、今回の程度の外れ値では、 1 f j 数にはほとんど影響を与 シナリオ 4 ( えないことが分かる。 365

359.

以上のように、シミュレーションによる例数設計では、データの平均構造・ぱらつき・外れ値などを変動 させて、様々な検出力と必要症例数がどの程度変動するかを容易に検討できる。 表4 . シミュレーション結果(シナリオ 3 ) No 表5 . シミュレーション結果(シナリオ 4 ) Power Power Power Power N L H No b o t h N Power Power Power Power L H b o t h 2 1 1 0 0 0 . 3 8 6 0 . 6 4 0 0 . 3 1 0 0 . 7 1 6 3 1 100 0 . 3 7 4 0.623 0 . 2 9 3 0 . 7 0 4 22 1 0 5 0 . 3 9 6 . 3 2 2 0 . 6 5 9 0 0 . 7 3 3 3 2 1 0 5 0 . 3 8 3 0 . 6 4 4 23 1 1 0 0 . 4 1 6 0 . 6 8 7 0 . 3 4 6 0 . 7 5 6 33 110 0 . 4 1 2 0 . 6 7 0 0 . 3 4 0 0.743 24 1 1 5 0. 432 0 . 6 9 7 0 . 3 6 0 0 . 7 6 8 34 426 0 . 6 8 8 0 . 3 5 3 0 . 7 6 1 1 1 5 0. 25 1 2 0 455 0. 0 . 7 2 0 0 . 3 9 0 0 . 7 8 6 35 1 2 0 0 . 4 3 7 0.719 0 . 3 7 2 0 . 7 8 4 26 1 2 5 0. 47 4 0 . 7 4 2 0. 41 1 0 . 8 0 5 36 1 2 5 0 . 4 7 2 0 . 7 3 5 0. 403 0 . 8 0 4 27 130 0 . 4 9 4 0 . 7 5 9 0. 433 0 . 8 2 0I 3 7 41 2 0.820 130 0 . 4 7 8 0 . 7 5 3 0. 28 135 0 . 5 0 4 0 . 7 7 1 444 0. 0 . 8 3 1 38 . 8 3 1 . 4 9 8 0 43 5 0 1 3 5 0 . 7 6 8 0. 29 140 0 . 5 3 0 . 4 7 1 0 . 7 9 3 0 0 . 8 5 3 39 140 0 . 4 5 2 0.848 . 5 1 5 0 . 7 8 6 0 30 1 4 5 0 . 5 4 4 . 4 9 1 0 . 8 1 2 0 0 . 8 6 5 40 1 4 5 0 . 5 3 4 0 . 7 9 4 0 . 3 1 0 0.718 0. 47 5 0 . 8 5 4 例2 . 経時測定データに対する線形(混合)モデルを用いた解析で、の例数設計 次に、 [ 2 ]を参考に、経 H 寺測定データの解析を考える。特に、試験中止等により計画された最終観測時点の データが得られない症例が発生する場合も検討する。平均情造は全シナリオ共通で以下の通りとする。 表6 .経 H 寺測定データの平均憐造 : ハ U‑nU 斗 4一駅仕 ヰ十ナ一 否伯一 ‑yrr﹁ ラ一宮大 ︑ 一 ︒ プ一 i i ベースライン 変量効果・誤差の分布は以下の通りとする。 シナリオ l 変量効果なし。誤差は全て独立に N(O , S 2 )に従う。欠測データはなし。 2 2 2 2 , 3)に従う。誤差は全て独立に N(O, 4 )に従う。 シナリオ 2・被験者が変量効果で、あり、独立に N(O 欠点[ I Jデータなし。 シナリオ 3:被験者が変量効果であり、独立に N(O , 3 )に従う。誤差は全て独立に N(O, 4 )に従う。 欠測確率は、 H寺点 1~4 でそれぞれ 3% とし、単調な欠点IJ ( 1回欠測すれば、その後は Iは MCAR( M i s s i n gCOl 1 lp l e t e l yAtRandol 1 l ) で 、 あ る 。 全て欠測)とする。このとき、欠浪J 2 2 , 3 )に従う。誤差は全て独立に N(O, 4 )に従う。 シナリオ 4:被験者が変量効果で、あり、独立に N(O 、 l時点前の測定値を Y ‑ Iとしたときに、以下のように設定し、単調な欠測 欠測確率 pは とする。このとき、欠測は MAR( M i s s i n gAtRandol 1 l ) で 、 あ る 。 366

360.

平均値 B ー・→・実薬群 < T , , "φブラセポ群 i 時点、3 時 点2 時 点1 時 点4 豆 │1 3 .経 H寺誤J I定データの平均構造 1 +exp(2.0+0.5Y ̲ ] ) '//~., ~T これより、 i:投与群 ( 1=実薬群, 2= プラセボ群)、 4= 時点 1~4) とし、 Yijk :応答変数、 一 一一」 1 +exp(2.5+0.5Y ] ̲) ,プラセボ群 :p= l 実薬群 .p= • r j :被験者番号、 k :測定 H寺点 (0=ベースライン, 1,2,3, μゲ:平均構造、 b i j 変量効果(シナリオ lで は ん =0 )、 円k 誤差と したとき、 Y i j k‑ b リ+ μリ + εゲA と書ける。ここで、被験者毎のデータをベクトノレ Y i j=( Y i 川 υ], Yρ ' Y i j ) ' Y i j 4 ) 'とおくと、 yゲの分散共分散 行列は以下の通りとなる。 2 5 0 0 00 52 3232 3232 o52 0 0 0 3252 32 3232 I シナリオ 1:V [yi j ]= 0 0 52 0 0 1, シ ナ リ オ 日 :V [ Y i j J=132 3252 3232 o0 0 52 0 o0 0 052 323232 52 32 323232 3252 ここで、解析方法として 2種類を考える。 lつは MMRM( M i x e d ‑ e f f e c tModelRepeatedMeasure)て、ある。 [ 1 ] より、 MMRMで は固定効果として群、 H 寺点、 u 宇と時点の交互作用とベースライン値を、変量効果は被験者を 考え、変量効果の分布は誤差と合わせて推定する。また、検定は1 1 寺点 4での群間差(交互作用込み)に対し て行うものとする。なお、分散共分散構造は U n s t r u c t u r e dのみを考え、収束した場合のみを扱うものとする。 もう lつの解析方法は LOCFANCOVA (ベースラインを除き、観測された最後の H 寺点のデータを応答変数と し、共変量としてベースライン値を汀l し、た共分散分析)である。なお、主解析は MMRMとし、 LOCFANCOVA は感度分析 ( S e n s i t i v i t yA n a l y s i s )として扱うことを想定しているとする。有意水準は片側 2.5%とし、検出力 80% となる例数を求める。シミュレーション回数を 5 , 000 回とした結果を以下の表 7~10 に示す。なお、 Misl 、 367

361.

Mis2 は そ れ ぞ れ 実 薬 群 ・ プ ラ セ ボ 群 の 欠 測 害J I合 ( H 寺点 4 が欠測している症例の割合)、 PowerMMRM, PowerLOCFはそれぞれ MMRM,LOCFANCOVAの検出力とする。 表7 . シミュレーション結果(シナリオ 1 ) No Misl Mis2 N Power 表8 . シミュレーション結果(シナリオ 2 ) Power No Misl Mis2 N MMRM LOCF Power Power MMRM LOCF 0 . 0 0 0 0 . 0 0 0 80 0 . 7 0 1 0 . 7 0 2 1 1 0 . 0 0 0 0 . 0 0 0 80 0 . 7 6 0 0 . 7 5 8 2 0 . 0 0 0 0 . 0 0 0 85 0 . 7 3 2 0 . 7 3 1 1 2 0 . 0 0 0 0 . 0 0 0 85 0 . 7 9 4 0 . 7 9 2 3 0 . 0 0 0 0 . 0 0 0 90 0 . 7 6 0 0 . 7 5 9 1 3 0 . 0 0 0 0 . 0 0 0 90 0 . 8 2 7 0 . 8 2 5 4 0 . 0 0 0 0 . 0 0 0 95 0 . 7 8 2 0 . 7 8 0 1 4 0 . 0 0 0 0 . 0 0 0 95 0 . 8 4 0 0 . 8 4 2 5 0 . 0 0 0 0 . 0 0 0 1 0 0 0 . 8 0 2 0 . 7 9 9 1 5 0 . 0 0 0 0 . 0 0 0 1 0 0 0 . 8 5 3 0 . 8 5 2 6 0 . 0 0 0 0 . 0 0 0 1 0 5 0 . 8 2 9 0 . 8 2 8 1 6 0 . 0 0 0 0 . 0 0 0 1 0 5 0 . 8 6 1 0 . 8 6 2 7 0 . 0 0 0 0 . 0 0 0 1 1 0 0 . 8 4 3 0 . 8 4 4 1 7 0 . 0 0 0 0 . 0 0 0 1 1 0 0 . 8 8 5 0 . 8 8 4 8 0 . 0 0 0 0 . 0 0 0 1 1 5 0 . 8 5 7 0 . 8 5 6 1 8 . 0 0 0 0 . 0 0 0 0 1 1 5 0 . 9 0 6 0 . 9 0 5 9 0 . 0 0 0 0 . 0 0 0 1 2 0 0 . 8 7 2 0 . 8 7 4 1 9 0 . 0 0 0 0 . 0 0 0 1 2 0 0 . 9 0 7 0 . 9 0 7 1 0 0 . 0 0 0 0 . 0 0 0 1 2 5 0 . 8 7 8 0 . 8 7 7 20 0 . 0 0 0 0 . 0 0 0 1 2 5 0 . 9 2 2 0 . 9 2 0 表9 . シミュレーション結果(シナリオ 3 ) No Misl Mis2 N Power 表 1 0 . シミュレーション結果(シナリオ 4 ) Power No Misl Mis2 N MMRM LOCF Power Power MMRM LOCF 2 1 0 . 1 1 5 0 . 1 1 4 80 0 . 7 2 1 0 . 6 9 5 3 1 0 . 1 5 9 0 . 0 7 8 80 0 . 7 1 0 0 . 7 8 8 22 0 . 1 1 4 0 . 1 1 5 85 0 . 7 4 7 0 . 7 2 3 32 0 . 1 5 8 0 . 0 7 8 85 0 . 7 4 4 0 . 8 1 4 23 0 . ] ] 5 0 . 1 1 5 90 0 . 7 8 1 0 . 7 5 7 . 0 7 8 33 0 . 1 5 9 0 90 0 . 7 7 4 0 . 8 3 8 2 4 0 . 1 1 4 0 . 1 1 5 95 0 . 7 8 7 0 . 7 6 0 3 4 0 . 1 5 8 0 . 0 7 8 95 0 . 7 9 4 0 . 8 5 5 25 0 . 1 1 5 0 . 1 1 5 1 0 0 0 . 8 1 5 0 . 7 9 6 . 1 5 9 0 . 0 7 9 35 0 1 0 0 0 . 8 2 0 0 . 8 7 9 . 1 1 5 26 0 0 . 1 1 4 1 0 5 0 . 8 3 3 0 . 8 1 4 36 0 . 1 5 9 0 . 0 7 8 1 0 5 0 . 8 2 9 0 . 8 9 1 2 7 0 . 1 1 5 0 . 1 1 5 1 1 0 0 . 8 4 5 0 . 8 2 8 3 7 0 . 0 7 8 . 1 6 0 0 1 1 0 0 . 8 5 1 0 . 9 0 6 . 1 1 5 28 0 0 . 1 1 5 1 1 5 0 . 8 6 4 0 . 8 4 6 38 0 . 1 5 9 0 . 0 7 8 1 1 5 0 . 8 6 6 0 . 9 1 6 29 0 . 1 1 5 0 . 1 1 4 1 2 0 0 . 8 7 6 0 . 8 6 0 39 0 . 1 5 9 0 . 0 7 8 1 2 0 0 . 8 7 2 0 . 9 2 4 30 0 . 1 1 4 0 . 1 1 4 1 2 5 0 . 8 9 2 0 . 8 7 6 . 0 7 8 40 0 . 1 5 9 0 1 2 5 0 . 8 9 0 0 . 9 3 9 368

362.

今回、 MMRMのすべての状況で計算は収束した。シナリオ 1( 表7 ) とシナリオ 2( 表8 )で 、 PowerMMRM (MMRMの検出力)が 80%に最も近いのは、それぞれ l群 1 0 0例とお例のときである。シナリオ!とシナ リオ 2では、応答変数の時点ごとの分散は等しいが、シナリオ 2の方が誤差分散が小さいため、必要症例数 が少なくなる。次に、 MCARの欠測を考えたシナリオ 3 ( 表9 ) では、 PowerMMRMが 80%に最も近いのは l群 9 5例のときである。欠浪J I が生じている分だけ、シナリオ 2 よりも例数が多く必要となっている。なお、 以上の 3つのシナリオでは、 MMRMと LOCFの検出力に違いはほとんど見られない。一方、 MARの欠測を 考えたシナリオ 4 ( 表 1 0 ) では、 PowerMMRMが 80%に最も近くなる例数はシナリオ 3と同じ l群 9 5例の ときだが、検出力は LOCF の方が 5~7%程度大きくなっている。以ヒの結果のみから判断すると、 MMRM よ りも LOCFの方が性能がよさそうである。しかし、欠測がある場合、 α エラーが設定した有意水準通りにな っているとは限らない。次にこの点を確認する。平均構造は、両群とも表 6のプラセボ群の設定と等しくし、 4と群ごとの欠加J I の状況がほぼ等しくなるようにしたシナリオ 3 ' . 4 'を考える。 シナリオ 3, シナリオ 3 ' 変量効果と誤差の分布・欠 i J l ! J 確率すべてシナリオ 3と同じ。 M i s s i n gCOl l 1p l e t e l yAtRandol l1)である。 このとき、欠測は MCAR( シナリオ 4 ' 変量効果と誤差の分布はシナリオ 4と同じ。 、 I 1 1寺点 Mの測定値を Y ‑ Iとしたときに、以下のように設定し、単調な欠測 欠測確率 pl士 とする。このとき、欠測は MAR( M i s s i n gAtRandol l1)である。 実薬群 :p二 l ,プラセボ i 洋 :p= l 1+exp(1 .5+0.5Y̲I)' , / ‑ . , . .r 1+exp(2.5+0.5Y̲I) 結果を以下の表 1 1,1 2に示す。シミュレーション回数は 5, 000回である。下線部分は、それぞれシナリオ 3, 4 で検出力が 80%となった例数である。 表 11.シミュレーション結果(シナリオ 3 ' ) No Misl Mis2 N Alpha Alpha MMRM LOCF 表 1 2 シミュレーション結果(シナリオ 4 ' ) No Misl Mis2 N Alpha Alpha MMRM LOCF 1 2 1 0 . 1 1 4 0 . 1 1 5 80 0 . 0 2 3 0 . 0 2 4 1 3 1 0 . 1 1 7 0 . 0 7 8 80 0 . 0 2 4 1 2 2 0 . 1 1 4 0 . 1 1 6 85 0 . 0 2 2 0 . 0 2 2 1 3 2 0 . 1 1 8 0 . 0 7 8 85 0 . 0 2 9 1 2 3 0 . 1 1 5 0 . 1 1 5 90 0 . 0 2 1 0 . 0 2 2 1 3 3 0 . 1 1 7 0 . 0 7 8 90 0 . 0 2 2 1 2 4 0 . 1 1 5 0 . 1 1 5 95 0 . 0 2 6 0 . 0 2 2 1 3 1 0 . 1 1 7 0 . 0 7 8 95 0 . 0 2 5 1 2 5 0 . 1 1 5 0 . 1 1 5 1 0 0 0 . 0 2 6 0 . 0 2 5 1 3 5 0 . 1 1 8 0 . 0 7 8 1 0 0 0 . 0 2 5 1 2 6 0 . 1 1 5 0 . 1 1 4 1 0 5 0 . 0 2 7 0 . 0 2 5 . 1 4 8 1 3 6 0 0 . 0 7 8 1 0 5 0 . 0 2 4 0 . 0 4 3 1 2 7 0 . 1 1 6 0 . 1 1 5 1 1 0 0 . 0 2 2 0 . 0 2 3 1 3 7 0 . 1 1 8 0 . 0 7 8 1 1 0 0 . 0 2 8 0 . 0 1 1 1 2 8 0 . 1 1 4 0 . 1 1 6 1 1 5 0 . 0 2 8 0 . 0 2 5 1 3 8 0 . 1 1 7 0 . 0 7 8 1 1 5 0 . 0 2 7 0 . 0 5 1 1 2 9 0 . 1 1 5 0 . 1 1 5 1 2 0 0 . 0 2 7 0 . 0 2 7 1 3 9 0 . 1 4 7 0 . 0 7 8 1 2 0 0 . 0 2 6 0 . 0 4 8 1 3 0 0 . 1 1 4 0 . 1 1 5 1 2 5 0 . 0 2 5 0 . 0 2 4 1 4 0 0 . 1 1 7 0 . 0 7 8 1 2 5 0 . 0 2 1 0 . 0 4 3 369 0 . 0 1 0 0 . 0 3 9

363.

今回も、 MMRMは全ての状況で収束した。 MCARの欠測を考えたシナリオ 3 '( 表 1 1 ) からは、 MMRMも LOCFも α エラーはほぼ設定した有意水準 2.5%と等しくなっている。一方、 MARの欠測を考えたシナリオ 4 ' ( 表 1 2 ) からは、 MMRMの αエラーはほぼ 2.5%となっているものの、 LOCFでは αエラーが 2.5%を大き く上回っている。以上より、今回のシミュレーションの設定に近い状況で LOCFを主解析として用いるのは 適切ではなさそうである。なお、実際の臨床試験では欠測メカニズムは MNAR(MissingNotAtRandom)を想 定するのが自然なことも多い。そのため MARを仮定したシミュレーションで αエラーが 2.5%に近かった場 合でも、さらに MNARでのシミュレーションも行い、 αエラーの大きさを評価することは重要である。 以上のように、シミュレーションを用いた例数設計では、変量効果の分布・誤差の分布・欠測のモデ ルを 変動させたときに必要症例数や検出力がどの程度変動するか、を容易に検討できる。また、検出力だけでな くαエラーも、プログラムを少し書き換えるだけで検討が可能である。 6 . まとめ 本稿ではシミュレーションを用いた例数設計について、主に具体例を用いて検討した。近年、臨床試験の 解析では、複雑な統計モデ ルを用いることが多くなってきている。そのため、今後一層シミュレーションを 用いた例数設計の必要性が増すことが予想される。 なお、本稿で示したシミュレーションのプログラムは、著者の Webページ ( www012.upp.so‑net.ne. j p/do め で公開予定である。 参考文献 [ 1 ] M a l l i n c k r o d t,C .H.,Lane,P .W.,S c h n e l l,D .,Peng,Y .andMancuso,J .P( 2 0 0 8 ) .R e c o l l l l l l e n d a t i o n sf o rp r i m a r y D r l l gJ n j o r m a l i o nJ O l l r n a l , 42,303・3 1 9 . a n a l y s i sofc o n t i n u o u se n d p o i n t si nl o n g i t u d i n a lc l i n i c a lt r i a l s ., [ 2 ] S i d d i q u i,0 .,Huang,H.M.J .,andO ' N e i l l,R .( 2 0 0 9 ) .MMRMVS.LOCF:A c O l l l p r e h e n s i v ec O l l l p a r i s o nbasedon O l l r n a l0 1 B i o p h a r m a c e u l i c a l5 1 a l 凶 i c s ,19,227‑246. s i m u l a t i o ns t u d yand25NDAd a t a s e t s .J 370

364.

J. ユザー鈴吋m …ツリユザ叩 │川三川川町一三 Y 勺 ぷ ジェトロ、システム知識ゼロの課長代理 が語る、 SASDataFluxを利用した Dataクレンジングの実際 田中政輝 日本貿易振興機構(ジェト口)ビジネス情報サービス部 ビジネス情報サービス課顧客班 BestP r a c t i c ef o rData CleansingusingSASDataFlux MasakiTanaka nonsystemKnowledge"DeputyD i r e c t o r i v ., ofCRMTeam,BusinessServicesD BusinessServicesDep , . t JETRO I ーやーザー給一 要旨: 個人情報保護およびサービスの質向上を目的とし、顧客情報の一元 管理を進めている。 一元管理では、組織、業務フロー、データマネジメント等様々な側面が 重要だが、 SASDataFluxの利用したデ タ品質の管理手法を紹介。 キーワ ドプロファイリング、データクレンジング、モニタリング 371 o l

365.

│ ω ュー付金 鮎 ! Sユ ー ザ ー 総 会 … … 一 … 372 m D l l

366.
[beta]
|以Sユーザー総会内町村JD;;-&o.~I)~->...3:'"
;
一
一一両ミlギJ
H
j
ヰ
ヰ
長
:
均

~g
一一;三一

i!均ン

SAS DataFluxとは?

【
概 要】組織におけるデータマネジメント用データ品質調整ソフト
【メリット】画面上でのマウス操作によるデータ品質管理が可能!

¥
<
Vl
ラ

IM~nitor:i 高データ品質維持

℃24

週 加 泊 防 相M

容Z
Zトー叩:
z
r
‑
i
d竺
コ
沼己主宰 i

{lr匝同町 1
0

I
i ~ここ:1:
r

ノヨ~'

I
ゃー

本プロジェク卜の EGとDataFluxの役割

喝

EEtgEEB'IEEEttsaEBIt‑‑tea

含
︐

Adm

自国・
一‑‑‑
・R司
z
ι 圃 由 明‑‑FE‑‑
︐
.
.
︐幽園内・・・‑

'bE. t..

・

‑
‑
‑
‑
a E
‑
‑
a
‑

‑丙

‑盟

働

‑E ロ
ド
岡
ー
‑
‑
‑
開
閉
岡
山
明
・
・Z E ‑ ‑

‑
閉
幽
・
・
・
・
・
・
・
・
・
・
・
・
・
開
凶
・
・
・
・
・
・
・
・
・
・
・
・
・
‑

情

3333'tslagagsetSEg‑‑38ee

maaa‑‑A
‑‑
‑‑
‑a
a
a‑
a
a
a
a‑‑‑m﹂

PCローカルに格納

EnteroriseGuide

3

DataFlux
DataManaaementStudio

顧客システム

基
副

i

通
、

SASデータライブラリ
に格納

373

レポーティング
{モニタリング)

367.

同一一ザー蝕……一泊ン ~.lIIBJ ジェトロにおけるプ口ファイリング、 1、2回のクリックで、全項目の基本統計情報を取得、瞬時にデータの傾向・課題を把握! S I J ユーザー総会… M ト ‑ ン ~IllJ I ジェトロにおけるクレンジング処理例ーその 1 量 λ! 7 J レ ー プ ' 1 1 ;I 場 五日前!叩n 恒 [ 同 旧b l 1 L o g l [ N 元ム ~ J 一員ふ 05' ・ ';:'‑8 山 ' , . 一 田 M 色叫姐 ・Daむ量】 ob 苧 :D a t aI n p u t s + ;D a t aO u t p u t s ~ D a t aI n t e 日 9 ' ョt i o 宅 Q u a l比v SE n r i c h m e n t G 3E n t i t yR e s o l u t i o n 必 M o n i t o r 明 SASI n s t i t u t eJapan株式会社 SASI n s t i t u t eJapan株式会社 サス(株) SASI n s t i t u t eJapan株式会社 SAS 大阪支庖 SASI n s t i t u t eJapan株式会社 3 7 4

368.
[beta]
I
1
1
1
民向?ーらふザヰ
ム
ミ
j

ジェトロにおけるクレンジング処理例ーその 2
【結果 (
20131月顧客情報データ使用)】
日本住所データのうち 99.
47%(全 量 の 5
2.19%)の都道府県充足率を実現

877件
口 顧 客 情 報 全 量4265
2
.
1
9
3
4
.
0
4
1
3.
49

都道府県紐付け可能データ
住所無しデータ
半角英数字から始まる海外住所、中国の住所海外データ

港区六本木 6丁目 1
01
顧客花子

(空白)

東京都港区六本木61
01

一一一一一一+東京都

顧客二郎

(空白)

港区六本木 6丁目 1
01

‑‑一一一争東京都

a 生一・~

j
,
J
‑

0
‑‑
,
る
勾 .
0
;
.
.
:
.
;
.
.
.
.
‑
.
,
.
.
.
.
."
‑
,
..
..:>.品晴樹必泌叫晶継嗣掛縄場相

375

川崎刷

ー鴇~~

コ三千益法子

β

:
;
.
.
‑
̲
.
"
"
'
=
,
山
・
,
‑
"
.
.
,
,
>
"

一

~~.,‘.,

.
.
f
i
‑
.
.
.
‑
Q
J
‑
.
.
.
O
‑

⁝

一日同̲,
,
J
‑ _~r.・ "ø~'

・3・
",,!>,'内

マ

‑
!
:
l
l
‑ が窃

︐gseeaA‑d

.n 問 点 市

‑
<
[
'
‑

長一{⁝万円花守山内V mV川
公
一

当

皿

~-

‑a

山明日帆山川..・~.

J一 ‑ 白 河

品門広沼田

逸品山斗ーマ<?'~忽?・ QJ-

埼ケヨ町内唱山富 w桂 町 塩 川 昌 " 唱

M

門同一

喝

2F

窃叩

HJ

J;

守
一 r司 泊 三 情 肺

Lit‑‑??

一
し
ー
一
︑
辺

⁝

門九円ザ⁝な山門前一

引

日 々 "Mr

"tf

ai‑‑
rH民一市町

者

‑

M

鴇ん白一

死三-.~二

369.
[beta]
I何十鈴アザミヤ 町一…ン

2
0
1
3
ご清聴ありがとうございました
J

PRE!¥I1UM

L OlJ N G E
';:".!!?-1"( プ訓笥惨 !;!;.~b<1 '''''.I~",,~略式お併そっ令ぐ、

‑

留酒罰盟諸濁
~2(! 日恥月 14E t
s
町 C胤 l ,事副

""回現場釘賜弘む硬象作

u
.
'ンティクスの不登舎の

""
"
'
"

m{
メールアドレス》

a零 ご

gH8

u
v一T F J
鳴戸〆一

句〆

h
一
シ
︑

F

タ

と

ξ4F‑‑
τ

ウ
v

・ンゐ盆釘

じ聞事‑

HH

jw

一
一
a
tゐ ス

えz
m

wa

包

c

同一川

w当ノ

歪
一

﹃ン川N e

アつ
スが

崎
一
回

理:Aq

﹃

包含弓と
隅杭棋

慰中を

5同 一
彦湾窓

却提出

J
摺I
2出血

=
︐
込

引に十九
一 工島

叩噛阿川町四叫

‑BUC

''''?ード

白π
凡
,

仁豆玄コ議孟量子主

磁轍謡議議轍
議

SAS
プレミアム連載
『システム知識ゼロの課長代理が
行政機関でデ一生マネジメントに臨んでみた!J

wutb:
脱輪総守都子、

lゾ ‑ 川 川 山 ヤ ヤ レ

人
山
三
戸

ι

川‑七一九

・

[均千三iI修会的均一I
一;…:じ三 201D
γ

参考資料:主なプロファイリング、観点一覧
法孟
I
頁目

f
牛
プロファイリング 総
NULL
割合/牛数
ブランク件数割合/件数
直のパターン
パターン件数
発生上位パターンの一覧

376

370.

ライブラリ参照と名前の定義を利用して EXCELファイルへの柔軟なデータ入出力を実現する 解析結果のレポーティングからセルオートマトンまで 森岡俗 ナイフィックス株式会社バイオメトリクスグループ UsingEXCELLIBNA恥1EEngineandNamedRang巴 t oEnhancef l e x i b l eI n p u tandO u t p u t ‑Fromr e p o r t i n go fa na n a l y s i sr e s u l tt os i m u l a t i n gac e l l u l a rautomaton‑ Y u t a k aMorioka Biom巴t r i c sGroup, N i p h i xKK 己[ロ 要 SASデータを EXCEL帳票に出力する場合、 ODS(OutputD e l i v e r y System)または DDE(Dynamic D a t a Exchang巴)機能を用いて、 SASプログラムのコーデイングにより実現可能である。 例えば、非リスト形式のセル配置やセル結合の使用、細かな罫線・セルの書式設定などが設定された EXCEL帳票に、 SASデータを出力する SASプログラムのコーデイングを想定してみる。 ODSや DDEを利用して k記のプログラムを作成する場合、どうしても複雑かっ特殊なコーディングに なり、手間と時間がかかると共に、高いコーデ、イングスキルが要求されるだろう。 このような場合に、 LIBNAMEステートメントによる EXCELシートへのライブラリ参照が非常に有 効である c EXCEL 上に予め帳票テンプレートを準備し、書式等を設定し、出力したい範囲に名前の定 帳票作成が実現可能となる。 義を行っておくことで、可読性の高い平易な SASコーデイングによる l また、 lつの応用事例として、セルオートマトンのように格子型のモデルを利用するシミュレーシヨ ンに対して、本稿の入出力方法は相性が良いと考えられる。 ライブラリ参照による EXCELファイルと SASデータセットとの間での入山力については、その便利 さにも関わらず、とりあげられる機会がやや少ないように思われたため、本稿で紹介する c キーワード LIBNAMEEXCEL MODIFY UPDATE CELLULARAUTOMATON 377

371.

1 . EXCELファイルへのライブラリ参照 ( 1 ) EXCELファイルへのデータ出力方法 EXCELファイルはファイル内に情報として、多彩な書式や、セル結合設定などのメタデータを含むことが 可能なスプレッドシートである。特別なプログラミングの知識がなくても、柔軟なデザインで表を作成する ことができるため、分野を問わず広く使用されている。 SASのデータセットを最も単純に、 EXCEL形式でリスト出力するだけであれば PROC EXPORTなどの選 択肢もあるが、様々な書式を伴う 1長緊デザインの場合には、一般的には実用的とは言い難い。 SAS データから、 EXCEL 帳 票 を 作 成 す る 代 表 的 な 方 法 と し て 、 ODS(Output D巴l i v 巴r y System)と DDE(Dynamic D a t a Exchange)を利用した方法があげられる。それぞ、れの方法の詳細については省略し、特徴 のみを紹介する。 まず、 ODSを用いてデザインが複雑な EXCEL帳票を作成する場合、 TAGSETS.EXCELXPの知識、または SASTEMPLATEの知識、或いは REPORTプロシジ ャや TABLATEプロシジャによる出力結果をベースにする 場合は、それぞれのプロシジャ等の詳細な知識が必要とされる。また、 ODSを用いた場合には、新規に EXCEL ファイルが作成され、シート上に 1長票出力されるため、既に作成されている EXCEL ファイルへのデータ出 力はできない。 一方、 DDEを用いた場合、既に作成されている EXCELファイルへのデータ出力は可能である。ただし、 1 寺に書式設定などを行う場合は、 E x c e l4 . 0Macro(かなり古いプログラム傑式)の知識が必要で、資料が少 実行1 なく、難易度が高い。また、今後どの製品パージョンまで 4 . 0Macroが使 J I J可能かも不透明である。さらに、 DDE 実行中、 EXCEL は必ずオープンかっアクティブな状態でなければならず、結合されたセルに値を出力 できない等の制約が存在する。 どちらの方法をとるにせよ、 EXCELファイルにデータ出力するためには、知識の習得と経験の積み重ねが 必要であり、 SAS初心者にはハード ルが高いといえる。 ( 2 ) EXCELエンジンを利用したLlBNAMEステートメント L lBNAMEステートメントは、様々なアプリケーションへのデータアクセスを、アプリケーションエンジ ンを介したライブラリ参照という形で可能としている。 EXCELファイルに対しても EXCELエンジンを介し l s x形式に非対応) て有効である。(※ SASACCESSのライセンスが必要。また SAS9.13は x 下記のステートメントで EXCEL ファイルそのものをライブラリとすることができる。ライブラリ名の後 の EXCELを明示的に記述しておくことで、ライブラリ参照完了までの処理効率がよくなる c LIBNAME ライブラリ名 EXCEL"EXCELファイルのフルパス"オプション; S h e e t AJと r S h e e t BJ という 2シートで構成されている EXCELファイルをライブリ名 rEXL lBJ 例えば r とし、 SASから EXL lB 内を参照した場合、 r S h e e tA$J r S h e e t B$J というデータセットとして扱わる。 L lBNAMEステートメントにより、シートがデータセットとして参照され、シート名に r $ J が付与される。 S h e e tA$J を workに rDS AJ としてコピーしたい場合は下記のようなコードとなる。 また、データセット r d a t aDS A; H E ︐ . I r s e t EXLIB.'Sheet A$'n; 3 7 8

372.
[beta]
s
c
t コマンドの後に、ライブラリ名に続いてシングルコーテーションでデータセット名(=シート名)を凶
n
J という文字を入れていることに注怠が必要である。これは本来 SAS命名規則適応の範囲外
み、直後に f

である EXCELのシート名というものを正しく参照するための、名前リテラルという規則である。
EXCELには任意のセル範囲にユーザーが名前をつけることで、 EXCEL関数や EXCELVBA等での参照効

率をあげる「名前の定義」機能が備わっている。 (EXCELのパージョンにより操作は異なるが、 EXCEL2007
ではリボン「数式 J →「名前の定義 J
)。これを使って、例えば f
AIJ セルから fB3J セルまでの範囲に「範
開 AJ という名前をつけておく。その後、LlBNAMEステートメントで以下を実行する。

LIBNAME EXL
lB 2 EXCEL"名前の定義を含んだ EXCELファイルのフルパス"
header=no;

実行結果として、 EXCELファイルのライブラリ内に「範凶 AJという 23i
3
J
Iデータセットを俄認できる。
AIJセルから fB3Jセルまでの範 J
mの内容と同期しているのである。
この 23列のデータセットの内容が f

なお、オプションに headel=noを指定しなければ、 l行目は変数の定義情報とみなされ、 i行自の内容が変数
1のデータセットとして参照される。
名となって l行 3亨]

$
J はつかないc
シート名の場合と異なり、名前を SASからデータセットとして参照しでも f

なお、 EXCELファイルで、印刷範凶を設定していた場合、 f
P
r
i
n
tArcaJ という名前が、自動作成されているの
で・注意が必要で・ある(印刷範囲がそのまま名前の定義の範囲となる)。

2
. ライブラリ参照による EXCELシートのデータ更新
(1) データ更新方法の実例
以下のように、ファイル名「症例レポート x
l
s
x
J という、臨床試験における被験者の背景情報を要約した
EXCELファイルのシート名「背景情報」に、データセットの対応する情報をシート上に出力してみる。

欝相噛幽幽幽幽幽幽闘騒│
省官 {
f、

州、l'

(2豆豆ヨ

参照範図
,

;
P
r
i
n
tA昭 a

、1患者背果

=背景情~"$A$ 1 .
$
E
$2
3
=背果情 ;
1
1
'
$
8
$7$8引 01
王座合併症=首果情;.'$A$131
>8$22

1

」喫煙伏況
リ(t~合コメント

」登録番号

<

=背景情;.'$E$7$
E
l
:9
=背果情;1ii'$0$13
=背景情幸fi'$8$4

̲ ̲0IIII̲ .iI色白田圃綱蹴幽醐雌幽ー

>
1

i
'
f
.
:
.
i
t
'
e
さJ
‑
R..̲...̲̲....̲̲..̲̲..̲‑‑̲.E
)
<
.
,
.

379

373.

ヒ記のシートには、印刷範囲を除いて、以下の 5つの名前が予め定義されている。 登録番号:84 患者背景:87:810 ト) , 0 ;内容を議集して〈だ主主以D 次のセn のみを書式設定旦) 住),の白色一ーさ出活型堅生1俊一選l~吋 ー ー 既往歴合併症:AI3:822 4 ノ LV V﹂ 喫煙状況:E7:E9 ユ ①②③④⑤ 名前.範囲 ÄiJああア y~ 宇 ~仁霊日 総合コメント:D13 総合コメントについては D13から E22までの範圏でセル結合が行われている。 既往歴合併症の名前範聞には、 EXCELの条件付き書式の機能を使って、セルがブランクでない場合 は 、 罫線で囲むという式が全セルに設定されている。 ① シートに出力したいデータセットは以下の 3っとする。 DM(患者背景) ② MH( 既往歴・合併症) ③ CO(総合コメント) (2) LIBNAMEステートメント LI8NAMEステートメントを以下のように指定する。 C :¥症例レポート . x l s x " LIBNAME OUTPUTEX e x c e l " s c a n t e x t = n o header=no; まず、対象となる EXCELファイルを閉じた状態で、 LI8NAMEステートメントを実行する。値の更新をし たい場合は LI8NAMEステートメントに s c a n l 巴x t = n o をオプションとして指定する。 今回はライブラリ名を fOUTPUTEXJ と定義している。 なお、 LI8NAMEステートメントで参照する EXCELファイルについては、開いた状態でも閉じた状態でも 参照有効でーある。ただし、開いた状態の場合、範圏が 1セルのみの名前の定義をデータセットとして認識で きないという制約があるようだ。 380 麗

374.

SAS社テクニカルサポート音1に問い合わせたところ、 M i c r o s o t i社の仕様に依存する現象であり、米国 SAS 社の回答としては、通常閉じた状態で利用することを推奨しているとのことであった。 xlnm#Print̲ Areaは印刷l 範囲) ライブラリ IOUTPUTEXJ には以ドのデータセットが作成される。(̲ 自昌 ̲ x l n mi ; 'P r i n t 患者背呆 既往歴合併症 喫煙状況 (3) 名前の範囲の値を更新する まず、名前「登録番号 j について、 SASデータセットを参照すると、LlBNAMEの際に hcader =noとしてい 付ー与され、 f F IJ となっている。 るため、変数名は自動J Iに値が入ると、それが EXCEL上の IB4Jセルに反映される。 ここで、データセット「主要録番号 Jの変数 F e t し Fl=USUBJIDと害I 1り当てステートメン卜を実行しでも、エ ただし、単純にデータセット IDMJ を s ラーとなる。 EXCELをライブラリとして、セル内のデータを更新する場合は、すべて更新処理として行わな ければならない。 そこで、 modifyステートメン卜または SQLプロシジャ内の UPDATEステートメン卜で実行する必要がある。 これが最大の制約て、あり、注意点となる。 a t aステートメン卜で指定したデータセット名を modifyステート 実際には、通常の SETコマンドの後に、 d メントに追記するだけである。 data OUTPUTEX.'登録番号 ' n ; s e t DM; modify OUTPUTEX.'登録番号 ' n ; n ︐ .uvz FI=USUBJID; 実行後のデータセット「登録番号」の変数 Flの値は右図のように、 値が更新されている。続いて、 L1BNAME OUTPUTEX clear; でライブラリを開放したのち「症例レポート . x l s x J のシート 「背景情報」を確認すると値が更新されていることが確認できる。 (ライブラリ参照状態で EXCELファイルを開くとエラーになる) 381 1 抑 制 TESTOO

375.

また、上記はデータステップの modifyステートメントを用いてデータ更新を行ったが、次のように SQLプ ロシジャにおいて UPDATEステートメントを用いても同様の結果が得られる。 procs q l ; 叩d a t eOUTPUTEX:登録番号 ' n s e tF l = ( s e l e c tUSUBJIDfromDM); q u i t ; 再度ライブラリ参照した後、全データセットを作成したい帳票デザインに合わせて加工した後、同様にデー タを出力する。 ①患者背景 p r o ct r a n s p o s edata=DMout=DM̲I; n t ︐ . r v a rREGDTCSEXINFDTCBIRTHDTC; d a t aOUTPUTEX.'患者背景 l l; f s e tDM̲l; l 1 10 d i f yOUTPUTEX.'患者背景 ' 1 1 ; Fl=COL 1 ; HU I ︐ 1 1 ②喫煙状況 p r o ct r a n s p o s edata=D恥1out=D恥42; v a rSMOKESYSMOKYRSMOKNUM; HU ︐ 1 1 r d a l aOUTPUTEX喫 煙 状 況' n ; s e tD M 2 ; modifyOUTPUTEX.'喫煙状況t n ; 1 ; Fl=COL r u n ; ③既往歴合併症 d a t aOUTPUTEX.' 既往暦合併症 ' n ; setMH; n ; modifyOUTPUTEX.'既往暦合併症 ' Fl=MHCAT; F2=MHTERM; れ m ; @総合コメント 1 1 ; d a l aOUTPUTEX.'総合コメント ' setCO; modifyOUTPUTEX.'総合コメント ' n ; Fl=COMMENT; r u n ; 382

376.

再度ライブラリ参照をクリアしてから、 EXCELファイルを開くと以下のように出力されている。 既往歴/合併症については、条件付き書式が働き、データのある部分にのみ罫線が表示される設定となって いる。また、総合コメントは結合セルであるが、正常に出力できている。 (4) セルの絶対参照範囲の値を更新する これまでは、名前の定義を行った範凶に対して、データ吏新を行ったが、次の S ASコードを実行すると名 前の定'義をしていなくても、絶対参照したセル範聞に対して同様の操作が実行される。ただし、セルの参照 方式は Al方式でなければならず、 RC方式で桁定はできない。 1 ) E4セルに投与併の情報を出んする d a t a OUTPUTEX."背景情報 $E4:E4"n; s e t DM; modify OUTPUTEX."背景情報 $E4:E4"n; r E I ︐ .‑ ‑ FI=ARM; 383

377.
[beta]
3
. 実用例、 応用範囲の検討
(1) 解析結果のレポーティング例
前章では、 LIBNAMEE
XCELの機能を紹介するため、 SASデータセットの内容を単純に出力するだけの例
を示したが、例えば EXCELシートに予めグラフや関数式を含めておいてから、データ出力することにより

SAS関数や SASでのグラフ作成に不慣れなユーザーであっても思い通りの1
'
長票を作成することができる。
下図は生存時間解析のレポート例で、左側が実行前のテンプレート、右側が実行後の同ファイルとなる。

EXCELシート上に出力されたデータ (非表示)に基づいて、 グラフが作成されている。

府坦限法による生存出主主

開坦限法による主存拙主主

ー一点

…
一
一
一
一

.~"

ーー喝さ"

"
.

c。

A
t
!
.

Eこ

01事

血
、
,

~CC

3t
J
.

An

例数

死亡

4
7ち匂予ゾ(1¥‑七「ノ>11ち匂予J

7
S
5
;

7
S
57

24(32~)

18(24~

T加羽o
et
oe
'An
l(Day)

3450
2720‑5010

カブラノマイヤー抱王 fi  tp~fl

9~~

j
8fl1喧間

ロタラノク検定 p
f
l

2460
1650‑2830
<OCul

(2) EXCELによるアンケート調査の集計
これまで、 S
ASデータセットの内容を EXCELに予め設定された名前の範聞に反映させる方法について紹
介した。
ここで、逆のパターンについて少しだけ言及したい。つまり、予め設定された名前の範 1
mにデータが入力
された状態の E
XCELファイルから SASデータセットを作成する場合である。

XCELで作成し、多数の回答者に EXCELを用いて入力してもらい、そのファ
例えば、アンケート調査を E
イルを受け取るというケースを想定する c
大量の E
XCELファイルを全て読み込み、 lつのデータセットにする場合、 IMPORTプロシジャや DDEで
読み込む S
ASコードをマクロ化して全てのファイルに対して実行する方法が考えられる。
ただし、 I
MPORTプロシジャで読み込むためには、アンケートファイルはリスト形式の単純な構造が望ま
しく、場合によってはユーザーが入力しにくいデザインになってしまう可能性がある c

DDEの場合は、読み込み処理の都度、対象ファイルをオープンするため、処理時間が多くヵ、ヵ、り、実行中
に他の E
XCELファイルを操作すると処理に支障をきたす可能性がある。
代わりに名前の範 r
mとライブラリ参照による読み込みであれば、アンケートがどのようなデザインであっ
ても、凹答セルにさえ予め名前を定義しておけば、読み込むコードは平易ですむ。さらに、 E
XCELがオープ

384

378.

ンされていない非アクティブ状態であっても、アクセスに問題がないため、実行時間も早く、その聞のユー ザー操作が処坪ーに支障をきたすこともないので、非常に有効な手段となりえる。 (3) セルオートマトン セルオートマトンという研究分野がある。ライフゲームといったキーワードと関連して広く知られており、 交通渋滞や森林火災の延焼、感染症拡大のシミュレーションに一部応則されている。 対象とするデータ空間、領域を分割l されたセルの集合と捉え、各セル問が一定の法則で、五いの状態で影響 し合う設定で、経過時間(局面)を変化させ、全体の変化を捉えるのが研究のコンセプ卜である。 これを SASで行う場合、状態の変化自体は SASデータセットで表現できるが、それを見やすいアウトプッ トとするうえで、 EXCELのスプレッドシート構造は大変都合がよい。 具体的には EXCEL をライブラリ参照し、対象範閉のデータを読み込み、 SAS プログラムでイ去則式を実行 し、その後 EXCEL の対象範│社l の値を史一新、再度読み込みというループを繰り返すことでセルオートマトン を実現できる。 推奨はされていないが、 EXCEL を│刻し、た状態での実行も実際は可能なため、 EXCEL 上で次々セル状態が 変わるところを目で見ることもでき、モテ.ルの珂ー解が慰Jけられる。 また 100回や 1000固など多く局面変化をしたい場合は EXCELを閉じた状態で行えば、かなり高速に実行 可能である。 仔. I Jとして、極端に単純化しであるが、感染症の f 広大をモデルにしてみる。 30X30セルが、ある一定の地域を示すと考える。セルの値として数値 0、 l、2 を用いる。 lは感染が流行 していない平常状態、 2は感染が流行している流行状態、 0は感染が終息した終息状態を示すとする。 EXCELの条件付き:占式を使って I (平常)は肌色 l こ 、 2 (流行)のセルは赤く着色されるように設定しておく。 l局面(時点)において、 lセルごとに感染症が向然発生し流行する確率を 0.2%とし、感染症が流行した場 合、縦横に隣り合う 4つの近傍セノレ(地域)に流行が伝染する確率を 65%とする。また 度感染が流行した地 域は次局面では O (終息)になり、終息した地域の値はそこで固定となる(再流行はしなし、)。 最初に全てのセルの値を I (平常)として、中心の lセルを 2 (流行)とし、ある l地域で感染症が流行した状 態を作り、局面変化を開始する。 プログラム内容については、付録に記放しているが、ここで、は近傍セルの定義を SASのデータステップで どのよう扱うかについての概略を示したい。 Jとして定義された 30X30セルは、 LIBNAMEステートメントにより、 30変数の 30オブザベー 名古jの範 W ションヵ、らなるデータセットとしてみなすことができる。 横方向については配列を利用することで、各セルに隣接する左右セルの債をそれぞれ要素番号ー l 、要素番号 +1 の公数の値として取得できる。」二)'j一向に近接するセルは l a gI 長j 数を使し、 lつ前のオフ。ザベーションの値と して取得できる。下方向については凶ステートメン卜を 2度使い、先の s e tステートメントで発生する自主}j i E数 N に+1 力Llえた値を変数に1i1 り当て、もう一度同じデータセット(ただし一l 二書きがおきないように変数 1 名は今ーて renameする)を読み込む s c tステートメン卜の p o i n tオプションに、先に割り当てた変数を指定する ことで lつ先のオフ ザベーションの怖として取得できる。 P そうして近傍セルの偵を?とて取得できたら、後は近{芳セルの状態と、設定した確率条件ーから百十算を行い、 385

379.

各変数の次局面の状態を決定し、結果を再度 EXCEL に出力する。これをシミュレーション回数が終了する まで、繰り返す。 以下が実際にプログラムを実行した際の様子で、左から初期 ( 0 )局面、第 I局面、第 5局面、第 20局面の様 子である。 第 l局面 初期 ( 0 )局面 第 20局面 2 5局面でシミュレーションを打ち切った場合、局面ごとの流行地域数の推移は以下のようになった。 l局面と現実時間の単位をうまく結びつけることができれば、流行のピークの予想、を得ることができる。 ' 白 '刷[;;周 E恒? , 4 . おわりに 解析処理や SASプログラミングそのものには興味があるのに、最終的に見栄えの良い帳票作成を思い通り にできなかったり、収集されたデータをどのように SASデータセット化するかに思い悩んで多くの H 寺聞を浪 費してしまったユーザーは、少なくないのではないだろうかc そういったユーザーにとって、少しでも平易なコーディングで EXCELファイルとの入出力ができ、これ まで苦労したり、あきらめてしまったようなデータ処理に有効利用していただければと思い、紹介した c また、 EXCELというアプリケーションのファイルを、あたかも SASデータセットと同じように扱う L lBNAMEの仕組みは大変興味深く、まだまだ色々な使い方ができる可能性を強く感じている。 今後も継続的に EXCELと SASをうまく使った新たな試みを研究していきたい。 5 .付録 セルオートマトンプログラム 386

380.
[beta]
モデ J
L
.詳細:
1.ノイマン近{芳に基づいて、上下左右 4セ jレを近傍セルと定義する
2. 開 放 境 界 条 件

ステータス1], 12
①流行:平常地域 (
1)I
J確 率 pで感染が流行し、流行地域 (
2
)となる
(
2
)1
'
:
i染:流行地域 (
2)め周辺(左右上下で近接するセ jレ)の平常地域 (
1)I
J確率、 qで。流行地域 (
2
)となるっ
く
D終息:流行地域 (
2)は次ターンでふき息地域 (
0
)となる
一一一一ー
一一一一一
一 一 一‑
*
1
司

/料++パラメ'‑‑;!詰定t++t++++t+本/
/本流行発生確率本/
出l
e
t p二0.002;
/本伝染確率 *I
%
I
e
t q=0.G5;
/持是り
し数本/
出1
e
tr
e
p
=
5
;
本
/E
>
:
:
C
E
Lファイ,11
ノQ
)フルパス ※ 川 :3)(形式の場合│ま S
AS9.2以上本/
矧巴 tb
ook二D
:半セルオートマトン・ )
(
I
s
)
(
;

i
z

エクセルブックをライブリ(名青箭:可i
b
凶
"
)
河
泊
1ヨ.犯 i
凶
:
.
川
心
3
D口
此
k
)とする
二二二二二二=========二二二二二=========二二二二二=二二二二二ニ============本/

1i
bname baseb口
口k

.
.

ぺ.~.b [l okr

s
C
8
.
n
t
e
x
t
=
n
o

he ミ d,里J仁三r~Qi._ _~指定....L:tiJ!よコ:tìê 詑うとさJ 日主よLIJ?J.重~.Jl~~_~.... ;

一一一一一一

/本二=二二‑‑二二二=二二二二二二‑‑ニ‑‑‑‑‑‑二二二=二二=二二二‑‑‑

マクロ :
r
ni
oad
o
r
k
l
こ現時点 0
:
'デ ー タ を 持 動
e
x
c
e
lか ら w
二二二二‑‑‑二二二二二二二二二二‑‑‑‑二二=二二二二二二二二二二二二二‑‑本/

81.acro Ii/ /OOl
J
;
data AREA;
s
e
t basebook.AREA: まヱクセル["予め、名古~の定義を使い 82:AE:311ζAREA という名前をつけている:
r
u
n
;
口a
d
;
l.end m │
/本=二=二二二========二二二二二二二==========二二=二二二=二二二=============

マクロ :m̲area̲cωnt;
セ,iL.,ごとに近接する左右上下のデ

タから流行地域数を計算

ー‑‑‑‑二二二二二‑‑‑‑‑‑̲二二二二二二二===========二二=二二二=二二==========二本/

Bl.acro Ii/ o
reo co
unt:
data COUNT D
8
;
s
e
t AREA:
/本下の近接セルー l
o
b
s先 の デ ー タ
最初 (~I s
e
tで 発 生 す る ̲
N一
!
こ+
1した散を取得*,/
n
e
)
(
t
= n +1:
円

ヨ

β

ト

ψ小

F
U

守
ム

‑
f
r

‑

41・

L
6ず

村川

‑
‑
i
F
J

守

l'

ち

‑

+や ‑4
a

︑
が

Jjs

↑
k

Bし

成

ト

J
C
)3
︑

ト

J ︺
RunuRdnu‑j
flηιq49dnu

ト

二一‑‑一一一

387

FlFlFlF12J
i
J i1
i
ト一トーι
J

﹄‑‑

叫何日町d

RunURunU 今4
ワ﹄ワ﹄ qu‑
F ﹁
F ﹁
F
n‑﹁
F ﹁

ト

川 UNUNBV‑
D‑ M川一川一
一一ガ

二

ト

1
i84日σ
5
F4
+
経
F
﹁ 引 川 1lTiη乙 η45=
N
‑FFFF淫

ト

一
一
r
u'l一
一‑一一‑=門凸

F

一

F ﹁
F AUTUUAUTuunυ
﹁
1111ntη/
A
H
守
口 U﹁
F﹁
﹁ ﹁
F ﹁
Fナ
ハ
Fl
﹄ Fl
ド
lb
MNUNη300つU Q U 十1
H
I
a
一
一

F

i

しV

‑
‑
‑
一 F‑EllF‑l‑Fnltrηp乙E
A斗 quuNM同 UNMNqd

ト
川︑

﹁ ﹁一一一一 4
‑一一‑‑一一一︑UJ

F

一
一

F

ト

ト

M
M同MMHFトlFトlFトlFトlEU 一

ト

ト

ト
川

3
0U38334い
﹁ ﹁ Ti‑‑ ワ﹄円ノ﹄ iJ

﹄

円

=二 ηノ﹄﹃Iaη ノ﹄づfbJ3
nanD1111η乙ヲ﹄一﹂
FトlFトlFトl ﹁十﹄ FトlFト

ト

ト

J
Jト
J Jlaps
トト
:一:一ト ‑L
huu
η乙 マf J一
Fl Fl一
一‑一一‑‑‑
MHMHnt?fη乙 マf 一﹂
一
一1 1 2 2 1
一
一
‑
一 FlFlFl﹁rE︐r
n471
・uu

ト

F ﹁
F 'inu‑‑nul﹂
﹁

ト

ll

11221
't'nhυFlFlFlFl 一
μ
E
n
nCFlF
MmMMm
一
E一
m N NlMM一UN一一一可l

一二二‑一‑一 i ‑
nnpd 一
一 ‑51nb13 b
円 n
h H n二
e'Inu‑‑11η4 ワ﹄・J
AI‑γaFトlFトlFトlFトlFトlFトlnu

E︐l
J13
︑
︑

,./*境界積域の断絶を[1で表現本/
F
O二0
;
FFO=O;
F
3
1=0;
F
F
3
1=0;

381.
[beta]
/り荒行 (
2
)を数値 1こかえて、地域政を力ウン卜する*/
克d
oi
=
1 出t
o3
0
;
i
fF
品i
二 2t
h
e
n FF~, i=l;

伺吋

uwuN

O

一・

︐
.
本

..
nu

ト

0 ん山

一
守

nHVF

ψA

二+ l

巾
・
計品

3 7 3一

﹁ K3﹁
F

山

﹁

+ι‑n‑
9
M
J
l

ト

﹁:・山

z n日

陪
耳
目
.OBLI‑‑J
土・ Is

;;14

﹄

︑}︐︑ } ' o G F

2SF
・
1
﹁ぷ
E+
‑
n
付
入 n4
' n EhH玖
吉
一
1 ・
1
・
・
4
)
︑4 ︑
白

aSFl

JI
Jl
i‑‑10

﹄

本本本率︑
・
OB
・
fJJJI
s︐ j

目 口 J f・
wh

l.
vvvqF
・Ilo‑‑‑T﹂ 4E
/ ' E J J E J J f︑
t = / J O出
3 干al
Z
4
本F
hIZI覧本
一
荒一
同
レ
FレFレta
N‑J
j
UE''FlE''Fl︐
JIli‑‑ir‑‑tl
︑
︐
ノ
・ Il
ロセいや一 k t k引セ止凡バ凡
レ
一
凱捜・一捜・一捜・一F 穣・一f 刊に
l1
i iZ
・
十 4
町
マ
l
斤‑
i
︑工品︑丘30 戸
1丘
E
‑f
‑却
︒
也市i
仁右F左F
︑
白上F 下F 日F 出

巴I
s巴 F
F
&
i
=
O
:
i
f N
F
&
i二2t
h巴n N
F
ι
i=
1;
巴I
s巴 N
F
&
i
=
O
;
克
己n
d
;

r
u
n
;

軍
国e
n
dma
r
e
ac
o
u
n
t
:

本
‑
‑
‑
‑
‑
二
=
二
二
二
二
二
=
=
=
=
=
=
=
=
=
=
=
=
二
二
=
=
=
=
=
=
=
=
=
=
±
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=

f

マクロ:冊 ̲
c
h
:
d
.a
̲
c
h
a
n担

j
欠ターンの各セルの状態を導出

一
一
一
一
一
‑
‑
‑
二
二
=
二
二
二
二
=
=
=
=
=
=
=
=
=
=
=
±
=
=
=
=
=
=
=
=
=
=
=
二
二
‑
‑
二
二
‑
‑
ニ
‑
‑
‑
二
本
/

巴

S
.
a
c
r
o li1̲data̲change
.
;
/本状 R
S遷特の法目]
1式本/

d
a
t
aC
H
A
N
G
ED
S
;
S色tC
O
U
N
TD
S
;
c
a
l
ls
t
r
e
a
m
i
n
i
t(
2
0
1
3
0
7
1
9
)
;
克d
oi
=
1%
t
o3
0
;
/:t平常地域!こ感染が自然発生し、流行す ξ3本/

i
fF
&
i二
1a
n
dF
C
&
i
=
Oa
n
dr
a
n
d
(
'
u
n
i
f
o
r
r
n
'
)
>二
%
s
y
s
e
v
a
l
f(
1
‑
&
p
)t
h
e
nF
&
i二
2
;

《流行地域から平常地域に、感染が 1
孟染する c
周り!こ流行地域がいきFいほど感染確率は高くなる:t/
e
l
s
ei
fF
&
i
=
1a
n
dF
C
&
i
>
Oa
n
dr
a
n
d
(I
J
ni
f
o
r
m
')
>
=
話s
y
s
e
v
a
l
f
(
l
‑品q
)本車 F
C
&
it
h巴nF
&
i
=
2
/主流行地域が終息する本/
巴

I
s巴 i
fF
品i
二 2t
h
e
nF
&
i
=
O
;

児e
n
d
;

k
e
e
pF
l
‑
F
3
0
;

1
*各地域数集計データめ作成本/

p
r
o
cs
q
ln
o
p
r
i
n
t
;
l
eS
U
M 1a
s
cr
e
a
t己 i呂b
s
e
l
e
c
tF
la
s Ff
r口mC
H
A
N
G
ED
S
%
d口 i
二2耳
t
o3
0
;
u
n
i
o
n呂 1
s
e
l
e
c
tF
&
ia
s Ff
r口nC
rH
A
N
G
ED
S
%
e
n
d
;
qUi
t;

/本集計り.

p
r
o
cf
r
e
qd
a
t
a二S
U
M1n
o
pr
i
n
t;
er
c
e
n
tr
巴n
a
m
e二 (
F
=
S
T
A
T
U
S
)
);
t
a
b
l
e
sF
/
o
u
t
=
S
U
M2
(
d
r
o
p二p
r
u
n
;
d
a
t
aS
U
M
̲
3
;
s
e
tS
U
M2
;
品j
;
T
U
R
N二
r
u
n
;
388

382.

/1'集計データの蓄積 I / p r o ca p p e n db a s e = S I J M ̲ D Sd a t a = S U M ̲ 3f 口r c e ; S . e n d ; /本=二二二二二二=二========二二=二二二二二二=二二二二二二二二二二二‑‑ニ‑‑ニニ‑‑‑二‑‑‑‑‑ マクロ:旧lIp d a ! ̲ e E X G E LS H E E Tの更新 二=ニ‑‑‑‑二二=二=二二二二二二二二‑‑‑‑‑ニ=二二二二二二二二二二二=二二二二二二二二二二二二二二二二本/ 日 S.acro HJ̲lIpollte; / : t更新用 i こr e n s . m巴牢/ d a t aC H A N G EU P : s e tC H A N G E ̲ D S ; 克d oi 二 1耳 t0 3 0 ; = F ι i ; F U P品i % e n d ; k e e pF I J P : ; /1'エクセ,1[ノ更新本/ d a t ab a s e b o o k . A R E A : s e tC H A N G E ̲ U P ; m o d i f yb a s e b o o k . A R E A ; ~;do i = l% t o3 0 ; F & i= F U P & i; 克 巳n d ; r u n ; S . e n d ; /本二二二=============二二二二二二二二二二二二二二二二二二二二二二二二二二二二二二二二二二二 マクロ : m[ o o p 各マクロをまとめて、試行回数分実行する こ二=二二==========================二=======================本/ 包 S.acro HJ̲loop; % d o j=1~tt 口 ι r e p ; % H JI O l ll J l本読み込み * 1 日;え I Ir ell̲cOllnt l 本力ウン卜本/ %ぇ O l lt l l ̲chllnge. μ; 去s l j式計算本/ ~;HJ_ lIpÓll teh書 き 込 h*./ 話e n d : S.en d ; 一一一一一一一一一一一一一一一一一一一一一一一一一一一… バ 長1 寸吹' 覧 足 loop 6 . 文献 1 )高 浪 洋 平 ・ 舟 尾 暢 男 ( 2 0 1 2 ) .統計解析ソフト SAS,工学社一 2 )A r tC a r p c n t e r ( 2 01 2 ) .C a r p c n t e r ' sGlωct oI n n o v a t i v cSAST c c h n i q u c s,SASI n s t i t u t c 3 )北 栄 輔 ・ 脇 田 佑 希 子 ( 2 0 1 1. )E x c e lで学ぶセルオートマトン.オーム社 389

384.

: s 縞ユー十総会均 1 1ご 一 一 ! SASCDI環境における SDTMとD e f i n e . x m lの作成 迫田英之/楊敏 株式会社タクミインフォメーションテクノ口ジー システム開発推進部 C r e a t i n gSDTMandD e f i n e . x m l I nSASCDIenvironment H i d e y u k iSakoda/MinYang SystemOevelopmentOep , . t TakumiI n f o r m a t i o nTechnologyI n c ISユーザー動:川 三 号 制…'"吻比一 凱 7" h ? 三 ~I 要旨: SOTMデータの作成については、試験ごとにプログラムを作成し、 SOTM化を図るケースが多いと思われる。 ここでは、 SOTMデータの作成に関する標準化や効率化などの 課題を解決する手段の 1つとして、 SASC l i n i c a lOataI n t e g r a t i o n 環境における SOTMデータおよび CRT‑OOS(define.xml)の作成 方法を開発事例を交え紹介する。 e f i n e . x m l, キーワード FOA,COISC,SOTM,CRT‑OOS,d C l i n i c a lOataI n t e g r a t i o n,C l i n i c a lStandardsT o o l k i t 393

385.

.. ユザー総会加~白山…セム 三 mI 呂次 1 .北 旦 同五ミ 2 . SASC l i n i c a lStandardsT o o l k i tの紹介 ① ② ③ ④ SASC l i n i c a lS t a n d a r d sT o o l k i t ( C S T )とは サポートしている C DISCの規格 CSTF r a m巴w o r k CSTG l o b a lL i b r a r y 3 . SASC l i n i c a lDataI n t e g r a t i o nの紹介 ① ② ③ ④ ⑤ SASC l i n i c a lD a t aI n t e g r a t i o n(SASC D I )とは SASC D IとD I Sの相違点 SASC D Iの操作手1 1 頂の概要 SASC D Iを使用した感想 SASC D Iでの SDTMとD e f i n e . x m l作成の課題 4 . 開発事例の紹介 ① ② ③ ④ 開発事例概要 開発ポイント 開発事例での SASC D Iの操作手1 1 頃の概要 SASC D Iのメリットとデメリット(開発を終えて) 1 1 : MS ユーザー鍛治問ロト?リ セ デ d ~I ;::j己王手 間五ミ 2004年 7月、米国 FDAが「臨床試験データの申請には CDISCIこよって 開発された SDTMを使用」とするガイf、ラインを公表した。 CDISC対応を見据え、データモデルの迅速な変更対応、各企業のデー タのバリエーションの柔軟な管理が課題となり、 CDISC構造のデータモ デルの作成と検証がで、きるツール開発の必要が生じた。これらのニーズ l i n i c a lStandardsT o o l k i tを開発した。 に応え、 SAS社は、 SASC その後、 SAS社は CDISC対応の支援機能を実装した臨床データ統合 l i n i c a lDataI n t e g r a t i o nを開発した。 SASC l i n i c a lData ツール、 SASC i o nはユーサ.ビリティーに優れた開発環境を提供し、 SDTMド メ I n t e g旧 t イン作成、データ標準への適合確認、 CRT‑DDS作成機能、 Medidata@ 社の EDC、Raveとの連携機能なと を実装し、スピーディかっ効率的に 臨床データの管理、統合、加工を実現する。 3 9 4

386.

│ 以Sユザ屯会……一千三件 mg SASC l i n i c a lStandardsT o o l k i tの紹介 [① ~α-泊mm吋~∞ImlωæJとは ) 1 1 しているの規格 ③ [CSTF前 1 1 1 j [②サポ ¥ I [ ④ 凶 加r y SAS ユでずで健会加問吟…iIセ古河ン 2013 SASC l i n i c a lS t a n d a r d sT o o l k i t( C S T )とは 〆主に臨床研究活動を支援するための Framework。 〆当初、 CDISCIこ焦点、を当て、定義されたが、 CDISCIこ限定されない。 〆「ツール」のコレクション。アップデートやリリースにより、拡張を続ける標 準的な仕様と機能に対する初期セットを提供する。 ,/ SASC DIの基本機能として設計され、オープンソースの SASMacrosと し てSASユーザーが利用できる。 ,/ PROCC DISCの代替機能として設計された。 標準機能のカスタマイズや拡張が可能。 SASデータセットや力タログなどで公開されている SASの標準機能を提供 する。 ,/ Framework: ,/ ‑Contentss t a n d a r d s :SDTM,ADaM XMLs t a n d a r d s :CRT‑DDSandODM ‑C o n t r o l l e dTerminology 395

387.

│ 鮎Sユ ー ザ ー 総 会 加 問Jロ … 一 一 mg サポートしている CDISCの規格 CST1 .4(最新バージョンは 1 . 5 )でサポー卜されている規格 SDTM3 . 1 . 1and3 . 1 . 2 ADaM2 . 1(BasicDataStructureandAnalysisResultsMetadatatemplates /V a l i d a t e ) CRT‑DDS1 . 0(define.xml‑Create/Import/Validate) . 3 . 0 ‑Read/Write/Validate ODM1 NCICDISCC o n t r o l l e dTerminology( A p r i l2 011) l鮎 純 一 ザ ー 総 会 ロ 九 ツ リ ー … m l Jg CSTFramework 次の 2つの部分で構成される。 SASFoundationと共有ファイルの一部としてインストールされている コンポーネント。 (SASMacros、JavaJARファイルなど) ‑SASROOT¥S A S C l i n i c a l S t a n d a r d s T o o l k i t F r a m e w o r k ¥ ‑SASROOT¥S A S C l i n i c a l S t a n d a r d s T o o l k i t S D T M 3 1 2¥. ‑SASROOT¥SASFoundation¥9 . 3 ¥c s t f r a m e w o r k¥sasmacro FrameworkMacrosの動作環境を提供する CSTGlobalLibrary。 C ¥c s t G l o b a l L i b r a r y ¥ 四 396

388.
[beta]
I
I
!
!
ユ
ー
ザ
ー
総
会
一
…
…
…

、

a

ElJ

CSTG
l
o
b
a
lUbrary
E
l,
A
ic
s
t
G
l
o
b
a
l
L
i
b
r
a
r
y
i
Tm
e
t
a
d
a
t
a
包島 s
chemaマe
p
o
s
i
t
o
r
y
長 cd町 ー c.tdds‑l0日
必c
d
i
s
codm‑1
.
2
.
1c
d
i
s
c
‑
o
d
m
‑
l
.
3
.
0

,

四

;csTGlob剖 L
i
b悶 ryは
、 CST‑{:
,
.
t
ス
'‑!トール時に作成される。
これは、 CST1.4のデフォルトインス
トールの例となる。

c
o
r
e
s
t
a
n
d
a
r
d
s
回 "c
d
i
s
c
‑
a
d
a
m
‑
2
.
1
‑1
.4
回 j' c
d
i
s
cc
r
t
d
d
s
‑1
.01
.4
t
t
JJ
.cdisc‑odm‑1
.3
.
0
‑.
14
t
t
Jj
;c
d
l
s
c
‑
s
d
t
m
‑
3
.1
.
11
.4
田品 c
d国 c
‑
s
d
t
m
‑
3
..
121
4
t
t
Jl
.c
d
i
s
c
寸e
r
m
i
n
o
l
o
g
y
‑
l
.
4
t
t
JJ
.c
s
t
‑
t
r
a
m
e
w
o
r
k
‑
U
田島 x
s
l
‑
r
e
p
o
s
i
t
o
r
y
畠i
t

日~.

回 l
.CRT‑DDS

Imetadata:登録されているスタンダード情

報を持つデータセット
Ischema‑repository:サポートされてい

るX
ML
ベ スのスタンダード。 X
ML/¥リ
デーシヨンに使用される X
MLスキ マ定義
Istandards:サポー卜されているスタン

ダド
Ixsl‑repository:X
ML変換に使用される

XSLファイ jレ

f
f
i
̲
"
".
0DM

盟聖霊翠題盟罷盟型盟臨醸湿潤
SASC
l
l
n
i
c
a
lD
a
t
aI
n
t
e
g
r
a
t
i
o
nの紹介
[ ① 側D
a
帥担 r
a
t
i
o
n(
S
A
SC
D
Iとは

‑

[!;1,,:."''''_ê]j]]と~相違点

三!

隆弘S(tD]jの操作手般の概要
陣内[fiDJを使用した感想

記

[⑤!;1~,....._ê]j]]でのSDTMとmiII!

397

]

389.
[beta]
I
A

ロ
…
ー

位 ー ザ ー 総 会 加 問J

ω

I

SASC
l
i
n
i
c
a
lDataI
n
t
e
g
r
a
t
i
o
n(SASCDI
)
と
は
SASC
l
i
n
i
c
a
lDataI
n
t
e
g
r
a
t
i
o
n (SASCDI
)
は
、 CDISC対応の支援機能を実
装した臨床データ統合ツールである。ユーザビリティーに優れた開発環境を提
供することにより、データ統合やデータ加工などの業務の一元管理を実現する。
臨床試験データとメタデータを構成・標準化・管理する。必要なスタンダードの
基盤を提供し、信頼できる臨床データを戦略的に分析することをサポートする。
SASC
D
I
‑
:
/ョブの反復・自動化処理で、スピーディーかつ効率的に臨床データ
を統合・分析することができる。
CSTは
、 SASCDIの基本機能として、 SASC
D
I
Iこ含まれる。
時 組 閣 韓 国 主 幽 嗣 蝿 罰 覇 榔 脚 開 祖 一 時 国 車 問 輔 轍 掴 圃 醐 醐 棚 踊 醐 醐 圃 醐 醐 ‑ Iロ IxI
ファイJ[,{f)極集回置孟[Y}チヱ拶クアヲト(f;)アタシヨシ(d)デバック{国ツー3
ほ ) つ イ 〉 門t
盟}何レブ包}

続
楓
f
t
J
;
'
i
.
(
凶
'
磁
必i
ザ

J
.

フ
オ タ

"
.
.
.
X
:
時 制t
縁 緑1
M滋1
i
l
llIIt必勝 j続11'1
ρ
i
l
l
?

i やめ円

・i 置決 F j‑
1
1

O
l
i
n
it:lIlAd", i
n
i
:
stul
幡町

備 努

信一̲jS
l
l
助
lti ーJ &b1"l 1~"; >OO
.
̲
jD
a
l
dSI.1l"ll:!"d~
I
!
;̲JC叩 I
r
0
1回 i
e
r片 岡 同v

a

I
A

白
山
…
…

位 ー ザ ー 総 会 内 向 。J

mm

SASCDIとDISの柁違点

回二JStudy
[B:コ Submission
[
B
.
:
ーJ
DataStandards

包
二JControlledTerminology

12

398

390.
[beta]
│鈎ユザー総会湖町付…
SASCDIの操作手順の概要
SASCDIを使用して、スタンダード・スタテ、ィを新規作成する場合
の操作手順の概要を以下に示す。
共通デフォルトフォルダ・ライブラリの作成
1 スタンダードのインポート
2 スタンダ ドのメタデータ修正
3 スタディの作成とカスタムド、メインの作成
4 カスタムドメインをスタンダ ドヘプロモート

5 ソースデータの登録
6 マクロプログラムの登録と SDTMデータ作成
7
.CDISC‑SDTMCompliance
0CRT‑DDSとCRT‑DDSV
a
l
i
d
a
l
i
o
n
8
.CDISC‑SDTM1

9
.C
o
n
l
r
o
l
l
e
dTerminologyの登録とスタディへの関連付け
1
0 ジョブ、のスケジユ ル

mJ

恒ーザプ総会対一一…ン…

2

共通:テ、フォルトフォルダ・ライブラリの作成

一一……←一一
・
フ FイJ凶η 健畠.{l:;l~(I.')7'ユタタYウト {q

I

》押

p~

.
,
,
1
:
.
1
111 0

,縄Il~fl}..闘 4曲折‘..)(

.
1 o=

i
'
.
.
.
.
.
.
.
.
‑
‑
.
.
.
.
.
I
‑
'
J

四叩向川

J

ω

陶︾

J
刊

剛山叫

uu
円

一ぃ︑︐

劇

WF

08λ

'
J
JJ

‑
m

川抑

前

ω

UHω 州 ︑ ︐ 阿 申 町

ι 日︾﹀し山﹀

山町

MhmM

山M

399

吋剛︑

叩

.臨轟画面幽圃・・・・・

川崎市一時州民甲山︾んじ

「

hoh引にぺけ

'
.̲
J
e
o
r
,II0!
>
.
d恥 司 自 問 甲 町 肱 出

1
1
1

}OU

'_J思覆思思~

制予

1
・1

.
:̲
j
s
.
J
;
,.
"
u郁

h z サ M E 川 崎 N H 何E } 叫 ︐ o h ︐ 己 ー が 明 町 ' 怖 o
ι
!
n'

cINe.alAd同国・回
.~ .
.
.
.
.
.
.
.
l
$
!
t
幼

U
H臼

,

刊岬

h M L恥 ﹄

・x
.町 四 ? 岨 a
I A J附 H 日 1・
1

断鏡限配 0・極畠,>,

!
l
j
i
n

刊 一 一 回 町 可 咽

"匂覆零M チェ,ク7つNC
)

叫劃

J
同

J

イ
"η

酬刊刷川

[
戸
田
町
,
.
r
.
u

叶

T スタンダードのインポート

aEE?"

-品川,~一旬守.~.・-

l
j

t~.kI町民湖、
品斗ト!....~ , ぺ 却 制

日
̲
J
l
>
"
'
"
叫
~(;J.,~齢~

忠
一
口
⁝
⁝
⁝
山
町
山
町
⁝
⁝
訴
は
同
町
ん
ぷ
⁝
⁝
口
一
⁝ι⁝

,~.・州

um 山 一 山 川 恥 山 山 山 山 山 一 川 山 時 川 酌 め 川 " 山 川 日 引 山 川 M M 川 川 町 W W

l , .~.:"'T"

‑γ‑^
帥同

同一叩⁝

r

1M
,岬

?出刷、
_J Ft,~.[",1. r"

N﹂

,、

j

:
~: n
.
:
̲
.
,
:
.
r.

ょ三軍 b刷

JF

'-;;空空き~認調

ご ωつ司刈H河辺川勾司珂H4司﹄司d司同 司H司可吋珂一司副同国 du

D
‑
'
.
.
.
.c;.,.一切"

事前にデフォル卜フォルダ
とライブラリを作成する。

j

̲
j
"
"
"
,
コ ~1

391.
[beta]
84

手¥目白

EHUVSγ¥

UH

沿い¥山町ーで︿むし長引!ゆ判事同
N'UF

鳴

ぃ

凶日

崎市川一

HHV月

吾意
川
1 1 11︑¥
;t

Fミd守 電 了 闇 凶 阻 園 ・ ・ ︑

Eas‑‑

V34

J

i
l
l
A
t
f! i
5
毒装 二 j
Y 一
mESE7iz
9
1
3
j
i
l
t
i
l
i
‑
‑
!
t!
EAUM9518
ヨ﹄﹁
9ず轟的WW
望 uuu星
zF
酒量制向き合えぬ
FEF
旨;ji
n u x ‑ s j ωJE

寸司沖什一社 UF
H
山
a
p
T円・弘久一
寸詩
ω U Fゆ
判中ベ
3fifM冷いはrii:K
十L
回殴眠障EEBB‑Eいよ
2
3
主
いいれ将勝一
U川U劃f i l i ‑ ‑ Y F ¥ ‑一u船目 EC
ド自国圃・・圃圃圏一いたほき

z
a
m 1奪 ︑ 芸 品 し

連 古fjit‑t
‑i副 司 ¥ 一
u'‑
‑w¥
i
聖書苦手
L11r¥
isbh

UM28守

feiEFiji‑is 冷沼ぽ活ド

何日

掬

AvaB

き

刊行制出汁

ヌグ健協

iT

t‑mumags‑

パーがわし十{子

ド

S'A
ast
HHHHI‑uiaT
宮
kE
iFi
i F

g
i
‑
‑UHd

︐

漆終草築制r

︼口市
ゆ引か }LJX
hF け UF
よい¥州知沿い¥ゆmj}hV/ けU
泌
m
m凶 器 制 踊 謹
記
事
こt
vg三事・ 2EEt

.1i

竜
.

の
S
し匂宮司 "訴

V32vtF"

首︑同22465

、
.
r
.
ド

、
q

H

︑いみ調

一
札
口
同
HEHE

e
u明 日 だ5411IQF

し36どいい
eL 同︿同夜 4dw

i

品︒︒

i
i

392.
[beta]
I

PmJ

制 ユ ー ザ ー 総 会 対 的 問 九 ソh 引 ン …

5 ソースデータの登録

・

1hE
(
j
JW

,

!

つ盟問
フヮプゲレ…t'{時

E
回r
o
:
5
,0
2
;
5
T03

持咽ー S伍 OATA
~'Sct育",.

i
コテブ,ぱT
)
.
.
.

c
t
n.
c

当コピー(c)
XIi!陸(0)

日フヌ J~(F)

渇ヲヨブ(
J
)

、
,
I
t
虫
色(
R
)
.
.

・
掴 Z社団;慣̲#1耳目

2

l
!
J
m
.

ー
・
司
l
>
>
:
e:
‑
=
F
rI

'r!(l IA_O"'.~ c:t噛....

名前の変更{町

みライブラリ{し)...

固定鋸 (
F
J
.
.
.

~AIl I.OM.$叫

コヌ'"タヘコピー(Y)...

e
lドキュメ〉卜(0)..

; ユ ー ザ ー 欄U
J

fo~;

コヌ J レタヘ岨,(M~..

(
:
'
1メ手(
N
l

監7
宿題島観捜索現・圃圃圃圃圃圃圃圃・ 、

、
一

ミ 昔 、

一一…一

CSV等の外部ファイル

!
?
玩

p‑‑

;巴なおm

i¥
ミ
‑‑‑
一
叩……

~

SASデータセット

開府イ例

ー口密盟彊軍一一つ亡ごてて
τ
:
町リ、山岬
E
1

:
訂
∞ OEU

泊三JlOG

正こj SASDATA

(
'
‑
J

・ . /RAVEデ タ

事斬混作成吋

シ九一
‑J

!下一一両雨戸

一

11ユーザー総会対的苦~#C?WJCÿ均ン

~I

6
.マクロプログラムの登録と SOTMヂータ作成
図上"日 1> 酎沢段留品ιJ ,.}r;:.主P~ 事'P I 窃訂よ昌一)1 図書l1 .m

長正コ・ー
f
I"
U
C
P
v

一
一

"
'
;
;
J
三
五
二
廿

.
.
.
逗
王
手
台 二‑
J

長二7r
許証二)0‑恒三至コ・ 3 一 一

C:D

,イアタ弘

=
‑

lコ ー ド ゴ 回 叶 内 情 ト ・

401

393.
[beta]
201g

.~ユーザー総会対的問九州内ン…

8
.CDISCωSDTMt
oCRTDDSとCRT‑DDSV
a
l
i
d
a
t
i
o
n
悶

轟轟扇

霊童よぱ幼 1 1>寅倒的白 1弘(S) や羽軍 IP~U~ ,~1f豆i 臼
① CRT‑DDSドキュメントをメタ

換を使用したジョブ、の作成

gh

副官官↓
一揖一

一寸一

aL

一

P ﹃t J i 由

一

}4

j

データに登録

② CDISC‑SDTM1
0CRT‑DDS変
③ ValueLevelMeladalaの追加

F)t.'l間協同軍・ E・g ・E晶 ー ー ー ー ー ー ー ー ー ー ー ー

I
I
1
I
I
1
:
'
,
(
妙 11>実行(8)・(('止{殺事P伊軍司p9
.
>I
Oi叫問12]

百

函
亙
こ
よ

亘三ヨ圃

J

3

L

l 鉱 炉 ザ ー 総 会 向 付Jロ ト ー

7
.CDISC‑SDTMCompliance
ロ
コ

E書烹町宮想脅曹照司君担圃圃幽幽幽幽園圃幽圃園園町二:‑r王玉fVll
1i!I~'"以砂質問咽銅鐸止 ι t>1JI '
IQ
:t>晶 4J斗 0(11

.!L̲j .
.
C
J
,
.
,
‑,
,
"I~
".̲ ̲I̲I
t010 ‑}‑ '
"I嗣 " 叶 ヨ

笠7!
t3とよ」之とL
旦とLn
単じこ

I

c
l
i
n
i
c
a
lAdl
l
l
i
n
j
s
t
r
a
l
i
o
n

1
1
l 【:~l

.
:
.
.
lS!udy

防 」 抽 m<
iSoon

l 回_j D山 5 ,~凶~d ,

;
.
;
ーJOOTesl5
1
省、d
d
f
d
s
L
!
;̲JOOT
e
s
tS培、dðfd~2
i
!
: ̲JOOTe~1 $lar凶ðrd~ 3

'
""
m;mI" 1
‑r
_J 臼~"....
jP
r
o
阿畑
ヲ:̲J加問 V
ヲ̲JV
d
l出

s

検剣略

幸
弘

品

1
'
=
'
>,周Iy盟問団.
1u
田9"

門内
九
‑
‑
、
.
J
ゴ;
ζ
:
z
;
;
ζ
:
z
;
0…一一一…一 …一……一
…
…
…
白
一
一
一
白
一
…
即
一
一
一
出

芯山斗 τ
π
E
S
H
‑印
C
i
1
‑
‑
:
.
JC。恒m
耐白。 I
I
e
c
!,
T
花
'
"

m

…
一
X』帥陪馳匝

島

さに三ζコ」立込J
ニ立製ムJ
…
…
…
一
ヨ

~ ̲lT
巴Y
下
一印DT

己 1γ?
守F

徹録

i

チ工ツク項目が力スタマイズ:パ

j
できる。(新規.変更.哨仰引自肖削J
I
胎除) i
‑‑‑‑ .
"
.
,
‑
‑
‑ ‑ ‑,
.
.
,
.
.
.
. 1

円 一 一 一 一 一

402

394.
[beta]
l

W
J
B

Sユーザー総会……日ンセッション

鮎

9
.C
o
n
t
r
o
l
l
e
dTerminologyの登録とスタディへの償還付け
w

l

1
‑
l

イ月初

J川

t
立
:
T
引
:
L
T
τ
官
3
ご
~二で主,cd
ヴ
j,..,ててJ:rTで:吋叩抱
t3

‑
白
‑
"
'
‑
一
回
宇

弘'-'~
之

コ.,~~

鼠泌総踊四四回目剛一

c
仙h拍
i
c
.
a
lAd由副同陥凶 畑飢

戸」 坤

"
II
t
dT
..,.司市町町l'b1e<

1 インペン柑

1
‑
1 耕

c
印l
i
、
n
i
c

‑
一
一
一
当
U
証
】
.
1i
1
ヨ.
.
.
JS
,
叫
岨y

・‑,‑ぐ i
雪斗?で,̲

1

;
i
搬出自信:;;/ポゴ幽逓恒三
'
:
:
D5C‑SDTM2
1
1
0
i
l
!
9(RhtSD'"I 1

言語蘭E

!

四

"
We
匂

a
?
:
t
・
.
.
.
.
.
.
.
.
̲
r

向
I
'

i

万岬

心。仰

1
‑
1 記
長

3

均

a

c
l
i
nk4
1Ad・in~tr.t堤同

‑

,
.

I
3
5

:
:
: ̲jSt
u
1
y

乍
.
.
:
.
J
o
.
, ...kC
酬 W叫

・
官

'‑"JM.
.
.

[Add]ボタン押下にて登録され

I
I

ゐ DOJSi
W
t
ゐ舟OOSW~
S同 省

φp
∞

ている TerminologyPackage

一
}

ーーーーーー‑

3

ζ
:
.
'
"
6・T<
s
γ
"

を追加する。

一時計

市
山
花STAIl~
TESTM~

主笠一

J
ー
ι
」
ー

一弘

4\!!~! &
udv

…

;
t
弓京.L一一.晶僧世田園

│
ω

,

U!:J三百J1

ユーザー総会加問…
ー

ν

ユ
ぃン

ケ

ス
の
一

一門︼

弓
Jm

ブ﹁
ヨ
一
叩

4

︑
r

一ン活問

O 一銭

①ジョブの配置
②フローの作成
③フ口 のスケジュール設定
④実行結果の確認
際おお渓蕊滋怒滋踊泌泌議輔融輔輔輯輔

一一…

よど岬].~~L笠t!.盟主授は法!L叫剤
liH翌日空‘三L;!.~, ;d
>
.
l
l
̲
.
'1j.?'~JL>t!l-"l 闘 I
I
(
F
)
吋

、予軒 t
lmll"

ニ1
1
1

,
.
.
位
向
"

唱〉尚、fif~ り 4

,
:
.

1'j‑li マ才一ツで

主スー)~ -,~ .~~ ‑
;.

よ ー
7
市デユーフテ

,.

ニ
と

:
'
:
i
:
'
:
>

? 五 万jヲ

;
;
=

〆
I
~ニ:2t!ニ:ァ
i
1
.~(>

~.IèJ・デイレ円クト1. 1 (0).
,
ー

喜ユーザーで~すべてのフローのmスケ 3ユ白川'),

当面!,~ーソT

c
.
.
.
.
.
.
c
.
.
.

,;,~,,'~.f 判明

?注!'I

I
IO
i
d
,
r
,爾帽に更新('】

~; :.を"');~'--'~・I::sll現E理軍宜容調書ー圃圃圃圃・一一--::;0
子、71':'‑デ パノ
"殉沖亨 、マ才

e院

・ llll ,~~ :/1:;'・1!'1~'.f

'
.
.
菅
'
.

品 品S山'^ステッププロクラふ句史!I(
p
)
.
GEZ5.aプの冨"'"}
[
品 xプヨレヨ :.(Qト

汁

:;;叩的由民匂。
当
泳
詰
柄 M 己尉"民凶a
曲』

~1..''''1ω咽 ν 片岡 1

.
.
.
.
p
.
.
.
̲
,
.

省τ
.
., 旭 国 掬
必υ
νゅ
も
な
l
1
t
1t
̲
l
畑川
:

l)~宅問 f -'J~

・
"
.

.
ζ

qo)
・"バヲ,.
.
/
,
.
ラτ
νー1.)"! ぬ.."諸倒・
η
、フ"ザ法,・ V
.
'
:
;
" ・."‑<.:卑A{:I).

1
1 022ごごとヱc)竺~.:1M干VJ

… ]ー一 一
"噌~,.~-コヲ

.JC '

4
0
3

緬,......-"."...~恥ーァ"し

町
一
←

山

府守「ーョ?<附酬附

ー島崎~;(- ..:~ .
.

E
よ与市'.苦"

v

f

,
1
'
d
.
.

l

作 08
防

訓 lIt~/ll !
lt~ 1
1

395.

│ ふsユーザー除問宍r.1.aH.i口九ソー… 2013 SASC O Iを使用した感想 1 . GUI画面での操作は理解しやすい。 2 . スタンダードとスタディの管理が容易である。 3 . スタンダード、とスタテ、ィのカスタマイズが容易で ある。 4 . Medidata社の Rave(EOC/COMプラットフォーム)と連携がメニュー化 されているので使いやすい。 5 . SOTM/¥I)デーションが自動化されており、さらに SOTM/¥リデーション 項目を容易にカスタマイズできる機能は利便性が高い。 6 . ControlledTerminologyの畳録とスタディへの関連付けが容易で、あり、 COISCTerminologyとCustomTerminology を柔軟に組み合わせること ができるので拡張性が高い。 7 . CRT‑OOSの作成とValidateが自動化されており利便性が高い。 8 . スケジュール登録によるジョブの自動実行に対応しているので、運用作 業が軽減される。 │Sユーザー総会内需初 ロト&ソリーセヲゆ 鮎 J ~'llI SASC O Iでの SOTMとO e f i n e . x m l作成の課題 1 .カスタムドメイン定義の CST畳録ができない。 2 .CustomTerminologyの CST登録ができない。 3 .CRT‑OOS(define.xml)の作成に以下の機能が必要である。 ① CRFのリンク付け ② ValueLevelMetadataの作成 ③ Commentの反映 ③外部辞書の作成 ④ RoleCodelistの作成 4 .SASCOIジョブのメンテナンスが煩雑である。 5 全スタディーで 共通に使えるマクロの部品化(効率化)が必要である。 ※特殊用途ドメインの作成、 XPT変換、 StudyOayの算出など 6 .SOTM作成の共通ジョブ、の作成(標準化)ができるか? =字上記課題を解決に導いた開発事例を紹介します。 404

396.

I~ユーザー総会均一……→…ン mm 開発事例の紹介 [①開発事例概要 │ (②開発ポイント ] m Ml 1l n 操作手l 績の概要 (③開発事例での [④~"IIJ111のrmIドとデメリット(開発を終えて ー ョ ‑川 1 γ古 │ ωユーザー総会…~'VDEO"Ëiン問ン ] j p . { I 1 1 g 開発事例概要 <システム概要> 最初に、実際のスタディをもとに、 SASCOI環境での効率的なスタディの組み込み方針を決め、 部品 (SASマクロや 0 1変換ジェネレータなど)を作成する o 同時に SASCOI操作手順書としてま とめる。次に、作成された方針と部品を使用して、 1つのスタディの SOTMデータを作成する。 <全体フロー概念図> 、 " 405

397.
[beta]
mI

|以Sユーザー総会~………

・

開発ポイント‑1

C
D
Iサ‑/¥、 CSTディレクト J
)、C
D
I作業フォルダの構成

〆各種定義書 (EXCELで編集、 CSV形式で保存)の保存場所、各処理プロ
セスの入力ファイルと出力ファイルの格納場所を決める。
〆セキュリティを考慮し、一般ユーザーがアクセスできる場所(共有フオル
ダ)を限定する。また、必要に応じて、フォルダのアクセス権限を設定する o
J 中間 D
a
t
a
s
e
tや PGMは一般ユーザーがアクセスできない場所に出力する o
J 新規 S
t
u
d
yの場合、ディレクトリとフォルダを簡易に構成できるように、コ

ピー用のテンプレートを用意する。

I~1:)ユーザー総会内町@'Z!.p;:;:r,yÞS::::;…ン
①C
D
Iサーバ

②CST
ディレクトリ

3~ 酎ュ-~(叫
j
.
. So
¥
5
C
(
)
{

.
n

?J
.I
h
.
.,"

町

、..c~ !G同.e ILb~y

. j
.
. e.岨占島内‑

瞬

周防・国

白内

問 A回 漕 耐 守 録 蝿 畑 y

久
HI̲P4r世d
・圃圃園田T
唱圃幽圃・酬明相官E・E ・ ‑

t

.
.

}出E
四
S~

伶
コ

.
i
.

"
'
1
島 吋 = ‑ 国t
m‑3
;1
‑
1
1

e

SO
l
閣O,
l
l
.T
,
l
.

JaJ
巴

a.副'1lO

九

置 、 九

I

出 ザ 回 申d

E..

引回.ar6‑I
O

,
,
,
"
,

I

".
‑
I
.'"叩加岡田 i

注ゐ

~~"、久、
ム皿
1
:
:
;
:
;
、 、

l
1

九一

J

ふ同

Iζ二と二"~"'''''~Itu:

町、

I I
I

r
;
:
:
)

~-~ごZ二;明市凶 .b

葺
二ニ l'ぷぷニ
.û 曲 樹 脂 叫
剥斗

"
ふ
と
:
:
‑
‑
.
.
;
̲
『、‑
y d曲 町

M

ー

晶.oATA
e
;
lu s
由
,

、

l

.

I
ト 却T
時 M A I

r
.

、

a 時 世a
師
三二t.剛山川

~晶.sn:

;
;
立

,
"
I
1
'
¥"
.
1

'
!
l
I
I
O
A
T
J
.

o
.
̲

,
I

・
司

コSC

山田山"
WRA
¥
I
を OATI
¥

I

E・ ・ ・ ・ ・ 圃 圃 戸 田 園 田 園 圏 直 面 園 田 皿 、 ̲

.
.CSl
l
Oo
l
o
T
A

Sj,.申=

I

,由什、

担.;e‑"$I

‑
‑
‑
,
‑
一

‑.5
励
C
[
l
,
l
l
l
.
TA

肘
e
い
̲
"

山'申

3 一」除踊‑
LlC
M
P
̲
・
.
cz

?J
. cd防c- ~erm四回r-"

~'.. StlTW

・ 2H5

μ

c
d暗 巳 甜 昨 3=
2
ト川

5<ふ占温b

Sム臨抽

凶』・,̲

,
‑
: ;_)SIO凶掴..[)O~

:
!
il
,c
d
r
.
c珂,...‑130
ト1
1

,...".広

・I

j
‑
! 四 ・i

'.4助,̲
.
.
.
:
l
恥B釦£匂

ヨA 吋 信 「 岨l
Im
‑21‑1
.
:.
.
.
.c
c
h
:
;
:c
‑
c
,
!
d
d
s
‑I
か1

‑
"
凶
,
‑

1 {:舟阿

RM

81 国 "
"
d
,

~'"・~曲"""
3
.
.
.
.
,
. GDT例

&1世'O.X'町向l'量均'.

c̲
凶M・m・
・
・a

』ら阿国.
.

"
'
,
j
‑
,
c
.
b1
2I
tS

.

③C
D
I作業フォルダ
一
一 一 一 一 一) 7一
ファイ叫η "'(E) 包珂V】 テエヲタ宇ワt{C
'
タ
ヨ
レ5

日.....ポりューム(H)

。
"Ib

~I]j I

‑
ー

キ
1
0 ~0'I!,rご

一

一、、~

‑‑‑斗~ーー

一一一「一ーベ C
Bコピー用のテンプレート?

企竺竺:一一…一;
t

406

398.

I S 崎 ユ ザ ー 総 会 一 一 … . … じ 三mI 開発ホ」イント ‑2 圃必要な定義書のフォーマットを作成し、定義書を用意する。 J カスタムド、メイン定義書とカスタムバリデーション定義書 , , /D Iジョブ定義書 ( V a l u eL e v e lMetaDataの定義を含む) 一〉デザイン系ドメイン 一〉一般ドメイン 一 >s upp系ドメイン 一一>RELRECドメイン 〆 CustomTerminology定義書と外部辞書定義書 , , /R oleCodeList定義書 , , /i 最後に実行するマクロ」定義書 l ωユーザー総会一一日…… 三点 mI 定義書フォーマットの例一 D Iジョブ、定義書(一般ドメイン) 407

399.
[beta]
~I

川ミザー総会……‑知的知
0
1ジョブ、定義書の例‑DM

YEARS
C
e
l5e
whentab
A.SEX;
、
=
"the門
subst tabA.SEX,
l,
l
)
else'u
end

ベ

ASIAN
substr(tabAνarO,
l,
l
)
'the門 Cl
whe門 l
when'
2
'then'C2
)
'then'
C
3
'
.
.
.
.
h
e
n・
when'
4
'then'C4'
when'
5
'then'C5
when'
6
'then'C6'
e
!
:
;
e
end
DT
純FL DR(tab6.varA)

曲目

│
ωユーザー総会対……ーンセツ泊ン
開発ポイント ‑3

・機能別に共通の変換ジェネレーターと 01ジョフ、を作成する。
値が変動する項目は、オプションとして作成する。
斗缶四回 D.:o!~

8 U

8.l :;~Folc知

J
: L.斗白 m
'
嗣Joゐ

.心1伐蛇

U耐内『

h

。,丸入タムドメイノ定程書主民

0 2 括処理

場 2150T同 日bドメイン定程
0 2 2丸入ヲム1¥')亨ーション定菟

母 23SDTM
作即日ブ定義
母 2
1CRT‑DOS
封安定項目の設定めPG川事民
モi} 3SDTM乍民
G 31CDJSC‑SDTM白 司 同 日
品~ C
RT心 国 内 民
笹 5Cu$l
o", Te<m間 同 直 抹
{) 6 円 支 全

、
、
、
、

~,担弘ドメイJ定有害 f問

2 括処理

宅J 2t50T IoI朋弘ドメイ~,主義
22カス見l
i
'
JデーソU 芝 草
2350TM間 DE
'
:
31
百
E
~ 21C
肝 D
D5烹怠定"自のZ
実支の町"内民
E
~ 3tSDT
叫 惜(
5"‑,,市定)
1
'
~.J 3250
制 作 間 刊 イ ノ 系 候 SU
円引
車
33SDTMfl民〈町 lREC)
~ 3
1COt
s
C‑SDTM白 司1
目的咽市宮
11
1CRT‑DDS亨i提 3
閉 めi
程
<
$
I
>
.
c
f
l
'a
'
l
8
も り CRT‑陥 組 制 目 岨 安 定
宮
5C
u
!
;lomTerm同 町 虚 録
司
6XPT
玄限
切

変換ジェネレーター

、
、

、
、

408

g

WlJ

400.
[beta]
[ミム片付会加~ソリー

201g

開発ポイント ‑4

.SDTM作成をデザイン系、一般ドメイン、 s
upp系、 RELRECIこ分
けて、それぞ、れにロジックを定義、実装する。
l
o
:
i:却問伝説2
'
<
'
"、
吋
マF " " "<''';Ji弓尚W

向、

包上ハ川日行刑判止..、~> '
l
P ~ ~:: '
l
> 治官│国;~ヨ|唱富民), 1 阻

、J

加
一

1弘M 作 成 《

どと

一
.
.
.
.
1
l
!
J一
50!'"作 成 {

骨

:
OU
P
P
i
iド〆,>仰慮

」一一一一一一一@

:
ι
8.
=
J
里

'回の 8 r
f (i)1O圃

I
m
m

内 ザ4
絡
会
一
一
P
7
.
U
!
Z
j
ロ
ト
ー
.
.
一

開発ポイント ‑5
圃S
DTM作成から CRT‑DDS作成までを 1
つのジョブ、としてスケジュール

する。スケジュールしたジョフ、の実行結果をレポートに出力し、関係者に
一→
一一一一一
メールする。
:
;
z
:
.
"
剛
刊

.ー

会:
;
a
s
c ‑‑0
」 ーγ ‑

tヰ
土
手
を土L ふ
グ烹プ) l'守柑働制V川角・~ '?"''''~:''I::;...>l!-~''''''
問 問

ヨ匂ぬト

日

戸

M ・
,.込町《、,
R~.o.

<・・品4初・巴寸別総・~.偽縛・・,.

バヲチジョブ確認レ車~~
約 __t対 A必醐 S~,轟 S.~“.,..tfo,
あ秘 W揚

c
。明湯川ゐ円r..
u
.
.
.
o動0・Sd‑Uot

l
l
'
渇

f
5
.
l
Ij

$t凪酷

拙2居畑附抽出直血m!~l~C凶咽圃

"曲

以即臨

捌.崎明刷出踊

ν理nJSH1l: E・圃

& 抽M

.
.
.
加

409

401.
[beta]
201g

ーミユーザー総会……ーンセツ泊ン

作成した Define.xml
~creat正月出5 凶f

~A
E.xpt

LFA.xpt

~SE.xpt

~5
UPPlB.xpt

~v匂l出t正内dds 凶f

uCM.xpt

UHx.Xpt

U SUPPxU.Xpt

.
̲
.SUPPMH.x
同'̲:l¥I, xpt

選~icon l. gJf

.
.
JCO.xpt

GLB.xpt

~SUPPAE.xpt

~S x
pt

'
̲
:
V
5
.
x
p
t

盈]icon2.gif

UDM.xpt

L.J阿 H
.
x
p
t

~SUP同:M.xpt

~TA.xpt

唖;dennel心 .
O
.x
s
1

.DS.xpt

L~ 陀 xpt

L
.
i5UPPD阿 xpt 一 :TE.xpt
uSUPPEX.Xpt

.
v

ふ
工
士
一
?
寸
三
ん一
一
一

波

}
q
で
!
r
I
C│鑑幽盤
>
I
剖

!「

I~

H
開戸時

f
;

印 .

1
日 ‑1

..,.ん1

一
血
.
.
.
.

咽醐

1記

1""…一一「一|刻印紙Ll~却益"'"

│
誌 i
… …

。-,~咽凹&時崎臨海副~副

F品
目
.
.
.
,
.
.
,
.
.
.
.
.
p
:<Ia
t
,
.
a
国π間四・

E
旗蜘雌主必凶酷

1

1……
~~'I腔詰詐2叫出:詑記立t
払:払泌印イ伊「γ
門叫…吋幅
-1際滋撚繋伊ぷ昨伊宇
?D 凶盤岬叩a

も翠盟盟主

山

1
t
:den同 2‑。心 xs[
担 denne.css

r
.
.
.
.
.
.
.
.T
l
, xpt

1
志
:
ヤ
h
h
i
j
i
t
k
r :
‑
L
十
仁
;
i
i
7
s
¥ プ.,....‑一 一
冶
沿
む
判
れ
ぺ
.
, り
ヤ
;

.
̲
:T5.xpt

国同・
.....

[0・.~吋阿川川酬相公定調帆,

i
…│一一院窓宮山
、
τ.
n
急
、
。 owr

す 白 血 耐l '
t を 竹 t以lIi
l
D 1
0:泌訟縫晶玉品Z鎗 出 窓
Pl
D
ぐ00 '
'
'
'
[
r
血血皿1
5.
.
.
.
'0沼;)C\tl問。
I~浸ll'ß.MU脚信望

im
,
,d m m l l
正
X
S
P
I
D
I~
1
"
‑問 削 阿 白 幽 崎 伸 南 咽 開 ' 田 I
T
U
O
I
咽 咽 │ 叩:
.
:
m口 1淡 町 巾 1
[,0血血A泡.
.
.
.
.
.
.
["園田-陣網代 f..~",.開九州開 I
I
fA$.PD .,¥花S官 n I
竃凪量魁凪
"λOQJ¥'!l
>
π百九M

民畠‑

阻止竺i一一 I~ぷz:コJZLttヰ lr~u~およ部2 牒蒜謡曲一 11

lω ユーザー総会 UoW7Jao'1.lロ 九 … …
開発ポイント

~g

その他

圃処理効率化用プログラムの洗い出しと仕様決定=宇部品化
圃必要に応じて処理効率化用プログラムを追加することを可能とし、
追加方法を手順化する。
作成と C
RT‑DDS作成の実行ログを出力し、保存する。また、
圃SDTM
SDTM作成の結果レポートを生成する。
回 FDAfこ提出する資料や結果ファイルなどは、 1箇所に生成される

ように設定する。
圃C
DISCのスタンダードやカスタムスタンダードからカスタムドメイン
定義書を生成できる機能を実装する。
圃他の SDTM
ドメインと関連する部分はマクロ化し、「最後に実行す
るマクロ定義書」に定義する。これにより SDTM
の作成順番を考慮
する必要がなくなる。

410

402.
[beta]
mI

ω
Iユーザー総会対均一一一一ンセツ泊ン
開発事例での SASCDIの操作手煩の概要
(
1
)
Custom
Standar
dの作

(
3
)
Custo1
Termino
l
o
g
y作

成

成

(
9
)

(
5
)
SDTM

作成
と

(
7
)
XPT

V
a
l
i
d
a
t
i
o
n1¥、
:
Jチ
ジョブ
確認レ
ポート
作成

9
前
ιτ

eeeeeeeee
(
2
)
Stand
ardイ

ノ
ー
ポート、

(
4
)
C
u
s
t
o
r
r
Termino
l
o
g
yイン

(
6
)
CRTDDS作

、

成と

ポート

V
a
l
i
d
a
t
l
o
n

Study

作成

(
8
)

スケ
:
ノ
ユ
ー
ー
ル登
録
3
),(
5
),(
6
),(
7
),
1
立
、 CDI
(
1
),(
ジョブを実行。 (
2
),(
4
),(
8
)は
、
CDI手操作。 (
9
)は自動操作。

rJ

川 ;
fミ1ヰナザー総会一
7'bTa7/'T!J/Q;.r. ,"_山
' …ン-己
pill~I
SASCDIのメリットとデメリット(開発を終えて)

・メリット
〆操作方法を手順化することにより、誰にでも SDTMを作成できる。
〆定義書を用意することにより、 CDI手操作と共通ジョブ、の実行だけで、
SDTMが作成できるので、 SDTM作成の時間を大幅に短縮できる
J 検証済の共通ジョブ、で、 SDTM
を作成するので、 OCも確保できる o
O

.
.
/SDTM作成から CRT‑DDS作成までが自動処理でき、処理結果のレポー
トをメール配信できる。

‑デメリット
〆操作手I
}
固に慣れるまで多少の時間が必要。
〆定義書の作成に多少の時間が必要。
〆定義書の作成に基本的な SASとSOLの知識が必要となる。
;
e

411

403.

│ 鮎Sユーザー総会内初予 J白 山 …ω ~II]J I 参考文献 1, SAS C i n i c a lStandardsT o o l k i t1. 4 :U s e r ' sGuide,odfb ySASI n s t iでu t巴 I n c 体 2, UsingtheSA5'C l i n i c a lSlandardsT o o l k i tt oV a l i d a t eCDISCSDTM ySASi n s t i t u t eI n c Data,pdfb 3 SA5"C i i n : c a l5 t司ndardsマo o l k i t :d e f i n exmiandValueL e v e lME 、 tadatapdf b yLexJansen, SASI n s r i t u t eI n c 4, UsingtheSA5"C i n i c a lStandardsT o o l k i t1,4t oworkwiththeCDISCODM mode. lpptb yLexJansen,SASI n s t i t u t eI nc . , , 412 ,

404.

FDAS u b m i s s i o nのための d e f i n e . p d f作成事例 ‑SAS⑧によるファイル変換の Automation 化 ー 豊 泉 樹 一 郎 1) 北 西 由 武 1) 吉 田 祐 樹 1) 平 井 健 太 2) 1 )塩野義製薬株式会社解析センター 2 ) 株式会社 SCA OneExampleofG e n e r a t i n gD e f i n e . p d ff o rFDASubmission AutomaticF i l eConversionw i t hSAS人 K i i c h i r oToyoizumil)Y o s h i t a k eK i t a n i s h il)YukiYoshidal)KentaH i r a i2) , 1 )SHIONOGI& C O. LTD. 2 )S ystemCommunicationA s s i s tCO.,LTD. 要旨 SASFは世界で汎J l lされている統計解析ソフトウェアとして知られているが,統計解析以外にも様々な機能 が実装されている.今回,弊社ではそのような SAS"の機能を利用し, FDA申請時にパッケージに含めた方が 良いとされる d e f i n e . p d fを ワ ン ク リ ッ ク で 作 成 で き る ツ ー ル を 開 発 し た . 過 去 の 報 告 ( E l i z a b e t hL ic ta l 深l , こ S A S " "で、ハイパーリンクやブックマークを含むRTFファイ PharmaSUG2 0 1 2 ) では, d e f i n e . p d f を作成する I mし、て PDFに変換する方法が催案されている. しかしこの方法では, ルを作成し,その後Adobc(ii' PDFMakcrを PDF変換を手動で千Tなわなければならず,またAdobe@PDFMakerの設定によっては,芭図したファイルが作成 されないことが危倶される.そこで今回, d c f i n e . p d f を作成するにあたり, PDF変換およびPDF変換時の設定 を行う VBスクリプ卜を SAS'で作成・実行する SAS7クロを開発した.さらに,この SASマクロと標準化され たADaMデータ変換仕様書を組み合わせることで, d e f i n e . p d f 作成の全てのプロセスをワンクリックで,自動 に実行することを可能にした.その事例を紹介させていただく. キーワード:FDA, ADaM,メタデータ, d c五 日e . p d f , VBスクリプト 1.諸言 SAS ⑧は言わずと知れた世界中で汎用されている統計解析ソフトウェアである. しかし SAダには統計解析 以外にも様々な機能が実装されている.例えばREPORTプ口、ン、ジャはSAS@のドキュメント作成ツールとして f f i c eソフト,コマン Fフ。ロンプ卜及びVBスクリプ卜といっ 代表的なものである.また, SAS岳はMi c r o s o[t@O た他のアプリケーションども互換性が比較的高いことも知られている 今回,そのような統計解析以外の SAS 垣の機能に着目し, FDA 申請時にパッケージに含める方が良いとされる d e f i n e . p d f をワンクリックで作成す l l 作成については様々な方法が知られているが,いずれも普段S るツールを開発した. d e f i n e . p d f の ASプログラ 413

405.

ミング業務に従事している者にとって馴染みのないものであり,申請の都度作成する場合,非常に多くの労 力を要すると思われる.本ツールにより FDA申請に必要なドキュメントを,一定の質を確保しながらワンク リックで作成することが可能となる.その事例を紹介する. 2 .d e f i n e . p d fとは 近年,データの標準化に対する取組みが活発に行われている. CDISCi 舌まり]で、はデータの標準化が進められ ており, FDAへの新薬承認申請時には CDISCIこ沿ったデータセットを提出することが必要となる. FDAIこ提 出すべきデータの lっとしてメタデータがある メタデータとは「データについてのデータ」を意味する. t c . . . ) や導出変数の作成過程に関 即ち各データセットの変数に関する情報(変数名,変数ラベル,変数属性 e する情報を含んだデータである. FDA申請時には, SDTMや ADaMIこ関するメタデータの提出が必要になる. メタデータとしては, xmJ形式 ( d e f i n c . xl l 1l ) や pdf%式 ( d e f i n e . p d η が代表的なものとして知られている. SDTM が CDISC標準に合致しているかを判別するソフトウェアが, d e f i n e . xl l 1l を用いて判別しているため,現在では d e f i n e . x m lが主に用いられている.しかし, d c f i n c . xl l 1l には印刷が難しいという問題点があり, ADaMのメタデ e f i n e . p d f ' の方を好むレビューアーもいることが報告されている 1) また, ータの提出の際には容易に印刷可能な d e f i n e . p d f を提出することで,レビューアーのタスク減少につながり,レビ スポンサー側としても印刷可能な d ュー期間の短縮につながることが期待できる.以│ご(こ d e f i n c . p df:こ必要な機能として,要求されているものを 挙げる 2) ー CDISC基準に良Ijっているデータの場合ー p tファイルへのハ ・データセットについての情報(試験名,データセット名,データセットのラベルグ1,x イパーリンクなど) ‑変数についての情報(データセット名,変数名,変数のラベル名,変数のタイプ,フォーマットコード, 変数の導出ルールなど) ‑印刷可能であること ‑CDISC基準に員J Iっていないデータの協合 ・上記 3つの項目 ・各データセットの説明から各データセット内に含まれる変数の説明へのハイパーリンク .各データセットそのものへのハイパーリンク • AnnotatcdCRFへのハイパーリンク STDMについての d c f i n c . p d f は CDJ v e r 2.4で、生成機能の拡張が予定されている.そのため今回,弊社では ADaMについての d e f i n e . p d f の作成 SASマクロ,及びそれを利用した d e f i n e . p d f イ乍成ツールの開発を試みた.な . 2で、行った. お SASマクロの開発は SAS" 9 3 .d e f i n e . p d fの作成 3 . 1 過去の報告と問題点 d c f i n c . p d f < の作成については過去に様々な報告がされている 4.5) それらの報告では, FDAが要求している 4 1 4

406.

l機能以外(こ,以下のような機能も持った d の d巴日日巴 p d f e f i n e . p d f を作成することでレヒ ューアーの更なる助けと なるのではなし、かと考えられている叫. ‑階層的なしおり構造 ・ページ番号 ・ヘッダー・フッター l作成方法について ,却 の e f i n e . p d f 20 1 口 2年 こ i にPh 凶 1 官a 1 汀 口 r m m 官 1 a a S β S U Gで これらの機能を持った d l作成プロセスについて紹介されている.最終成果物が p 4 )この報告で、は d e日n e . p d f d庁芸式のファイル がある 叫 の であるとき, SAS ⑧で処理をした後に, ODSPDFステートメン卜で出力するというプロセスが考えられる.し iはその方法で、はハイパーリンクやしおりの作成で問題が起こることを指摘している.そこで, かしながら L ODS RTFステートメン卜でハイパーリンクや見出しを含む RTF形式のファイルを一旦出力し,その後 A d o b c ' 安 PDFMakerで"PDF形式のファイルに変換する方法を提案している.見出しは PDF変換を適切に行うことで,し おりとして PDFに反映される. しかし,この方法は以下のような問題点がある. • PDF変換を手動て 行わなければならない akelで適切な設定が行われていない場合には, PDFに反映されない ・しおりは, Adob♂ PDFM [ i J ,我々はこれらの問題点を解決するために, SAダから VBスクリプ卜を作成する手順を考えた. そこで今 I 3 . 2 作成の流れ 今~, ① d e f i n e . p d fは,以下の方法で作成した. ソースファイルからの ADaMデータセット情報の抽出 ② ハイパーリンクや見出しを含む RTFファイルの作成 ③ VBスクリプ卜をJl J し、た RTFファイノレの PDFへの変換 ④ ① ③を実行する SASマクロの ADaMデータ変換仕様書への実ー装 ①,②は既存の報告に基づいた方法,③,④は今回新たに取り組んだ方 wである.以下にその詳細!を示す. 3 . 2 . 1 ソースファイルからの ADaMデータセット情報の抽出 d c f i n e . p d fを作成する際に,まず考慮しなければならないことは情報源となるソースファイルについてであ e f i n e . p d fのソースファイルとしては, ADaMデータ変換十t:係書 ( . x 1 s m形式)と ADaMデータセットの る. d 2つが考えられる.それぞれのメリッ卜・デメリッ卜を以下の表にまとめたー ソースファイノレ メリッ卜 ADaMデータ変換仕様書 ADaMデータセット 'SDTMから ADaMへの変換処理の際 ‑データセットそのものの情報を得るキにより, の変数導出の{l:様,データの情報が d e f i n c . p d fに 1 1 ¥力する内容との不整合がない 集約されている デメリッ卜 • ADaM データ変換仕様書が一定の様 'SDTMから ADaMへの変換処理の│際の変数導 式で作成されていなければならない : f i.長等の情報を後から, ADaM データイl: 出のイ l 'ADaMデータセットと d e日n e . p d fとの 様書カ、ら追加する必要がある 内容に不整合がおきる可能性がある 上記の通り, ADaMデータセットから情報を抽出した場合,変数の導山方法といった直接データセットに 含まれていない情報について,情報 1 r t l間後 l こADaMデータ変換仕様書から追加することが必要となる.その 415

407.
[beta]
ため,結局 ADaMデータ変換仕様書からも情報を抽出することになる.一方,弊干上では一定様式のテンプレ
ートに基づいて ADaMデータ変換仕様占‑が作成されていること, ADaMデータセット作成1
1
寺に変数名,長さと
し、った変数の属性定義を自動化していることから,データセットと仕様書の不整合が起こらないと考えられ
る そのため, ADaMデータ変換仕様子i付、ら情報を抽出する際に上に挙げたようなデメリットは起こらない
と考えられたことカミら, ADaMデータ変換仕様書をソースファイルとすることにした.なお,同様の議論が

d
e
f
i
n
e
.
x
m
lを作成する際に報告されているので,詳しくはそちらを参照されたし仰.

ユ

3 2 ハイパーリンクや見出しを含む RTFファイルの作成
RTF形式のファイルはフォン卜,フォントサイズ,色などすべての情報が全て,ある文法に沿った文字コ
ード (RTFコード)で形成されている.今回ハイパーリンクや見出しを作成するにあたり, ADaMデータ変換
仕様書から抽出した情報に,ハイパーリンクや見出しに該当する RTFコードを

SASデータセットの変数に

c
o
t
tOsowskiらの報告
直後格納し出力することで,ハイパーリンクや見出しを作成した.作成するにあたり S

iこその方法を示す.
を参考にした 7) 以 f
①ハイパーリンク・見出し作成のための準備
以下に示すプログラムを実行することで, RTF コードを挿入した際にハイパーリンクと見出しが文書 i
ゴ
こ
反映されるようになる.

o
d
sp
a
t
hw
o
r
k
.
t
ell1p
l
a
t
(l
Ip
d
a
t
e
)s
a
s
l
l
s
er
.t
ell1p
l
a
t
(
r
e
a
d
)s
a
s
h
e
l
p
.
tll1p
l
m
s
t
(
r
e
a
d
)
;
¥5
1h
巴似
a
吋
!
(
ω
d
山
l
i
日
昭
I 1
:
洋
¥s
2h
刊
e
c
a
刈ω
d
出i
口
口
l
1
9
2
;
¥
洋5
3h
児
c
c
a
叶
d
i
汀
m呂3
;
リ
}
f
I
;
o
d
sr
t
fw
o
r
d
s
t
y
l
e
=
"{
;

2つ目のプログラムでは, s
l という RTFコード・を帰入することでレベル iの見出しが, s
2という RTFコー
ドを挿入することでレベル 2の見山しが作成されることを意味している.

ハイパーリンク作成のための RTFコードの挿入

②

次にハイパーリンクを作成するための RTFコードを帰入する.例としてハイパーリンクを作成するための

RTFコードを挙げる.
¥
{f
i
e
l
d{
¥
*
'
tf
l
d
i
n
s
t HYPERL
lNK 叫 l
¥"ADSL
勺{¥ l
l
d
r
s
l
t¥
{c
s
l
5c
f
2S
u
b
j
e
c
td
i
s
p
o
s
i
t
i
o
n,demographic,and

b
a
s
e
l
i
n
cc
h
a
r
a
c
t
c
r
i
s
t
i
c
s
)}
}
このコードは,文書には"Sl
Ib
j
e
c
td
i
s
p
0
5
i
t
i
o
l
l,d
e
m
o
g
r
a
p
h
i
c,a
n
db
a
s
e
l
i
n
ec
h
a
r
a
c
t
e
r
i
5
t
i
c
s
"と表示され,クリック
すると文書内の ADSLという場所にジャンプするハイパーリンクという意味で、ある.ジャンプ先については
後に ODSRTFBOOKMARKステートメントで指辻‑する.ファイル以下のプログラムを実行することで,ハイ
ーリンクを作成する RTFコードをデータセットに書き込む.

ノf

旬、イ川ーリンクの作成事

f

d
a
t
ad
a
t
a
s
e
t・
I
C
l
l巳t
hDATASET DESCRIPTIONl
o
c
a
t
i
o
l
l$
1
0
0
0
.
;
s
c
td
a
t
a
s
e
t
;
バ;え山内へのハイパーリンクの i
t
J
N叱

DATAS訂
ET一DESC則
RI
P
T
η
I
旧
ON='(
伴
¥
日
恥c
l
川
d{
伴
¥
ド
宇
咋
平
叩
t
l
d
i
l
l
削
s
幻t
HYPERL
lNK¥
碍
鞘
¥
羽I
¥
¥
'
!
j
.
(
'
川吋"
"
1

416

408.
[beta]
strip(DATASET̲DESCRIPTION)1
1'
}
}J
'
;

/市丈主外へ<],ノ、ィパーリンクの作成 *
i
l
o
c
a
t
i
o
n='
{
¥f
i
e
l
d{
¥
本
¥f
l
d
i
n
s
tHYPERLINK"
.
.
/
d
a
t
a
s
e
t
s
/
/
'I
l
s
t
r
i
p
(
D
S
)1
1".XPT"1
1"
'
}¥
{f
l
d
r
s
l
t¥
{cs15¥cf
2'
I
l
s
t
r
i
p
(
D
S
)
1
1".XPT"1
1'
}}}
'
;

E
l

u
︐
.
r
‑

f
o
r
m
a
tDATASET̲DESCRIPTIONl
o
c
a
t
i
o
n$
1
0
0
0
.
;

且

プログラム実行後の SASデータセットの例を示す.
缶 詰r
i
p
t
i
o
n0
1Da
同部剖

Da
拍s
e
t

l
o
c
a
t剛

{
刷'
e附 f
抑制 !
d
i
n
s
tHYPERllNK
1

I
AOSL

ト一一一
I
ADAE

2

、
一
ー
一
一
一
ー

③

'[
¥
<
c
s
1
5
V
c
f
2[
¥
<
f
i
e
l
d
!
Vlield押哨 ldinstHYPERllNK
V
V
I
V
"ADSL"l!V旧日 l
[
¥
<
.
¥I
I
d
i
n
s
'HYPER
L
l
NKVVI
V
"ADSL"}
枠制"It "Jd e's//ADSLXpr}
梓 出 口l
tf'tI çs15~cf2
r.cs15Vcf2S~lbject le'le
lA
n
a
l
y
s
i
s
ADSLXPη}}
バ"
e
t
}
}
}
}
}
}
Da
f
制i
e
!
d軒家制 I
d川 s
tHYPERL
l
NK
v
"ADAE"H
刷 抽 出 Ncs15VcロI
制i
e
!
d
{
Vf
陪 凶 炉 開d
i
n
s
tHYPERLINK
vvi
f l
l
d
i
n
s
tHYPERL
lNKV
V
I
V
"ADAE"H
刷 出:
;
I
t "
'.
J
dota:;ets//ADAExpr}
f
'
if
l
d
r
s
l
tNcs15Vcf2
Ncs15Vc_f~_Adverse E'Ie
n
tA
n
o
!
y
s
i
s
ADAEXPη}}
D
a
t
a
s
e
t
}
}
}
}
}
}

,
'
>
s

,
'
'
o

見出しの作成と RTFファイルへの出力
作成した SASデータセットを REPORTプロシジャにより出力する.その│民 ODSRTFPREPAGEオプション

中に RTFコードを挿ー入することで,見出しの設定を十Jう.また ODSRTFBOOKMARKオプションを用いてハ
イパーリンクのジャンプ先も作成した. S
c
o
t
tOsowskiらの報告 7)では RTFコードの挿入により,ジャンプ先を
1
mすることで,より容易にジャンプ先を作成できる
作成しているが, ODSRTFBOOKMARKオプションを手1

と考えたため,今回このオプションを利用した.以下にそのプログラムの制;を記赦する.

o
d
se
s
c
a
p
e
c
h
ar=川;
,
;
c
/
o
l
c
tl
i
n
e
=
^R
1RTF判 r
d
r
b
¥b
r
d
r
s
!
t
'b
rdrw1
0¥b
r
s
p
2
0
・ / *tIIL~Íî! J
̲
:
:
‑f
1
e
b
け ら RTfコ一戸。

o
d
sr
t
fbookmark="AnalysisD
a
t
a
s
e
t
s
"
; 旬、イノ¥ーリンクのジ γンプ先の作成,.
o
d
srtfprcpagc="^RiRTF'
!
t
's
l¥f
5
2
6¥b¥q
c'
A
n
a
l
y
s
i
sD
a
t
a
s
c
t
s
"
; バ L べJl̲‑
1の見出し作成オ/
procr
e
p
o
r
td
a
t
a=d
a
t
a
s
e
tl
l
o
w
c
l
;
1
1nDSDAT
ASET
̲DESCRIPTIONl
o
c
a
t
i
o
nkeyd
o
c
l
l
m
e
n
t
a
t
i
o
n
;
c
o
l
ul

d
c
f
i
n
eDS/
le
t
is
t
y
l
c=[
c
e
l
l
w
i
d
t
h=10%] "
D
a
t
a
S
e
t
"
;
5
t
)
化 =[
c
e
l
l
w
i
d
t
h=1
5
'
)
1
0
]"
D
e
5
c
r
i
p
t
i
o
no
f
D
a
t
a
s
e
t・
1
d
e
l
i
n
eDATASET DESCRIPTION/
1巴n
d
e
f
i
n
cl
o
c
a
t
i
o
n/I
c
f
td
i
s
p
l
a
ys
t
y
l
c=[
c
e
l
l
w
i
d
t
h= 15%]"
L
o
c
a
t
i
o
n
"
;
i
n
ekey/
le
J
i
忌t
y
l
e=[
c
e
l
l
w
i
d
t
hニ 15%]"
K
e
y
s
"
;
d己f
1
1c
n
t
a
t
i
o
n/I
c
f
td
i
s
p
l
a
ys
t
y
l
c=[
c
c
l
l
w
i
d
t
h=10%]"Commcnts";
d
c
t
i
n
cd
o
c
l
ll

c
o
m
p
l
l
t
eb
c
f
o
r
C
'̲
p
a
g
e
̲
!
s
l
y
l
c=[
p
r
o
t
e
c
t
s
p
e
c
i
a
l
c
h
a
r
s=o
f
f
]
;
p
r
e
t
e
x
t="~sl-220'islmllltO¥bltql "
l
i
n
e@1"
A
n
a
l
y
s
i
sD
a
t
a
s
e
tT
a
b
l
eofContentsf
o
rS
t
u
d
y&studyname人
endcomp;
t
i
t
l
c
lj
=
1"
&
s
t
l
l
d
y
n
a
m
c
.D
a
l
a
s
c
t
s&
I
i
n
c
"
;
=
c"
&
l
i
n
e
"
;
f
o
o
l
n
o
t己1j
p
a
g
c
of
}"
; キヘ一己柔~J
ーの作 f;
¥
i
:*
i
f
o
o
t
n
o
t
e
2j
=
r"Pagc八 {

417

409.
[beta]
n

・

l
︐
.
t
v

以上のプログラムにより,以下のような R
TFファイルが作成される.特に,

SASデータセットでの RTFコ

ードと実際の出力された結果について着目していただきたい

間正l;'ïD~

ヘッダ

表面上は見えないが,

見出し

J、ィパーリンクの

一一~.,.,..官

ジャンプ先に設定

AnalnisDatasets"‑

~円Îs Da
:1
3
S
t
tT3ble
‑O
rContf'.出 f
o
rStud~' s
9
9
9
9
9
9
.
t
e
s
!
.
‑
'

ADSV

s
;
u
b
J
e
;
;
:
t
L
e
¥ヨl加 alymD 抗日 t~

.
‑
¥
DA
E
'
"
'

A
d
'
:
e
E
:
:
'E 剖 却 , [ 日 目 D

I
泊 SLXPT"

山
"
,
.
' IADA玉XPT.、

STIJD¥lD.USUBJID"

一史¥X
.
'
SAP氾 <X

STIJD¥lD.USUBJ
lD♂

S
.
‑
¥
PXX̲
X.
:
r

sTIJD¥lDUSUBJID."

SAP;
"
'
.
X
.
'
SAPXXXρ

MedicalH
:
S
!
C
l
)
'Arnly
s
.
uD ミ t ,:; s?t~
hbontoIV加 点 sED;
:
tt
a
!
'
{
t♂

.
'
J
)
¥
'
S
・
2

、':1 出事~ AnalynsD
:
l
t
a
:
:
HoJ

IAD¥"sXP下

STIJD¥lD.USUB.ijDぶ

Eìe:tro~i叩m 加 lY !l~ Da山

tρ│必 EGXPT
・
3

sTIJDY
I
D
.USUB.ijD・

SAP氾 ¥
.
X
.
'
SAPXXXρ

I
.
>
J
J
Q恥 X
P
T
ρ

STUDYID.USUBJ
lD.

SAP

'
・

ADEG
ADQSDR.'

町 民 主¥ " D
,
,
,
,
,
,
,
'

ADQSDRWK.
ADTTEl"
.
.
>
J
JT
TE:"

:
‑
ι
x
x
.
:
r

SAP又X XoJ

STOOYIDUS
むE耳D
.'

5ーザ X
X
.
X
ρ

T", J

.
.
>
J
JF
,
屯
争

S
T
I
J
D
¥
l
D
.
U
S
U
B
.
i
j
D
.
"

STOO¥τD.U5UBJ
w,
.
.
.
.
晶
、』ーーーー『ミnQS
¥
、
長 XPT,"
lD.
竺j 文書内への
出 品 ¥一一一一一『 STUDYID.USUBJlD〆

長 lハイパーリンク

ヨ
:
n
11"1

可'r量三~lW

‑
.
庁
、

〈目,,

'v

E

STIJDYID.USUB!
lD
.
"

S.-\l';", X~

J
l ←

SAPXXX.

吉u
向
咋
匂
枠
除
ι
叫
さ
恥、t臥均中口 m

.
.>JJ EX~

D
D
悶
r
u
悶
唱
i
喜 L刊
pC
S
町却ヰ出 D
at
山
l5
日
山
叫
d
宅"

ADEXCO
,
!
・
、

Tre.um叫 C
0
m
p
h
a
n
;
;
"
.加 昨 日
DJ.!:t:eI+"

加
D
2羽山…:臼出山山
日山
a~5詰叩舎包1叶川ぷ汁卜岬
J油山
お=
D

[必E..\.XPT~
I
.
.
>
J
JE:XCOMXPT

・

'
.
'
.

ETIJDYID.USUBJID.
'

S
,
ぜ
;
,
.
,
.
x
"

l
D
.
"
STIJD¥
lDUSUBJ

5AP;
"
, X.'

STIJDYID.USUBJID•

S
.
‑
¥
l
'
氾¥
.
X
・
2

STIJD
¥l
D USUBJID."

SAP;
"
, X.'

dρdρ

.
.>JJ CT~

ADDS•

却加
a
北k
叫距

r

w["
1ハイパ ‑ 1 ) ンク 1 STOOYID.USUB D

C
"
:
',
J
:(
c
n
u
t
;
:
;
.r;tυrug : 却 叫 出 山 口
C0nCl~m山 r,tTI悶 3pyA'1均叫 D山斗.~守

w

,

SAPXXX.'

♂

.
.
>
J
JCD.
、

品~iH XPT"

│
必LBXPT・
1

︑
‑dJddu

AD~!H・2

ADLB
、

ddJvdd'G

J
.

じミi ..
P
a
g
'こ
むr
i
.
:
'

各データセットに含まれる変数についてのデータも同線のプログラムで作成することができる.作成結果
を以下に示す.

J

"ヲ ~'9 ヲ予 l~:;; ミにD~ I:.ρ

ヘッダー

│同 古1
、
、

J、ィパーリンクの

E

ジャンプ先に設定

S".~i.'口 ~.~:~.~.I._~.~~_I:'.~.i.~..~.~.!~.~~~..~7~p.~.~

418

410.
[beta]
CODE の列には変数に格納されている値についてのデ、コード情報(フォーマット)が出力されているのだ

が,今凶作成にあたり問題点として,フォーマットの情報が lベージに収まりきらなかった場合,すべての
情報が出力されず,情報が切れてしまうことが問題となった(下図参照).そこでその部分に関しては appendix
を作成し,その部分へのハイパーリンクを作成することですべてのフォーマットの情報を出力した.

改善前

にu
J・
H.m
剖 o
c
r
i
t,
"

・

UOl7
屯 U1
rO
p
h
i
l
sltukoc~;tu戸
1
:
0
"
:
・
Z
帥網開.biJ.¥l
e
u
k
oC
:l
t
S
〆
UO~ ・ Bnoptu.b l~uk"c叶“〆
1306~1、 mph" C:1t s h'\l.kc>cyt~;. ,'"
日 07-1[on目、'l~~ )~ゆ':t'C"\tu ・

I
J
u
t
.
.P
l
:
ll
t
l
'
!!S..
.
:

立主盆
Paumeter(C7~

,

也氏ミM
.'
亡o
d
e
P
"
'
:

Ch".' lappさn
d
l SLBTEST."

3
.
2
.
3PDFへの変換
以前まで の報告で、は PDFへの変換は Adobe
選'
PDFMak巴rで行うと報告されていた.しかしこのプロセスのみ
手動で行われていること,また Adobe
⑨ PDFM
akel の設定が適切でなければ,しおりやハイパーリンクの設定
が正しく設定された d
e
f
i
n
e
.
p
df:が作成されないことが問題として考えらえる.
今回はこの PDFへの変換のプロセスを全て SAS'"上から行うことがけ1
来ないかと考えた.このような PDFへ
の変換のプロセスをとることで,以下のような利点が考えられる.
・全ての d
c
f
i
n
e
.
p
d
f作成プロセスを自動で行える
笹'
PDFMakerの設定 l
こ依らず,適切に PDFへの変換が行える
・使用する PCの Adobe

• SASめで解析業務を統ーできる

・実行I!寺の詳細な l
o
gが出力される

そのために今回 SAS句、ら PDFへの変換をわ一う VBスクリプ卜を作成・実行するプログラムを開発した. VB
スクリプ卜とは WindowsJ
てのアプリケーションをますJ
作させるプログラム言語である.具体的には以下のよう
な SASプログラムを実行することで, VBスクリプ卜を作 hl(:,実行することができる.また,

419

しおりを作成す

411.

る際に必要な設定も VBスクリプト上で行うことができる この機能を mし、て今回 PDFへの変換までの白動化 を行った.ただし PDF変換を行う VBスクリプトはAdobe ⑨ P DFMakerがインストールされていないPCでは動作 しない点にご留意していただきたい. d a t an u l l; a t a s e t s ¥s a s 2 w o r d . v b s ' ; t i l巴¥..¥ d p u t' D i mo b j D o c ' ; / キ s a s 2 w o r d .v b s,"いうファイル;二スクリブ:、を記述不/ 丸一の中身がs a s 2 w o r d . v b sに記載されて L、くキ/ p u t' D i mwdOpenFormatRTf; ' p u t' D i mpdf I I u ︐ . v s 略 OPTIONSNOXWAITNOXSYNC; X I!I . . Y . .主d a t a s e t s Y s a s 2w o r d .v b s " ' ; /九l s 2 w o r d .v b訟の:t1J'* i しかしながら,この方法ではPDF変換をした際に見出しがしおりとしてPDFに反映されなかった.この理由 について倹註したところ,見出しとして作成した部分が, 1つのセルにテキストとして出力されるため, PDF への変換の際に見出しとして認識されていない可能性が考えられた.この問題は手動で、Adob♂ PDFMakcrを 用いて PDFへの変換を行った際には起こらなかったため, VBスクリプトでPDFへの変換をしたことにより新 たに発生した問題であると考えられる そこで解決策として, VBスクリプト実行前に,出力した RTFファイ ルを SASデータセットとして読み込みを行い,データセット上で、セルを作成している RTFコードの部分を改変 し,見出しが埋め込まれているセルを取り除いた後 l こSAS データセットを RTFファイルとして出力する SASプ ログラムを作成した. i ¥ c1 t x1 r t b i ¥ c1 v e r t a1 t i ¥ c1 c b p a t 8i ¥ c e1x 1 3 9 5 7 i ¥ p a r d i ¥ p l a i n i ¥i n t b li ¥ s b l 0 i ¥ s a l 0i ¥ q r i ¥ f li ¥f s 2 0i ¥ c f l[ P a g e[ ¥ ifield[ ¥米\ifldin~ [ ¥ ir o w l 42 0 A

412.
[beta]
この SASプログラムにより, PDFへの変換後に見 H
iしがしおりとして溜切に認識されるようになった.以
下に最終成果物を示す.
EZτrョ';r,,_吊"'~帽百 n_ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー哩!回Jt:lJ
E

叫町一一円,',岡崎市川叩

什

,.\ nAlni~ DnlA~rrç

E制

..
由

御首相指

,
.
田
r
<r".s田
d,
‑
,
紳
伸
"
.
,
門
書

4. luh 開 O.., ..nτ~bl~ "
fC""

{ぱ"'l

[
!
o
a
t
al
t
:
rl
t
e
肘匂d
.
:
:.
,!Hf;注'J

.
.
.

同ヤ聞

(

)

3面 司 氏r
"
L
議Xl"c;b)'

世
,
.
.
.

,。
N

u)

[1",匂耐向
ν民3159
'
、s

""栴a

("^司
!
]DaY 耐 向
Eほ官民 ~d <q

,,"'#¥eI市首"
〈ば淫G)

3山 氏rl明
向唱付誕指

〈ば均気取〉

3恒 也 甘

J得 制 D町

噌
.
.
.
.
.
.

目
由
沼.
u

AD5L

shdzeMu
曲h
F

会 芭...

:
¥
DS
l
.
時
X
Y
1

‑
e
田
畑
.
.
:
,
‑
:
;
.
r
, ...nA.!:).1>T
ID
山
0
0
.Ib:M.6 111'
,
,
<
<
,
/
加h司'
D
.
.
.
l.bcu
,
O
<
'
VA
AD13X
Pr
;
.
D
¥
'
ち X'
l
T
D軒
.
.
f
<
<
d
:
eA"四 時 h

λDAE
組 閣

AD~IH Xf>T

e
>
.

A(江B

脂血

宝
、

λD

且町田

ID.山白 éc ,'.!~\,:.z:.A副hも

ADEG

lhur",I!w~;"て官....,,, dw田宮間

,
¥
D
'
‑C
:XPT

.
.
.
.
.
.
.
1
.
.
.
.
.
.
.

、

ADQSD?.
ADQSDRW
ADTτ三2
ADTτE・
主DfA
AOCD

ADCτ
ADDS

.叫)QS
n
;
I
:
"
,
,
.τ
旧
"
'ι司
o
.
.
.
.
.
y"
.
rn"
,仲
,
1
;
"O;'P"'I'¥回;yw‑t
YITElXPl
E叩叫v
ID.uio:"~'":~ l
.
,
.
j
!
:
̲
2
X
Y
T
0
.
,
.
.・;:..tbcf::
>
d
"
宮 A割
材
、
│
J r
.
‑
¥
X
P
T
D喝
'
" rb.‑C岨
"
,
由
也
.
島
可
A.
司
.
̲
,
n可
̲
司 1
;
'
0
(
"
1
'
'
'
'
'
‑
;
D
t
a
a
‑
t
d
aJ
h
4
「
i
「
D
h
u
山
a
旧
2
a
d
t
U
・
回
1 白
ち
袖
向
回
叫
仇
h
│γl I
)
;
1
'
1
l
H

…

円'".‑町

E
山 Y冒 E

祖国国

ユ問叫

油 出 日円
叶
f

xxx

│主ザ

yτl!D、,ID.c~t.:BJ言及

s
.
A
P
x
.
.
xx

百t
:
"
'
S
弔
l
.
:
B

STl
JD D
. L
"BJ
I
D
羽 D'
J
I
D
snm

叫

s
.
‑
¥
pxxx

S
1UDY
I
D
.
t
:
SI
.
1UID

訂1;0'1τD.t: St:・~1m

口 出 向 │ 山

S
.
J
J
>XXX

、
色pxxx

立
〉

AIlQSr: R~\"K文PT

;'.~

SAPx
.
.
x
.x
.x
.
"
(
.
x

s

近

~v官'

:.~

L:::回~!2l<: O.金 ....t;:壇企.,坦措'"

む
コ
,
1
m
n
.
.
'
O
YIDじ
i
S
l
.
"
BJID
ち
n
.
'
D
"
l
"
l
D
,
t
:
'
>
I
.
:
百
1
m
、
官DYlDじ St"BJ
口'¥IDYIDじ5

'
l
,
)
'
l

S
:
¥ XX¥:
I
S
"
‑ :
x,¥

ち
;
.
1百
、
百
,
1
D
̲
1
.
‑
:
:
;
¥
:
B

m 田宮 ¥
"
1
0
. 1 I
I
D

目立文

sτ1τ3τD.1
.
.
"
"
!
'
iL
i
1πD
sn;D
J
I
D

S"‑PXX丈
S
.
"I
'XXX

町 田 口 四 国

S
A
l
'
x
.
.
xx

ち
1
1
.
.
;
D¥
'
1
DじSL
"
l
UID

s
.
‑
¥
px
x
.
x

"'"恥醐
相耳目蹴)

[
]
l
nta"耐同
'
"
句
.
,
.
雪
、e

T羽
"
,e
t
o
(
'
,
e
r
吠
""恥四

〈岨円El)

J".~lc 日司

!:~ Data liY~

3
.
2.
4ADaMデータ変換仕様書への実装
今回作成した SASマクロを, VBAをJl
J
¥,、て実行するボタンを ADaMデータ変換仕様書上に作成した.
e
f
i
n
e
.
p
d
f作成マクロが実行される.これにより ADaM
このボタンをクリックすることにより今凶作成した d

データ変換仕様書上からワンクリックでの d
c
f
i
n
c
.
p
d
fの作成が可能となった.

ADAE
i

4

PlannedTreatment(
C
)

4
. まとめ
今回,統計解析以外の SASI){の機能,特に他のソフトウェアとの互換性や文書出力機能に着目し, FDA承 認
c
f
i
n
e
.
p
d
f
申請時にパッケージに含めた方が良いとされる d
の作成事例を紹介した
'

421

VBスクリプ卜を利則する

413.

ことで,過去の報告では行えていなかった d e f i n e . p d f 1 乍成における PDF変換のプロセスを Automation化するこ とに成功した.さらに今回開発した SASマクロと VBAを連携させることにより,弊社でi土ADaMデータ変換 p d f を作成できるツールを開発した. d e f i n e . p df 1 乍 成 仕様書上のボタンをクリックするだけで,自動的に d巴行 n巴. のための SASプログラムコードは,普段 SASプログラミング業務に従事している者にとって馴染みのないもの であり,その作業をワンクリックで実行できることは,業務の効率化に大きく寄与する.このようなツール を開発できた珂ニ由として, SAS""が他のアプリケーションと互換性が比較的高いこと,弊社で'ADaMデータ変 換仕様書のテンプレートが傑準化されていたことが考えられた. こういった事例は SAS'ii'が統計解析ソフトウェアとしての機能だけに留まらず,様々な利用可能性があるこ とを表している.例えば,弊社ではアクセス権の管理を SAS で行う取組みも行っている~)データの標準化と SAS ⑧をコラボレーションすることで,様々な便利ツールの作成が可能になると考えられる. S . 参考文献 1 )8巴h r a n gV a l i .ADaMR巴VI巴w fromaCDERS t a t i s t i c a lR巴VI巴w e r ' sP e r s p e c t i v 巴.FDA/ASAI n d u s t r yWorkshop 2 )StudyDataS p e c i t i c a t i o n s2 0 1 2 . 1 down1 0 a d s / Fo r ln d u s t r y / D at a S t a n d a r d s / S t u dyDat a S t an d a r d s / UC M31 2 9 6 4 .pdf h t t p : / / w w w .f d a . g o v 3 )CDERCommonDataS t a n d a r d sI s s u e sDocument2 0 1 1 . opl 1 1c n t A p p r o v a lP r o c e s s / FormsSl l b mi s s ionRequircm巴n t s / El e c t r o ni cSub l l l is h t t p : / / w w w . f d a . g o v / d o w n l o a d s / D r u g s / D c v巴1 sions/UCM254113.pdf e r s i o n 9 . 3ODSRTF. PharmaSUG2012‑ADI4. 4 )E l i z a b e t hL i .C r c a t i n gD c f i n c . p d f w i t hSAS⑧ V j a n s e n . c o凶 p h a r l l l a s u g l 2 01 2 1AD/PharmaSUG‑2012‑AD1 4 . p d f h t t p : / / w w w . 1巴x e f in e . x m l( t h a tcan 5 )LexJ a n s e n .Usingt h eSASXMLMapperandODSPDFt oc r e a t eaPDFr e p r e s e n t a t i o nofth巴 d b巴 p r i n t e d ) .NESUG2 0 0 8 .h t t p : / / w w w . n c s u g . o r g l P r o c e e d i昭 s l 問 s u g 0 8 / p h l p h 0 6 . p d f 6 ) 北原孝志,東島正堅,北西出武,吉岡祐樹解析業務プロセスにおいて効率的な仕様書作成と D e f i n巴. x m l への変換 SASユーザー総会 2011論文集 p285・2 9 9 . 7 )S c o t tOsowski, Thol 1 1a sF r i t c h e y .H y p e r l i n k sandB o o k l l l a r k sw i t hODSRTF .Phannasug2006,PaperTT21. s 1 1 g / 2 0 0 6I tc c h n i c a l t c c h n i q l l c s / t t 2 1 . p d f h t t p : / / w w w . l e x j a n s c n . c o m / p h a r1ll3 8 ) 惟高裕一, ii~ 原正和,北西出武,吉岡祐将t ~ SASを使った情報管理事例 SASユーザー総会 2013 422 そしてリスクをやっつけろ

414.

I 1 1 一千絵加問……ゅ I SASを用いた医薬品開発の統計解析担当者 に対する CDISCの社内教育 浅見由美子、小山暢之、山之内直樹 第一三共株式会社データサイエンス部 CDISCI n ‑ h o u s eT r a i n i n gf o r B i o s t a t i s t i c i a n sUsingSAS YumikoAsami,NobuyukiKoyamaand YamanouchiNaoki C l i n i c a lDataandB i o s t a t i s t i c sDepartment, D a i i c h iSankyoCo.,L td . . . 二 3 i 1 i ヰ ヤ ザ 什工e t i ル ゆ . ~~ 要旨 ‑医薬品開発において、国際共同試験の増加等によ り、日本国内で CDISCを使う場面が増加している 0 .本発表では社内における統計解析担当者に対する SASを用いた CDISCの教育方法を提案する。 ‑キーワード: ‑ SAS,CDISC,SDTM,ADaM,国際共同試験、併合解析、 eCTD v 423

415.

T i l S紛 ユ ー ザ ー 付 加 加 佐 ぷ ~I 仰 O u t l i n e • CDISCとは ・日本における CDISCの状況 • SASとCDISC .教育プラン構築 一課題の定義 ー現状の把握 一原因の分析 ‑改善策の提案 ・まとめ ・今後の課題 : J : . ユ ー ザ ー 給 対 宍 … … 一 … m JI CDISCとは (ClinicalDataInterchangeStandardsConsortium) ‑臨床研究データとメタデータの取得、交換、申請、 アーカイブをサポートする標準を確立する非営利の 団体合 CDISCStandards: ‑P r o t o c o lRepresentation(PR) ‑C l i n i c a lDataA c q u i s i t i o nStandards Harmonization(CDASH) ‑ studyDataTableT a b u l a t i o nModel(SDTM) A n a l y s i sDataModel(ADaM), 等 橡 4 2 4 h t t o : / / w w w . c d i sc .o r 2 /より抜粋、和訳

416.

I~ザー総会加… SDTM( S t u d yDataT a b u l a t i o nModel)とは .医薬品の規制当局の申請臨床試験データ形式 • SDTMデータセット構造 冷1 2013 ADaM( A n a l y s i sDataModel)とは ・医薬品の規制当局の承認申請に用いる標準統計解析 データ形式 • ADaMデータセット構造 ‑ ADSL(Subject‑ L e v e lAnalysisDataset) ‑被験者レベル解析データセット ‑ BDS(BasicDataS t r u c t u r e ) ・基本データ構造 ‑ ADTTE(BDSf o rTimet oEventA n a l y s i s ) ・生存解析 ( T i m e1 0e v e n la n a l y s i s )のための基本データ構造 ‑ ADAE(ADaMDataS t r u c t u r ef o rAdverseEventAnalysis) ‑有害事象のためのデータ構造 h t t o : // w w w . c d i s c . o目 /adamより抜粋、手口訳 425 ー 訳 ︑ 1 1 3 : ‑ 日 Z m十触……… 粋 t よ a ↑ 4 J ‑I n t e r v e n t i o n • f~lJ) E x p o s u r e,C o n c o m i l a n lM e d i c a l i o n s ‑ Events • O I J )A dverseE v e n l s,D i s p o s i l i o n ‑ Findings ・例)L a b o r a l o r yT e s l s,ECGT e s l s Demographics ‑T r i a ldesignModel 等

417.

1 1 ユーザー蝕加問…一… m 三 ι 日本における CDISCの状況 ・「国際共同治験に関する基本的考え方」が発行 一日本が参画する国際共同試験の増加 ‑現時点では、 PMDA承認申請において、 CDISC データ提出は要求されない ーしかし、世界各国が参加する国際共同臨床試験、グ 口‑J¥)レ承認申請の増加により,日本でも CDISC実装 が必要な場面が増加 つ¥ I~~ユーザー総会一仰向。一向 Submission ~I 固四四回開園圏 図 CDISC データ標準を使用した場合のメリット ' f " 426

418.

! ω ユーザー蝕ホ……一… g P i l l J SASとCDISC ‑データセットの FDA提出のフォーマット ‑SASXPORTT r a n s p o r tF i l ef o r m a t • SASXPORTt r a n s p o r tf i l ef o r m a t,a l s oc a l l e dV e r s i o n5SAS t r a n s p o r tf o r m a t,i sanopenf o r m a tp u b l i s h e dbyt h eSAS I n s t i t u t e .(FDAStudyDataS p e c i f i c a t i o n s ;2012) • SDTM/ADaMの実装 ‑B a s eSAS, SASC l i n i c a lD a t aI n t e g r a t i o n(CD , り SAS C l i n i c a lS t a n d a r d sT o o l k i t( C S T ),e t c ・各ドメイン、テータセットの作成(データ変換) .テータセットのバリデーション, e t c .Shostak,2012) ( C . H o l l a n d&J 1 1 r.:I::lユーザー総会加flWlWA"&f'ーシ宮川知 ~9 教育プラン構築 ‑品質マネジメント手法を活用し社内の ADaM実装の 改善案を検討 ー改善案の中で教育に関するものをピックアップして、教育 プランを構築 ・その他の改善案については、別途検討 ‑JMPの品質管理ツールを活用 ‑改善案では SASを効果的に活用 (C 427

419.

mI 川ルザー総会加初回日ツリー… 課題の定義 ‑グローバル申請が可能なA DaMの実装 ‑(当社の想定)ク、口ーバル申請が可能: ・ク、口ーバル申請パッケージ内で、の併合解析、 s i d e ‑ b y ‑ s i d eの解析が可能 ‑規制当局への提出が可能 t I 圃置覇市宮田 ω ユーザー総会一…… CDISCとSASを用いた場合の統計解析プロセス (SDTMから解析帳票まで) XPT(SAS1anspoMle) 可 f XPT(SAS anspo吋 i i i ι 7 7i i ll . ; ; ;三 二I I 図 SASとSDTM/ADaMを用いた統計解析プロセス停1 ] (模式図) ¥ 428

420.

mI .ユーザー総会一…一一 CDISCとSASを用いた場合の統計解析プロセス (ADaMから併合解析帳票まで) )/ ¥。闇 申請プロジェクト単{立 図 SASとADaMを用いた併合解析プロセスO" J I(模式図) │ 鉱uー ザ ー 総 会 問 問 … …ω 2013 現状の把握 咋土内で、 ADaMガイダンスの教育を一通り実施した後の状況を確認 ¥ ¥ ¥ ¥ ¥ ¥ 旦 ど ム 治 国 ; ふ 国¥;;二 口¥曹;吾 由 、 , 甲 山 吉 明 ー=ー乞胃袋一守 e 主孟J ¥ … " iJJ ;統計解析担当者の教 白 z f 図.グローバル申請可能な ADaM作成に関する特性要因図 429 Em 開 園 (人 手

421.

p '・べ¥'d夫 ¥ . , 、 dや¥̲ "/J m n I ~r.:..l=:ユーザー倣加……一… 原因の分析 ( 1 / 2 ) 合教育に関するもの • ADaMのコンセプトの理解不足 ‑SDTMとの関係、卜レサビリティを理解していない • SDTMのD e r i v e dv a r i a b l eの存在を理解していない • SDTMSupplementalを理解していない ‑併合解析ができる状態になっていない • SDTMT r i a ld e s i g nを理解していない • TerminologyをE 里解していない ‑ Analysis‑Ready(OneProcAway")をE 里角写していない (後述) 1 1 1 ユ十字会……アプ 2013 原因の分析 ( 2 / 2 ) 合教育に関するもの • ADaMの各仕様の理解不足 ‑ADSL • SDTM. DM、SupplementalQ u a l i f i e rの内容を理解していない ‑8DS • V a l u e ‑ L e v e lMetadataを理解できない 実際の 8DS 構造がイメージできない ‑モチベーション不足 ‑CDISC標準を使用する意味を理解していない • FDAReviewerがどのようにSDTM/ADaMを使っているかイメー ジできない ・標準化のメリットを理解していなし、(解析プログラムのマクロライ I :い 川 な I I¥ l ブラ日等) 430 目 ι

422.

k 4 J M ユーザー蝕 m … … 一 … P I I I B J Analysis‑Ready(OneProcAway") • A n a l y s i sd a t a s e t sshouldhaveas t r u c t u r eand c o n t e n tt h a ta l l o ws t a t i s t i c a lanalysest obe performedw i t hminimalprogramming. • Suchd a t a s e t sa r ed e s c r i b e das a n a l y s i s ‑ r e a d y . " CDISCA n a l y s i sDa!aModelTeam.A n a l y s i sDa!aModel(ADaM)v e r s旧 n2.1.2009 ーシ解析データセットは、最小限のプログラミング CData Step)で統計解析ができるような構造にしておくべき 16 … 一 飴 一 … … … 201I l 改善策の提案 1 . 関連するSDTM/ADaMドメイン横断の教育 2 . SASを用いたハンズオン サンプ jレADaMデータセットのレピ、ユー ‑ ADaMfこ準拠した標準化 SAS解析プログラムの実行 ー 3 . eCTD*,申請パッケージを用いた説明 会 electronicCommonTechnicalDocument 431 園南鴨宮曹司圃 門/ ‑ SASXPTがどのように eCTDf二添付されているか? ‑ FDAが実際にどのようにデータセットをレピ、ユーして し、るか?

423.

│ ωs ユーザー倣 続 的 ロ 日 ソ リ ー … ~IIll I 7 ど従来) SDTM/ADaMを 見1 1 々に、それぞれ一通り教育 コ干[_...目_i*-__.~~::__~~_~~~_~_~~とう竺竺-j 11m圃璽・国等 ADaM:ti‑ 1 "fンスの教育! F j 圏 内i iEBi 52223sJ 1 ・圃圏・圃‑ ︑ 司‑園踊ミ目一 胃困層 ‑a臨咽・E ‑︑輸験 F‑ ・圏内凶一 F ・ ・ 晶 ・ 一 ‑間 同 一 一 ︐ ︐ag︑ ‑ E'・ 'E 畠 診 関 連 す る 5DTIV仙 DaM横断での教育 等 園田問問咽 ) ~ ( ωユ ー ザ ー 蝕 対 … 日 ツ リ ー … ~I & 1 砂 1 関連する SOT OaMドメイン横断の教育 附 1)関連する C RF、SDTM( S u p p l eも含む)、 ADaMの関係を 関連イメージ図を使って説明 2)関連する変数同士の関係 ( C o p y / D e r i v a t i o n )を説明 例 )SDTM.DM.変数AIまDerived ".司噂園調圃.. 3 ・E斗 ! . I . L 辺 国 ・ OOADSL変数 X IまSDTM変 数 Xの 完全コピー 必品内ニ〉四 例 )CRFの変数 B IまSuppDMへ E 品邑孟4 品斗掴 司 圃 圃 ・ ・ ・ 曲F 例 )ADSL変数 YIまSUPPDMから作成 図 関 連 す る CRFベ ジ 、 SDTMDM、ADaM.ADSL関連イメージ図(模式図) 噂 実 際 は 当 社 の CRF,SDTM(SuppDM)、ADSLに合わせて作成 園田開曹司 432 パ 、

424.

⑥ 日 よ 1 1 t * # ザ ー 蝕 … … … 一 SDTM/ADaMガイダンスを用いた説明(講義形式) ガイダンスはすべて英語、 Metadata表示が大半(デ セットの例示は少ない) 膨大なページ数 • SDTM/SDTMI G一合計約 350ページ • ADaM/ADaMI G一合計約 100ページ タ SASを用いたハンズオン a . SASを用いたサンプ)[., SDTM/ADaMデータセット のレビュー b . ADaMfこ準拠した標準化 SAS解析プログラムの 実行 本ガイダンスも適宜併用 11ュ一一一…:d!~~:婿躍診 2.SASを用いたハンズオン E盟理盟彊E い 「 2013 a.SASを用いたサンプル SDTM/ADaMデータセッドのレビュー 台サンプ jレSDTM/ADaMデータセット例 ‑ SASC l i n i c a lStandardsT o o l k i tのサンプルデータ • Compliancecheck(SASP r o cCDISC,OpenCDISC等)を実施 CDISCP i l o tP r o j e c tのサンプルデータ 一一ェク卜のて事 SASデータセットを SASで実際に目で見ること、ならびに、 Compliance checkを実行することで、デ タセット構造を把握し、理解を深める .特に、 Metadataの状態ではイメージしずらい構造 (ADaMValue‑Level Metadata等)の理解を深める • 圃官官官r . l ' 1 酒 433 円

425.
[beta]
│
臥Sユ ー ザ ー 総 会 的 問

g

2
引

ω

J白 山 リ …

S
闘しいコ汗ルグー

印刷

t;開く・

,
,
:
1

昼前

'官僚白"

ロ 制 " 口b
d
d
t

:
0
1
21
01
8t
2.l?月データセヅト

ロ 糾 問 & 日 目 凶t

.
0ロ 日 目 口 3
2 剖S デ ~~:í ト

ロ 岬 問d 期加.tJt

2
0日 1
J18123
Z 国←何十

ヲイ

2
;
2
2
←
‑r ‑
2
:
1
5
A
5テ'ータ古川吾実原/ごEでj言てみ多
亘 五 福γ一
一
一
仁
二
2
.
'↑→伊J
)T
r
i
a
ldesigndatasetsが申請プロジェクト
自己記
「 :
i内で統一されていないと、併合解析が困難にな
t
.

I

号、私町叩円l.~盛:1 ることを把握、認識を深める

ー

ドヨァイル柿慮凪匂田明":f‑Jt,(l} ~~倒的

̲
j

'.J,j:,-!". 対りつ-!;..f.勺判明叫ぽ附

白 6・
・(lミ "宅)'.1t1i!D' 6臼
E
l
l
l
l
l
'
・

抽 …

h
=
'
.
) ~~:~.Jー"'",..,.,..,..
.
ー紘一 :~l .
.
.
.
.
.
.
̲
d
<

記議室i i;

こう二!郡部;
Y
:

;
:

f ̲

;
芸
:
善
悪
ー

SASを用いたサンプjレ
SDTM/ADaMデータセットのレビュー(例)

I

I

総ユーザー総会対的……均

!
I
'
.2.SASを用いたハンズオン

b.ADaMIこ準拠した標準化 SAS解析プログラム*の

茎宜
*CDISCを基に以下の統計関連マテリアルを社内標準化
1
. TLFS
h
e
l
l
(図表のレイアウト)
2
. ADaM仕様
3
. SAS解析プログラム(マクロプログラムライブラリ)

J事
レ
‑ 標 準 化 SAS解析プログラムの実行を通じ、 CDISCによる標準化のメ 1
)ッ
卜
を実感する
・実行を通じ、 ADaMデ タセット、 Metadatalこ接触する機会が増える

置需曹曹曹司

4
3
4

426.
[beta]
..
r

r

|こγ~-.è
7~"/T/)/r
t> 二川一三
I
総会主
やが?:九
I
日行均. .
三日 l
.
'IQ
ADaMに準拠した標準化
SAS解析プログラム*の実行

三手

を通じて、標準化のメリットを
実感

L

一 ー ョ

CDISCを基に
1.TLFShell(図表のレイアウト)
2.ADaM仕様
3.SAS解析プログラム
(マクロプログラムライブラリ)を
構築
合

リ
'
│恒.将川 川ιτ尚
川

4
'
1
.
'
以マ
..
九
へ
で
命

ι2却~悶9目E

三
百 ぷ川♂ぺ
i
i
i
i
す
T
1
1
竹
七
ヤ
…
?
咋
‑
U
ド
叩
戸
山
?
主
=

任主)SDTM/ADaMガイダンスを用いた説明(講義形式)
• SDTM/ADaMデータセット、 d
e
f
i
n
e
.
x
m
lが実際にどのよう

な形で FDAIこ提出されているかのできない
FDAが提出された SDTM/ADaMデータセット、 d
e
f
i
n
e
.
x
m
l
をどのように使っているのかイメージできない

e
c
r
D、申請パッケージを用いた説明
a
.SASX
P
T
がどのよう l
二eCTD{こ添付されているか?

b
.FDAが実際にどのよう!こ CDISCデータセットをレ
ビューしているか?
ガイダンスも適宜併用

瞳盟誼盤謹i

2
十

435

427.
[beta]
I

惨
.

201I

r.:.l=Jユーザー総会………ゅ

3
.eCTD,申請パッケージを用いた説明
a
.SASXPTがどのように eCTDIこ墨付されているか?

正当。[町泊料

/~ D
e
f
i
n
e
.
x
m
lサンプJ
レ (SASC
l
i
n
i
c
a
lT
o
o
l
k
i
tより)

,

記占ミミ由国民包

ノ

出 白 [ 山d
y
J
国白制問

J

酬/

:
,
;
匂 .d
む d奇白日 b

f
:
:
J
r
J
市
,開

局白同手

間 j
品抽出

包 pr09'鵬

J
匂 pro s
白』同

i
N

B じ)U!b
u
l
十也市

山~協同--'叫山一一四回一

.
,
.
.
" 'y(

" h

司
令
̲
.
.
.
.
.
.
.
.
.
.
.
'

器$
乙3由 咽

一
一
一
一
一
一
一
一
一
一
一
一
」
eCTDD
i
r
e
c
t
町 S
t
r
u
c
t
u
r
e
FDAStudyDataS
p
e
c
i
f
i
c
a
t
i
o
n
s(
2
0
1
2
)

君。 V 明ト

SAS XPT'
升ルサンプル

・
・
・・
・事ー.
ファイルの関係(模式図)
・E胃明明司明"明・・
1
1
1
11
1 '
l

eCTDとSASXPT

1
t

I

ロ
日
…
…

~I

r.:.l::ユーザー総会…J

錯躍診 3
.eCTD,申請パッケージを用いた説明
b.FDAが実際にどのように CDISCデータセットを
レビューしているか?
‑FDAReviewerの発表 CPhuse等)
・
#
,1えl
、
f
; BehrangVali(2012)、MatSoulくup(2010)

‑FDA対応情報

斗事レ
‑実│擦の FDAReviewerの使用実態を知ることにより、臨床試験
テ、ータセットの CDISC化の意義を実感することができる

E雨明胃曹司

436

ぺ
今

428.

Imート蝕……~…… mI まとめ ‑国際共同試験、グ、口一バル承認申請の増加により、 日本でも臨床試験データの CDISC標準化が必要な 場面が増加 • CDISC標準化には SASが多く関与 ‑本発表では、品質マネジメント手法を用いて社内の ADaM実装の改善案を検討することにより、 SASを 用いた医薬品開発の統計解析担当者に対する CDISCの社内教育プランを提案 r 主 I Siiiií'Jìi総一…~ー叫 r ♂ 九 九 2013 今後の課題 ・提案した教育プランの評価、更なる改善 • CDISCIこ関する統計担当者への教育以外の 対応策の検討 一社内標準のマネージ、ガバナンス強化 ーグ、口一バル体制の強化 一関連部所(臨床開発、薬事等)への教育 7 イ 437

429.

SAS ユー付金……一… ~g References 薬食審査発第 0928010号.国際共同 治験に関する基本的考え方 ;2007 CDISCSubmissionDataStandards• Team.StudyDataT a b u l a t i o nModel (SDTM)V e r s i o n1 . 3 ;2012 CDISCA n a l y s i sDataModelTeam. A n a l y s i sDataModel(ADaM) v e r s i o n2 . 1; 2009 CDISCA n a l y s i sDataModelTeam A n a l y s i sDataModel(ADaM) I m p l e m e n t a t i o nGuidev e r s i o n1 . 0 . 2009 C h r i sH o l l a n dandjackS h o s t a k . ImplementingCDISCUsing SAS;2012 SDTM/ADaMP i l o tP r o j e c t !o : / / w w w . c d i s c . o r q / s d t m ‑ a d a m ‑ ht 凶旦主盟盟主l BehrangV a l i,FDACDER,ADaM ReviewfromaCDERS t a t i s t i c a l R e v i e w e r ' sP e r s p e c t i v e,Phuse S i n g l eDayEvent;2012 MatSoul くu p,FDACDER, ConductingS t a t i s t i c a lReviewsa t i n g l eDay CDER,PhuseS Even: t 2010 可 438

430.

非線形回帰分析の基礎と応用 高橋行雄 B i o S t a t研究所(株) AnI n t r o d u c t i o nandA p p l i c a t i o n st oN o n l i n e a rR e g r e s s i o nModels Y u k i oT a k a h a s h i B i o S t a tResearchC o ., L td . 要旨 非線形回帰は,応用分野ごとの問題について解説されることが多く,線形回帰に引き続き非線形 回帰を学習しようと思い立っても,敷居が高く学習する意欲がそがれてしまう.そもそも,線形回帰と非線形 回帰の違いは何なのか,解析法の違いは何なのか,線形回帰は正規方程式を立てて解くことは知ってい るが,非線形同帰はどのような計算原理なのか.線形同帰の事例を用いて,線形同帰分析による解析手順 と,非線形回帰分析による解析手1 1 闘を並列することにより,非線形回帰の本質が理解しやすくなる.線形回 帰式でも簡単な式の変形により非線形同帰式となることを,回帰式をパラメータで、偏微分した結巣から判定 する考え方を示す.さらに,共通の切片を持つが具ーなる傾きをもっ線形式を取り上げる.傾きの比の分散を 合成分散の一般式(デルタ法)で求めた結果と,傾きの比をパラメータとする非線形式に変形し非線形回 帰で求めた結果が同じとなることを示す.いわゆる平行線検定法は,線形回帰で、求めたパラメータの比か らX車 I B方向の 2つの直線の距離と分散を求める方法として知られているが,非線形式に変換し非線形回帰 分析によって,同じ結果が簡単に得られることを示す. キーワード P r o cNLIN 非 線 形 回 帰 逆 推 定 勾 配 比 検 定 平 行 線 検 定 デ ル タ 法 E x c e l 1 はじめに 非線形回帰モデ、ル分析は,応用分野の高度に専門的な分野で使われている.そのためか,ごく身近に ある統計的な問題に対して多くの適用場面があるにもかかわらず,適用事例を見出すことがで、きにくい.線 形回帰については,応用分野それぞれごとに統計の入門書で必ず取りとげられている.応用分野の非線 形回帰の問題で,モデ、ル式を線形化し通常の線形同帰・による解析が定式化されている事例も散見する. ただし,線形化できない問題については棚上げされることになってしまう.このように線形化して問題解決を はかった先人の努力が,身近にある問題について非線形回帰の普及を阻害しているかのように思われる 統計解析を必要とする分野は,多岐にわたっている.応用分野での統計に関するオピニオン・リーダた ちが,現実の問題で非線形回帰の統計解析について学習したいと思っても,入門書は非常に少ない.出く r a p e r,N . R .a n dS m i t h,H .(1966),中村慶一訳 (1967),r 応用回帰分析 Jの 1 0章に「非線形推定序 は , D 説 J,芳賀俊郎・野津自弘・岸本淳1 真司 (1996),r SASによる回帰分析」の 8章に「非線形回帰分析 Jがある. 最近,出版された芳賀敏郎 (2010),r 医薬品開発のための統計解析,第 3部非線形モデ、/レ」は,非線形 モデ、/レ(非線形回帰)の基礎から応用まで、丁寧に扱っており,線形モデルにヲ l き続き,非線形モデ、ル学び, 活用したいと思う人にとって必読の書物で、ある. 439

431.

非線形回帰・モテ守ルの入門として,線形回帰の種々の統計的な推定について,非線形同帰への拡張と 応用を念頭とした基本的な考え方を Excelの行列関数を使って示し,次に.同じ例題に対して,非線形回 帰の基本的な考え方を線形回帰と対比しながら Excelの行列関数を使って示す.さらに,典型的な線形式 を,非線形式に変換する.どちらも同じ直線のあてはめであるにもかかわらず,前者は線形回帰の問題とな るが,後者は非線形回帰の問題となる.なお,非線形回帰は,回帰式が線形で、あっても非線形で、あっても 取り扱うことができることを SASの NLINフ。口、ンジャで、示す. 2 .E x c e lの行列関数による線形回帰モデルの基礎 2 . 1 . 線形回帰の行手J I関数を用いた定式化 5個のデータ ( x , y)=(I,O ),( 1, 2 ),( 2, 3 ),( 3, 4 ),( 3, 6 ) について, yt=β。+β, X +e ,E i‑N ( O, σ ‑ ; ), jニ 1 , 2, . ・ . ,5 i i ( 2 . 1) 誤差 E iが互いに独立に平均 0,分散が σ jの正規分布に従うと仮定し,最小 2乗法によって,回帰パラメー )を推定したい.行列関数を用いて計算する場合には,式 ( 2 . 1)を用いるのではなく, β。に XOiな タ(sO' β, る変数を明示した Y i =β山 i+βrXJj +Cj,久 ‑N ( O,σ ‑ ; , ) i=I, 2… ,5 を用いる.ただし,全ての I について XO i =1 ( 2 . 2 ) とする.式 ( 2 . 2 )は , Y i=L s k X k i+E i ' i=1 , 2, . . ,5 ( 2 . 3 ) と Z 記号を用いて表すことができる.さらに,行列を用いて現すと,データ数 11=5,変数の数,ここでは, XO iも含めて変数の数 p=2 の場合も明示することなく,一般式 y=Xp+e ( 2. 4 ) で表すことができる.Excelシート上で,式 ( 2.4)に数値を入れて示そう. これらの行列を, J':測定値(反応・応答)行列(ベクトル), y X:計画行列,デザイン行列, 川 E: 誤差行列(ベクトル), 1x1 )の場合はスカラーと と言うことにする.大きさ ( 区別することもあるが,全て行列として扱うことにす ( 5 x l) ),X は ( 5x2 ),Pは る.行列 yは,大きさ (5xl (5x2) 白 ( 2 x l) ( 5 x l) 図 2 . 1 Exx巴lシート上での行列表ー現 ( 2x1 ),εは ( 5x1 )の長方形(矩形)で表現されて いる .Xpは,行列の積で ,X の行方向のi(こ対し て,pの列方向の積和を,次に示すように計算す 5x2 )( 2x1 )は,それぞれの内側の大きさが等しくなければならない.行列の積 Xpの結果は, る.行列の積 ( 5x1 )と行列となる. それぞれの内側の大きさ 2が消えて, ( 2 . 2 . 回帰パラメータの推定 、 2乗法とは,誤差 E のそれぞれの要素 iごとに平方し, 同帰パラメータ pを最ノト 2乗法で推定したい.最ノj 440

432.

すべて加えた偏差平方和 S Tが最小になるように,同帰パラメータ pの推定値 p( ベータ・ハット)を求める ための解析法である.これは,線形式のそれぞ、れのパラ メータについて偏微分した式(正規方程式) 次式で得られたとする. 3 ~G ここで ,X T はもとの X の行と列を入れ替え た転置行列 (Excel:Transpose 関数,トラン ( 2 x 5 ) │ 1 ; ; : l LquqJ (2 . 5) 2 内 J j= (XTX)一1XTY 「 4141 を解くことによって得られる.ここでは pが , ( 2 x 2 ) ( 5 x 2 ) スポーズ関数)とし、う. (XTXrlは逆行列 (Excel:Minverse関数, E1 │ 1 ; ; : │ マトリックス・インパース関数)といわれるもの で ,(XTX)と(XTX rIの積を計算したときに, その行列の対角要素が全て!となる単位行 ( 2 x 2 ) 列 Iとなる. 逆行列の結果を用いて行列の積 (Excel:Mmult関数,マトリックス・マルチプリ 「 ケイション)で推定値 β を求めてみよう.逆 行 列 (XTX rlの大きさは (2x2), XT は 2 3 ( 2x5 )なので ( XTX) XTの大きさは (2x5) ~[J口 一1 5x1)なので,推定値 p となる.さらに Yは ( ( 2 x 2 ) ( 2 x 5 ) ( 2 x1 ) )となる. の大きさは (2x1 ‑1E1lnU1E1l EE‑‑ ( 5 x 2 ) ( 2 . 7 ) 一 一 同八︽勾 LqJqJ 内 ( 2 . 6 ) す ﹂ シ 現 AY 芯ノ一一 行 J る ょ と ザ ︐ シ払 い 一 11355 Iiに対する同帰直線上の推定値 Y iは X y‑02346 s o=‑1,傾き β1=2が得られた.これを用いて, 4141 一 X 11111 行列計算により,回帰のパラメータとして切片 ( 5 x 1) ( 5 x1 ) ( 5 x1 ) となり, Y 軸の切片がー 1,傾きが 2 の同帰由;綿 上の推定値)'が得られる. 2 . 3 . パラメータの分散の推定 誤差分散の推定 測定値 Y i と回帰直線上の推定値 Ci=Y i‑Y i ' 1 Y J との誤差を i= 1 2, , … ,5 ( 2 . 8 ) としたときに,それらの誤差平方和 S Tは,次のようになり, L(Y一丸)"=1 ンf i=lJ .5 S ] '= ( 2 . 9 ) i 行列で現すと, S, . 二f tとなる. 441

433.
[beta]
誤差分散 d
jは,データ数 11=5か ら 推 定 に 用 い た パ ラ メ ー タ の 数 p=2を差し引し、た自由度

λ=11‑p=3で,誤差平方和 S"を害JIって待られる.
S
r
4
σ
ー=一一!.̲‑一一一=1
.
3
3
3
3
ーラ

I
1‑P

(
2
.
1
0
)

5‑2

回帰パラメータの分散の推定
a
r
(β。
),傾き β
lの分散 V
a
r
(β
'
]
),s
oとβlの共分散 Cov(so,s]),これらを分散共分散行
切片 Aの分散 V

ヲ[J..[として表す.
Z

二

C
οv
(
s
o,
s
]
)I

I
Cov(so,
β
'
]
)

V
a
r
(β
'
]
) I

(
2
.
1
1)

白

IVar(so)

T
分散共分散行夢 [
J
.
.
[ は ,(X X)
一Iに 誤 差 分 散

= .
.
[

可を掛けて求められる.
,,[ =(XTxr] ô-,~

1
.
6
0
0‑
0
.
6
6
7
0
.
6
6
7 0
.
3
3
3

(
2
.
1
2
)

(
2
x
2
)

行列とスカラーの積の計算は,行列の全てのセル

(
1x1
)

(
2
x
2
)

に対してスカラーを掛け合わせる.
Z の対角要素が ,Var(β~]) =1
.600とV
a
r
(β
'
]
)=0
.
3
3
3となり, 2夢[J 目 l行目が共分散 Cov(so,
β
'
]
)=
一0
.
6
6
7

となる.分散共分散行列..[の対角要素の平方根が,同帰パラメータの標準誤差 SE となる.標準的な
回帰分析で出力される回帰パラメータに対する I統計量は , Ik=s
k/
戸高で計算ーされる

さら

x
c
e
lの T
d
i
s
t関数 (
1d
i
s
t
r
i
b
u
t
i
o
n,分布関数)で計算する.
に,自由度 3の I統計量の両側確率 p は E
表 2
.
1 阿帰‑パラメータの推定

。

k

x
X
o
:包J
j
)十

ρ
A

Pk^

V
a
r(
sk^)

戸
。

X
I
:傾き

P
I

‑
1
.0
2
.
0

1
.
6
0
0
0
0
.
3
3
3
3

SE
1
.
2
6
4
9
0
.
5
7
7
4

p

0
.
7
9
0
6
46
4
1
3.

0.
4869
0
.
0
4
0
5

3
. 線形式を非線形式に
3
.
1
. 線形式を非線形式に変換

組形同帰の基本である次式は,

。

J
'
j=β +β'
]
X
j
+
&
j

(
3
.
1
)

切片 β。と似{き点)の 2つのパラメータで現されている.ある与えられたんを通るような式を考え,その推定値
を正。とする.式 (
3
.
1
)
(こんを代入して, β。について解くと,

s
o=Yo β']XO
が得られる .s
oを式¥3.
1)に代入し,整理すると
Y
j=Yo+β
'
](
x
2.
,・
,.1
j一
九 )+&j , i=I,

(
3
.
2
)

となり, X。は推定したい未知パラメータであるので, β2 ‑正。とおいて,
1

y
j=Yo+β](
X
j βュ)+&j , i=I,
2,
,
・
.
.1

となる. もしも ,Yo=yとyの平均値を与えれば,民=王となり,重心を通る線形式となる

442

(
3
.
3
)

434.
[beta]
式(
3
.
3
)は
, β
!とβ2で偏微分したときに,

。

全
土 =(X sZ)

公
!
.
.
.
一β

‑
i

θ
β
1

(
3.
4
)

β2

となり,偏微分した式に,他のパラメータが含まれているので,最ノj
、2乗推定量,

I

I{Y Yo‑s
I(X s2)}2

Sr= 以 ‑)
'
y=

i‑

i‑

(
3
.
5
)

は,パラメータに関して線形で、はなくなり,正規方程式を立てることができないために,線形回帰の解析法

3
.1)を,パラメータで、偏微分した式は,
が使えない.ちなみに,式 (

生L=x

8Yi=1

8
s
O

(
3.
6
)

'8
s
I

となり,他のパラメータが含まれないので,パラメータに関して線形となり,正規方程式を立てパラメータに
ついて解くことにより,推定値を得ることができる.
非線形同帰は,正規方程式を立てずに,パラメータを逐次的に変化させ,誤差平方和を最小化する方

3
.1
)
法として知られている.非線形回帰の解析法は,非線形式のみならず線形式に対しても適用でき,式 (
に対しても式l3.
3
)に対しても,解析手1
)
国も結果は同じである.
3
.
2
. 非線形回帰の手1
)
頂

線形式と同様に,非線形式でも,第 l段階「パラメータの推定J.第 2段階「パラメータの分散
の推定J.第 3段階 195%信頼区間など、の推定」などのように分けて考えると理解しやすい.
1
) パラメータの推定

iに対し,何らかの方法で推定された推定値を丸としたときに,誤差平方和を,次のよ
与えられたデータ Y

うに定義する.

S
r=I(Yi 丸)
2

(
3
.
7
)

線形回帰の場合であれば,推定された (so'β,)を用いて,

Y
i=so+β'1'¥

(
3.
8
)

を計算し,事後的に誤差平方和 S
rを求める.非線形回帰の場合は,おおよそのパラメータの推定値
(点。)点。))を与えて得られた推定値 F
J
O
)を計算し,とりあえず残差を計算し,

2
J
O
)
=九一 (
j
J
{
¥
O
) +β
'
I
(
U
)
X
)=
J
'
i‑ 5
:
‑
)
0
)
i
として,誤差平方和

(
3
.
9
)

s
y
}
)を計算する.

この誤差平方を小さくするような,変化量

40)と河口)を何らかの方法*(注)で推定し,

舟l)=A(O)+可。)

。 )+40)
点 1) 点

(
3
.
1
0
)

のようにパラメータに 40)と判。}を加える.同様な手 1
)
闘を繰り返して,変化量が δ
J
2
2
1
}
=
0とδ
J
m
}
=
0となった
時点で反復計算を終わりにする.
訟は,パラメータで、偏微分した式を用いて,全てのデータについて微係数
最も基本的な解析方 i

δY
i
z
"=
̲
,
̲
, • i=1
.
2
… ..17
8
s
o' uθβ

Z
n
:‑
δ
i
‑Y
O
i‑

(
3.
1
1)

を計算する.この微係数を行列 Z としたときに,取りあえずの残差 ;;(0)に対する次の線形式

Z
rZr

(Zr

δ(0) =

1

(
3.
1
2
)

;
;
(
0
)

443

435.

で,変化量 δ(0)を計算する. キ(注) I 何らかの方法 J としたのは,さまざまな数値計算法があるが,最終的なパラメータ推定値は一致 する.統計では,得られたパラメータとその共分散分行列から,さまざまな推論をするのが目的である.した がって,変化量 40)と高(0)を小さくする計算アルゴ、リズムは,統計の本質的課題ではないため「何らかの方 法Jとした. 2 ) 分散共分散行事] 1 の推定 パラメータを偏微分した微係数行列 Z は,線形モデルでのデ、サ、イン行ヲ I]Xと同様の性質を持つ.誤差 ι 6 1 pb ︽ 一 一 υ hvT' ︑ 円 分散の推定値を可としたときに,変化量が 4F 吋 =0とδ J叫 ( 3 . 1 3 ) となり,誤差分散と,分散共分散行列 Z は , z r: δ ('(m) 可=ユてヨ n‑L L :=(ZT 1 ( 3 . 1 4 ) となる.これを元に,線形@帰の場合と同様に各種の分散が推定できる. 3 ) 各種の推定 線形同帰の場合に直線上の推定値丸の分散 Var(丸)は, V a r (丸) =x よrJT となる非線形の場合は,微係数行列 Zの行方向のベクトル Z jを用いて, Va ベ丸)=z jL : z ; ( 3 . 1 5 ) で求められる.同帰の 95%信頼区間,および,伺別データの 95%信頼区間も,線形回帰の場合と同様に 回帰 戸而, 個別:ム士 f(/, 0.05)~Var(yj) +可 Y i士t ( /, 0 . 0 5 ) となり,線形回帰の場合と問じ式で求められる. 表 3 . 1 線形および非線形回帰の比較 盤虚血1 量 1 )パラメータの推定 非線形回帰 x rXTy J j=(XT d(O) = ( ZTZ) 一1z T i ( O ) 1 j J ( 1 )ニ 片 (0)+δ(0) d(l) = ( ZTz r1ZTi(l) 片山=片(1)+δ(1) ペ サ z? d XI iMJ 4qJqJ 7=AS L := (ZTZ)一l δ f V a r (丸 )=z jL :z; 一︽ 一 r‑r y でY σ で 一+ ﹁一均一均 xtββ ・ ︽ 九 はか U U AIh 個別データの 95%CL れ 同帰の 95%CL =ベ+一+一 3 )推定値丸の分散 zv 2 )分散共分散行列の推定 九 : : t1(/, 0 . 0 5 )戸芯万 Yj 士 I(λ 0.05)~Var(丸) +a ‑ ; このように線形回帰と非線形回帰を比較してみると, 1 )パラメータの推定方法が異なり, 2 )デザイン行列 X を微係数行列 Z に置き換え, 3 )推定値丸の分散の推定は,デザイン行列のベクトル Xi,微係数 Z 行列 444

436.

のベクトル z ;と異なるが, 95%信頼区間は同じ式となる. 1 )パラメータの推定 jにある.この過程を E x c e l のシート上で見える 非線形回帰の普及の阻害要因は, 1 ようし,誰にでも初期値を変え,簡単な手作業によって逐次計算の過程が追えることが,身近な問題に対 する非線形回帰の適用する糸口となる. 3 . 3 . 線形式を非線形回帰の手順で x , y)=(I,O ),( 1,2 ),( 2,3 ),( 3,4 ),( 3,6 ) について, 第 2章では, 5組のデータ ( σ ; 。 ( 3 . 1 6 ) YJ=β +βjX , , ) i=I, 2, . . . ,5 i+e i) 只 ‑N(O の 線 形 回 帰 式 の 誤 差 G;が互いに独立に平均,分散が σ ;の正規分布に従うと仮定し,最小 2乗法によって x c e l の行列関数を用いて回帰パラメータ ( β。=‑ 1 .0,β ' 1=2 . 0 ), 分 散 可 =1 . 3 3 3が 回帰分析を行ない, E 得られた. 同じデータについて,非線形回帰による解析方法を示す.まず,目の子でヲ l し、た同帰直線の切片と傾き . 8 0,舟 0)=2.15)とする.これを用いて,図 3 . 1 に 示 す よ う に 推 定 値 を 丸 =0 . 8 0+2 . 1 5 x ;で を(点。)‑一0 計算し,誤差平方和を sy)=正(内( 0 ) エ : l ( Y I 丸)=5 . 3 4 で求める.式 ( 3 . 1 6 iをノミラメータについて偏微分して, Z ( ¥ :‑ δy ; 1 = δy ; 1;δβl ( 3 . 1 7 ) 一 一 ‑ 0 ; O β。 【 微 係 数 の 行 列 Zを求める.このように,微係数の行列 Z は,線形式の場合のデザイン行列 X と同じである. Zを デザイン行列"とみなし,図 3 . 1 に示すように誤差 tを測定値 v の代わりとして,推定したいパラメー 2 . 5 )と同様な 同帰式" タを δとした線形回帰を行う.式 ( d ( O )= (ZTZ)一1Z T i ( O ) ( 3 . 1 8 ) で , δの 推 定 値 ( b 6 0 )=一0 . 2,布。}二一 0 . 1 5)を得る.この方法は,残差に対する線型化法 ( / i n e a r i z a t i o川ま たはテーラー展開法,あるいは,カマウス・ニュートン法ともいわれている ; 臼 3 1 由 士 10. 05 Y"= 内 t1aつιneu φ 守 ‑ 2 3 4 5 図 3 . 1 第 O ステッフ。で、の計算結果を図 3 . 2 に示す.図 3 . 2(左)の回帰直線は,やや上側で,一見して残差 平方和が最小となっていなし吃判断される.図 3 . 2(中)は,凶 3 . 2(左)の同帰直綜に対する残差フ。ロット . 2(右)が,残差フ ロットに対する回帰直線のパラメータ で,それに対する回帰直線が示されている.図 3 C ( ‑ 0 . 2 0, ‑0.15)を(ー 0 . 8,+2 . 1 5 )に加えた回帰直線が上書きされている.図 3 . 2(右)で上書きした回帰直 線は, 445

437.

β J l ) = β ' 60)+6 60)= 一0 . 8‑0 . 2=‑ 1 .0 ( 3. 1 9 ) ( 0 ) =2 . 1 5‑0 . 1 5=2 . 0 0 β J i ) = β l ( O ) +司 ( 3. 2 0 ) で,計算したもので,これを用いて第 lステップ。に移行する. j i ( O ) =一0 . 8+2.15x'/ し/ぐら‑' 図 3 . 2 医I3 . 3 に 第 lステップ。の結果を反映した結果を示す.残差に対する回帰分析の結果 (b~\I) ニー0.00 , δJl)=‑0.00)であることが示されている.これは,最適解が得られていること解釈され,第 2ステッフ。が,もは や必要ないことを意味する. ; : 臼 1 0 . 0弓 = ん ハ= 1 ‑ 1 . 0 0 1 sJ^=L ̲ ̲ ̲ 2 J l J l ̲ j I= 1FD re‑‑lq4qun x 図 3 . 3 凶 3.4(左)に第 lステップで、得られた回帰・式,回帰の 95% 信頼区間, f 岡別データの信頼区間を示す. 図 3.4(右)は, (左)の回帰分析の残差フ。ロットで,切片が 0,傾きも 0の直線が示されていて,このステップ。 で、最適解が得られたことがわかる. 正(1) = 0 . 0‑O . O x , ‑8 図 3. 4 第 lステップで、の残差に対する回帰分析 。 等高線図は, X 軸に切片 β ( b O )を Y 軸に傾き β 1( b l )とし,それぞれのパラメータをメツ、ンュ状に変化さ 4 4 6

438.

せながら残差平方和 S rを計算し, S rに対する等高線図としと結果である. lNプロシジャによる線形回帰 3. 4 . NL NLINフ。ロシジャは非線形回帰のみならず線形回帰に対しても適応で、きる.E x c e lの行列関数での計算 結果と対応するためには, SASの線形回帰のための REGフ。口、ンジャ,あるいは, GLMプロシジャよりも NLINフ。ロ、ンジャが適している.これは,回帰分析系のフ。口、ンジャで、は,伝統的に 切片"に対応する変数を 内部で、補っているが, NLINフ。口、ンジャで、は明示的に 切片"に対応する変数を model y = betaO 大 XO + beta1 女 x1 のように明示的に与えることができ, E x c e lの行列関数での計算方法と合わせることができる. Program1 NLINフ。ロシジャによる線形回帰 da. ia d O l; i n p u x O x1y~@ ; o u . lp u . l d内 l . , ,1 i n巴s : 4 188 110 112 123 13 十 一 proc prin. id , J . t 8 .= d O l ; run Ti . lIe 2 '線形式表 NLIWt '' proc n li n dU. 8= d O l 口u l . e d = es + .O1; pi : 1 . r a m e t e r s b ε l . a O = ‑ 0 . 8 bel. ,~1=2.15 m o d e l y=b el . 8 .0持 x O + behl 時 x l; r u n 一 ̲ . . . . ̲ ̲ . . . . . . ̲ ̲ . ̲ . . ̲ ‑ 宅. ̲ . . . . . ̲ . . . ̲ ‑ ‑ ・ ・....̲...‑一一一一一..̲......̲‑̲.̲........一一 M proc prin. id al . 8 . = 巳 宕1 . 0 1 ; run , NLINプロシジャで、は, parametersステートメントで,初期値を与えなければならないので,散布図か ら推定されるおおよその値として betaO=ー 0.8 beta1=2.15 を与えている.パラメータに関する分散 共分散行列 Z を得るために outest=est01 オフ ションを指定している. c t u L 司 Da O D B S 反復計算の過程と分散共分散行列 ﹄ ‑ n r 斗r d Ua ﹄内︿ T Y P E S T A T U S I T E R I T E R 2! l .e r 乱 l .i o n 2I t .e r s . li 口n oC o n v e r g e d oC口n v e r g e d oConverged F I N A L C O V B C O V B N A M E I T E R S S E . l o . l b e 5 . 3 4 4 . 0 0 4 . 0 0 4 . 0 0 4 . 0 0 . 8 .0 b el b e . l a l O U l p U l 1 . 1 に示すように,パラメータの推定値は, 工 s o=‑1,s, =2 となり,分散共分散行列 Z は , b 巴 1 . 8 .0 1 . 6 0 0 0 0 ‑ 0 . 6 6 6 6 7 ‑ 0 . 6 6 6 6 7 0 . 3 3 3 3 3 E x c e lで計算したと同様になる.対角要素から V a r (β。 )=1 .6 00 と Var(β ' , )=0 . 3 3 3 となり,その平方恨からパラメータについての SE となり, 95%信頼区 間も出力される. P a r a m e . l e r b e . l a O b e . l a l .2 回帰パラメータの推定値 O U l p u t1 A p p r o x S . l dE r r o t . A Es t .i m o . . l ε i m " . . l e85~; C 口n fi d e n c eL imi き . l p p r口x ‑ 1 .0 0 0 0 ) ( 1 2 . 0 01 1 .2 6 4 8 0 . 5 7 7 4 447 ‑ 5 . 0 2 5 8 0 . 1 6 2 6 3 . 0 2 5 8 3 . 8 3 7 4

439.
[beta]
3
.
5
. 非線形式に対する非線形回帰の適用
yj=3.5+β1'(
X
j β
'
2
)+E
i をパラメータ β
!とAで偏微分すると次の結果を

3
.
5
)で示した非線形式
式(

得る.

。
日v
β
1

ZJ
j=
ー よ =(X
j‑

s2)
."

。
V,

=
一
一
一
刷
。
β2

Z

吋

~

(
3
.
2
1)

= ‑ D,

パラメータの初期値河口)=1.7と河口)=2.1を式 (
3
.
2
1)に代入し, 1
1{固分のデータについて予測値封。}
を計算し,反応率 Yjと の 残 差 げ
帰モデ、ル

Z
rZT

(ZT

1

;
;
(
0
)=

¥
z
!
?,z
g
)を計算する.増分に対して,微分係数行列を用いて次の回

d
(

(
3
.
2
2
)

日)

で計算し ,d(O)=[
0
.
3
0 0.18fを得る.

;
:
臼

s,
^
=
ん^=
YO
二

2
3

4
5

目
白
図 3
.
5

o=3
.
5とXO=巧0
)ニ 2
.
1
0を通る直線
凶 3
.
6(左),こ傾きが βJO)=1.70で,Y
PJO)=35+β'
J
X
j‑s
2
)=3
.
5+1
.
70
(
‑
¥‑2
.
1
)=‑
0
.
0
7+1
.
70
x
j

が示されている.図 3
.
6(中)は,残差に対する回帰式

i
' 5
iO)βJO)

t
J
O
}
=身
九l+40)Z2=JJ汽Xiー β O))‑

=0
.
3
0
(
x
.
1
0
)‑0
.
1
8x1
.
7
0=‑0.936+0
.
3
0
x
j‑ 2
j

が示されている.第 0ステップ。の P
.
6(右)であり,あてはまりが良くなっている.
J川こげ)を加えたのが図 3

図 3
.
6

パラメータの第 l回目の推定値を
0
)
1̲
)
1点
。
)+5;0)二 2.1+0.18=2.28
1
(
0
)+5(
片'
.
0
0,点 ̲
.
7+0
.
3=2
舟)
1 =1
0
.
0
0 ‑o.03fを得る.
として,図 3
.
7 に示すように計算をすると ,d(l) =[
第 lステッフ。で、は,収束していないので,第 2ステッフ。として
)̲
;2}+42)ニ 2
舟 I)+JJl}=2れ Oβ=2.0,片;Z}=片
.
2
8‑0
.
0
3=2
.
2
5
点2

448

440.
[beta]
として計算すると,凶 3
.
8 に示すように増分 d
(
2
)が 0
.
0
0となり,収束していることがわかる.

;
:
臼

f0.05=

j
j

I
:
=
•
σ
ρ 1ハ=

吋

︐
ιquA F
h
u
・
1 1lq

図 3
.
7

;
:
白

10.
0
5=

3
:

l.~=

^
σ 1一=

Fa‑e44nJι
4
内 ua 1
FhJU

園 3
.
8

同州ノミラメータの推定値は,第 2 ステッフ で、傾きが β
f
)=2.00,J'o=3
.
5を通る X 4
!
H
lの 逆 推 定 値
c

点
。
)= 2.25が 得 ら れ た . こ れ ら の 分 散 は , 図 3.8 で す で に 計 算 さ れ て い る 分 散 共 分 散 行 列
Z
TZ
rto"}の対角要素で ,Var(βt)=0.333,Var(sJ=0.072 となる.これらより,
L =(
.
2 に示すようにパラメータについての f検定をおこなうことができる.
表 3

一

'K1 2

表 3
.
2 回帰パラメータの推定

x
Xt 蒲~
X ヲ:逆推定

L

st

ム

P
l
'
^
2
.
0
0
0
2
.
2
5
0

Vα
,r
(sI"
)
0
.
3
3
3
0
.
0
7
2

SE
0
.
5
7
7
0
.
2
6
8

3
.
4
6
4
1
8
.
3
9
2
5

立

0
.
0
4
0
5
0
.
0
0
3
5

ただし,逆推定値民の f検定は形式的であり,統計量としては, 95%
信頼[
;
.
<
:
1
11]に若;味がある.

同好~: s
]
̲士1
(
(,
0
.
0
5
)長友石=
(
1
.
39
7,
3
.
1問

449

(
3
.
2
3
)

441.

s 個別: 2:t/(f, 0.05)~Va叫ん +σ; =ー (1 . 5 2 3, 6 . 0 2 3 ) ( 3 . 2 4 ) L lNプロシジャによる非線形回帰 3 . 6 .N NLINブ。口、ンジャを用いて,あるん=3 . 5 を与えた非線形式 model y = yO + betal 大 ( Xl ‑ beta2 ) の回帰パラメータを推定してみよう.初期値として, Excelと同様に,河口)=1 .7とβ;0)=2.l とする. Program2 NLINフcロシジャによる非線形回帰 Ti . 11 e 2ヨ 'F 線形式事N L lNで' proc nIi nd a . la = d O l 1i s . lo u . le sl . = 巳s . l0 2 y O =3.5 parame . le rs b e . lal=1.7 b e . la2=2.1 ; . la 2) e m o d e l y =y O +b e . la l x l ‑b run . la=es . l0 2 ; run ; proc print d a *( O l l t p u t2 . 1 反復計算の過程と分散共分散行列 OBS TintつU S斗 ﹁Dnb T Y P E S T A T U 8 l TE R l TE R l TE R F I N A L C O V B C O V B le r a . li o n 2I I .e r a . li o n 2l 2I le r a . li o n oConverged 1 (C 口n γ e r g e d oC口nγerged N ¥ i M E l TE R b e . l a l b e . l a 2 0 . 3 3 3 3 3 0 . 0 4 1 6 7 ‑ 0 . 0 4 1 6 7 0 . 0 7 1 8 8 S S E 4 . 8 0 4 5 0 4 . 0 1 4 0 1 4 . 0 0 0 0 0 4 . 0 0 0 0 0 4 .日0 0 0 0 4 . 0 0 0 0 0 b e . l a . l b e l a 2 O l l t p u t2 . 1 (こ示すように繰返し lで 河 1 ) =2 . 0 工 とβ j i )ニ 2 . 2 7 6 , 繰 返 し 2 で 河 2) =2 . 0と ・ β ' f )=2 . 2 5で E x c e lと同様に収束したことが示され , Excelで計算したと同様に出力されている.回帰パラメータについての 95% ている分散共分散行列 Z は 信頼区間も Excelで計算した場合と同じ結巣が得られている. 直一 定 一 推 一 の 一 タ 一 JY 一 一 フ 一 ノ一民げ 2 . 0 0 0 0 2 . 2 5 0 0 当日巾一一川町 b e . l a l b 巴 l .a 2 守u E s . li r 同 I .e 1 4 U P a r a m e . l e r 田一仰 E Output2 . 2 f J la t .e85%C o n fi d e n c巴 L i m i. I s A p p r口xi 0 . 5 7 7 4 0 . 2 8 8 1 8 . 8 3 7 4 3 . 1 0 3 2 0 . 1 6 2 8 1.3~Jß8 z E x c e l で非線形回帰を行うために,非線形式をパラメータで、偏微分し,微係数行安Ij を用いたのである が , NLINフ内口、ンジャで は,偏微分した式を与えていない.これは,偏微分式を与えない場合に, NLINプロ シジャ内部で,自動的に偏微分を行うからで、ある.その内部計算の過程を, list オプ。ションで、見ることが できる.非線形式を構文解析してパラメータについて偏微分した式が,示されている. O u t p l l t2 . 3 ﹄ QU ) ρv .︐目︑ ︐ .nf 角川司.︐ ‑A7ι LUI' thM ︐ ‑ ‑ V A ‑ ‑ ' l ' ‑t d Jt︑一巳 p d 一 戸 d== ー 赤色 ︑ ‑ 免U Y A ‑ ‑'ー︑ ' h u ‑ ‑ n VJLULU +bPAH‑pd lp﹂ lp﹂ ﹂戸ト﹄﹁ト﹂ 判‑ 川政凶U ‑ 450 ﹄ 〆 . ︐ 目 ︑ ︐ + ー ︑ n H ' 白い)一ド ︿ U れ yM = ﹁ ヒlphunu Hununu nunuumum 11Z 凸 つ ιnt 8 0 :5 6 2 : 5 6 2 : 5 6 2 : 5 ︒包向巴 = r ' ' r ' ' EUVJVJ ︐ .n ‑ ‑・V J ‑ ‑ 8 . 1 m . l t . in go fC OfJlPi 1 e dPr o gr ( l f J l C o d e Li s S . l a . l e m e n . l8.S P a r s e d L i n e : C o l

442.
[beta]
3
.
7
. 線形回帰で得られたパラメータの比の分散
線形回帰の結果は,一般的に X
=
oにおける yi切片」と xが l増加した場合の vの増分である「傾き Jで
I御 凶 子 X としてい1
'=
1,
表現され,図にした時に理解し説明やすい.多くの実験研究では,市J
X2= 2,...)のように水準を設定し,反応 Y
iを得る.制御因子 X の増加に伴ない反応が統計的に増加す

ることを期待しているとしよう.あらかじめ設定した期待反応値 y。となる X(lの値とその 95%信頼区間を求め
たいとしよう.
線形式 Y=β。+βIX に対して線形回帰を行い ,Y
o=3
.
5が得られたとした場合に前節で、推定されたパ
ラメータ

A

s
I=2から逆推定の点推定値,

,

二一 1

Yo‑so 3.5‑(‑1)

(
3
.
2
5
)

Xo= ーと~-一一一一一一二 2.25

' β 2

)を 2つのパラメー
を得ることは容易である.しかしながら,その分散はパラメータの比となっているので,式(3.:25

タで偏微分した式を用いて,合成分散の一般式(テ、ルタ法)で近似的に求める必要がある.

.
a
¥
‑
o ‑
1

(
y
。 β。
)

針
。

Z,ニーーァ=一一一^て一一一

Z
/
} ‑ 一一ァ=ーァ

a
s
o β
1

a
s
I

βl

として,分散共分散行ヂJ
I1:"について 2次形式

川

T

0
)=7
.
I
Z

=
(
長
)

手手 叫ん

与I

V
a
r
(
s
o
)+
2
c
β
'
1
)+
1
V
a
r
(
s
I
)
a
s
oa
s
I
.
' .,
¥
.a
β
'
1)

(
3
.
2
6
)

V

から九の分散を推定することができる.

ー
。
=
斗

‑
1
θ
β。 β
1

。 t'

生=主壬 so)=一(3.5:(l)L‑1.125

ニ
l 0.5,

ー1 ‑

二一

βlβ

2

2
‑

I 1
.6

Zニl

1
‑
0
.
6
6
7

.
5
I
ノ
a
r
(お
)=zLZT=[ 0

斗 1
2
5
1

1
.
6
0
0
0
.
6
6
7

0,6
6
7
0
.
3
3
3

回=

0
.
0
7
2

佐i
lの分散は, VarCXo)=0.072となり,
逆J
表 3
.
2 で示した V
a
r
(民)=0
.
0
7
2に一‑致する.このように線形回帰て、推定されたパラメータの関数で与えられた
I途
推定値に閲して,その分散を推定することができることを示したが,これを実現するためには,白己責任で月J

SAS の DATAステッフ。で、計算プロクeラムを作成する必要がある.このようなことは,一般的には推奨できないの

で,線形式を非線形式に変換して NL
lN フ。ロシジャで、直接推定することを的める.

4
. 切片が共通な 2本の回帰直線
4
.
1
. 線形式によるパラメータの推定
きが異なる 2本の回帰直線が,共通の切片 Aを持つとした場合,
ば
(l

。
X2i+[
Y
2
j=β。
+β2
;
2
j

(
4
.
1)

Yli二 β +s
I
X
l
j+ι
'
Ij

(
4
.
2
)

最小 2乗法で共通の切片 s
o,2つの傾き β1'β2を同時に推定したい.式 (
4
.
1)および式 (
4
.
2
)を
(
4
.
3
)

jv=β(内 +s
I
X
l
j+βュX2
U
j+E

J

451

443.
[beta]
ただし , Xo=1 , X1
i
fi
=2
), x1
i
f i=1
),
j=0 (
j=0 (
および、 X に上記のように条件をつけ lつの線形式とする.
のように変数 X1
j
2i
この 3変数について線形回帰の計算式によってパラメータ so' sI' β
2 を同時指定する.この推定値を
用いて誤差分散を次式で求め,これから分散共分散行列を求める . Lの対角要素が,各パラメータの分
散の推定値になることカミら,
表 4
.
1 に示すように回帰パラメータの 5Eの推定が行なえる.

41nυ

0
戸

﹃

u
4lnv h
内

etnUAU

l

(
3
x
1
0
)

(
1
0
x1
)

(
3
x1
)

、
昼
5
r
8
.1
4
3
7
2, (j.~ 士一一I__ ‑一一一一=1
5T 2
二

0
.
6
8
6
‑0.
28
6
‑
0
.
1
4
3

X
rð(~

L =(XT

︐
tnuq
ι

i=y‑'
i=y‑Xp,

(
3
x
3
)

噌

3
4
5

2
2
4
6
6

・3nuqt

2
2
2

。
。
。
。
。

41nJnU

2

1 ﹄ nJnu

2

2
3
3

0
.
1
2
5
0
.
2
5
0 ‑
0
.
6
0
0 ‑
‑
0
.
2
5
0 0
.
1
4
6 0
.
0
5
2
0
.
1
2
5 0
.
0
3
6
.
0
5
2 0

‑‑qtnv

1
2
3
4
5
1

(XTX)
ぺ

'l l n v

1
1
1
1
1
2

。
。
。
。
。

x

主̲
l
i

主
旦

J
A
‑
1
‑
o

X

ー」一̲̲L̲̲

n‑p 10‑3

0
.
1
4
3
0
.
2
8
6 ‑
0
.
1
6
7 0
.
0
6
0
0
.
0
6
0 0042

ー

表 4
.
1 回帰パラメータの推定
一

Eし

1H

J
﹁ ‑672
‑nocuλ 件
'
L︐‑
cu‑‑nu
︐ v‑nuunHunHU

州
ん
ム
ム
一
ρ一

k‑012

P
k
^
4.000
2.000
1
.
0
0
0

SE

L9
5
'
1
0 U95%

0.828
0.
408
0.204

2
.
0
4
2 5
.
9
5
8
1
.
0
3
5 2
.
9
6
5
0
.
5
1
7 1
.
483

/2二 0
さて,この 2本の回帰直線の傾きの比 ρ二民 /
.
5 により比較を行ない,それらの 95%
信頼
β
I二1

区間から統計的な検討を行ないたい.比 ρをそれぞれのパラメータで偏微分すると,

ap"

み = 一 一 =0.

uθβo

a
p

s
2

1

"
c.
0
.
2
5
Z,=一一=ーーム=一一::‑=‑
"
Oβ
lβ2"
,

ρ l
a

"
'
:
:
"
'
=
0
.
5
ム=一一 =
as1 β
l

行目と 1~[J 目を落として,
となるので,合成分散 V
, 2
a
r
(
ρ)は
:0= 0なので l
,ゆ
V
σ

0
.
2
51
.
10
.
1
6
7 0
.
0
6
01
1‑
.
0
0
5
9
5
0
.
5
1
1
=0
" 1
I
J0
.
0
4
21
.
5 1
.
0
6
0 0
10

が得られる .95%信頼区間は,
(
0
.
0
5,
t1
巧予7=0.5士2.365x必茄百子=(0.318,0.682)
95%α=ρ :
!
c
.
)
.
j

信頼区間が lを含まないので ρ=‑0.5は,統計的に有意な差で、ある.
となり, 95%

4
.
2
. 線形式の非線形化
4.4)に代入すると,
{民きの比 ρ=β21
β
I をβ
2について解くと広 =ρβl となる.これを式 (
X1
βI
o
リ+
β
l
λ:
I
j+ρ
j+[;ii '
Yu=sox

となり,パラメータで偏微分すると

452

444.
[beta]
'
Y
i

ム=一一'‑‑=Xn= 1.
υ0βo

司
Y
i
i

一
一'‑‑=X,
.+0ふ...
β
l リ'り

Z,
.

リ 。

Z~i 与
=βI X 2
uρF

(
4.
4
)

i

となり,他のパラメータが残ってしまい,線形同帰を行なうための正規方程式を立てることができないので,
線形回帰の解析法を適用できない.そこで、,これまで示してきた 2パラメータについての非線形回帰を 3パ
ラメータに拡張する.
パラメータの初期値 βl(O)=5.O , β~0)= 1. 5.ρ(0) =0
.4を式 (
4
.
6
),(
4
.
7
),(
4
.
8
)に代入し ,11何 分 の デ ー

タについて予測値げ)を計算し,反応率んとの残差

40),微係数

z
i
j
},z
i
f
),z
Z
)を計算する.残差に

対して,微係数行列を用いて次の同帰モテ、/レ
(ZT lZTi(O) δ(0)

Z
r

(
4
.
5
)

二

で計算し, (
5
(
0
)=[
‑
1
.00 0
.
5
0 0.13fを得る.

E
三工三盃

q'ιnO にJ
qunU43
nununu
nυnunυ

1
.40
1
.40

0
.
4

2
.
4

唱t

8
.
6
8
.
6

A‑‑E‑if‑‑

7
.
4

4

‑
0
.
5
0
0
.
5 0
.
5
0
0
.
0 0
.
0
0
‑
0
.
5 0
.
5
0
0
.
5
0
1
.5
‑
1
.2
0
.
2
0
0
.
8 0
.
2
0
.
6
0
0
.
6 0
‑
1
.5

iif‑nunununU ハ
U‑nυnunununu
‑nυnυnununu‑nununυnυnu

6
.
5
6
.
5
8
.
0
9
.
5
9
.
5
6
.
2
6
.
2

σ,
・ A‑

66Boo‑668DO
︐
一一
.
+

言

工
二

e

戸=

nununu

2
.
0
0
0
.
5
3

・凋付

立山」

。
。
。
2
。
3
。
3
。
2
。
2
。
。
。 66

I

I
J
^+
t
5
4
.
0
0

‑
0
.
0
2I
/
Jo^=
0
.
0
0I
s,
^
=

・
一
一
︐
守=‑788
rι79
7
0
‑nu

u

ηζ4tハ

U
只ベV
F
h
J
Uハ

x

nυnunu

yp‑nυRJU 勺L

一

PL氏uqLnu

r‑oOO

z‑‑

;
:
臼

,

20

Zli

1
.00
1
.00
1
.00
1
.0
0
1
.00
1
.00
1
.00
1
.00
1
.0
0
1
.00

1
.00
1
.0
0

2
.
0
0
3
.
0
0
3
.
0
0
0
.
8
0
0
.
8
0
1
.6
0
2.
40
2.
40

Z21

0
.
0
0
0
.
0
0
0
.
0
0
0
.
0
0
0
.
0
0
3
.
0
0
3
.
0
0
6
.
0
0
9
.
0
0
9
.
0
0

x
c
e
lシート上での非線形回帰の第 0ステップ'での計算結果
図 4
.
1 E

凶 4
.
2 (左)に切片が β
'
60
)=5
.
0,傾きが βJO}=1.5と傾きが ρ河
口
)=0.
4x1
.5=0
.
6の 2本の直線が描かれ
)として計算されているが,これは,微係数行夢 IJzに対する
ている.残差に対する回帰パラメータはが 0
hm込
t
v ι

ηJd

aHa''

一

一

'J

︐屯‑

同︐'八プ

1h'

o
ti'

川

LG'dO

︐ィ︐

ご
ご

I

i:残悦差吋引机刊川日引引H

l
j;

l
I

o

0

̲
.
'.
.
(
.
:

て
二一

ト一一 ~.aι二一一ー
‑1'"♂ 2
③

μ
一

1

.

A
a

f

g
=
i
Z
E
t
a
‑
z
;
i
p
i
E
P
i
s
i
‑
‑
B
I
l
‑
‑
?
!
?
i
i
A
F
i
j
i
‑
p
i

ょげの
H

τ

仁 二二ナ二二二二二二

,1 0

i

心

。

。

図 4
.
2 第 Oステップて、推定された回帰直線・残差ブ、ロット・調整後の回帰直線
ものなので,元の xのスケールの同帰ノミラメータに戻すために, 次の汁算をする.

z
d
(
O
)=高 +Jl{ lj+JFZ21
5
?
1
)
ρ
(
0
)+宅明1(01)XZi
=5
60
)+51
(
0
)
xl; +(
=‑
1
.
0+0
.
5
x1
i+(
0
.
5x0.
4+0
.
1
3x1
.
5
)
x
Z
J
.
0+0
.
5
x1j +0.3925x
=一 1
2
i
凶 4
.
2(中)は,切片が

1
.
0,x1jに対する傾きが 0
咲きが 0
.
3
9
2
5 の 2本の直線が W
i
.
5,XZiに対する f

453

445.
[beta]
かれている.図 4
.
2(右)は,パラメータの初期値 p(IJ) に 増 分 δ(0) を加えた回帰パラメータで,切片

s
c
il)=5.0‑1.0=4.0,傾き βl{り =1.5+0.5=2.0,β;i)=ρ(1)β'?)=0.53x2.0=1.06であり,あてはまりが良く
なっている.
)= 5
.
0‑
1
.0=4
.
0,βjりニ1.5+0
.
5= 2
.
0,
パラメータの初期値に増分 J(()) を加え第 l ステップの瓜 1
ρ
(
1
)=
0.
4+0
.
1
3=0
.
5
3を得るので, E
x
c
e
l シート上に入力し直し,図

4
.
3 に示すように,第 2 ステップで、の

{
I
) =[
0
.
0
0 0
.
0
0 ‑
o
.
0
3
fを得る.
推定値とし, J

図 4
.
3

残差;こ対する l
訂l
帰直線

d
.
!

0ιo
《

l

3

0 6

一
一
5 ‑"t‑一寸

!

汀 白 『ω

T

0

d

。

。

. '

一一

一一

一司自白一一一一一一 J

i
10

。
一」

図 4
.
4 第 iステップで・推定された回帰直線・残差フ。ロット・調整後の回帰直線

第 2ステッフ。で、

p(2) =p(l)

+J(I)これらを加えて図 4
.
5 を得る.増分 δ(2)が全て 0となったので,ここで,

収束したと判断する.
P^+d
4
.
0
0
2
.
0
0
0
.
5
0

f
e
=7

10.
0
5=

I=

‑
0
.
2
8
6 0
.
0
0
0
0
.
1
6
7 ‑
0
.
0
1
2
‑
0
.
0
1
2 0
.
0
0
6

σ 2 ^ー

図 4
.
5 第 2ステップで、推定されたパラメータの増分
分散共分散行列 rの対角要素がそれぞれのパラメータの分散になるので,それらの 95%信頼区間を計
.
2 に示す.切片 β。と傾き β
!とについて,表 4
.
1 と同じ結果となる.また比 ρの信頼区
算した結巣を表 4

:
とめた (0.318,0
.
6
8
2
)と一致する.
間は,比 ρをそれぞ、れのパラメータで、偏微分して合成分散で、 1
表 4
.
2 傾きの推定値

K

Xlj:傾き

﹄

比

判
一
ん
ム ρ
n

一0 1 2
k

x
‑
'
0
:
窃

Pk^
4
.
0
0
0
2
.
0
0
0
0
.
5
0
0

V日γ
ψぐ
〕
0
.
6
8
6
0
.
1
6
7
0
.
0
0
6

SE

L95% U95%

0
.
8
2
8
0.
40
8
0
.
0
7
7

2
.
0
4
2 5
.
9
5
8
1
.
0
3
5 2
.
9
6
5
0
.
3
1
8 0
.
6
8
2

E
x
c
e
lで比 ρの信頼区間を求めるための計算量は,線形回帰に引き続き合成分散で求めた方が計算は

容易であり,非線形回帰を用いる必要性はないと思われるだろう.ただし,結果の再現性の観点から,
E
x
c
e
lでの計算は常に計算ミスが誘発されやすく,その原因を特定することが困難であり,実務で使うことは

まったく薦められない.困ったことに,線形回帰のための統計ソフトには,推定された回帰パラメータの比の

454

446.
[beta]
に二二ペ7-h:こ対する同
J~\j直線
x
{
土
.

o 'o

3 白

栴1上となってい

ム

0

γーァ+一一念一一‑‑‑
2

JL
.‑ーー

一一一一‑
一
̲
‑

図 4
.
6 第 2ステップで、推定された回帰直線 (95%
信頼区間は外側のみ)
分散を合成分散の一般式をサポートしている統計ソフトを見出すことができない.非線形回帰のための統
計ソフトには,非線形式をパラメータで、偏微分する機能を持つようになり,比を直接推定できるように線形式
を非線形式に式変換して,非線形回帰のための統計ソフトを使って計算することを強く薦める.
Excel をもちいて,計算手順を詳細に示したのは,非線形回帰の本質をしっ泊、りと四解することにより,さ

まざまな応用問題にチャレンジするための基礎をしっかりと学んで、もらいたし、からである.また,統計ソフトを
用いた非線形回帰は,ブ、ラック・ボックス的で、あり, c 言語などを用いてブ。ログ、ラミンクoする際の数値例として
使ってもらいたいためでもある .NLIN プロシジャで‑のフ。ロク寸ラミング,結巣の出力を次に示す.Excel での
結果と一致している.
Program3 切片が共通な非線形同帰

合問

uz

u
︐
.
m
m

t

9ιAqd
VA

0HVAho

11
11

の
4dvAHU

O河
U A可uv

凋崎町

oHUハhu

oHO

OU

UAHU
合喝

﹄

AUυAMO

'a.
︑fr
x;'l
O
H
U 今L
︐
︐
︑

今

‑ ‑ a t H U ぐv ' ' o u

︐
.
︐
.
uup
e
・

ittoeg

MMnvaEn
‑ ‑ n H H U 2SFhJVFhd

aaoU L
tnυ
aa''

dd
も
・
・

巳日~_:j白星 ff~_Ol-主主主一並立LOlL.l.L_y . Takaha主hi':

i
.
11
e
2 .来線形式を NL
lNで
troc n
lin da
.
la=d02 Ii
"
,
1
.
口u
l
e
s
!
.
=
e
s
t
0
2
.
lers betaO=‑1
.7 b
et8.1=2.1 .
h
o
= 0.5;
parame
model y = belaO +be
.
la
lゅ(
x
l +r
h口湖 x
2)
run ;
troc print d
8
.
t
a εst02; run

,

二

式Z
た一旬

¥刀一向司

d

し
一 md

.mm

︒ι

︐
.X

巾中

︽

事

ι

ぃ

︑
ーv
ρ

LHV
︐
.
?

'llh

pd11a

t? J'‑‑thν

'hUVAl?

︒
︒
'+
ta
‑

..

l'L山小 1
﹄ nu
+‑
p‑ρuLH
1hunuhur

11﹂ 11﹂

川町印南口
!h

︐
V
P
Jふ

I

︐f︐
‑‑t
'f'
VJVJ

・

山小品開

11﹂・﹄l ﹁ト﹂Fト﹄
︿
﹁ト﹂

zjucdzlu

i‑
‑u
Ea
? ︑
?﹄
︐
.
︑
n
ux'l=
a
a

ダfk

心以

J

斜同一肝P

v︑
‑‑
d守
a

タ一ほ t

メ 一︑印日
一
一

ノ一 g

222

V nHνnHν
︐
nHunu
n︑
u
一
フ
一 1
5訓 l
‑
t‑
t
︒¥一副む {
umm
v
m
w
ν

3一
iu

u一 C

Em

‑aj 1
18
1
ou
‑
‑ 86

••••••

Output3
.
2 回帰パラメータの推定値
P
a
r
a
r
n
e
t
e
r
.
aO
b
el
b
e
.
l
a
l
r
h
口

E
s
l
i
r
n
a
t
e

A
p
p
r
o
x
S
l
dE
r
r
o
r

4
.
0
0
0
0
2
.
0
0
0
0
0
.
5
0
0
0

0
.
8
2
3
1
0
.
4
0
8
2
0
.
0i
72

455

A
p
p
r
o
x
i
r
n
a
t
e9
5
%C
o
n
f
i
d
e
n
c
eL
i
m
i
t
s
2
.
0
4
1
8
1
.
0
3
4
8
0
.
:
31
7
[
;

5
.
8
5
3
1
2
.
8
8
5
4
0
.
8
3
2
4

447.

O u t p u t3 . 3 パラメータの収束過程および分散共分散行列 B S 地 'lqt‑quATrnuρb7 ・ T Y F 'E S T A Tl JS I T E R I T E R I T E R F I N A L C 日V B G O V B C D V B te r a t io n 2J 2J te r a ti 口n 2I te r a t io n oC口nverged oC口nverged oC口nverged oConγerged N A M E I T E R S S E b e t a O b el . a1 r h o 1 3 . 3 8 0 0 3 . 4 2 8 7 8 . 0 0 0 0 8 . 0 0 0 0 8 . 0 0 0 0 8 . 0 0 0 0 8 .日0 0 0 b e t a O b e t a l r h o 5 . 傾きが共通な 2つの回帰直線 5 . 1 . Y方向の差. x 軸方向の差 λノ よ 47勺 ︑ぇ lを持つが,切片が S群で、は s s ' T群では βTと異なる 2つの回帰直線のあてはめを 共通の傾き β S群 , i= I Y ] j= β~xs+A1:]j+C]j' j=I, 2, . . . ,n ] ( 5 . 1 ) T群 , i=2 Y2j=βrXr+β' ] X2 j ' j=1 , 2 ・,, . .1 12 ( 5 . 2 ) j+e'2 線形回帰で 2つの切片 s s' βr' 共通の傾き β iを同時に推定したい.そのために, 2つの式 ( 5. 1 ), 5 . 2 ) を次のように,他の群のデータの場合に Xs' x 式 ( rが 0 となるような条件を付け , 1つの式 にまとめる. ( 5 . 3 ) y引 =βI 'X ] X cij' i=I, 2, j=I, .・. , l 1 i, S+βrXr+β' U+ ただし xs=1 ( i f i=I), xs=O ( i f i=2), Xrニ o(if i=1, ) Xs=1 ( i f i=2), 行列表現で現すと次のように表すことができる. x 、 。X 。 . 。 。 XX21 。 . 。 Xs J Xr , ー ! I " " 1 2 p 回 1 .11 1 Y ヲヲ 、、 X ':'.11., ( N x3 ) ( 3X 1 ) (Nx1 ) 図 5 . 1 傾きが共通な 2木の回帰式の同時推定 Y 切片の差 βY<S‑T) ‑ 兵一応を, βTについて解くと βr=兵一 βl ' (s ‑ r )となる.これを式 ( 5 . 3 )に 代入すると,次式が得られる. Yu=βi S X ' (S ‑T))Xr+β] X i j+勺 S+(βsβl ( 5. 4 ) =βiS(X ( S ‑T)Xr+β l勺 +c i j S+Xr) βY Xs+x rは,常に lなので, ( 5 . 5 ) ( S ‑T)Xr+β] X ゲ Yυ=βE一βY U+C と簡略化できる.行列表現で現すと,図 5 . 2のように現すことができる. !と 2 つの直線の Y 軸方向の差はc)l'(s ‑ r )である.では, X 軸方向の差 βx(s‑r)は , 共通の傾きを β したときに, β) ' ( S ‑T) ‑ β l βX(S‑T) なので,式 ( 5 . 5 ) の βY ( S‑T)に代入すると, 456

448.

x p 。 。 。 Xs+Xr Xr Xi; X1 1 X1 2 X1.11! Xl1 . Y方 ̲ . 、 』 ‑ " 2 . 1 1 : : ( 3 X I ) ( NX3) (NXI) 凶 5 . 2 切片の差 β,)(S‑T)を用いた線形式 Yij =β t一β l β λ (S‑T)XT ( 5 . 6 ) +βIXij 十 eij' となる.パラメータで偏微分すると, 。 ' J ' i i a βS Z, , : :‑ 一 一 」 一 = 1, vy め 乍 n z , , =一 一 一 ‑ ‑ 一 一 二 一 i λ "1 βX(S‑T) ハ a ;T q v H a β l n Z守 口 = ー ー ム =~ f j¥'1 c " ! I , J tJ T¥X T ,J , +.X.; ( 5 . 7 ) υ となり,他のパラメータが残ってしまうので,線形ではなく,非線形となる.したがって,微係数 行列 Z を用いて,残差 εに対する線形回帰を用いた非線形回帰で f q q ;く必要がある. 5 . 2 . 計算事例 S薬の用量を 2mgから公比 2で 3用量, T薬は 4mgから公比 2で 3用品ーとして,次に示すよう に反応 y を得た. Program4 . 1 平行線検定のデータセット作成 data d 0 2; i n p u l xST xT x y @e d o s e =2 : 1 : : I : x lou̲dose =x ̲ 1口g 2 ( d o s e ); o u l p u . l; d a . la li n e s; [3 :1 1 1 15 11 [ 1i 11 ( 2B 10 38 11 1] 1 1125 112i 1I38 11 4 8 114 1 O u t p u t 4 . 1 解析用データリスト 0 8 8 xST 。 リ 4 υ E xT 。 日 o I 1 X 5 つ ' . 。 . ) つ 1 1 E ワ 8 proc prinl d a l a = d 0 2 run 日 1 0 d o s e ~,' 3 : 4 4 「 。 υ 1 1 l o g 2 ̲ d o s e L 内 ι 内 4 。 8 4 4 o 1 s 1 8 2 3 3 2 2 3 4 4 SASの NLINプロ、ンジャで,推定したいパラメータとして, S薬の切片を betaS,X車 I h方向の差 を betaX S T,共通の傾きを betal としてモデル式を次のように設定する NLINプロシジャ で,推定したいパラメータとして, S薬の切片を betaS,X軸方向の差を betaX S T,共通の傾 きを betal としてモデル式を次のように設定する. Program4 . 2 NLINで平行線検定 打i . 11 e 2 '非縁形式を NLINマ 一p 一 一 一 一 一 一 ! r o c nIi nd a l . a . = d 0 21 i SI.口 u . le s l .= 口u . le s . lO l 一 一 一 一 P乱 r a m e t e r .主 b e . la S = 5 b e . la X8T = 2 b e. lal=3; m o d e1 y = belaS本xS T‑b el . 主1 : 取b e . la X̲S̲Tホx ̲ T +b e . la . l取x run 3 .= o u. le 主 1 .0 1 ! p r o c pri nl d 8 . l . run 457

449.
[beta]
O
u
t
p
u
t4
.
2パラメータに関してモデル式を偏微分した結果
L
i
s
ti
n
g口fC
o
r
n
pi
I
e
dP
r
o
g
r
a
.
!
nC
o
d
e
L
i
n
e
:
C
口I
8
1
.a
.
l
e
m
e
n
.
la
sP
a
.r
s
e
d

8
t
m
.
l

.y=b
e
l
.a
8ホ x
̲
8
̲
T‑b
e
.
l
a1
M
O
D
EL

1
7
8
:
5

*be.laX8Tホ xT+be.la1 x;
市

J
!
M
O
D
E
L
.
y
/
自b
e
.
l
a
X8Tニー (
b
e
.
l
a
1: x
̲
T
)
;
!
JM
O
D
E
L
.
y
/
自b
e
.
l
a1=x‑b
e
.
l
a
X8T:
和
記 T
;

1
7
8
:
5
1
7
8
:
5

O
u
t
p
u
t4
.
3 パラメータの推定値と 95%
信頼区間
P
a
r
a
m
e
.
l
e
r

E
s
.
li
m
a
.
l
e

b
e
t
.a8
b
e
.
l
a
X8T
b
e
.
l
a
1

4
.
0
0
0
0
1
.
00
0
0

A
p
p
r
o
x
.
l
dE
r
r
o
r
S

A
p
p
r
o
x
i
m
a
.
l
e9
5
%C
口n
fi
d
e
n
c
eLi
mi
.
l
s
1
.
8
8
5
0
0
.
2
0
0
8
1
.1
0
8
2

0
.
8
8
4
4
0
.
3
3
8
1
0
.
3
7
8
0

2
.日
目
。
。

8
.
1
1
5
0
1
.
7
8
9
4
2
.
8
8
8
8

O
u
t
p
u
t4
.
2 収束の過程と分散共分散行列 Z
O
B
S
2
3
4
52
一
、

8
T
A
T
U
S

T
Y
P
E

N
A
M
E

S
S
E

。

2I
te
r
d
.
.
li
o
n
te
r
a
.
li
o
n
2I
te
r
a
t
i口n
2I
oConverged

I
T
E
R
I
T
E
R
I
T
E
R
F
I
N
A
L
C
O
V
8
C
口
"
l
8
C
Ol
/8

I
T
E
R

81
.
00
0
0
1
0
.
2
2
2
2
8
.
0
0
0
0
8
.
0
0
0
0
8
.
0
0
0
0
8
.
0
0
0
0
日.
0
0
0
0

2

b
el
.
a8
oConverged b巴l.aX8T
oConverged be.
l
a
1
。

.
l
a
X
b
e
ST

b
e
.
l
a
S

l~口 nγerged

2
.
0
0
0
0
0
1
.
3
3
3
3
3
1
.
0
0
0
0
0
.
U
U
U
U
U
0
.
1
1
4
2
3
0
.
1
1
4
2
8
0
.
0
0
0
0
0

b
e
t
.a
1
3
.
0
0
0
0
0
2
.
0
0
0
0
0
2
.
0
0
0
0
0
~.UIJIJIJIJ

‑
0
.
2
8
5
7
1
0
.
0
0
0
0
0
0
.
1
4
2
8
8

︐

rit
E
E
r
e
‑
&
s
i
t
e
‑
L
[
i
l
e
‑
‑
r
e
e

Runu

11

。〆〆ム

。‑〆

" ‑
‑

~/'"o/.ム

.0

/〆

G
QIム

/
〆
〆0 /
ム

~~

P
牛

b
.

o

〆/'

"

。
。

O

。

。

X
;
;:l
o
g2
(d
o
s
e
)

I

X
2
・ d
o
s
e
!
}

o
g
2
(
d
o
s
e
)および、 d
o
s
eに対する用量反応関係
図 5
.
3 l
L
lNプロシジャの追試
5
.
3
. Excelの行列関数を用いた N
これまで Excelで示してきた非線形回帰の手順で,平行線検定の問題を解いてみよう.パラメータで、偏微

5
.
7
)から次のようになる.
分した微係数行列 Zは,式 (
400

X
.
Ys
+XT

ρ

Z
22
'
'
(
1
!

20

。 .1""
XJ.
nl

β 1 β X(S
‑了)
+
;
:
2
1
ー

‑
s,βx<s;‑)+
.
x22

、
灯

‑
s,βX(

1
1ラ

図 5
.4平行線検定のための微係数行列 Z

458

+
:
:
:
:
2.
1
'
1

1
~~ l
n
6

450.
[beta]
パラメータに適当な推定値を入れ (
s
t
),β兆
一
T
)sI(())) とする.これを用いて,残差ど 0)!こ対する回帰パ
ラメータグ 0)を推定する.

0
40}=yu‑yf)=yffー Cs1)βi(O)β;

込T+β川 ij)
δ
()=CZTZ)1ZT/
:
(
0
)

推定されたが日}を β{}に加えて β(1)とし ,y
)
/
)を求め,さらに,微係数行列 Z を更新する.
01
)̲β:1
)+0
¥
0
), β
;
!ら
‑T)
β11T}+6J{}), A(1)=βl
附 +
δ;0)1)β;!JLT)XT+βI(I)X
J4l)=β;l)一

nhunuqu
nonU 凋件
ιnU41

︐
︒nununU
マ
︐
.
一
一
回

nMdqu M
︽
U
マ
'nb00
4lqunu
q︐
ιnU4i
‑
一

‑内

euFhJuqu
l
噌 nunu

一
一
‑
'auqu
c
aマ
回
︐
マ
fJ‑006

一

nunununununununununu‑
nunununununununununuE

n‑‑123300122

一

‑nunununununununununu‑
‑nunununununununununu‑

‑‑000004U4 寸 41d

‑oDODODODoo‑‑ト

unununununununununu‑‑ 一
園内

一一︑y

1111111111

ー

‑ILI‑

﹁Illl1111111L 一笛升

‑勺‑‑一

四

﹁

ト

ド司功一

内

﹃︽

tt41nu
nununu

﹄

凋仲良

図 5
.
6 第 l反復 [
41
.
33
32Fを与えた結果

引
一

﹄

‑
た
寸l i l i ‑ ‑l﹂一え
士 ‑3343333433‑ 一
L
'ooQUOOQU マ
'Quoo‑‑L 7
20000 マ
‑
半 2212222122‑ 一
を
b

田

ζJ

圃

・・﹄﹁ lIL

E

T
︐E F ‑ ‑ E L
l
l
J
d
園︑︑
‑‑nunununununununununu‑n
U
︐
‑
‑‑31351E202n‑D
‑E‑一一一一一一
‑12
‑‑司

HL

nunkunu
nυnU にd
に
dnJιnd
つ乙 nU4﹄

u M
内
U

nununU
一
一

p
n
v

T4unu
︑
戸
a
H
u
v
n
J
ι

!!圃

‑‑onbo
f‑‑nUT nu
nU
d
F4
・
47 1 2

ど
一 004

459

‑EEau‑
‑EE

ーーーーーーーーーーーーーー古

nunununununununununu‑‑
一‑A‑‑
aa ト 44E5al‑‑=τ惟
土期
一 11111
一J
‑ ﹁ii
︐
竹υ
E
E
E
Z
E
EEEEEEEEEEEIE
E.
l
l
it
‑
‑‑
T

の
帰

形

ノ

ト

n
し

X

ρv

よ

る

4#

Lド﹄I

線

'tt︐ 一 円

2248844866

J

TFU

+

sζJ

凶

f
J,^=

σl^

X‑
X5

σ2^=

fc=7
0
.
2
0
7 ‑
0
.
3
6
5
0
.
1
5
1 ‑
0
.
0
3
0
0
.
0
3
0
0
.
1
8
2

'
0
.
0
5
=
I=

ー

民

qι

2
3
3
2
2
3
4
4

nununU

︐
マ

﹄

‑‑nununu
fvEnununU

ヲ' d E ‑

J‑nununu

pdAE

U
1
・
nυζd u
'1 ︐

nuqu
nunMUTt
FhJUFOa斗
l
句 nunu
nununu

‑一

βIA
ニ
nυ マ
'nu
nυTikiu
ノ
F
h
J
u
a ﹃内ι
q︐
ιnU43
nununu

戸、八=

U
ゐ凋外刈仏マハ

nununu
nununu
nununu
nununu

﹄

nununu
‑
‑
1 nu

回

聞

‑‑ODD

‑
h
p nununU
Y1 nunURU
F
a
d
‑
42qζ

qL回 一

J︐
‑ooo
マ

0出 =

fJ‑11 旧
11 ︹

八三

nununu
nunU にd

s,
5
02
︐
n
ιnU41

sX八 三

4
.
0
0
0
1
.
0
0
0
2
.
0
0
0

j
j
o
^
=
f
J.
r
^
三

;
:
日

八二

Iニ

4
.
0
0
0
1
.
3
3
3
2
.
0
0
0
β♂
二

;
:
臼

。
。
。
。
。

,
平行線検定法

'
0
.
0
5
=
I=
4
.
0
0
0
1
.0
00
2
.
0
0
0

s
o

;
:
臼

井'
X
(
S
‑
T
)
O
'
T 'A
i
j
】

β
1
U

ー

ヶ(
1
)

z!~} =一β,
(I)X
Fノ
T
z(l) ニ 1
,

リ

更新したパラメータ β(1), Yげの推定値 y
;
l
},更新した微係数行列 Z を用いて,同様の計算手順で繰り
返すー 15(111)が 0となった場合に繰り返しを終了する.

これらの計算課程を Excel のシート上に落とし込み, NLIN プロシジャと同じ初期値を与えた結呆を図

5
.
5 に示す .15(0)として[ー1.0,
・0
.
6
6
7,
ー
1
.0Fが得られたので, p(l) = p(O) +δ(0)の計算結果が示されている
ので,この値を β(0)に上書きして β(1)とする.

.
6 に 第 ] 反 復 β(1)=[4,1
.3
3
3,2Fを与えた結果, δ
(
1
)= [
0ー
,0
.
3
3
3,oFとなるので,これを加え
図 5
て

^
σ
ρ 1ハ=

図 5
.
7 に示すように β(2)= [4,1
,2Fを上書きするとが 2)= [
0,0,oFとなり,すべて 0なので,収束したと

判定する

451.

. Runund O6nua ndnU 唱l nununu ︑ 旬 sl^= ﹄ 八三 ﹄ 4 . 0 0 0 1 . 0 0 0 2 . 0 0 0 八三 nununU s " s . ¥ c‑A匂 A 1nuv 三‑ F ・ F 1 1 ・ 'ztinu 0 . 1 0 0 0‑ 0. 25 0 0 0 . 1 0 0 0 0 . 1 0 0 0 0 . 0 0 0 0 ‑ 0 . 2 5 0 0 0 . 0 0 0 0 0 . 1 2 5 0 ﹃ ︐ ︐ . ︐ ︐ ; : 臼 凶 5 . 7 第 2反復 [ 4,1,2Yを与え収束 表 5 . 1 パラメータ推定値 o x Pk XS+XT 1 xr βs βX(S.TI k 2 Pk^ V a r( sk~) 4 . 0 0 0 1 . 0 0 0 2 . 0 0 0 0 . 8 0 0 0 . 1 1 4 0 . 1 4 3 SE L95% 0 . 8 9 4 1 . 8 8 5 0 . 3 3 8 0 . 2 0 1 0 . 3 7 8 1 . 1 0 6 U95% 6 . 1 1 5 1 . 799 2 . 8 9 4 6 . まとめ 非線形回帰の解析方法は, SASの NLINプロシジャで概説されてはいるが,非線形回帰を学習し ようと思う者にとって難解である.そこで,線形同帰の解析方法と対比しつつ身近な問題について E x c e l の行列関数を用いて非線形回帰の解析法の可視化を試みた.非線形回帰を難解にしている反 x c e lの計算シート上で手軽に再現 復計算について, SASの NLINプ口、ンジャの反復計算の過程を E する工夫をした. 身近にあるが線形回帰の問題としては「難解」であっても,非線形に式変換を行ない非線形の問 平行線検定」について示した.これらの事例を 題として「容易」に解けることを「勾配比倹定 J, i 通じて,非線形回帰について理解が深まるものと期待している. さらなる応用として,共通の交点をパラメータとする 2つの直線の同時あてはめ,酵素阻害反応, 薬物動態など本質的に非線形の問題に対しても計算課程の可視化を実現し,この分野へ関心を持つ 人達に対する非線形回帰・の入門書として整備を行ないたい. 文献 [ 1J D r a p e rN . R .,S m i ! hN .( 1 9 9 8 ), A p p l i d e dR e g r e s s i o nA n a l y s i s,3 ,,1 e d,1 1 5 ‑ 1 3 4,5 0 5 ‑ 5 6 5,W i l e y . . 3U s e r 'sGide,5089・ 5180,C h a p ! e r6 2TheNL lN p r o c e d u r e . [ 2 J SASI n s t i t u t e( 2 0 1 1 ),SAS/STAT9 / e n / s t atug/63962/PDF/de[au lt l s t at U g .pd[(160M) h t t n : 1 1sunnort.sas.comldocument at i o n / c dI 1 9 9 6 ),SASによる回帰分析, 1 6 1・1 8 0,東大山版会. [ 3 J 芳賀敏郎,野津昌弘,岸本惇司 ( [ 4 J 芳賀敏郎 ( 2 0 1 0 ),医薬品開発のための統計解析,第 3部非線形モデル,サイエンティスト社. 460

452.

:持!被滋椛.み:石川E I I g 2群の割合の差における 信頼区間の構成法の比較 飯塚政人,浜田知久馬 東京理科大学工学研究科 Comparisono fconfidence i n t e r v a l sf o rt h ed i f f e r e n c e betweenindependentp r o p o r t i o n s Masatol i d u k a,ChikumaHamada Graduates c h o o lo fE n g i n e e r i n g,TokyoU n i v e r s i t y o fScience .,得点jず手伝み-みら~a~ 要旨: 2群の割合の差の信頼区間に関して, SASの FREQ プロシジャでは .8つの信頼区間が構成可能である 本発表では,例数もしくは割合の差を変化させ,被覆 確率を評価指標として性能を比較し推奨される信 頼区間を報告する キーワード・信頼区間,被覆確率, FREQプロシジャ 4 6 1 2 0 1 3 I

453.

! 201I ω ユーザー総会対完……ーンセヲ泊ン 信頼区間の構成の現状 ( 1) ロ2群の割合の差の信頼区間 〉医薬統計では両側 95%信頼区間 ロ多くの医薬統計の教科書はWald型の信頼区間を使用 [ 1) [ 2 ] 比率(リスク)差の信頼限界 手 J I1( r e s= 0 ) Wald信頼区間 : 比率差=一 0.5333 I p l( 1‑pt )• P 2 ( 1‑P 2 ) SAS出力結果=今デフォルトはWaldを出力 PROCFREQDATA= DATA; 皇 丘E正E ; TABLESEXPOSURERESPONSE/RI WEIGHTCOUNT; RUN; 合 SAS出力結果 リスク 漸近標 準誤差 (漸近)95% 信頼区間 (正確)95% 信頼限界 f T1 0.1333 0.0621 0.0117 0.2550 0.0376 0.3072 行z 4719 0.8271 0.6667 0.0861 0. 4980 0.8354 0. 合計 0. 4000 0.0632 0.2760 0.5240 0.2756 0.5346 差 0.5333 0.1061 ‑0.7413 ‑0.3254 一 462 Fhd 。 信頼区間の構成の現状 ( 2 ) A U マ │ 臥Sユ ー ザ ー 総 会 加 問 … 一 … q4 一 一 一 a 界一 3 限目内│ 頼一3 ︐4l AUマ %一 7 5 O J1 プ一M n 2 . タ一 W τ ; 十一十 Pl‑pz士 Zf 1 . ! z1‑ ~I]I

454.

N 1 1 司 令 総 会 ? ザ 三 ‑ 2x2分割表 有効 無効 言 十 有効割合 母 数 薬剤群 η11 η12 η1・ 7 τ 1 P1二了 1 . 対照群 η21 η22 η2・ P ? = ・ τ[2 2η2 計 η・ 1 η・ 2 η P=一一 η11 η21 η1 n 2群の有効割合の差の真値!J.=π1一 π z 2群の有効割合の差: 五二 d二 日 ‑ P 2 1 1 I ュザー総会問問 … ー セ ー J 2群の割合の差の信頼区間 131141 • Farrington‑Manning信頼区間 • Hauck‑Anderson信頼区間 Newcombeスコア信頼区間 • Newcombeスコア(連続修正)信頼区間 • Wald信頼区間 • Wald(連続修正)信頼区間 正確な検定に基づく信頼区間 ・ 正確な検定に基づく信頼区間 (FMスコア) 463 m l JI

455.
[beta]
ω
!
信頼区間の構成手法 (
1)
ロFarrington・Manning信頼区間
Ip(l‑p). p(l‑p)

ZαhJ~一一十一五一

Pl‑ P2:
t

[
z
り 標 準 附 布 の 則一;)%点
1

2

目H
auck‑Anderson信頼区間
,{
1
1
)
1(
1‑P1) p2(1‑P
2
)¥
P1‑ P2:
tIc
c十 Z
α1
‑I
十一一一一一一一一 l
目

¥

12J nl ‑1
・

n2・ ‑1

I

[連続修正 C C = ‑ ‑

2min(nbn
2
'
)

P
I
l
l
l
I

!臥ルザー総会 7tl"Fa7/~……セツゆ
信頼区間の構成手法 (
2
)

ロWald信頼区間
且

I
P1 (
1‑Pl) .P2(1‑P2)

hl
十
! η 1 . η 2
・

P1‑P2:
tZ
α

ロWald(修正)信頼区間

:
l
:
ト
イ17JF
〆
ぺ
ぺ
メ
1
へ
(
℃
:
七
工
γ
;
ア
2

Pl‑P2

二
(
去
;
走
)

[連続修正 cc

464

ω
p
防
Z
ρ
)

456.
[beta]
a

(鮎S.::l.~-.会 7柄拘…~セツゅ
信頼区間の構成手法 (
3
)同
ロNewcombeスコア信頼区間
(下限)=(P1‑ P
Z
)‑J
e
石
三 L1)Z+(Uz‑PZ)Z
(上限)=(P1‑ P
Z
)+.
J
(
U
1‑ P
1
)
Z+(
P
Z‑L
z
)
Z

[
山

1のW
ilsons
c
o
r
e信頼区間
L
z,U
z
:
p
zのWilsonscore信頼区間

口Newcombeスコア(修正)信頼区間
(下限)= (P1‑ P
Z
)‑.
J(P1一 L
/
)
Z+(Uz'‑pz)Z
(上限)=(P1‑ P
Z
)+.
J
(
U
1
'‑ P
1
)
Z+(
P
Z‑L
z
')
Z

[L1 川 の Wilsonsco陀 ( 連 続 修 正 ) 時 間
L
,
'
zUz
':
p
zのWilsonscore(連続修正)信頼区間

ω ユ}ザー総会問符

Jロ ト 山 一 泊 ン

201a

信頼区間の構成手法 (
4
)

τ
Z
?
?
z
z
r
T
I
P
I
l
E
j
;
;
1
1
2
2
1
a
1
1
8示
副
(上限)=的[(企:
P
企)>?)
L(

2X2表の同時確率 [
(
1
1
1
1,
1
1
2
1
',
.
dπ
2)

、

In.
,¥

In
ヲ
ー

¥ 11/

¥
"
2
1
/

=
[
̲

I
(
t
Hπ2)"11(
1‑,
:
f ‑π
2
)
n,π"X[
.
.
ー I
(
π
2
)
π
2
1(1π2)η2‑
n
Z
l
,

P
u
(d
.
)= SUp( )
[
(
η 11'n21',
.
dπ2) ¥
π2 ¥
A,
T
I
納豆、
i

Pル s~; CT~,; to

[(1111 η
2
1
'd
.π2))

A:2x2t
a
b
l
e
(
η
1
.,
1
1
2
.
)
T
(
a
)t
a
b
l
e内のある{直aのときの割合の差
t
o
:観測された割合の差
ー

465

457.

m m S~ユーザー倣加問……… 降圧薬の 2x2分割表の実例 [8J 臨床試験の結果を示す 2X2分割表 改善あり 改善なし 合計 新薬 47 10 57 標準薬 26 18 44 合計 73 28 1 0 1 qH ノ n ﹃ J iH q3 q3 フ 鮎 n u nU lS ユーザー総会内向均一一一 一 一 円 ヲ J ︑ J41 ﹃ M 一 一 QJ rhvQJFb ATnu 85一 L nunufo =一一 4 48 一 7‑76 4 5 2一 4nu 一 ・ 一 一 一 一 標準薬改善割合: 改善割合の差: ょう p・ p・︐ d 新薬改善割合・ m t Jg FREQ プロシジャで 8つの信頼区間を出力 RISKDIFF(CORRECTCL=(WALDNEWCOMBE)); とすることで連続修正を加味して出力 EXACTRISKDIFF(FMSCORE); とすることで正確な検定に基づく信頼区間 (FMSCORE)を出力 466

458.

II ユザラ鈴加……一一 g 8種類の信頼区間の比較 F a r r i n g t o n ‑i ¥1 3 ̲ 1 ln i n g 信頼区間 ト一一一一一一一一一一一一一句一一一一一一一+一一一一一一一一一一一一一一一一一一一一一→ I l a u c k ‑ A n d c r s o l l信頼区間 Wald信頼区間 Wald(連続修正)信頼区間 Ncwcombcスコア信頼区間 Newωmbe スコア(連続修正)信頼区間 一一一一一一一一‑‑0&一一一一一一一一一一一一一一一一一一一一 一 → 正確な検定に基づく信頼区間 正確な検定に基づく信頼区間 (Fl¥1スコア) 1 Aり • 0 . 2 割合の差 0 . 3 . ユ ー ザ ー 総 会DfWロ印'……ン 0 . 4 ~g 本研究の目的 〉症例数や割合の差の真値を変えて, 8種類の手法について 信頼区間の被覆確率を評価し,適切な方法を検討 〉一般的に使用されている Wald信頼区間が,適切であるため の条件を検討 467

459.

P M J I │ ω ユーザー蝕……一… 信頼区間の被覆確率 口被覆確率 CCoverageP r o b a b i l i t y ): C ( l l ) 判言頼区間が真値を含む確率 C(π1,1[2 )=L~~~=OL~~.1=01(n11 , n21 ,1[1' π2) In In っ 1 x l i π 1 n吋 1‑π1)η1.‑n吋 ゐ ) 2 ) η2.‑n21 π2n21(1‑π 噌 ¥ ム ' 1 <21/ ¥ 11/ ・‑l I1,信頼区間が真値を含む I0,信頼区間が真値を含まない 、 1(n, 1.n 句 つ π π っ)=~ , 、ムム ムι 寸 ム '‑/ 信 問 5%の 信 頼 区 向 合 │被覆確率が 95%に近い信頼区間が望ましい P M J I │ ωユーザー総会加問~ツリユ叩… 信頼区間の評価基準 口2種類の評価基準で適切な信頼区間を検討 〉被覆確率が95%に最も近い信頼区間 》被覆確率が保守的になる信頼区間 100 被 覆 雲95 早 も 90 Cコ ト品 Cコ N π1 Cコ W Cコ よ , Cコ v1 Cコ 一 一0 . 5‑0.9 468 、 、コ αコ a C J C : l Cコ I . . D 7rz 、 ? 一

460.
[beta]
鮎

~g

ユーザー総会均…九州叩…

S

被覆確率の計算の設定
1
1
1
'

112

15 1
5
20 20設定 1

各群の症例数
が等しい場合

70 70設定 2

π
1= 0
.
5,0
.
7
.0
.
9
π2

ロ

Z=

定
コ
吋
凡
R

・内

‑nu
・ 4U4n u
ι・ n
ヲ
﹁
︐

し

nunu ・ nunu‑nU
5 3 ・1
0
2 ・
44
・・
44

句'

nunu
nU1A

各群の症例数
が異なる場合

信頼区間:両側 95%水準

=0.01.0.02. ・・・, 0.99

川一一切ら岳会対草加
η1・
J nZ
・
=20とした場合の

)
被覆確率(設定 1
i~C\\ωm(}cスコア(修正}

;ムtr~1~附~4
被穣確率(%)

│
凹

W
川州Iid

I

¥¥州
a
a

~明帝戸どJ

ufh
柏が:
7
5
7
h
b
伽 州 開 銀t

}
1
1
¥
んいい

黒 .π1=0
.
9
灰 色 π1 =0
.
5
】
.
.
.
.
.
"
.
.
.
.
.
.
. c
>
、
.・
,

0 0 0 0 0 0 0 0 0
v1
0

。

0 0 0 0 0 0 0 0

‑

~凶忌引か吋細川。

E2222Z222πz
1
8

469

461.
[beta]
201I

Sユーザー総会問先初J白 日 ソ リ ー 片 山 ン

! 鮎

η1・
In
z
.
=
7
0とした場合の

被覆確率(設定 2
)
F
a
r
r
i
n
g
t
u
n
‑¥
il
a
n
n
ing
2
回一

Nc¥¥combcスコア

I
l
a
uC
'k
‑Andcrson

Ncwcombrスコア{修正}

、

‑

¥

95

切山明~三ど

〆

リ

A

司、,

!
i
".

どごもいU仲ゆかw←マ尚一ア円~河

合

J

Rト 回 一

Vy,
y
.
.

幅 時ζ A‑"

90

自由

ー

被覆確率(%)

、

V
:
山i

自

Wald(修正)

正確 (FMスコア)

1世~ケ事づ

勺叫4 M説記必ごこt
.
.
.
.
.
.
メ
内

~\\\NIがん+ーへ

。 凶

85

黒:
π
1= 0
.
9
灰色 .
π
1=0
.
5

0 0 0 0 0 0 0 0

̲

N

凶
.

。0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0

凶 命 、4 降、s

】旬凶晶、"。吋"、。

̲

N

~

E22222222πz

~吋"岨

│
ω

ユーザー総会内向ヲ

i

症例数別
Wald信頼、区間の被覆確率

田

被覆確率(%

~
=11‑.
,=70

nJ.

回~~~…、r州、

<
:
)

0

0

0

.
.
.
.

.
.
.
.
.

.
.
.
.
.

,1>.問。吋

<
:
)

4
7
0

<:)

<:)

0

<:)

ω~

00

。

z
π

0

OJW

<:)

0ω

<:)

。、可旬、a

00

ψ

0ω

<:)

P.

os

<:)

.
.
.
.
.

N

ON

<:)

.
.
.
.

黒 π
1= 0
.
9
灰色 .
π
1=0.
5
ow

。o

日
︒

85

附脚州伊十…勺

i
伊附

462.

l mI 鉱 Sユ ー ザ ー 総 会 … … … … 症例数別 Wald(連続修正)信頼区間の被覆確率 J炉刊…d C W附 ザ ゴ ベA fMVv叶付イ吋 W 被覆確率戸% 8S 今=70 "品=n".::::60 ::J,;.孟品品=~O n品 : ; ; : : : : 1 1 目 黒 ー π1=0 . 9 90 灰色 π1 ニ 0 . 5 8 5 o 0 0 0 ̲ N 凶 b 0 0 問 。0、, 0 0 ~ ~ 。o ̲ N 0 0 0 0 凶 ゐ 印 。 0 0 0 " ~ ~ o 0 0 0 0 0 】 N W • 0 0 0 明。吋∞ uロ Tr z r r W J I ¥ω ユ ー ザ ー 総 会 口 問 リ ー セ ツ 泊 ン η1.4O, η2・ =50とした場合の 被覆確率(設定 3 ) F a r r i n g t n n ‑ ¥Jan n i n g I l I : : l Uc k ‑ ; ¥ n d c r s o n 被 同 夜 確:∞ 率 早 も 、 、ald l 、 刊 印m bcスコア I:¥c¥¥combcスコア{修正} 正確 (FMスコア) 込町~吋d: 9 5 黒 π1= 0 . 9 灰 色 町 =0. 5 90 8 5 0 0 0 0 0 0 0 0 0 ̲ N 凶 レ 印 。 吋 旬 。 471 222222222πz

463.

I将ユーザー総会摘発一…一一 l I m E I まとめ 口被覆確率が 95%に近い信頼区間 ~Newcombe スコア信頼区間 ロ保守的である信頼区間 〉正確な検定に基づく信頼区間 (FMスコア) ~Newcombe スコア(連続修正)信頼区間 ロ症例数が 70以上で等しく,真値が0や 1 付近でないとき のみ Wald信頼区間の被覆確率は保たれる ロ各群の症例数が異なると全症例数が多くとも手法に よっては被覆確率が保たれない │ ωザ ー 総 会 … 今後の課題 信頼区間の幅に重点を置いて構成方法を評価 • 2x2xk表による信頼区間の構成方法へ拡張 乙C 472

464.

. . 川 ユ ー ザ ー 紘 一 … … 吟 m m ω 弘 い 参考文献 [ l JP .Armitage,G .B e r r y ,S t a t i s t i c a lMethodsi nMedical R e s e a r c 九 3rde d . , Oxford:B l a c k w e l lS c i e n c e,1 9 9 4 . E p i d e m i o l o g y: S t u 砂 DesignandData [ 2 JM.Woodward, A n a l y s i s,Chapman& HalllCRC,2 0 0 4 . [ 3 JSAS/STAT9 . 3U s e r ' sG u i d e :TheFREQP r o c e d u r e [ 4 JManabul w a s a k iandS a t o s h iH a s h i g a k i,C o n f i d e n c e i n t e r v a l s101't h ed i f . l e r e n c eb eれv e e nt w oi nd ψ ,e n d e n tb i l 10 m i a l ,J . F a c . E n g .,S e i k e iU n i v .2004; 41 ・ 9 ‑ 2 0 . p r o p o r t i ol1s Ir.:..~ユーザー総会加問ル叫一泊ン I 参考文献 [ 5 JNewcombe,R .G ., J n t e r v a lE s t i m a t i o n. f o rt h eDi f . f e r e n c e B的 v e e nJ n d e p e n d e n tP r o p o r t i o n s :Comparisono . f E l e v e n ,S t a t i s t i c si nM e d i c i n e,1 7, 873‑890. Methods a n t n e r , T .J .andS n e l l,M.K . , Small‑SampleC o n f i d e n c e [ 6 JS f o rP l‑P 2andPdP2II 12X 2C o n t i n g e n c yT a b l e s , J n t e r v a l s. JoumaloftheArne r i c a nS t a t i s t i c a lA s s o c i a t i o n,75,386 ‑ 394, 1 9 8 0 . .S .F .andZhang,Z ., T c s t ‑ B a s c dE x a c tCon白dcnce [ 7 JChan,1 e n c cofTwoB i n o m i a lP r o p o r t i o n s, I n t c r v a l sf o rt h cDi能 r B i o m c t r i c s,55,1202‑1209,1 9 9 9 . [ 8 J丹後俊郎 臨床検査への統計学,朝倉書庖, 1 9 8 6 . F 473

465.
[beta]
SASによる二項比率の差の非劣性を示す

ベイズ指標の算出方法について
J
1
!
I
I
J
;
r
r 洋平 1
)
.
2
) 榊原伊織2
)

宮│品l 悦良 3)

1
)国立国際医療研究センター臨床研究センター医療情報解析研究部医学統計研究室

2
) タクミインフォメーションテクノロジービジネスソリューション部
3
)東京理科大学理学部

Onc
aI
cu
l
a
t
i
o
nmethodo
faB
a
y
c
s
i
a
nn
o
n
‑
i
n
f
e
r
i
o
r
i
t
yi
n
d
e
xf
o
rtwob
i
n
o
m
i
a
lp
r
o
p
o
r
t
i
o
n
su
s
i
n
gSAS

Yoh巴iKawasaki)
12
)

l
o
r
iS
a
k
a
k
i
b
a
r
a2
)

E
t
s
u
oMiyaoka3)

1
)D
i
v
i
s
i
o
no
fB
i
o
s
t
a
t
i
s
t
i
c
s,D
c
p
a
r
t
m
c
n
to
fC
l
i
n
i
c
a
lS
t
u
d
yandI
n
f
o
r
m
a
t
i
c
s,C
c
n
t
e
rf
o
rC
l
i
n
i
c
a
lS
c
i
e
n
c
e
s,
N
a
t
i
o
n
a
lC
c
n
t巴rf
o
rG
l
o
b
a
lH
e
a
l
t
ha
n
dM
e
d
i
c
i
n
e
2
)B
u
s
i
n巴s
sS
o
l
u
t
i
o
n
sDcpartm巴n
t,TakumiI
n
f
o
r
m
a
t
i
o
nTcchnologyl
n
c
.

a
r
t
m
e
n
t0'
1Math巴m
a
t
i
c
s,
TokyoU
n
i
v
e
r
s
i
t
yo
fS
c
i巴n
c巴
3
)0巴p

A
b
s
t
r
a
c
t
l
nd
r
u
gd
e
v
e
l
o
p
m
e
n
t,n
o
n
‑
i
n
f
e
r
i
o
r
i
t
yt
e
s
t
sa
r
巴 0日
巴 n 巴m
ploy巴d t
od
e
t
c
r
m
i
n
et
h
ed
i
f
f
e
r
e
n
c
eb
e
t
w
e
e
n two
tb
i
n
o
m
i
a
lp
r
o
p
o
r
t
i
o
n
s, Manyt
c
s
ts
t
a
t
i
s
t
i
c
sf
o
rn
o
n
‑
i
n
f
e
r
i
o
r
i
t
ya
r
eb
a
s
c
dont
h
ef
r
巴q
u
e
n
t
i
s
tf
r
a
m
e
w
o
r
k
.
i
n
d
e
p
c
n
d巴n
,r
e
s
e
a
r
c
honn
o
n
‑
i
n
f
e
r
i
o
r
i
t
yi
nt
h
eB
a
y
e
s
i
a
nf
r
a
m
e
w
o
r
ki
sl
i
m
i
t
e
d, L
e
tX1andん d
e
n
o
t
eb
i
n
o
m
i
a
lrandom
Howev巴r

a
r
a
m
c
t
c
r
s
π
1a
n
dπ
2,r
c
s
p
e
c
t
i
v巴l
y
,a
ndt
h
cn
o
n
‑
i
n
f
e
r
i
o
r
i
t
ym
a
r
g
i
ni
s"
'
0>0, Wc
v
a
r
i
a
b
l
e
sf
o
rt
r
i
a
l
s1
1
1a
n
d1
1
2,andp
¥Voc
aI
cu
l
a
t
i
o
np
r
o
g
r
a
m
sf
o
ranewBay巴s
i
a
ni
n
d巴xr= P(π1>πr 企
。 I
X1,
X2),
a
na
p
p
r
o
x
i
m
a
t巴 m巴t
h
o
dt
h
a
t
showt

.Wea
l
s
op
r
e
s
e
n
taSASmacro
u
s
c
sn
o
r
m
a
la
p
p
r
o
x
i
m
a
t
i
o
nanda
nc
x
a
c
tmcthodt
h
a
tu
s
c
sa
nc
x
a
c
tp
o
s
t
e
r
i
o
rPDF
u
r
巴
, M
or
巴o
v巴r
,¥V巴 p
r
c
s
e
n
tt
h
er
巴s
u
l
t
so
fa
c
t
u
a
lc
l
i
n
i
c
a
lt
r
i
a
l
s
programa
b
o
u
tac
a
l
c
u
l
a
t
i
o
nu
s
i
n
gt
h
eFCMPp
r
o
c巴d
i
nJ
a
p
a
n
c
s
et
oshowt
h
eu
t
i
l
i
t
yo
fi
n
d
c
xr
.

Kcywords:i
n
d
e
p
c
n
d
c
n
tb
i
n
o
m
i
a
lp
r
o
p
o
r
t
i
o
n
s
;B
a
y
e
s
i
a
ni
n
f
c
r
e
n
c
e
;n
o
n
‑
i
n
f
c
r
i
o
r
i
t
y
;e
m
p
i
r
i
c
a
lBayesmethod

1
.I
n
t
r
o
d
u
c
t
I
o
n
N
o
n
‑
i
n
f
i
巴r
i
o
r
i
t
yt
e
s
t
sa
r
eo
t
i
e
nc
o
n
d
u
c
t巴di
nc
l
i
n
i
c
a
lt
r
i
a
l
s,p
r
i
m
a
r
i
l
yt
od巴t
e
r
m
i
n
ewh巴t
h巴rt
h巴 r
巴s
p
o
n
s巴 t
ot
h
es
t
u
d
y
d
r
u
g
si
sc
l
i
n
i
c
a
l
l
yn
o
tmuchw
o
r
s
ct
h
a
nt
h
cr
e
s
p
o
n
s
et
ot
h
er
e
f
e
r
e
n
c
e(
c
o
n
t
r
o
l
)d
r
l
l
g
s, I
np
a
r
t
i
c
u
l
a
r
,n
o
n
‑
i
n
f
e
r
i
o
r
i
t
yt
e
s
t
s
i
a.
lT
hc
a
r
cc
m
p
l
o
y
e
dt
od
e
r
i
v
et
h
ed
i
f
f
e
r
e
n
c
cb
c
t
w
e
c
nt
w
ob
i
n
o
m
i
a
lp
r
o
p
o
r
t
i
o
n
si
ft
h
cr
e
s
p
o
n
s
ci
sa
ni
n
d
c
p
e
n
d
e
n
tb
i
n
o日l
I
n
t
c
r
n
a
t
i
o
n
a
lC
o
n
f
e
r
c
n
c
eo
nH
a
r
m
o
n
i
z
a
t
i
o
no
fT
c
c
h
n
i
c
a
lR
e
q
u
i
r
c
m
e
n
t
sf
o
rR
c
ι
i
s
t
r
a
t
i
o
no
fP
h
a
r
m
a
c巴u
t
i
c
a
l
sf
o
rI
‑
Iuman
lC
H‑E9)g
u
i
d
e
l
i
n
e
s[
1
]a
n
dt
h
cE
u
r
o
p
c
u
nM
e
d
i
c
i
n
e
sAgcncyg
u
i
d
e
l
i
n
e
s[
2
]p
r
o
v
i
d
ct
h巴 f
r
a
m
e
w
o
r
kf
o
rs
c
t
t
i
n
g
Usc(

a
r
i
s
o
n
sb
e
t
w
e
e
nt
r
c
a
tl1le
n
t1
よ
r
o
u
p
s
.
n
o
n
‑
i
n
f
c
r
i
o
r
i
t
yc
Ol11p
c
c
n
R
c
s
c
a
r
c
hp
c
r
t
a
i
n
i
n
gt
on
o
n
‑
i
n
f
e
r
i
o
r
i
t
yt
c
s
t
sf
o
rd
c
r
i
v
i
n
gt
h
cd
i
f
f
e
r
c
n
c
e
sb
c
t
w
e
c
np
r
o
p
o
r
t
i
o
n
sh
a
sf
o
ral
o
n
gi
tl11cb
q
l
l
e
n
t
i
s
tt
i
'
al1le
w
o
r
k
.
c
o
n
d
u
c
t
e
di
nt
h
c仕e

475

466.

DunnettandGent [ 3 ]s e l e c t e dt h ee x a l l l p l eofan o n ‑ i口氏 r i o r i t yt e s ti nac l i n i c a lt 吋a . lI nt h e i rs t l l d y ,ane s t i m a t o r W 巴i g h t e dbyan o n ‑ i n f c r i o r i t ymarginwasu s e df o rt h eunknownp a r a m e t c rw i t ht e s ts t a t i s t i c s .F a r r i n g t o nandManning [ 4 ]proposedt h r e emethodsf o re s t i l l l a t i n ganunknownp a r a m e t e ri ns t a n d a r de r r o rl l l e a s u r e l l l e n tandrecommended u s i n gar c s t r i c t c dmaximuml i k c l i h o o dc s t i l l l a t o r( a sproposedbyMi巴t t i n e nandNurmincn[ 5 ] ),whichi sar c s t r i c t e d v a l u eoft h en u l lh y p o t h e s i s . Almendra‑Arao [ 6 ]c a l c u l a t e dn o n ‑ i n f e r i o r i t yt e s ts i z e sf o rt h ed i f f e r e n c ebetweentwo o n su s i n gZ ‑ s t a t i s t i cw i t hp o o l e dv a r i a n c e,f o rs c v巴l 百1 c o n t i n u i t yc o r r e c t i o n s,anda n a l y z e dt h巴 i n d e p e n d e n tpropo口i b e h a v i o roft h e s et e s ts i z e s .H i r o t s u[ 7 ]p r o v i d e dC I st h a tc o r r e c t skewncss and d i s c u s s e dt h ed e s i g ni s s u e oft h e r 巴q u i r e dsamples i z ef o rt h en o n ‑ i n f e r i o r i t yt e st .DannandKoch[ 8 ]proposcdal l l e t h o dofe v a l u a t i n gt h en o n ‑ i n f i 巴r i o r i t y t e s tont h eb a s i sofsomeC I s .Theya l s oshowedt h er e l a t i o n s b i pbetweent b eC I sandt b en o n ‑ i n f e r i o r i t yt e s tf o rt h e d i f f e r e n c eb巴tweentwoi n d e p c n d e n tb i n o m i a lp r o p o r t i o n s . Zhange ta . l[ 9 ]proposedanewt e s ts t a t i s t i cf o rt h en o n ‑ i n f i 巴r i o r i t yt e s tf o ro r d e r e dc a t e g o r i c a ld a t aandexpandedt h i s . l[ 1 0 ]p r e s e n t c dsomenewt e s ts t a t i s t i c sdevelopedfrom t e s ts t a t i s t i ct ot h ed i f f e r e n c eofp r o p o r t i o n s .Kawasakie ta .[ 9 ],andt h e yd e t巴c t e dandv e r i f i e daw e l l ‑ p e r f o r m i n ge s t i m a t o . r Zhange tal However ,t h e s et e s ts t a t i s t i c sf o rn o n ‑ i n f e r i o r i t ya r eb a s e dont h ef r e q u e n t i s tf r al 1 le work;t h e r ea r efews t l l d i e sf O l 日 t h eBayesianframework n o n ‑ i n f e r i o r i t yi e= P(π1>πュIX , ; 町 、 whereX andX denotebinomialrandom 1 1 ]proposedanindex KawasakiandMiyaoka[ 1 1 2 v a r i a b l e sf o rt r i a l s1 1 1and1 1 2,andp a r a m c t e r si f landπ 1 2r e s p巴c t i v c l y .Theyp r o v i d c da p p r o x il1la t cande x a c te x p r c s s i o n s 司 e f o r byu s i n gt h eb e t ap r i o randp r e s e n t e dt h er e s u l t sofa c t l l a lc l i n i c a lt r i a l st oshowt h el l t i l i t yofθー T h i si n d e xc a nbe i n o m i a lp r o p o r t i o n ofas t l l d yd r l l gi ss l l p e r i o rt ot h a tofac o n t r o ld r u g . l l s e dt od e t e r m i n et h ep r o b a b i l i t yt h a tt h巴 b Hence, t h i si n d e xd e t e r m i n e st h ei n f e r i o r i t yf o rtwoi n d e p e n d e n tb i n ol1li a lp r o p o r t i o n s . KawasakiandMiyaoka[ 1 2 ]propos巴danewB a y e s i a ni n d c xTニ P (π1>π2‑L loI X,J X owcver ,t h c yd i dn o tp r e s e n t .H 2) , weshowtwoc a l c l l l a t i o np r o g r al1lsf o ranewBayesiani n d e xT= P(π1>π2‑L lo ac a l c l l l a t i o nprogramf o rr .I nt h i spap巴r I X1, X2) l l s i n gSAS,wheret h cn o n ‑ i n f e r i o r i t ymargini sL lo>O .Wecomparct h ca p p r o x il1la t cp r o b a b i l i t yw i t ht h ce x a c t h eu l i l i t yofi n d e xT. l nt h e p r o b a b i l i t yf o rrl l s i n gSAS. Wea l s op r e s e n tt h er e s l l l t sofa c t l l a lc l i n i c a lt r i a l st os b o¥V t wcc a np r e s巴n taSASmacrop r o g r al 1 la b o u tac a l c l l l a t i o nl1le t b o du s i n gt b eFCMPp r o c c d l l r e . Appcndix, 1 la i n d e roft h i spaperi so r g a n i z e da sf o l l o w s .Wesbowa p p r o x i m a t eande x a c te x p r e s s i o n sf o rT i nS e c t i o n2 , Ther el andwcp r e s e n ttwoc a l c u l a t i o np r o g r al1lsf o rri nS e c t i o n3 .Wep r e s e n tt h c1 ・ c s u l t sofa c t u a lc l i n i c a lt r i a l st oshowt b e ,wec o n c l l l d et b ep a p e rw i t hab r i e fsummaryi nS e c t i o n5 .I nt b巴 Appendix wecan u t i l i t yofri nS e c t i o n4 .F i n a l l y 司 c r oprograma b o l l tac a l c l l l a t i o nl1le t h o dl l s i n gt h eFCMPp r o c c d l l r c p r e s c n taSASl1la 2 .Approximatea n de x a c te x p r e s s i o n sf o rτ L e tX1andX2d e n o t eb i n o m i a lrandomv a r i a b l e sf o rl r i a l s1 1 1and112.andp a r a m e t e r s π 1and町, r e s p e c t i v e l y .l nt h i spaper , wea S S l l l l l et b a tal a r g eb i n ol1li a lp r o p o r t i o ni sp r c f e r r e dc o n s i s t e n t l y .F u r t h e r ,weassumet h a t7f1i si n d e p e n d e n t合 011lπ 2・ Tbec o n j l l g a t ep r i o rd e n s i t yf o ri f ;( i =1 ,2 )i st h eb e t ad i s t r i b l l t i o nw i t hp a r a l l l e t e r sa ndb , ; , wh巴r ea ndb , ;>O . p;>0a p;a Thep o s t e r i o rPDFf o ri f ;i sg i v e nby ふ( π;IX;)=ー」ーーイ, ‑1( 1 久 ) " , ‑1, B(σ; , b ; ) wherea ;=(11';+x i,b ;=11;‑X;+b ,ands(o;,b ; )dcnot巴st b cb c t af l l n c t i o日 p; 476

467.
[beta]
2
.
1
.Approximateexpressionforr
Thencwi
n
d
c
xrc
a
nb
ec
a
l
c
u
l
a
t
e
dv
i
aa
na
p
p
r
o
x
i
m
a
t
i
o
nu
s
i
n
gt
h
es
t
a
n
d
a
r
dn
o
r
m
a
It
a
b
l
c
.Weassumet
h
a
ta;a
n
db
;o
f
t
h
c
p
o
s
l
e
r
i
o
rd
e
n
s
i
l
ya
r
el
a
r
g
e
.Thea
p
p
r
o
x
il1la
l
ee
x
p
r
e
s
s
i
o
nf
o
rri
sg
i
v
e
nb
y
九二 P
(π1 >if2‑l
'
>o
IX1,
X2)

&0‑(
メり川川f一μ2.戸
p
川
υ
t
川
O
川
川
川
)
S
.
¥
川
"
/
J
)
)
/
川
̲
,
)

之
叶1
‑
(
φ
D
D
│

BY

町)~心
l) l vosυ/ρ
バ
/
引
(
(
1
lμ
メ
'.
1')
υ
(
)
S
/
)
I I
+
/
問
ρ
仰
川
"
川
川
J
日
川
S

凹山川
目
川
)
,
川
S
/
川
(
1
宮

¥V

al+向+1

I

a2+b2+1

)

whereφ(勺 i
st
h
ec
Ull1u
l
a
t
i
v
ed
i
s
t
r
i
b
u
t
i
o
nf
u
n
c
t
i
o
no
ft
h
es
t
a
n
d
a
r
dn
o
rl1la
ld
i
s
t
r
i
b
u
t
i
o
n,andJ
I
;
,
p

川/

+b
;
)d
e
n
o
t
e
s

= a
;
/(
a
;

t
h
ep
o
s
t
e
r
i
o
rmeano
fif;.

2
.
2
.Exactexpressionforr
.T
hee
x
a
c
tp
r
o
b
a
b
i
l
i
t
yf
o
rt
h
enewi
n
d
e
xri
sc
a
l
c
u
l
a
t
e
db
y
K
a
w
a
s
a
k
ia
n
dMiyaoka[
1
2
]p
r
o
p
o
s
e
dc
x
a
c
te
x
p
r
e
s
s
i
o
nf
o
rr

.Thcc
x
a
c
te
x
p
r
e
s
s
i
o
nf
o
rri
sg
i
v
e
nb
y
u
s
i
n
gt
h
ee
x
a
c
tp
o
s
t
e
r
i
o
rPDF
九三 P
(π1>π2‑1'>01X1,
X2)=

f(o)do

w
h
e
r
e
f
(
O
)f
o
rO i
st
h
ee
x
a
c
tp
o
s
t
e
r
i
o
rPDFf
o
r
]
[
1ー π2.Thee
x
a
c
tp
o
s
t
e
r
i
o
rPDFi
se
x
p
r
e
s
s
e
da
s

B(
a2,
bl)
(
10)内 十 h1‑J

f
(δ)=

B(aIA)B(α
2
'h2)
B(
al,
b2)
(
1+δ
)
ο
I+h~ ー l

W
L
:
'
:

:,,~I

or 0く δ壬l
F)(a2A,
I‑b2,
I‑al;a2+向;1010) 1

1

f
I‑bl,
1一正 2,
al+b
Ol
2;I+o;l+δ) f
J(al,b2,

B(al,
向)B(a2,
b2)
B(al+a2‑
IA+b2一1
)1
:
<
=
δくO

1
orδ ニ O

B(aIA)B(a2,
hュ
)

w
h
e
r
e
ι~( k l );(k 2 );(!I);(!2)i 11; 1I~

1
I2
円 (kl,
k2,
1112;h;lIl,
)=), 予 一 一 一 一 ‑
ftfZ1(/7)I+f
11j!
I

.
!
.

maxI
1l1J!1/12
11
}
, d
e
n
o
t
e
st
h
eA
p
p
e
l
Ih
y
p
e
r
g
e
ol1le
t
r
i
cf
u
n
c
t
i
o
n, a
n
d(
k
)
;i
st
h
ePochhaml1le
rs
Yl1lbo.
lK
awasakia
n
d
Miyaoka[
1
3
]p
r
o
v
i
d
e
dt
h
ep
r
o
o
f
f
o
r
f
(
o
)
.

3
.C
a
l
c
u
l
a
t
i
o
nprogramf
o
rτ
u
s
i
n
gSAS
I
nt
h
i
ss
e
c
t
i
o
n,wep
r
e
s
e
n
tt
w
oc
a
l
c
u
l
a
t
i
o
np
r
o
g
r
a
m
sf
o
rru
s
i
n
gSAS

3
.
1
.ApproximateProbability
t
ep
r
o
b
a
b
i
l
i
t
yc
a
nc
a
l
c
l
l
l
a
t
eb
yt
h
ef
o
l
l
o
w
i
n
gp
r
o
g
r
al1lu
s
i
n
gt
h
eCDFf
l
l
n
c
t
i
o
n
.
Thea
p
p
r
o
x
il1la

477

468.

d a t aWORK.OUT; p o s t lニ &a1/(&a1+&b1); p o s t 2=&a2/(&a2+&b2); o s t1))/(&a1+&b1+ 1) ; den02=(p o s t 2宇(1‑p o s t 2))/(&a2+&b2+1); denol=( p o s t I宇(1・ p random=( ( ー1 )*& d e l l a‑(p o s t1‑p o s t 2))/s q r l (d e n o l+den02); r a n d o l l l, 0,1, )0 . 0 0 1) ; Tau̲a=1‑r o u n d (c d f ('NORMAL', ︐ 1 1 1 1 r 9U LU VJ t l PA LU o v z t n し 9u x 吋ノ﹄ ι F コ 今 Thee x a c tp r o b a b i 1 i t yc a nc a l c u l a t ebyt h ef o l l o w i n gprogramu s i n g FDELTA"and P o c h h a m l l l e r "f l l n c t i o n s .We c r e a t e FDELTA"and P o c h h a l l l m e r "f l l n c t i o nl l s i n gt h eFCMPp r o c e d u r e . p r o cfcmpo u t l i b=WORK.FUNC .SAMPLE; *CREATEPOCHHAMMERFUNCTION* ; n d); f u n c t i o nPOCHHAMMER(v a l,i i fi n d=0t h e nRES= 1:c l s eRESニ V日1; dojニ 1t oi n d‑1; RES=RES*(v a l+j); end; r e t u m (RES); endsub; *CREATEFDELTAFUNCTION* ; f l l n c t i o nFDELTA(i, j, d e l t a, a l, a 2 b l, b2) ; dom =0t oi : don=0t oj: l l ); LI=POCHHAMMER( 1‑b l,I L2ニ POCHHAMMER(1‑a2,n); l l )/g a l l l m a (a l) ; KI=g a m l l l a (a l+I ̲K2=g a m l l l a (b2+n)/g a m l l l a (b2); e l t a)叫 m; ̲E=(I+dclta)**n; ̲Ul=al+b2+I l l+n; 一U2=a l+b2; Dニ(1+d b2)*((1+d e l t a)* ホ(a1+b2‑1)))/(b e t a (a1, b1) ホb c t日 (a 2, b2)); K =(b e t a (a1, 1=Oor L2=00r D=Oor E=OthcnKAl=O・ i f KI=Oor K2=00r L 巴I s巴 KAI=(̲Kl*̲K2*̲LI *̲L2*̲D*̲E)/(gamma(̲UI)/gamma(̲U2)*f a c t (n)*f a c t (m)); ADD+KAI; PDF=ADD* K; cnd: end; ‑ ︐ . L r r e t l l r n (PDF) ; endsub; 478

469.

Wecanc a l c u l a t et h ePDFu s i n gt h ef u n c t i o nt h a twec r e a t e di nt h eabove‑mentioned. d a t aWORK. FDEL; ー0 . 9 9 9t o‑ & d e l t aby0 . 0 0 1; dod e l t a= PDF= FDELTA(&Loop, &Loop, d c l t a,&al, &a2, &bl, &b2); o u t p u t ; cnd; run: Next, wec a l c u l a t eana r e aofupt oD e l t a " ;N o n ‑ i n f e r i o r i t yl 1 1a r g i n,a tt h et r a p e z o i d a ll 1 1e t h o d . d a t aWORK.OUT2; s c tWORK. FDELcndニ EOF; LAGPDF=LAG(PDF); LAGDEL= LAG(d c l t a); h e nDAI= sum(LAGPDF, PDF)キ(d e l t a‑LAGDEL)/2; i f N 八 二 It RDAl+DAI; Tau̲e= r o u n d (I‑RDAI,0 . 0 0 1); ifEOF; ︐ 1 1 n u r I nt h eAppendix,wep r e s e n taSASmacroprograma b o u tac a l c u l a t i o nmethodu s i n gt h eFCMPprocedur 巴 4 .Examplef o rτ u s i n gSASprogram I nt h i ss e c t i o n,weshowt h eu t i l i t yofrbya p p l y i n gi tt ot h cr e s uI tsofcI in i c a lt r i a l s .I nt h ef i r s texample,wea p p l yT t oa 1 1a t i o nr e g a r d i n gS OI 1 lC p r c v i o u sc l i n i c a lt r i a l si sn o ta p p l i c a b l c .T h c r c f o r e we a s s ul 1 lc a s i t u a t i o n wherein i n f o rl .I nt h eseconde x a l l l p l e,wel l s et h ei n f o rl 1 1a t i o nr e g a r d i n gap r e v i o u sc l i n i c a lt r i a. ITherefore,we n o n ‑ i n f o r l l l a t i v ep r i or e s t i m a t ct h eh y p e r p a r a l l l c t巴rv i aane m p i r i c a lBaycs1l1c t h o d Table1l i s t st h er e s l l l t sofad O l l b l e ‑ b l i n d e d,r a n d ol 1 1i z e d4 1 ‑ c e n t e rs t l l d ycomparingt h ee f f i c a c yofTJN‑318c r e a l l l np a t i e n t sw i t hc l l t a n e O l l S1l1y c o s i s(TJN‑3I 8S o l l l t i o nS t l l d yG r o l l p[ 1 4 ] ) .The w i t ht h a tofb i f o n a z o l e(BFZ)c r e a1l1 i mainp l l r p o s eoft h i sc l i n i c a lt r i a lwast oshowt h a tTJN‑3I 8creami sn o tl 1 11 1 c h(10%)worset h a nBFZc r e日1 1 1 .H ence, t h en o n ‑ i n f e r i o r i t yl l l a r g i ni s 10%.Theprimaryendp o i n toft h i sc l i n i c a lt r i a li sab i n a r yv a r i a b l e :I ns h o r t,t h ep a t i e n t e i t h e rr e c o v e r so rdoesno1 .T y p i c a l l y,t h ef r e q u e n t i s tf r a l l l e w o r ki sel 1 1p loyedt ov e r i f yt h epurposeoft h ec l i n i c a lt r i a l byc a l c l l l a t i n gap ‑ v a l l l e . Fort h ep l l r p o s eofr e f e r e n c e,wec a l c l l l a t et h ep ‑ v a l l l el l s i n gt h eZ / . ‑ t e s ts t a t i s t i c( e . g s e e 句 Fa汀 i n g t o nandManning[ 4 ] ) . 1 lo s tc o l l ll 1 1no f丁 目b l e. 1Asar e s l l l t, wel l s ean o n ‑ i n f o r m a t i v ep r i o r , Ther e s l l l t i n gv a l l l eofi n d e xri sshowni nt h er i g h tl t h a t瓜 日 ; =s ;=Iandiニ 1 ,2 .C l e a r l y ,rbecomesl a r g e ra st h ep ‑ v a l l l ed e c r e a s e s .a吋 i th a sav a l l l en e a r1whent h en l l l l h y p o t h e s i si sr e j e c t e d .Moreover ,wen o t i c et h er e l a t i o n s h i pa sr 王寺 I‑p ‑ v a l l l e . Next,wea p p l yt h eproposed i n d e x rt ot h ed a t ac o l l e c t c di nad O l l b l e ‑ b l i n d e d,randol 1 li z e dphase 3c l i n i c a lt r i a l comparingt h ee f f i c a c i e soff o l l i t r o p i na l p h a( h e r c a f t e r ,Iheslllめ ゆ ・IIg)andh l ll 1 l3 nmenOj 百l l l s a lgonadotropin( h e r e a f t e r, 479

470.

t h e c o n t r o l d r u g )i np a t i e n t sw i t hn o ‑ o v l l l a t i o n ‑ c y c l e syndrome (from t h e assessment r e p o r t ofP h a r m a c e l l t i c a l s and MedicalDeviccsAgency(PMDA)[ 1 5 ) ) .Tablc1 showst h er e s l l l t i n go V l l l a t i o nr a t c,whichi st h eprimaryendp o i nt . The ZFt e s ta f f o r d s ap ‑ v a l l l e of0 . 0 9 3 when t h en o n ‑ i n f e r i o r i t y margin i s 10%,which i n d i c a t e sn o n ‑ s i g n i f i c a n t dim 巴r c n c e s .I na d d i t i o n, t h ec x a c tv a l l l cofri s0 . 9 1 1whcnt h en o n ‑ i n f o r m a t i v cp r i o ri sl Is e d . Wet h e nc a l c l l l a t eront h eb a s i softher e s l l l t softhep r e v i o u sc l i n i c a lt r i a lt oe s t i m a t et h ehyperparameterf o rt h ep r i o r d e n s i t y .Thcobservedo v u l a t i o nr a t c sd l l ct ot h cs t l l d yandc o n t r o ld r u g si nap r e v i o u sc l i n i c a lt r i a la r ed e t a i l e di nt h c a s s e s sl l 1e n tr e p o r . tI nJ a p a n e s ec l i n i c a lt r i a l s,t h eo b s e r v e do v u l a t i o nr a t eduet ot h es t u d ydrugwas90.2%( 5 5 = 6 1 ) .On nano v e r s e a sc 1i n i c a lt r i a lt h co V l l l a t i o nr a t eduet ot h ec o n t r o ldrugwas73.5%( 7 2 = 9 8 ) .Web e l i e v e t h co t h e rhand,i t h a tv a r i a b i l i t yi si m p o r t a n tbecausenoc l i n i c a lt r i a l su s i n gt h ec o n t r o ldrughavebeenconductedi nJ a p a n .Wee s t i m a t e t h ehyperparameterbyu s i n gt h eM Lcl l 1p i r i c a l Bayesmethod.Ont h eb a s i soft h eM Le m p i r i c a lBayese s t i m a t e,we a s s ul l 1et h a tt h ep a r a m e t e r softhcp r i o rd c n s i t yf o rt h es t l l d ydruga r eGI 'J =7 4. 45andb 4 . 61 .Thus,weassumet h a t pJ = 1 t h ee x p c c t e dv a l u eoft h ep r i o rd i s t r i b l l t i oJ1 i s0 . 8 3 6andt h ev a r i a n c ei s0 . 0 3 9 .S il l 1i l a r l y,weassumet h a tt h ep a r al l 1e t e r s oft h cp r i o rd e n s i t yf o rt h ec o n t r o ld r l l ga r c(/1'2ニ 8 0 . 5 4andb 2. 40 .Thus,wea s s l l m et h a tt h ee x p e c t e dv a l u eoft h e p2 2 二 p r i o rd e n s i t yi s0 . 7 8 2andt h ev a r i a n c ci s0 . 0 41 .Asar e s l l l t,t h ee x a c tandapproximatep r o b a b i l i t i e so b t a i n e da r eeach 刊 hp r o b a b i l i t yofamajord i f f e r e n c ebetwccnt h ee f f i c a c yoft h es t u d ydrugandt h a tof r o u g h l y0 . 9 9 7 ;t h i si n d i c a t e sa1 1 1a nner,wecans c tt h cp a r al l 1e t e r sofap r i o rd i s t r i b l l t i o nw i t hi n f o r m a t i o nr e g a r d i n gt h er e s u l t s t h cc o n t r o ld r l l g .I nt h i sl ofap r c v i o u sc l i n i c a lt r i a. l l 1a r yc n d p o i n ti nc l i n i c a lt r i a lf o rTJN‑318c r c al l 1v sB i f o n a z o l ec r c a m . T a b l e l :Ther e s l l l to f p r il D i s e a ら ご N ame T i n e aP e d i只 T O l l t c o m e l u e A p p n l x i m a t e E x a c t D r u gName C u r e N o n ‑ C u r e T o t a l jJ‑l"a ( ) . ( ) 0 6 T J : ¥ ‑ 3 1 8 1 0 1 2 7 12~ り2 0 . 9 リ4 0 . 9 B F Z 9 6 1 2 7 , T J : ¥ ‑ 3 I S C a n d i d n l l n t e r t r i g o T J : ¥ ‑ 3 1 8 T i n e aC o r p o r i C a n u i d a lInterdi~it‘tI P i t v r i a s i sV e r s i c o l o r s F Z 7 0 6 9 1 3 l ‑ l 8 3 8 3 O . 0 2 R 0 . 9 6 5 0 . 9 7‑ l 3 9 4 4 ‑ l3 ‑ ll 0 . 0 6 8 0 . 9 3 2 0 . 9 4 3 2 7 0 . 0 0 2 0 . 9 9 8 0 . 9 9 9 0 . 0 0 5 0 . 9 9 2 O . 9 9 R s F Z 守 ' ‑, T I . : ¥ ‑ 3 1 8 日 ドZ 2 5 2 3 ' ) 59 2 3 T J : ¥ ‑ 3 I X B F Z 4 6 3~ 品i 4 9 T a b l e2 :Ther e s u l to f p r il l 1a r yc n d p o i n ti nc l i n i c a lt r a i a lf o rf o l l i t r o p i na l p h av sm e n o p a l l s a lg o n a d o t r o p i n, 了 O l l t c o m c D r u gName Cl Ir e N o n ‑ c u r e T o t a l OVl Il a t i o nR a t i o p ‑ v a l u e Appn悶 i m a t e E x a c l 0 . 0 9 3 0 . 9 1 0 2 7 7 9 . 1係 0 . 9 1 1 S t u d v 1 0 2 1 2 9 1 0 リ 自1 . 6 % 1 3 2 C o n t r o l 2 3 5 .C o n c l u s i o n We proposed two c a l c u l a t i oJ1 p r o g r al l 1s f o rt h e new Bayesian i n d e x rニ P (πJ>巧 ー b .oI X,X2) t od e t e r m i n et h e J p r o b a b i l i t yt h a tt h eb i n o m i a lproponionofas t l l d yd r l l gi sn o n ‑ i n f e r i o rt ot h a tofac o n t r o ld r u g .Web e l i e v et h a tt h e l 1a t eand i n d c xi sadvantageousi nt h a ti tcanbce a s i l yandi n t l l i t i v e l yu n d e r s t o o danda p p l i c d .Wco b t a i n e dt h ea p p r o x il 480

471.
[beta]
e
x
a
c
tc
x
p
r
c
s
s
i
o
n
sf
o
rr
.Thec
a
l
c
u
l
a
t
i
o
n
swcrcp
e
r
f
o
r
・
medu
s
i
n
gFCMPp
r
o
c
c
d
u
r
cofSAS.W 巴 showedt
h
ec
a
l
c
u
l
a
t
i
o
n
macroprogramingf
o
rt
h
ep
r
o
b
a
b
i
l
i
t
yi
nAppcndix.
Ther
e
s
u
l
t
sofa
c
t
u
a
lc
l
i
n
i
c
a
lt
r
i
a
l
sr
e
v
e
a
l
c
dt
h
a
tri
sl
a
r
g
cwhen l
h
ep
‑
v
a
l
u
ci
ss
m
a
l
!
. Regardingt
h
cr
c
s
u
l
t
sofa
p
r
c
v
i
o
l
l
sc
l
i
n
i
c
a
lt
r
i
a
l,
andwet
h
c
r
c
f
o
r
cc
s
t
i
m
a
t
e
dt
h
ch
y
p
c
r
p
a
r
a
m
c
t
c
r
sbyu
s
i
n
ganc
m
p
i
r
i
c
a
lBayesmcthod.I
n
d
c
xri
s
t
h
u
sc
o
n
f
i
r
m
i
n
gt
h
cu
t
i
l
i
t
yandf
l
e
x
i
b
i
l
i
t
yofr
advantageousi
nt
h
a
ti
tc
n
a
b
l
c
su
st
oc
o
n
s
i
d
c
rt
h
i
si
n
f
o
r
m
a
t
i
o
n,

R
e
f
e
r
e
n
c
e
[I]ICHE9e
x
p
e
r
tWorkingGroup.ICHharmonizedt
r
i
p
a
r
t
i
t
cg山 d
e
l
i
n
e,
s
t
a
t
i
s
t
i
c
a
lp
r
i
n
c
i
p
l
e
sf
o
rc
l
i
n
i
c
a
lt
r
i
a
l
s
.S
1
a
1
i
s
1
i
c
s
i
nMedicine1
9
9
9
;1
8
:J
905‑J
9
4
2
.
[
2
]E
f
f
i
c
a
c
yWorkingPa口y
.EuropeanMedicincsAgcncyComl
1
1i
t
t
e
ef
o
rM
e
d
i
c
i
n
a
lP
r
o
d
u
c
t
sf
o
rHUl
1
1a
nUsc(CHMP)
口 i
nMedicine2006;2
5
:J
6281638.
g
u
i
d
c
l
i
n
cont
h
cc
h
o
i
c
eofthcn
o
n
i
n
f
e
r
i
o
r
i
t
ym
a
r
g
i
n
.S
1
a
1
i
s
1
i

i
g
n
i
f
i
c
a
n
c
ct
c
s
l
i時 1
0c
S
l
a
b
l
i
s
he
q
u
i
v
a
l
c
n
c
cbclwcenl
r
c
a
l
m
e
n
t
sw
i
l
hs
p
c
c
i
a
Jr
e
f
e
r
e
n
c
e1
0
[
3
] DunncttC W,GentM.S
d
a
t
ai
n
l
h
eformof2x2l
a
b
l
c
s
.Bioll1C
1
r
i
c
s1
9
7
7
;33:593602.
.T
e
s
ls
l
a
l
i
s
l
i
c
sand samples
i
z
ef
o
r
m
u
l
a
cf
o
rcomparalive b
i
n
o
m
i
a
Jl
r
i
a
l
sw
i
l
h nul
J
[
4
]F
a
r
r
i
n
g
t
o
n CP,Manning G
h
y
p
O
l
h
c
s
i
sofnon‑zcror
i
s
kd
i
f
f
c
r
c
n
c
co
rn
o
n
‑
u
n
i
l
yr
c
l
a
l
i
v
cr
i
s
J
ιS
1
a
1
i
s
1
i
c
si
nMedicinc1
9
9
0
;9
:1447‑J
4
5
4
.
[
5
]M
i
e
t
t
i
n
c
n0,
Nurl
1
1i
nenM.Comparalivca
n
a
l
y
s
i
soflWOr
a
l
e
s
.S
1
a
1
i
s
1
i
ωil1Medic
・
i
n
e1
9
8
5
;4:213226.

、

l
P.
l
o
l
ll"l1a
/o
I
B
i
o
s
1
a
1
i
:1
i
c
s2009;3:247‑256.
[
6
]Almcndra‑AraoF
.Behavioroflhca
s
y
m
p
l
o
l
i
cpoolcdZ
‑
s
l
a
t
i
s
t
i
c
..
山
引
h
廿
i
i
h
四 aK,
AdachiE
.C
a
l
c
u
l
a
l
i
o
noft
h
cc
o
n
f
i
d
c
n
c
ci
n
t
c
r
v
a
lw
i
t
hskcwncssc
o
r
r
c
c
t
i
o
n
[
7
]H
i
r
o
l
s
uC,HashimotoW ,Nis

J
ap日n
c
s
e.
J
O
l
山
l
t
円
r
i
月l
(
I/
olA/
ρ
J
ρ
l
1
/
μi
e
d
S
1σ
1
1
;
λ刈s
、
l
i
c
ι
.
古 J
9
9
7
;26:83‑97.
f
o
rt
h
cd
i
f
f
e
r
e
n
c
coftwobinominalp
r
o
b
a
b
i
l
i
l
i
c
s
..

[
8
] Dann RS,Koch GG. MClhods f
o
ro
n
c
‑
s
i
d
c
dl
c
s
l
i
n
g oft
h
cd
i
f
f
c
r
c
n
c
c bclwcen p
r
o
p
o
r
t
i
o
n
s and samplc s
i
z
c
c
o
n
s
i
d
c
r
a
l
i
o
n
sr
c
l
a
t
e
dt
on
o
n
‑
i
n
f
e
r
i
o
r
i
l
yc
l
i
n
i
c
a
ll
r
i
a
l
s
.Phar
l
l
1a
ce
1
l1
i
c
a
/S
1
a
1
i
s
1
i
c
s2008;7
:130‑141.
‑
!
, MiyaokaE
.Noi
n
f
c
r
i
o
rn
o
n
p
a
r
a
m
c
l
r
i
cl
e
s
ta
to
r
d
c
rc
a
l
c
g
o
r
i
c
a
ld
a
l
a
.Organi
ごe
dS
e
s
s
i
ol1sollhe
[
9
]ZhangF,FupingI
.
J
apa
l
1e
s
e.
J
o
i
n
1S
r
a
1
i
s
r
i
c
sMee1ing,TohokuU
n
i
v
c
r
s
i
l
yS
c
n
d
a
i
s
h
i,Miyagiken,Japan,2008;2
6
8
.

[
1
0
] Ka¥Va
s
a
k
i Y,ZhangF,i
V
li
y
a
o
k
aE
.Comparisonsofl
c
s
ls
l
a
l
i
s
l
i
c
sf
o
rn
o
n
i
n
f
c
r
i
o
r
i
l
yt
c
s
l
saimcda
td
c
r
i
v
i
n
gl
h
c
d
i
f
f
e
r
e
n
c
ebetweenlwoi
n
d
e
p
c
n
d
e
n
tb
i
n
o
m
i
n
a
lp
r
o
p
o
r
l
i
o
n
s
.AlI1e
r
i
c
a
n.
J
o
l
ll"l1a
/ofB
i
o
s
1
a
1
i
s
r
i
c
s2010;1:
2
33
1
s
a
k
iY,MiyaokaE
.A Baycsiani
n
f
c
r
c
n
c
cofP
(7[1 >7[2
)f
o
rI
¥VOp
r
o
p
o
r
l
i
o
n
s
..
J
o
l
ll"l1a
/OfBiophar
l
l
1a
Ce1l1
i
c
a
l
[
1
1
]Ka¥Va

、

2
:425‑43
7
.
S
l
a
r
i
s
1
i
c
: 2012;2
. A Baycsian n
o
n
‑
i
n
f
e
r
i
o
r
i
l
yl
c
s
l f
o
r two i
n
d
c
p
e
n
d
c
n
l b
i
n
o
m
i
a
lp
r
o
p
o
r
l
i
o
n
s
.
[
1
2
] Kawasaki Y, Miyaoka E
Ph
ω"/I1acell1i
c
a
lS
l
a
1
i
s
1
i
c
.
δ2013.i
np
r
e
s
s
.
.A p
o
s
l
c
r
i
o
rd
c
n
s
i
l
yf
o
rl
h
ed
i
f
f
e
r
e
n
c
cbclweenlwobinominalp
r
o
p
o
r
l
i
o
n
sandl
h
eh
i
g
h
c
s
l
[
1
3
]KawasakiY,MiyaokaE
J
o
l
ll"l1a
/oI
.
J
apanS
1
a
1
i
s
1
i
c
sS
o
c
i
e
(
v2010;40:265‑275.
p
o
s
l
c
r
i
o
rd
e
n
s
i
l
yc
r
e
d
i
b
l
ei
n
t
c
r
v
a
!
..

i
f
o
n
a
z
o
l
ec
r巴am1
0l
h
ep
a
l
i
e
n
lw
i
l
h
[
1
4
]TJN‑318S
o
l
u
l
i
o
nSludyGroup.D
o
u
b
l
e
‑
b
l
i
n
ds
l
uの onTJN‑318crcam日ndB
CN
i
s
h
i
n
i
h
o日 .
J
o
l
lrl1a/olDer
l
l
1a
1
0
/
0
幻1 1
9
9
2
;54・
977‑992
l
h
cc
u
l
a
n
e
o
u
smycosis 刀1

ド
[l
日
勾
5
]刊
Ph
削a
n
n
a
c
e
l
l
l
i
陀
c
a
山 a
吋 ル
M
c
d
ω
l
C
ω
a
l
D
c
v
i
c
c呂 Ag
巴叩
n
c
y
.Fol
/i
1
μ
印
r
υ
e'
p
フi
ω
月
J
?臼l
伊
phσο
ザ/臼出
δ
Y
叩e
C
川
写
S
W
川
引
刊
I
1
1
刀1
臼
e
F
月1
汀r
r
り
ψ
3
οバ
r
‑
γ
1
.Pル
M旧DA:Tokyo,
2009.

481

472.

Appendix / * +一一一一一ー一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一・+ I DESCRIPTION:Takumil n f o r m a t i o nTechnology I VERSION:SAS9 . 2 I FILENAME:Noninf .s a s I PURPOSE:Onc a l c u l a t i o nmcthodofaB a y e s i a nn o n ‑ i n f e r i o r i t yi n d c xf o rtwob i n ol 1 li a lpropo 口i o n su s i n gSAS ρLρ ﹂ ベ ノ ‑ ZZ1A 11 0 nbquE 円 以 HHHHHu 11t n M L 吋 T l X2 eem が1 凶 川 正 1 1A NNX 戸 [ ︼ R PA T 戸 [ ︼ M A R A +一一一一一一ーーーーーーーーー一一一一一一一一一一一一一一‑一一一一一ーーーーー一一一一‑‑‑‑‑‑ーーーーーーーーーーーー一一一一一一一一一一一一一ーー+ :Outcome2 Alphal :HyperparameterαI 1 le tclα2 Alpha2 :Hypcrparal B e t a l :Hyperparameter̲sI Beta2 :Hyperparameter̲s2 D e l t a n f e r i o r i t yM日r g l n :NO!ト l Loop 1 lb e rofs i m l l l a t i o n si nt h egroup : Thcn l ll +一一一一一ー一一一一一一一一一一一一一一一一一一一一一‑‑‑‑‑‑一一一ー一一一一一一一一一一一一一一一一一一一一一一一一一一一一一ー+ * / %macroN o n i n f (n l= , n2= ,x l= , x2= ,a l p h a l= ,a l p h a 2= ,b e t a l= ,b e t a 2= ,d c l t a= ,l o o p= ); % 車 CREATEFUNCTIONS* ; o p t i o n scmplib= WORK.FUNCI 1 lp r i n t; p r o cfcmpo l l t l i b= WORK.FUNC .SAMPLE; % キ CREATEPOCHHAMMERFUNCTION穴 f l l n c t i o nPOCHHAMMER(v a l,i n d); h e nRES= 1; i f i n d= 0t a l; e l s eRES=v oi n d‑1; doj= 1t a l+j); RESニ RESキ(v end; r e t l l r n (RES); e n d s l l b ; 482

473.

% 本 CREATEFDELTAFUNCTION宍 f u n c t i o nFDELTA(i, j, d e l t a, a1, a 2, b1, b2); dom =0t oi ; don=0t oj; LI=POCHHAMMEI ミ ( 1‑b I,m); 2, n); L2=POCHHAMMER(1‑a KI=gamma(a l+m)Igamma(a I) ; 1 1m a(b2+n)Igamma(b2); K2=gal o=(1+delta)判 n 1; E=(1+d e l t a)* *n; 口1+n; UI=a I+b2+ U2=a I+b2; b2)本((1+d c l t a )村 (aI+b2‑1)))I(b e t a (aI, bI)* b e t a (a 2, b2)); ̲K=(b c t a (a1, i f KI=0o r K2=0o r LI=0o r L2=0o r 0=0o r E=0t h e nKAI=0; e l s eKAI=( K1* K2本 LI本 L2本 D 本 E)I (g a m l l l a (̲U1)Ig aI l ll l l a (̲U2) 本 f a c t (n)* f a C l (I I I)); ADD+KAI; PDF=ADD本 K; end; end: r e l u m (PDF); endsub: r u n ; % I e laI=%eval(&alphaI+&x1 ); % I c ta2=%eval(&alpha2+&x2 ); %Ielb l=%eval(&nl‑&xl+&betal) ; % I e tb2=%eval(&n2‑&x2+&bcta2); d a t aWORK. FDEL; dod c l t a=‑ 0 . 9 9 9t o‑ & d e l t aby0 . 0 0 1: PDF=FDELTA(&Loop, &Loop、d c l t a,&al,&a2,&bl,&b2); o u t p u t ; cnd; run: 4 8 3

474.

d a t a、 r VORK.OUT2; s e tWORK. FDELend= EOF; e l t a); LAGPDF= LAG(PDF);LAGDEL= LAG(d i f̲N̲^=1t h e nDAI=sum(LAGPDF, PDF)* (delta‑LAGDEL)/2; RDAI+DAI; o u n d (1‑RDAI, 0 . 0 0 1); Tau e= r ifEOF; r u n ; d a t aWORK.OUT3; p o s t1= &a1/(&a1+&b1) ; p o s t 2= &a2/(&a2+&b2); deno1= (p o s t1* (1‑post1))/(&a1+&b1+ 1); o s t 2* (1‑post2))/(&a2+&b2+ 1); den02= (p randol l 1= ( ー (1 ) 本 &d巴l t a‑(p o s t1‑p o s t 2))/s q r t (d巴n o l+d巴n02); o u n d (c c l f ('NORMAL', r a n c l o m, 0,J), 0 . 0 0J); Tau aニ J‑r kccpTau̲a; r u n ; d a t aWORK.OUT4; l p h a1a l p h a 2b巴t a lb巴t a 2d巴l t aTau̲aTau̲e; f o n n a tnJn2xJx2a mergeWORK.OUT2 WORK.OUT3; a l p h a 2= &alpha2; a l p h a1= &alpha1; b e t a1 =&beta1 ; b e t a 2 =&beta2 n1= &n1;n2= &n2;x1= &x1;x2= &x2;aJ= &a1;a 2= &a2;b1= &b1;b2= &b2; d e l t a; c l e l t a= & l I n p r o ct r a n s p o s cd a t a= WORK.OUT4o u t= 、 r VORK丁目; v a rn ln2x1x2a l p h a1a l p h a 2b e t a1b巴t a 2d e l t aT a l l aT a l l e; t n 484

475.

d a t aWORK .OUTDS; s e tWORK.Trs l e n g t hITEM$1 0 0; i f NAME =" n l " t h e nITEMニ "SampleS i z e1 " 守 e l s ei f NAME =" n 2 " t h e nITEM="SampleS i z e2 "; e l s ei f NAME =" x1 " t h e nITEM=" O l l t c o m e1 "; " x 2 1 1 t h c nITEM=" O l l t c o m e2 '勺 e l s ei f NAME 二 e l s ei f NAME 一=" a l p h a1 "t h e nITEM="Hyperp日r a m e t e ra1 "; I ‑ lyperparameterα2"; e l s ei f̲NAME̲=" a l p h a 2 "t h c nITEM=" f̲NAME̲=" b e t a l " t h e nITEM="Hype中 a r a m e t e r ̲s1 "; e l日 i e l s ei f̲NAME̲=" b e t a 2 " t h c nITEM="Hypcrparamcter̲s2"; N o n ‑ ! n f e r i o r i t yMargin"; e 1 5 EIf‑NAME‑="delta"thenITEMニ " r o b a b i l i t y "; e 1 5 Eif‑NAME‑="Tau‑a"111E11ITEMニ "ApproximateP f NAME e l日 i 二 " T a l l ̲ e " t h e nITEM=" E x a c tP r o b a b i l i t y "; 丁 目u a "I t 丁 目l l ̲ e " )t h e nVALUEニ c o m p r e s s (p l l t (COL l,8 . 3)); i f̲NAME̲i n (" e l s ei f NAME ニ " d e ! t a " e l s e l h巴nVALUE=c o m p r e s s (p l l t (COL l,8 . 2)); VALUE=compress(p u t (COL1,8 . 0 )); p r o cp r i n tnoobsl a b e l; v a rITEMVALUE; V a l u e "; labelITEM=" I t e m "VALUEニ " r l l n : %mend; n2ニ 1 0, x1= 1, x2= 1, a l p h a1ニ 2, a l p h a 2=3, %Noninf(n l= 1 0, b e l a lニ 4,b e l a 2=5, d巳I t a=0 . 1,l o o p= 100) 485

477.

│ 治 手 伝 説 話 事I 柄拘I 謀 長 男1 2 1 6 1訓l エラーディクショナリ作成と統計解析帳票 作成業務における問題点の抽出 松 島 純 之 介 1) 久力 j 羊1),杉谷康雄 1), 結 城 美 保2), 坂 上 拓 2) 中 外 製 薬 株 式 会 社 臨 床 企 画 推 進 部 統 計 解 析 G1) 株式会社中外臨床研究センターバイオメトリクス部 解析プログラミンク、 G2) C r e a t i n gE r r o rD i c t i o n a r yandI d e n t i f y t h eProblemo fA n a l y s i sReport JunnosukeMatsushima 1 ) ,ト~iroshi K u r i k i1),YasuoSugitani 1 ) , MihoYuuki2),TakuSakaue2) ChugaiPharmaceuticalCO.,L td . C l i n i c a lResearchPlanningDepartmentB i o s t a t i s t i c sGroup1), ChugaiC l i n i c a lResearchCenterCO.,L td B i o m e t r i c sDepartmentA n a l y s i sProgrammingGroup2) 璽塑竪翠璽臨盤盟盟盟瞳髄置盟事 要旨: 統計解析業務の中でも解析帳票を作成するプロセス に特化したエラーディクショナリの作成方法と弊社 で作成したエラーディクショナリを元に,解析帳票を 作成するプロセスで発生したミスやその原因を紹介 する。 キーワード:エラ ディクショナリ,医薬品開発,品質 管理,プロセス改善, 1¥1)デーション 489

478.

│ ム ミ ヂ ザ 今 季I ー み @ 1 M一 一 一 . ぷ 1 ' 1 ' 1 & 1 エラーディクショナリの作成 ブロ y エクト (QCサ ク ル ) 送 達 成 警 E r r o rtR告書に不明!I:む情 柑や世間点がある渇含 は.入力者に問い合わせ I I 言語説経らみ.ぷi l l s t f l : : : ; 2 6 1 g 収集項目 レポーナイング イベント情報 誌験を特定できる情報 J プロダクト名,プロトコル番号 s 試験名, イベント情報 (CSR,CTD,照会事項)等 エラ一発生場所 どこでエラーが発生したかを特定できる情報 J 臨床試験デヲ(デヲセット名), プログラム名 解析内容 ヱラーが発生したデーヲ・解析帳票(プログラム) の解析内容 J 有害事象集計,臨床検査{直一覧 集計して間違いやすい解 祈内容を特定する リスク エラ一発生場所に対して事前に算定したリスク リスク毎のエラ一発生頻 度を調査し、リスク算定方 j 去の見直しに用いる ( r i s kmanagement) 490

479.
[beta]
川 … 行 ケ 川

川 川 ‑ 守 山 川 町

:-手ーや触アカデ1'~J=>';-,,')I):l.->~ i:...~:-

三

D

収集項目
ヱフー内容

実際に発生した具体的なエフー内容

エラー内容
(一般名}合

発生したエフーを一般的な名称に読み替えた
情報
J プログラムの不備、 SAPの要件不備,プログ
ラム仕緑の不備

検索を容易にしたり、集
計して発生したエラーのト
レンドを確認する

エラ一発生原因

発生したエフーの具体的な原因

エラ一発生原因
(一般名)合

エラ一発生原因を一般的な名称に読み替えた
情幸E

検索を容易にしたり、集
計して発生したエラ に
対する原因のトレンドを確
認する

対応

発生したエフーに対して実施した対応
J プログラム修正, SAP当プログラム仕様当プ
ログラム修正

時間・コストへのインパク
ト(手戻りの多さ)を評価
や、特異なエラーへの対
応方法のナレッジシェア

合プロジェクトで読み替えルールを規定した上で

設定するもの

jムユーザー蝕一一ームムムム1
1
1
一一一叫 1
1
1
1
'
1
収集項目
倹出工程

エラーを検出したQC工程
J ダブルプログラミング,コードレビュー
メディカルライヲ から報告,受入検査時等

QC手法や体制を見直す

発生したエフーのコスト・時間への影響度
J 大,中 小

改善活動での優先度の
設定

a

影響度

v

491

480.

: ミ ム ぶ 1 : ι 除問?ム.いふ 20~3I エラー報告時のルール ‑全般的なルール 一報告するエラーは、検証以降に発生したエラーにする。 ・自己点検や、プロトタイプレビ、ユ一時に検出したものは報告しない。 1こ影 ー出力情報(デー夕、解析結果やラベル、タイトル、フットノート等 ) 響しないエラーは報告しない。 ・検証時点では出力情報には影響しないが、将来的に影響が示唆 されるようなプログラムアルゴリズムのエラーを検出した場合に は報告する。 ‑ 1回の検査工程で、同一プログラムに複数のエラーが検出された場 合は、検出した件数分のエラーを報告する。 1 1 蝕 加 … ‑ … m l I エラー報告時のルール 収集項毎のルール エラー内容 〆 担当者以外の設が読んでも状況が分かるように、エラー内容を 詳しく説明する。 . / r‑のため J、r ‑ Iこより Jといった原因に該当するような記載は 省く(原因として記載する) 可能な限り t 屈り下げた原因を記鼓する。 原因 J 影響度 〆 発生したエラーにより、作業の手戻り・修正かかった時間や、発 生したエラーの影響範囲を考慮して設定する。 492

481.

J 1 1 1 ι吟必伝説1 1 1 1 1 1 1 j 1 i l i J : 1 1 7 i f :泌緩 用語の統一 「原因」のコ 積 一 す 方 U Hか 献 起 わ 集ラ析一し﹁の﹁はカ れたエラーテ、ィクショナリの「エ 容」と「原因」は、個別に状況分 ためにもフリーテキストで収集 解析計画書どおりに PG仕様書を作成して いなかったため 、、「エラー内容」と「原因」を集計 析すれば、 デインクr{~IJ ‑ iPG仕様書作成 ︑]包 仕様書に記載しなかっ たため ?もどんな種類のエラーが多い PG仕格書通りに開発 していなかったため , J( 今 QC工程・項目の改善) プログラム作成 E ︐ 工程の何が原因となってエラー 解析計画書で不要な [ る の か ?J(今開発工程の改善) footnoteが指定されて いたため 解析計画書作成 、るはず 解析計画書で何トル に誤記があったため i │集計可能にするため、統一用語でコーデV 云 ヲ1 I 祐 子i エラーデ、ィクショナリの例 .口 r 問 竺 守会 合 h点マ イ ポ ペ ー ン テ 付 ィ 育 ン 報 グ N o . レ 議 、 1 CSR 軍事務内軍事 エラ一発生場所 臨床試験デ‑';l( DEMOEXT)I 被 験者背景関連デ ‑';l{?'y卜 2 6 1 I I りえ 主 ク d 芸 品 「 臨 床 試 験 デ 畑 町 一 被 験 者 背 景 関 連 デ ヲ セ Y卜 共通マクロ (etpdshif. tsas) I 薬 i t , .力学的評価項目のシフトテープ LOW 共通マクロ (etcrpshif . tsas) lCRPのシフトテーブル │ lt 1 0 493

482.
[beta]
.
s

ザ)給均台民一I
均
一

2
0
1
3
I

エラーデ、ィクショナリの例
N
o
.

ヱラー内容

も
、
竹
、
、
ト
ゾ
や
:
ミ、ρ
、 吟
、
へ
エ
{
一
ラ
般
ー
内
名
容
)
i

、
、
戸
、
、
一
エラ一発生源医対+

f

II

ベ スフイン体重のカ7 ゴリ化す
解析用加工デ ヲセットのベ スフイン時点
る際の条件式で、欠値を考慮に
の体重カテゴリ変数を導出する際、体重の
入れていなかったため
ロジックの不備 欠測{直を考慮に入れていなかったため。体
重の欠測がありえることを念頭にコ ディン
グしていなかった。

2

ロジック内部で中間的な変数を
プログラム内にて類似処理を何度か行って
合成して新規変数を作成してい
ロジックの不備 おり.ロジックをコピーしたときに変数名を修
たが、使用する変数名を間違え
正し忘れたため。
て新規変数を作成していた。
LOCFされていない値で、ベース

3 ライン値と、 24週時の測定結果
とのシフトテ

ブルを作成した。

解析使用変数
の不備

LOCFされていない値で、ベース
I4 ライン値と、 24週時の測定結果 解析使用変数
の不備
とのシフトテーブルを作成した。

プログフム仕積書のプロクフム仕棟で、
LOCFした値を使用するように定義されてい
なかった。
解析計画書の変更が解析プログフマ 1
:
:伝
達されず、プログラム仕犠書に反映されて
いなかったため。
1
1

Iiiiifi十件-ふろ-~;'-I:,~;'ぶ m
エラーディクショナリの例
N
o
;
1 ごにエラ一発生源国
i入
、
{一般名}
w

I
プログラム作成

プログラムの修正

コ ドレピュ

2 I
プログラム作成

プログラムの修正

コ ドレピュ

3 I
プログラム仕保書作成

プログラム仕棟書の修正=会
プログラムの修正

SAPとの整合性の確認│小

1

統計担当者と解析プログ│プログラム仕様書の修正=>
4 1'~I._:_J~=_::::-=~~'III-:::""'._'
SAPとの整合性の確認│小
ラマのコミュニケ ション │プログラムの修正

1
2

4
9
4

483.

I 1 1 1 ι足元らん I 弊社で作成したエラーテ、ィクショナリを元に, 実際に解析帳票を作成するフ口セスで発生した ミスやその原因をまとめたものにつきましては, 当日のポスターにて発表いたします D 13 495

484.

│ ωユーザー総会時一…一泊ン三 201I SBCSSASでの日本語データハンドリング 矢嶋友也 坂上拓 株式会社中外臨床研究センター バイオメトリクス部解析プログラミンググループ 7 HandlingJapanesed a t aonSBCSSAS TomoyaYajima,TakuSakaue td ChugaiC l i n i c a lResearchCenterCo.,L B i o m e t r i c sDepartmentA n a l y s i sProgrammingGroup │ ωユーザー総会ホー…叩仇ン 要旨: SBCSSASを使用している海外サイトと SASチータセットや SAS プログラムを共有する際に、必ず大きな問題となるのが日本語 データ(ダブルバイトで構成された文字)のハンドリングである。 本発表では、 SBCSSASで日本語データの取扱いで発生した問題 を踏まえ、 SAS9.1以降の SBCSSASで日本語データをハンドリング する際の注意点と、データハンドリング方法について説明する。 レバイト文字 SAS9.1 キーワードー SBCSSAS,ダブJ 497 I

485.

‑ e * SAS . : : L ‑ ‑ 1 F 71l~7IT'J.lD>';S~~ユーザー総会 7続問J…νーンセ均ン 州 I ~,]g モチベーション ‑海外とのプログラムの共有(プログラム資源の有効活用) ‑ SBCSSASの稼動している海外サイトと、 DBCSSASの稼動 している日本のサイトの両方で利用可能な、解析帳票を作成 するための標準 SASプログラム (SASmacro)を開発したい。 ・日本語で収集されたデータも、海外サイトの SBCSSASで正確に ハンドリングできるようなプログラムを作成しなくてはならない。 ー海外サイトのプログラム開発者にダブ ルバイト文字を説明し、 日本語をハンドリングするための方法を説明したい。 1 1 1 ユーザー飴均一… encodingについて知る encodingとは? ーデータセットに格納されている文字列を符号化すること。 • SAS9.1以 降 SASd a t a s e t lこエンコード情報が保持されており、 SJISで エンコード されたデータセットを、 SBCSSASで、読み込むと エラーが発生してしまう。 英語版 (SBCS)SASのd e f a u l tencode:w l a t i n 1Western 日本語版 (DBCS)SASのd e f a u l tencode.SJIS SAS 刺す 498

486.

! ト と えγγ11戸 川 片 三 日 1~ユーザ十総会出向Iii叫 点三〈ぷ ふ ? と . 三 e n c o d eの異なるデータを読み込む • SASlibnamestatementoption SASlibnamestatementにin(out)encodingoptionを使い、明 示的に読み込む/書き込むデータの encodeを指定する。 • inencoding 一読み込むデータの encodeを指定する l i b n a m eabc xxxxx Jy y y y l z z z z "i n e n c o d i n g = < e n c o d i n g ‑ v a l u e > ; • outencoding 書き込むデ タの encodeを指定する i I bnam巴 巴d f" x x x x x / y y y y / z z z z "o u t e n c o d i n g = < e n c o d i n g ‑ v a l u巴>; ※ < e n c o d i n g ‑ v a l u巴〉の値は SASの NLSRef巴 「 巴n c巴Guid巴をご確認ください Iw 蝕内.…合物? 駄 三三 wI e n c o d eの異なるデータを読み込む 英語版 SASで日本語版 SASで作成したデータを読み込む ‑ encodelこ関係なくデータセットを読み込むには、 inencoding optionlこ"asciiany"を設定する。 l i b n a m巴 abc" x x x xx J y y y y / z z z z "i n e n c o d i n g = a s c i i a n y ; 499

487.

m m 一 「s ユーザー総会一一…… 英語版 SASで日本語を扱う際の注意点 英語版SASで日本語データを扱う際、 SJISの"文字コード"で J、ンドリングされる。このため、日本語データをハンドリング する際には注意が必要。 . s ユーザー総会!!宍…均一日向ン lEIlJI 英語版 SASで日本語を扱う際の注意点 日本語テキストの置換行った際、文字化けすることがある。 ぬx t=t r a n s l a t e (鼻咽頭炎¥ ', '@')I @マークをスペースに変換する i 問書明票議・今崎 9 d R顎議 SJISて'9520でコ ドされる文字は存在しないため 文字化けが起こる 500

488.

ー~ユーザー;総会均一九ムザωシハ: 与 a 1 ] g 英語版 SASで日本語を扱う際の注意点 ‑ 日本語テキスト!こ compress関数を使った際、文字化けする ことがある。 rSASアカウント JのAを除くため、 compress関数を用いる Is A data n u l l t e x t =' S A Sアカウント t e x t 2=c o m p r e s s ( t e x t,ι A ' ) ; p u tt e x t 2 = ; S ア カ ウ ン 卜 53 4 1 53.834 干両日五日函訂扇子 r u n ; t 巴x t 2=SSャJウント, H 1 1 1 ← 総 会 一 P 7 U : J … 一 向 ン g 英語版 SASで日本語を扱う際の注意点 日本語と英語が混在する文字列からの部分抽出すると、抽 出する文字列長によっては文字化けする。 一文字列 r SASユーザー総会 2 0 1 3 Jから抽出 ・12b向 ま で 抽 出 │text=substr(SASユーザー総会 2013',1,12)I 5 A 5 ユ ー ザ ー 総 会 2 0 1 3 ; 竺 41し53 8386 81堕 18:竺日‑哩2P:89EF‑32j3omi33 末尾が「総」を構成する 1 b y t e目までしか取得できていないため 文字化けする 501

489.

的ユマザー総会加I…~ヤン…. 三 ~I 英語版 SASで日本語をハンドリング 1 . 日本語と英語の判定 テキストの冒頭から 1byteづつ文字を抽出し、抽出した文字 r英語かを判定する が日本語 o ー判定方法 抽出した 1byteの文字に対して rank関数で評価する。 1‑ 1 2 8 ) 英語 rank関数の戻り値 ( 日本語 ( 1b y t e目): r a n k関数の戻り値 (129‑ 159/224‑ 251) 総 f < 2.ö-T~.3.1 司王子一三一一一一.Jf 幻 : 竺 唇J売155JP示 81司 亙 詞 ↓ 301 英語の文字の場合は Oを、日本語文字を構成する 1b y t e目が 検出された場合 1を設定する。 l 川 川 S~ユーザー総会加拘~…… ι ~I 英語版 SASで日本語をハンドリング 2 . 日本語を構成する 2byte目の検出 ‑ 検出方法 1のステップで日本語の 1 b y t e目が検出されている場合、次の 1 b y t e目は必然的に日本語を構成する 2byte目として 2を設定す る 。 S ユ ー ザ 総 会 2 0 1 3, 竺主任問 183叫16 明~1亙~L~?~恒子育 0 0012121212121200001 502

490.

II ュ = 会 一 … … 一 一r二‑ m 英語版SASで日本語をハンドリング 3 . 抽出位置の判定 一判定方法 1.‑2.のステップで、設定した英語 ( 0 )と日本語 1byte目( 1)、日本 i 吾2byte目( 2 )のフラグを元に、テキスト抽出位置を判定する。 S A S ユ ー ザ ー 総 会 2 0 1 3! D8 9 E F ‑32'30 31竺 53 4~__~~386 8158: ̲ 8 ̲ 3 5 5 一 同 58!918 jo 0 0 ① 2 1 2 1② 1 2 1 2 1 2 0 0 0 0 1 テキスト冒頭から 4byte自まで文字を抽出しようとした場合、 4byte目のフラグは 1のため、「ユ」の 1 b y l巴目までしかデ タを取得できないことが分かる。 テキスト冒頭から 9byt巴目まで文字を抽出しようとした場合、 9byt巴自のフラグは 2のため、「サ1 の2byt巴目まで文字列を抽出できており、文字化けは起こらない。 503

492.

ミクロデータ分析コンテスト:規定課題 0魚 住 龍 史 東京理科大学大学院工学研究科経営工学専攻 A microd a t aa n a l y s巴sc o n t c st :s p巴c i f i巴dr 巴q Ulr cmcnts R y u j iUozumi Deparf l 7 le n r0 1Mal1agemel1lSciel1ce,GradllaleSchoo/ojEl1gineeril1g,TokyoUnivel計 f ) 'ofScience 要旨 本コンテストで用いる擬似ミクロデータは,平成 1 6年全国消費実態調資の個票データに某づき,独 立行政法人統計センターによって作成された.本干jiijで与は,規定課題として,独立行政法人統計センター が擬似ミクロデータを用いて作成した集計結果を再現した. キーワード:疑似ミクロデータ,集計世品;表,世帯数分布,集計一用乗率, 1 0 万分比,消費支出, 1 0大 費問,世情;人員,有業人員, FREQプロシジャ, MEANSプロシジャ 1第 ト l表 / 第 1 ‑ 2表 / 第 1 ‑ 3表の再現 第 1 ‑ 1表集計世帯表(各レコードを単純にカウント),第 1 ‑ 2表世J:帯数分イl i (各レコードを集計用乗率で重 み付けしてカウント),及び~~ 1 ‑ 3表 j U :借数分イi ( 1 0万分比)をそれぞれ I l f J } Lするために作成した SASプロ ‑ 1から表 1 ‑ 3に示す.これ グラムをプログラム lに示す.さらに,プログラム iによって符られる結果を表 1 可現していることを確認した.な らの表は,独立行政法人統計センターによって作成された集計結果を I 027行 , 1 8 3変数, CSV形式のファイルで、あり,データセット名 DATAとして SASへインポ お,データは 32, ートした.また,本データには集計 m乗ネが含まれており,乗率を重みとすると 495,465件のデータとなる. │プログラム[:.l第 M 表 / 第 叫 表 I第 M 表 を 再 現 す る た め の 凶 プ ロ グ ラ ム *=士‑‑ニニ‑‑‑ニニ==============================*. *=========================================* 本有業人員/世帯人員ごとの集計JIj染率の平均及び N *10万分比、 o d so u t p u tsummary=weightO1 ; d a t al a b l e O O : s e lw e i g h l O O ; p r o cmeansd a t a = d a t ameann ; l O l a l = & t o l a l ; 日日1 ; v a rw e i g h t ;c l a s ss h u u g y o u j i n i ns e l aリl I O l a l w = & l o t a l w、 507 I

493.

f r e q1 O=freqw / to talw*1 00000; n u n u ‑‑ ふU H = 引J H u ρ i v 1 ・ ︐ . i1 i' ' ・u 1 n .:0 1ou び凶) m 3ihi n 川 w =円 a Mlvd h r ︑s r pbqd 討︼いは i ‑'1 2円U J U H u 引l u 目 w m︑ s ・ l l ρLZ 1c 14 u ‑‑u q 暗 'i m 1 VA1 ovh ロ・︒ uum l l ︐ . r odso u t p u tsummary=weight02; p r o cs o口 d a t a = t a b l e O Oo u t = t a b l e O O ; bys h u u g y o u j i n i ns e t a i j i n i n ; p r o cmeansd a t a = d a t ameann ; v a rw e i g h t ;c l a s ss e t a i j i n i n ; r u n ; *=====================================ニ=ニ二*. , d a t aw c i g h t O O ; *表ト 1 ; n u p r o cf r e qd a t a = t a b l e O O ; n u ︐ . r s e tweightOl ‑ w e i g h t 0 3 ; *====ニ̲̲̲ニ二ニ==============================*. , t a b l e ss h u u g y o u j i n i nホs e t a i j i n i n/norown o p e r c e n tn o c o l ; *重み付‑けにJIjし、る集計一川乗率の計算; w e i g h tweight̲N; r u n ; d a t aw e i g h t O O ; s e tw e i g h t O O ; *一一一一一一一一一一一一一一一一一一一一一一一一一一一一一 一一一一一一一一一一一*. , frcqw=weight̲N*wcight̲lllcan; 1 u r ホ表 1 ‑ 2 ; *====士三三士=二ニ=================二二二二二二ニ二ニニニホー, odsO l l t p U tCrossTabFreqs=tableO1 ; p r o cf r e qd a t a = t a b l e O O ; *総データ数; odso u t p u tSUInl l l a r y = t o t a I O O ; t a b l e ss h u l l g y o l l j i n i n * s e t a i j i n i n/norown o p e r c e n tn o c o l ; p r o cI l le a n sdata=weightOOsum; weightf r e q w ; d a t at a b l e O1 ; s e tt a b l e O1 ; wheres h u l l g y o u j i n i n = . ; Frequency= round(Frequency , 1 e ‑ O ) ; v a rweight̲N; 江b l e O I ; p r o cf r e qd a t a = t t a b l e ss h l l l l g y o l l j i n i n * s e t a i j i n i n/norown o p e r c e n tn o c o l ; d a t an l l l l; s e tt o t al OO ; w e i g h tFrequcncy; %globalweight̲N̲Sl Il l l ; r u n ; weight̲N̲Sum); c a l lS Y l l l p u t ( " t o t a l ", ホ 一 一 一 r l l n : 一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一*. *=二二============ニニ====================ニニニ=*. ‑ 3 ; , *表 1 *集計用乗率の合計; odso u t p l l tCross 丁 目b F r e q s = t a b l e 0 2 ; odso u t p u tSlIl11ll1a r y = t o t a I O O ; ニt a b l e O O ; p r o cf r e qd at a t a b l e ss h u u g y o l l j i n i n * s e t a i j i n i n/norown o p e r c e n tn o c o l ; p r o cI l le a n sd a t a ニ w eightOOS l l l l l ; w l 町 CS h l l l 暗y O l 吋 l I j i 口 1 1 1 1 川 n竺 = 可 ,.; weightf r c q1 0 ; d a t at a b l e 0 2 ; s e tt a b l e 0 2 ; v a 剖I 什e qw; Frequency=round(Frcquency , l c ‑ O ) ; a t a = t a b l e 0 2 ; p r o c仕eqd d a t an u l l; s e tt o t a l O O ; t a b l e ss h u l l g y o l l j i n i n * s e t a i j i n i n/norown o p e r c e n tn o c o l ; c a l ls y m p u t ( " t o t a l wぺ f r e qw̲SUll1); w e i g h tFrequency; VA 508 I l n u ︐ . r a l ︐ .‑ %globalfrcqw̲Sl Il l l ;

494.
[beta]
11 :集 ;
i
+1
t帯表
Satai.
Jinin(世 帯 人 員 〉

人:;ぷγ
ι人プ 5 A 57人 i
白
人

S hu u町 o u.
.
Jinin
情 業 人 民 >1 2

1'4124 39伺

J
4
7
3
2
J

令

i436i

『宮

ι
込

Z
5
6
!51

,
制

3239 i
3391j4201 "943: 4

2人

162

今
一
ー
ー
"
' 559' 232' 84
い
伺
1

39人

j合 針

10
人

。
! ふ汁 3913

6

会

}

29

oi

0

6

3:

0' 29
日

o j 1035

13459

4人

、

5.)

6人

不詳
合 室f

表 ト2
:I
な帯数分布
Sct‑di
.
Ji
nin(世 帯 人 員 〉

壬雪量骨

人
2

制691

2A

50138

3人

o

。
。
。

a
込λ

、

5‑"
6人

考ミ量芋

市)6

・・

61294. 66299.2
乏740!担 13

田

64 I 0 i

1

515231 648681296唱6! 6801 ,
23361 441 l 0
1591宮

。
! 485
。 o!
。i

7関 川mι1137I

七 回 5!

O~

期

i

。

1354

422

01
0

会05723

o i 44041
o t 10唱67

0

01

727; 401 ;170

《
。
2
目

571
1C
時
15120

33:495464

5; 132
崎 市 開 916
布 団 1 7
1回 目 12i1197i問
'

.
g
‑ff

0

。

,0

51

4:
216! 3
!
519j 1761

3871195

田 明

49

76

01'
219742

官官自

表 1
‑
3
:I
り:帯数分イl
i (IO}j分比)
S e拍 i
.
.
Ji
nin(世 帯 人 員 〉

273
16
10
355

合計

23379 i26643 31455 13ι>
36.34臼

85 I 39
包

01

i0I。

10ι

01

0'

147: 81

34 ;

1131241

41

22表の再現
第 2表 支 出 ( 消 費 支 出 及 び 1
0大賞'円)をi'i‑現するために作成し/こ SASブログラムをフ。ログラム 2に示す.

r
i数及び UiJ1F数分イ1については,表 11 及び表 12 における世帯人以 4人の列と一致するため,
なお,集計[lJ:f
プログラムは矧愛したー千十六'1';:円の結決はマクロ EXPENSE を作成し

N~見結果:を得た.プログラム 2 によ

って得られる結果を表 2に 示 す . こ れ ら の 表 ば , 独 立 行 政 法 人 統 計 セ ン タ ー に よ っ て 作 成 さ れ た 集 計 結 果
を再現していることを確認した.

*世帯人民 4人,布業人民 l人または 2人の結果;

*マクロ EXPENSE;
*VAR: 大貨同の変数名

OUT・結果データセット名司

509

o
d
sO
U
t
p
l
l
ts
l
l
l
l
l
l
l
l
a
r
y
=
t
a
b
l
e
0
4
;

495.
[beta]
LABEL:OUTにおける大費目の変数ラベル;

p
r
o
cmeansd
a
t
a
=
d
a
t
anmean;
i
g
h
tw
e
i
g
h
t
;
v
a
r&var;時 e

%
I
l
lacroexpense(var,
o
u
t,
l
a
b
e
l
)
;

l,
2
)
;
wheres
e
t
a
i
j
i
n
i
n
=
4ands
h
u
u
g
y
o
u
j
i
n
i
ni
n(

*==================二===================二=ニキ.
a
t
at
a
b
l
e
0
4
;
s
e
tt
a
b
l
e
0
4
;
, d
d
a
t
a
n
u
l
l
l
=
4
;s
h
u
u
g
y
o
u
j
i
n
i
n
=
9
9
9
;

o
d
sO
l
l
t
p
U
tsummary
=tableO1
;

.̲N;
keepdatanums
h
u
u
g
y
o
u
j
i
n
i
n&var.̲Mean&var

nHu

︐
.
r

*総数;

a
t
anmcan;
p
r
o
cmeansd
a
t
aニ d

キ==============ニ==========ニ============キ.
,

v
a
r&var;weightw
e
i
g
h
t
;
d
a
t
at
a
b
l
e
O1
;
s
c
tt
a
b
l
e
O1
;

*ある大費目に対する結果;

d
a
t
a
n
l
l
m
=
l
;keepd
a
t
a
n
l
l
l
l
l&var.̲Mean&va.
r
̲N;

HU

nu

︐
.l

d
a
t
a&
O
l
l
t
;

. Mean="&labcl";
s
e
tt
a
b
l
c
Ol
‑
t
a
b
l
c
0
4
;l
a
b
c
l&var

キ==================================ニ=ニニニ士三*.
,

&va.
r̲Mean=round(&var.̲Mean,
1
e
‑
O
)
;
1

u
r

*世帯人員 4人;
odso
u
t
p
u
ts
l
l
m
m
a
r
y
=
t
a
b
l
e
0
2
;

*=========ニニ‑‑‑‑ニ=ニ=====ニ=二============*
.
,

p
r
o
cmeansd
a
t
a
=
d
a
t
anmean;

%mend;

*========================‑‑==============ニ二*,

ニ4
;
v
a
r&var;w
e
i
g
h
tw
e
i
g
h
t
;wheres
e
t
a
i
j
i
n
i
n

d
a
t
at
a
b
l
e
0
2
;
s
e
tt
a
b
l
e
0
2
;

*各大~~,目に対してマクロを実行;

d
a
t
a
n
u
l
l
l
=
2
;keepdatanum&var.̲Mean&var.̲N;

%以 pense(youto037,
d
a
t
a
O1
,消費支出);

r
u
n
;

%expensc(youto038,
d
a
t
a
0
2,食料);

キ
一
一

一一一一一一一一一一一一

一*, %expense(yollto079,
d
a
t
a
0
3,住居);

odso
u
t
p
u
ts
l
l
l
l
l
l
l
l
a
r
y
=
t
a
b
l
e
0
3
;

%expense(youto089,
d
a
t
a
0
5,家具・家事用品);

=活

%以 pense(yollto099,
d
a
t
a
0
6,被服及び履物);
%以 p
e
n
s
e
(
y
o
l
l
t
o1
1
7,
d
a
t
a
0
7,保健医療);

AU

%expcnse(youto1
22,
d
a
t
a
0
8,交通・通信);

寸

hH

︐
.
一
一
1

11

luN
伽ぬ叫

内

PL‑ul‑
ρル

VHW

川町
u
1 5h

i

︑
r

VA

m山

n
v

1 1 l︐
nu ・H H H H 叶
HHdq
︐
.19 ul. t
MO
芯
nVJ5
10bE
IU
汀

%expensc(youto084,
d
a
t
a
0
4,光熱・水道);

stuN
ド
・
G
︑
z
v
u
︑
︑
冗&叶︼
r 汀 .
m

*l
U
:帯人員 4人,有業人員ごとの結果;

d
a
t
at
a
b
l
e
0
3
;
s
c
tt
a
b
l
e
0
3
;

%expcnsc(youto1
2
9,
d
a
t
a
0
9,教育);

datanum=3;

%expensc(youto1
33,
d
a
t
a
O1
0,教養娯楽);

n
i
n&va.
r Mean&va.
r̲N;
keepdatanumshuugyo吋i

%
e
x
p
c
n
s
c
(
y
o
l
l
t
o1
4
2,
d
a
t
a
O1
1,その他の消費支出);

t

︐
n
表 2:支出(消費支出及び 1
0大費目)
l
川i
f数
分布

総数

止
'
rli人 民 :4人
l
有業人員

l
人
2人

l

住
f
.
l
i

光熱・家具・被服及び
交辿・
その他の
保健医療
音
水 ; 古 家 事I
I
I品 同 物
通f
z 教 育 教 養 娯 事 消費支出
9
,
2
0
4
1
生1
3
8
1
1.
366 47,
9
6
1 2
2,
2
7
0
3
1
.
3
刑
8
2 3

3
2,
0
ヨ
7 4
9
5
,
4
6
5

3
2
8,
1
4
0 7
1,
8
8
3 1
7
,
6
8
7 1
9
,
2
3
8

1
5
5
,
8
5
0

3
3
5.
4
3
8 7
6
,
3
6
2 1
5
.
3
4
5 2
0
,
2
1
4

9
.
9
4
4

1
,
0
3
1
3
2
4
お
2
5
6

1
5,
6
1
5
4,
8
5
1
4,
引
2l
凶
6

3
8
0
,
5
2
1 8
3,
7
9
6 1
2,
5
8
3 2
3,
0
4
5
3
9
9
川辺 ,
お083 1札5 22バ拘
3
7
乃9
.
8
8
2 む
8
2
,
1
η
3
4 2
4
コ
,
2% 2
2
.
2
3
8

∞

1
4
.
45
2

1
0
.
9
8
7

4
7,
8
9
4 3
3
判
,2

3
2
.
2
6
9

7
5,
5
附

・

I

1
0
.
2
7
6
1
1
.
7
6
3
7

1
6
.
56
1
1
4
.
0
9
6

1
0
̲
'
3
1
1
0
,
8
1
2

5
2,
4
0
6 2
2,
5
1
3
5
1,
3
1
0 4.
50
9

2
7
,
8
5
2
3
2,
7
刑

1
2
1,
凶
〕
l
柑.
6
2
8

同 機 盤 機 嫌 織 機 j機 I緋 : 鵬I盤 機I鱗.鵬、 E

I
人また{は
立

2人

∞

8
,
8
8
5

!酬附州清戦樹海材料削除刷除去桝桝‑=::lI9l州;主
3
語版‑.ri!I糾
川~係長
崎‑昔前説
油叫が
繍匠晶子ん
繍剛院
治 機 ‑ 燦1
干
潮員約
鴻
制
限
5
l
I
た 1

3人
4人
イ、詳

消費支出食料

[単位:円]

c

510

496.

擬似ミクロデータによる国内旅行費支出と世帯情報の関連の検討 0魚 住 龍 史 東京理科大学大学院工学研究科経営工学専攻 I n v c s t i g a t i o nf o rt h巴 r 巴l a t i o n s h i pb巴tw巴巴 nt h巴巴 xp巴I1S巴 f o rdomcstict r a v巴l andt h巴 dcmographicc h a r a c t c r i s t i cr c g a r d i n ghouseholdsu s i n gpseudomicrod a t a R y u j iUozumi D e p a r / n 悶 1 /o fManagemen/S c i e n c e ,G r a d l l a / eS c h o o lofE n g i n e e r i n 要旨 旅行・観光市場は位界的にみて成長性の高い産業であり,波及効果の裾野の広い産業である.本稿では, J 疑似ミクロデータを用いて,国内旅行自'と t l :帯情報の関連を検討した. キーワード:擬似ミクロデータ,国内旅行費,消費活動,世,出:情報, GLMSELECTプロシジャ, GCHART プロシジャ, SGPLOTプロシジャ,相関分析 1 はじめに 旅行・観光市場は W :界的にみて成長 t l :の r : " I Jし、産業であり,波及効果の裾野の広い産業である.観光 1 1'にお いて,旅行・観光産業の経済効果に以付一る調査研究が定期的に実施されている この調査は,日本の旅行・ 観光における消費実態を I Y lらかにし,旅行・観光施策の基礎資料のために活用することを目的として実施され ている 2 0 1 0年の調査によると,国内旅行消費は 2 3 . S兆円であり,これは世界で見てもアメリカの 5 8 . 1兆 円に次いで 2番目に大きい.さらに,同内旅行消費が H本経済へ及ぼす影響としても,雇用創出効果は 424 万人といわれており,対全国就業者数の 6.6%であると械情されている [ I J 本稿では,平成 1 6年余同消費実態調会:の個票データに基づいて作成された擬似ミクロデータを用いて,国 内旅行費支出と世帯情報の関連を検討寸ることを目的とする また,その他の家主│簿における収入・支出デ ータを用いて,園内旅行費との関連を検討する.なお,本稿で用いる擬似ミクロデータは,平成 1 6年全国消 2, 0 2 7 費実態調査の個票データに基づき,独立行政法人統計センターによって作成された.データとしては, 3 n, 183変数, CSV形式のファイルである.さらに,本データには集計用乗率が含まれており,乗率を重み とすると 4 9 5, 4 6 5件のデータとなる.本データを SASにインボートした上で,検討を行う. 2 国内旅行費支出と世帯情報の関連の検討 本稿では,園内旅行費に焦点を当てる. i E E似ミクロデータにおいて,国内旅行費は消費支出における大分 類「教養娯楽j,中分類「教養娯楽サービス」に含まれる変数である. 511

497.
[beta]
まず,擬似ミクロデータにおいて,国内旅行費に影響を及ぼす可能性のある世帯情報として,年齢カテゴ
リ,世帯人員,有業人員,就業の有無,企業区分,企業規模,産業カテゴリ,職業カテゴリが挙げられる.
これらを説明変数として, GLMSELECTプロシジャにより変数選択を行った.なお,国内旅行費は,支出し
ていない世帯については 0となるため,対数変換後の変数を目的変数として川いた.変数選択は STEPWISE
法を採用し, SchwarzBayesiani
n
f
o
r
m
a
t
i
o
nC
r
i
l
e
r
i
a に基づき実施した.結果,年齢カテゴリ,世一帯人員,企業
規模,職業カテゴリが選択された.以下,これらの要因が国内旅行費にどのように影響を及ぼすか検討する.

2
.
1 年齢による影響
各年齢における 1
0大費目の支出割合を図 1
‑
1,各年齢における同内旅行費の支出額(円)を図 1
‑
2に示す.
‑
2における支出額は乗率による重み付き平均を示している.また,年齢不詳のカテゴリの結果は含めな
悶 1
‑
2は SGPLOTプロシジャを用いて作成した.
‑
1は GCHARTプロシジャ, 図 1
かった. なお, 図 1

ふげ川パけは凶鶴川けず欄鵠盟麗顕和

~:鑓思

山内討議畿ハ議輔植田富む

HEZE

_t :::O~の..It.._~

蜘側︑ババパパ副総円以雛鑓櫨橿盟お

μ

,・ m・

州側

.周忌お里

仰向︑一一一以綴畿遊離雛麗瞳盟公

諸外山階級鱗灘間以州議鶴舗里例
制
制
パ
一
一
一
一
五
一
一
一
‑
一
川
勝
槻
閣
内 欝一蹴闇臨む

m

MN溺額一川口一翻騨酒z
盛
州パパ⁝⁝謬璽減額鰯輯瞳醸臨む
z

混入い¥関一幽盟問一一寸縄脳髄臨臨臨臨

‑

m門川額欄関口謝鵬融醐翻臨む

引

品川け一瞬間岡山ハいい織鱒輔臨瞳瞳瞳お

品役纏用語︑議髄盟醸盤E
E

崎 日 時 間

60<~

40
曲

""EZ

6
αl
O

∞

8
0

'側lOO

口氏加。

図 1
‑
2 各年齢における国内旅行費の支出額(円)

図1
‑
1:各年齢における 1
0大費目の支出割合

図 1
‑
1より,例えば,消費支出に占める住居の割合に注目すると,年齢とともに支出は減少している. しか
し,今回焦点を当てる国内旅行費が含まれている教養娯楽に着目すると,年齢が変化しでも横ばいとなって
・
2より,園内旅行授は年齢と
いる.そこで,各年齢における国内旅行費の支出額のグラフを見てみる.図 1

i
市が 5
0歳より前九、と,国内旅行費は顕著に高くなっている.ま
ともに増加していることが分かる.特に,年l
た,図 1
‑
1において,消脅支出に占める教育の割合が低い年l
i
治では,図 1
‑
2における国内旅行脅が高くなって
いる.すなわち,子供の授業料,教科書・学習参考教材,補習教育による教育費が多い年齢の 1
1
1
:帯において
は
, 国内旅行費に支出できる割合が低くなってしまうと考えられる.

2
.
2 世帯人員による影響
各世帯人員における 1
0大費目の支出割合を│元1
2
‑
1,各 t
!1:帯人員における悶内旅行費の支出額を附 2
‑
2に示
‑
1 より,国内旅行費が含まれている教養娯楽について,世帯人員数 i
こ依らず支出割合は横ばいとな
す.図 2

1
帯から 8人 [
l
t帯においては,消費支出;こ占める教育の割合が
っている. しかし,教育に注目すると, 4人日:
高くなっている.

5
1
2

498.
[beta]
8

日畑出盤(議棚盟国国

別担額灘何一一議関謹

7

Eh

4

2

醸盤置

mh]賄 側 蹴 町 一 m

品川一繍翻叫:ベ鹸闘困

ミペ鱗蹴轍 蝉
CJ 灘 盤 置

i

叫33141

問山

m 醤
三蝿輔副E3
品
川
額
一
一
一
一
一
一
一
十
一
議
離
瞳

N=

‑
7
C
‑
‑
‑
^
,十三7 マ
ブ1
N
,
I …三三一二三 fゴ

里
!

月O

FE

園田

園醐醐

間四四

'

温調

支

s

.
.
可
"
・
・
・
・
.
.
.
'
"
・
a
.
・r
.

1
0
0
0

司

図2
‑
1 各│止帯人員における 1
0大費目の支出方[j合

この背景として

N
"
'
‑
g
1

円

10

叉d.d宮

総魁

2
"
'
"

rー

3俣1
0

邸
'
"

4

一一ーす

も餓'"

.000

図2
‑
2:各世帯人員における国内旅行費の支出額(円)

:*であることが考えられる.その結果, 子 供
[止帯人数が多いことによって,子供がし、る W

のほ業料,教科書・学習参考教材,補習教育による教育費の市める割合が [i..f
Jくなったと考えられる.次に

r
'

図2
‑
2より, 2人世帯におし、て, 国内パック旅行y の支出額{立高くなっている. ここで, 図 2
‑
1 において, 2
人世帯では教育に占める割合が低いことが分泊、る.消費支出に占める教育の割合の低い 2人位帯においては,
囲内旅行費に支出できる }
i
[
j合がおくなったと考えられる

2
.
3企 業 規 模 ・ 職 業 に よ る 影 響
各企業規模における悶内旅行貨の支出額を j
g
:
l3
・1
,各職業における国内旅行貨の支出額を図 3
‑
2に示す.

、

t"
'
̲
(
=
4

需用労務作業者

!
J
(
=
、
=
29
血肉及び日々足労孫作建省

z
g

相

2

離

〆ヰ持

種

制

民間副長

5
0
0
<
=
.(
:
9
9
9

首公職員

咽指令

邸
'
"

1

2
0
0
0

3
α
'
"

邸
'
"

4

図3
‑
1 各イI
、 業規伎における同内旅行者の支出稼i(
l
J
J
)

図3
‑
2:各職業における同内旅行貨の支出額(円)

図3
‑
1より, 合業規模が大きくなるほど旅行授の支出額:立高くなっている. これは, 企業規模が小さい企業
においては,国内旅行中の仕事の代舟二ができなし、等のことが起因していると考えられる.また, l
i
1
3
‑
2より,
官公務員, 民間峨只, 臨時及び!‑I々雇労務作業省,常用労務作業者の/1民に, 同内旅行費の支出棋はおくなっ
ている.

513

499.
[beta]
2.4財産売却収入額と圏内旅行費支出額との相関
家計簿の収入・支出データにおいて,国内旅行費と関連のある因子を探索するため,その他の収入・支出
と国内旅行費について相関分析を行った.結果,財産売却収入額と同内旅行費支出額の聞に正の相関が見ら
1
,図 4‑2に,対数変換前後の財産売却収入・園内旅行費について散布図 (N= 1
0
) を示した.財
れた.図 4・
Iり当てる支出額が高くなる傾向にあった.ただし,財産売去1
産売却による収入が多いほど,国内旅行費に害J

収入のある世帯は限られていたため,少数のサンプルから得られた結果であることに留意する.
c
1
2
.
'

10‑

ε︑

阻宮廷︒

。
。

岨

!
c

、

c
l
!
i ・

。
。

'
0
0
0
0

。

、
;

v

Eeo

4似XIO

&IX刷

。

sαm

c

2

α
ElOOI)

"

酎1
1亮 甜

図4
‑
1:財産完封i
収入ー園内旅行費の散布図

100

"
'

~J(嗣直売却}

1
1
.
0

,
,
'

図 4‑2:財産売却収入ー園内旅行費の散布図(対数)

3 まとめ
本稿では,国内旅行費に影響を与える世帯の特徴を表す要因として,年齢,位帯人員,企業規模,職業が
どのように影響を与えるか検討を行った.結果,園内旅行費は年齢とともに増加し, 2人世帯ほど国内旅行
発への支出額が高いことが分かった. これらは,子供の教育費の占める割合が低い世帯であることが影響し
ていることが考えられ,結果,国内旅行費へ割り当てることのできる割合が高くなったと考えられる.年1
(
伶
が高い世帯ほど圏内旅行費の支出が高い結果となったが,この点については,高齢者でも安心して旅行がで

0歳以上を対象としたシニア割引など,各旅
きるバリアフリーツアー,高齢者を対象とした人に優しい宿, 6
行会社が高齢者向けのサービスを提供している状況である 1
'
‑
4
1 また,イI':業規模が大きくなるほど国内旅行
貫'の支出額は高くなり,職業としては,官公務員,民間職員,臨時及び ~I 々雇労務作業者,常 HJ 労務作業者

の順に国内旅行費の支出制は高かった

加えて,財産売却収入額と国内旅行費支出額の聞に正の相聞があっ

た. ただし, この相関は, 少数のサンプルから得られた結果で、あった.

参考文献
[
1
] 観光庁.旅行・観光産業の経済効果に関する調査研究 (2010年版).
h
t
t
D
s
:
/
/
w
w
w
.
m
l
it
.!
!
.
o
i
.o/common/000220421.odf.2013/05/28アクセス.
[
2
]JTB. バリアフリー特集 .
1
1t
t
O
:
/
/
dOI
l
l
.i
t
b
.
c
o
.i
o
/
v
a
d
o
/
th
e
m
c
l
b
a
r
r
ie
r
t
r
c
e
/
.2013/05/28アクセス.
[
3
]H.I
.S
. バリアフリーの旅 .
1
l
t
l
o
:
/
/
w
w
w
.
h
i
s
‑
b
a
r
r
i
e
r
f
r
e
e
.
c
ol
1
l
!
.2
0
1
3
/
0
5
/
2
8アクセス
[
4
] 楽天トラベル.人に催しい街 1t
t
n:
l
I
t
r
av
eI
.
r
a
k
u
t
e
n
.
c
o
.i
n
/
s
n
e
c
i
aI
!
v
a
s
a
s
hi
i
1
.2013/05/28アクセス.

514

500.
[beta]
世帯主の就業状況が貯蓄性保険需要に与える影響についての考察

i
t
lHurdleモ デ ル 推 定
擬似ミクロデータを用いたおb
テルモ株式会社臨床開発部

宇野慧

[自由課題]
[規定課題]

《1.導入と分析の目標》

7つ の シ ー ト を SET文で縦結合し、 1
0万 人 比 の 重

世帯は様々なリスクに直面しており、それをへツ

み付け変数を W
eight2ニWeightl4.95465で定義し、

ジするために多様な保険商品が存在している。世帯

さ ら に 就 業 人 員 が l人 及 び 2人 の 世 帯 の ダ ミ ー 変 数

の中でのリスクとして影響が入ーきいのは、死亡・傷

(ShuugyouJinin1
2
)を 作 成 し た 。 ま た 、 十 大 支 出 項

病等によって所得が途絶する/支出が増大するリス

目に関しては各区分(世帯人員、就業人員)の調整済世

ク 、 天 災 等 に よ っ て 資 産 を 喪 失 す る リ ス ク の 2つ で

帯 数 分 布 で 重 み 付 け し た 変 数 を 作 成 し た l。 こ の デ ー

あり、それぞれ生命保険(医療保険含む)と損害保険

タセットに下記のコマンドを実行することで、規定

(火災保険を含む)などが対応する保検商品となる

課 題 通 り の 結 果 を 得 たc

これらの保険商♂:への加入行動は、各世帯が抱える

111 Rの集長 i
世f
i
?数"/
proct
a
b
u
l
a
t
em
i
s
s
i
n
g
;
c
l
a
s
sShuugyouJininS
e
t
a
i
J
i
n
i
n
;
t
a
b
l
e
sa
l
lShuugyouJinin,a
l
lS
e
t
a
i
J
i
n
i
n/MISSTEXT='O
・
;
r
u
n
;

リスクの大ノト、およびリスク選好度合いと絡援に関

1
・
1
‑
2表の主み十 t
iナ
集計ill:帯数v
proct
a
b
u
l
a
t
em
i
s
s
i
n
g
;
c
l
a
s
sShuugyouJininS
e
t
a
i
J
i
n
i
n
;v
a
rWeight;
t
a
b
l
e
sa
l
l Weight (SUM咋 =
6
.
)ShuugyouJinin"
Weight"(SUM乍 =
6
.
),a
l
lS
e
t
a
i
J
i
n
i
n/MISSTEXT
ゴO
'
;
r
u
n
;
合

/汁 ‑
3去の

0
'

}に 関 し て 、 世 帯 属 性
連 す る 。 本 稿 で は 保 険 加 入 行 進J

の中での重要な指様である就業状況の影響を考察す
こ及ぼす影響
る 九 世 帯 の 就 業 状 況 が 保 険 料 支 払 い 額l

)。
と し て 、 以 下 の 2つの経路を想定する(図 1

金

(
医11 保検事│支払傾への影響の経路)

‑
i
nみ付け集計世帯数v

p
r
o
ct
a
b
u
l
a
t
em
i
s
s
i
n
g
;
c
l
a
s
sShuugyouJininS
e
t
a
i
J
i
n
i
n
; varWeight2;
t
a
b
l
e
s a
l
l Weight2 (SUMキ =
6
.
)ShuugyouJinin
Weight2 (SUM中 =
6
.
),a
l
lSetai
Ji
n
i
n/MISSTEXT='O';run;

・

金

会

合

1"2去の支出(消 '
1
'支出及び十大 f
i
:
肘
)
・l
f全体の集計千
p
r
o
ct
a
b
u
l
a
t
e
;
c
l
a
s
sS
e
t
a
i
J
i
n
i
nShuugyouJininShuugyouJinin1
2
;
varYouto037www
e
i
g
h
t
;
t
a
b
l
e
sa
l
lweight"(SUM"F=6.)Youto037ww
吋SUM)
'
;
r
u
n
;
/MISSTEXTゴO

r世帯人員 4人・就業人員 1人世帯1
の集計表 "
1
'
p
r
o
ct
a
b
u
l
a
t
e
;
c
l
a
s
sS
e
t
a
i
J
i
n
i
nShuugyouJininShuugyouJinin12;
v
a
rYouto037ww1w
e
i
g
h
t
;
whereS
e
t
a
i
J
i
n
i
n
=
4andShuugyouJinin=1
;
t
a
b
l
e
sa
l
lweight"(SUM"F=6.)Youto037ww1 (SUM)
/MISSTEXTゴ0・
;
r
u
n
;
会

[経路①]所得のリスク=キ保険需要
所得のリスクが良川、(低い)ほど、保険需要が高く
(低く)なり、保険料の支払額が大きく(ノj
、さく)なる

l 伊l
え
:
王
、 4人l
止?!?でかつ就業人員が 1人の世指守で{士、 f
凋怒済み
i
l
l
:
指
数
:
"
i66299世"
t
tであることから、
Youto037w=Youto037w
e
i
g
h
t
;
Youto037ww1=Youto037w/66299;

[経路②]潜在的な家計のリスク選好=キ保険需要
世帯がリスク回避的(受容的)な場合には、保険需

合

とする,{也の区分;二郎しても問慌の方法で乗数を湖較すれば良いe
2 すなわち、各観測 f
i
i
'
(を区一分の度数に合わせて者 J
Iった怖を足し合
わせて平均値を訂 X~ している。この他の支出項日に i刻しでも同保

である c
九就業人 F
!が 2人の世 f
、
丹 l人もしくは 2人の位帯に!刻しても、
同機の方法で結果を得ることが出来る。

U
t需が抱えるリスクには惚欽の径績があり、それ
t
i
f
以ミクロデータで
ぞれに対応する保険の性質も異なる しかし j
̲
] されているため、本稿で
はこれらの保険への支出が 括しご言 J
は位指のリスクに関して 括したものとして取り扱ったc
5 本有"で検討している保i
換の商品区分は、生命保険、 I
i
i
i易保l
換
、
J
十者性の保険である
取立型火災保険など、 t
4 当然ながら、

E

F

515

501.

要が i 告i く(低く)なり、保険料の支払額が大きく(小さ く)なる 持家 )で 、 持家世帯 (Shoyuuが 1もしくは 2 戸建住宅 かつ戸建住宅に居住している世帯 世帯のリスク選好はー般に観察不可能であるが、 ダ ミ ( Ta t e k a t a = l ) 職業選択に反映されている可能性がある。すなわち 持家 持家世帯で (Shoyuuが 1もしくは 2 ) リスク回避(受容)的な世帯ほど、所得が安定(不安定) 共同住宅 で、かつ共同住宅に居住している世 的な職業を選択すると考えることが出来る。以上か ダミー 帯(Tatekata=2,3,4,5,6 ) ら世帯の保険加入行動は、就業状況を通じて経路① と経路②の影響が相反して発現する可能性がある ー → 世帯主年代 (Sl̲Age)を各 10歳刻み 年代ダミー G 本稿では擬似ミクロデータをもとに、世帯主の就 ( 6 0歳以上は 1区分)にし、各年代で ダミ + 変数を作成 業状況が貯蓄性保険料支払額に与える影響を後述の 就業 就業人員 (ShuugyouJinin)が 1名 、2 T o b i t/Hurdleモデ、ルで・推定し、就業状況が世帯のリ 人員数 名以上の世帯を 1区分とするダミー スク選好・所得リスクの両国から保険需要に影響す ダミー 変数をそれぞれ作成 る可能性について考察した。今回のデータでは就業 非就業 世帯人員ー就業人員を非就業人員と 属性を表す指標として、企業区分、企業規模、産業 人員数 、 1名 、 2名以上の して定義し、 0名 区分の 3変数があるが、産業区分は不詳データが多 ダ ミ 各区分のダミー変数を作成 + + いため、企業区分と企業規模から大企業/公務員の 2 つのダミー変数を作成した(比較基準は中小企一業)。 住宅ローンは、倒壊・焼失の際に 2重のローンを 背負う点などからプラスの影響があると考えられる。 《 I l , デ ー タ セ ッ ト の 解 説 " 方 ロ ー ン 完 済 世 帯 で は 、 2 重ローンのリスクが無 今回の分析に用いた変数の名称、定義、及び保険 く保険需要がマイナスになると考えられる。住宅特 料支払額に与える影響の予想は以ドの通りである。 性は、特に戸建住宅で倒壊・焼失リスクが高い木造 ( 表 1 分析データの概要一覧表) 住宅が多く、プラスに影響すると考えられる。 変数の定義 変数名 保険料 Youto174を 1000円単位に変換 予想 / 支払額 経常収入 ( 同 2:保険料支払額の度数分布岡 Youto004を 1000円単位に変換 + Youto178を 1000円単位に変換 + 支払額 • . .︐ ︑ s ' ‑Aesz 住宅ローン 《I I I, 記 述 統 計 量 お よ び 分 析 の 概 要 》 持家世帯 (Shoyuuが 1もしくは 2 )で 、 住宅ローン 完済ダミー かつ住宅口 ン支払額がゼロの場 t" 合 1を取るダミー変数 大企業 K i g y o u K i b oが 4,5の場合 1を取る ダミー ダミ変数(つまり、 500人以上) 公務員 KigyouKubunが 3の場合に 1を取る ダミー ダミ 女性ダミー ー → ー → 変数(つまり、公務員) S lSexが 2の場合に 1を取るダミ ー → 変数 516 単位:1000円)

502.
[beta]
(
表 2 保険料支払額の基本統計 !
1
1
; 単位: 1000円)

性を仮定した Hurdleモテツレを考える。今回は量的選

中小企業 大企業
公務員
6658
6999
32027 15607
0
.
0
0
0
.
0
0
0
.
0
0
0
.
0
0
1
8
.
5
3
1
3
.
3
6
2
4
.
2
9
1
5
.
8
2
2
5
.
2
9
3
0
.
2
4
3
8
.
5
4
2
8
.
5
2
5
6
.
3
1
4
1
.
5
4
4
5
.
3
3
4
5
.
5
7
4
0
.
7
9 7
0
7
.
0
2 1
0
0
8
.
6
0
1
0
2
0
.
3
5 8
3
1
.
8
3
3
5
.
2
9
4
4
.
5
9
3
4
.
8
5
3
2
.
1
7
3
0
.
6
1
2
8
.
2
2
3
3
.
8
8

Jし、る以下の 2
択の部分で正規分布・対数正規分布を H

全体

世帯数
最小値
第1
四分位
中央値
第 3四 分 位
最大値
平士句値
標準偏差

つのモデルを考える。
[HurdleC
iE規)モデル:③式]

f
(州民) = {1-φ(Xi~i)} 刈 i
l
[
y

φ
(X(i') ¥ d !
l
i‑ x
;ai11
[
山 j
)
9
(一一一)}
φ(乎)xσ

x
{(

[Hurdle(対数正規)モデル

④式]

.
f
(
l
J
i
!
X
i
) = {
1ー φ
(
X
i
;
)】
}ω
i
=
tヰ
φ
(ぉ γ
)¥~/log( め) ‑X
is¥)1
[
仙 りj

上の図表は保険料支払額の度数分布図(上段:中小
企業、中段・大企業、下段:公務員

占

※右端 10万円)、

x{(ττ7)ゆ( σ )
}

および基本統計量の表である。中小企業では下限値
であるゼロに値が集中していることが分かる。また

両モテ、ル共通の特徴として、尤度式は 1本である

中央値・平均値共に、保険料支払額は公務員>大企

が
、 2 つの選択の独立性を仮定している。そのため

、企業となる。
業>中ノj

>Oの
両モデ、ルとも?をプロピットモデルで 推定し、 y

保険需要では、負 t
官も取りうる潜在需要 (
yつが想定

(
y
>
O
)の条
サブサンプルについて、正規モデルでは P

.を支
出来る。つまり、怪我をした場合に通常額以 1

件付分布に対する最尤法、対数正規モデ、ルで、は対数

払 い 、 逆 に 平H
寺は保険料相当額を受け取るような負

正規分布に対する最止法から、それぞれ最尤推定量

の保険需要が考えられる。しかし、このような潜在

s、a)が求まる(詳細は Wooldridge(2010)等参照)。
(

…
…

需要を満たす保険商品は存在せず、実際の保険料の
支 払 額(
y
)はゼロが下 l
理値となる。これをモデ ルで、記

《

I
V
.推 定 結 果 お よ び 解 釈 》

述すると以ドのようになる(①式)
c

上述の 3つのモデルについて、表 1の全変数を組

xト川川…~,
叫州
γ引V叩(伊O

み 込 ん で 推 定 し 、 主 要 変 数 の み 3の 推 定 値 、 襟 準 誤

(M = x

グ=山以(刊0
,
〆
)

~と p f
直を記載した(表 3
)。

(
表3
:3モテマルの惟定結果

このような打ち切りデータの推定を行う統計手法
として、 Tobitモデル(タイプ 1T
o
b
i
t
)や
、 Tobitモ デ

変数名

ルの制約を緩和した Hurdleモデルが知られている。

大企業
ダミー

Tobitモデルで、は yの条件付き密度関数を、標準 I
E規

分布の累積分布関数φ、密度関数 φ、インディケータ
関数 1
[
'
]を用し、て以下のように構成する(②式)。これ
に最尤法を適用することで Tobit 最尤推定量:
(
s、δ)
が求まる。

x
.
;
i
3¥
¥
I[Yi~'1 ̲
̲.
,f 1¥,
L
li
l
i‑ x
J
!¥¥l[加え)j

f(
I
.
J
;I
x
lー φ(7)}
i) ={

×{
(
z
)
φ
(.'1'

(
1
"
一
)
}

Tobitモデルでは、保険加入の 2値選択と支払額の

量的選択を同ーのパラメータによって推定・している。
このため、例えば高鈴になる程リスクが高まり加入
の確率は上昇する一方で、期待余命は短くなるため
支払額は低下寸る、といったケースは考察できない。
そこで、 Tobitモデルの制約を緩め、各選択問の独立

517

公務員
ダミー
住宅ロン
完済ダミー

持家
戸建住宅
ダミ
持家
共同住宅
ダミー
観察数
切断観察数
対数尤度

T
o
b
i
t

各 段 推 定 値 パS
.
E
lIp値 )
H
u
r
d
l
e
H
u
r
d
l
e
(正規)
(対数正規)
‑3.0827
‑0.0059
(
0
.
3
5
9
6
)
(
0
.
0
0
8
7
)
<.0001
0.
4947
5.7111
0.2090
(
0
.
3
5
0
4
)
(
0
.
0
0
8
8
)
<.0001
<.0001
9.2394
0.0825
(
0
.
5
3
1
2
)
(
0
.
0
1
3
1
)
<.0001
<.0001
0.3542
0.2286
(
0
.
5
6
6
5
)
(
0
.
0
1
2
6
)
0.5319
<.0001
10.
4753
‑0.0462
(
1
.
1
3
1
7
)
(
0
.
0
2
5
5
)
<.0001
0.0708
20269
20269

‑2.8894
(
0
.
3
0
6
8
)
<.0001
4.9292
(
0
.
3
1
0
9
)
<.0001
8.0971
(
0.
4638)
〈ー 0
001
‑1.5312
(
0.
4463)
0.0006
‑10.0122
(
0
.
9
0
3
)
<.0001
20393
124
ぺ53882.9 ‑152951.7

r

r

句

‑77773.1

503.
[beta]
就業属性に注目すると、基本統計量の場合と比較

の影響経路の比重が異なる可能性が示唆された。

して、公務員に関してはプラス 12500円=キプラス約

今回のデータでは預貯金額を始め、いくつかの重

5000円と差が縮小したものの、依然として高水準で・

要な世帯属性が欠落していることもあり、想定と異

ある。以上から、公務員世帯では、所得の確実度合

なる結果が出た要因も存在した。しかしながら、分

いに関する影響(経路①)よりも、元来の家計のリスク

析の主眼に置いた就業状況の影響として、特に公務

回避志向(経路②)の影響が大きいことが示唆された。

員世帯の保険需要特性については頑健な結果が得ら

一 方 で 、 大 企 業 で は プ ラ ス 3500 [
11
司マイナス約

れたと言える。

3000 円と符号が逆転しており、

経路①の方が勝る
《V
1.プログラムの角転免》

と考えられるが、対数正規分布モデルでは有意とな
らなかった。以上から、大企業と中小企業問では影

本稿の分析は NLMIXED プロセジャで実施した。

響の経路にそれほど違いが無い可能性がある一方で、

各モデル推定についてのプログラムの概要は以下の

公務員世帯の需要特性については頑健な結果が得ら

通りである。

れたと言える。その他の変数についてもまとめると、

[Tobitモデル]

以下の表 4のようになる。

PROCNLMIXEDTECH=NEWRAP6
;
PARMSb
O‑b
1
4s
i
g
m
a勺 BOUNDSs
i
g
m
a>0
;
n
;
x
b
e
t
a
=
b
O
+
b
l*
D
a
i
k
i
g
Y
O
l
l
+ ー+b
1
4NoLoa
IFYoutol74m=0t
h
e
n
mob=1
・C
D
F
(
'
N
O
R
M
A
L
'
.
O
.
x
b
e
t
a
.
s
i
"
m
a
)
;
EL
室主
m'ob=PDF('NORMAL'.Youto174m.x
b
e
t
a
.
s
i
"
m
a
)
/
s
i
"
m
a
:
l
o
g
l
i
k
e=
L
O
G
(
p
r
o
b
)
;
MODELYouto174m‑g
e
n
e
r
a
l(
lo
g
l
i
k
e
)
;RUN;

(
表 4:推定結果のまとめ)
プラスの影響
‑公務員ダミー
‑経常収入
‑住宅ローン

マイナスの影響

女

ケース 1¥イケース

=大企業ダミー

‑女性ダミー

支払額

‑持家共同

-ローン~主

住宅ダミ

‑笠室 E翠

一室三二

Hurdle(正規)モデルと、 Hurdle(対数正規)モテずル

i
主
主
'
j
̲
ミ
ー

‑
率E
S茎人1&

‑世帯主年齢
‑就業人数

は
、 y>O のサブサンプルに関して、尤度をそれぞれ
以ドに書き換えて推定すれば良い。自
[Hurdle(正規モデル):簡便法]

予想、と異なる結果が得られた変数(下線のもの)に
ついて考察する。住居属性のうち、持家戸建住宅に

Drob=PDF
やNORMAL',Youto174m.x
b
e
t
a
.
s
i
g
m
a
)
j
(sigma士(l'CDF('NORMAL',O
.
x
b
e
t
a
.
s
i
g
m
a
)
)
)
;

居住する世帯が、 Tobitではマイナス、 Hurdleでは
プラスであった。すなわち、 2 値選択では非力1入の

[Hurdle(対数正規モデル):簡便法]
nrob=PDF('NORMAL'.LOG(Youto174m).x
b
e
t
a
.s
i
"
m
a
)
/
(
Y
o
u
t
o
1
7
4
m*
s
i
"
m
a
)
;

方向に大きく影響するものの、加入した場合は逆に
保険需要が高まる性質を持つことが示唆される c

《VlI.参考文献》

住宅ローン完済ダミーがプラスになる点、あるい

• Liu,
W.S.andCela,J
.,(2008),CountDataModel

は非就業人数に非単調な影響が出る点については、

i
nSAS
也

解釈が困難である。今凶のデータでは頂貯金額や住

.,(2010),E
conometricA
n
a
l
y
s
i
sof
• Wooldridge,J

宅評価額、家族構成など、世帯の j
属性に関する重要

0・
'
055S
e
c
t
i
o
l
1a
ndPanelData(2nded.),
MITPress

SASGlobalForum,Paper371‑2008

な情報が含まれていない。こうした点が結果に影響
した可能性については、今後の課題としたい。
6 今回のモデ

《 V. まとめ》

本稿では、世帯の就業状況が貯茶型の保険需要に
与 え る 影 響 を おb
i
t/Hurdleモデルで分析した。そ
の結果、公務員世帯とその他の世帯では保険需要へ

ルでは Newton
‑RaphsonI:去の方が上手く収
束した。 )
J
l
lえて、 QTOLや ABSGCONV、GCONV等の収
束基準、あるいは MAXIT等の反復回数の設定を追加した。
7 初期値に閲しては、 T
o
b
i
t
.Hurdle{正規)の場合は線形回
婦
、 Hurdle{対数正規)の場合は y>Oを対数変換した線形回
立の近傍に設定すると収束しやすい。
帰の推定 f
8 1本の尤度式で推定を行う場合は、 p
rob以下を③式・④
式に変更すれば良いが、推定するパラメータが増加するた
め、アルゴリズムを収束させるのは非常に困難となる。

518

504.

健康因子に対する支出傾向に関する解析 若 林 将 史 , 東) [ 1 正晃,岡村正太 東京理科大学大学院工学研究科経営工学専攻 Theanalysisofspendingtrendsf o rthehealthfactor MasashiWakabayashi, MasaakiHigashikawa, ShotaOkamura Depa口mentofManagementScienc巴 , G raduateSchooIofEngin巴e r i n g,TokyoU n i v e r s i t yofScience 要旨 日番好品の摂取は傑々な環境要因に依存していると考えられる.また n 番好品と健康の関係は世の中の 関心事の lっとして,様々なメディアに取り上げられている.本研究では,世,出ー主の生活環境(年齢, 住居の建て方,住居構造)や労働環境(企業規僕,企業区分,産業)とたばこ・酒等の 1苔好品・保険医 Iのたばこ・洞 療等の健康に影響を及ぼす因子の支出額の傾向について解析を行った.木稿では,産業日J 及び保険医療の支出額の傾向についての結果,考察を示す.その結果,産業によって支出に明確に違い があることがわかった.また,産業によって,健康への意識の高さが大きく異なることが示唆された. キーワード:たばこ,洞,保険医療,生活環境,労働環境 1.規定課題 1.2.第 1 ‑ 2表 1.1.第 1 ‑ 1表 作成したプログラムと出力結果は以ドの通りであ 作成したフ。ログラムと出力結果は以下の通りであ る. る. procf r e qd a t a= d a t an o p r i n t ; procf r e qd a t a d a t an o p r i n t ; l l t 2 ( d r o pニ t a b l e sS h l l l l g y o l l J i n i n * S e t a i J i n i n/O l l tニ o 二 u t l ( d r o p= t a b l e sS h u u g y o u J i n i n * S e t a i J i n i n/o u tニ o p e r c巴n t ) ; p e r c e n t ) ; ,2 )andS e t a i J i n i ni n( ‑ 1 ) ; whereS h l l l l g y o l l J i n i ni n(1 ,2 )andS e t a i J i n i ni n( . t ) ; whereS h u u g y o l l J i n i ni n(1 1 u v a procp r i n td a t a= o u tIl a b c l ;r u n ; d a t ao u t 2 ;s c to l l t 2 ; 1 n u ︐ . v a w c i g h tW e i g h t ; o l l n d (c o u n t,l . ) ; r ̲c o u n t= r l a b c lr ̲ c o l l n t= "修J! ̲ J [1 / X . " ; I n u OBS 有 業 人 員 世 帯 人 員 度 数 4 4132 2 つ procp r i n td a t aニ o l l t 2l a b c l ;r u n ; 4 4201 519

505.
[beta]
OBS 有 業 人 員 世 帯 人 員

度数

修正度数

c
l
a
t
atempO1
;s
e
ttempO1
;
r
̲c
o
u
n
t=r
o
u
n
c
l
(c
o
u
n
t,1
)
;

46
4
8
6
8
.
2
3

64868

1
1
1帯数分布(抽出来調整) "
;
l
a
b
e
lrc
O
l
l
n
t="
n
u

66299

u
︐
.
r

つ

2

46
6
2
9
9
.
2
7

た集計jI!:帯数,支出の平均ー・

p
r
o
cmeansc
l
a
t
a=c
l
a
t
an
o
p
r
i
n
t
;

1.3.第 1
‑
3表

wbere&
w
h
.
:
'
r,
;
>
.
;

作成したプログラムと出力結果は以ドの通りであ

v
a
rS
y
o
u
h
i
s
h
i
s
y
u
t
uFoodH
O
l
l
S
CK
O
l
l
n
e
t
s
u
̲
S
l
l
i
c
l
o
u

る
ー

K
a
g
l
l
̲
K
a
j
iH
i
b
u
k
l
lHoken̲
I
r
y
o
uK
O
l
l
t
s
u
u̲T
s
u
u
s
h
i
n

p
r
o
cf
r
e
qc
l
a
t
aニ c
l
a
t
an
o
p
r
i
n
t
;

KyouikuK
Y
O
U
Y
O
l
lO
t
h
e
r
̲
S
y
o
u
h
i
s
h
i
s
y
u
t
s
u
;

t
a
b
l
e
sS
b
u
l
l
g
y
o
u
J
i
n
i
n本 S
e
t
a
i
J
i
n
i
n/o
u
t=o
u
t
3
(
c
l
r
o
p=

w
e
i
g
h
tW
e
i
g
h
t
;

c
o
u
n
t
)
;

o
u
t
p
u
to
u
tニ t
e
m
p
l
l
(
c
l
r
o
p=一TYPE̲̲
FREQ̲);

n

川

u
︐
.
r

n
ru

w
e
i
g
b
tW
e
i
g
b
t
;

c
l
a
t
at
e
l
l
l
p1
2
;s
e
tt
e
l
l
l
p1
1
;

d
a
t
a01
lt
3
;s
e
tout
3
;

where̲STAT
̲i
n("MEAN");

c
o
u
n
t1
0=p
e
r
c
e
n
t*1
0
0
0
;

a
r
r
a
yy
o
u
t
o{
I
l
)S
y
o
u
h
i
s
h
i
s
Y
l
山 F
o
o
c
lHousc

r
̲c
o
u
n
t1
0=r
o
u
n
c
l
(c
O
l
l
n
t1
0,1
.
)

K
o
u
n
e
t
s
u
̲
S
u
i
c
l
o
uKagu̲KajiHihukuHoken̲hγou

l
a
b
ヲc
lc
ω
O
U
I
川 1
0=
"
η
リ
'
J
l
交
主L
数
士 r印
c
o
u
n
t
l
0=
"
叶
+
修
多汁
i
卜
.
r
t
叫
生t
z
"
;
;
1
1

K
O
l
l
t
s
u
l
l
̲
T
s
u
u
s
h
i
nKyouikuKyouyou

c
l
r
o
pp
e
r
c
e
n
t
に
;
v
a

n
u

O
t
h
e
r
̲S
y
o
u
h
i
s
h
i
s
y
u
t
s
u
;
a
r
r
a
yr
̲
y
o
u
t
o
{
1
1
}r
̲
S
y
o
l
l
h
i
s
h
i
s
y
u
t
ur
̲
F
o
o
c
lr̲House

p
r
o
cp
r
i
n
tc
l
a
t
a=o
u
t
3l
a
b
e
l
;

r
̲
K
o
u
n
e
t
s
u
̲
S
u
i
c
l
o
ur
̲
K
a
g
u
̲
K
a
j
ir
̲
H
i
h
u
k
u

wbcrcS
b
l
l
l
l
g
y
o
uJ
i
n
i
ni
n(1
,
2
)a
n
dS
c
t
a
i
J
i
n
i
ni
n(
4
)
;
︐
n
u
v
a

r
̲
H
o
k
e
n
̲
l
r
y
o
ur
̲
K
o
u
t
s
u
u
̲
T
s
l
l
l
l
s
h
i
nr̲Kyouiku
r
̲Kyouyour
̲O
t
h
e
r
̲S
y
o
l
l
h
i
s
h
i
s
y
u
t
s
u
;
c
l
oi=1t
o1
1・

OBS 有 業 人 員 世 帯 人 員
3

2

1
0

度数

修正度数

4 1
3
3
81
.2
3

1
3
3
8
1

4 1
3
0
9
2.
40

1
3
0
9
2

リ

o
u
t
o
{
iド r
o
u
n
c
l
(y
o
u
t
o{
i
},1
.
)
;

e
n
c
l
;
o
o
c
l="食料"
l
a
b
e
lr
̲
S
y
o
u
h
i
s
h
i
s
y
u
t
u="消費支出 "rF
rH
O
l
l
s
e=,
,
{
:
主π
'
.
"rKOllnetsu SlIiclou="光現ト 7
}
<
.
j
1
!
:
"
r̲Ka
引
guKa
勾
l
j
i
ド=II~家家具.家 j字l:j川!りj 品 11 r出
H
f
五i
凶
h
1
Uk
u
ω
U
=1f被服及

│ び履物"汁rH
刷O
休k
e
n1
均
別
r
y
∞
ou=判漁鯨医療
作成したプロク‑ラムと出/力J
片t
結古果は以下の通りであ I r̲Ko
ω
u
I
ω
s
t
uuTsuu
s
山
凶
h
i
州
1!1ニ"交通.通{信吉 "rK
町y
卯o
山
ui
山
k
t
ド噸

1
.4 第 2表

句町
叩倒
叩

飢川
山
山
除
刷
削
凱
胤
削
釦
山i
札

る

ι

ただし ,出力結果の一音部│目l
は力[口を施している

O
/
o
m
a
c
r
問om
附1
e
邸a
n
s
一町
m
n
即c
α
叫
r
吋
(出
l
c制
t
ao
以
ut
,wh町);
た吠市数分会ー;

ωω
∞則削
1
川
.
l
け
1
山
J
I
I
川

、

whe
町r
で
e&wbe
釘r
e
.
;
w
e
i
g
h
tW
e
i
g
h
t
;
r
u
n
;

L

I r̲O伽 ̲Syouh凶 syutsuニ"その他の治費支出";

Iclrop̲STAT̲Syo山 hisyu FooclHouse
IKωωoωO
u
r
I
凶

P
戸r
阿
o
ch
i
合
加
f
閃
悶
e
伎
問
刊
q
パ
l
刊
l
c,巾 ニ c
l
a川 op吋
巾
山
n
t
じ
;
凶

山川

│ 育"勺rK
均
く
匂
y
卯
O
l
α
叫

恥刷
飢山
〈附

O
l
l
ド ω
I
加
ω
m
c
川
叩
川附
叫
I
川
1
I
川
I
1
可
甲
凶
p
幼
3
判
州
削
O
酬
刈
州
州
1
(
付
d
命
的
叫
r
州
O
叫
opニ p巴m

I Other̲Syollhishisyutsui
;
隠

Ir
u
n
;

Idatatemp21;settemp11;
520

506.

寸 ︐ 守A吋Uム 11656 d a t atcmp22;s e ttcmp21; 世 挙 司 社 蝋片山締混浴 Hu n ︐ .rA k e巴pwhereS y o u h i s h i s y u t u ; WM 悩・悩 型 4 的 叫 荊湾問瀬 BE冷害巷 つ ; where̲STAT̲i n("N 31202 31959 ; renameS y o u h i s h i s y u t u= n 2 10538 52141 39485 33681 l a b e ln= "集計世構数". 3 11103 47371 35298 32810 where= "&where."; 4医 qu 市3 l e n g t hwhere$ 5 0 . ; E d a t a&data out . ; 叩恐糊噌凶門 叫 BE 山が事詩 r u n ; n t ︐ . r 57801 d a t a&data̲out . ;merge&dat3̲01l1. t 巴 I l lP 22tempO1 ( k c c p =r ̲c O l l n t )temp1 2 ;r l l n ; 2 76078 3 66839 , 11:帯人員 4人 * 1:就業人員 1人 %mendmeans m c r ; 2:就業人民 2人 , 世 帯 人 員 4人 n( 1 )and %means̲mcr(o u t O O I,ShuugyouJinini 3:就業人員 1 , 2人 , I Y :帯 人 員 4人 S e t a i J i n i ni n( 4 ) ) ; %mealls̲mcr(01 lt 0 0 2,S h u l l g y o u J i n i ni n( 2 )and 2 . 自由課題 S e t a i J i n i ni n( 4 ) ) ; %means̲mcr(o u t 0 0 3, ShuugyouJinini n(1 ,2 )and 背景・目的 2 . 1 S e t a i J i n i ni n( 4 ) ) ; たばこや梢といった l 将好 l H :の 照 取 と 健 康 は 我 々 の dat ao u t O1 0 ;s e to u t O Ol ‑ o u t 0 0 3 ;ru1 I ; 生活に裕接に関わるものであり,陸間の関心ごとの p l ' O Cp r i l l td a t a= outOIOl a b e l ;r u n ; l つである 本稿では,世帯主の労働環境と世帯の f こ{まこ, i 尚 一 , 保険医療の支出稼i の傾向性について記 305234 71543 2 4201 64868 347740 78472 3 8333 131168 326256 74970 叫 同 伴 掌 叩 W柑はE E 門 66299 EW岬凶門 E 4132 叫 博噂糊片山吋叫司 BEぬr寺 巷 ( 寄E山加盟隈) 述する. j i L 2 . 2 . 解析 ; た(まこと i l l l i,保険医療の支出額に関して,Jff..業ご とに'1J央値を罫げiし,パフ、、ルチャートを作成する. 17556 18854 8383 13579 ヲ 12932 20621 8917 14876 3 15269 19728 8647 1 4 2 2 1 た ま 判 1 田 海 道 知Q淑芯 細川側通白 法鴻 ・ r N党 出 帥 道E 山が{存持 F 守 E 日 クラスタ一分析を行い, 産 業 問 の 支 出 傾 向 に ついて探索す一る. なお, サンプルサイズ等を考 H~: し て r 鉱業」と「不詳」のデータは解析対象から除く. 2 . 3 . 結果・考察 産業別のたばこ一酒支出額'1:1央{直のパフツレチャー トと l i 当 保険医療支出鎖中央J i l ' [のパプールチャートを ヌ │I 1 ,2にそれぞれ示す.パフ、ルの大きさは産業ごと のサンプルサイズの相対的な大きさを表している. 521

507.
[beta]
。

∞

次に,たばこ.i
阿・保険医療の支出額の中央値に
関するクラスタ一分析結果を図 3に示す.手法は,

6

E

C

鮮半必J
I:よを用いた.

制

冒司岡リ H‑ど

。
τ
い
"

0
'
ー

fヘ質泌が仰い開

ク

0
'
"
'
'、

2
曲・

ラ

ス

9
舗
の
思

2

•
JV

~.不・".・

誕泊。

'
5
C
焔

7
1
:
企

丙汗1

001
1

遜支出闘

守 銅 * " 不
ー 過 曾 . . 嗣

図 1:i
定業別たばこ

ピ禽て,
ス , ト

消支出額中央値に

ス.
・

.ピ~

I
1
:

!刻するパブ、ルチャート

・

.
3

I

分

"
さ

れ
$

D

3ヌ~ "

も

J
I
‑

工

~

CA‑

..:・K婚 g・>れ~句、も.(),

i
叉13:デンドログラム"
"
国

(結果・考察〉

司

同
開

・
.

|立13 につし、て,*均 ~[~lilf[ 0
.
5で分害[
Iを行うと,

Q~銀・山 .m 叫・本書 R
目白 4

で閉まれた 5つのグループに分けることが出来る .

。
噌
・
温
傷
.

.A
し:平均的な支出
間~

l
l
: 晴好品の支出が f
s
:
ぃ

0・
1
:
‑
3
‑
.
"
・

C :~需主f- Jtl の支出がおい

)
(
)
(
)

D: たばこの支出が{尽く,保険医療の支出が高い

ε たばこの支出がおく

l
立
]2:産業)j
J
I 消 保険医療支出額中央値に

i
筒・保険医療の支出が低い

また,平均距離 0
.
7
5で分割を行うと, ζ二 コ で U
H

関するバブルチャート
(結果・考察〉

まれた 3つのク、ループに分けることが出来る

I
三I
1
,2より,産業{こよって支閉鎖に傾向があり,

2

保険医療の支出が低いグループ

蓄好品の支出が高い!まと¥保険医療の支出は低くな

務t
.

保険医療の支出が平均的なグループ

っていることがわかる.たばこと泊の支出額に関し

d
I
‑:保険医療の支出が高いクツレープ

1

て

r
医療・抗祉」はどちらも低い傾向がある.これ
2.
4
.

は,普段から健康に密接に関わる産業であることが

まとめ

r
建設業 J・「運
飲食 T
d
i
'.
輸業 Jではどちらも高い支出傾向があり r
宿泊業」はたばこの支出が高く , i
出・保険医療の支

業」・「運輸業 jではIl信好品;こ高い支出傾向があった.

出が低い傾向がある.これは,余 1
1
1誌が少ない,勤務

また

時間が特殊といった職業の特性が起因していると考

保険医療の支出が低い傾向がみられた.

産業によって支出に明確に違いがあることがわカ、

起因しているものと考えられる.また

った

えら ~ë るー

5
2
2

r
医療・福祉 J,土噌好品の支出が低く

r
建設

r
飲食 J
人.1
i
'
Jt白業」はたばこの支出がおく,出i
.

508.

第一回ミクロデータ分析コンテスト規定課題 高宗太輔 株式会社データフォ シーズ TaisukeTakamune . K . D a t a 4 C ' sK 1.規定課題 以 l ごに規定課題の集計表を再現したものを示す。 第 1‑ 1表 集計世倍数(各レコードを、単純にカウン卜したもの) 総数 総数 有業人員 1人 2人 3人 4人 5人 6人 不詳 第 1‑ 2表 3 2027 3人 537 8, 4人 9 . 9 4 4 5人 4. 405 1 3, 913 124 4. 908; 1 3, 4, 1 3 2 1 . 4 36 司 1 3, 459 。 。 。 ri 。 。 。 。 。 。 。 3 . 2 3 9 2950 6 9 1 1 3, 39 1 1 1 .035 6 96X 7 5 203 7人 8人 8 1 256 5 1 6 2 0 1 4, 1 , 943 494 巾 559 220 232 1 0 4 84 3I 27 6 7 220 3 1 1 9 3 5 2 256 1 0人 9人 390 ヲ 1 6 324 40 、 3 1 5 。 。 。 。 。 。 。 29 6 1 2 3 。 。 。 。 。 。 28 1 2 3 世帯数分布(各レコードを、集計用乗率で重み付けして、カウン卜したもの) 総数 総数 有業人員 1人 2人 3人 4人 5人 6人 不詳 世帯人員 6人 i 之1 4 2人 7, 438 2人 3人 835 1 1 5, 1 3 2, 005 4人 1 5 5 . 8 5 0 219, 743 9 1 646 284; 6 1, 1 66 , 299 205, 723 50, 1 3 8 495. 4 65 44, 0 4 1 1 0, 1 6 8 570 99 1 5, 1 2 0 5人 世帯人員 6人 8人 1 0人 9人 1 7, 1 6 1 5 . 6 1I 1 , 1 9 7 2 2, 7 40 3, 813 8 3 1 84 。 。 。 。 。 。 。 。 。 。 1 .006 7人 67, 565 207 。 。 。 。 。 。 。 5 1, 523 64 、 868 29, 616 6, 8 0 1 2, 336 4 4 1 1 5, 912 1 5, 615 4, 8 5 1 7 . 9 6 3 3. 3 45 383 36 4, 216 3 . 5 1 9 1 , 1 3 7 422 1 0 8 5I 727 76 1 9 5 287 3, 3, 302 1 , 354 80 49 1 , 7 6 1 4 0 1 1 7 0 4人 31 .455 5人 1 3 . 6 3 7 1 3, 38 1 4, 590 3 3 。 。 。 。 。 。 33 第 1‑ 3表 世 帯 数 分 布 (10万分比) 総数 総数 有業人員 1人 2人 3人 4人 5人 6人 不詳 1 0 0 , 000 2人 23. 379 44, 3 5 1 1 3 . 0 5 7 4 1, 5 2 1 8, 889 1 0 , 1 1 9 2, 052 1 1 5 20 3 . 0 5 2 3人 26 , 643 i l 1 2, 369 世帯人員 6人 203 6作l 7人 8人 1 , 1 3 2 9人 242 7 770 1 6 X 1 7 1 , 373 666 4 7 1 229 8 9 1 5 979 675 273 8 5 39 7 7 1 6 1 0 355 22 1 0 1 4 7 8 1 710 523 7 。 。 。 。 。 。 5 . 9 7 7 1 .607 8 5 1 1 0人 42 。 。 。 。 。 。 。 1 3, 092 3, 1 5 2 。 。 。 。 。 。 。 。 。 。 1 0 , 399 3, 2 1I 4 ( 主4 3, 7 34

509.
[beta]
第 2表 支 出 ( 消 費 支 出 及 び 十 大 品 目 )

総数
う ち 世 帯 人 数 が 4人

有量入貝
1人
2人
3人
4人
不詳
{特掲) 1人 又 は 2人

世帯数分
集計世僻
布{抽出 消費支出
数
串調整}
3
2,
0
2
7
4
9
5,
4
6
5
3
2札 1
‑
U
l

宜料

住居

光熱・氷 家 具 ・ 軍 被 服 及 び
交通・通
保健医樟
事用品
道
履物
信

教育

教聾鼠楽

その他の

消費支出

19.23~

1
5
3
4
5

2
0
.
21
"
;

1
"
;
.
1
3
8
1
4.
4
5
2

II
.J
舶
[
0
.
9
8
7

~::.::!70

3
3
5.
4
3
8

9
.
2倒
ぉH
S
5

4
7
.
%
1

1
5
5
$
5
0

7
2
.
8
!
O
7
6
.
3
6
2

円 "
'
7

9
.<
J
.
l
4

~7 お山

3
3
.
牛』ご

313X9
3
2
.2
6
9

5
お
お
7
5.

3
2
4,1

品2
開

3
0
5
.
:
:
3
4

7
1
.
5
4
3

1
7,
5
5
6

1
8
.
R
5
4

K3!O

1
3.
5
7
9

1
1
.
6
5
6

4
2
.
7
0
3

3
1
.
:
:
0
2

31
.
9
5
9

.
{
J
[
5
7
.8

4
.
2
0
1
1
.
0
]
1
3
2
4

&Ul68
1
5
.
6
1
5
48
5
1
4
品j
J
3
1
.
16
H

3
"
;
7
.
7
4
0
7
8
.
4
1
2
1
2
.
9
3
2
お]
.7%
1
2.
5
8
3
3
X
O
.
52
1
出.
ω
!
) お
!5
α
}
3
9
9り
1
>
'
‑J4.五泊
3
,削姐 -~::..品
弓
:
:
6
9
7
"
;
.
9
7
0
l
3
2
6
.
2
5
6

一
一H13]3
誌

,

自 由

一

X~.OO3

}
9
̲
4
お5
1
"
;
.
&
7
6
3
3
.
6
8
1
7
2
0
.
6
2
1
K917
1O.53~
5
2
.
1
4
1
札0
71
'
l
1
0
.
2
7
6
2
3
.
0
4
5
1
6.
56
1
1
0
.
3
3
1
5
2.
4
06
2
2
.
5
I
J
2
7
.
:
‑
:
5
2
I~ I.I 60
2
2,
.
.
;
叩
1
1
.7
6
3
1
4
.
0
9
6
2
8
"
;
.
5
0
9
3
:
:
.
7
6
9
1
4丸6
.
31
0
51
1
1
11
'
l1
2
̲ .
:
W
.
4
S
.
ぶ ̲...3凶 1 ー 副 担 ♀
1
.
0
μ ー-4 ~2
,之斗孟3
8 四..J.泳J
J四 ‑ 14
品3 四 μ
R
.l
バ7
6
6
.
K
:
;
Q
1
9
.
7
2
8
1
"
;
.
2
:
:
1
4
7
.
:
m
3
5
.
2
9
8
1
3
2
.
X
I
O
1
.
10
3

5
2
4

510.

食費の分析による食に対する意識と食生活の把握 高宗太輔 株式会社データフオーシーズ Understandingofi d e af o rmealande a t i n gh a b i t sbya n a l y s i soff o o db u d g e t T a i s u k eTakamune Data4C'sK.K. 己目 要 食費を消費'者の食に対する意識の直接的な表出であると捉え、食費の分析によってその意識の把握を 試 み た c 食費の詳細内訳を用いた閃子分析によって食に対する意識を悶子として抽出し、抽出された閃 子をもとに階層的クラスタリングによって大まかな世帯の分類およびその解釈を行った。 キーワード:全国消費実態調査、食費、因子分析、階層的クラスタリング 1.はじめに これまで、消費者の食に対する意識を知ることを目的とした調査は数多く実施されてきた。特に、アンケ ートによる調査・分析は最もよく実胞されてきたアプローチの lって、ある。しかし、アンケートデータの側 ' H併などに起肉する、回答の信頼度への懸念が存在することは否定で 面として、回答者による設問の誤った f きない。一方、家計簿に記載された数字(土実際の消費行動の結果である。したがって家計簿の食費の各項目 は、消費者の食 i こ対する意識が第三右の手を介することなく、消費の実体として直接的に表出したものとし て捉えることができ、食費を分析することで消費者の食に対する意識がより実体に則したものとして把握で きるのではと考えた。 この考えのもと本稿では、まず食費の詳細内訳を入力とする因子分析によって、食生活に影響する因子を 抽出した。次に各世帯の囚子得点をもとにして、全日l 守?に階層的クラスタリングを施すことで分類し、各ク ラスタの特徴を捉えることを試みた。 2 . 食費詳細内訳に対する因子分析 入力変数を食費の詳細内訳全 29品目として、全jiI:帯を対象に FACTORプロシジャを用し、て因子分析を行 去を用い、パリ 7 ツクス l 凶転を行った。その結果、 3つの因子が抽出された。表 l った。因子抽出には主因子 j に各品目の肉子負荷量を示す。 525

511.

悶子 1について、閃子負荷量の高い品目には 表 l食費詳細内訳の因子負荷量 因子 2 因子 3 因子 l 入力変数 魚介・野菜に関する品目が多く含まれており、 . 1 5 1 5 1 0 . 7 7 0 9 5 0 . 2 3 5 7 2 0 生鮮魚介 . 1 9 5 8 8 その他生鮮食品も多い c これは食に対する健康 0 . 3 8 9 4 4 0 0 . 7 4 0 0 3 生鮮野菜 0 . 7 0 4 6 1 0 . 2 4 9 5 1 0 . 2 0 7 6 8 志向の強さを表していると解釈できる。因子 2 他の野菜・海藻加工品 0 . 1 5 8 2 5 0 . 6 9 0 6 9 0 . 1 9 7 5 2 塩干魚介 については肉や牛乳・卵など、比較的高カロリ . 1 5 3 2 5 0 . 6 8 0 8 4 0 . 1 2 7 4 9 0 生鮮果物 1自の因子負荷量の高さが目立つ。この因 0. 46 2 0 3 大豆加工品 0 . 1 5 1 0 8 ーな 2 0 . 6 5 6 0 5 . 1 5 1 5 4 0 {也の魚介加仁品 . 2 2 6 6 7 子は布カロリー思考を表す因子と解釈できる。 0 . 6 4 0 8 9 0 . 1 2 0 6 8 乾物・海藻 0 . 5 7 5 9 4 0. 31 0 9 6 0 . 5 5 4 0 4 0. 調味料 0 . 5 5 6 4 0 37 0 7 3 因子 3(こは外食や調理食 l弘、菓子類などといっ 0. 40 0 8 0 . 1 7 2 4 4 た料理をせずに食事をとれる品目の因子負荷 魚肉練製品 0 . 5 3 7 0 1 0. 43 7 2 2 0 . 2 9 6 4 5 0 . 0 4 9 2 1 米 量が高い。このことから、悶子 3は自炊に対す 0. 40 0 1 0 . 0 2 8 7 7 0. 35 2 5 茶類 0. 35 7 9 5 0 . 0 8 8 5 5 0 . 1 5 9 9 る無関心さを表していると解釈で、きる。 1 国類 果物加工品 0 . 2 5 0 2 4 0 . 1 2 9 1 5 0 . 1 4 4 6 以とから、各因子を以下のように名付ける。 0 . 2 4 2 6 8 0. 36 1 4 4 0 . 6 7 4 1 3 因子 1 健康志向 0 . 2 3 2 2 2 0 38 6 5 9 . 6 2 8 4 9 0. 加士肉 . 5 9 4 9 7 0 . 2 8 9 4 6 0 . 4 4 3 0 2 0 生鮮肉 閃子 2:高カロリーぶ向 0 . 5 2 4 2 0. 45 3 8 2 めん類 0 . 2 4 3 3 1 因子 3:自炊回避志向 0 . 2 4 1 7 8 牛乳 0 . 2 8 5 1 4 0. 49 1 7 3 0. 31 4 5 9 0. 48 0 6 4 0 . 1 7 5 8 2 油脂 他の穀類 0 . 1 9 2 7 4 0. 38 1 9 4 0 . 2 1 8 5 2 主食的調理食品 0 . 2 3 9 4 8 0 . 0 7 3 7 3 0 . 6 6 3 5 1 3 . 因子得点を用いた階層的クラ 47 5 7 2 0 . 6 3 3 7 5 菓子類 0 . 1 8 8 8 9 0. 他の飲料 0 . 1 3 2 7 2 0 . 2 5 8 0 7 0 . 5 8 1 1 5 46 6 7 4 パン 0 . 5 7 4 9 4 0 . 1 4 4 0 4 0. スタリング . 1 3 7 5 2 0 . 5 3 3 9 6 外食 0 . 0 7 6 7 0 0 . 2 4 5 9 5 0. 48 0 0 3 0. 33 1 4 5 他の調理食品 因子分析時に出力された各世帯の因子得点 0 . 1 4 0 5 2 0 39 3 7 9 . 1 6 9 7 7 0. コーヒー・ココア を入力とし、全世帯を対象に CLUSTERプロシ 芝 すl い之 i [ l1 , 1 旦 口 0 . 1 2 2 9 3 0. 32 1 0 9 0. 33 2 7 ジャを用いて階層的クラスタリングを施した。 o n : 去を選択した。クラスター数は様々な数を検討した結果、解釈しやすい 4を採用した。表 2に各 手法は Wardt クラスタにおける平均因子得点を示す。この平均因子得点をもとに以下のようにクラスタの特徴を解釈した。 クラスタ 1:自炊、調埋食品・外食を問わず、健康志向の強さが目立つ c クラスタ 2:向炊は行うが、特に栄養価に対するこだわりを持っていない。 クラスタ 3:自炊や調理食品・外食にこだわらず、また栄養価についてもこだわりを持っていない。 クラスタ 4: 自炊を回避する傾向が強いが、同炊の場合は栄養価のバランスを考えている。 以上から、各クラスタを次のように名付ける。 クラスタ 1:健康志向クラスタ クラスタ 2:栄養バランス軽視クラスタ クラスタ 3:食欲充足重視クラスタ クラスタ 4: 自炊こだわりクラスタ 526

512.

表2各 ク ラ ス タ の 平 均 因 子 得 点 健康志向 │高カロリー忘向 │自炊回避志向 0 2 3 3 2 2 9 7 1 ー0 . 0 3 5 9 6 6 7 1 ー0 . 0 8 9 6 2 5 0 . 1 4 4 9 4 2 4 1 ‑ 0 . 1 9 2 2 0 2 1 1 ‑ 0 . 2 0 3 5 2 9 6 ‑ 0 . 1 3 7 4 6 5 9 0 . 0 3 2 8 0 6 7 0 . 0 1 6 3 2 3 9 0 . 1 2 9 3 7 9 5 0 . 1 8 4 9 1 4 3 0 . 3 4 0 6 7 6 9 4 . クラスタの特徴 表 3、表 4、表 5にそれそ れクラスタ別の世代分布、世帯人員分布、エンゲル係数分布を示す。 0代以 kが中心と 世代については、それぞれのクラスタに次のような特徴が現れた o 健康志向クラスタは 5 なって構成されており、年齢を重ねるにつれて健康を意識するようになるという直感に従う分布となってい る。栄養ノくランス軽視クラスタについては 30代前半および 50代後半に 2つピークがある広い分布となって いるが、これはどの t l t代にも一定数栄養ノミランスを経視する世帯があることを示している G 食欲充足重視ク i l :帯人員分布の有業人員と合わせて考えると、 ラスタは 40歳前後にピークがある分布となっているが、これは t 各世帯に子どもがし、ることに起囚していると言える c 自炊こだわりクラスタについては 40代前半をピークと i J r ;するt1 : J帯は現状何らかの埋出で自炊はあまり行わないが、 して広がる分布となっている。このクラスタに, 自身の年齢を考えて健康に配慮した自炊をねなっていると考えることができる。 世帯人員については次のような解釈を行った。健康,む向クラスタは世帯人員が単調減少する分;:f f iとなって いる。このクラスタは世代分布で、見たように高齢 t l t帯が中心となっていることから、子どもとの同居世帯が 24歳 未 満 25‑'29 歳イ : ‑ l0‑34歳 35‑39 歳 40‑44歳 45‑49 歳 E ~ 道 議 后 50‑54 歳 Z55 59 歳 60‑64 歳 65‑69歳 歳 70‑74 75歳以上 。 1,000 2,000 0 1, 000 2, 000 0 1 , 000 2, 000 0 1 . 0 0 0 000 2, 世帯数 !有議X 員一ロ l;::-iï 2:人・ 3~人:04天王五五, D6 天百三宇和 2人 3人 4人 r m r 〈 ら人 日人 圭l 7人 持 8人 9人 10 人 。 2, 000 4.000 6, 0000 2, 000 4, 000 6, 0000 世帯数 2, 000 4, 000 │ 有 集 人 員 ロ 1人 82人 同 日 人 ヨ 4人 ・ 5人 口 行 人 圏 不 詳 │ 527 6, 0000 2, 000 4, 000 6, 000

513.

10 d i ‑ ‑ 4¥ぺ川 8 6 4 2 0 20 百 40 首 G O l も 8 0% 100 也O 首 2 0 也 40% 60 也 80 首 1 00 也0% 21 l ' l 品 40% 6 0% 80 首 1 00 唱。也 エンゲル係数 0 也 20% 40 也 6 0 首 80 首 1 00 也 比較的少ないことによると思われる。栄養ノくランス軽視クラスタも同様に W :帯人員が単調減少するような分 布だが、これは各世帯に子どもが少ないことから、特に食半の栄茶ーを気にしていないと考えられる。食欲充 足重視クラスタは世帯人員が 4人の凶:帯が突出して多い。この結果!土世代分布でも述べたとおり、世帯に子 どもがいることが起因していると言えよう。自炊こだわりクラスタについては、世帯数の遣いはあるが、食 欲充足重視クラスタと似た分布となっている。 エンゲ ル係数分布については健康志向クラスタと自炊こだわりクラス夕、栄養バランス軽視クラスタと食 欲充足重視クラスタがそれぞれ似たような形状をしている。それぞれのクラスタでのエンゲ.ル係数の平均値 5.4%、栄養ノくランス軽視クラスタは 19.8%、食欲充足重視クラスタは 24.3%、自炊 {土、健康志向クラスタは 2 こだわりクラスタは 28.7%であった。健康志向クラスタは、健康のために良質な食材を用いて食事をしてい ると解釈できる。栄養ノくランス 1 ; 霊視クラスタについては、食事を重要視していないことがエンゲル係数の低 さの要因と解釈できる。食欲充足重視クラスタについては、 ある程度の食事の最を確保するために、やや高 めの数値となっていると考えられる。 自炊こだわりクラスタは、外食や中食を多用することがエンゲ、ル係数 の高さの原因と考えることができる。エンゲ、ル係数 l 土、一般的な特徴として収入との負の相関があると言わ れているが、 一方で表 5のように、食生活のスタイルによって異なる特徴が現れたことは、特筆すべき点で あると言える。 5 . おわりに 今回の分析では食費の詳細内訳に着目し、「健康志向 J r 高カロリ一志向 J r 自炊回避志向」 という 3 つの 食事に関する因子を抽出した。さらにこの囚子を用いて全│止帯を 4つのクラスタに分類し、各クラスタの特 徴を↑~:代・悦帯人員・エンゲ.ル係数の各観点から解釈した。以上の結果から、食費そのものの分析というア ンケートデータの分析とは~く異なる定量的アプローチによって、実際の n~ 1'~'行動の結果から食に対する意 識および各↑止帯の大局的な食生活の様子を把短することができた。よりきめ細やかな分析を行うには、その 他の消費項目との比較や収入との関連性を考慮するなどの方法が考えられる。 528

514.
[beta]
ミクロデータ分析コンテストの規定課題
筒井杏奈
アストラゼネカ株式会社臨床統計・プログラミング、グ、ループ

Thec
o
m
p
l
l
l
s
o
r
yprogrami
nt
h
ec
o
n
t
e
s
t

AnnaTSl
It
sl
Ii
n
gG
r
O
l
l
p,AstraZcnccaK.K.
C
l
i
n
i
c
a
lS
t
a
t
i
s
t
i
c
s& P
r
o
g
r
al11l11i

要旨
L
c
t
'
sデータ分析第一回ミクロデータ分析コンテストの規定課題の解答を述べる c 疑似ミクロデータは
a
t
a
s
e
t
件数と変数の両ノらーが多いという特徴があったため、解析に先だってデータの読み込みと ReportingD

の作成を行い、その後に規定課題の解析を行った。

キーワード:擬似ミクロデータ(平成 1
6年全国消費実態調資)、規定課題

1
. データの読み込みと ReportingDatasetの作成
本論;文でfiJし、たデータは、公的統計のミクロデータの利用を図るため試行従 f
J
tされている疑似ミクロデー

6午全国消費実態調査)である [
1
]。解析には SAS9
.
3を用し、た c
タ(半成 1
このデータの特徴には、 3
2
.
0
2
7としづ件数の多さ、 1
9
7としづ変数の多さ、ならびにデータが複合的で、
値のタイプが数値や符号ーなど様々なことが挙げられる

G

データを管理するため、各変数の属性(ラベル、フ

ォーマット)の定義が不可欠と考えた。一方でL、手作業ではミスが生じやすい。よって一緒に提供された符
) を参照して疑似ミクロデータに変数の属性の情報を
号表(同 1

力1
1した R
c
p
o
r
t
i
n
gD
a
t
a
s
e
t(以卜

析で付加し、さらに解析に必要な変数を迫

RDS) を作成し、この RDSをJ
T
Jし、て解析を千 lうことにした c

最初に疑似ミクロデータの読み込みを行った。データは 7分害1
1された CSVファイルだったため、 lつの CSV
ファイルを DATA ステップカ‘ら ~j:/é み込むマクロを定義して 7 回実行した。読み込んだデータは縦結合し、永

久データセット G
I
J
Iを作成した。
次に、符日ー表 (
1主1
1
) の読み込みを行った。符号表は EXCEL形式で提供され、項目名や変数名、符号、符

.
.
l
J
̲
4
.
J
.
̲
i
.
斗i
J
ユ
j
̲
8
.
J
8
号内容などの一覧が記載されてし、る。幽一上ムーしJ
;行番苦口イヲ l
T量1
1宣1}¥イ HC
:l
"
,,1
1重1 :
‑
n
‑
.
.
.
.
.
.
唱

IMPO町プロシジャで読み込み、ま

ずは変!史を加えずに永久データセッ
卜 川 OUTを作成した c 続いて、デ

JiiflJ7'.ータピット
ー タ 机 士 し て おI
(フォーマット作成(こ必要な情報を
含むもの)に変換し、永久データセ

I

s: 号 I買自名|高置卜点|喜|型 g~
郡江名
8
'
1世 帯 区 分 1'
1 '
1 '
1 1
を
い t"iK~'b リ n
7
子γ引
11 1 1 111
3
1
1
1
1

レ;
I
} .
I
i
l
‑d

リオートー j
.
.
.十 一 一

I_!立J一一~1_~i_1~

1

1

わ

│動労
,勤労以外

守 口

│符号

~

e
r
3

‑ 口

山

2[

…

村叶 "iJinin

1
1満
考

1

I
!
!l
H
一一│通自の区切り

十 ;
開^a I
.
}
¥
.
.
.
.
a
.
¥
k
b
;
;
2
=
2
X
=
1
1
2
1
3
1
2k
1
r \ls~ï~;J;;;i;;.
1
1
6
2
‑
‑
‑1
1
2
1
"
:1
I
l

白

符号内容

人‑

1

.
1.
2
I
..S1I
.
'
.
.
L
.
L
I
.
1
.
.
k
IJ~ 自の里切り|
1
6
叶 吾 護 人 員 12
16
2
r
2 l
r1
1
6
1
‑
‑
‑ い人
.
i
T
. 到。
1
.
.
.
.
.
1
.
.
.
1山
山
山
上し L
.
.
.
.
.
.
.
L................................l~~:' J
'
i
'
詳
1~. , .!I~.

IShυυg'}ouJi
ni
n

[~[I 符弓表(統言トセンター layoll!

529

c
o
d
c
.
x
l
s
)(一部妓伴、体裁改変)

515.

ット FORMATSおよび永久フォーマットカタログ FORMATSとして保存した。 I J I、 LAYOUT、FORMATSから RDSを作成した。まずは FORMATSを参照し、 G I J I 最後にデータセット G の変数にフォーマットを設定することにした。今、 FORMATS にはフォーマットの設定が必要な変数とその フォーマット名が含まれている。そこで DATAステップで FORMATSを読み込み、 CALLEXECUTEルーチ ンを呼び出し、その引数 l こ DATASETSプロシジャとその FORMATステートメン卜を指定した(表 1 )。この 方法を選んだ理由は、短いコードで表現でき、かつ引数をログメッセージで確認できることである(表 2 )。 間後に、 LAYOUTを参照して G I J Iの変数ラベルを付加した。また第 3r 頁の第 2表の集計に備え、一部の支出 の変数(消費支出とその十大項目(食料や住居など))を抽出し、それらの変数名 Y o u t o 0 3 7、Y o u t o 0 3 8、Y o u t o 0 7 9、 、 ‑Y o u t o l 4 2を EXPENSEIから EXPENSEIIに変更したのち、 G I J Iに SEQ変数(連番)をキーに横結合し た。データ加工の完了後、永久データセット R G I J Iとして保存し、以後の解析にはこの RDSを用し、た。 表 lデータセット FORMATSを参照して変数のフォーマットを設定するプログラム *データの読み込み; p r o cs o r tdata=RAW.GIJIO l l tニーG I J In o d u p k c y; b ySEQゾ SEQ: 連番, n u ︐ l l ‑ p r o cs o r tdala=RAW.FORMATS( k e e p ニ V ARIABLEFMTNAME)O l l l =̲ FORMATSnodllpkey; b yVARIABLE; r u n ; *フォーマット設定(処珂 A 表 2参照); d a t a NULL : s e t̲ FORMATSend=̲EOF; i f Nー=1t h e nc a l lc x e c l l t e ( " p r o cd a t a s e t slibrary=WORKn o l i s t;11l0 d i f y̲G I J I; "); c a l lc x c c l l t c ( " f o r m a t" I I VARIABLEllcomprcss("$"IIFMTNAMEII ) 1 1 "; " ); i f̲EOFt h e n c a l le x c c l l t c ( " q u i t; " ); r u n : … 表 2 処理 A(表 1 )実行 H 寺のログメッセージ NOTE:T h e r ew e r e1 2o b s e r v a t i o n sr e a df r o mt h ed a t as e tWORK. FORMAT S . NOTE:DATAs t a t el 1 lc n tl Is c d( T o t a lp r o c c s st i m c ) : r e a lt i m e 0 . 3 2s e c o n d s C p l lt i m e 0 . 0 1s e c o n d s NOTE:CALLEXECUTEg e n e r a t e dl i n e . 1 +p r o cd a t a s e t sl i b r m γ =仇IORKn o l i s t;11l0 d i f y̲G I J I; o r m a tK O l l Z O l l $ K O U Z O l l .; 2 +f 3 +f o r m a tSI̲Age $S1 A g e .; o r m a tS I ̲ K i g y o l l K i b o $SIKKibo.; 4 +f (略) 1 4 +q l l i t ; NOTE:MODIFYwass l l c c c s s f u lf o rWORK. G I JI .DAT A . NOTE:PROCEDUREDATASETSu s e d( T o t a lp r o c e s st i m e ) : r e a lt il1le 0 . 0 4s e c o n d s c p l lt i m c 0 . 0 1s e c o n d s 2 . 第 ト l表から第 } ‑ 3表:集計世帯表と世帯数分布 第 1 ‑ 1表から第 1 ‑ 3表ーまでは、 HT¥頒の似た頻度表を作成することが規定されている。 第 1 ‑ 1表集計世帯数(各レコードを単純にカウントしたもの) 1 第 1・2表 1 ぞ帯数分布(各レコードを集計 m乗[.fで重み付けしてカウン卜したもの) 530

516.

第 1 ‑ 3表世帯数分イ百 ( 1 0万分比) これらは共通の処理が多いため、 lつのプログラムでまとめて作成した。共通点は FREQプロシジャを月 j いて有業人員(総数と内訳)と世帯人員(総数と内訳)の 2元クロス集計表を作成すること、相違点は表題と FREQプロシジャで用いる重み付けの値で、ある。各表の重み付けの値はそれぞれ以ドの通りである。 第 ト l表 1(重み付け変数は不要だが、他!の重み付けをしても算出結果は等ししつ 第 1 ‑ 2表: 集計一月]乗率 ‑ 3表:集計用乗率÷総世帯数 x1 0万 第 1 つまり重み付け変数の値を調整して BY変数を活用すれば、最初から RTFファイル等の外部ファイルへの 出力の直前まで、マクロを使わずに 3積類の表を一度に作成できる。よって、解答は以下の通りである。 JIを読み込む(表 3 ) 処坪一1.データセット R Gl 処上q ¥2 . DATAステップで、集計用乗率(変数 Weight) を累計することで総世帯数を算出する(表 3 ) 処理 3.DATAステップで、処理!と処理 2のデータセットを読み込み、各表の重み f 、1":ナ変数の作成とオ ) ブザベーションの出力を 3凶行う(表 3 処理 4.DATAステップで、処理 3のデータセットを読み込み、まずは変更を加えずに出力し、続いて有 業人員の変数にダミーの値 " 0 "を与えて再度出力する 処埋 5 処理 4のデータセットを表)11買に並び変え、 FREQプロシジャで有業人員と I U :帯人員の 2冗クロス 集計表を、重み付け変数と BY変数(表)を用いて集計し、結果をデータセットに保存する 処上型 6 処理 5のデータセットを TRANSPOSEプロシジャで 1伝置し、続いて DATAステップで世帯人員の 総数を求め、データを規定課題の表に合うように加工する .RTFファイル出 ) Jのマクロを定義する。内容は ODSRTFステートメントと REPORTプロシジャ 処理 7 f i果を RTFファイルに出力するものであり、キーワードパラメタに表番号を定義した c を用いて f これは呼び出し H 寺には指定した表番号の結果のみ指定した表番号ーの RTFファイルに出 jJできる 処珂¥8 .T汀 LEステートメントで表題を設定し、処理 7のマクロを呼び出すプログラムを 3回繰り返す 表から第 1 ‑ 3表のプログラム(処埋 1 ,2,3 ) 表3 第ト l キデータの読み込み(処理 1 ); p r o c5 0 r tdata=RDS.R̲Gl Jl(keep=SEQS huugyouJininS e t a i J i n i nWeight)out= ̲Gl Jlnodupkey; e t ai Ji n i n : 世帯人員, S h u u g y o u J i n i n :布業人員; bySEQ;*S r u n ; 本総、世帯数の算出(処理 2 ); d a t a N; s e t Gl Jle ndニ EOF; NSUBJ+Weight;*W e i g h t : 集計 J T l乗 率 ; i f EOF; keep̲NSUBJ; ; r u口 キ各表の重み付け変数の作成と出力(処珂D); d a t a GIJI2; 5 e t̲G I J I; i f N =1t h e ns e t N: ; WEIGI ー汀= 1;o u t p u t ; 1 i "1 ‑ 1表 ; TABLEニ 1 ̲TABLE=2;̲WEIGHT=Weight;o u t p u t;キ第 1 ‑ 2表 ; 本 → ;̲ WEIGHT=Weight/̲NSUBJ 100000;o u t p u tゾ 第 1 ‑ 3表 ; TABLE 本 E I I Hu r a ︐ 531

517.

3 . 第 2表支出(消費支出及び十大費目) この集計表は、世帯属性(総数、うち世帯人員 4人、うち世帯人員 4人かっ有業人員がそれぞれ l人 、 2 人 、 3人 、 4人、不詳、 (特掲)1人又は 2人)ごとに集計世帯数と世帯数分布の頻度、および支出(消費支出 とト大費目)の平均値を求めたものである。 RDSでは各支出は名前が EXPENSEで始まる変数にまとめられ ているので、この表は簡潔に作成できる。解答:は以下の通りである。なお重み付けには集計用乗率を用いた。 I J 1を読み込む(表 4 ) 処理 l データセット R G 処理 2 .DATAステップで、世帯属性毎に出)]を繰り返す(表 4 ) 処理 3 .世帯属性1 ) 民 (BY 世帯人員、;釘業人員)に並び替える .FREQプロシジャを用い、位帯属性の度数分布表を求めて集計一世帯数を算出する 処理 4 処理 5 .処理 4に同じ。ただし重み付けして世帯数分布を算出する 処理 6 .MEANSプロシジャを用い、 i 止帯属性別に重み付けした支出の平均を算出する(表 4 ) 処理 7 .処理 4,5,6の結果を、世帯 j 属性をキーに横結合し、データを規定課題の表に合うよう加工する . 処理 6のデータセットには各支出の変数ラベルの情報 処理 8 (消費支出、食料、住居など)があるので、 これを参照しながら CALLEXECUTEルーチンを用い、処理 7のデータセットの各支出の平均値 の変数ラベルに、元の変数と同じラベルを設定する 処理 9 .ODSRTFステートメントと REPORTプロシジャを用い、結果を RTFファイルに出力する ) 表4 第 2表のプログラム(処理し 2,6 *データの読み込み(処理 1 ); p r o cs o r t data=RDS.R̲G I J I(keep=SEQS e t a i J i n i nS h u u g y o u J i n i nW e i g h tEXPENSE:) O l l t = ̲G1 . J1n o d l l p k e y; e t a i J i n i n : 世帯人員, S h l l u g y o u J i n i n :有 業 人 員 ; bySEQゾ S r u n ; *各世帯属性の変数の作成と出力(処理2 ); d a t a̲ALL; s e t̲G I J 1; ̲ S e t a i = " O O "; ̲ S h l l l l g y O U = " O O ";o u t p u tゾ 総 数 ; i fS e t a i J i n i n = " 4 " ;S e t a i =S e t a i J i n i n;*世帯人員 4人の抽出; ̲ S h u l l g y o u = " O O ";o u t p u t ;*うち世帯人員が 4人 ; S h l l u g y o u = S h u u g y o l l J i n i n;o u t p u tゾ 各 有 業 人 員 ; i fS h l l u g y o u J i n i ni n( "1 "" 2 " )t h e nd o; ̲S h u l l g y O U = " X X ";o u t p u t;e n dゾ(特掲)1 人又は 2人 ; r u n ; (略) *支出の平均値(処理 6 ); o d sO l l t p u tSllmmary=̲MEAN p r o cmeansd a t a ALLI1lc a n;v a rEXPENSE:;w e i g h tWeight;by̲ S e t a i̲ S h u l l g y o u ;r u n ; 10 s e; o d sO l l t p l l tc 二 一 4 . 参考文献 [ 1 ] ~rtt 立行政法人統計センターホームページ.擬似ミクロデータの利用. h t t p : / / w w w . n s t a c . g o . j p / s e r v i c e s l g i j i ‑ m i c r o d a t a . h t m 1 .最終閲覧日 2 0 1 3 / 6 / 1 4 本論文には「疑似ミクロデータ(平成 1 6年全国消費実態調査 ) J (独立行政法人統計センター)を利用しま した。 532

518.

変曲点を用いた最低生活費の推定 ー疑似ミクロデータ(平成 1 6年全国消費実態調査)によるー 筒井一存奈 アストラゼネカ株式会社臨床統計・プログラミンググループ E s t i m a t i o noft h巴 minimums t a n d a r dofl i v i n ge x p e n d i t u r 巴b a s巴dont h巴 i nf 1ectionpoint i c r o ‑ a g g r c g a t e dd a t aof2004N a t i o n a lSurveyofFamilyIncomcandExpenditurcー ‑Usingt h巴 m AnnaT s u t s u i C l i n i c a lS t a t i s t i c s& ProgrammingGroup, AstraZ 巴n 巴c aK.K. 己回 要 背景と日的:最低生活費は生活保護の要否を判断するための基準であるが、設定方法には未だ議論が多 い。そこで世祐;主が女性の世侍:に注目しながら、変曲点を用いた推定を行った。対象:疑似ミクロデー タ(平成 1 6年全国消費実態調査)に含まれる 3人(有業 l人)の勤労者世佑:6 1, 284 世,倍。方法:世荷主 の性別ごとに世借属性の頻度を求めた。各世帯の収入階級 50分位を求め、消費支出の変曲点を 2つ の 回帰直線および非線形最小二乗法により求めた。結果と考察:世帯主が女性の世帯は全体の 1 1 .0%で 、 一般低所得世帯に占める割合は 41 .5%だった。変E!. u点と最低生活費は、 2つ の 回 帰 l 卓線による方法では 平均消費支出ヵ、ら求めると 2 . 9 1 分位、 225, 419f J ]、消費支出の白然対数の平均から求めると 3 . 7 5分位、 201, 078円、非線形最小二乗法で、は 3 . 7 0分位、 205, 048円(女性が世帯主の世帯では 3 . 0 6分位、 212, 625 円)だった c議論の余地はあるが、変曲点に某づく最低生活費の推定は意義がある可能性が示唆された。 キーワード:生活保護、最低生活費、変曲点、持制以ミクロデー夕、平成 1 6年 全 国 消 費 実 態 調 査 1 . 背景と目的 生活保護制度は、憲法 2 5条で保障された健康で文化的な最低限度の生活を営む権利を実現するための]つ 制民隈度の生活を営むための費用は段低生活費(生活保護基準)と呼ば の制度である。厚生労働大臣が定める i 荷たし且つこの基準を下回れば申請者は生活保護を受けることができる。 れ、他に定める要件を I 最低生活費の設定方法には未だ議論が多いが、現在は昭和 59年に始まった水準均衡方式に基づいている。 これは前年昭和 58年の中央社会福祉審議会意見具申(以下、昭和 58年意見具申)において「現在の生活扶助 基準は、一般国民の消費実態との均衡上ほほ、妥当な水準に達している」と評価されたのを受けて、以後は一 般国民の生活水i:(~の向 r.' こ見合った引き!'.げをすることにしたものである c この妥当な水準の検証には、変 曲点の概念が用いられた。変曲点とは「収入階級ごとの消費支出額を比較すると、所得の減少 i こ伴って、消 費支出はゆるやかに減少するものであるが(略)、急激に下方へ変曲する所得分位(図 1 )[ I ] J を見いだして 変曲点と解釈したものであり、当時はこの分位の消費支出を最低限度の生活を組持するための水準と考えた。 しかし今日の厚生労働省関係の審議会では、最低生活 ' . { ' i 'の検証には 533 般低所得│止帯(年間収入階級第 1 / 1 0

519.

分位層)の消費水準との比較が用いられ、変曲点による方法は報告書 には記載されていない。 よって本論文では変山点にもとづく最低生活費の推定を行い、方 法について考察することを目的とした。同時に、平成 1 6年に母子力J I 算のあり方が検証されたのを踏まえ、世帯主の性別の検討を行った。 消費支出 最低限度の 生活を維持 するための水準 / 変出点 2 . 対象と方法 対象は疑似ミクロデータ(平成 1 6年全国消費実態調査)に含まれ 284 る、現在の標準世帯に相当する 3人(有業 i人)の勤労者世帯 6 1, 収入階級 図 I 変曲点について である。 最初に世帯主の性別ごとに世帯主の年齢などの世帯属性の頻度を求め、次に変曲点を求めるため、年間収 階 級 50分位を求めた。その後、傾向を視覚的に見るために、収入階級層別に平均消費支 入から各世帯の収入 i 出と世帯主が女性の世帯の割合を出附した。最後に、 3つの異なる方法で変曲点を求めた。 1 し、られた方法である。散布図等から、各収 一つ目は 2つの回帰直線による方法で、昭和 5 8年意見具申でJl 入階級層の平均消費支出の収入階級に対する回帰の変出!点が第 x/50分位周辺にあり、第 1 / 5 0分位から第 x l / 5 0 分位まで、かっ第 x l / 5 0分位から第 x 2 /50分位まで同じ傾向にあると仮定できたとすると、 / 5 0分位から第 x l / 5 0分位まて、の回帰直線 第 1 y=alx+bl ~~ x l / 5 0分位から第 x 2 /50分位まで、の回帰‑直線 y=a 2x+b2 をそれぞれ当てはめることができる。この 2つの回帰式の交点の xが変曲点の分位、 yが最低生活費になる。 二つ目は上記と同様に 2つの回帰度線を用いるものであるが、反応変数としては消費支出の自然対数変換 値の平均値を用いるものである。この方法を用いた理由は、予備的解析をしたところ、収入階級ごとの消費 水準の分布は対数正規分布が仮定で、き、また対数変換することにより等分散を仮定できると考えられたため である。 三つ目は非線形最ノト二乗法による方法である。これは変曲点も lつのパラメタとしてモデ、ルに含め、 2 つ lN プロシジ、ヤを J Ht,、た。第 1/50分位屑 の回帰直線の回帰ノ fラメタと同時に推定するものであり、 SASの NL 品i 点を求めた。同様の解析 から第 X2/50分位層までを対象に、個々の消費支出の自然対数の変換値を用いた変 l を世帯主の性別に行った。 表 l世帯主の性別にみた世帯属性の頻度表(%)(不詳のぞく) 女性世帯 男性世帯 (n=54, 5 2 7 ) (n=6, 7 5 7 ) 抽出率調整を行った。 2 3, 909 ( 4 3 . 8 ) 1 , 436 ( 21 . 3 ) 世帯主の 3 9歳以下 1 8 , 3 8 1 ( 3 3 . 7 ) 2 , 4 2 1 ( 3 5 . 8 ) 年齢 40 ・ 5 9歳 ( 5 . 6 ) 3 , 0 4 5 6 0 歳以上 3 . 結果 694 ( 5 4 . 7 ) 5 3, 7 3 1 ( 9 8 . 5 ) 3, 就業・非就業 世帯主の性別の世帯属性を表 iに示す。 6 5 1( 3 9 . 2 ) 796 ( 1 . 5 ) 2, 就業の別 うちパート 世帯主が男性の世帯(以下、男性世帯)は 企業規模 1 , 592 ( 2 3 . 6 ) 9, 476 ( 17. 4 ) 1 ‑ 2 9人 1 5, 5 8 1 ( 2 8 . 6 ) 1 , 478 ( 21 .9 ) 3 0 ‑ 4 9 9人 5 4, 527世帯 ( 8 9 . 0 % )、世帯主が女性の世帯 5 . 8 ) 1 3 9 ( 2 . 1 ) 3, 1 5 8 ( 500‑999人 757世帯 ( 11 .0%) だ (以下、女性世帯)は 6, 1 2, 638 ( 2 3 . 2 ) 566 ( 8. 4 ) 1 0 0 0人以 k った。女性世帯は世帯主の 39.2%がパート 住居の 3 2, 055 ( 5 8 . 8 ) 3, 756 ( 5 5 . 6 ) 持ち家 1 2, 853 ( 2 3 . 6 ) 1 , 1 7 4( 1 7. 4 ) 、 11 .0%が県市区町村営賃貸住宅に 所 有 関 係 民 営 賃 貸 住 宅 で 、 倒jき .0 ) 2 . 5 ) 746 ( 11 1 . 35 1 ( 県市区町村営賃貸住宅 .5%が一般低所得者に分類された。 住み、 41 6427 ( 11 .8 ) 42 ( 0 . 6 ) その他 6 . 1) 2, 3, 3 2 1 ( 803 ( 41 .5 ) 一般低所得者 解析には SAS9 . 3を用い、集計には全て 。 534

520.
[beta]
1
0
0

5
0
0

収入階級層別平均消費支出と女性 j
H
:惜 の

8
0

みると、収入階級届が低くなるにつれて平均
p
h
U

辺 で 変 山 し て 急 激 に 減 少 することが雌訟で

ハ
υ

/
5
0分位周
消費支出が緩やかに減少し、第 3

4
0

きる。世帯主の性別にみると、低い収入階級
では女性世帯の方がやや消費支出が多くみ

(
日
)
令
一
‑
抑Q告
と
一
‑
一 L'd

‑
1:
;
0

割合を図 2に示す。全世帯の平均消費支出を

2
0

2
0
0

えた c 女性世帯の吉J
I
合をみると、第 1
/
5
0分

/
5
0分 位 層 で 50%を超えていた。
位層と第 2
0分位層
収入│階級 5
l
χ
1
2 収 入 階 級j
p
間J
I半
.
l
f
.
,J
消費支出と女性世帯の割合

凶 2の 全 世 帯 の グ ラ フ か ら 、 変 I
l
l
l点 は 第

3
/
5
0分位周辺にあり、第 1
/
5
0分位方、ら第 3
/
5
0分 位 ま で

2
4
0
.
0
0
0

と第 3
/
5
0分位から第 1
2
/
5
0分 位 ま で が 同 じ 傾 向 だ と 仮
r

定できた。この仮定:こ基づき、 3つの )
j
i
Lで・変 I
l
h点とこ
の分位の消費支出(最低生活費)を求めた。
2つ の 回 帰 直 線 を 用 い て 平 均 消 狩 支 出 か ら 求 め た 結

•

•

、2
2
0,
0
0日

ユ
コ 2
0
0
.
0
0
0

2
1
8
叩

O

u

変 Il点の分位・ 2
.
9
1
消費支出:225,
419円
9

I
1
0 I

巾
円

︑
・

出
支
費

日間開

ハ
り

¥J 司
﹁
Ji
ノ

主斤同︐平

市 H‑

1d

y=824x+223,
024(
R
'
=
0
.
0
4
9
)

時水

図

第3
‑
1
2
/
5
0分 位

山山操

y=38,
408x+113,
760(
R
'
=
0
.
9
1
9
l

7

J
L
Jだった。凹帰直線はそれぞ、れ、

1
4
0
.
0
0
0

6

1
6
0,
0
0
0
日川る
えよ

来を I
き1
3に示す。変 I
也点{土 2
.
9
1分位、消費支出は 225,
419

第 ト3
/
5
0分 位

•

•

•

2

であった。ここで Rは寄与率であり、 yは平均消費支出で

1
2
.
.
1

ある e

•

(

2つの回帰直線を介H、て消費支出の向然対数の変換値の

E 12.3

平均ヵ、ら求めた結果を図 4に示す。変!山"灼1
1
)

ミ12.2

T
費号支出は 2
引
01
,
仰
078円だだ、つた c 回帰直線はそれぞれ、

ご 1
2
.
1

第 ト3
/
5
0分 位

y
=
O
.
1Ox+11
.8
3(
R
'
=1
.0
0
0
)

第3
‑
1
2
/
5
0分 位

y=0.015x+12.16(R‑=
0
.
5
1
7
)

)

.
:
r
‑
f

ぎ1
2
.
0

変H
l!点の分位:3
.
7
5
消費支出:2
0
1,
078f
I
J

11
.9

であった c ここで y
i立平均 l
o
g
(汗i
持支出)て、ある。

6

非線形最I
J、二乗法により求めた変 I
1
1
1点をほ15に示す。第

1
/
5
0分位層から第 1
2
/
5
0分 位 層 の 聞 の 変 1
1
1
1点と消費'支出を

x
<
3
.
7
0の場合

y=0.094x+1
1
.
8
8

x
z
3
.
7
0の場合

y=0.0085x+1
2
.
2
0

9

1
0 I
I

収入階級 .
5
0分位層
j
)
g
1
4l
i
J
J
'
H
l
i
l
直線による結果(平均 l
o
g
(消費支出))

求めると、変 H
h点 は 3.70分 位 (95%信頼区間 2.63‑4.77) 、

05,
048円であった c 符られた式は、
消費支出は 2

8

1
5
三
三 I
1
士二

1
3

7弐

ご
字 12

であった c ここで yは l
o
g
(消費支出)で ある。

。

)

.
8
6分位、
同様に世帯主の性別に .
>
f
とめると、男性世帯は 3

変曲点の分位:3
.
7
0
消費支出:205,
048J
T
J
9

1
01
1 1
2

果
結
る

¥ヨトレド

7 M W法

8 位1

線

帥二

︐

J

トドドー
JJ
イ

︑
戸文

535

日乗
5
l

3

日

5ph4hd

1
0

l U品
H形

2
0
1,
175II]、女性仕上帯!土 3
.
0
6分位、 212,
62511
J
だった。

三E

'
"1
1

521.

4 . 考察 本論文で使用した擬似ミクロデータのオリジナルデータである全国消費実態調査は、最低生活費の検討に よく用いられてきた。しかし世帯主の性別の検討はあまりなされてこなかった。結果から、女性世帯は相対 的に収入が低い傾向にあり、 4害J Iの世帯が一般低所得者に分類されることがわかった。 最低生活費を考えるとき、一般的にアプローチの方法は絶対的水準論と相対的水準論に分けることができ る。先進国では相対水準論による方法がよくJlJし、られ、変曲点による方法は相対水準論による方法のひとつ である。 . 9 1分位から 3 . 7 5分位であり、この分位付近は女性世 今回の 3つの方法で求めた変曲点の範囲は収入階級 2 l l点の分位はその交絡の影響を受けている可能性が考えられた。 2つの 帯の割合が大きく変動していて、変 H 回帰直線から変曲点を求める方法を比較すると、消費支出を自然対数に変換するか否かで分位点が 0 . 8 5異な 4 . 3千円違っていた。寄与率 R2f 直をみると消費支出の自然対数への変換値を用いた方が凹 り、最低生活費は 2 帰直線へのあてはまりがよかった。これは経済データの性質として対数正規分布によく従うという理由に加 えて、疑似ミクロデータの性質によるという理由が考えられる。 消費支出の向然対数への変換値を j目いて 2つの回帰直線から求める方法と非線形最小二乗法を比べると、 変出l 点の分位の差は 0 . 0 5、消費支出の差は 4 . 0千円と大きく変わらなかった。非線形最小二乗法は算出 H 寺に 変出i点の分位を事前に仮定しないので、より客観的な手法といえる。 過去の変[lIll~i、と最低生活費の報告をみると、昭和 58 年五:見具申では 2.99 分位、 157 ,943 円(勤労者 4 人(有 業 I人) t 止帯)、平成 1 5年の第 2回生活保護;j j l J度の在り方に関する専門委員会での 3 . 7 0分位、 216, 740I 工J( 勤 1 )。平成 1 5年の検証の変曲点の分位は非線形最 I J、二乗法による方 労者 3人世帯(夫婦子 l人世帯))だ、った [ 法に等しいが、最低生活費は 11.7千円異なっていた。平成 1 6年当日寺の標準 3人世帯 ( 1級地)の保護基準 1 6 2, 1 7 0円と比べると、本推計の方が最低でも 3 8 . 9千円高かった。 さらに絶対的水準論によるマーケットバスケット方式(全物量積みヒげ方式)を使った試算をみると、首都 700円であった [ 2 )。本推計はこれより低く、この 圏に住む 30代夫婦と未婚子 l人世帯の最低生活費は 278, 前一たせるか詳細に検討する必要がある。ただし限界点として、データにはない尻ー 額て、最低限度の生活水準を i 住地域と物価の差、および世帯主以外の世帯構成員の属性を考慮できない。 最後に世帯主の性別に変山点をみると、女性世帯の収入階級はかなり低いものの、最低生活費は男性世帯 とそれほど変わらないことが確認できた。変曲点が意味することについては議論の余地があるが、変曲点を 世帯のように低所得者を多く含む集団で、は有意義 用いた最低生活費の推計は、女性世帯を多く含むひとり親 1 である可能性がある。 5 . 参考文献 [ 1 ] 厚生労働省ホームページ:資料 l 第 I凹部会における委員の依頼資料,第 2回社会保障審議会生活保護 基準部会資料.http://www.mhlw.go.jp/stf/shingi/2r985200000Id2yo.html. 最終閲覧日 2013/6/ 14 [ 2 ) 金津誠一 i 現代の貧困」とナショナル・ミニマム.高菅出版.p . i 首都圏最低生計費」の試算の概要 239・ 255, 2009年初版発行 本論文には「疑似ミクロデータ(平成 16年全国消費実態調査 ) J (独立行政法人統計センター)を利用しま した。分析結果は実証研究の結果とはみなせません。 536

522.
[beta]
規定課題解答
J:
J
:
I
優子
パナソニック株式会社

モノづくり本部

生産技術開発センタ一生産技術研究所

0である。
それぞれ、再現すべき表の次に再現した表をぷす。照合部分を太線で閉った。使用ソフトは JMP1

<付録>基礎集計表

 1 1     

:

付録基礎集計表

L
n 旦tト    {     iを.Iit耗     

 1





I J人 I .,人 I :
;
}
.

~. ;
:
j
!
守ト!.o:!;

~

¥
I
H

I

も, l~

1
.1
  :w玉 置.....置掴.

ーも"

2
.
:
'
:.
3
<
:
<

;..ôl4~

も
‑

:
'
.
1

1
.'
J
3
1

5
5
9

二J
:
:



S
二a

2
lC

1
0
1

'
宅

3
.:
1
ヲ1 盟 国 ̲

c

l
.o
n

5
6
i
9
1

日J

4
i

。

2
'
>
3


"

~~

υ

1
,~

l
:
!

"



.


I 2

5huugyouJinin
有業人員

1
2

2
'

︒

7 品︑ J i i F 8
2
; 5 5 2 ︐﹄
6
0 2ヲ 4 9 6
2
31
32
31

一人入人人人入竺

lJ計則│﹂

日﹁

2人

た も の3

d

1
0
' すべて

o
i 13913

1
2

d13459

3

0
: 2950

4

0
1

691

0
:

40

6

0
:

6

w

3
:

968

すべて

3
! 32027

 1‑2表     
 1‑2表      {          Y
苛衆告で重み付りして、カ内ントしたものぬ)
総数

I
世情人員
D主,I人
[ J  G  I"
^
I
b入 r =  I"
" I"
" II人
l3 1
:
1
:
;
,0
'
‑
' i
S
主
.
6
;
',
'
t
5
1
1
f 1
;
.
1
5
1
う

喝

~50

一山日 1
引 284 闘 ~2. i
4
0
20~.i::3
5
u
,1
3
8 51
.5:3""'::
古.(lu
Q
.
11
.
H,
o 1
5,9
l
2 1
5
.
(
1革
九百 6
3
H
.
:
.
1
Gき
1
,
8
5
1 3
,
3
1
五
l
:S
I
:

3
.
8
1
3
!
)
.~(}1

J
.
3
0
2
。
4
。
。
目
。
。 ••'0
ヲ。
,
.
¥
白
、H
,
0
0
f
, 吋
J
Z
O t
2
J

!
E

.
1
. 1
l
i

q

:
!
.
!
i官

5
.
0
3
1
1
8
3
1
2
.
J
J
u

,
!l
9
i

1
.1~、5',・,

'
i8
1
9
5

白
3

1
G
l

1
71
]

1
.
:
;
五

4
'
;
2
}
(
O9
5
1

J
.
i
't
i
j

t日
二i

2
0
i

3
3

"
H
!




U

Weight
集計用民事
Setai
Ji
n
i
n1!!:帝人員
ShuugyouJinin有業人員

2

3

4

5

6

7



合計

合計

畠匙

合計

合計

合計

合計

ι
;
;

1

64691 61284

2

50138 51523

3
4

15912

5
6

w
すべて

9
1
合計

22740 3813 831 84
2961 6801 2336 441
7963 3302 1137

76

205723
36

8
0
1 108
49 5
1

1006 3287 4216 3519 1761 727 401 170
115835 132005 155850 67565 17161 5611 1197 207

重み:W
eight
集計用東率

537

合計

.1219743

4851 3345 1354 422 195
383

10 すべて
合計

日41
44

10168
570
9
3
3
1 15120
331495465

523.
[beta]
第 1‑3表 世 帯 数 分 布 (
10万分比)
白
目 1‑:;表位帯数分布(10万分Jt)

││ ~
昆世

1人

4
1
.
5
2
1
3
.
8
6
9
:
:
!
.
0
5
2
1
1
5

1
3,
0
5
1

2
6
.
6
i
3
1
2
.
3
6
9

1
0
.
1
1
9

1
0
.
3
9
9

2:~.3j9

3
.05~

3
1
.‑
i
5
E

。 3.211

2
0
3

I"A I6人 o人 I"
" I9 A I同人

3
.
1
5
2
9
i
9

。

6人
不詳

川

L..2人

1
0
0
.仔0
0
IH.351

。

t
o
4

1
3
司
,3
7
4
,
5
9
0

3
.
4
6‑
1

1
.
1
3
2
l
f
X
e

2
‑
J
:
!

・
i
勺

5
.,
]
i
7
1
.乙
ゆ7
り7
5
7
7

1
.3
7
3

.
.
J
I
I

i
{
.
>
6(
宮7
3

Z
:
!
9
8
5

8
9
1
;
i
:

'
伝

~2

。

1
‑
1
‑7

8
1

8
5
1

ー

、
一

i
l
O

3
9

。品

1
u
・
3
'
>
5

4

<
2

3
1

10万分比
Setai
Jinin世帝人員

ShuugyouJinin
有業人員

2

3

4

5

6

7

8

9

合計

合計

合計

合計

合計

合計

合計

合計

13381 4590

1

13057

770

168

17

2

10119 10391 13092 5977 1373

471

89

666 229

15

I

3

3211 3152

4

979

1607

41521
7

8889

85

77

16

22

10

10

710 355

147

81

34

7

23379 26643 31455 13637 3464 1132

242

42

71100000

6
203

すへて

合計
44351

675 273

5

w

10 すべて
合計

664

851

39

2052
115
20
3052

重み: 10万分比

第 2表 支 出 ( 消 費 支 出 及 び 十 大 費 目 )

再現
Weight
星!
t
用疑事
Setai
J
in
i
n
世帝人員

平均

4201

住居 YOB4
光酌・水道
V037
消酉茸出 Y038
宣 明 Y079
305234
71543
66299
1
1
m
7
5
5
6
i
;
78472
64868
347740
206

3

1031

15615

380521

83796

4

324

399962

vv

256

4851
4216

85083
82134

すべて

9944
32027

155850
495465

ShuugyouJinin
有量人員
4
1
1
2

すべて すべて

N

Y089軍具・家事用品

Y099
描臆丑び履噛
13579
8
8
9
3
8
1
7
3
i
14876

合計

4132

3
2
8
1
4
0
1

76362
7
2
8
8
3
1

10276

16561
14096

以

間
1
1
1
5
即
2
5
3
4
8
3
5
4
;
i

17687

1423B

1
9
2
3
8
'

4452
14138

9204

車i
h
:W
eight
集計用車車

=争

Y117偉 瞳E唖 I
Yl22空軍・遇摺 Y129
鞄 資I
Y133
担 曹 棋 聖 Y142
その他の消賢主出
11656
57801
4
2
7
0
3
1
31282
3
3
3
1
9
6
8
5
9
1
i
76078
10538
5
2
1
4
1
'
39485
;
1
121160
22513
10331
4
1
5
2
41
0
6
148628
1
日8
12
4509
3
2
7
5
13
6
<
l
2
7
8
6
0
6
5
9
q
2
6
;

帽

d

3
8
2

自

七8

10011
10987
1
1
3
6
6
1

538

4352

49453

4789
47961

33442
2
2
2
7
0
1

312
322
3
1
3
8
9
'

94942
7
5
5
8
8
1
820031

524.

世帯人数 4人且つ有業人数 l人 X は 2人の t t t帯 1 8 8 5 4 ' 20621 8383 ‑ ‑ 2 ー すべて 8917 8647 19728 重a ‑ t :Weight集計用車率 二 争 l i Y117 保健医療 Y122交通・通信 IY129教育 Y133 教聾践楽 j 吋 吋 判 明 1 0 5 3 8 i 以上の用に、各表を再現できた。 539 5 2 1 4 1 1 Y142モの他由消費支出 39485' 336811 1 5m 352981 328101 66839 76078

525.

家計簿から見た「世帯人員ごとの幸福度」に関する研究 土井優子 パナソニック株式会社 モノづくり木部 生産技術開発センタ一生産技術研究所 TheDegreeofHappinessR e s e a r c h e dbyHouseholdAccount Yuko001 P r o d u c t i o nE n g i n e e r i n gL a b o r a t o r y , P r o d u c t i o nE n g i n e e r i n gDevelopmentC e n t e r , G l o b a lM a n u f a c t u r i n gD i v ., P a n a s o n i cC o r p o r a t i o n 要旨 内閣府が公表している「幸福度」は、個人の主観的な幸福感を上位概念として算出している。これに対 して本研究では客観的に家計簿から凡た「世帯人員ごとの幸福度」を算出するべく独自に分析を行った。 「擬似ミクロデータ(平成 1 6" F全国消費実態調査)Jから、「主観的幸福感」に深く関連すると考えら れる家計簿の項目を抽出し、そこから世帯人員と幸福度との相聞を分析した。項目ごとに結果は異なっ たが抽山した全ての項目から事福度を算山した結果、 j l t帯人員が 9人のときに幸福度が最も高く、 4人 である場合が最も幸福度が低いことが分かつた。これより主成分回帰分析を行い、幸福度の予測式を立 てた。 キーワード:幸福度、家計簿、相関、主成分分析、重回帰分析、主成分回帰分析 1.はじめに 一般的な「幸福度 J とは、幸知j ) 支を数値で見えるように定吐化した指標であり、内閣府が「新成長戦略」 8日閣議決定) (※ 1) をうけて調査して発表している。この調査は r~ 主観的幸福感』を (平成 22年度 6月 1 上位概念として経済社会状況、心身の健康、関係性を 3本柱として指標化した」ものである。 6年全国消費実態調査 ) J (独立行政法人 今回の研究では、「擬似ミクロデータ(平成 1 統計センター)の データの中で分析するために、家庭の家計簿カ、ら幸福度に関係していると考えられる指標を抽出して JMP1 0 で分析し、独自に「祈帯人員ごとの幸福皮」に関する分析を行った。以下、提供されたデータの名称は基本 的に図中でラベルと名称をあわせて表記してあり、計算式を用いたものは新たに名前をつけた c 2 .幸福度の評価基準 表 lに示すように、幸福度の基準となる家計簿の項目を選び、上記で述べた「経済社会的状況」、「心身の 健康 j、「関係'生」に分類して分析した。イ可に重きをおいて幸福とするかの主観的な幸福感は人それぞれであ るが、 般的:こ人間はどのようなときに幸福であるといえるかを基準にして、何人快帯が一般的(こ幸備なの か、それはどのような家計になるのかを考えた。それぞれの分析方法は各分析結果に示す。また与えられた 541

526.
[beta]
データ数は 32027件であるのでこれを集計用乗率によって重み付けして、 1
0万分比にして分析した。
注意点として、下記の分析の中で 1
0人世情は各種傾向に沿わないことが多い。これは統計のサンプル数が
少ないためである c しかし各世帯数を全て同件数集計してしまうと実態とは異なる分布になる恐れがあるた
め、今回 1
0人世帯のデータは傾向を論ずる際に例外とする場合も設けた。また、支出をまとめて分析してい
ないのは、支出の中の項目ごとに傾向があるので、それによって幸杭度を考察しようとしているからである。
表 1 分析項目
間E
悪性

経活社会的状,)t

心身白檀量

世帯人員

量密言霊

鞄聖偏韮

有軍人民

童事

主空軍買

実'
l
l入
照貯古
負債

3
.分析結果
3ム 経 済 社 会 的 状 況
まず経済社会的状況の項で世帯人員ごとにグルーフ。分けして分析したところ(図 1
)、有業人数は世部人数
に対して増える傾向にあるが相関はない (R2=0.0608) ため、人員構成だけでは幸福度の判断は難しい。次に
) 世借人数 1
0 人を除くと、
その世帯全体の実収入の傾向を見た。(図 2

i
引i
;
:人員と実収入には相関があり

(R2=0.9868)、預貯金も同様である (R2=0.9933)c 経済的に豊かであればあるほど、人(土幸せであるという

研究もあるため(※ 1
)、実収入および預貯金から見ると世帯人数が多い方がのーかであると言える。負債は総
額でみると相聞がないが一人当たりの負債を見ると 8人が概小になっており、幸福度は 8人世 4
1
Tが高いとい
える。(図 3
) ここで負債とは、土地家屋借金返済、他の借金返済、分割払い・一括払い購入借入金返済の総
計である。(ここでの傾向は 1
0人世帯を例外とした)

‑
,̲

̲
‑
,,.
̲̲

世編入貝と且明生会的 t
末現

,~

c
γ

日.,~)'o"".A.

図 1 世併人員と有業人数

1 2 3

<
1

∞叩凹臼

CS;

∞田町田

c・
.
c

25000

211

C又

(gagpuh罰︿l ︺宮跡

m

S Jヘ巴似

側側

M
司

﹀冒

C 7J

寧均({}

•.
・
..•

.
I
C

ー平均(Y17!M
貯盆}5000

100000

。

‑平均(YOO3
実 収 λ}

・
.

600000

u
明
主

i
‑
"
・

・
・
.
' .
.

7000001

.
‑

孟

5 6 7

a 91011

S
e!al
Jmu'包楊人員

図 2 世幣人員と経済社会的状況

2

4

6

8

10

Set
d
l
J
t
n
i
n世 格 人 員

図 3 一人当たりの負債

3
.
2
. 心身の健康
身体が健康体であれば幸福度は高いと考えられる。つまり保健医療費は低いほうが幸福である。世帯ごと
の平均出費を見ると、人員が多いほど保健医療が増加する。(図 4
) (10 人 tll: ;~g: を例外とする)これはひとり

i
?で見ると一年間で・誰かが医療機関にかかっ
ひとりの医僚機関にかかる頻度に世併ごとの違いは無いが、世 f
ている確率は人員が多い桂高くなるためこのような結果になると考える。しかし今回は世帯ごとの幸福度を
考えるので、世構内の誰かが病院に通っているのは好ましくないとした。

) という研究を参考にした。これ
次(こ心の¥f;f,7;度を家計簿から読み取るために、「料理!と幸せの関係J (
※2

542

527.
[beta]
によると料理の頻度が高いほど、自分が幸せだと感じている割合が増える。ただし収入が多いほど幸福度が
高いのは前述した通りだが、料理の頻度は世帯収入とは相関がないという。これより料理に使った費用で幸
福度を与えられる。したがって家計簿において食料の中でも調理食・外食等に対する料理に使ういわゆる「食
材」の割合を分析した。(図 5
) すると、世帯人員が多し、ほど食材の割合が高かった。世相:人数が多いほど「内
食」傾向にあり、幸福度が高いといえる。
3
.
'

•‑

25000
20000

.
‑.
.

15000

6

8

3

t
: 2.8

信

5000
4

禍

1
>
"
6
同

‑••

10000

:
; 3
.
2

2
.
6

E
S 2
.
4

‑Tm

(豊凶担感 h H H﹀)
E
N昨

30000

.
.. ,

守

i
f
"

2
.
2

砂

2

6

5etai
Ji
n
i
n世 帯 人 貝

1
0

5et
a
l
J
t
n
i
n住 用 人ω

図 4 世帯人員と保健医療の関係

図 5W仏人員と食料の訴i 理食 till ・外食に対する ~~?iJfì の関係

3
.
3
. 関係性
関係性は、本来自分の成長に用いる時間j
や、社会や家族など、自分以外とのつながりに満足して幸福を感
じているかどうかを考える項目である。自己投資をしているノ¥は、していない人よりも人生が豊カ であるし、
人とのつながりは人生で大きな意味を持っと考えられる。ここでは家計簿の中で、自分の教養を高めるため
に使った費用として習い事などの教養娯楽、また人との付き合いを充実させるための交際費を対象として分
析した。(図 6,
7
) 結果より、交際費は 4人世帯までは急低下して、その後はほぼ横ばい、教養娯楽もほぼ横
ばいである。 (10 人世帯を例外とする)つまり、世品・人数が少ない場合でも関係性において幸福度は高い。
これは世帯人数が少ないとそれだけ外に向ける交際費や、自己投資にあてる H
寺問も金銭も余裕があるためだ
と考えられる。 4人以上の世帯では、世構内での用事や交流が多いのではなし、かと考えられる。
(U盟
R 匝総門門同﹀

,.

'
¥
、

。

6

B

'
¥

4

叩

'
¥

)E 川町

10000~

T
‑

と

"
耳 50001

••••••• •
4

6

B

1
0

)!
n
i
n世帯人員
SetaI

Se旬I]inm世予詩人員

図 6 世帯人員と交際費

00000000
00000000
00800000
05050505
4332211

300
口
̲ 25000;
l 込 . ・4
200001
' ¥ 戸 ‑ ..
.
目..e‑・
反 15000{̲戸 ' ¥

ヨ

止
,l
i
:人員と教養娯楽
図7 │

4
.幸福度の算出
前述の世帯人員と各項目の関係から、総合的に見た I
引詩人員ごとの幸福皮を算出した。表 lの項目の有業
人員以外で、世帯人員ごとに幸福度の順位をつけて、順位の平均を求めてこれを幸福度とした。このとき、
項目ごとに重みは設けず、全ての項目を平準化して考えた。幸福皮は順位から計算しているので、値が lに
近づくと幸福度が高いといえる。(図 8
) これより幸福度がもっとも高いのは世帯人数が 9人で、 4八のとき
に幸福 j
支がもっとも低くなることが分かった。
またこの結巣から幸福度の予測式を算出した。この幸福度の算出には幸福度と相関の低い、 10人世惜のデ
ータは除外した。家計簿各項目問では相関がとても強 L、ため、重回帰分析ではなく主成分回帰分析を行った。
まず世借人員、有業人員以外の表 Iの 7項目の平均家計簿から、各 t
仕掛人員に対して主成分分析を行った。
そして主成分を累積寄与率が 92%以上になる 2個に設定し、(図 9
) それらの主成分から重回帰分析によって

543

528.

予測式を立てた。(図 10) つまり、自分の刊計;-人数と各種家計が分かれば、 9 点 ~1 点、の幸福皮ポイントを算 出できる。点数が低いほど幸福である。元のデータから計算したこの予測式の当てはまりはR2=0.913であり、 1 ) 良く当てはまっているといえる。(図 1 1 .0 5.0 7.0 ・ ‑ . ‑ ・ . 9.0 4 8 10 世帯人員 図 8 世帯人員と幸福度の関係 固有値 醤号 固有圃 … 20406080 累 圃 寄 与 率 寄与君臨 1 5.8673 7 3 . 3 4 1 1 2 3 4 1 .5 加 山0 6 0. 41 89 5 . 2 3 6 1 1 0.1114 1 .3 9 2 1 5 6 7 0.0715 0.0014 0.0010 ~. I 73.341 七一一汁 0 . 8 9 4 1 0 . 0 1 8 1 0 . 0 1 3 1 1 ¥ 97.683 ) 99.075 ~ ~ ~ 99.969 99.987 100.000 あてはめの要約 R 2乗 4 . 5 自由度調整 R 2乗 R M S E ) + ー 0. 4994087258342本主成分 1 誤差の標準偏差 ( 予測式 + ー 0.1463194252369本主成分 2 図 9 累積寄与率 図1 0 予測式 0 . 9 1 3 0 8 5 0 . 8 7 8 3 1 9 0. 44 6 5 1 2 Yの平均 4.5 オフザペーション(または重みの合計) 8 1 予測式のあてはまり 図 1 5 . まとめと考察 幸福度に関係すると考えられる家計簿 7項目を用いて、それぞれの家計簿と世帯干人員の幸福度の相関を把 握することが出来た。この相関から各世帯人員の幸福度を算出した。そしてこの幸福度と、各世帯人員の平 均家計簿 7項目との関係から、主成分回帰分析によって幸福度の予測式を立てることができた。このように 世帯ごとの幸福度が予測できると、自分がどれくらいの幸福度の世おに属しているのか調べられる。そして 予測式を用いて今後の幸福度上昇のための計四が立てられる。 今回、幸福度として 7項目で世併ごとに順位をつけて全ての順位を同等として単純に平均したが、也‑ f i Eの 年鈴構成によって項目ごとの重みが変わると考えられる。つまり例えば若い人が多い世帯なら教養娯楽や交 際費が多い方が幸福度が高いので平均する際に重みが重い、また世帯全体の年齢が高いほど保健医療現'の重 i t常人員の年齢が不明なため実施してないが、このような考えを導入すれば、今 みが重い、などだ。今回は t 回の幸福度予測式の他ーは大きく変化するであろう。今回はさらに日本の現状から考えて、一例として幸福度 の分析対象に表 lのような項目を用いたが、海外の世併に適用する際、は項目ごとの順位の重み付けを国によ って変えたり、この項目自体を憎やしたりすることでより精度を高められるだろう。 6 .参考資料 ※ 1r 幸福皮に関する研究会報告ー幸福度指標試案ー」概要 平成 23午 1 2月 内閣府経済社会総合研究 料理と幸せの関係」太宰潮 ※2 r ※ 3 r~お金はあればあるほど幸せ』米研究紹介 URL: 1 lt 1p : l l w w w . a f p b b . c o m / a r t i c l e / 2 9 4 1 4 6 9 / 1 0 6 6 4 2 1 5 このレポートでは「慌似ミクロデータ(平成 16年全国消費実態調査)J (独立行政法人 利用した。 544 統計センター)を

529.
[beta]
教育用擬似ミクロデータを用いた
収入・消費傾向の考察
富里遼太,土生敏明,米倉孝俊
大鵬薬品工業株式会社データサイエンス部

Thed
i
s
c
u
s
s
i
o
noft
h
eincomc‑consumptionp
r
o
p
e
n
s
i
t
y
Is
i
n
gpseudomicrod
a
t
af
o
re
d
u
c
a
t
i
o
n
.
byl

RyotaTomisato, T
o
s
h
i
a
k
iHabu, TakatoshiY
O
n
e
k
l
l
r
a
t, TaihoP
h
a
r
m
a
c
c
l
l
t
i
c
a
lCO.L
td
.
DataScienccDepartm巴n

要旨
独立行政法人統計センターが作成した教育用擬似ミクロデータをJl
H、て,指;定された規定課題及び自由課
題の結果を報告する.規定課題で指定された同センターの集計結果の再現は, SASの FREQ及 び MEANSプ
,
ロシージャを利用し実施したので,その過程の概要を示す.自由課題のテー 7 は

ミクロデータを用いて実

支出における黒字世帯,赤字世帯の消賀'の違い,史にその位代差について調査した.その結果と考察を提示
する.

キーワード:教育用擬似ミクロデータ,収入・消費傾向,黒字・赤字世帯

l.使用ソフトとデータセットの作成
規定課題,自由課題のいずれも SASv
e
r
9
.
2を用し、て解析を行った

SASで解析を行うため,擬似ミクロデ

ータの元データである 7分割された CSVデータを lつの SASデータセットとして統合し,変数名やラベル
は「統計センタ一一l
a
y
o
u
t
̲
c
o
d
e
.
x
l
s
J と「統計センター v
n
a
m
e
.
x
l
s
J に合わせた.収入・支出に関するデータは
数値変数,それ以外の世帯に関する情報は文字変数として扱い,データ内容に対する符号は SASのフォー 7
ットとしてあてた.作成したデータセットの一部を図I.lに示すー
時匂間野?私一

議器盟丘

両 Z

2
. 規定課題

拘ち;J."{1!Iョr..~ら A'
持ち,~,曾司,.名~,

拘号~,芭寺周名景、

̲
.
<
:
:
;
;
1

‑
.
:
=
j
l

.
"

規定課題である第ト l表,第 1
‑
2表,第 1
‑
3

?唱
す治

表の再現は世帯数の分布であるため FREQプロ

目
,
,
'
令
"

Jし、て行った.第 ll表は TABLE
シージャを H

寸~I ,

ステートメントで["S
h
l
l
l
l
g
y
o
l
l
J
i
n
i
n
*
S
e
t
aリi
n
i
n
Jと
" 1
"芳

戸
、E

‑
.
<
;
;
・
‑
<
>
;
1

.
.
‑
,
;

.(
剥

一声"

宇治
T"

が可能であった.

..iij~

‑
<
>
1
1
戸理

‑
=
1
・
‑
<
:
;
;
!

:
n
J

指定するだけで SASのアウトプットトーで再現

‑
.
<
>
j
l

̲olt

,
,
'

,
,
'
.
j
̲
!

司

一
言
・

す
、
,
1
:
,
.

‑
;
:
:
;
;
1

白

l
!

‑>:¥)

‑
i
"
i
i
!

戸
.

問
ち
写
〈
曹
司
書
貝
名
"
,
阿
ろ
夢
'
"
署
銅
右
民
》
伺
"
医
,
.
警
備
名
'
"
J
阿
久
夢
{
1
!
.
.
I
.
:
o
轟
伺ろT'.司書'~IU
伺
ち
.
.
,
曾
ヨ
.
.
各
.
,
問
,
.
.
,
瞥
署
員
色
属
、
問
ち
.
.
,
瞥
署
員
色
直
)
拘
ち
夢
(
1
i
I
:
;
J
.
I
I
I
も
買
〉
開
ち
司
区
'
"
号
.
:
o
J
l
)
伺
,
.
.
,
曾
ヨ
,
.
右
翼
,
"
J
"
(
曾
署
周
右
翼
伺ミ
内
ち
司
区
《
曹
司
署
員
各
'
"
阿
久
夢
(
宮
署
.
名
質
問
ち
司
区
〈
曾
芸
周
包.
.
詞:
:
'
1
医
〈
曾
ヨri.l.:f, JI、
S

鈎::''J."(世号.~~、

伺 ::'1医t 曾~・右翼3

何ミ夢《曹司書貝~..'

同1.1 作成した SASデータセット

545

530.

第 1・ 2 表は第 1 ‑ 1 表に重みを考慮した表であるため, WEIGHTステートメントで変数 rWEIGHTJ を指定 して実行した. 第 1・ 3表は第 l ・ 2表の 10万分比であるため,重みを r100000x重みム重み付け後の総世帯数」に置き換える ことで再現した.これらの解析に用いたプログラムの代表として第 1‑3表で用いたものを図 2.1 に示す. ト 呪 ー方,第 2表は連続量である消費支出の分布であ るため MEANSプロシージャを使 J I Jして再現した. V A Rステートメントでは各支出(消費支出 その他 の消費支出)に対応した変数を人れ,重みを考慮す るため第 1‑2,1・ 3 表と同様に WEIGHTステートメン トで変数 rWEIGHTJ を指定している.なお,表内 1 ‑ 3表 ネ procf r c ouala~work 1 : t a b l eS h U U ! ! v o u J i n I n * S e t l lりi n i n/norown o c o ln o p e r c e n tout=work2; \....~ight w cighに r u n ; I procmeansdata=work2n o p r i n t ; v a rC O l l nt : o u t p u tout~work3 叩 m=sum; r u n ; u a t an l l l l 5 e twork3: c a l ls y m p u t ( ' ¥ ul 1 ぺcompress(put(sum, b e st .) ) ) ; での集計カテゴリーが全世帯,世帯人員が 4人であ る問:帯, 4 人附帯のうち有業人員が 1~4 人・不詳の I flln; u a t alVo r k 3 : 場合,及び有業人員が 4人世帯のうち l人または 2 I 人の場合であるため,実際のプログラムでは条件を Ir u n ; WHEREステートメントで指定し,条件ごとにプロシ t i t l eU出 I . J表". J = 、N o r k 3 : procf r c od a ti t a b l eShllu~vollJinin 牟 seta リ inin /norown o c o !n o p e r c e n t ; !h t, , ¥' c i: e h t1 0 : w c i1 u u g y o u j i n i n . ; f o r m a ts h u u g y o u j i n i nSミh Ir u n ; ージャを実行している.これらの結果を OUTPUTス テートメントでデータセット化し,それぞれを統合 日 t¥ ¥ ' 0此 1 : ヘ¥'eight; w e i g h t l Oニ 100000/&山 m, PRINTプロシージャでアウトプットしたのが閑 2.2 図 2.1 第 1・ 3表を再現するためのプログラム である. c a t 家主主主 世 帯 人 員 が 4人 2 3 4 , J I 2J 平詳 、 主 ミ 土 ニ 、 黒計世帯聖堂 捧計用語早 32027 官 官4 4 4132 4 2 0 1 1 0 3 1 324 256 8333 ヨ5465 d 1 5 5 8 5 0 ヲ 662ヲ 64868 1 5 6 1 5 4 8 5 1 4216 1 3 1 1 6 8 省主眼及 7 5属 物 保健医用 女:亜. ; 9 .t 云 1 4 1 3 8 1 4 4 5 2 1 3 5 7 ヨ 1 4 8 7 6 1 6 5 6 1 1 4 0 ヲ6 1 4 2 3 8 1 4 2 2 1 1 1 3 6 6 ヨ87 1 0 1 1 6 5 6 1 0 5 3 8 1 0 3 3 1 1 0 8 1 2 1 0 0 1 1 1 1 1 0 3 4 7 9 6 1 478 ヨ4 42703 5 2 1 4 1 52406 51310 4 3 5 2 1 d i 3 7 1 328140 335438 305234 347740 3 8 0 5 2 1 3ヲ9962 ヲ8 82 37 326256 執育 22270 33442 31202 3ヨ 485 22513 4 5 0 9 ヲ4 53 4 35298 72883 76362 71543 78472 ヨ6 837 85083 8 2 1 3 4 7 4 ヲ7 0 1 7 6 8 7 15345 17556 1 2 ヨ32 12583 1 8 5 0 0 24296 1 5 2 6 ヲ l ヨ238 20214 1 8 8 5 4 2 0 6 2 1 23045 224 官 。 22238 1 9 7 2 8 事民警揖車 その他の消費三官出 31389 32269 5 ヨ 3 1ヨ 3 3 6 8 1 27852 ヨ 3276 31206 32810 82003 75588 5 7 8 0 1 76078 1 2 1 1 6 0 148628 94942 6683 ヲ ヲ2 04 8885 8383 ヨ1 7 S 1 0 2 7 6 11763 7843 8647 火 │12.2 規 定 課 題 第 2表を再現した SASアウトプット 3 . 自由課題 3 .1.序文 今回, 2004年当時の収入・消費傾向の調査と分析に焦点を当て,その中で特徴ある支出項目をピックアッ プし,その背景に何があるのか考察を行うこととした.すなわち,仮説ありきの検証的な研究ではなく,結 果から原閃を探る帰納的な探索調査を実施した.その調査方法については次節で述べる. 546

531.
[beta]
3
.
2
.調査方法
一般的に収入と消費の関係は、収入が上がれば消費も上がるというモデルで、説明されることが多く,例え
ば「消費二 aX収入 +bJ のような基本的な線形モデルを当てはめるが,その他に様々な因子が収入と消費と
複雑に絡み合っていることは疑う余地がない

擬似ミクロデータには世帯主の性別や年齢階級など,収入と

消費に関連する情報がある程度含まれているが, 不詳などの欠測データや重要と考えられる因子が変数とし
て含まれていないなど,これらをモデル化して詳細に分析するには不適切な場合も考えられ、また相当の時
間や手聞がかかる.そこで今回,これらをモテール化して解析するのではなく,シンプルに実収入

実支出が

正である世帯を「黒字世帯 J,負である世帯を「赤字世帯」とし,それぞれの世帯内では収入・消費傾向は同
ーであるという仮定の下で,世帯問および t
U
:帯内で、どのような差異があるのかを調べていくことにした.な

1
古の算出や世帯件数などは重みを考語、した上で SASの MEANSプロシージャを用いて算出し
お,平均・中央i
た.

実収入と実支出の要約統計量
表3
.
1 世帯以j

3
.
3
.結果
集 計 の 結 果 , 黒 字 世 帯 は 24,
2
6
3r
t
J
帯

N

平均

中央値

(重み付け N)

(円)

(円)

世帯

(
7
5
.
8
%
),赤字世帯は 7,
764世帯(
2
4
.
2
%
)で
あった.表 3
.
1は 1t
l
t帯あたりの実収入,
実支出,及び実収入と実支出の差の各々

実収入

619 487,
5
3
1,
785

実支出

666
372,

346,
5
6
5

実収入実支出

1
5
8,
9
5
3

1
2
6,
239

実収入

3
9
1,
764

347,
014

2
4
.
2
6
3
黒字
(
3
7
5,
1
4
4)

の平均と中央値で,全て重みを考慮しで
ある.解析前は,前述した通り消費が収
入に比例するという考えから,黒字世帯

7,
764

実支出

赤字
(
1
2
0,
3
2
0
)

では赤字世帯に比べて実収入も実支出も

実収入実支出

71
4
5
0
0
.
6
5
2 425,
1
0
8,
888 ‑
6
3,
762

ー

高く,赤字世帯の赤字の原悶は収入の低
さが主な原因であることを想定していた.

表 3
.
2 階層 5における黒字・赤'子:世帯矧j
平均支出

しかし,実収入につい

黒字世帯

ては想定'通り黒字世帯

平均

のほうが高し、結果とな
ったが, 実支出におし
ては赤字間帯が黒字 t
t
t
帯を上回っていた.
の結果から赤字世帯は,
単に収入が低いから赤
字になるというわけで
はなく,支出の大きさ
が家計を赤字に導く大
きな要因となることが
わかった

階層 5

中央値

赤字世帯

害リ合

差(黒字赤字)

平均

中央値

割合

平均

中央値

(円)

(円)

(%)

(円)

(円)

(%)

食事│

7
1,
473

6
8,
223

2
4
.
2

7
7,
280

7
3
.
1
2
3

1
7
.
9

5
. 07

住居

1
4.
432

1
.
0
9
9

4
.
9

27,
836

3.
352

6
.
5

.
上4
J
.
1

光熱・水道

1
9,
056

1
7,
819

6
.
5

1
9
.
8
0
6

,
日
!351

4
.
6

家具・家事JtJ品

8,
453

5,
629

2
.
9

1
1,
547

6,
749

2
.
7

ミ0

・
リ

.
1
2
0

1
3
.
1
7
7

8,
949

4
.
5

1
7,
1
3
3

1
0
.
5
1
2

4
.
0

ヌ
(
)
:
;
が

ー
"
(
,1
;"0ヌ

被n
f
i及 びi
l
(
I物

,

、
《
之

1

号
ミ

保健 l
零
封t

1
0,
218

6
.
6
4
7

3
.
5

1
4,
947

8
.
1
4
9

3
.
5

L
"
!
}
n

交通・ i
必j
i
;

710
40,

863
3
3,

1
3
.
8

7
0
.
5
6
9

4
2
.
5
4
6

リ
ユ.
'
:
5
'
)

引

1
6
.
7
1
5

584

5
.
7

39,
588

。

1
6.
4

4
主1
‑
f

9
.
2

2
2
.
0:
‑~

教美娯楽

410
29,

2
2,
572

1
0
.
0

3
7
.
5
6
1

058
26,

8
.
7

お1
5
1

‑
'
t支 U1
その他の消y

7
1,
377

5
4,
622

2
4
.
2

11
5,
1
3
5

7
1
.
0
3
6

2
6
.
7

547

.
t
!
̲l
Io
(
)

持

h

ι
ー
ポi
584

宅

4日
7

1
o.
‑
il
5

I

532.
[beta]
続けて,この支出の差が何の消費に起因しているかを調べるため,実支出の階層 5
(食料,住居,光熱・水道,
家具・家事用品,被服及び履物,保健医療,交通・通信,教育,教養娯楽,その他の消費支出)に対して,支出

.
2
)
. その結果,赤字世帯は黒字世帯に比べて平均支出
額の平均,中央値,全体からみた割合を比較した(表 3
総額が全ての水準において高かった.また,黒字世帯と赤字世帯では階層 5の各水準の割合が基本的に異な
っていることから,消費傾向が異なっていることがわかった. しかし,いずれの項目についても分布に偏り
があったので,中央値の差についても検討した.各水準の中央値の差の上位を見てみると,その他の消費支
出,交通・通信であり,その他で、特徴的で・あったのは教育で、あった.教育は,中央値の差(黒字

赤字)が唯

j
Eであり,赤字世帯における中央値は 0で、あった.さらに,背景項目(年齢階級,企業│玄分など 1
2項目)にお
いて,傾向や偏りがあるかどうか平均値を用
拡 醐 1
.
'̲
.
.
.
.
.
.
.
̲
‑
‑.
.
.
.
.
.
.
.
.
.
.
..
.
̲
̲
.
.
.
.
.
̲
.
.
̲
.
̲
‑
‑.............̲.....̲.....̲.̲.̲̲...̲.....̲.....,. 7師 団
9
0
α:
X
J

いて比較したところ, 45 歳 ~54 歳の年齢階級

ふ らα
JJOC

8叩

0
0
0
<
拍
5

における教育支出では,赤字世帯は黒字世帯
より約 3倍異なっていた(凶 3
.
1)
.
図 3
.
1 では,年齢階級別の実収入もプロッ

t
帯
トされており,実収入は赤字惟帯・黒字i!
問わず年齢に併せて同じように推移している

斗征四国

30JJ0C

<0
α珂

30αZ

200000

20αz
1
αヨXlC

'0αz

。

.
+~+ ̲.
.
.
~..
.
+6~+ ぺ....
.
.
T
'
".
̲
Q J
視.9‑
T
(
(
r .

円曲,
.ε~...
~.. ~~ζ~.
.
. ~.. ~t>..
a←

~QI-

.

恥'"〆〆〆〆~〆〆〆〆~

が, 40 歳代 ~50 歳代のレンジで赤字批帯の教

‑ーー赤字:教育支出
崎命倫黒字:実収入
ーー赤字:実収入

円

I
'
" .

。" 。 令
。
。'"べ。
。
"
'
‑

.
A
.
'
T
' _~うう.,加わら
与す
わ
令
匂
'
1
.
: ri=う"!:I~
to‑
t
o

由町一星字:較盲支出

句

主砲:数百支出
右開:実収入

育支出が突出している,いわば交互作用のよ
国3
.
1 教育支出と実収入の年齢階級別推移

うな現象が見られたー

3.4.考察
黒字世帯と赤字世帯の消費に関する傾向として,赤字世帯は半:i{,)的 i
こし、ずれの水準でらも黒字世帯より支出
が上回っていることから,程度の差はあれ,赤字世帯は様々な物・サービスへの支出の結果,赤字となった

0,
0
0
01
1
Jに対し中央値は o
f
I
J
で・あったことから,赤
といえる.特に教育に関しては,赤字世帯の平均値が約 4
字世帯には教育においてお金をかけていない世帯が半数以上あり,

方大きくお金をかけている世帯も存在

することが考えられる.年齢階級でみた黒字世帯と赤字[止帯の教育消費傾向では 40 歳{-1:: ~50 歳代の赤字世

帯では平均支出が大きかったが,この年代は小学生

大学生の子供がし、る世帯と一致しており妥当と考えら

1年度文部科学白書 1)の「図表ト 1
‑
3
.子供 l人世帯の平均貯蓄率 J (
図3
.
2
)で,子供が成
れる.これは,平成 2
長するにつれ貯蓄率(その年の可処分所得のうち貯蓄に

2
0
.
0

回している割合)が下がり,大学生までになると貯蓄を
取り崩すこととなるという調査とも矛盾しない.教育
に限らず黒字・赤字世帯,また実収入や各支出の因果
関係、を推察することは難しいが,この結果から,教育
に関しては教育支出が大きいことにより赤字で、あった,

(:::‑5

とし、う肉果関係がある可能性を推察することができる.
図3
.
2 子
f
J
l
.
;1人世帯の平均貯蓄率

3
.
5
. 参考文献
1
) 平成 2
1年 度 文 部 科 学 白 書 子 供 l人世帯の平均貯蓄率

(
h
t
t
p
:
/
/
w
w
w
.
m
e
xt
.g
o
.
j
p
/
b
̲l1le
n
u
/
h
a
k
u
s
h
o
/
h
t
m
l
/
h
p
a
b
2
0
0
9
0
1
/
d
e
t
a
i
l
/
1
2
9
6
7
0
7
.
h
t
m)

548

533.

シニア世代の消費特徴分析 中島貴之 株式会社データフォーシーズ Consumptionf e a t u r 巳a n a l y s i soft h巳 s 巳n i o rg e n e r a t i o n TakayukiNakajima . K . Data4C'sK 要旨 シニア世代の消費支出を整珂し、消費性向の内訳を明らかにする。また、アクティブ、シニアのような 特徴的な消費要素を抽出し、現在のシニア世代の消費を分類する c キーワード:シニア世代、アクティブ シニア、消費性向、主成分分析 1.はじめに w 近年、シニア世代のマーケットが注目されている。 1 ) ( :が国のシニア 一 代 ( 6 0歳以上)人口は、総人口の 27% を占め (1)、今後も増加の 途をたどると予測されている c シニア世代の消費については、 1 0 0兆円の巨大マー ケットを形成しており、今後、マーケットの中心になっていくと言われている。最近では、「アクティプシニ ア j と呼ばれる従来のシニア像にはない、泊費に積械的な、ンニア層の増加も注目を浴びている。シニア世代 に関心が強まる中、消費の実態はどのようになっているのか。アクティブシニアは本当に存在するのか。今 後、企業はどのようにシニア佐代へのアプローチを考えていくべきなのか。 6年度の全国消費実態調査 ( 2人以上の勤労世帯)のデータを使Jl lし、①一般世代とシニ 本稿では、平成 1 ア山:代を比較して消費の実態を把握する。次に、②アクティブシニアの存在を示すため、消費特徴別に分類 を行う。最後に、③シニア世代の特徴を踏まえ、結果の考祭を行う。 2 . 使用データの特性 平成 16年度の全国消費実態調査 (2人以1‑.の勤労附帯)のデータについて、世帯主の年齢別件数(凶表 1 ) と消費支出と山:帯票の項目の相関(図表 2 ) を確認した。図表 2から消費支出と世帯主主の各項目に強い相関 0歳以上と定義し、 はなかった。以降、世帯主の年代別にのみ着目して議論を行う。尚、シニア│吐代は年齢 6 9歳以下とする。年齢不詳のデータは使用しない。また、今回は相関係数の指標に Speannan 一般世代を年齢 5 の順位相関を mし、た。 549

534.

年齢別サンプル数 図案 1 2 5 Speannanの 相 関 係 数 HO:Rho=O(こ対する Prob>I r l オフザペーション数 l~ 表 2 017835 <0001 3 1 9 7 0 3 . シニア世代の消費の特徴 3 ‑1.消費性向の内訳調査 消費の内訳を凶る指標は、│立l 表 3に示した消費支出 1 0項目。全体的な支出!土、一般開:代に比べてシニア世 代は減少している。そのうち増加している消費支出項目立、食料、保健医療、教養娯楽、その他の消費支出。 f l 1 えび履物、交通・通信である。項目 一方、減少している消費支出項目は、住居、光熱・水道費、教育、被 n 別に一般世代とシニア世代の支出の違いがよく観察できる。 図表 3 勤労者世帯の世帯主年齢階級別 1世帯当たりの収入と支出 350, 000 ロその他の消費支出 300000 司 口教養娯楽 250.000 ロ教育 200, 000 口交通・通信 000 150, 口保健医療 圃被服及び履物 000 100, ・家具・家事用品 50.000 図光熱・水道 。 ・住居 60歳以下(平均) 60歳以上(平均) 3 ‑ 2 . 消費特徴の要素抽出 アクティブシニアの存在を示すため、シニア世代の消費の特徴別に分類を行ってし、く。分析に使用した頃 0項目 c !IJし、た分析方法は、主成分分析である c 全体の 94%を説明する 1 1 5 日は、図表 3で使JlJした消費支州 1 9主成分までを解釈する(図表 4 )。寄与率については、第 1.主成分が 20%弱と高いが、第 2から第 9主成分 立 │ 表 5から各固有ベクトルに次のような特徴がみられる。①全体 までは 10.9%から 7.5%と近い値を示した。 I 的な出費型、②交通・通信&教育出費盟、③交通・通信出費特化担、④住居出i‑'t型、⑤保険・医療出資型、 @家具・医療節約型、⑦教育&教茶娯楽出費型、③その他の消 550 w支出出資型、@教義州貰'&被服節約型。以│て

535.

から①、②、③、⑦、③の主成分スコア値が高い対象がアクティブシニアと考えられる。尚、アクティブシ 7 0 0件のうち 1 2 2 ニアの傾向が強いサンプル(①、②、③、⑦、③のいずれかの主成分スコア 3以上)は、 2 件確認できた。 相関行列の固有値 図表 4 閉 ? 芳n 張 堕 し し ……》… ω 1 : L910094i0 . 8 1 3 9 8, 01911 0 . 1 9 1 1096訂正 0.02田65~ 0 9 6 1 0 . 3 0 侃 10 6U491 0.0660041 0:1 067 0. 40 7 4 . 4 11 : 0 0 1 4 4 5 :00 3 9 . 9 4 6 0 0 . 5 0 7 5 5 10961498.0 . 0 6 0 8 9 7 0 . 0 9 6 1 1 0 . 6 0 3 7 6 10 . 9 0 0 6 0 20 . 0 2 9 7 1 3 0 . 0 9 0 1 0 . 6 9 3 7 0 . 8 7 0 惣 日 開 必 0.08互い 0. 7808 B i̲ Q旬何 47 00; 号29 旦L Q空空想し… 0.8647 ,9i0. 75 5 4 5 4 10 . 1~7445LJ!:._0755L 09402] I 0.0598: 1 1 1 0 10598009; 刊し … 図表 5 L 食料 4 . 考察と今後の課題 本稿では、シニア世代の消 1 ! j :支出という観点で、消費性向の内訳から特徴抽出まで行った。以上を踏まえ て、シニア世代の l世帯当たりの消費支出ば減少傾向ではあるが、アクティブシニアは存在するといえる。 止代」として また、消費傾向の分類泊、らシニアの消費支出の形は多種多様であることが伺える。「シニア l 括 りに見るのではなく、それぞれに合ったアプローチ方法を H J意するべきである。 また、課題としては、消費特徴の要素抽出に関して迫力日調査が必要だと考える。今回実施した主成分分析 I ]した項目が合算されている(交通・通信等)ため、詳細に追うことでより的 による要素の特徴付けは、使 } 確な特徴付けが期待できる。 参考文献 ( 1 )総務省 統計局 平成 17 年国勢調査結果確定人 μ に基づく改定数値(平成 17 年 10 月 ~18 年 7 月) 551

536.
[beta]
<規定課題>
第 1
‑
1表

集計世帯数(各レコードを、単純にカウントしたもの)
2人 ! 3
人
75:
203
4,
124i 3,
90
時
3,
239i 3,
3
9
1
1
,
.
1,
035

有
業 1

人 2
貝
3
4
5
6

'
;

,
.

世帯人員
4人
5人 i 6人
256
220I 119
4,
132 1 1,
436:
256
4,
494
201 I1,
943!
1,
031
232
5591
324
220I 104
27i
6
3
.

7入 ! B
人
52
28
5
1
6
162
29
84
6
3
1
12
7

9入

1
12

3

3

… L一司~

31

第 1
‑
2表世帯数分布(各レコードを、集計表乗率で重み付けして、カウントしたもの)

84
8
3
1,
~J36 L--_~~ll-一一…
1
,
1
3
7i
76
36i
一一ー一一叩一一島町一一一・ー白ーーー一-~._-一一司ーーー甲山町

422;
1
0
8
5
1

1
9
5

…一一

第 1
‑
3表 世 帯 数 分 布 (
1
0万分比)
!総 数 :

1
Q
1
!

年作J
C
C
A

有 h

業 !
1

人日

n

定計で与手

二ごと三~

7

員弓

7v
:
,
3.052:
一一句
4
4
.
3
5
1,
4L529i

工
豆E
rL
虫記

「 」 泣j

20,
71
1
0
0
.
0
0
0!

総数

第 2表 支 出 ( 消 費 支 出 及 び 十 大 費 目 )

有柔

1o
r2

人員

552

538.
[beta]
JMPC
l
i
n
i
c
a
lにおける
CDISCデータの解析について
18J
u
!
y令
2
.0
13

東京大学大学院室学系研究科臨床試験データ管理学
大津洋
共同発表者、山口拓洋

ゴ己主主

同月ミ

‑昨年、 iJMPC
l
i
n
i
c
a
lはどこまで使える?
Ver3から Ver4で想定される将来像について J
というタイトルで、講演させていただきました。
• i
non‑SASユーザー」の意思決定を支援する
ツールとして、標準化したデータ (CDISC
S
t
a
n
d
a
r
d
s
)上で、活用可能とした。

白"

j
!
:
:
'
l'
f
.

fγ

肝出仁り~'"r;:;、

l九1"
.
1
1
̲
}
h
j

555

,; :'D].~

539.
[beta]
今回の発表
• JMPC
l
i
n
i
c
a
lは、ライトユーザーだけのもので

はない。
‑SASへのプログぉラムの受け渡し

‑J
S
L(
J
M
PS
c
r
i
p
t
i
n
gL
a
n
g
u
a
g
e
)の利用

(
;
:
<
:
:
'
;
=
,
'
‑
‑
令
、
~-

t.:~布京日"y."rl兄、け!:,ÿ \rl: (
)
r
,
!
̲
;
;
.
;
.
.
2
,"
nょ

JMPC
l
i
n
i
c
a
l
• JMPのadd‑onp
a
c
k
a
g
e
• Menu‑driven
• SOTMd
a
t
a(o
rAOaM'sADSL)が前提である

3

ι

、

<
:
.

、.,,~
白
色
U

日 ゐ 一

一

ー

に“ ~f: ;.口、、 P'(II~~炉 t Hir~>:~ :ç;;:t 、 ;,~:i.; ミ

5
5
6

540.
[beta]
ADaMデータセット
ADSL:Subjectレベルでのデータセット
‑ BDS:ADaMB
a
s
i
cDataStructureADAE:AdverseEventA
n
a
l
y
s
i
sDatasetsADTTE:TheTimetoEventA
n
a
l
y
s
i
sDataset

2
(コ
パ3

干布語、山市!':,~ht :':;r~';.;hυh'..ti_}(']';

J
MPC
l
i
n
i
c
a
lb
e
n
e
f
i
t
'
s
‑簡易的なデータチェックができる
‑RequiredV
a
r
i
a
b
l
eCheck

‑特に安全性解析については、多くのテンプ
レートを持つ
ールーティンの解析については、その順序も
IWorkflowJで定義できる
‑帳票も作成可能
‑被験者毎のサマリー情報も出すことが可能
.:,)~ '~/7:' l~

..i~ 1
.
:

,
.
{""

九円。}

557

言
、 [;12

541.
[beta]
JMPC
l
i
n
i
c
a
lproblem
‑ただし、ダイレクトに日本語が使えるか?とい
う
と iNoJ
ー「日本語化」の 2つの側面
・メニューの日本語化
・データの日本語化への対応

‑CDISCs
t
a
n
d
a
r
d
sは、正式な多言語対応ではない

‑B
a
c
k
‑
e
n
dで動く SASが英語版である。
• UTF‑8で、保存すれば… C
a
s
e
‑
b
y
‑
c
a
s
e

î:~~1.\百三 q./i r1 i:: 1 tHl::.) ら r~: (
)
れ
・
"
":1ぅ

どこがベネフィットか?
‑データを標準化しているため、解析ルーティン
を構成しやすい
‑特に頻度が高い安全性解析

‑データセット名、項目名が一致しているため、
解析変数の再設定が不要
ーリサイクルが可能

,、;'" ,
、命

ι

t~"2 {ri 口 i

己、 n.'! i ,~?o t Hjr:;-;':~H C)~ , t~ι , 2 i ì ミ

558

542.

Customizeは可能か? • JMPClinicalは 、 JMPベースなので図表のレベ ルは高い ‑特に探索的なデータ解析には最適 • JMP!こ慣れているユーザー ‑JMPの機能もそのまま利用可能 ・自分で図表を書くことも可能 ‑JMPS c r i p t i n gLanguage( J S L )を用いればよい。 • JMPC l i n i c a lに、コード集がある。 ー ナ 4乞今、 6 ーち ← ~.. .~、、、 ν;η や l、 J :~:. '.1ιvι 〉 r ~';.; ~ I まとめ • CDISCstandardsデータ(特に、 SDTM, ADaM)1こ関 して、データを可視化し、意思決定に役立てるこ とは可能 • CDISCstandardsは、英語文化で、生まれたもので、 ある。従って、日本語化してデータを見せてほし いというこーズに関しては、 2つの視点、が必要 ‑ CDISCの多言語化(特にデータ辞書関係の言語ス イッチング) ‑JMPC l i n i c a lorSASの多言語対応 , : :. 、 , , ; =' " , , . , 一 一 'c;" ,、~.' 、 ; 十 ! 559 . ‑'、 ( : 1 " . , ~

543.
[beta]
まとめ
• JMPC
l
i
n
i
c
a
l は、定型処理、非定型処理の両

方が可能
‑標準化されたデータを様々な視点、でレビューする
ことが可能である。

̲
:
G~ :~:;';" i
t

1C~,;;i'fI ;;:lt H"ç <,~, i ;'y!
,.‑u.lnl?

jミ
布完

560

544.

索引(発表者・講演者 5 0音順) [ あ1 ・浅見由美子(第一三共株式会社).............................. . . . . ・ ・ ・ ・・ ・ ・ ・ ・ ・ ・ ・4 2 3 B E rSASを用いた医薬品開発の統計解析担当者に対する CDISCの社内教育 J <共同発表者> 小山暢之/山之内直樹 ‑有馬昌宏(兵庫県立大学教授)・・・・・・・・・・・・・・・・・..・・・・・・・・・・・・ ・ . . . . . . ・ ・ ・ ・ ・ ・ ・ ・ ・ ・1 1 5 B 「学生の実演芸術鑑貰構造とその変化一学生調査と社会生活基本調査の結果から一J <共同発表者> 福永征世/王程 ‑飯塚政人(東京理科大学大学院)・・................................................... 4 6 1 r 2群の割合の差における信頼区間の構成法の比較J <共同発表者> 浜田知久馬 )ユーションズ7・ ・.............................. 1 7 5 ‑池田敏広(株式会社ベル・メディカル、ノ 1 r(財)日本科学技術連盟における「臨床試験セミナー統計手法専門コース」と SAS教育」 <共同発表者> 奥田英樹/永田均/田辺大樹/坂井絵理 ‑伊藤要二(アストラゼネカ株式会社)・・... . .. . . .. . ............・・・・・・・・・・・・・・ ・ ・ ・ ・ ・ ・ a・ ・7 3 B rNLMIXEDプロシジャを用いた生存時間解析」 ‑稲葉洋介(株式会社新日本科学)・・.............. . . . . .. . .. . . . .. . . . . . . . . . . . . ・ ・ ・ ・ ・ ・2 1 3 「隠れマルコフモデルにおけるベイズ推定 J <共同発表者> 宮岡悦良 ‑今井健太郎(日本リスク・データ・パンク株式会社)・・・・・・・..・・・.........・・・・・ ・ ・ ・ ・ ・ ・ ・ ・ ・1 0 1 B 「共同 DBにおける欠損値解析法の利用」 561

545.

‑上野真治 ( ACメテ、イカル株式会社)・・....................・・・..・・・・・..........・・・・・・ 1 8 3 「一般財団法人日本科学技術連盟臨床試験セミナー 統計手法専門コースの総合実習プログラムを通した生物統計家の養成ー受講生の立場からー」 <共同発表者> 大竹優哉/奥田英樹/永田均/田辺大樹/高畑隆之/笹川佳員1]/坂井絵理/池田敏広/ 吉川俊博 ‑魚住龍史(東京理科大学大学院)・・ ・ ・ ・ ・ ・ ・ ・ ・ ・ . . . . . . . . . . ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ . . . . . . . . . .' 3 2 5 2 2 B rRAND関数による擬似乱数の生成」 <共同発表者> 浜田知久馬 ‑魚住龍史(東京理科大学大学院)・・・・ ・・・・・・.........................................507 2 2 規定課題 ‑魚住龍史(東京理科大学大学院)・・..........・ ・・ ・ ・ ・ ・ ・ ・ ・ ・ . . . . . . . ・ ・ ・ ・ ・ ・ ・ ・・ ・ ・ ・ ・ ・ ・ ・ ・. 5 1 1 2 2 2 2 2 自由課題「凝似ミクロデータによる圏内旅行費支出と世帯情報の関連の検討」 ‑宇野慧(テルモ株式会社)・・・・・・・・・ ・・....................・・・ ・・・・・・.......... ・ ・ ・5 1 5 B B 規定課題 自由課題「世帯主の就業状況が貯蓄性保険需要に与える影響についての考察 擬似ミクロデータを用いた To b i t/H u r d l eモデル推定 ‑J ‑大津洋(東京大学大学院 特任研究員)・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 5 5 5 r JMPC l i n i c a lにおける CDISCデータの解析について」 <共同発表者> 山口拓 j 羊 ‑大橋渉(東京医科歯科大学大学院非常勤講師)・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 1 6 5 「統計を知らなかった私の SAS日記」 ‑岡村正太(東京理科大学大学院)・・・・ ・・・・・・・........................................' 5 1 9 2 自由課題「健康因子に対する支出傾向に関する解析」 <共同発表者> 若林将史/東 J J I正晃 562

546.

[ か 】 ・加倉井靖之(東京理科大学大学院)・・............・・・・・・・・..........・・・..・・・・・・・・・・・・・・ 335 i C o n t i n u a lr e a s s e s s m e n tm e t h o d における MCMCプロシジャの利用」 <共同発表者> 浜田知久馬 . j l l u 崎洋平(独立行政法人国立国際医療研究センター). . . . ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・4 7 5 2 2 2 2 iSASによる二項比率の差の非劣性を示すベイズ指標の算出方法について」 <共同発表者> 榊原伊織/宮岡悦良 ‑小林聡晃(日本たばこ産業株式会社)・・....・・・・・・..............................・・・・・・・・ 83 iNLMIXEDプロシジャ紹介 PK解析及び生存時間解析への応用」 <共同発表者> 高橋行雄 . t 佐高裕 (塩野義製薬株式会社)・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 3 0 1 iSAS を使った情報管理事例~そしてリスクをやつつけろ ~J <共同発表者> 藤原正和/北西由武/吉田祐樹 【 さ1 ・迫田英之(株式会社タクミインフォメーションテクノロジー)・..・・・・・・・・....................・・ 393 iSASC D I環境における SDTMと D e f i n e . x m lの作成」 <共同発表者> 楊敏 ‑新村秀一(成践大学教授).. . ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・ ・ ・ ・ . . ・1 9 3 2 B B 「小標本のための 1 0 0重交差検証 j 去のすすめ」 ‑周防節雄(兵庫県立大学名誉教授)・・・・・・・・・・・・・・・・・・・・・・・・・... . . .. . . . ・ ・ ・ ・ ・ ・ ・ ・ ・ ・2 5 1 iTUTORIAL市区町村名で住所情報を分割する SASプログラムの作成方法」 ・ .. . .. . . . . . ・ ・ ・ a ・ ・・・・........ . . ・ ・ ・ ・ a・ ・ ・ .. . . . . . ・ ・2 7 5 ‑関根暁史(株式会社 ACRONET)・ 2 iPLMプロシジャによる回帰分析と予測の分離」 563

547.

‑寒水孝司(京都大学大学院准教授)・・.............・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 153 「京都大学大学院医学研究科社会健康医学系専攻の講義・実習における JMPの活用」 <共同発表者> 佐藤俊哉 【 た 】 . . . . . . . . .. . . ・ ‑135 ・高浪洋平(武田薬品工業株式会社)・・...................... . ・ ・ ・ ・ ・ ・ B rODSLAYOUTによるワクチンの臨床開発における Dashboardの作成」 ‑高橋行雄 (BioStat研究所株式会社)・・・・ ・・・・・・・..............................・・・・ 439 2 「非線形回帰分析の基礎と応用」 ‑高宗太輔(株式会社データフオーシーズ)・・..........・・・ ・ ・ ・ ・ ・ ・ . . . . . . . . . . ・ ・ ・ ・ ・ ・ ・ ・ ・ 523 2 B 規定課題 ‑高宗太輔(株式会社データフォーシ ズ ) ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ 525 2 B B 自由課題「食費の分析による食に対する意識と食生活の把握」 ‑多田主佑(イーピーエス株式会社)・・・・・・・・ ・・・.................. . . ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ 261 B B fMIProcedureによる多重代入 SASv e r9 . 3における新機能の紹介」 ‑田中政輝(日本貿易振興機構ジェトロ)・・............... . ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ . . . . . .. . . . ・ ・ 371 B 「ジェトロ、システム知識ゼロの課長代理が語る、 SASDataFluxを利用した Dataクレンジングの実際」 ・ ・ . . .. . . . . . . . . ・ ・ ・ ・ 203 ‑田中祐輔(イーピーエス株式会社)・・....................・・・・・・ ・ B 「一般化加法モデル (GAM)によるイベン卜ヒストリー解析」 <共同発表者> 辻谷将明 ‑筒井杏奈(アストラゼネカ株式会社)・・............................ . . ・ ・ ・ ・ ・ ・ ・ ・ ・ ‑‑‑‑‑529 B 規定課題 ・ ・ ・ ・ ・ ・ ・ ・ ・ ‑‑‑‑ ‑‑‑‑‑‑‑ ‑‑‑‑533 ‑筒井谷奈(アストラゼネカ株式会社)‑‑ ・ ・ ・ ・ ・ ・ . . . . ・ ・ ・ ・ ・ ・ ・ ・ ・ B 自由課題「変曲点を用いた最低生活費の推定」 ー疑似ミクロデータ(平成 16年全国消費実態調査)によるー 564 2

548.

‑土居正明(東レ株式会社)・・・・・・..・・ ・・・..........・....... . . . . . . . . . . ・ ・ . . ・ ・・ ・ ・ ・ ・3 6 1 s 2 a rSASによる例数設計のシミュレーション J ‑土井優子 ( 1'¥ナ、ノニック株式会社)・・.... . . .. . ..........・.............. . . . . . . ・ ・ ・ . . ・5 3 7 規定課題 ‑土井優子(パナ、ノニック株式会社)・・....................・・・・・・・ ・ . .. . . .. . . . . ・ ・ ・ ・ ・ ・ ・5 4 1 B 自由課題「家計簿から見た「世帯人員ごとの幸福度」に関する研究」 ‑富里遼太(大鵬薬品工業株式会社)・・・・・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ . . ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・3 1 5 B B B B B r JMPC l i n i c a l4 . 0の日本での活用の試みと課題 J <共同発表者> 津田克彦 ‑富里遼太(大鵬薬品工業株式会社)・・...... . . . . ・ ・ ・ ・・・・・・...... . . . . ・ ・ ・ ・ ・ ・ .. ・ ・ ・ ・ ・ ・5 4 5 B B 自由課題「教育用擬似ミクロデータを用いた収入・消費傾向の考察」 <共同発表者> 土生敏明/米倉孝俊 ‑豊泉樹一郎(塩野義製薬株式会社)・・....................・・・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・4 1 3 B FDAS u b m i s s i o nのための d e f i n e . p d f作成事例 B B SAS ⑮によるファイル変換の A u t o m a t i o n化 ー <共同発表者> 北西白武/吉田祐樹/平井健太 【 な 】 ・長井章夫(リコーリ ス株式会社)・・..........・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 9 7 「マクロ経済指標を使った重回帰分析による倒産予測 J <共同発表者> 中井員人 ‑中島貴之(株式会社データフオーシーズ)・・..・・・・・・・・........ . . ・ ・ ・・・・・・・........... 5 4 9 2 自由課題「シニア世代の消費特徴分析」 【 は 】 ・浜田知久馬(東京理科大学大学院教授)・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 3 rSAS生存時間解析プロシジャの最新の機能拡張 J 565

549.

【 ま 】 ・松島純之介(中外製薬株式会社)・・..........・・・・ ・ ・ ・ ・ ・ . . . . . . . . . . ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・4 8 9 2 B 「エラーディクショナリ作成と統計解析帳票作成業務における問題点の抽出」 <共同発表者> 久力洋/杉谷康雄/結城美保/坂上拓 ‑武藤猛 ( M a r l くe Te c hC o n s u l t i n g )• • . ・ ・ ・ ・ ・・・・・・・・・・・・...................・・・・・・・・・.' 1 2 5 2 fMRアンケートによる製薬企業の営業力診断」 ‑森田裕(ナイフィックス株式会社)・・...................... . . .. . . . . . . . . . . . . . . ・ ・ ・ ・ ・ ・ ・3 7 7 「ライブラリ参照と名前の定義を利用して E XCELファイルへの柔軟なデータ入出力を実現する ー解析結果のレポーテイングからセルオートマトンまでー」 【や】 ・矢嶋友也(株式会社中外臨床研究センター)・・..........・・・・ ・ ・ ・ ・ ・ . . . . . . . . . . . . . . . .'497 B fSBCSSASでの日本語データハンドリング」 <共同発表者> 坂上拓 ‑安井浩子(公財統計情報研究開発センタ ) ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ . . . . . ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・2 3 5 z 2 「名簿の住所情報を市区町村名で自動分割する SASプログラム」 <共同発表者> 周防節雄 ‑矢田真城(株式会社 A CRONET)・..........・・・・・・・・ ・・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・3 4 7 B B E a B fMCMCプロシジャによる非独立データの解析」 <共同発表者> 浜田知久馬 ‑山本景一(独立行政法人国立循環器病研究センター)・・... . . . . . . . . . . . . . . . . . ・ ・ ・ ・ ・ ・ ・ ・ ・2 9 1 「国立循環器病研究センターにおける臨床研究 I T基盤整備と SASの活用」 <共同発表者> 山本晴子/宮本恵宏/植田初江/桑田成規 566

550.

SASユーザー会世話人会 代表世話人大橋堵雄 東京大学教授 世話人伊藤陽一 北海道大学准教授 {氏名 5 0音順) 上田聖 総務省統計局総務課調査官 小野潔 株式会社三菱東京 U FJ銀行 岸本淳司 九州大学病院 ARO次世代医療センタ一副センター長准教授 堺イ申也 イーピーエス株式会社 坂巻英 公立大学法人宮城大学 周防節雄 兵庫県立大学名誉教授 菅波秀規 興和株式会社 高橋行雄 B i o S t a t研究所株式会社 八木章 元近畿大学教授 山之内直樹 第一三共株式会社 SASユーザー総会事務局 SASI n s t i t u t eJ a p a n株式会社内 T106‑6111 東京都港区六本木 6 ‑ 1 0 ‑ 1 六本木ヒルズ森タワ 1 1階 TEL:03‑6434‑3702 FAX:03‑6434‑3701 E ‑ m a i l :jpnsaswg@sas.com 論文集 2013年 7月 1 8ヨ 初 版 第 1 局 J I 発行 発行 S ASユーザー会 SASI n s t i t u t eJ a p a n株式会社 567