SASユーザー総会論文集 2009年

482 Views

April 21, 25

スライド概要

統計解析プロセスの再構築と規制要件 角谷伸一
変数ラベルのないSASデータセットに変数ラベルを付加するSASプログラムを自動生成するSASプ ログラム 和泉あゆみ
%RTFマクロを用いた解析結果の効率的作成に向けた取り組み-医薬品開発における解析業務 の標準化- 吉崎正浩
PDVを意識したプログラミング 中村竜児
プログラム実行時間短縮の試み-コンピュータの変更やx64版ソフトウェア、SSD、RAM Diskを用い て- 土居主尚
研究者と統計ソフトウェアの関係とは? 大橋渉
SAS-WinBUGSを用いたベイズモデル分析 畑山知慶
SASでベイズ推定を行う方法- proc MCMC vs R&WinBUGS- 舟尾暢男
SASにおける微分方程式モデルのあてはめ 森由美子
ロジスティックモデルとROC AUC分析を組み合わせた検査性能の評価と疫学基本モデル評価方法 古川敏仁
生存時間解析におけるLakatosの症例数設計法 の有用性の評価 魚住龍史
生存時間データを扱う臨床試験における試験終 了時のイベント数の推定方法 西野美沙
2つの生存関数の差に対する同時信頼区間 平井健太
バイオマーカーと薬剤の交互作用の検出に対す る最大対比法の適用 水澤純基
GAMとその周辺 田中祐輔
経時測定データに対する一般化線型モデルに基 づいた反応プロファイルの分類 冨金原悟
ゲノムワイド関連解析における薬物動態関連遺伝 子同定のための新しいスクリーニング法 長島健悟
LIFEREGプロシジャによる正規分布からの打ち切り標本に対するパラメータ推定と二標本有意差検 定 棚橋昌也
コンジョイント分析による官民連携地域ポータルサ イトの住民評価 有馬昌宏
SASでのAHPによる重要度評価-官民連携地域ポータルサイトの運営主体の信用の源泉評価を 事例に- 加藤優希
落語家の勢力分布の変遷-師匠から弟子へ・親 から子へ- 坂部裕美子
医療圏分析と医薬品マーケティング 武藤猛
基本的な集計による信用リスク判別精度の改善 手法 福本信吾
Poverty Mapping: Case Study of Iran ARMAN BIDARB AKHTNIA
SASによる共分散分析 浜田知久馬

profile-image

SAS言語を中心として,解析業務担当者・プログラマなのコミュニティを活性化したいです

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

A‑ 柔 コ 烹 ; ; 空 会 │ 国1 1 1 ] ] 論文集

2.

SAS、SASを構成するプロダクト群は、 SASI n s t i t u t eI n c .の登録商標です。 その他、本論文集に記載されている会社名、製品名は、一般にそれぞれ各社の商標または登録商標です。 本論文集の一部または全部を無断転載することは、著作権法上の例外を除き、禁止されています。 本論文集の内容を実際に運用した結果の影響については、責任を負いかねます。

3.

目次 応用システム 統計解析プロセスの再構築と規制要件 I 3 角谷伸一(塩野義製薬株式会社) 浦狩保則 変数ラベルのない5 A5データセットに変散ラベルを付加する 5A5プログラムを自動生成する5A5プログラム 13 和泉あゆみ(兵庫県立大学) 周防節雄 %RTFマクロを用いた解析結果の効率的作威に向けた取り組み ー医薬品開発における解析業務の標準化一 25 吉崎正浩(小野薬品工業株式会社) 初道正博 冨金原悟 PDV を意諒したプログラミング 4 1 中村竜児(株式会社インクリース研究所) プログラム実行時問題舗の試み 6 4 版ソフトウエア、 5 5口 、 RAMD i s k を用いてー ーコンビュータの変更やx 49 土居主尚(放射線医学総合研究所) 医薬統計 医学研究者と続計ソフトウェアの関係とは? 」 67 大橋渉(先端医療領興財団臨床研究情報センター) 5A5‑WinBUG5を用いたベイズモデル分析 77 畑山知慶(株式会社ACRONET) 本多隆之 矢田真城 林行和 5A5でベイズ推定を行う方法 ‑ p r o cMCMCv sR&WinBUG5‑ 95 舟尾暢男(武田薬品工業株式会社) 5A5における積分方程式モデルのあてはめ 115 森由美子(住商情報システム株式会社) 田崎武信(塩野義製薬株式会社) ロジスティックモデルと ROCAUC 分析を組み合わせた 検査性能の評価と蜜学基本モデル評価方法 125 古川敏仁(株式会社バイオスタティステイカルリサーチ) 杉本典子 生存時間解析における L a k a t o s の症例数設計法の有用性の評価 魚住商史(日本化薬株式会社) 水津純基(東京理科大学) 浜田知久馬(東京理科大学) 143

4.

生存時間データを扱う臨床試験における試験終了時のイベント散の推定方法 一一一一 153 西野美沙(イーピー工ス株式会社) 堺伸也 2つの生存関教の差に対する同時信頼区間 1 6 1 平井健太(住商情報システム株式会社) 吉田祐樹(塩野義製薬株式会社) 田崎武信(塩野義製薬株式会社) バイオマーカーと薬剤の受互作用の検出に対する最大対比法の適用 1 7 1 水津純基(東京理科大学大学院) 浜田知久馬 統計解析 GAMとその周辺 I 183 国中祐輔(大阪電気通信大学大学院) 株式会社) 伊庭克拓(東京 CRO 辻谷将明(大阪電気通信大学) 経時測定データに対する一般化線型モデルに基づいた反応プロファイルの分類 一一一 195 冨金原悟(小野薬品工業株式会社) 菅波秀規(興和株式会社) 山田大志(アストラゼネカ株式会社) 山口拓洋(東京大学) ゲノムワイド関連解析における 薬物動態関連遺伝子同定のための新しいスクリーニング法 207 長島健悟(城西大学) 佐蔵泰憲(千葉大学/ハーバード大学公衆衛生大学院) NanM .L a i r d(ハーバード大学公衆衛生大学院) L lFEREGプロシジャによる E規分布からの 打ち切り標本に対するパラメータ推定とニ標本有意差検定 219 棚橋昌也(興和株式会社) 丸尾和司 菅波秀規 岸本淳司(九州大学/デジタルメディシン・イニシアティブ) │ マーケティング・調査 コンジョイント分析による官民連携地域ポータルサイトの住民評価 │ 231 有馬昌宏(兵庫県立大学) 加藤優希 藤田昌弘 SASでのAHPによる重要度評価 一官民連携地域ボータルサイトの運営主体の信用の混泉評価を事例にー 243 加疎慢希(兵庫県立大学) 有馬昌宏 蔵田昌弘 落語家の勢力分布の変遷 一師匠から弟子へ・親から子ヘー 坂部裕美子(財団法人統計情報研究開発センター) 255

5.

医療圏分析と医薬品マーケティング 265 武 藤 猛 (MarkeTechC o n s u l t i n g ) 〔 信用リスク 基本的な集計による信用リスク判別精度の改善手法 276 福本信吾(データ・フォアビジョン株式会社) 経済分析 Pove同yMapping;CaseStudyofI r a n │ 289 ARMANBIDARBAKHTNIA(東京国際大学) │ SASによる共分散分析 浜田知久馬(東京理科大学大学院) チュートリアル 301

7.

統計解析プロセスの再構築と規制要件 O角谷伸一・ 1. 北西由武 *1 ・1 甫狩保則・ 1. 平 井 健 太 勺 ・塩 野 義 製 薬 株 式 会 社 解 析 セ ン タ ̲ ̲ 住商情報システム(株)データサイエンス部ビジネスパートナー l * 2 R e s t r u c t u r i n gofS t a t i s t i c a lA n a l y s i sP r o c e s sandR e g u l a t i o n S h i n ‑ i c h iK a k u t a n i・ 1jY o s h i t a k eK it a n i s h i ・ 1jY a s u n o r iU r a g a r i * l jKentaH i r a i 寧 c i e n c eD i v .B u s i n e s sP a r t n e r l B i o s t a t i s t i c sDep , . tS h i o n o g i& C o ., L t d・ 2D ,S umishoComputerS y s t e m sC o r p . a t aS 要旨 新薬開発で作成される電磁的記録への規制動向に注目し、統計解析プロセスの再構築に取り組んでいる。そ こでは、プロセスの自動化により,作成する解析用 SASデータセットおよび解析資料の真正性を高めること に主眼をおいている。本報告では、今までに行った改定ポイントのいくつを紹介するとともに、現時点での 規制要件への充足性について考察する。 キーワード:統計解析プロセスの再構築、電磁的記録への規制、プロセスの自動化 1.はじめに 近年、新薬開発での統計解析プロセスにおける電磁的データに関する規制動向とそれへの対応に注目が集 まっている。各製薬企業は統計解析プロセスの標準化を進めているが、品質の確保と同時に、電磁的記録へ の規制要件への対応が求められている。また、統計解析プロセスのあり方は必ずしも一通りではなく、作業 の効率性とスピードの点、でも、各社が凌ぎを削っているのが現状である。報告者らは、電磁的記録への規制 要件の動向を追跡し、自分らなりに、統計解析プロセスのあり方を考えている。そして、統計解析プロセス の再構築を進めている。 2 . 治験の電磁的記録への規制要件の動向と報告者らの歩み データ取得から始まり、データクリーニング、データ固定を経て、統計解析結果を出力するまでの治験デー タ処理プロセスを考える。このプロセスで作成する電磁的記録への規制要件の主な動向と報告者らの歩みを 表 Iに要約した。 1 9 9 7年に発布された答申 GCPで,電子データ処理システムにおける CSV( C o m p u t e rS y s t e m V a l i d a t i o n ) 、監査証跡、セキュリティーの保持といった要件はすでに提示されていた。同時期に、それらの つU

8.

要件に加えて、電子署名、タイムスタンプに関する要件が米国法令 (PAR Tll ) で提示された。当時、これら の規制要件に対して、データマネジメント部署(治験データ処理プロセスの上流部)は敏感に反応する一方 CHの統計解析 で、報告者らが所属する統計解析部署(下流部)の反応は鈍感で5あった。その理由として, I ガイドライン (E9) ,非劣性試験のガイドライン (EIO) が同時期に続けて公布され、それらへの対応を重 視したこと、そして何より電磁的記録への規制要件の記載が不明確で、あったことがあげられる。 表1.治験の電磁的記録への規制要件の主な動向と報告者らの歩み 年 法令・規則 規制要件 報告者らの歩み 1 9 9 7年 答申 GCP ( 8 ‑ト1 1 )1 電子データ処理システムを用いる場合の要 件として, CSV,監査証跡,セキュリティー の保持,パックアップの実施,利用者管理を 規定。データ処理中のデータ変換には,処理 前と処理後のデータの対比可能性を規定. 1 9 9 7年 2 1CFRPAR Tll ' 電磁的記録のデータ本体において真正性,見 詰性,保存性の要件を規定.メタデータに対 して,監査証跡に加えて,電子署名,タイム スタンプの要件を規定. 2003年 PAR Tll見直し版 3 PAR Tllを遵守するための不必要なタスク や出費の軽減のため,いくつかの規制事項の 施行を猶予.ただし, PAR Tllは見直し期間 中も有効. SASP H ‑ C l i n i c a l (解析資料作成システム) , SASPH‑Da 泊w are (解析用データセット作成 システム)による実行履歴の管理 ( 2 0 0 3年 から 2005年) 2005年 厚生省 ERlES指 針 4 電磁的記録のデータ本体において,真正性, 見読性,保存性の要件,およびメタデータに 対して監査証跡,電子署名,タイムスタンプ の要件を具体化.CSV,ER l ES指針対応組織, 教育訓練等についても規定 上 記 2システム利用停止ー SASパージョンア こ頼らな ップへの対応不可のため。システム l い統計解析プロセスの再構築を開始。 2007年 製薬協自主ガイダンス 5 EDC利用に特化して, E孔 ES指針の要件を 具体的に記述 特に意識せず その後、規制要件の内容が具体化されるにつれ、報告者らも対応に乗り出した。実際に、 S ASP H ‑ C l i n i c a l (解析資料作成システム)と S ASPH ・D ataware (解析用データセット作成システム)を相次いで導入し、標準化を ASのパージョンアップに伴いシステムの更新が 推進し、統計解析プロセスの管理を開始した。ところが、 S 出来なくなった。そのため、これら 2つのシステムの利用を停止し、統計解析プロセスの再構築に取り組ん できた。再構築にあたっては、プロセスの自動化を徹底し、人の手が介在する機会を可及的に少なくするこ ASデータセットおよび解析資料の真正性を高めることを主眼としてきた。ま とによって、作成する解析用 S た、市販システムに頼らない道を選択した。その理由は、市販システムの導入・運用、およひ。パージョンア ップ時の対応に必要な時間、タスク、費用が軽視できないと考えたためである。 3 . 統計解析フ。ロセスの再構築 報告者らが再構築を手がけている統計解析プロセスを図 Iに示した。このプロセスは 3つのステップから成 る。これらのコンビュータ処理は専用のサーバで実施する。このサーバ内に開発品目ごとのプロトコルフォ ルダを作成し、アクセス権を付与された複数名の担当者が、チームを形成して作業する。プログラムの作成 はダブルプログラミング手順で行い、その実行履歴を自動的に残す。解析資料作成後には 2通りの結果を照 ASマクロを利用して瞬時に照合できる仕組みをとり入れた。このマ 合することが必要で、あるが、自動照合 S クロにより、従来目視照合に費やしていた作業時間を大幅に短縮した。以降では、データ抽出から解析用デ ‑ 4・

9.

ータセットの作成までの部分と解析資料作成の部分に分け、改定したポイントを報告する。 . ス テ ッ ブ2 仕様書と解析用データセットの作成 ヨ 雪 ゴ 己竺~D ス テ ッ ブ 1. デ ー タ 抽 出 ステッブ 3 . 解析資料作成 表題および脚注自動取得SASマ クロ 初期設定ファイル 自動照合SAS マクロ ステップ 1:抽出 SASマクロを利用して、 CDMS( C l i n i c a lD a t aM a n a g e m e n tS y s t e m l からデータを抽出し、 SASデータセットへ 変換する。このマクロは、 CDMSからデータを抽出し、実行履歴をログファイノレとして自動保存する。この保存フ ァイノレは編集不可で、ある。 :解析用データセット仕様書および解析用データセットを作成する。まず変数情報取得 SASマクロを利用して、ステ ステップ 2 ップ Iで抽出した SASデータセットの変数情報を E x c e l( x l sファイノレ)に出力する。次に、統計解析計画書および 土傑書に従い,解析用データセットを作成する。 図表計画書等を参照し解析用データセット仕様書を作成する。この f C l i n i c a lS t u d yR e p o r t l に必要な解析資料を作成する。基本的に、解析資料 l表 ステップ 3 解析用データセットを用いて、 CSR( につき Iつの SASプログラムを作成する。 図1.統計解析プロセス 3 ‑ 1 データ抽出から解析用データセット作成まで デ ー タ 抽 出 か ら 解 析 用 デ ー タ セ ッ ト 作 成 ま で の フ ロ ー を 図 2に 示 す 。 主 担 当 者 と バ リ デ ー シ ョ ン 担 当 者 注 ) が l 人ずつ割り当てられ、 1 )主 担 当 者 に よ る デ ー タ 抽 出 、 2 )解 析 用 デ ー タ セ ッ ト 仕 様 書 作 成 の 後 、 主 担 当 者 と バ リデーション担当者がダブルプログラミング手順で 3 )解 析 用 デ ー タ セ ッ ト 作 成 に あ た る 。 ku

10.
[beta]
[(1)山内当~

1
)T9
f
i
l
l

プログラム、実行ロ
グなどを CD‑Rへ

θ
図2
. データ抽出から解析用データセット作成まで、のプロセス

注)解析用データセットあるいは解析結果の帳票をタ守ブルプログラミングにより 2組作成し,それらの整合性を確認する
ことは、一般に、

「ベリフィケーション」と呼ばれているが、報告者らは慣例として「バリデーション」の語を使用して

いるので注意されたい。

①データ抽出
SAS
比 Fで作成した専用のツールにより、 CDMSに格納されている各テープ、ルを S
ASデータセットとして抽
出する。データ抽出入力画面(3)へ入力した情報とともに、作業者のユーザ I
D、実行時刻、エラーの
)
。
有無などの実行履歴が自動的に保存される(3右

実行履歴

データ抽出入力画面

阜̲j

u

O
n
.c
I
I
I
パスワード
データ拙タイミンタ

:

師ヲ百亨ヲ玉南γ ‑1
J

m 1?のブロトコ吋レ名

I一一一一一一一一一

ブロトコールフ削レ自

j
.:z:柑雌岬

H

"
3

̲!

目 ー 刊 綱 山 ー ' : f '1門 戸 畑
パラバーヲ情相
叫 iUDY
首L .
明鋼完全ヂ タ槍d
前針ヲロクラム作時主企企土色̲Jご 'PHO
師析ヲロタラム作間 89688 Zt
降 10YSH
.
.
oYWL 等‑,ープン周ヂ タ
c
c
c
c :
.
降10ysTUO拘 S テスト憎お
前腕ヲロタラム仰司 c
前折プロタラム作肝 D叩 o ZtPHO̲ST
1
.
JO
Y
l
iS テヌ子槍お
コF
'
)スト吏慌に
前析ヲロタラム作町Ern玉E 写
:PHD'oSTlUYWL キ ごすーブJ 周デ タ
Z
̲
̲
PI
'
‑
'OYSit
.
.
OYYl家紛糾周データ(2α却
前折ヲロタラム作用 F芹 芹 官
前析ヲロタチム{町 GGGGG :::.PHDoSTIJO'r官

P

1
J

..~

と旦!)tt~J r
I
コメント 2

__!f!__Jー竺~

図3
. データ抽出入力画面と実行履歴

‑
6・

‑

1
<

11.

②解析用データセット仕様書の作成 解析用データセット仕様書の作成には,変数情報取得 S ASマクロを用いる。このマクロは CDMSから抽出した SASデータセットの変数情報を自動的に取得し、それらを E x c e lシート上に出力する。主担当者は、統計解析 計画書、図表計画書等を参照し、そのシートへ解析資料を作成するうえで不足している変数、たとえば連続 値をカテゴリ化した変数、ベースラインから最終時点までの変化量などを追加する。この手順で解析用デー タセット仕様書を完成させる。バリデーション担当者はこの仕様書を点検し、不備があれば主担当者に修正 ) 債を繰り返し、解析用データセット仕様書を完成させる。 依頼を行う。この手1 3 ‑ 2 解析資料の作成 解析資料作成は、 1 ) 図表計画書からの表題情報、脚注情報の自動取得、 2 ) 環境設定プログラムの作成、 3 )標 ) 解析資料の自動照合(解析資料の整合性の確認)、 5 ) 本解析の実行 準図表マクロによる解析資料の作成、 4 D‑Rの作成)から成る(図 4)0 1 )と 2 )は主担当者が実施し、 4 )はバリデーション担当者 (実行履歴の管理、 C ) と5 ) は主担当者とバリデーション担当者が並行して実施する。 が実施する。 3 主担当者 図表計画書を参照 解析用データセット仕樟書.解析計画書.その他 θ 解析資料、プログラ ム、実行ログファイ ルなどを CD‑Rへ 図4 . 解析資料作成プロセス ①図表計画書からの表題情報、脚注情報の自動取得 従来、解析資料の表題情報および脚注情報は解析資料作成プログラム内に直接入力していた。 1試験あたり 懐票の数が膨大なため,データ固定前の早い段階で解析資料作成用のプログラムの準備に取り掛かる。こ のI の段階はまだ統計解析計画書および図表計画書は固定されていない時期であり、図表計画書の変更が行われ、 表題情報、脚注情報の変更も発生する。そのため、担当者は、その都度プログラムコード上で表題情報、脚 注情報を修正する必要があった。また、プログラムコードへ直接入力するため、タイピングミスも起こり得 た。この状況を改善するために,表題および脚注の情報を自動取得するための図表計画書 ( E x c e lツール)と t 円

12.
[beta]
立一一‑L
一一一E一 一̲ L
̲Eーーし̲ ̲ G

̲A]̲!j 1 c I
f~I翻情縄

I

畠力文字

L̲ ̲ ̲ ̲ J ̲
一一J̲̲I̲

I

H

lan
.
.
.
.
四
P
r
o
t
∞IFi~き抽情。 n 閥 ND 此剛
山 陰2
回 出 国 bn
f
o
o
t
r
o回 1
f
o
o
t
n
o恒 2
f
o
a
t
r
n回 3
f
o
o
t
間悼
1E
AAAA TA
日 孔1
1
1
TobI4.1
.
1
.
1 pa
由n
tD~
A
J
!Ra町 10m国 dP
a
憎n
'
AAAA TA
町 4)12
TabH1
.
1
.2T
r
電波 r
n
e
n
t
A
I
IRa町 10m
回 dP
a
t
i
e
n
t
2EJ
3J
AAAA TA
日 4)2
TobH1
.2A間柄忌向~
A
I
IR
a
r
由 m田 dP
副刷,(a)P・咽!岨.0用 f
"
"
4E
AAAA TA
町 4)31
T
a
b
1
4
.
1
.
3
.
1D
i
s
t
r
ibJt
i
o
r
A
I
IRardomisedP
at
i
e
n
t
(a
)A
'
唱団田 a
ft
f
、
."
,
(
b
)C同 n..f
回,(c)P・咽l
岨 50
町
5E
AAAA TABl4̲
132
T
a
b
1
4
.
1
.
3
.
2
D
i
s
t
r
ibJt
i
o
r
S
e
l
f
e
t
yPopu回目::m
{
a
)A唱団~aft同省、(b) c 同 n.. f
"
,
,
(
c
)p
‑
喝 luesa
r
を
6E
AAAA TA
日 4)33
Tobl41
.3
.
3D回 r
ib.向
FAS
ωA
曙 市 2 eo
ft同 a、 ωC 国n~ f
r
o
r
(c)ト咽k厄 . . 陪
7E
AAAA TAB14̲
134
TabI4.1
.3
.
4
0
i
s
t
r
ib
.
虎i
o
r
PPS
ωA
曙吊.ae a
ft
国 a
,
(
b
)C同 n
..f
",,(c)ト咽k
厄 .0
時
8E
AAAA TA614)41
Tabl41.4
.
1 De""i'3世
S
a
f
e
t
yP包 同 国 bn
(
a
)P
t
.pwa咽 p
e理 I
9E
AAAA TAB
I4)42
T.bI4.1
.
4.
2De",,2'百世
FAS
匂)P
t
.Pwa
r
咽 p
e市!
一
一
一
一
一
一
ー
ー
ー
ー
一
一
‑
10E
ん>AA TA
日 4J43
T
a
b
t
4
.
1
.
4
.
3Der
r
o
w
a
世
P月
ω 尺 pw0咽 両 市
L一
一
一
一
一
一
一
一l
.-.1\ 表紙 k且;!Á~ 伊i 分烈犠買~)Á割付と処方必冨翠蓋丞:r!III&箆1m.!箇顕E霊E亙.
1
<
ー一一一一一一一回

陥

入力項目
A列ーシーケンス番号(目次の数の確認)
B列:解析資料を作成するときの言語の区別
C列:プロトコノレ番号
D 夢1
]
:表題および脚注の情報を自動取得するときに利用するマクロ
変数名

E列
、 F夢]
1:表題 1(主題)、表題 2 (副題)
G列.解智子対象集団
H亨]
1
から Q列:脚注 Iから脚注 1
0まで設定可能

図5
. 表題および脚注自動取得のためのエクセルツールの目次と入力内容

SASマクロを開発した。図表計画書の E
x
c
e
lは、図表計画の 1枚 1枚に対応するデザインシート(複数枚)
と 1枚の目次シートからなり、目次シートに工夫を凝らした。すなわち、各デザインシートへ出力する表題
情報、脚注情報を、目次シート上の対応するレコードへ格納できるように、目次シートへ表題情報用と脚注
情報用のフィールドを設けた。目次シートの各フィールトの表題情報と脚注情報は、対応するデザインシー
ト上の表題出力場所と脚注出力場所にそれぞれリンクさせた。そして、 SASマクロを用いて、目次シートか
Iの表番号をマクロパラメー
ら表題情報および脚注情報を取得し、 SASデータセット化する。次に目次の D 亨J

タとし、各解析資料に表題および脚注が自動的に出力される。この仕組みで、各解析資料作成プログラムへ
の表題情報と脚注情報の入力操作が不要となり、入力ミス、人為的ミスを軽減することができた。

②環境設定プログラムの作成
解析資料作成プログラムのすべてに共通して設定する情報を一括管理できるように、環境設定プログラムを
作成した c このプログラムは、解析用データセット参照先の他、解析資料作成時に必要な情報、例えばフォ
ーマットの参照順、解析資料出力先、出力言語(日本語 o
r英語)などの指定を行う。これらの情報は、解
析資料の作成を容易にする。担当者は、これまで個々の解析資料作成プログラムへ上記情報をすべて手入力
していたc この環境設定プログラムを %INCLUDEステートメントで各解析資料作成プログラムの先頭で読み
込むと、解析時に必要な情報を自動的に取得でき、参照先の間違いを犯すリスクを軽減することができる。
日 比 除 問 問̲ ̲ ̲ ̲ ̲ ̲ ̲ ̲ ̲ ̲ ̲
~Il3k3

'11 ・綜既 Ãf";~包 η 凶黒命保(;?:.三自主すもた Vj:,~, で~口一一守一一

n,
1
.
.
c
r
Q̲Dut̲s.rb:

、2・τ 、..民支の・『、野定・ 5

2
tI
i .I
.
",
u
・
s
・
.
'I• :n..1'IId。
"
3
1
.
' υ
"
Urt l
̲̲rH =Z
:
.
S
t
u '
P
r
oc
t
.
P O
<
:
I
'I
'
̲
E
a1
l
"
3
S:
l
e
to
u
t
.̲
M
.
i =Z
:
:
a
u P
r
o
d
uc
:
te
Pt
o
c
t
'l
l
̲
dh:
2

z
s1" ・宮lI t~. t.'lP_l官二字自才泊三包慢'.叫 '~H~~;':' 日でする'""・ H ・ H ・ H ・ "1

: 1;btI..~ d・t ・:::, PHcr.ttJ G' ~.P~.,伽 c. , rr 、 tr ~ I
ゆ ftb' H. C~~~ : r"$d~ I\ J',

s

.

. /‑ ~占暁<E_
旬、 U~ '1":K:I'..-:'司
『
ト..-ご~::;~
S 1,
b
r
l
t
.
t h¥ .~;・トC時 a 叫 "P'ld"" , P f(J\ 鴎 1. ,、! ..F~ 叶,,' ",.r."~

s

? 。フ・ー『ノ

今三 ~l ~

~

,r~・<1",, 1 .,..;

:
t
ι ・r

・

・ハ

" ・奮!.!‑聞け甘てき ι豆 長
!
!
} 6 r:
3
:
町
、 1・
:
.
;
"
1
1 II~l I
・
^
"
・ U': Il,Il"c
!
τ 吋 J)ー

"I
"
H

・面得::j",i1
¥1~ を?ロ
1
l ル、勾ロ X~'.:. 1,
i
iゐ
'
;
C
:
T
:
'
;
す11'1";::"コグヌム叫,.下 ,
r
'
"ロ
ー

"Xt

:J

1
2

ド

" ̲ .

"

、.

刷

デ・シ, "担当 t
.
"
;
.
R
T
Fファイルご""三・ 2
"
,
・
向
‑
t
e
6
y
!
f
u
,
。
・

" 1
・主習=i., :Hペファ <
'
IJ
!,
・
,

‑
主
"

‑-コ疋抗~ f) 問 T~. ./

,
p同・

主 U
6
y
・

阿

'
I

,
,
<
=
,
,
':

f
'
l

f
.

3
3
1i
・ハリデ :
"
'
1
>
!!,!ョ・ 6
ち斗叫忠力支・ J
U %
1t削 t
̲
,,̲
M
.
! =l
:¥
lP
K
C
.
.
S
t
ud)'I
P
r
O
l
!
u
c
t,
P
r
o
!
c
c
l
.
''
l
l
̲
d

・

,.

U .rlob.1 o
'
J
t
̲
.̲
rH
・三 1
.2当・'円 F~、日. J
l~主力.~
1
1
lcb・IC¥Jt̲
.
.
.~rl f
:
リ γ ーソ苛ノ司書胃、肉Ifフ ィ 自己句内克・
l
' hloT・
I刷 t ・M ・" ・主坦ョ..', ‑T,
:
,
.
.
フ
‑
,1 ~力子. .
l
' hlllb.l o
<
Jt
̲
"
,̲
hhl ・,"デ , 司 " 当 者 、 史 アT免・J

2
1
1:
;
1O
t
l
l
! ~tγle:

J"

,",・主巴ヨ・の ;
:
:
T
;フ占的ペルと己アヲ支 '
1
日 %
I
tl刷 t
̲
I
̲,t
l =Z
:・
併
司
C
:.
S
tu
d
'
,
・P
r
o
d
uc
:
t.
P
r
・
。o
e
I
t(Jc
t
o
l:

I "pt.
o
:
>r
t hh~HCh ' (.or.
l ft
)・
3

一一一一一ーー

"
1
27
"
1:
l
e
t
i

・
:

オJ ト
ヶ{;‑:. :;理の性 :1 て/l~~ ・ J
s・ '~lll
u
:

=s
t
y
l .
r
t
U
:

,
.
伶
"
U I
.
.
.
n
d
:
̲
p
.
t
I
.
"
,.

t
‑
.
.
.1‑
r
. ")・ト~ !
i
:
l":~τ.

U I
.

"
' I̲Dut

図6
. 環境設定プログラム作成例

‑
8
・

'1

13.

③解析資料の自動照合(解析資料の整合性の確認) 主担当者およびバリデーション担当者がそれぞれ作成した解析資料(表題および脚注を含む RTFファイル) を自動的に!照合するマクロを開発した。実際には、 RTF出力と同等に出力される HTML出力を E x c e l経由で SASに取り込み、 SASデータセットイじさせる。それを SASの compareプロシジャで比較する。このマクロの 入力例と実行結果を以下に示す。 自動照合マクロの入力項目の説明 実際の入力例 %T̲RTFVA( 主担当作成 HTMLファイノレ保存フォノレダ¥, ノ〈リデーション担当作成 HTMLファイノレ保存フォノレダ¥, バリデーション出力結果ファイノレの保存フォノレダ弘 主担当の作成した HTMLファイル名 ノ〈ヲデーション控当者が作成した HTMLファイル名. % T ̲ R T F V A L ( C¥T e m 戸M a i n , ¥ C : ¥T e m p ¥V a J , ¥ C¥T e m p ¥V a J ¥R e s u J f , ¥ MainEOI F A S . h t m l MainEOI P P S . h t m l 均I ̲ E O I ̲ F A S . h t m l 均 1E OI P P S . h t m l ,MAX R~ 1 8 0 0 ,MAX C~50 , R̲FNAME~ % s t r (比較結果)); MAX_R~ エクセノレ行数の指定, MAX C~ エクセノレ3'IJ 数の指定, R FNAME~ バリデーション結果出力 RTF のファイノレ名 入力手順:最初に、照合したい 2つの HTMLファイノレが入力されているフォルダを指定する。次に、それらの HTMLファイル名を並べ る。ここで、もし複数の解析資料を同時に照合したい場合は、パイプで区切る(右側の入力例を参照)。パイプで区切って順にファイノレ 名を並べる。複数のファイノレを指定する場合、その並び順が重要である。!照合結果は RTFファイノレで出力される。 R FNAMEでファイ ノレ名を指定する。 この入力例は、 2種類の解析資料について、主担当者とバリデーション担当者間で照合した例である。比較 結果は以下のような . R T Fファイルで 出力される。これとは 1 3 ' jに主担当者とバリデーション担当者の解析資料 3 ' jシートとしてそれぞれ出力される。この x l sファイルは、両者の結果 がコピーされ E x c e l( x l sファイル)の 1 に不一致があった場合、その場所を確認するために利用する。 x l sファイルに出力した照合結果を図 7に示す。 なお、この自動照合マクロには別の利用方法がある。データが変更される前の HTMLファイルを別途保存 しておき、置き換えられたデータで解析資料を作成し、その HTMLファイルと更新前の HTMLファイルの比 較を行えば、データが変更され影響があった箇所を容易に調べることができる。 この自動照合マクロの利用により、従来目視に頼ってきた作業時間を大幅に短縮することができ、照合の 精度も格段に向上させることができた。 N ) . ' 比較 f i 1 e n a m e似 AI M a i n ̲ E O l ̲ F A S . h t m 1 . ' MamEOl PPS.h 出 1 < ' ¥ 比較 f l l e n a m e ( V A L ) + ' [ V a 1 ̲ E O l̲ F A S . h t m 1 + ' V a 1 ̲ E O l ̲ P P S . h t m l + ' I 詳細は、別 L こ出力されたエクセルファイルを参照して下さい。 μ 比較結果の.RTFファイル ‑ 9 ‑ 備 考4

14.
[beta]
I :
H
判l
tUJ1it
t
.
温
.
"
.
喝
.
皿F}D It.ff1t

I l HAM<J 111UI車'J;tl- Oαヮ tDlJI~.
I 1'}1l1l11~tDlt~.tDlI.岨釘鑑".
2 I[PPS
J

,

f
+
t

耐震

E" ・a・ ~ÐIt企MÐJHtIUtI

.
1

│
症
聞
1
.
"
, 軒目同情!時餓│畳捕時旦置引

1
'
1
.
‑
.

I l]UMD17ttll.kl‑OCF)ÐtIt~
J" _.1ItJ;1IH..,-It~.,.
.
唱
¥
出
也
.
a
.
.
.
e
E
S
.
i
¥
:
'
aU
田̲p円/

,, ,

B

!
<
畢

│症例雌陥鎗│開催釜│骨l
岨│柑錨│猷d V
警幹

廿耐震

I鵠
"1rWl11llt1!1t6I1t/
:
f
.
a(LOCF)DI
t
ヲ
e
111jl̲'
I
I
I
‑I
t
.
f
f
i
l
l
t
1
.
‑,.州出岨日.es...(vau田 f問 /

>¥

,. 了‑‑‑‑.‑ーで,‑‑‑‑.‑‑一寸戸一τ一一ァー

l

よ」

室→E日
(
)
1‑
1
:f

1 IHAN叩 11ttll:f.J;t~OCF)tDlt~.
I lð"lII~tDlt~.lf)j四~.聞E

HAJtl.D fl t!tl眠1fâ a.oα"l ÐIJI~.

!6 1!.~tDtIt~ltD.…

除t附 '1

"jJ
[P
PsJ

l
引開野

i
号制野

│症例盤│平均値同居山崎│円鍍│医大鐘時旦甜引

|症例敏|平均,.1.. ",蝿|館小僧 1..姐|猷Il~置引

J:'n咽

1
9
5

・
e

・ 別 問
合

I ,えAM-l) 11ttll.k~OC,η Ð>k"
1
1
1II_..~岡崎 "1II-1ít~1íl.

1
.
1
1

151

問

I.Hl

山

1
1
8
1

l.fT

151

山

I.n
I.n

1
.
'
1
.
8
5
1
.
6

1
1
1
1
8
1
1
1

I
.
HJ
Ht
.
1

l.~ ~

,
同 ・
,9
I"~

,州時MD17(t,lt'Jt~OCF} ÐIt~

致

比ピ 1
̲
.I
t
.
I
Jj怖 "
1
I
I
‑
I
t
I
#
..
同
一
,
.;;¥剛司LE
P
l
Ys S A Y i 岨 日 " . /

>
1

l

不

・M"4-'-I~YMi耳元田CPF司S).~乱ßl!__fES/

.[

一致
(不一致箇所は黄色で網掛けされる)

図7
. 自動照合マクロによる照合結果
上段:主担当者の解析資料、下段ソくリデーション担当者の解析資料

④本解析の実行
最終的なプログラム実行においては、パッチサブミットにより、 SASのログファイルを自動的に残すのが通
常である。このパッチサブミットでは、 SASのログファイルとリストファイルが自動生成される。報告者ら
はプログラムの実行履歴を記録するために,この機能の一部を拡張した。すなわち、自動生成されるログフ
ァイルとリストファイルのそれぞれのファイル名の末尾に実行日付をシステム的に付加する。同様に、実行
した SASプログラムをコピーし、そのファイル名の末尾に日付を付加する(図 8参照)。ログファイルには
利用したサーバ名と SASを実行したユーザ名および実行時聞が記録される。これらの処理で作成される 3つ
のファイルはすべて読み取り専用となる。この手順で、監査証跡、再現性の要件への対応を図っている。

SAS8でがヲチザフ司ト〈旦)
SAS9
.
1でハザ明司ト坦}

4欝
。
問
、

w
l
t
hE
n
t
e
r
下町田島出 3
0
聞
(
(
0
.
)
5岨 8で
SAS9
.
1で
冊
(
(
O
̲
)
f
r
i
n
t
ス
テ
ム
で
官1
副(皇)
SASシ
P
rI
"
ltw
l
t
hSAS~:b貯帽
サγザト匂)
1

.1苧型

5岨 9

i名前

A

I
@
;
豆
亙E璽豆豆
i@Sa叩吋悶.20間 713

出

l.JBSa岬¥e
.
p同 月 四 7
1
3回

i
T
'
l
S
a
"
,
,
¥
e
.
P .
2
0 1
3
1
.
問

即

s
t

耳目 BB8
4hkkkk
ザ 1132

S
̲ASView

l
1

i

図8
. プログラムの実行履歴、ログの管理

最後に、データ固定後の最終的な SASプログラム、それによって作成された解析用データセット、解析資
料、実行ログを CD‑Rにコピーしている。これにより、真正性および保存性の要件への対応を図っている。

3
‑
3 教育資料の作成
今回、統計解析プロセスの流れを整理し解析担当者で共有できたことから、数多くの開発品目の統計解析を
効率よく実施することが可能となった。また、実際のデータを触り、プログラミングを行い、バリデーショ
ンを完了させ、それらの結果を CD‑Rにコピーするという統計解析プロセス全体の流れを整理し、教育資料
としてまとめた。この教育資料を学習する際、例えばダミーデータを用いたプログラム実行と併せることで、

‑
1
0・

15.

統計解析プロセスの一連の流れを体感することができる。 SASの初心者や他部署からの異動者で、あっても、 解析担当者への早期の成長を期待できる。このことは,今回の統計解析プロセスの再構築で得られている菌IJ 産物である。 4 . 考察 2008年 1 0月に開催された GCP研究会では、 EDCを利用した治験を新薬申請した際の信頼性調査の方法が 議論され,厚労省からは信頼'性調査項目に CSV,電磁的記録の真正性,見読性,保存性,および電子署名が追 l ES指針対応は必須であり、 加されることが伝えられた。すなわち、データマネジメントプロセスにおける ER 今や常識レベルにまで到達している。一方、統計解析プロセスに対する規制要件はそれほど明確ではなく, 各社は様々な受け取り方をしているというのが実情であろう。再構築した統計解析プロセスが規制要件をど の程度満たしているかを考察した。その結果を報告者らの見解として表 2に示す。 表2 . 電磁的記録への規制要件に対する報告者らの見解 電磁的記録に関する規制要件 CSV 報告者らの見解 解析用サーバ,クライアント PCに対して、利用するソフトウェア (SASなど)のイ ンストーノレとオベレーションについてバリデーション計画書と報告書を作成し、 保管している。 真正性 改憲防止: ・データ固定後の実行プログラムそれによって作成された解析用データセット、 解析資料、実行ログを CD‑Rにコピーしている(ただし、解析資料原本は文書 管理システムへ登録)。 ・作成者が CD‑Rに作成日を記入し、手書き署名している。 見読性 SASインストール環境で、 SASデータセットの見読可能。 SASプログラムおよび 保存性 作成した CD‑Rを金庫で保管。 監査証跡 真正性とタイムスタンプでの対応で要件を満たしていると考える。 電子署名 SASの実行ログ上に実行者のスタンプが記録されている。なお、解析用データセ 実行ログはテキストファイルであるため見読可能。 8年ごとに CD‑Rを複製する (CD‑Rの耐用年数を考慮)。 ットおよび解析資料は SASプログラム実行で自動生成されるため、本人性の証明 は不要と考えている。 タイムスタンプ サーノ〈の時間を SASの実行ログに出力している。サーバの時間は統計解析部署と は独立した情報管理部署のみがアクセス可能。 再現性 SASインストーノレ現環境下で CD‑Rに保存したプログラムを常に実行可能。処理 前と処理後のデータを常に対比可能。 (SASパージョンアップ時には SAS社のアナウンスに注意して対応する必要あ り) 教育訓練 統計解析プロセスの一連の流れを体感することができる教育資料を利用。記録は 台帳により管理。 報告者らは、電磁的記録に関する規制要件には、現状で概ね対応できていると判断している。ただし、厳 格にファイル管理を行う機能,解析プログラムとデータセット、解析資料の流れを可視化して追跡可能性を 高める機能など、今後検討すべき課題を残している。 本報告の内容について、読者の方々のご批判を仰ぎながら、また今後の規制要件の動向にも注意して、次 の再構築の打ち手を考えていきたい。 ‑11・

16.

参考文献 [ I J 厚生省審査課長・安全課長通知 I 医薬品の臨床試験の実施の基準の運用について J( 1 9 9 7年 5月 薬 審 445号・薬安 6 8号) [ 2 J FDA九 1 CFRPAR T 11 ( e l e c t r o n i c r e c o r d s ; e l e c t r o n i c s i g n a t u r e )"( 1 9 9 7年 8月) [ 3JFDA." G u i d a n c ef o rI n d u s t r yP a r t1 1,E l e c t r o n i cR e c o r d s ;E l e c t r o n i cS i g n a t u r e sScopea n d A p p l i c a t i o n "( 2 0 0 3 年 8月) [ 4 J 厚生労働省医薬食品局局長 I 医薬品等の承認又は許可等に係る申請等に関する電磁的記録・電子署名 2 0 0 5年 4月 薬 食 発 第 0401022号 別 紙 ) の利用の指針 J ( [ 5 J 日本製薬工業協会.医薬品評価委員会「臨床試験データの電子的取得に関するガイダンス J ( 2 0 0 7年 1 1 月) [6J 村 山 浩 一 . ICSV ERJES に 関 す る 規 制 当 局 の 動 向 J ( 2 0 0 8年 1 0月)イーコンブライアンス h t t p : / / e c o m p l i a n c e . c o . jp / m a t e r i a l s / C S V / S e m i n a r 2 0 0 8 10 0 7 .pdf ‑ 1 2 ‑

17.

変数ラベルのないS A Sデータセットに変数ラベルを付加する S A Sプログラムを自動生成する S A Sプログラム 周防節雄 和泉あゆみ 兵庫県立大学・経済学部 4回生 兵庫県立大学・神戸学園都市学術情報館 L e tSASProgramsCodeandE x e c u t ea n o t h e rSASPrograms Tha tA u t o m a t i c a l l yAddV a r i a b l eL a b e l s,C r e a t e' P r o cF o r m a t 'f o rEachV a r i a b l eandRenameV a r i a b l eNames S e t s u oSuoh TheSystemsI nf o r m a t i o nC e n t r e, TheU n i v e r s i t yofHyogo A y l l m iI Z l Imi F a c u l t yofEconomics, TheU n i v e r s i t yofHyogo 要旨 変数の数が多い S ASデータセットの場合、変数ラベルを付加したり、各変数にそれぞれ f o r m a tを作成した り、変数名を変えたりするプログラムを作成するのは手聞がかかる。我々は、①変数にラベルがない S ASデ ータセットの変数リストを p rocdatasetsによりデータセットに取り込み、それをエクセルファイルに一豆 e x p o r tする SASプログラムを作成、②そのプログラムを実行して作成されたエクセルファイルに手入力やコ ピー&ベーストなどの手段で変数ラベルを入力した後、③そのエクセルファイルを i m p o r t して、元の SASデ ータセットに変数ラベルを付加する I S A Sプログラム」を自動生成し、かつ、自動実行する SASプログラム ASの f o r m a t文を自動作成・自動実行する SASプログラム、数の多 を作成した。この他に、同様の手法で、 S い変数の変数名を変える S ASプログラムを自動作成・自動実行する S A Sプログラムも作成した。このプログ ラムの最大の利点は、 S A S言語を知らない作業補助者でも、変数ラベル付け、 format文作成、変数名の変更 AS データセットのデータベース整 といった手聞のかかる作業を事故なしでできることである。大規模な S 備・構築には有益なツールとして利用できる。 abel文 、 proc import、 proc 巴xport、 proc format、 format文 、 キ ー ワ ー ド :proc datasets、 l rename文、見 includ巴文、マクロ変数、変数ラベル 1.はじめに 従来、官庁統計とか政府統計と呼ばれていた統計調査データが、最近では「公的統計」と総称されるよう になってきた。これらの統計調査結果は、これまで政府刊行物、 CD‑ROM、インタネット上のファイルなどの 形式で、いずれも集計量として公表されてきた。近年のコンビュータの高性能化により、メインフレームコ ンピュータを使わなくても、いわゆるパソコンで高度な計算処理が可能な時代になってきた。それに伴い、 個票レベルのいわゆる「ミクロデータ」の分析が研究者個人でも技術的に可能になった。これまで、「統計法」 の「目的外使用申請」により一部の研究者達によりミクロデータの分析が行われてきてはいるが、日本では ‑ 1 3・

18.

まだ広く普及してはいない。本年度から「新統計法」が施行されて幾分目的外使用のハード ルが緩和された が、一般の研究者にはまだまだ手が届かないのが現状である。 一方、海外に目を向けると、 1983 年に発足したルクセンブ、ルグ・インカム・スタディ (LIS)では加盟国が ミクロデータを様々な形で提供し合い、各国のミクロデータを使った研究が盛んに行われてきた。残念なが ら、我が日本は統計法のからみでミクロデータの提供ができず、加盟していないため、ミクロデータを使っ た研究で世界に遅れをとっているのが現状である。 東京国際大学経済学研究科では数年前から英語プログラムというコースが提供されており、英語だけで講 義を受け、英語で修士や博士論文を書く留学生が勉強している。このうちの多くは、広くアジア、中近東、 旧ソ連の政府統計局の職員である。これらの学生は、自国の家計調査などのミクロデータを持参して、その 分析結果を修士・博士論文にまとめている。このコース発足当時の同研究科長であった松田芳郎現青森公立 大学教授が中心となって、こうしたミクロデータを蓄積して、アジア版 LISを作ろうという構想を長らく温 めてきた。本年度から、「アジア地域貧困問題研究用の世帯統計ミクロ統計データベースの編成とその解析」 B ) :研究代表者:伊藤彰彦(財)日本統計 と題する研究プロジェクト[(独)学術振興会・科学研究費:基盤研究 ( 情報研究センタ一理事長]が、東京国際大学経済学研究科の教授陣と協力して発足し、筆者の周防はデータベ ース整備斑として参加している。このプロジェクトの目的のひとつが、アジア各国のミクロデータを SASデ ータベースに構築して利用者へデータを提供することである。ミクロデータの利用に絡む話なので、当然各 国の統計局と正式な使用許可に関する取り決めが必要なのは当然のことである。更に利用者に配布するミク ロデータには個人を特定できる情報の削除を始めとする種々の秘匿処理を行ったものが提供される。 その上で、利用者側の利便性を考えると、提供する側は次のような点に配慮する必要がある。 ① SASデータセットの変数は英語表記で、かっ英語のラベルを付ける。 ② proc formatを使って、必要な変数には formatを定義する。 アジア諸国をはじめ先に挙げた国々では国家統計局といえども SASを使っているところはほとんどなく、 ミクロデータは dBase、Access、 SPSSなどのデータベースファイルで保存されている。これらのファイルは 何らかの方法で SASに importができるので、 SAS環境で利用するのは問題がない。問題になるのは、変数名 がもともとは自国語で表記されているため、その国以外のユーザーには甚だ使いにくい点である。そのため には変数名を万国共通の英語表記に変更する必要がある。変数名の変更には SASの rename文、または proc datasetsを使えばできる。ただし、変数の数が多く、場合によっては、数百個に及ぶこともある。これらの 変数をひとつひとつキーボードを叩し、て入力しながら rename文を書いていくのは、時間がかかると同時に、 スペリングの間違いなどのエラーも起きやすく、作業の効率化が求められる。変数にラベルを付けたり、 formatを作成するのも同様の問題を抱えている。 本論文では、これらの課題に対処するために以下の 3種類の処理をする SASプログラムを紹介する。 ① SAS変数にラベルを付ける。 ② data stepで rename文を使って SAS変数名を英語の変数名にする。 ③必要な SAS変数には formatを定義する。 これらのプログラムは、 SASの文法を知らない補助作業者にも使えるように配慮しており、大規模な SAS データセットのデータベース整備・構築には有益なツールとして利用できることが期待される。 2. 変数ラベルを付加する S A Sプログラム ‑ 1 4 ・

19.

変数ラベルを付加する処理は、図 1に示すように、 3つの S A Sプログラムから成る。 一‑ ‑ J E u ‑ ‑ :・d 日:・・1 日 ‑EMH ﹁ レ) ラベルなし 変数リスト(エクセルファイノレ)作成 e x p o r t 当田園置声酷ー←ー‑ 変数ラベル手入力 E ラベル付 変数リスト(エクセルファイノレ)作成 vaUist.xls SASVariablesL ist m a c r o ̲ d e f i n e . s a s lIDPO 此 ‑ ‑ SAS a t a S e t │ ~ {ラベル付き 国 1 変数ラベルを付加する手順 処理手順は以下の① ④である。 ① macro d e f i n e .s a sでマクロ変数を定義し、一旦保存した後、実行する。 ‑ 1 5 ‑ tt ﹄ Eu‑ ↑号︑且 M L1 ." 日 比一一宮一 h. ‑M 一 u v z J a︐ H J ' a .︑一 一 e h 1 句︑︑ 1‑nh 一e 2 ‑ ⁝順一緒寸││← 順刷一 E ai ‑‑‑‑i u﹃司寸 1i lt ー 44 司司 M= •••• 一 一 で'ー0ィ. ?J‑ n ⁝ 一 1 一 ︑ ⁝⁝ 即 ⁝ 一 ︑ . 出 一 (l)macro̲d巴f i n e . s a s ( 2 ) d s ̲v a l i a b l el .s as ( 3 ) d s ̲v a l i a b l e 2 . s a s (付録 1参照)

20.

(処理対象となる SASデータセットのデータセット名、そのデータセットのための 1ibname文に必要な情報、およ び自動作成される SASプログラムが保存されるフォルダ の完全ノ fスがマクロ変数として定義される[付録 4参照]。 このプログラムは必要ならば、図 1の手順 3の直前でも実行する。また、このプログラムは変数名を変えるプロ グラムや format文を作成するプログラムでも使用されるが、次節以下の解説では省略する。) ds variable1 .sasを実行して、 proc datasetsで、変数ラベルがない SASデータセットの変数リストを ② SASデータセットとして取り込んだ後、それをエクセルファイルに‑̲ e ̲exportする。 ③ そのエクセルファイルに手入 力やコピー&ベーストなどで 変数ラベルを入力する。(付録 6参照) ds̲variab12.sasを実行する ④ と、そのエクセルファイノレを import した後、元の SASデー タセットに変数ラベルを付加 する SASプログラム with̲labe1 .sasを「自動生成」 し、かつ、「自動実行」して変 数ラベル付きの SASデータセ data hhold.micro̲sample: set hhold.micro̲sample: l a b e l hhid='Household i dN u m b e r ' hmemberid='Household Member i d ' F u l l Name o f Household M e m b e r ' name二 ' s e x = 'G e n d e r ' a g e = 'Age a so f2 0 0 1 ' member̲status='Relationship o f Household M e m b e r ' i n c o m e = 'A n n u a lI n c o m e ( U S $ ), e x p e n d i t u r e = 'A n n u a l Expenditure(US$)' educatio円='EducationL e v e l ' job='Occupatio円' r u n : proc print data=hhold.micro̲sample(obs=2) l a b e l : 品l ibname..&dsname: only two observations displayed":run: title "data= 自動生成された S A Sプログラム:w i t h ̲ l a b e l.自白 ットができる。付録 5のテス ト用 S ASデータを使った結果 自動生成された SASプログラムを右に示す。 3 . 変数名を変える S A Sプログラム 変数名を変える処理は、図 2に示すように、 3つの SASプログラムから成る。 [ ( 1 )macro̲define.sasl (2)renamel .sas (3)rename2.sas (付録 2参照) ① 変数が自国語表記されている S ASデータセットから renamel .sasで変数リストをエクセルファイ ノレに exportする。 ② そのエクセルファイノレに英語 表記の変数名を「手入力」す る。(付録 6参照) ③ rename2.sas を実行すると、 このエクセルファイルを lmport し た 後 、 変 数 名 を renameする S ASプログラム rename̲var.sas(右図)が自動 作成され、直ちに自動的に実 行されて、英語表記 S ASデー タセットが完成する。 data hhold.micro̲sample: set hhold.micro̲sample: rename hhid =houseHid hmemberi d ヰn e m b e rI D ヰn ̲status member status I n c o m e =yearlncome expenditure =yearexpense education =edu job ニo ccupatio円 r u n, proc print data=hhold.micro̲sample(obs=2): title1 "data= 品Ii b n a m e 品dsname: only two observations displayed": title2 "After r e n a m e " : r u n, 自動生成された S A Sプログラム:rename̲var.sas ‑ 1 6・

21.
[beta]
この例では、英語の変数名を別の英語の変数名に変更している。

一
44

:

:

J

→手順 1

macrod
e
f
i
n
e
.
;
sa
s

司司

[

.
.
.
.
.
.

:
:
.
,
:
.
*
'
:
'
寸
了了

一 一 ?三
盟
:
三
主
重
選
墜
星
静
義
島
」
盛
!
慰
種
詑
塗
一

J

元の変数リスト(エクセルファイル)
の作成

e
x
p
o
r
t

新旧変数リスト(エクセルファイル)
の作成

rename̲
li
s
t
.
x
l
s SASV
a
r
i
a
b
l
e
sL
is
t
macro̲
d
e
f
i
n
e
.s
a
s

OldName NewNameVARNUM
h
h
i
d
hmemberid
2
naπle
3
sex
4
age
5

x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x

J
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

(必要ならば実行)

i
m
p
o
r
t

•

, μι 付Jキ手!噴 3~..;,.目
半,証eiia邑~2~B託s_ アー

変数名を変える SASプログラム
の自動生成かっ自動実行

renamev
a
r
.
s
a
s:
̲
.
~'''_--'

‑
ー
ら
••.

‑室生三;ー̲ 一一一ー

'~-. ."̲J5
7
i
国 2 変数を r
e
n
a
m
eする手順

‑
1
7
22.
[beta]
4. P
R
O
CF
O
R
M
A
T文を作成する S
A
Sプログラム

u
‑

PROC FO問 AT文を生成する処理は、図 3に示すように、 3つの SASプログラムから成る。

フォーマット作成用変数リスト
(エクセルファイル)作成

e
x
p
o
r
t

フォーマット作成用
変数リスト(エクセルファイル)に入力

ι
‑
d
‑
α 一陥一

eH

ケ‑enN

回
一

u‑‑別T

此一一h 正

h 一副一 G

三世主

COLB

"
,
.
・
・

皿

a
c
r
od
e
f
i
n
e
.
s
a
s

→

I
n
p
u
tf
o
r
m
a
tn
a
m
e
.‑
>
1・
・
・ IInputformatnams.
I
n
p
u
tCodeN
o
.b
e
l
o
w
.
I
.
..
l
l
n
p
u
tCod. No.b.low.

l

p m伽 mat文 を 作 的
SASプログラムの自動生成かっ自動実行

幹的Jfomat--s ・,~

‑
c
唾
き
?
ー

p
r
o
cf
o
r
m
a
t文
実行済み

国3 p
r
o
cf
o
r
m
a
t文を作成する手順

‑
1
8・

r

r

且
E

h
‑

・・・

口口︑︐

SH

・

‑ ‑

E

U

一一‑
・・
[
:
f
:
.
'
̲
y
J
r
u
i
L
1
l
t
;
‑
『一一一

HaH

ドア~一一一一

4H

血一

司司

⁝
子
一d ⁝

44

E‑
H
F
‑
t︑広遁日

川戸︑

︒
︑az

••••

一

an
u
‑
‑
n
n
⁝頃︐銅山

[
(
l
)
m
a
c
r
o
̲
d
e
f
i
n
e
.
s
a
s
] (
2
)
f
o
r
m
a
t
̲
c
r
e
a
t
e
d1
.s
a
s (
3
)
f
o
r
m
a
t
̲
c
r
e
a
t
e
d
2
.
s
a
s(付録 3参照)

23.

format ̲ c r e at e d 1 . s a sで変数と属性のリストをエクセルファイルに exportする。このエクセルファ rocdatasetsから作成した変数リストの SASデータセットを更に proctransposeで行と列 イルは p を入れ替えた後、更に必要な行と列を追加して、次の手順で行うエクセル上での手入力作業をしやす くしている。 ① そのエクセル上で、 format作成に必要な情報を手入力する。(付録 6参照) ② format created2.sasを実行すると、そのエクセルファイルを importした後、 procformat 文を作成する SASプログラム p roc̲format.sasが自動作成され、直ちに自動的に実行される。 proc̲format.sasは、この後必要になる度に単独でも再実行できる。 下の例では f o r m a t名が l $ s e x Jと I $ m s t at u s J の定義ができている。 f o r m a t名が l $ x x x x J では、 f o r m a t 名の入力はエクセルファイルにされていたが、肝心の値と意味の入力がされていなかったために生じた現象 で、コメント文で I E r r o r J表示するようにプログラムで、指示している。ただし、この p r o cf o r m a t文自体は、 このままでも実行時にエラーを出さないので、正常に生成された f o r m a t名については、正しく作動する。 p r o cf o r m a t ; v a l u e$ x x x x I * ? ? ? ? ?っ ? ; <ー E r r o r* 1 v a l u e$ s e x " F " = " F e m a l e " " M " = " M a l e " v a l u e$ m s t a t u s " l " = " H o u s e h o l dH e a d " " 2 " = " H o u s e h o l dH e a d 'ss p o u s e " ' ' 3 ' '= ' ' C h iI d " 自動生成された S A Sプログラム例: proc̲format.sas 5. まとめ 本論文では 3種類の処理をする SASプログラムを紹介した。この 3つのプログラムを一つのプログラ ムにまとめることはできるが、実際の利用場面を考慮すると、別々の方が便利と判断して、個別に作成 した。実際の利用現場では、 macro̲define.sasの 中 の マ ク ロ 変 数 を SAS経験者が設定をした後は、 SASを 知 ら な い 補 助 作 業 者 で も エ ク セ ル 上 で 作 業 を す る だ け で 済 む の で 、 安 心 し て 作 業 を 任 せ ることができる。 改良すべき点はいくつかある。 format文を作成するプログラムでは、 format名 が 7文 字 以 内 で あ る こ と を チ ェ ッ ク す る 機 能 が 必 要 で あ る 。 ま た 、 macro̲define.sasで は 、 後 で 自 動 生 成 さ れる SASプ ロ グ ラ ム の プ ロ グ ラ ム 名 も マ ク ロ 変 数 で 指 定 で き る よ う に し て お く ほ う が 、 「 上 書 き」されることがなくて、安全と思われる。付録 1~3 のプログラムでは要所に proc p rint文を 挿入して途中経過を確認しているが、変数が多い場合には表示しないほうが便利な時もある。 procprint文 を 無 効 に す る た め の マ ク ロ 変 数 も macro̲define.sasに 含 め た ほ う が よ い 。 途 中 経 過の表示がなくても正しく一連の処理が行われたかどうかは、自動生成されたプログラムを見る か 、 出 来 上 が っ た SASデ ー タ セ ッ ト を 見 れ ば 判 断 で き る 。 こ れ ら の 点 に つ い て は 論 文 発 表 当 日 までに改良する予定である。 ‑ 1 9・

24.

│付録 1.変数ラベルを付加する S A Sプログラム│ / *d s ̲ v a r i a b l e s 1 . s a s* / ‑ & Ii b n a m e ; p r o cd a t a s e t s1 i b r a ry c o n t e n t sd a t a 北d s n a m eo u t = v a r ̲ l i s t ( k e ep = v a r n u mn 釧 et y p el e n g t hl a b e l ) ; r u n ; 3 ) ; p r o cp r i n td a t a = & l i b n a m e . . v a r ̲ l i s t ( o b s= t i t l eも e f o r e " ;v a rv a r n u mn 釧 et y p el e n g t hl a b e l ;r u n ; d a t a& 1i b n a m e . . v a r ̲ 1 i s t ; d r o pT Y P E ; r e n a m et y p e 1 = T Y P E ; s e t ; i fT Y P E = 2t h e nt y p e 1 = " C h a r " ; e l s et y p e 1 = " N u m " ; r u n ; p r o cs o r t ;b yv a r n u m ;r u n ; p r o ce x p o r to u t f i l e = "& pr o g r釧平w o r k 平v a r ̲ l i s t . x l s "r e p l a c e ; r u n ; a r̲ Ii s t .x l sを開いて、ラベルを手入力した後、上書き保存する。*/ / * ヱクセルファイルの v / *O p e na nE xc e lf i l e,v a r ̲ l i s t . x l s,a n di n p u tv a r i b a l b el a b e l sm a n n u a l l yo r p a s t es u c hi n f o r m a t i o nf r o ms o m e w h e r ee l s e,a n dt h e nr e p l a c ew i t ht h ec u r r e n t E xc e lf i l e . * / / *d s ̲ v a r i a b l e s 2 . s a s* / o p t i o n sm p r i n tm t r a c em a c r o g e n ; & pr o g r釧平w i t h ̲ l a b el .s a s " ; f i l e n a m eo u t 1" 四 r a m 平' w o r k 平v a r ̲ 1i s t .x l s "o u t = & 1i b n a m e . .l a b e l ̲ d a t ar e p l a c e :r u n ; p r o ci m p o r td a t a f i l e = " & p r p r o cp r i n t ;t i t l e" d a t a = 品1 i b n a m e . .l a b e l ̲ d a t a " ;r u n ; d a t a NULL; f il eo u t 1 ; s e te n d = fi n a l ; i f̲ n ̲ = 1t h e np u t" d a t a&1 i b n a m e . .&~sr:l\Ime;" /"set&1 i b n a m e .. & d s n a m e ; "/勺 a b e l " ; l a b e C Ii s t = r i g h t ( r i g h t ( n a m e )1" = ' "1 1l a b e ' l )1 r'"; p u tl a b el ̲ li s t ; i ffi n a1t h e np u t' ̲ ; ' /' r u n ; '/ " p r o cp 引n td a t a = & l i b n a m e . . & d s n a m e ( o b s = 2 )l a b e l ; "/ 北l i b n a m e . . & d s n a m e :o n l yt w oo b s e r v a t i o n sd i s p l a y e d " ; r u n ; ' ; ' t i t le" d a t a r u n ; 新n c l u d e"&program~with_label.sas"; │付録 2. 変数名を変える S A Sプログラム│ / *r e n釧 e 1 .s a s* / p r o cd a t a s e t sl i b r a ry ‑ & I i b n a m e ; = va r n u mn a m et y p el e n g t hl a b e l ) ; c o n t e n t sd a t a = & d s n a m eo u t = r e n a m e ̲ l i s t ( k e ep r u n ; p r o cp r i n td a t a = 品1 i b n a m e . . r e n a m e ̲ l i s t ( o b s = 3 ) ; t i t l e" b e f o r e " ;v a rv a r n u mn 釧 et y p el e n g t hl a b e l ;r u n ; d a t a& l i b n a m e . . r e n a m e ̲ l i s t ; d r o pT Y P E ; r e n a m et y p e 1 = T Y P E ; s e t ; i fT Y P E = 2t h e nt y p e 1 = " C h a r " ; e l s et y p e 1 = " N 四". r e n a m el e n g t h= Ne w ̲ N a m e ; 20・ ー

25.

r u n ; xlength=length; l e n g t h = .; rename xlength=length; rename臥 ME = OI dN a m e ; procs o r t ; byv a r n u m ;r u n ; W procexportoutfile=w& program平work平ren釧 e̲list.xls replace; run; 1 *ren釧 e2.sas* 1 *Op tions mprintmtracemacrogen; W e n 釧 e ̲var.sas ; f il e n a m eo u t l 可progr釧 ¥ r proc i m p o r tdatafile=W&program~work¥ ren釧e_list.xls o u t = & l i b n a m e . .rename̲data r e p l a c e ;r u n ; W proc p r i n t ; titleWdata=&libname..rename̲data ;r u n ; W data NULL f il eo u t l ; = f i n a l ; sete nd 釧 e ; WIWset&Iibname..&dsn釧 e ; WI i f̲ n ̲ = l then putWdata &Iibname..&dsn rename e l e t e ; i f NewName=w then d else r e n a m e ̲ 1i s t = Old̲Name 1W = W 1New̲N釧 e ; put rename̲list: Iwrun;wI i ff i n a l then put r∞ p Wp ri n td a t a = & 1i b n a m e . .&dsname( o b s = 2 )プ / W ' t i t l e l :data=&libnam~..&dsname: onlytwo observations displayed ; ' I'title2WAfter rename勺 ,I'run;'; r u n ; W W;W proc printdata=&libname..&dsname(obs=2); title wBefore r e n釧よ, r u n ; W 平r e n 釧 e ̲var.sas ; 引ncludeW&program │付録 3 .F O R M A T文を作成する S A Sプログラム│ 1 *format̲createdl.sas* 1 p r∞ datasets l i b r a ry ‑ ‑&Iibname; = varnum n 釧 et ype l e n g t hl a b e l ) ; contents data=&dsname out=var̲list(keep r u n ; proc p r i n t ; title"before"; var varnumnametype l e n g t hl a b e l ;r u n ; data& 1ibname..var l i s t ; drop T Y P E ; r e n釧 etypel=TYPE; s e t ; w i fTYPE=2then t y p e lよChar ; elsetypel=WNum"; r u n ; proc s o r t ; byvarnum; r u n ; data& I i b n a m e . .l a b e l ̲ d a t a ; r e n釧 e臥 ME=Variable; s e t ; Format=Wlnputformat n釧 e . ー) W ; Codes=WlnputCodeNo. below.W ; o u t p u t ; NAME=WW; TYPE= 町 ; 凶B EL= 向; LENGTH = . ; VAR削除.; format=同; Codes=WlnputMeaningsbelow.W ; o u t p u t ; R U N ; proc p r i n t ; titleWdata=&libname..l a b e l ̲ d a t a : with extra blank l i n eW ; run; proctranspose out = for̲format; varVariableLENGTHVARNUMTYPELABEL Format C odes; r u n ; ‑ 2 1 ‑

26.

w p r o cp r i n t :t i t l eW A f t e rt r a n s p o s e i n gl a b e l ̲ d a t a :r u n : d a t af o rf o r m a t : d r o p̲ L A B E L ̲ : r e n釧 e̲ N A M E ̲ = A t t r i b u t e : s e t : r u n : W p r o ce x p o r to u t f i l e = w & pr o g r a m 平: w o r k : 平f o r m a t ̲ l i s t . x l s r e p l a c e :r u n : w / 叩r o cp r i n t :t i t l eW d a t a = t o r ̲ f o r m a t :r u n :本/ 本 / f o r m a t ̲ c r e a t e d 2 . s a s* 1 w f i l e n a m eo u t 1W & p r o g r a m ¥p r o c ̲ f o r m a t . s a s: p r o cd a t a s e t s1 i b r a ry ‑ & Ii b n a m e :c o n t e n t sd a t a = & d s n a m eo u t = n o ̲ o f ̲ v a r s( k e e p = n釧 e )n o p r i n t : 本 T oc o u n tt h en u m b e ro fv a r i a b l e si nt h eo r i g i n a ld a t a s e t本 / r u n :I d a t a :時 o u n tt h en u m b e ro fv a r i a b l e s : k e e pc o u n t : = fi n a1 : s e te n d c o u n t + 1 : i ff i n a l : r u n : d a t an u1 1 s e t : c a l ls y m p u t ( W h o w m a n y W,c o u n t ) :I ピh o w m a n y Wi sam a c r ov a r i a b l e . * 1 r u n ; p r o cp r i n t :t i t l ew m a c r ov a r i a b l e' h o 開 閉n y ' = & h o 開 祖n y W :r u n : & pr o g r a m 平w o r k ' 平f o r m a t ̲ l i s t ̲ s a m p l e . x l sWo u t = f o r m a t ̲ d a t ar e p l a c e :r u n : p r o ci m p o r td a t a f i l e = w p r o cp r i n t :t i t l ew f o r m a t ̲ d a t aw:r u n : 伽l a c r om a k e ̲ f o r m a t( i ): d a t af o r m a t & i : k e e ps t a t e m e n t : l e n g t hs t a t e m e n t$5 0 : l e n g t hf o r m a t ̲ n a m e$5 0 : r e t a i nc h a rq u a t a t i o nf o r m a t ̲ n a m e : r e t a i ns w 1 0s w 20 : s e tf o r m a t ̲ d a t ae n d = l a s t : r o cf i f̲ n ̲ = lt h e nd o :I 本s t a t e m e n t = Wp o r m a t :w: 本/ ネo u t p u t : e n d : s e l e c t : w h e nしn ̲ = 4 )i fc o l & i . = w C h a rwt h e nd o :c h a r = W $ w :q u a t a t i o n = ' w, :en~; w h e nしn ̲ = 6 )i fc o I % e v a 1品 (i + 1 )N EWWt h e nd o :s t a t e m e n t = w v a lu eW1 c h a r 1 ∞I % e v a l品 (i + 1 ): ∞1 % e v a1 品 (i + 1 ): f o r m a tn a m e = 本 F o r m a tn a m ee x i s t s .本 / s w 1 = 1 :I o u t p u t : e n d : n ds w 1= Ot h e nd o :p u tw F o r m a tE r r o r( 1 )! !N of o r m a tn a m e ?W w h e nしn ̲ ) = 8 )d o :i fc o l &i .N EWWa c o l &. ic o l事e v a l品 (i + 1 ) :r e t u r n : e n d : i fs w 1 = 1t h e ni fc o l & i .子 t h e nd o :i fs w 2 = O t h e nd o :p u tw F o r m a tE r r o r ( 2 )! ! W N of o r m a tv a l u e ? f o r m a t ̲ n 釧e = : s t a t聞 e n t = W I 本 ? ? ? ? ? ? ? :<ー E r r o r* r : o u t p u t : s t a t e m e n t = W : W :o u t p u t : s t o p : e n d : e n d : o l &i . e l s ed o :s t a t e m e n t = c . o . m p r e s s ( q u a t a t i o nJ1c 1 1quatation 1 '=同) rtrim(left(∞l事eval品(i+1))) W W s w 2 = l: o u t p u t : e n d : ‑ 2 2・ 1 'W':

27.

o t h e r w i s e ; e n d ; e n d ; i fl a s ta n ds w 1 = 1t h e nd o ;s t a t e m e n t = " ; " ;o u t p u t ;e n d ; R U N ; p r o cp r i n t ;t i t l e" d a t a = f o r m a t & i :F o r m a ts t a t e m e n t " ;r u n ; 伽e n dm a k e ̲ f o r m a t ; 知n a c r or e p e a t ( v a r ̲ n o ) ; 明d oi = l 首t o% e v a l品 (v a r̲ n o * 2 ‑ 1 ) 首b y2 ; 伽1 8 k e ̲ f o r問 t ( 品i ) % e n d ; 伽l e n dr e p e a t ; 百r e p e a t( 針l oY l T l 1 a n y ) * 50 f a ra l lp r o cf o r m a t sa r ec r e a t e d .N o w,t h e yw i l lb ea l lj o i n e dv e r t i c a lI y ; 伽l a c r os e t( v a r̲ n o ); 明d oi = l 首t o首e v a l品 (v a r̲ n o * 2 ‑ 1 ) 首b y2 ; f o r m a t & i % e n d ; 伽l e n ds e t ; d a t ap r o c ̲ f o r m a t ; l e n g t hs t a t e m e n t$5 0 ; s t a t e m e n t = " p r o cf o r m a t ; " ; r u n ; ) ︐ .nVHJ ︾ a a n 勧 m ( 百 M +L a u e n M +L ・ ea ・ ' L m 晶 晶 川 V n H nuaG sIm 4EE‑aG ︐ .+HLuFnMueLa 晶 O﹁ 晶L 内 nuFs EE‑‑r?Eeonur a u &L L . ' ' ' ・ τ ' I UHU "H Hu l r 晶 a M J u α ' r u n ; 首i n c l u d e" & p r o g r a m Y p r o c ̲ f o r m a t . s a s " ; * 5p e c i f yt h ef o ll o w i n gt om a k es u r et h a t" f o r m a t s "a r ed e f i n e ds u c c e s s f u l l y . ; p r o cp r i n td a t a = 品1 i b n a m e .. & d s n a m e( o b s = 2 )1 a b e1 ; t i t l e‑ Wi t hf o r m a t :d a t a = 品1 i b n a m e . . .& d s n a m e :o n l Yt w oo b s e r v a t i o n sd i s p l a y e d " ; 判 a rs e xm 朗 帥r ̲ s t a t u s ; 1 *< Specify* 1 * fo r m a ts e x$ s e x . 1 *<一 Specify* 1 m e m b e r ̲ s t a t u s$ m s t a t u s . ;1 *< ‑ ‑ ‑Specify* 1 r u n ; 一 ‑ │付録 4. マクロ変数定義プログラム│ 1 *macro̲define.sas* 1 首l e td s n a m e 司n i c r o ̲ s a m p l e ; 1 *S A Sd a t a s e tn a m e* 1 則自tp r o g r allFC :¥S A S ̲ F o r u m 事2 0 0 9 ;事 /W h e r et os a v eS A Sp r o g r a m s * 1 引e tl i b n a m e = h h o l d ; ∞ 引e ts a s d s= C : ¥S A S ̲ F o r u m 平2 9 Y s a s d s ; l i b n a m e& I i b n a m e" & s a s d s " ; ‑ 2 3 ‑

28.

也監 テスト用データセット l d a t a = m i c r o ̲ s a m p l e ﹄ 寸 ﹁ 円 uaa 4 E E F n v r h U 4 1 E A H v n J ι 4 1 E A H v r h u﹁ D a斗 rhuqd A守 ~・. ︽ A守 nununununu nununU r h u 守 ︐ ︐ ﹁ hu q u n J 凋斗 EU 凋仏寸の4 41EFhU41E 4 1 E n J ι 4 1 E n J ι ηu ﹁u p n u n u J V' 守 ' n u J Vh rDa斗 a斗 qd4l 1 f L J UaHU ρ u 作とロ nununununu nununU ハ HvpnU41E n u J V ﹁ h u Eu ‑ ‑ n t︐ 守 ‑11nHpunum川 ρ u 匁U 一 S + L a +﹂ U S ﹄ 川 U 内︽ フォーマット文 ‑ 2 4 ‑ 門H unuau&1 ‑EEnunu ρulU evAnvenlqiE L み U r e memιuer um・ F um・ F Mm ιH t n ﹂ ・ 11nu mS ︑ Fu l n u 1lnH ・ lunnhunu nuEnHFO a + nuuylnU 1u︐ i or; msanu ρu nulnuHmm ︑ l ・ i l 4 E E n J ι 4 E t n J ι 11uynune rceLK anti‑‑C LHaee‑‑' nLVMNMHmmHH M 円H 白字が手入力情報 である。 [注] 変数名変更 Char 干 骨 圃 宅 て a " 変数ラベル付加 I n p u tMeanings I n p u tformatname,ー〉 I n p u tCodeNo,below ・.一. 10 3 cuρuVA name ι H m e m L u e r ‑ ‑﹂ 口 4 E E 4 E E n J ι n J ι n J ι nununununu nununununu nununununu nununununu nununununu nununununu 寸 4 1 E n J ι η uaa r h u 11 11 11 11 1 1 ~← TYPE Char Char Char Char Num Char Num Num Char Char LENGTH VARNUM LABEL 9 ! . 3 2 1 ,ーと‑ "ー, , ヰ " ..;.ぃ, 3 .'I~_ ・, ー . と み : . i ' ι l、人手 句 、 ' . , ユ 「 30 1 4 1' ‑ . ," . , ̲ , 8 ' ご ミ .; ' ー l' 5 1・ 2 ! .' :. i' . : ・ ‑ι ,戸 ' " ‑ : ," ! ' 6 1~" 7 ・ 8 " '' . ~ J句 . . 8 , ' . ' : ' 11' ;、 , " 8 1' 2 9 1 • NAME hhid hmemberid naπle sex age member̲status InC Oπle expenditure education job COL 2 COL 1 houseHid A t t r i b u t e V a r i a b l e L 王NGTH VARNUM TYPE LABEL Format Codes 11EU l n H E n H・ 刊 nunDnb 附 録 6 importされるエクセルファイルの例l

29.

E * 1 ̲ 孟置陸 J 主ラ シ 乙 = ン • I %RTFマクロを用いた解析結果の 効率的作成に向けた取り組み ー医薬品開発における解析業務の標準化ー 吉崎正浩,初道正博,冨金原悟 小野薬品工業株式会社 Approachf o re f f i c i e n tmaking ofanalysisusing%RTF ‑Standardizationofanalysisworki ndrugdevelopment‑ MasahiroY o s h i z a k i,MasahiroHatsumichi,S a t o r uFukinbara ONOPharmaceuticalCo.,LTD. 竺竺士一? ??‑35 ミ ム‑4 ら.草壁g l 要旨: 臨床試験の統計解析では,統計解析業務を効率的に 行い,結果の早期固定を行うことが求められる. そこで,多くの時間・コストを費やさず.に効率的な解析 業務を行う手法を検討した. キーワード:RTF.解析業務の標準化 ‑ 2 5 ‑

30.

E1 ‑ 1 & ; ; 置 量 陣 鐘 臨i ン 発表内容 ‑標準化への流れ ・RTFによる解析帳票の作成 ・解析結果の保証に対する工夫 .複数の RTFファイルの結合 2 1 1 一 一 切 端 曲 一 一 ; ιL I SASザ ー 給 一 一 ノ 己 ジ ー … 与士 発表内容 ‑標準化への流れ ・RTFによる解析帳票の作成 ・解析結果の保証に対する工夫 ‑複数の RTFファイルの結合 3 ‑ 2 6・

31.

医薬品開発における解析業務 データの固定 a 統計解析の実施 • 以降の開発方針の判断 質が高く,速やかなレポート作成が求められる! 4 とシシ=.‑::1 高品質で速やかなレポート作成 ・標準化 解析計画書,解析帳票の標準化は達成 ‑パリデートされたプログラムの導入 質が高く,スピーディな解析結果を得られるが │労力コストの問題│ 融 ‑自前でできる範囲でやってみよう! 5 司 27・

32.

.eeem 竺竺.一一明ι ム:作‑三I 発表内容 d標準化への流れ ・R TFによる解析帳票の作成 ‑解析結果の保証に対する工夫 ‑複数の R TFファイルの結合 6 E冨 ‑ 孟 富 島 監 謡 臨 省主ーョシ己主三ジシ 弊社の取り組み ‑解析結果を E x c e lから RTFへ M Wの業務効率の向上 総括報告書, CTDなどをWordで作成するため 園 時 RTFで作成することにより余白調整などが不要 ・解析プログラムの標準化 すべての試験で利用できるように ‑標準化は質の向上にも寄与するはず 7 ‑ 2 8 ‑

33.
[beta]
ヨヲラ‑ラ
骨

RTFとは
•R
i
c
hT
e
x
tF
o
r
m
a
t
多くのワープロソフトで読み書きが可能
フォントサイズや色の設定,表の作成などが可能
a

{
¥
はf
MicrosoftWord
SAS¥par
{
¥fs50Forum}¥
{b2009}.¥par
}
赤字 :RTFのタグ(装飾の命令)

ー
・
砂

ド
A
S
ν

:
.
' Forum2009

,
"
,

寸

ω

タグを含むテキスト!
8

巴畠量孟主置主砲包訟

とシシ‑シ

社内要求水準(目標)
‑副作用の項目別発現率
ONO・1
2
3
4群

投与群

(MedDRA
副に作よ用る項
SO
目
C'PT分類)

プラセボ群

発現対象発{現%率) 発 現 発現対象」発込現L
率発現
{
9
i
J
数例数
件 数 伊j
数例数
件数

99/99
99/99
99/99
99/99
99/99
99/99
99/99
99/99
99/99

全体
心臓障害
心房細動
上室性期外収縮
胃腸障害
便秘
おくび
悪心
日匝吐

(
1
0
0
.
0
)
(
10
0
.
0
)
(
1
0
0
.
0
)
(
1
0
0
.
0
)
(
10
0
.
0
)
(
1
0
0
.
0
)
(
1
0
0
.
0
)
(
1
0
0
.
0
)
(
10
0
.
0
)

9
9
9
9
9
9
9
9
9
9
9
9
9
9
9
9
9
9

99/99
99/99
99/99
99/99
99/99
99/99
99/99
99/99
99/99

(
1
0
0
.
0
)
(
1
0
0
.
0
)
(
1
0
0
.
0
)
(
1
0
0
.
0
)
(
1
0
0
.
0
)
(
1
0
0
.
0
)
(
1
0
0
.
0
)
(
1
0
0
.
0
)
(
1
0
0
.
0
)

9
9
9
9
9
9
9
9
9
9
9
9
9
9
9
9
9
9

総括報告書・ CTDの本文に掲載する帳票

・・砂見易さのために複雑な罫線

司

299

34.

E孟畠畠量函邑語調箇箇薗詣缶詰雌起i ~,;..; RTFの作成 (005を利用) • OutputD e l i v e r ySystem 解析結果などをデータセットやファイルに落とすことが可能 スタイルテンプレートを用いることで,ある程度好みの帳票を作成可能 (RTF,HTML,PDF などの出力形式 OK) . . . これを利用し解析結果の作成を試みた 1 0 巨富置置孟置鐘謡醤起; 005でできたことけ) ‑副作用の項目別発現率 ONO.12J4群 剛作用項目 (Mc dDRAによる SOC'PT分顛} プラセポ群 発現対象発現串発現発現対象発現串発現 例数伊l 数(%)件数例数例数(%)件数 全例 99199 ( 1凹 0 ) 99 99199 ( 1凹 0 ) 9 9 心臓障害 99199 ( 1凹 0 ) 9 9 9 9 9 9 99199 ( 1凹 0 ) 9 9 9 9 9 9 心房細亜J 99199 (1凹 0 ) 上室性期l 外収縮 99199 ( 1凹 0 ) ¥ ' 1腸障害 99199 ( 1凹 0 ) 便畠 99199 ( 1凹 0 ) おくび 99199 ( 1凹 0 ) 悪心 99199 ( 1凹 0 ) 唖吐 99199 ( 1凹 0 ) 9 9 9 9 9 9 9 9 9 9 99199 ( 1 0 0 . 0 ) 99199 ( 1凹 0 ) 99199 ( 1凹 0 ) 99199 ( 1 0 0 . 0 ) 99199 ( 1 0 0 . 0 ) 99199 ( 1凹 0 ) 99199 ( 10 0 . 0 ) 9 9 9 9 9 9 9 9 99 1 1 ‑ 3 0・

35.

EAS:J.-'!f~醤孟監盟直結託 ' ; : : : ; 1シ三ン ODSでできたこと ( 2 ) ‑大枠のアウトプットはスタイルテンプレートで、設定可能 社内要求基準には,オフザベーション単位での罫線設定が必要 ー・代替手段が必要 %RTFの登場 1 2 %RTFマ クロ • Peszekが 1998年に公開 DATA̲ N U L L ̲ ; Iこて.putと組み合わせて RTFを作成(タグの自動生成) .... 表組みの面倒なタクを書く必要がない 。 園 データの列 (085)ごとにセル幅,罫線位置などの指定可能 出力の自由度が高い! 〉 1 3 ‑ 3 1 ‑

36.

E冨 ‑ 温 轟 盤 醤 溢 型ラシ L事 %RTFマ クロ (2) %仕f (n, m, 5=, b=, 戸 , 0=, h=, v=, h l i n e =, l i n e =, l a s t =, w=) ; 該当夢J Iのセル数 .各セルの占有幅の比 :文字上下のスペース .s :表の囲み線有無 .b :小数点桁合わせの位置 .r :用紙縦・横の設定 :横線を引くセルの指定 .h :縦線(右)を引くセルの指定 .v • h l i n e 横線がセルの上か下か . I i n e :線は普通か二重線か . I a s t :行の下部に二重線を引くか :表の横幅(インチ) .w .n ‑ π 1 。 . ex:5 e x :23121 e x :100100 e x :1 e x :1 e x :p o r t r a i t e x :135 e x : a l l ex:bottom ex:S ex:O ex:5 希望するタグを自動生成! 置 14 さシシ~ン 表l プログラムの主要部分 投与群 平均値±標準偏差 ONO‑1234群 プラセボ群 1 0 . 5: t 4.6 t5 . 3 8 . 2: Pタイトル行の設定会l %m同f (1, 1, o=p, h = a l l ) ; p u t&bl . " 表1 "& e . ; %m同f (2, 35, 5=100100, o=p, h = a l l, v = 1 ) ; put&bc."投与群 "&cc."平均値土標準偏差 " & e . ; Fデータ行に対する処理会l %m同f (4, 3212, o=p, h = a l l, v = 1 ) ; .v a l u e 2& e . ; p u t& b c .t x t& c r .v a l u e 1& c c ."土"&cl 1 5 ‑ 3 2・

37.
[beta]
Zッミ,乙ツ

司

・
1

ー

%RTFマ
クロ (4)
Pタイトル行の設定 *
1
% m吋f
(1,
1,
o=p,
h
=
a
l
l
)
;
put&bl
.
"
表 1"&
e
.
;
% m吋f
(2,
35,
5=100100,
o=p,
h
=
a
l
l,
v
=
1
)
;
put&bc."投与群 &cc.n平均値士標準偏差 "&e.;
1
*
データ行に対する処理η
% m吋f
(4,
3212,
o=p,
h
=
a
l
l,
v
=
1
)
;
put&bc.t
x
t&
c
r
.value1&cc."士"&c.
lvalue2&
e
.
;
1
1

ー
‑
P

附の中身は?

1
6

E
t
&
te e孟 置 盈

ν
=

,,‑シ予乙

TimesNewRoman;}

Ar
l
a
l
;
}

500Vclbrdrb馳 r
d
r
h
a
i
r
l
t
l
c
e
l
l
x
2
5
0
0
l
l
l
c
l
b
r
d巾 助 r
d
r
h
a
i
"
'
c
e
l
l
x
3
0
0
0
l
i
l
c
l
b
r
d
r
b助 r
d
r
h
a
i
r
Vcellx4日日開 pard
I
ic
e
l
l単pard副 n
t
b
l
l
t
l
q
r
¥sb2目白02
日10.5I
ic
e
l
l
l
l
l
p
a
r
d
l
i
l
i
n
t
b
l
l
i
l
q
c
l
t
l
s
b
2
日
I
i
Isa20土
I
i
IceI
l
噂p
a
r
d
l
i
l
i
n
t
b
l
l
l
l
q
l単sb2日
I
i
Isa2日

500V
clbrd巾 IIbrdrhai"'cellx2500lilclbrdr
凶 b
r
d
r
h
a
i
r
l
l
l
c
e
l
l
x
3
0
0
01
!
l
clbrdrb
助 r
d
r
h
a
i
r
Vcellx4000l
L
'pard
プラセポ醇単c
e
l
l
単pard桁 n
t
b
I
単qr
Vs
b
2
0
l
l
l
s
a
2日8
.
2l
1c
e
l
l
l
i
l
p
a
r
d制 n
t
b
ll
L
'q
c
l
l
l
s
b
2
0¥
lsa2日
土
I
i
Ic
e
l
l
単pard訓 n
t
b
l
l
l
l
q
I
I
I
I
s
b
2
0
単5a205
.
3

表l

ー
・
砂

投与群

平均値±標準偏差

ONO‑1234群

1
0
.
5:
!
:4
.
6
!
: 5
.
3
8
.
2:

プラセボ群

‑
3
3
‑

38.

f E}tSS 置輩臨鐘溢 ジ ユ ヰ ー ー ' 三J と シ ン Lシ ヘッダーの指定 全体行 s o c行 PT行(最終行以外) 三シシ乙ン 一般化 ONO‑1234 群 投与鮮 (MedDRA 孟 に ' I j よ乍胤る項 SO 目 C‑PT分類) 全体 心臓障宇・ II 心房細動 │上室性期外収縮 1 2 プフセボ群 発現対象発(夜%半) 発 現 発現対象発{現%) 率発現 例数f7i 1 数 件 数 伊l 数例数 件数 99/99 ( 10 0 . 0 ) 99 99/99 ( 10 0 . 0 ) 9 9 99/99 99/99 99/99 ( !0 0 . 0 ) ( 10 0 . 0 ) ( 10 0 . 0 ) 99 9 9 9 9 99/99 99/99 99/99 3 4 5 6 7 8 ( 10 0 . 0 ) ( 1 0 0 . 0 ) ( 1 0 0 . 0 ) 9 セルの数 :2+4x( 群の数) ー吟プログラムの一般化可能! │何群でも利用できるプログラムの作成を実施│ ‑ 3 4・ 99 9 9I 9 9 10

39.

E冨置盃孟置極量鑑単孟孟 ヨッシ三, ; ̲ t RTFマクロの短所 • RTFのタグそのもの タグの意味と効果がわかりにくい(情報不足)=ブラックポックス ‑デバッグが難しい 一般化したプログラムは複雑(マクロ変数などの利用により) ミスを起こしたとき,どこにミスがあるのか,示してくれない 穴 慣れるしかない 2 0 … I 発表内容 d標準化への流れ dRTFによる解析帳票の作成 .解析結果の保証に対する工夫 ‑複数の RTFファイルの結合 2 1 ‑ 3 5 ‑

40.

Ea 重量量量肇謹単語 解析結果の保証(従来) AとBの結果確 認に多くの時間 ‑ダブルプログラミング が必要! プログラマA u 圃 ♂ .ーーーーーニー│ ̲̲ . ザ ' J I 解析結果A 目視比較「一~ │⑧ l . . . . . . . . 0 プログラマ B 最終結果 解析結果 B 22 圏直直孟置魁謹酪 ミシシ三士シ 解析結果の保証の見直し ・ l •1 m ・ ・ l , ~ 果のデータ化 ミスは皆無 O L R T F p L ! !認!~ ,=~司 こ作成 I l ー珍昌ー. 五J 最終結果 プログラマ B 23 ‑ 3 6 ‑

41.

I'~..,.CSi~給 7tJ'7=:..71- /[J~-&拐言語地靖国島民与 三日ミ斗 発表内容 d標準化への流れ dRTFによる解析帳票の作成 d解析結果の保証に対する工夫 ‑複数の RTFファイルの結合 24 Zシシ三:シ " ' 複数の RTFファイルの結合 │直面呂田│ 品明星│弓 RTF [ l~~tt I l R T F~哩| フアイルの結合に,田村 ( 2 0 ω 0 6 )の rSASからWordマクロを実行する」を利用 圃 ‑ + 砂 SAsプ防ムでで 全解析結果を 1つの 焔 F @勾令{管理しやすい ~ Lそのまま総括報告書の 14章へ ‑37 ・ 2 5

42.
[beta]
EAS::l.-'!f-f!~量通箇箇雌量

田村 (
2
0
0
6
)のメリット
.SASプログラムで結合を行える

¥
司

ー・砂処理の自動化

‑プログラムでは Word
の機能を制御する
ー・砂 W
ordの「ページ設定』の制御が可能
ー・砂縦・横の用紙混在の結合が可能

26

置亘Fi
置置匙量醤童謡

3二
'
1
.
"
,ど
‑;;シ‑ニノ

まとめ
・RTFマクロを利用し一般化したプログラムを作成
ー社内要求槻満たすプロトコール哨はい均ラム
・解析結果の目視チェックをデータセットの c
o
m
p
a
r
e
lこ
ーデータ固定直後の門フトの結果の精度向上(現段階)
ー膨大な確認作業の削減(将来構想)

l
解析薬務の嘆準 i
じを這瓦t:j I
2
73
8
43.

I r ! . l=lユーザ噛元デザ平問調理望l 参考 • Peszek(1998)AutomatetheCreationandManipulationof WordProcessorReadySASOutput (ftp.sas.com/techsup/download/observations/obswww13/obswww13.pdf) ‑田村洋介 (2006)SAS・ MicrosoftWord聞の自動化処理による出力の加工・整形 SASForumユーザー会学術総会 2006 28 ‑39・

44.

PDVを意識したプログラミング 中村竜児 株式会社インクリース研究所臨床統計部 SASD a t as t e pp r o g r a m i n gc o n s i d e r i n gPDV R y o j iNakamura LTD.,S t a t i s t i c a lA n a l y s i sGroup E可CREASECO, 要旨 DATAステップの特徴はプログラムデータベクトルにある。プログラムデータベクトル上の処理の流 れを理解し、 RETA凹ステートメントを有効に活用するとプログラミングの幅が広がる。本報告では DATAステップの流れをおさらいするとともに、コーデ、イング例をいくつか示す。 キーワード:DATAステップ、プログラムデータベクトル (PDV)、RETA凹ステートメント 1 . PDVとデータステップ 1 . 1 . データステップの処理の流れ DATAステップをサブミットすると、ステートメントがコンパイルされ、プログラムデータベクトル (PDV) が作成される。 PDVはメモリ領域上に作成される lオブザベーション分の一時的なデータセッ トである。ここで変数が定義され、 SETステートメントや MERGEステートメント等で指定された SAS データセットから読み込まれたデータや、 ATTRlB ステートメントや割り当てステートメント等により 新たに定義されたデータが PDV 上の該当する変数に格納される。そして DATA ステップの終わりに PDV上のデータを lつのオブPザベーションとして SASデータセットに書き出す。 PDVには読み込まれた SASデータセット上の変数や、 DATAステップ内で定義された変数の他に、 N と ERROR としづ変数が自動的に作成される。 N は DATAステップの反復回数を示し、 ERROR はエラー発生の有無を 0, 1で示す。 PUTステートメントを記述すると PDVの内容をログに出力すること ができる。 DATAステップの処理は lオブザベーションごとに以下の処理が反復される。 ( 1 ) 自動変数 N の値が lつ増え、 DATAステップの反復開始 ( 2 ) DATAステップ内で新しく作成される変数に欠損値が設定される ( 3 ) オブザベーションが読み込まれ PDVに格納される ( 4 ) その他のステートメントが実行され、 PDV上の変数の値が書き換えられる ( 5 ) PDVから SASデータセットにオブザベーションが書き出され、 DATAステップの先頭に戻る ‑ 4 1・

45.

ユ PDV上の変数の取り扱い l 以下にプログラミング上のポイントをあげる。 DATAステップ内の処理は PDV上の変数定義に従って行われる。 読み込む SAS データセット上の変数の定義を変更したい場合は、変数の定義を指定するス テートメントを SETステートメントなど SASデータセットを読み込むステートメントより前 に記述する。 SETステートメントの後に SETステートメントで指定したデータセット上の変数の定義を変更しよ うとすると、次の様なメッセージがログに出力される。 W A R N I N G 文字変数 s u b j i d の長さはすでに設定されています。 文字変数の長さを宣言するには、 D A T Aステップの最初に L E N G T H ステートメントを使用してください。 RENAMEステートメントと DATAステートメントの REN 品 1 t E=オプションは SASデータセ ットに書き出される時に実行されるため、 PDV 上では旧変数名で扱われる。これに対し SET ステートメントで RENAME=オプションが実行されると、 PDV上の変数名は新変数名となる。 ただし SETステートメントオプションの優先順位は KEEPIDROP=→ RENAME=→ WHERE=とな るので、 KEEP/DROP=オプションは旧変数名、 WHERE=オプションは新変数名で記述する。以下の例で はデータセット oneを読み込む際に変数 A を B に RENAMEしているが、 KEEP=オプションは A (旧変 数名)、 WHERE=オプションは B (新変数名)で参照している。 d a t at w o s e to n e ( k e e p = ar e n a m e = ( a = b )w h e r e = ( b = 'X Y Z ') ) DROPステートメントと DATAステートメントの DROP=オプションは SASデータセットに 書き出される時に実行されるため該当する変数は PDV上に作成される。 よって DROPされる変数は以下の例の様に割り当てステートメントで参照することができる。 d a t at w o s e to n e( d r o p = a ) b = a 1 . 3 . 値を保持するステートメント 通常。 DATAステップの次の反復に進む際に、割り当てステートメントで新しく定義される変数の値 は欠損値にリセットされるが、リセットせず前のオブザベーションの値を保持したまま次のオブザベー ションの処理を行いたい場合は合計ステートメントか RETAINステートメントを使用する。 合計ステートメントはオブザベーション毎に実行される計算結果を累積していくステートメントで あり、次のように記述する。 ‑ 4 2 ‑

46.

合計変数+計算式; 例として次のデータセット oneを考える。 i d x 内︿ u n J ι 内︿ uaaT n J ι 変数 xの値の合計を変数 yに落とす d a t at w o s e to n e y + x r u n. 結果は次のようになる。 i d x y 内5uvFn︾ Fn︾ nJιnu ‑ nJιnuaaT 次の例題はグ、ループ内通番をふるプログラムである。 s u b j i dと c m s t d t e nでソートされた S ASデータセ ット conmeds (データセットの構造は次節参照)について同ーの s u b j i d内で通し番号をふり cmseqに入 力する。 d a t an e w s e tc o n m e d s b ys u b j i dc m s t d t e n i ff i r s t . s u b j i dt h e nc m s e q= O c m s e q + l r u n; RETA 町ステートメントは次のように記述する。 r e t a i n変数名く初期値> ; 合計ステートメントの例題としてあげた合計値を求める処理を RETA別 ス テ ー ト メ ン ト で 行 う と 次 のようになる。 d a t at w o s e to n e r e t a i ny0 y = s u m( x .y ) r u円 ‑43・

47.

2 . 例題 2 .1 . 複数変数の TRANSPOSE 次の様な併用薬データセット conmedsを考える。 名 一 1 靖一担︒ 句匂坤‑向 司 JJ ‑1ln4nd Y JE t ﹁ " ︑ ‑ ‑ ﹂ ロ ルi 一 P ブノ 官一 E 番 一 薬 一 汁一 用 一 iH 被験者識F口ード SUGI‑001 SUGI‑001 ト0 0 1 SUG 投与終了目 2008112 口 ハ 2008/12/20 200911/ 日 変数定義は以下とする。 # 変数 長さ n4JUFhunJιnJι ハHvnMunHvnMunHvnHv 字値字値字字 文数文数文文 eEEnJιn4uau守 Fhupnu s u b j i d c m s e q c m t e r m c m r o u t e c m s t d t e n c m e n d t e n タイプ 出力形式 入力形式 ラベル $ 3 0 . $ 3 0 . 被験者識別コード $ 2 0 . $ 2 0 . 併用薬番号 薬剤名 投与経路 投与開始日 投与終了日 U S A G E $ 2 0 . $ 2 0 これを次の様に横に展開してみたい。 投与終了 E 2 0 0 8 / 1 2 / 2 0 縦に入力されたデータを横に展開するプ口、ンジャとして TRANSPOSEがあるが、 TRANSPOSEプロシ ジャを使う場合は次の様に I変数ずつ実行して最後に MERGEすることになろう。 p r o ct r a n s p o s ed a t a = s u g i . c o n m e d so u t = d a t a 1 b ys u b j i d i dc m s e q p r o ct r a n s p o s ed a t a = s u g i . c o n m e d so u t = d a t a 2 b ys u b j i d i dc m s e q p r o ct r a n s p o s ed a t a = s u g i . c o n m e d so u t = d a t a 3 b ys u b j i d i dc m s e q ニs u g i . c o n m e d so u t = d a t a 4 b ys u b j i d i dc m s e q p r o ct r a n s p o s ed a t a d a t ao u t merge d a t a 1d a t a 2d a t a 3d a t a 4 b ys u b j i d r u n v a rc m d e c d r u n v a rc m r o u t e r u n v a rc m s t d t e d r u n v a rc m e n d t e n r u n この処理を DATAステップで行うと次の様になる。 ここで併用薬番号 cmseqの繰り返し数は最大 3 としている。 4EEnJιn4uau守 Fhupnu ''nMunuJV 司 HU ︽ ー d a t ac o n m e d s l e n g t h = $ 3 0 a t tri bs u bji d I e n g t h = $ 1O . c m d e c d1 e n g t h = 8 c m r o u t e1 l e n g t h = $ 2 0 c m s t d t e n1 l e n g t h = $ 2 0 . c m e n d t e n1 I I e n g t h = $ 1O . c m d e c d2 e n g t h = 8 . c m r o u t e2 I e n g t h = $ 2 0 c m s t d t e n2 l e n g t h = $ 2 0 c m e n d t e n2 l f o r m a t = $ M E D ̲ . f o r m a t = U S A G E f o r m a t ニ$ M E D ̲ . f o r m a t = U S A G E ‑ 4 4・ l a b e l = "被験者識別コード" l a b e lニ"薬剤名 ̲ 1 " l a b e l = "投与経路 1 " " l a b e l = "投与開始日一 1 " l a b e l = "投与終了日 1 l a b e l = "薬剤名ー2 " l a b e l = "投与経路一2 " l a b e l = "投与開始日 2 " " l a b e l = "投与終了日一2

48.

1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 2 0 2 1 2 2 2 3 2 4 2 5 2 6 2 7 2 8 2 9 3 0 3 1 3 2 3 3 3 4 3 5 3 6 3 7 3 8 • c m d e c d3 c m r o u t e3 c m s t d t e n ̲ 3 c m e n d t e n ̲ 3 l e n g t h = $ 1 0 l e n g t h = 8 l e n g t h = $ 2 0 l e n g t h = $ 2 0 f or m a t = $ M E D ̲ . f o r m a t = U S A G E ̲ l a b e l = "薬剤名 3 " l a b e lニ"投与経路一3 " " l a b e l = "投与開始日 3 " l a b e l = "投与終了日 3 iconmeds s e tsug. r e t a i nc m d e c d 1̲ c m d e c d 3c m r o u t e 1̲ c m r o u t e 3c m s t d t e n 1̲c m s t d t e n3 c m e n d t e n 1̲ c m e n d t e n3 a r r a y̲ c m d e c d C 1 3 ) $c m d e c d 1̲ c m d e c d ̲ 3 a r r a y̲ c m r o u t e C 1 3 )c m r o u t e 1̲ c m r o u t e3 a r r a y̲ c m s t d t e n C 1 3 ) $c m s t d t e n ̲ l ̲c m s t d t e n ̲ 3 a r r a y̲ c m e n d t e n C 1 3 ) $c m e n d t e n 1̲ c m e n d t e n ̲ 3 b ys u b j i dc m s e q ̲ c m d e c d C c m s e q ) = c m d e c d ̲ c m r o u t eC c m s e q )= c m r o u t e ̲ c m s t d t e n C c m s e q ) = c m s t d t e n ̲ c m e n d t e n C c m s e q ) = c m e n d t e n i fl a s t . s u b j i dt h e nd o o u t p u t d oi = lt o3 ̲ c m d e c dC i )=山'・ ̲ c m r o u t eC i )ニ 一cmstdtenC i )= " " c m e n d t e nC i )= " " e n d e n d k e e ps u b j i dc m d e c d ̲ l‑ ‑c m e n d t e n ̲ 3 r u n 2~14 行目:1\官、RIB ステートメントで作成する変数を定義する。変数名は「元の変数名一cmseqJ としている。 17・18行目:作成する変数を全て RETAINする。 19~22 行目 :ARRAY ステートメントで薬剤名、投与経路、投与開始日、投与終了日それぞれに ついて配列を定義する。 ・24~27 行目:配列参照を利用して元の変数の値を新しい変数に割り当てる。このとき配列の要 素番号に併用薬番号 cmseqを指定しているため例えば cmseq=lのときの cmecdの値は cmecd 1 に割り当てられ、 cmseq=2のときは cmecd̲2に割り当てられる。そして cmseq=2のとき cmecd̲l の値は RETAINステートメントにより保持されている。 ・ 28~36 行目:症例番号グ、ループの最後の行のときに PDV の内容を SAS データセットに出力し、 各変数の値に NULLを割り当てて次の症例番号処理のために初期化する。 この方法によると lステップで処理を行うことができる。ソースはかなり長くなっているが、変数定 義は予め CONTENTSプロ、ンジャを実行してマクロ変数に落とすなど、すればマクロ化することができる。 2ユ デカルト積の作成 併用薬データセット conmedsに入力されている併用薬剤名 (CRF記載名) cmtennを医薬品名データ ファイルとつけ合わせ、読み替え候補を出力する処理を考える。 CRF記載名と辞書名が似ている語を探すには SPEDIS関数を利用する。 ‑45・

49.

S P E D I S ( q u e r y,k e y w o r d ) u e r yと keywordに指定した 2つの単語のスペルの違いを 200を上限とする負でない値 SPEDIS関数は q u e r yに指定したワードに変換するため (コスト)を返す。このコストは keywordに指定したワードを q に必要な操作として定義され、 2つのワード聞の柁違は、コストを queryで指定したワードの長さで割 った(整数計算)値(スコア)により求められる。定義されるコストは以下の通りである。 相違なし 。 中央部から 1文字を削除する 50 2重文字の 1つを削除 25 先頭の 1文字を削除する 100 末尾に 1文字追加する 35 中央部に l文字挿入する 100 文字を 2重にする 50 中央部の 1文字を置換する 100 連続する 2文字の1 ) 慎序を逆にする 50 先頭に 1文字挿入する 200 末尾から 1文字を削除する 50 先頭の 1文字を置換する 200 u e r yに併用薬データセット conmedsmの併用薬剤名 cmtermを指定し、 keywordに医 SPEDIS関数の q i cとする)の薬剤日本語名(変数名を dnameとする) 薬品名データファイル (SASデータセット名を d i cの を指定してスコアが指定した値以下の物を SASデータセットに出力する。このとき conmedsmと d オブザベーションの全ての組み合わせについて SPEDIS関数で評価することになる。 全てのオブザベーションの組み合わせ(デカルト積)は SQLプロ、ンジャで WHERE文節を指定しな ければ求めることができるが、オブザベーション数が非常に大きくなり処理に時間がかかってしまう。 そこで DATAステップで、デ、カルト積を作成しながら SPEDIS閣数による評価を行い、条件をみたした組 み合わせのみを SASデータセットに出力する処理を考える。 DATAステップにおいて複数の SETステートメントを指定した場合、全てのデータセットをオブザベ 1対 lマージ)。新しく作成されるデータセットのオブ ーション番号が同じものどうし横に結合する ( ザベーション数は、入力データセットのうちの最小の数となる。複数の入力データセット内に同じ変数 出+ data2 i d v a r 1 y l 2 y2 I= 3 y3 ほ 一 1‑2 同 一1‑2 が含まれる場合は、最後に指定した入力データセットの値となる。 d a t aa1 1 d a t a l s e td a t a 1 v a r s e td a t a2 r u n; a l l v a r これは SET ステートメントが実行される度にプログラムデータベクトルの内容が書き換わることを 意味する。そこでこの性質を利用して、 SETステートメントに POINT=オプションを付けて両方のデー タセットから lオブザベーションずつ読み込む度に OUTPUTステートメントで出力することにより、 デ、カルト積を作成する。 d a t aa1 1 d ox= 1t o2 二x ̲ s e td a t a 1p o i n t 一 = 1t o2 : d oy s e td a t a 2p o i n t = y ̲ o u t p u t e n d e n d s t o p d a t a l a l l d a t a 2 由+由=│ x x l x l x2 x2 ‑ 4 6・ y y l y2 y l y2

50.

r u n. 以上の処理におけるプログラムデータベクトル上の値の変化を以下に示す。 。 y N 。 y N y y N y y 1│yl N 1│xl X y ̲ y ̲ N ̲ X X y X X y 1│xl X X 1│xl X X X 2 Iy2 I1 I d ox= 1 s e td a t a 1p o i n t = l d oy ̲ = l s e td a t a 2p o i n t = l o u t p u t d oy一= 2; s e td a t a 2p o i n t = 2 o u t p u t y一 凶 一 M 川‑tE‑ V‑1‑ y一パ一 M 川 ‑4E ‑ n 4‑ x ‑ l f u ‑ ‑ x ‑ 一 v2 一 一 一 y‑d 2一 一 一 v3 一 一 x一 泣 一 一 2 x 一 一 吋‑ ‑n4‑ x ‑ l f ‑ x ‑ X 一 一 x ‑一 2一 d ox= 2 s e td a t a 1p o i n t = 2 d oy ̲ = l s e td a t a 2p o i n t = l o u t p u t 一 M川 ‑11 d oy ̲ = 2; s e td a t a 2p o i n t = 2 o u t p u t 実際の処理のプログラムは次のようになる。 0 1 d a t a n u1 0 2 s e tc o n m e d s ー ) ) 0 3 c a1 s y m p u t(' n 1 ' .1 e f tしn 0 4 r u n 0 5 d a t a n u1 1 0 6 s e td i c ̲ l l 0 7 c a1 s y m p u t(' n 2 ' .1 e f tしn 0 8 r u n 09 1 0 d a t ao u t 1 1 d oi = 1t o& n 1 1 2 s e tc o n m e d sp o i n t = i 1 3 d oj = lt o& n 2 ‑ 4 7 ‑

51.

1 4 1 5 1 6 1 7 1 8 1 9 • s e td i cp o i n t = j s c o r e = s p e d i s ( c m t e r m . d ̲ n a m e ) i fs c o r e < = 7 5t h e no u t p u t e n d e n d r u n 1~8 行目: c onmedsと c l i cのオブザベーション数をそれぞ、れマクロ変数 n1、n2に落とす。 ・11・12行 目 :point=オプ、ンョンにより conmedsから 1オブザベーションずつ読み込む。処理の 繰返し数はマクロ変数 n1を参照する。 • 13・14行目:p o i n t =オプションにより d i cから 1オブザベーションずつ読み込む。処理の繰返し 数はマクロ変数 n2を参照する。 • 1 5・16行 目 :SPEDIS関数でスコアを求め、 75以下の組み合わせのみを出力する。 参考文献 [ 1 ]SAS言語:解説編パージョン 8、SASI n s t i t u t eJapan株式会社 [ 2 ]中村竜児、角真理子 ( 2 0 0 8 ):BITAPアルゴリズムによるマッチング、 SASForumユ ー ザ ー 会 学 術総会 2008論文集 [ 3 ]YefimGershte戸 1 ( 2 0 0 0 ):Useo fSPEDISF u n c t i o ni nFindingS p e c i f i cValues、P r o c e e d i n g so f t h e25thSASUsersGroupI n t e r n a t i o n a lC o n f e r e n c e,2000 ‑ 4 8 ・

52.

プログラム実行時間短縮の試み ーコンビュータの変更や x64版ソフトウェア、 SSD、 RAMディスクを用いてー 土居主尚 放射線医学総合研究所放射線防護研究センター 規制科学総合研究グ、ループ At r i a l . o fa c c e l e r a t i n ge x e c u t i o no fSASprograms 品Iicomputer , x64e d i t i o ns o丘ware, SSD, andRAMd i s k ‑ ‑Withpowe K a z u t a k aDoi R e g u l a t o r yS c i e n c e sR e s e a r c hGroup R e s e a r c hC e n t e rf o rR a d i a t i o nP r o t e c t i o n, N a t i o n a lI ns t i t u t eo f R a d i o l o g i c a lS c i e n c e s 要旨 近年、複雑な解析手法やシミュレーション研究が短時間で終わらず、結果が出るまでに時間を要することも 少なくない。そこで本研究では実行するコンピュータの変更や M i c r o s o f tWindowsx64版 SAS9 ム SSD、札仙f ディスクなどを用いることで、プログラムをできるだけ変更することなく実行時聞がどの程度短縮できるか について検討を行った。最新のコンピュータではメモリアクセス速度が著しく向上しているが、その効果は 大半の解析に現れた。 SSDや RAMディスクによるディスクアクセス速度の上昇は、通常の規模のデータ解 析ではあまり現れず、大規模なデータをソート、マージを行う状況で一定の実行時間短縮が見受けられた。 コンピュータの変更や x 6 4版 SAS9ム SSD・孔仙fディスクによる実行時間短縮の効果は個々の処理内容に より異なり、特に M Ur . ; 廿 ESTプロシジャでは同じプロシジャでも実行する内容によってその差が顕著に顕れ た 。 AS9.2x64e d i t i o n、SoI idS t a t eD r i v e、RAMディスク、 ANS‑9010 キーワード: S ‑ 4 9 ‑

53.

1.緒言 近年のコンビュータの発達により、モンテカルロ積分のように反復計算を前提とした手法も広く使われる ようになった [ 1 ] [ 2 ]。しかしながら、実際の計算速度には限界があり、同じ解析を複数回反復するシミュレー ションでは結果が出るまでにかなりの時間を要することも少なくない。そのような場合の対処として、効率 の良いプログラムやアルゴ、リズムを作成することが重要であるが、それだけの対応では限界がある。本研究 では、 SAS9 . 2 より正式にサポートされた Windowsx64 e d i t i o n( 6 4 b i t版 Windows) 上で動作する M i c r o s o合 Windowsx64E d i t i o n版 SAS9 . 2( 6 4 b i t版 SAS) によるパフォーマンスの向上について、 3 2 b i t版 SASと比較し て検討を行う。ここでは従来の 3 2 b i t環境を x師 、 6 4 b i t環境を x64とする。またここでの 6 4 b i t環境は、広く A ‑ 6 4( It a n i u m 市販されている個人用のパーソナルコンビュータを指し、一部のサーバー等で採用されている I シリーズ)については付録で扱うに留める [ 3 ]。 SASを含めた全てのプログラムは、ハードデ ィスクなどの外部記憶装置からメモリに読み込まれた後に実 行される。演算・制御の主体である CPUは、加算、乗算など各種演算命令などをメモリから読み、実行する 4 ] 0 x86 が、その演算命令を実行する際には、 CPU はその内部にあるレジスタと呼ばれる記憶領域を用いる [ では 3 2 b i tの汎用レジスタが 8本あり、 x64では 6 4 b i tの汎用レジスタが 1 6本ある。レジスタは CPUの作業 スペースに例えられ、作業スペースが足りなくなるとその内容をレジスタに比べて低速なメモリに退避させ る 。 x64ではこのレジスタの数が 8本から 1 6本に拡張されているため、 x86だと複雑な反復処理でレジスタ が足りなくなってメモリを使わなければならない場合でも、 x64 ではレジスタだけで処理できる場合も考え られる。よって x64に対応した SASを用いることで、実行時聞が短縮される可能性がある。 CPUの性能以外に SAS実行速度に影響を与えるものとして、ハードディスク等のドライブ性能が考えられ る 。 SASは当初より大規模データを扱うことを念頭に入れて開発されたため、データを全てメモリ上ではな くハードディスクのような外部記憶装置上に置いて計算を行う設計となっている。よって大規模データの場 合、ハード デ ィスクのアクセス速度が解析時間に影響を与えている可能性がある。ハードディスクは高速回 転する金属の円盤上にデータを磁気により記録しており、任意のデータにアクセスする際には、そのデータ の記録された部分に磁気ヘッドが移動させるまでの時間が必要である。そのためハードディスクはランダム アクセス(先頭からではなく途中のデータへのアクセス)に弱い。一方で RAMDiskとは、通常はメモリと して使われる DRAMのような半導体をそのまま外部記憶装置として使用したものであり、また最近ハードデ ィスクの代わりとして注目されている S o l i dS t a t eD r i v e (SSD) は DRAMのような半導体をハードディスクド ライブとして用いた装置である。これらはハードディスクよりランダムアクセスが強く、またハードディス クよりも転送速度(一定時間内のデータ転送量)も高速であることが多い。従ってこれらを用いることでプ ログラム実行時聞が短縮される可能性がある。 効率のよいプログラムを作成する場合とは異なり、これらのものを利用する場合にはプログラム自体の変 更は原則行う必要はない。そこで本研究ではプログラムの中身の変更を最低限に留めた状態でこれらのもの を用いることで、プログラムの実行時間がどの程度短縮できる可能性があるかについて検討を行った。 ‑ 5 0・

54.

2 .対象と方法 2 . 1 コンビュータの構成 [ 4 ] [ 5 ] コンピュータの構成要素は大きく分けて 3つである。 CPU、メモリ、入出力装置(以下 I / O ) である。図 lに C o r e2 ) における構成図を示す。 今回用いたコンピュータ ( CPUとは C e n t r a IP r o c e s s i n gU n i tの頭文字であり、制御、演算等のコンピュータの中心的な動作を行う。メモ / Oは最近のコンピュータではほぼ例外な リは制御、演算の命令やその命令対象を保存しておく場所である。 I く搭載されているハード ディスクやビデオカード、キーボードなどを含み、ハードディスクの読み出しゃ書 0へのデータの読み出しゃ書き込みに対応する。チップセットとは CPUとメモリやI1 0 を接続す き込みはI1 るための各種回路を集積したものである。また先述したレジスタは CPU内部に存在する記憶領域であり、情 報を記憶するという機能ではメモリと同等であるが、その容量はメモリと比べものにならない程小さい一方 で 、 CPUと同じ速度で動作する。 メモリ 図1.コンピュータの構成図 ( C o r e2 ) 近年の CPUの動作速度は数 GHzであり、 l秒間に 1 0の 9乗のオーダーで動作している。一方でメモリも高 速とはいえ、 CPUと比べれば遥かに遅く、メモリにアクセスする必要がある場合、 CPUはかなりの時間を待 たなくてはならない。さらにハードディスクへのアクセスには時間がかかり、磁気ヘッドが移動する時間が えば今回用いた C o r e 2Duoのシステムの場合、転送速度も CPUとチップ 必要な上、転送速度自体も遅い。伊J . 5 G B / s(FSB1066MHzの理論値)であり、またチップセットとメモリ間は 6. 4GB/s(DD R2800M Hz セット聞は 8 の理論値)であるが、ハードディスクは 0 . 3 7 5 G B / s(接続インターフェースであるシリアル ATA3.0の理論値) x p r e s s 以下であり、実際のハードディスクは転送速度の理論値よりもさらに低い。なお、ビデオカードは PCIE xl6で接続されているため 4.0GB/sの転送速度であり、キーボードは USB2 . 0を想定しているため 0 . 0 6 G B / s である。なお、この構成概念図は C o r e2のみに該当し、 C o r ei 7ではメモリコントローラが CPUに内蔵され ‑ 5 1 ‑

55.

ているためチップセットを介さずにアクセスでき、最終的に CPUがデータを得るまでの遅延時間の減少が期 7ではチャンネノレ数は 3 待される。さらに Core2では 2つのチェンネノレでEメモリにアクセスを行うが、 Corei に増加しており、アクセス速度の向上していると考えられる。また Corei 7のメモリアクセス速度は 32GB/s とのデータもあり、その場合は Core2の 4倍弱である [ 6 ]。 2.2 比較したコンビュータの詳細 今回主に用いたコンピュータのスペックは表 lに示す通りである。今回コンビュータの性能が変化した場 合の性能変化を調べるため 2台のコンビュータを用いたが、 l台目は 2年前に最新だ、ったコンピュータであ 0 2台目のコンピュータは本原 り 、 CPUに Core2を搭載している(以下このコンビュータを Core2とする ) 稿作成当時に比較的最新であり、 CPUに C o r ei 7を搭載している(以下 i 7とする)。 表1.比較したコンピュータの詳細 C o r e2 C o r ei 7 CPU z) Core2ExtremeQX6700 ( 2 . 6 6 GH C o r ei 7940 ( 2 . 9 3 G H z ) メモリ 8GB (DDR2‑ 8 0 0 ) 12GB (DDR3PC3‑8500) OS WindowsV i s t ax64SP2 WindowsV i s t ax64SP2 ハードディスク S e a g a t eB a r r a c u d a7 2 0 0 . 1 1500GB S e a g a t eB a r r a c u d a7 2 0 0 . 1 2500GB 2.3 今回試みる高速化の原理 今回行う高速化は、大きく分類してソフトウェアによるアプローチとハードワェアによるアプローチの 2 つに分類される。ソフトウェアによる高速化は x64E d i t i o n版 SAS9 . 2を用いることで、処理の 6 4 b i t化によっ て行われるものである。またハードウェアによる高速化は、ハード、ディスクより高速な RAMデ イスクを用 P いることでデータセットの読み書きの高速化によって行われるものである。ここではコンピュータ内部に増 設されたメモリを RAM ディスクとして用いる他、最近発売されたメモリをハードディスクとして扱う装置 7 ]。以下でその詳細について示すが、やや技術的なので読 である ACARD社の M叩・9010も比較対象とする [ 7アーキテクチャへの変更による高速化の原理の詳細はコンピュータの構成 み飛ばしても問題はない。 Corei で説明した通りであり、それ以上の詳細な説明は省略する。 2 . 3 . 1 ソフトウェアの 6 4 b i t化による高速化 [ 8 ] [ 9 ] 最近、市販されているコンピュータの CPUの多くは 6 4 b i tであるが、 3 2 b i tOSがインストーノレされている 場合も多く、その場合は 3 2 b i tのコンビュータとして動作する。通常、コンピュータの b i t数とソフトウェア のb i t数は一致しているが、ソフトウェアの互換性に対する要望が強いため、 6 4 b i t拡張である x64は 3 2 b i tの ソフトウェアをそのまま実行することができる。 そもそもコンピュータの b i t数とは何であろうか。しばしば、 6 4 b i tは 3 2 b i tの倍だから、処理速度や扱える データ量も倍になると期待される場合もあるが、実際はそのような単純なものではない。ここの b i t数はレジ スタの b i t数を指しており、 x86の CPUは 3 2 b i tの汎用レジスタを 8本備え、また x64の CPUは 6 4 b i tの汎用 レジスタを 1 6本備えている。多くのソフトウェアでは汎用レジスタをメモリアドレスの指定に用いるが、そ の際にレジスタが 6 4 b i tになったことで扱える数値の上限が上昇し、それによる扱えるメモリ容量の増加が最 ‑ 5 2 ‑

56.

大のメリットである。よって 3 2 b i t環境ではメモリ不足で実行できなかった解析が実行できる可能性はあるが、 2 b i t環境で既に実行できていた既存の解析におけるメリットはあまり大きくない。 このことによる 3 SASなどの統計解析パッケージソフトウェアでは浮動小数点演算が用いられるが、このような演算は x87 命令と呼ばれる浮動小数点演算専用の命令が用いられ、 x87命令用の 8 0 b i tのレジスタが 8個備わっている。 同じような浮動小数点演算を実行で、きる CPUの仕組みとして、 Pentium4から加えられた拡張命令である S t r e a m i n gSIMDE x t e n s i o n s2 ( S S E 2 ) も存在し、ソフトウェアによってはこちらが用いられる。 SASのよう 4 b i tの浮動小数点しか扱えない SSE2が用いられて な計算精度を要求されるソフトウェアにおいて、最大で 6 いる可能性はあまり高くないと考えられるが、詳細は不明である。 x87命令自体は x86版の SASから実行し ょうが x64版の SASから実行しようが速度に変化はない。しかしながら、もし SSE2が用いられていた場合、 x64では 1 2 8 b i tの専用レジスタが 1 6個使えることに加え、さらに 1 2 8 b i tのレジスタにて 6 4 b i tの浮動小数点 を 2つまとめて一度に処理できるため、かなりの高速化が期待される。 今回、考えられる速度面でのメリットは、 x86を拡張して x64を定義した際にレジスタ数を増加させたこ a c i n t o s hに搭載されており、アップルコンピュー夕、 i l l M、モトローラによって開発された とである。以前 M PowerPCアーキテクチャなどでは 3 2個の汎用レジスタと 3 2個の浮動小数点レジスタを備えており、 x86の レジスタ数の少なさ(汎用レジスタ B個、浮動小数点レジスタ 8個)はソフトウェアの最適化の妨げとなっ ていた。汎用レジスタは反復処理の回数のカウントに使われており、反復処理がネストした場合にはその数 だけ必要となる。またプログラム上、繰り返して実行される一連の処理はサブ ルーチンとしてメインプログ ラムとは別の場所に一つにまとめられ、メインプログラムから繰り返し呼ばれる。メインプログラムからサ ブルーチンが呼ばれる際にサブルーチンで計算に必要な値が渡されるが、これも汎用レジスタが用いられ、 足りない場合にのみ CPUの一部であるレジスタの動作と比べ、かなり低速なメモリが使われる。 以上、 x64版 SAS9 . 2を用いることで反復計算中のメモリアクセスの機会が減少し、実行時間が短縮する可 能性が考えられる。 2 ふ 2 作業ドライブの変更による処理の高速化 SASはデータセットを通常ノ、ードディスク上に保存する。起動時に設定ファイル(日本語を選択した場合、 l sの中にある j aにある SASV9.CFG) を読み込むが、その設定ファイル中 インストールしたディレクトルの n の I‑WORKJ で指定した場所に作成したデータセットはファイルとして保存されている。インストール直後 ¥SAST emporaryF i l e s "Jとなっており、 Windowsが指定する一時的なファイル置き場が指 は I‑WORK"!TEMP 定されている。この設定ファイルの内容を書き換えることにより、任意の場所をデータセットのファイル置 き場にすることが可能でーある。 緒言でも述べたように、ハードディスクは磁気ヘッドの動作とし、う機械的な駆動が存在するため速度は遅 し、一方、全て半導体内での電気信号のやり取りにて完結するメモリをディスクとする RAMディスクは極め て高速なアクセスが可能である。この RAMディスク上にデータセットのファイルを置くことで、データセ ットの読み書きが高速化される。 RAMディスクの歴史は古く、 Windows以前の MS‑DOSでは扱えるメモリ容量の制限から「かな漢字変換 の辞書」は RAMデ、イスク上に置かれた。それ以降はハードディスクの性能向上の陰であまり目立たなかっ たが、そのアクセス速度や機械的な駆動部分の摩耗がないことで一部のユーザーからは支持されていた。搭 載できるメモリ容量が少ない状況でその一部を RAMディスクに害J Iいてしまうと逆に速度が落ちる場合もあ ‑ 5 3 ‑

57.

るが、近年では増設メモリの金額も下がったことで大規模な RAMディスクの作成も現実的となった。ただ i s t ax64で動作する RAMDiskを作成 し、その作成のためには追加でソフトウェアを導入する必要がある。 V するソフトウェアとしては、 QSoftRAMDriveや G a v o t t eR a r n d i s kなどがある。ここでは G a v o t t eR a r n d i s kを用 いた。 また最近、メモリを本体に増設するのではなく、ハードディスクと同じ外部記憶装置として使用できる装 置が発売された。本体に増設できるメモリの容量はマザーボード上に実装されている増設スロットの数に制 限され、その増設スロット数が多いマザーボード、はサーバー用で、あるために金額が極端に上がってしまう。 一方、このようにキットで外部に増設し、それを外部記憶装置として利用する場合は、外部記憶装置と本体 との接続インターフェイスの転送速度の制限を受けるが、増設できるメモリ数にそのような制約はない。 2005 年には主にマザーボードを主力商品とする台湾のメーカーである GIGABYTEが i‑RAMとよばれる製品を発 表し、その後 2008年には外部記憶装置を主力商品とする台湾のメーカーである ACARDが同様の製品である ANS‑9010を発売した [ 7 ] 0 I‑RAMは DDRメモリスロットを 4つ備え、シリアル ATAでコンピュータに接続 秒に制限されたが、 ANS‑9010はより高速なシリアル ATA3.0で接続されてい したため転送速度は 0.1875MB/ 秒に上昇しており、また DDR2メモリスロットを 8つ備えている。 たため 0.375GB/ SSDは DRAMのような半導体をハードディスクドライブとして用いた装置であり、 RAMディスクと同様 1 0 ] 0 Windowsからは通常のハードデ、イスクと全く同様に にランダムアクセスが強く、また転送速度も速し、 [ 扱えるため、 RAMディスクのようにソフトウェアを導入する必要もない。しかしながら、 SSDの最大の欠点 として、書き換え可能回数に上限があることが挙げられる。よって本来であればハードディスクよりも単位 容量あたりの単価が高い SSDを長く使うには、書き換えの回数は少なく読み出しが多い状況が適している。 しかしあまり一般的でない ANS‑9010を入手することの手間や、大容量のメモリを搭載して追加のソフトウ ェアを導入する手聞を考えれば、 SSDの入手し易さやその設定の容易さなどより、これらの機器の比較対象 として挙げるに値するであろう。ここでは書き換え回数が MLC型 ( M u l t iL e v e IC e I I ) と比べて数倍であり、 またアクセス速度も高速といわれる SLC型 ( S i n g l eL e v e IC e I I ) の記憶用半導体素子を用いる製品のうち、さ らにアクセス速度が速いといわれている I n t e Iの製品 X・25E32GBを用いた。メーカーサイトでは、通常の使 1 ]。コンピュータ内部に直接増設したメ 用では全く問題にならないだけのデータ書き込みが保証されている[1 モリと比べるとアクセス速度は遅いが、 SASのデータセットアクセスでボトルネックになるのはランダムア クセスであり、ハードディスクと比べた場合にはかなりの速度上昇が見込まれる。 2.4実行時間の測定 実行時間の測定は、ソフトウェアごと ( x 8 6、x 6 4 )、コンピュータごと ( C o r e 2、Corei 7 )、外部記憶装置ご と(ハードディスク、 RAMディスク、 ANS‑90IO、SSD) ごとの組み合わせにて一定の処理を行うプログラ ムの実行にかかる時間を測定することで行った。 RAMデ、イスクを作成するソフトウェアには、 x64版が存在 a v o t t eR a r n d i s kを用い、 4GBを RAMディスクに害1り当てた。 ANS‑9010 し、なおかつフリーで公開されている G には DDR28004GBのメモリを 8個増設し、 16GBずつの 2つの RAMディスクと認識させた後、 Windowsか らソフトウェア RAIDOを構築した。 SSDは高速であることが知られている I n t e I製の X‑25EE x t r e r n eSATASSD 7のみに限定し、また 32GBを用いた。ただし、 RAMディスクの作成はメモリを 12GB搭載している Corei C o r ei 7には x86版の SAS9 . 2をインストールしていないため時間計測は実行していない。また 2台のコンピ ュータの性能の違いや各外部記憶装置の性能差を検討するため、ベンチマークソフトを用いて基本性能の測 ー5 4・

58.

定を行った。計算で用いられる浮動小数点演算、メモリのアクセス速度を計測するためには C r y s t alMa r k r y s t alDi skMa r k2 . 2x64e d i t i o nを用い、 0 . 9 . 1 2 1 . 3 2 0を用い、またディスクのアクセス速度を調べるためには C 500MBのファイルの読み書きの速度を測定した ( h t t p : / / c r y s t a l m a r k . i n f o / )。時間を計測したプログラムの詳細 は以下に示す。 2 . 5時間を計測するプログラム 次のプログラムを実行させ、その所要時間を比較した。 Iつ目と 2つ目のプログラムに関しては、それぞ れ過去の SASForumユーザー会の論文集にも記述されている。 Iつ目は、 2006年度の SASForumユーザー会で発表した「医学データ解析における 6 4 b i t版 SASの有効性 t a n i u mプラトフォーム ( I A ‑ 6 4 ) を軸にして‑Jで用いた、各種医学データ解析における代表的な の検討ー l プロシジャのオンラインヘルプのサンプルプログラムを複数回実行を行うプログラムである。この中には、 まずマルチスレッドの性能を調べるため、 SAS/IMLでデータ発生を行い、発生した疑似データを MIXEDプ 、 4時点の繰り返 ロシジャで解析を行うプログラムを複数同時に走らせ時間を計部した。対象者数は 200名 し測定のデータに対し、線形混合効果モデルの適用を 200回反復している。また医学データ解析における代 表的なプロシジャ (NLMIXED、IML、NLP、GLM、GLM、MIXED、MULTTEST、PHREG、LOESS、ROBUSTREG、 SQL、GCHART) とデータステップのサンプノレプログラムにより構成されている。 2つ目は、 2007年度の SASForumユーザー会で発表した fSASプロシジャにおける非線形最適化法の実例」 で用いた原爆被爆者のデータ解析であり、ポアソン回帰モデルの最尤推定を行うプログラムである。ここで の解析は、固形がん擢患率と放射線の線量の用量反応関係を記述し、その用量反応関係を修飾する年齢や性 5 3I J などの因子の探索である。ここでは線量あたりのベースライン擢患率の相対変化である過剰相対リスク ( e x c e s sr e l a t i v er i s k ;ERR) の推定に関心があるものとする。固形がんの擢患率の解析は 1 9 5 8年の時点でがん 9 9 8年まで追跡した 1 1 1, 9 5 2人(男性 45, 880人、女性 66, 072人)を対象とし、そのうち を発症しておらず、 1 線量評価ができなかったふ 5 2 5人を除く 1 0 5, 427人が解析に用いられた。固形がんを発症したのは 1 7, 448人 であった。解析には NLMIXEDプロシジャを用い、そのプロシジャにて計算に要した時間を計測した。 3つ目は、ディスクアクセスの影響を受けると考えられる処理として、大規模なデータ ( 2, 500万オブザベ ーション)を 2つのデータセットとしてそれぞれ発生させ、ソートをし、最後にマッチマージを行うプログ ラムを作成した。データ発生から最後のマッチマージが終了するまでの時間を計測した。 4つ目は、リサンプリング法に基づく多重性の調整を MULTTESTプロシジャによって行うプログラムをユ p e r m u t a t i o n ) とブートストラ ーザーズガイドの例を基に作成した。 MULTTESTプロシジャでは、並べ替え ( ップに基づく方法が利用可能である。 この方法は、まずブートストラップ(反復復元抽出)と並べ替え(反復非復元抽出)により、指定した個 数の疑似データを作成する。この疑似データに対して全ての検定を行い、その結果、疑似データ一つあたり 複数個の p値が得られる。複数個の p値のうち、最も小さい p値を疑似データごとに求め、その p値と実際 のデータの全ての検定の p値の比較を行う。この手1 ) 慎を全ての疑似データに対して行い、疑似データから得 られた最小の p値が実際のデータの p値より小さい場合の割合を検定ごとに求める。以上の手順で得られる 割合が調整 p値である。 ここでは並べ替えとブートストラップの 2通りの調整 p値を求める時間を計測した。 Iつ目は F i s h e rの直 接 確 率 法 を 50 万 回 の 並 べ 替 え に よ っ て 疑 似 デ ー タ を 発 生 さ せ 調 整 p 値 を 求 め (permu)、 2 つ 目 は 民リ 民リ

59.

Freedman‑TukeyDoub1eAr c s i n e検定を 200万四のブートストラップによって疑似データを発生させ p値を求め b o o t )。 た ( 3 .結果 3 . 1比較に用いた 2台のコンビュータのベンチマーク 比較に用いた 2台のコンピュータの性能の違いや各外部記憶装置の性能差を検討するため、ベンチマーク ソフトを用いて基本性能の測定を行った。 Crysta1Markの結果を表 2、C r y s t al Di skM a r kの結果を表 3に示す。 表2 .Core2とCorei 7のC r y s t a 1 M a r k 結果 Core2 FPU (浮動小数点演算) Corei 7 49841 55632 メモリ ( r e a d ) 7184.0MB/s 16488.3MB/s メモリ ( w r i t e ) 3084.1MB/s 8467.2MB/s メモリ ( r e a d / w r i t e ) 3096.1MB/s 8497.7MB/s 表3 .B a r r a c u d a7 2 0 0 . 1 1 (HD7200. 11 )、B a r r a c u d a7 2 0 0 . 1 2 (HD7 2 0 0 . 1 2 )、X‑25ESSD、ANS‑9010、RAMディス r y s t alD i skM a r kの結果 (MB/s) クの C RAMディスク HD7 2 0 0 . 1 1 HD7 2 0 0 . 1 2 X‑25ESSD ANS‑9010 S e q u e n t i a 1Read 9 3 . 1 1 0 9 . 1 2 5 0 . 5 3 3 4 . 7 3 5 4 6 . 6 S e q u e n t i a 1W r i t e .2 91 1 0 3 . 9 2 0 2 . 6 2 8 0 . 2 4 9 6 5 . 8 RandomRead512KB 4 0 . 6 3 3 . 9 1 6 5 . 8 3 2 8 . 9 3 7 1 6 . 0 RandomW r i t e512KB . 3 61 4 4 . 9 2 0 3 . 2 2 7 5 . 8 5 1 6 8 . 7 RandomRead4KB 0 . 6 4 0. 11 .5 51 . 1 1 5 0 6 . 3 RandomW r i t e4KB 1 . 3 1 .0 2 4 . 7 4 5 . 1 1 1 5 7. 4 7は約l.l倍に留まっており、計算速度が劇的に向上したわけで、は 表2のFPUの項目では、 Core2と比べ Corei 7では約l.l倍であり、このクロック周波数 ないことが分かる。 CPUのクロック周波数が Core2と比べて Corei の向上に対応している。しかし、メモリアクセスの項目では、 r e a d w r i t e、r e ad/w r i t eの全ての項目で2倍を越え る転送速度となっていた。 0 倍の転送速度であり、さらに RAMデ、イス 表3より、ハード ディスクと比べ、 SSDや ANS‑9010では2倍から 1 クは SSDや ANS‑9010の 1 0倍以上の転送速度であった。 ユーザ 表4に実行プログラムのスレッド数と実行時間を示す。また参考のため付録に 2006年度の SASForum ー会で発表した「医学データ解析における 6 4 b i t 版 SASの有効性の検討 輸にして一」の際に発表した結果を示す。 ‑56・ I t a n i u mプラトフォーム ( I A ‑ 6 4 )を

60.

表4 .実行プログラムのスレッド数と実行時間(秒) ,. C o r e 2 Core2 Core2 Core2 C o r e2 Core2 Corei 7 Corei 7 Cor巴 i 7 o x86 x86 x86 x64 x64 x64 x64 x64 x64 代議 HD SSD ANS HD SSD ANS HD SSD RA お4 2 4 . 0 2 3 . 0 2 3 . 1 2 3 . 1 2 2 . 2 2 2 . 0 1 5 . 2 1 5 . 2 1 5 . 2 2 2 5 . 1 2 4 . 1 2 4 . 2 2 4 . 1 2 4 . 2 2 4 . 1 1 7 . 3 1 7 . 3 1 7 . 2 4 2 7 . 2 26. 4 2 7 . 3 2 7 . 2 2 7 . 2 2 6 . 2 2 5 . 3 2 5 . 3 24. 4 8 5 4 . 1 5 2 . 6 5 5 . 6 5 5 . 3 5 4 . 3 5 3 . 3 4 8 . 7 4 7 . 8 4 7 . 7 1 6 1 0 8 . 9 1 0 5 . 3 1 0 6. 4 .8 1 0l 1 0 2 . 2 1 0 3 . 0 96. 4 9 5 . 5 9 6 . 6 , 色 ム HD: ハードディスク ( C o r e2ではB a r r a c u d a7 2 0 0 . 1 1、Corei 7ではB a r r a c u d a7 2 0 0 . 1 2 ) SSD:X‑25E32GB、ANS:ANS‑9010、RAM:RAMデ イスク 表4の結果をx86とx64の違い、ハードディスク、 SSD、ANS‑9010、RAMディスクの結果を比べると、あま り大きな差は見られなかった。 Core2と比べCorei 7で、は、全てのスレッド数において実行時聞が短縮が見られ た 。 表 5に各プロシジャを使うプログラムの実行時間を示す。 表5 .各プロシジャの実行時間(秒) Core2 Core2 Core2 Core2 Core2 Core2 Corei 7 Corei 7 Corei 7 x86 x86 x86 x64 x64 x64 x64 x64 x64 HD SSD ANS HD SSD ANS HD SSD RAM NLMIXED 2 8 . 2 2 7 . 8 2 7 . 8 3 2 . 1 3l .6 .6 3l 1 3 . 3 1 2 . 8 1 2 . 8 IML 1 4 . 2 1 2 . 7 1 6 . 2 1 3 . 6 1 2. 4 1 2 . 6 1 0 . 2 8 . 9 8 . 7 GLM 7 . 2 6 . 8 7 . 9 3 . 8 3 . 5 3 . 5 MIXED 7 . 6 7 . 5 8 . 2 8 . 2 8 . 2 9 . 8 4 . 7 4 . 7 4 . 6 MULTTEST 1 3 . 9 1 3 . 8 1 3 . 8 9 . 7 9 . 2 9 . 2 8 . 3 6 . 6 6 . 6 PHREG 3 2 . 1 2 8 . 2 2 8 . 6 2 8 . 6 25. 4 2 5 . 8 1 8. 4 1 4. 4 1 3 . 7 7 . 9 6 . 6 3 . 7 4 . 3 3 . 5 NLP BASE 9 . 8 9. 4 9 . 6 1 0. 4 9 . 7 LOESS 7 . 1 6. 4 6 . 6 8 . 7 8 . 5 5. 4 5 . 3 3 . 0 ROBUSTREG 7 . 3 5 . 0 5 . 3 6 . 5 4 . 8 4 . 3 8 . 1 2 . 9 3 . 0 SQL 5. 4 5 . 1 6 . 3 5 . 0 4 . 8 4 . 3 3 . 2 2 . 8 4 . 7 GCHART 5 . 8 5 . 7 5 . 8 6 . 8 6 . 7 6. 4 3. 4 2 . 7 2 . 6 HD: ハード、ディスク ( C o r e2で1まB a r r a c u d a7 2 0 0 . 1 1、Corei 7ではB a r r a c u d a7 2 0 0 . 1 2 ) ・ 25E32GB、ANS:ANS‑9010、RAM:RAMディスク SSD:X NLPの項目はライセンスの関係で、 GLMの一部の項目ではエラーのため実行不能 ROBUSTREGを除くほぼ全てのプロシジャで、Core2と比べ、 Corei 7での実行時間短縮が見られた。特に ‑ 5 7 ‑

61.

NLMIXEDや GLM、GCHARTでは実行時聞が約半分となった。一方、ハードディスク・ SSD• ANS‑901 0、RAM ディスクの効果が見られたものは PHREG'BASE・LOESS・ROBUSTREGなど一部のプロシジャに留まって o r ei 7で実行した ROBUSTREGのみであり、他のものの時 おり、またその実行時聞が半分に短縮したものは C 間短縮はそれ以下で、あった。 また SSDは全ての項目で時間短縮の効果が得られた一方で、 ANS‑9010や RAM ディスクでは逆に IML や SQL実行時間が長くなってしまった項目も存在した。 x64がx86と比べて実行時間が 短くなったプロシジャとしては、 IML、M UI : 廿EST、PHREG、ROBUSTREG、 SQLなどが挙げられる。一方 で、逆に x64の方が実行時聞が長くなってしまったプロシジャもあり、そのようなものとしては NLMIXED、 MIXED、 GCHARTが挙げられる。一方 LOESSは実行時間の増加と短縮の両方が見られた。 表6に原爆被爆者のポアソン回帰モデ、/レの最尤推定に要した時間 ( L S S )、大規模なデータのソートとマツ p e r m u t a t i o n ) とブートストラップに基づく多重性調整の チマージ、 MULTTESTプロシジャによる並べ替え ( 方法の実行時間を示す。 表6 .LSS、ソートとマッチマージ、並べ替えとブートストラップによる多重性調整の実行時間(秒) Core2 Core2 Core2 C o r e2 Core2 Core2 Corei 7 Corei 7 Corei 7 x86 x86 x86 x64 x64 x64 x64 x64 x64 HD SSD ANS HD SSD ANS HD SSD RAM LSS 2 4 . 6 2 4 . 6 2 4 . 5 2 5 . 6 2 5. 4 25. 4 1 8. 4 1 7. 4 1 7 . 6 SORT 1 5 4 . 9 9 8 . 7 9 7 . 0 1 5 0 . 2 1 0 0 . 5 1 0 0 . 7 1 1 3 . 5 7 6 . 3 7 2 . 5 permu 2 6 . 7 2 6 . 6 2 6 . 5 1 6 . 1 1 5 . 9 1 5 . 8 1 2 . 0 1 2 . 0 1 2 . 0 b o o t 2 8 . 6 1 6 . 7 1 6. 4 2 7 . 1 1 6 . 5 1 6. 4 1 7 . 6 1 2 . 3 1 0 . 7 HD: ハードディスク ( C o r e2で、は B a r r a c u d a7 2 0 0 . 1 1、C o r ei 7で、は B a r r a c u d a7 2 0 0 . 1 2 ) デ イスク SSD:X‑25E32GB、ANS:ANS‑9010、RAM:RAM p e r m u f 土並べ替えに基づく多重性調整、 b o o tはブートストラップに基づく多重性調整 o r ei 7にて実行時間の短縮が見られた一方、ハードディスク・ SSD・ANS‑9010、 LSSの解析では Core2と比べ C RAMディスクによる違いは SSDや ANS‑9010、RAMディスクを使うことで実行時間の短縮はごく僅かにしか 巴 2と比べ C o r ei 7による実行時間の短縮が見られた上に、ハードディスクから 見られなかった。 SORTで、は Cor SSDやANS‑9010、RAMディスクに変更することでさらなる実行時間の短縮が見られた。並べ替えによる多重 性の調整では、ハードディスク、 SSDや ANS‑9010、RAMディスクによる違いはほとんど見られなかった一方、 x86から x64に変更することでかなりの実行時間短縮が見られ、またそれよりは小さいが Cor 巴2 から Cor 巴i 7への 変更によっても実行時間短縮が見られた。ブートストラップによる多重性の調整では、ハードディスクから SSDや ANS‑9010、RAMディスクに変更を行うことで、大幅な実行時間短縮が見られた。一方で' x 8 6から x64 に変更することによる違いはほとんど見られなかった。また Cor 巴2 から C o r ei 7への変更による時間短縮も見ら れた。 4 .考察 本研究では、時間を要する処理に対して、プログラムを変更することなく実行時間の短縮の試みとして、 ‑58 ・

62.

コンヒ。ュータの変更や x64SAS9 ム SSD、孔山1:Diskを用いることの検討を行った。ほぼ全ての処理にて、 Core2から Corei 7へのコンビュータの変更により、処理時間が短縮されることが示唆された。これは、コン ヒ。ュータのアーキテクチャに変更により、メモリアクセスの高速化が寄与している部分が大きいと考えられ る 。 方、ディスクアクセスを多用する状況、つまり大規模データをソートしたりマッチマージする状況や、 ブートストラップを実行する状況では SSDや RAMディスクを用いることで、処理時間を短縮できることが 示唆された。しかし、例えば通常の対象者数が数百例くらいまでのデータ解析などでは、あまり生かされな い可能性もある。よって、現在行っている処理の内容を把握し、何に投資するのが最も効果的であるかを判 断することが重要である。 MULTTEST プロシジャではリサンプリング法に基づく多重性の調整法として、並べ替えに基づく方法と、 ブートストラップに基づく方法の 2つが適用可能である。しかし、今回の結果では、並べ替えに基づく方法 7への変更で処理は高速化された。ブート では x86から x64への変更で高速化され、さらに Core2から Corei ストラップに基づく方法で、はハードディスクから RAMディスクへの変更で処理が高速化された。以上から 同じリサンプリングでもこの 2つの方法は内部での実装は大きく異なり、並べ替えに基づく方法ではリサン プリングはメモリ内部で行われており、一方でブートストラップに基づく方法では何らかの形でデータセッ トとして作成されていることが予想される。実際に実行している際、並べ替えに基づく方法ではハードディ s e r ' sGuide スクへのアクセスはほとんどない一方、ブートストラップでは断続的なアクセスが続いていた。 U のC o m p u t a t i o n a lR e s o u r c e sの項目には、 PERMUTATIONを指定した際には追加でメモリが必要であることが 明記されており、このことからも何の記述もないブートストラップとは異なりメモリ上での作業が行なわれ ていることが分かる [ 1 2 ]。またこの MULTTESTプロシジャの並べ替えに基づく方法では反復処理 l こ強し、と思 われる x64の特徴が生かされている。 ハードディスクと、 SSD• ANS‑901 0・RAMディスクの差は C r y s t a I D i skMa r kのランダムアクセス (Random Read4KBIRandomW r i t e4KB) では 1 0倍以上の差が付いたが、実行時間の差は 2倍以下と小さかった。さら に差が開くような状況を探索したところ、 SORTを 2変数にて行った場合には HD ( C o r ei 7 ) では 2分 20秒 C o r ei 7 ) では l分 3 5秒であり、 3変数ではそれぞれ 8分 59秒と 4分 20秒で、あった。 かかった処理が SSD ( ソートを行う変数の数が多い状況では、ランダムアクセスの性能が生かされると考えられる。 ハードディスクと、 SSD• ANS‑9010・RAM ディスクの差は大きい状況は見うけられた一方、 SSD' ANS‑9010・RAMディスクの聞での差はそれほど大きくなかった。特に RAMディスクと残りの ANS‑9010、 SSDとの s e q u e n t i a lr e a dと s e q u e n t i a lw r i t eの速度では 1 0倍以上の差があるにも関わらず、処理時間の短縮で はその差は小さい。またこのような RAMディスクが生かされるのは、データが大規模な場合であり、その ような大規模なデータを RAMデ、イスク上に収めるには大規模な RAMディスクを作成しなくてはならない。 メインメモリとして搭載できる容量は限られており、大規模な RAMディスクを作成することで、他のメモ リを使う処理で支障が出る可能性もある。よって九仙4ディスクの使用が推奨される状況は多くはない。一 方で ANS‑9010は DDR24GBのメモリを 8枚増設したために 32GBで、あったが、製品自体は DDR28GBにも n t e lの X25‑E 対応しており、最大 64GBの RAMディスクをハードディスクとして扱うことができる。同様に I も 64GBの製品も存在する。 今回用いたメインのコンピュータは Core2で、あったが、 Core2はアーキテクチャの設計上、 x86の命令に 特化した実行速度の高速化が行われており、そのため x64では x86ほどは性能が発揮されないという記事も 存在する[l3]。それでも Core2上の x64版でかなりの高速化が見られた項目も存在するが、 Core2と Corei 7 ‑ 5 9 ‑

63.

で x64への移行による高速化の効果が異なる可能性も考えられる。しかしながら Cor 巴 2の x 64での速度低下 orei 7でどの程度改善されているかについての資料は調べられていなし、。 がどのくらいであるかや、それが C 今回は時間の関係上 Core2での結果に留めたが、今後は C o r ei 7上での x64と x86の比較も検討している。 SSDは一般に入手が容易で=あり、 ANS‑9010も最近では扱う!苫舗も増え、比較的容易に入手できるようにな った。一方、 RAMディスクを作成のために大規模なメモリを搭載するには通常目にするコンビュータではな く、特殊なサーバー用のものなどを容易する必要がある。また RAMディスク作成のためのソフトウェアも 別途必要である。 x86用には RamPhantomのような市販のソフトに加え、フリーのソフトウェアもいくつか 存在する。 x64版では選択肢は多くなく、市販のものでは Q S o f t孔 仙1 D r i v e、フリーのものでは G a v o t t eRamdisk がある。本研究では G a v o t t eRamdiskを用いたが、インストール時やその運用には手聞が必要である(付録参 2 0 0 9年 6月中旬) X‑25‑E32GBは 7万円前後である。 ANS‑9010 照)。金額面であるが、この原稿執筆時現在 ( は 4万円前後の本体に加え DDR2のメモリが必要 (DDR24GBは l万 2千円前後)であり、今回の 32GBを 4万前後になる。 Corei 7のコンビュータは、個々の構成にも依存する部分もあるが、本 実現するには合計 1 体のみならば安いものを探せばメモリを 12GB搭載しでも 1 6万円前後で購入可能である。手間を最小限にし て大規模データの処理時間の短縮を試みる場合には、入手と設置のしやすさでは SSDが最も優れており、 SSD の書き換え回数の制限等が気になる場合には多少インストール時に手聞はかかるが ANS‑9010が良いと思わ れる。大規模データのみならず、全体的な速度向上を期待する場合には、 Cor 巴i 7への変更が有効である。 5 .結論 実行するコンビュータの変更や M i c r o s o f tWindowsx64E d i t i o n版 SAS9ム SSD、RAMDiskなどを用いるこ とで、プログラムをできるだけ変更することなく実行時間がどの程度短縮できるかのついての検討を行った。 その結果、従来の Cor 巴 2から C orei 7へコンピュータを変更することで NLMIXED、 IML、GLM、MIXED、 MULTTEST、PHREG、BASE、LOESS、ROBUSTREG、 SQL、GCHARTなどの幅広いプロシジャ等で、かなり の時間短縮が得られる可能性があることが分かつた。 x64版ソフトウェアの変更により時間短縮が得られる 可能性があるプロシジャは限られており、 M ur ; 廿EST、PHREG、ROBUSTREG、SQLに留まった。 SSD、RAM ディスクにより実行時間短縮が得られる可能性のあるプロシジャは多い一方で、逆に実行時間増加も見られ た。さらにあまりデータの規模が大きくない場合にはその時間短縮の程度も小さい。一方で、データの規模が 大きくなれば SSD、RAMディスクの効果は大きくなり、特に大規模データをソート、マッチマージなどを行 う状況では実行時間短縮の効果は大きい。このようにコンピュータの変更や SSD、RAMディスクによる高速 化の効果は個々のプログラムの処理内容に依存するが、それが顕著に顕れるプロシジャは MULTTESTプロシ ジャであり、このプロシジャで並べ替えを行う際には x64版を用いることや C o r ei 7への変更が有効で・あり、 一方ブートストラップを使用する場合には、 SSD.RAMディスクの利用が有効である。 謝辞 本研究の一部である LSSの解析で用いた原爆被爆者のデータは、広島および長崎の放射線影響研究所(放 影研)から入手したものである。放影研は日本の厚生労働省ならびに米国の学士院を通じてエネルギー省に より資金提供を受けている公益法人である。当該データには、広島市・県および長崎市・県の腫蕩登録、な らびに広島・長崎の組織登録から得られた情報が含まれている。この報告書に示した結論は著者のものであ ‑60・

64.

り、必ずしも放影研またはその資金提供機関の判断を反映するものではない。 参考文献 [ I J 在金芳,回栗正章,手塚集他.計算統計I.岩波書庖. 2 0 0 3 . [ 2 J岩崎学.統計的データ解析のための数値計算法入門.朝倉書庖. 2 0 0 4 . 2 0 0 0 . [ 3 J 池 井 満.IA‑64プロセッサ基本講座.オーム社. [ 4 J 蒲 地 輝 尚 , 水 越 康 博 . は じ め て 読 む Pentiumマシン語入門編.アスキー. 2 0 0 4 . [ 5 J 中森章.マイクロプロセッサ・アーキテクチャ入門 .CQ出版社. 2 0 0 4 . ・9 7 . [ 6 J 技術評論社.S o f t w a r eDesign2009年 7月号.p70 [ 7 JACARD.IDE/SCSVSATARAIDS t r a g eS o l u t i o n s .2009年 6月 29日アクセス. j a p a n e s e / f b Oトp r o d u ct . j s p ? i d n o ̲no=256&typel ̲ i d n o =1 3 h t t p : / / w w w . a c a r d . c om/ [ 8 J 大貫広幸.x86アセンブラ入門 .CQ出版社. 2 0 0 6 . [ 9 JI n t el.インテルエクステンデッド・メモリ 6 4テクノロジ・ソフトウェア・デベロッパーズ・ ガイド、第 l巻 .2009年 6月 29日取得. j p / d e v e l o p e r / j p d o c / E M 6 4 T̲VOL l̲30083402 ̲i . p d f h t t p : / / d o w n l o a d . i n t e. lc om/ [ 1 0 J 久 保 勇 .DDR2対応 RAMディスク r ANS‑9010J を試す.2009年 6月 29日アクセス. h t t p : / / a k i b a ‑ p c . w a t c h . i m p r e s s . c o . j p / h o t l i n e / 2 0 0 8 1 1 0 8 / s p ̲ a c a r d . h t m l [ I I JI n t el.エンタープライズ用途向け高性能ソリッド・ステー卜・ドライブ (SSD) を出荷開始 仕p : / /www . in t e. lc o . j p / j p / i n t e ν p r / p r e s s 2 0 0 8 / 0 8 1 0 1 6 b . h t m 2009年 6月 23日アクセス .h 2008 [ 1 2 JSASI n s t i t u t eI n c .SAS/STAT9 . 2U s e r ' sG u i d e .C a r y :SASI n s t i t u t eI n c, [ 1 3 J 後藤弘茂.6 4 b i tは苦手な CoreM i c r o a r c h i t e c t u r e .2009年 7月 6日アクセス im p r e s s . c o . j p / d o c s / 2 0 0 6 / 0 7 1 8I k a i g a i 288 . h t m h t t p : / / p c . w a t c h. 付録 A .I t anium2や Pentium4との比較 参考のため 2006年度の SASForumユーザー会での「医学データ解析における 6 4 b i t版 SASの有効性の検討 ーl t a n i u mプラトフォーム (IA ・ 6 4 ) を軸にしてー」で公表した結果を掲載する。用いた SASのパージョンが 9 . 1( 6 4 b i t版 2003、3 2 b i t版 XP)であるため、直接的な比較には注意が必要である。過去のデータであるため、 有効数字の桁数は統ーできなかった。全てハード、テ守イスクであるため、ここでのハード、ディスクの結果を比 較対象として掲載する。スペックは以下の通り。 IA‑64 ~ CPU:l t a n i u m21 .5GHz (L3キャッシュ 6MB) 2コア 》 メモリ:10GB ~ WindowsS e r v e r2003, E n t e r p r i s eE d i t i o nf o rl t a n i u m ‑ b a s e ds y s t e m s IA‑32 ( x 8 6と同義、 2002年前後の製品) ~ CPU:Pentium42.6GHz (L3キャッシュなし) Iコア 》 メモリ:512MB ‑ 6 1・

65.

〉 WindowsXPP r o f e s s i o n a 1 表7 .I t a n i u m2、Pentium4、Core2、Corei 7の比較(秒) l t a n i u m2 Pentium4 Core2 IA‑64 I A ‑ 3 2 x86 x64 x64 HD HD HD HD HD 1t h r e a d 37 9 7 2 4 . 0 2 3 . 1 1 5 . 2 2t h r e a d s 39 1 9 9 2 5 . 1 24. 1 1 7 . 3 4t h r e a d s 7 5 339 2 7 . 2 2 7 . 2 2 5 . 3 8t h r e a d s 1 5 1 8 3 1 5 4 . 1 5 5 . 3 4 8 . 7 1 01 .8 96. 4 1 6t h r e a d s 296 1 8 5 3 1 0 8 . 9 Core2 Corei 7 NLMIXED 1 9 9 4 7 . 8 2 8 . 2 3 2 . 1 1 3 . 3 I 加江 40 3 5 . 9 1 4 . 2 1 3 . 6 1 0 . 2 NLP 1 8 1 6 . 2 GLM 6 . 3 8 . 2 7 . 2 MlXED 9 . 8 9 . 6 7 . 6 8 . 2 4 . 7 MULTTEST 2 5 3 7 . 2 1 3 . 9 9 . 7 8 . 3 PHREG 3 6 . 9 4 2 . 6 3 2 . 1 2 8 . 6 1 8. 4 BASE 9 . 2 1 0 . 8 9 . 8 1 0. 4 6 . 6 LOESS 8 . 3 7 . 1 7. 1 8 . 7 5 . 3 SQL 6 . 2 8 . 3 5. 4 5 . 0 3 . 2 GCHART 1 3 . 1 1 6 . 6 5 . 8 6 . 8 3. 4 3 . 8 B .MicrosoftWindowsx64Edition版 SAS9 . 2上での IMLで作成可能な行列サイズ 本文中では掲載しなかったx64E d i t i o nの利点を以下に記述する。 x64 版 SAS9 . 2上のIMUこて、作成可能最大単位行列は 1 6 3 8 3 x 1 6 3 8 3で、あり、その最大サイズの行列作成個数 に制限はないただしシステム全体のメモリ使用量(タスクマネージャで確認)が実メモリを越えたあたりか ら全体的な動作が鈍くなり、最終的にプログラムの入力などもほとんどできない状態にまでなった。 8GBの メモリを搭載している状態で 1 6 3 8 3x1 6 3 8 3の単位行列を 8つ作成まで確認。 x86 版 SAS9 . 2でも作成可能最大単位行列はx86 版と同じく 1 6 3 8 0x1 6 3 8 0であった。何故かx64版よりも僅かに 3だけ小さい。ただし最大作成可能なサイズはほぼ等しいが、 l つ以上の作成ができなかった。 2006 年のユーザー会ではIA‑64 ( It a n i u m2、メモリ 10GB) とIA ・3 2( P e n t i u m4、メモリ 512MB) のSASにて 同じこと ( 1 0 0単位でサイズを増加)を実行した結果、 IA ・6 4では 16300x16300、I A ‑ 3 2では9400x9400で、あった。 この結果より、 IMUこて作成可能最大サイズはメモリの制限ではなく IMLの仕様となっている可能性が高い。 一方、 I A ‑ 3 2で9400x9400が制限だ、ったものは、メモリ搭載量の増加により 16300x16300までは作成できたと考 えられる。 x64 版 SAS9 . 2でIMLを用いることで、最大サイズは変わらないものの作成個数は増え、今まで実行 できなかった処理が実行できる可能性がある。 ‑62・

66.

C .G a v o t t eRamdiskのインストール方法と運用 このソフトウェアを x64版 WindowsV i s t aで使用する場合には注意が必要である。 x86版と比べ、 x64版 で はセキュリティ強化の一環としてドライパの署名が必須とされている。 Q S o f tRAMDriveを用いた方が面倒な S o f tRAMDriveを用いた場合、 3GBまでしか RAMディスク 手順は避けることができるが、手元の環境では Q を作成することができなかった。また x86 版 の 場 合 に は Ra mPhantom a v o t t e ( h t t p : / / w w w . i o d a t a . j p / p r o d u c t l h d d l s o f t l r a m p h a n t o m 3 / i n d e x . h t m ) とし、う商用ソフトウェアも存在し、また G Ramdiskのインストールも煩雑な作業も少なくなるものと思われる。 RAMディスクのソフトによって性能が 違い、 Q S o f t RAMDrive の 方 が ラ ン ダ ム ア ク セ ス に 強 い と い う 意 見 も あ る が ( h t t p : / / w w w . w a g i p o n i a . c om/w o r d p r e s s / a r c h i v e s / 2 1)、本研究ではソフト聞の違いについては扱わない。また G a v o t eRamdiskに関する情報をまとめたウェブサイト ( h t t p : / / w w w l O . a t w i k i . j p / g a v o口e r d l ) も存在する。以下で x 6 4版 WindowsV i s t a )で G a v o t t eRamdiskインストールした際の手順を記しておくが、個々 は、手元の環境 ( の環境によっては動かない可能性も考えられるが、その際に著者に問い合わせても解決法を示すことはでき ないと思われる。 RAMディスク自体、やや取り扱いが困難なものであり、ある程度のコンビュータに関する 知識と検索エンジンによる知識の収集に慣れていない場合には苦労することもあることをあり得る。以下の 作業が何をしているのか分からない場合やトラブ、ルが生じても自力で解決できる自信がない場合には、 RAM ディスクではなく SSDを使うべきである。また重要な作業を行うコンピュータでの使用は推奨しない。本記 述に従う場合は各自の責任で、行っていただきたい。 a v o t t eRamdiskを取得するとファイルは圧縮されていると思われるので、適切な解凍ソフトウェアを まず G 用いて解凍する。 r r a m 4 g . r e g J ファイルを実行し、レジストリ情報を登録する。その後、デ、パイスマネージャ より「レガシーハードウェアの追加」を選択し、「ディスクの使用」よりこのファイルがある場所を指定する。 「デジタル署名されていません」とのエラーが出るが、そのまま続行する。ここまで終了したら、 r a m d i s k . e x e を右クリックから管理者として実行メニューより実行する。上手くインストールされていれば D i s kS i z eと D r i v eL e t t e r の変更ができるようになっているはずである。 MediaType は変更を行わない方がよい。なお U n i n s t a l lはこの画面より行える。 この状態で起動をすると、起動時にエラーが出て途中で止まる。そこで詳細ブートオプションのメニュー を出し、「ドライパ署名の強制を無効にする」を選択して起動を続行する。上手くいけばこれで RAMディス クが使える。この起動時の「ドライパ署名の強制を無効にする」の選択は RAMディスクをインストールし h 叩://ha i z i n . s e r v e b l o g . n et ! ?p=2657)、かなり専 ている限り、毎回必要となる。それを回避する方法もあるが ( 門的である上に作業に失敗した場合には起動すらしなくなる可能性もあり、著者も試していない。 ‑ 6 3・

68.

医学研究者と統計ソフトウェアの関係とは? 大橋渉 先端医療振興財団臨床研究情報センター HowMedicalResearcherse s t a b l i s h r e l a t i o n s h i p sw i t ht h eS t a t i s t i c a lSoftware? WataruOhashi Foundationf o rBiomedicalResearchandI n n o v a t i o nT r a n s l a t i o n a l ResearchI n f o r m a t i c sCenter '~.._.,'シ "-::1 要旨: 医学研究における統計処理の位置付けが決して高いとは思え ないのは何故か?大学における統計処理に対する意識と教育、 及びそれらと統計ソフトウェアの関係についての事例を報告する キーワード:統計教育、ソフトウエア、投稿規程 ‑ 6 7・

69.

どシシ三ン 1この数字が示すものは? ある医療系大学における 2種類の統計ソフトウェア教室で、の出来 事(大学院博士課程 教授まで) 1 . 2日間で定員 60名が満杯 2 . 講座当固まで5名程度しか集まらず (両講座とも 6月中旬の月曜日夕方開催、講師も同ーのため開催条 件にそれほどの差は無い) .は他ならぬ 上記の 1は「クリックだけでで、きる」ソフトウェア教室、 2 SAS教室。ここまで差がついてしまう原因は何であろうか? 2 E冨置轟孟置極量溢血 とジシ三〉 2 .この差は何処から来ている? 現段階で考えられることは・.. 1.SASの「難しい」というイメージの強さ? 2 .GUI(GraphicalUserI n t e r f a c e )の安易さ?(=プログラムの難 しさ?) 3 .その他の理由? 上記の原因を探るための手掛かりとして・.. 2007年4月1日" " ' 2 0 0 8年 3月3 1日に持ち込まれた統計相談(学部生 によるものを除く)、ソフトウェア教室におけるアンケート結果、大学院 生向けの授業におけるソフトウェア実習の内容について検討する ‑68 ・

70.

s …唱会ん弔問司 3 .ソフトウェアのタイフ別受講者の内訳 クリック骨イプの受講者学科属性(n=60) プログラム骨イプの受講者学科属性(n=5) 5,8 . 3目 26,4 3 . 3 % 4( 8 0 . 0 % ) │ロ医学科ロ歯学科│ 安各学科とも、ほぼ大学院生(博士)‑教授まで … I4.出席者の期待するもの? (%) 」主且品afj4.ゴ受講者アンケートより(複数回答) nunununununununununU 987E54321 合 ‑ 6 9・ 仁 コ はSAS 講座参加者

71.

E函置置孟置量趨越艦 5 .受講理由 (GUI~ イプ)講座を受けようと思った理由 今後のための学習 05050505050 544332211 43 ( ! まI まExcelでした) ' ! F ̲ " , " ・ ES:I.-'!f--f!~藍盤盛幽謡: ヨ恒三J 2 6 .(少数ですが )SAS講座出席者コメント 自習できるような教本・教材がない (n=4) 今用いているソフトウェアでは限界がある (n=3) データのセットの仕方がわからない (n=3) 自身の研究テーマに合致した解析を行なうためには、これしか ないから仕方が無い (n=2) 信頼度が高いからマスターしたい (n=2) 論文の査読者から推奨された (n=1) 就職に有利かもしれないので (n=1) GUIタイプのソフトウェア教室が満杯なので (n=1) ‑ 7 0・

72.

とシシ三=〆 4 唱 7 .大学院生向け E n t e r p r i s eG u i d eによる SAS教室 からの感想、 (20名参加) ・ 難しく感じた (n=14) ・出力が複雑で、何処をどのように解釈すれば良いのかわからな い(n=12) .出力の何処を見ればよいかわからない (n=11) .とにかく修士論文が書ければよい (n=9) ・ どこをどのようにクリックすれば良いのかだけ知りたい (n=8) .データセットや結果の保存方法がわからない (n=8) ・今度はプログラミングを覚えたい (n=6) ‑出力の見方について統計的な背景から理解したい (n=2) E函置盃孟置盈量醤溢蕗 8 .学部生向け SASプログラミング教室からの感想 (80名参加) 医学・生物統計学について SASの離島度について 1 .1 . 3槌 4 . 5 . 0 也 41.51 .3% SASI ま ・ ・ ・ 4 . 5 . 0 也 ‑ 7 1・

73.

E盗 図 面 雇 通 逼 歯 菌 略 法 迄 訟EZ 日Jエヰーシるン.~-::シ乙ン 9 .ソフトウェア教室からの仮説 • E x c e lだけで、は追いつかなくなってきた。統計処理について査読 が厳しくなってきているのが理由 ‑講座にやってきている人々にも、統計処理は他者にという考え 方が蔓延 (81.7%)(これも査読が厳しくなっているのが原因?) .とにかく結論のみ知りたい? ・データを読み込むところ(=かなり初期段階)から理解できず(教 本の少なさ、教育の問題?) E n t e r p r i s eGuideでも「出力の見方がわからない」 「やりたくなしリが75% く 〉 潜在的には「他者に任せてしまえばよいJr E x c e lでできることで、済 ませよう」はもう少し多い可能性がある E t . s ‑ ‑ seT43 富島町詞 ; .1 . ! I 1 0 .統計相談の内訳(複数回答) デザインに関する相 談が少ない! (要求の場合、自身による事前検討の有無は?) さらに自身による事前の検討なし=今特に臨床医に顕著 (73.1%) ‑ 7 2・

74.

E冨置亙孟歯藍醤誕起J る 二ν三シシミレン 1 1 .統計処理の要求内容 (%) 統計処理の要求内容{復数回答) 内 5d 0d5 0505 q'hq'﹄ 唱 ﹄ 句 ﹄ 内 ておいてほしい ﹄のデータをまとめ I])~ )カ し基テ て本ゴ 1 ' "統 リ し計 l い量デ を l 出タ 処理に困った?とにかく有意差? e t c . . . とシシミLエ J 1 2 .何故か統計処理の要求時には・.. rSASで処理して下さい」というリクエストだけは多い傾向 く〉 これなら絶対に文句を言われない ・ 同じゃってもらうならば信頼度が高いソフトウェアが良い く〉 ・どうやら研究者自身では「できない!J ・プログラミングを覚えてまで「やる気はない!Jr 時間が無い!J (これから投稿するジャーナルや学会は)統計処理に文句を言 わないから気にしない→(結構こうしづ意見は多かった!) ‑ 7 3 ‑

75.

とンシ ~:;,I 辱 1 3 .結論として ロ事前のデザインに関する相談が少ない。結果、手持ちのデータで 処理をしようとした結果、処理方法に困っている ロ統計処理を自身で行なおうという意識が低い。昔と比較して、統 計処理に対するジャッジが厳しくなってきているゆえ、自身では処理 できないケースが増えてきていることも原因 ロプログラミングに対する敷居の高さは多少なりとも存在する ASの難しさで、断念のパターンも? ロ生物統計に興味はあっても、 S ロSASを難しいと感じる理由には、プログラミングだけではなく、出 力の見方やデータセットの作成方法なども含まれる ロ誤用を認めてしまう投稿規程の問題もある? E冨EEf 置歯盤撞溢益率 ーンーとシシ三:;.. 参考投稿規程に関する記述(圏内雑誌分) 具体的記述の内容(重檀あり) 用いた統計的 手法を示すζと 亡二叫に附 統一基準を 事照白 ζと ヒ コ 蜘 前 に 附 詳細ガイドラインあり 軍に監惇を京める ζと 一一一一一一一「パラメトリツウ瞳定を 安易に用い立いこと 用いたソフトウエア を示すこと │ │ 普 段 し 古 駄 ど │そ由也錨量的記述 のみ (件) 司 7 4 ‑

76.

,, F l ミ;..~ .~:メシ乙二ン '.) 統一投稿規程「主な推奨項目 j 抜 粋 》特に必修ではないが ilMRAD( I n t r o d u c t i o n(緒言), Method(方法), R e s u l t s (結果), D i s c u s s i o n(考察)構造」が望ましい ~ K eywordはi M e d i c a lSu同e c tHeadings(MeSH)Jリストの用語を用いる ~ i 著者」は実質的な知的貢献者であること(①構想や設計、②データの取得( 収集ではない)・解析、③論文の起草等への貢献の場合のみ) 》編集者・査読者・スポンサー・広告等あらゆる利害関係者の衝突可能性に ついて、事前に開示する 》インフォームド・コンセントの取得、へルシンキ宣言の遵守、実験動物の管理 と利用のガイドライン遵守 》二重投稿の回避、発生時の対応(重複掲載、同一研究の競合、解釈・解析 の相違、結果の相違時の対応等→例:即時却下、言明書の提出、取り下げ 等) 》統計的仮説検定のみに依存することなく、使用した統計的手法及びソフトウ エアを明記する E窪 田 = 豆 島 和文誌における推奨項目の合致度 0.0% 20.0% 40.0% ‑ 7 5 ‑ 60.0% 80.0% 100.0%

77.

置置置孟量陸盈醤 ご清聴ありがとうございました TRIは全国に聞かれた公的機関として、臨床試 験・研究の支援要請を随時受け付けています ‑ 7 6・

78.

SAS‑Wi nBUGSを用いたベイズモデル分析 o畑 山 知 慶 本多隆之 矢田真城 林行和 株式会社 ACRONET 開 発 本 部 デ ー タ サ イ エ ン ス 第 l部統計解析・ DMSグ、ループ AnA p p l i c a t i o nofMCMCm e t h o du s i n gSASa n dWinBUGSf o rB a y e s i a nd a t aa n a l y s i s uY a d aY u k i k a z uH a y a s h i T o m o y o s h iH a t a y a m aT a k a y u k iH o n d a S h i吋o c e sDept .1, C l i n i c a lD e v e l o p m e n t, ACRONETC o r p o r a t i o n D a t aS c i巴n 要旨 ベイズモデルによる統計解析を行う際、 S ASプログラムに WinBUGSの制御を組み込むことで MCMC法によ る事後分布の導出部分のみを W inBUGSに行わせ、全体の処理フローは SASで行う方法を紹介する。 、 W inBUGS キーワード:ベイズ モデル、 MCMC法 1.はじめに 1.1ベイズ統計学と MCMC法 近年、医薬統計分野におけるベイズ分析の実例が増えつつある。ベイズ分析がより身近なものとして受け 入れられつつある理由として、ベイズ分析のための数値計算手法が確立され、実際のデータへの適用が容易 となったことが挙げられる。 ベイズモデルによるデータ解析を実際に行う場合、その事後分布に興味のあるところだが、事後分布導出 のための計算には、多次元の確率密度関数の積分が頻繁に登場し、数値積分が通常の数値解析手法では得ら C(M a r k o vc h a i nM o n t eC a r l o )法 れにくい場合がある。現在では、解析的には困難な事後分布の導出には MCM I J。 が標準的に用いられている [ MCMC法はマルコフ連鎖の性質を利用して、任意の確率分布から乱数を生成するマルコフ連鎖サンプリン 9 5 0年代に核物理学の分野で開発されたモンテカルロ グ法を応用したモンテカルロ法である。 MCMC法は 1 9 8 0年代にベイズ分析に応用可能であることが知られることとなり、以後、ベイズ統計学においてそ 法で、 1 I J。 の適用方法が発展し、ベイズ分析の実問題への適用に大きく貢献している [ 1 .2MCMC法と W i nBUGS SASでは、 V 9 . 2から MCMCプロシジャが評価版として実装され、 MCMC法を用いたベイズ分析が可能 となったが、これまで、 MCMC i 去を用いてベイズ分析を行う場合に一般に広く用いられてきたものは WinBUGSである [ 2 ] 0S ASに並び広く用いられている解析ソフト Rでは、 Rの MCMCパッケージを用いて MCMC法による計算を行うことが可能である。しかし、 Rから WinBUGSを制御し、 MCMC法を実装する方 inBUGSp a c k a g e )が採用されていることも多い [ 2 ]。また、ベイズ分析を用いた臨床試験においても、 法(R2W MCMC法による計算に WinBUGSを用いた例 [ 3 ]もあるなど、 WinBUGSの使用例は多い。 ‑ 7 7 ‑

79.

WinB UGSを用いると、 MCMC法の実装のために、特に専門的な知識や複雑なプログラムを書く必要もな く、ギブスサンプラーによる MCMC法を容易に実装する事ができる。しかし、 WinBUGSには、 SASなどの 様にデータハンドリングを行うための機能が用意されていない。また、 Loopや条件分岐などの仕組み自体も 用意されていない。よって、複数のデータを用いた解析やシミュレーションを行う場合、 WinBUGSのみでは 扱いづらい。また、 WinBUGSのインターフェイスに用意されたタブやボタンを手動で操作して得られた解析 結果には、 SASプログラムの様にパッケージとしての再現性を求めることが難しい。 h a n g ( 2 0 0 8 ) [4 ]で紹介された方法を参考に、 SASによってデータのハンドリングやデータ解析全 本稿では、 Z UGSを制御することで、 MCMC法による事後分布の導出の計算部分 般の処理の制御を行い、 SASから WinB のみを WinBUGSに行わせ、その後の計算結果のハンドリングについては SASを用いて行う方法を紹介する。 これにより複数の解析対象データやデータハンドリングの必要なデータに対しでも、より容易にベイズ分析 を行うことが可能となる。 以後、 2章において MCMC法とそのアルゴ.リズムであるギブスサンプラーについて簡単に紹介し、 3章に おいて、 SASを用いて WinBUGSを操作する方法を紹介する。また、 4章において SASを用いて WinBUGS を繰り返し実行することでベイズ.モデルのモンテカルロシミュレーションを実行する方法を紹介する。 2 .MCMC法とギブスサンプラー 本章では、ベイズ分析と MCMC法の関わりと、 MCMCサンプリングの良く知られたアルゴ、リズムであり、 WinBUGSに実装されているギブスサンプラーについて紹介する。 2 . 1 ベイズ分析と MCMC法 ベイズ分析では、データが得られる前の事前情報から構成したパラメータの事前分布を、得られたデータ によって更新し、事後分布を得ることで統計的推測を行う。 パラメータ θに関する事前確率密度関数をJr( θ )、θが与えられたときのデータ D の尤度関数を Jr( D[ め とすると、 θl こ関する事後確率密度関数Jr( θ[ D )は次の様に表される。 θ) Jr(め 1 r(D[ J r( θ[ D ) = ‑ ; ; ( 2 . 1 ) I Jr( D[ θ) Jr(θ )d θ ベイズ統計学においては事後分布Jrθ ([ D )が多次元であることも多く、その場合、事後分布に基づく推測 のために数値積分を求めることは難しい。そのため、事後分布からのモンテカルロ標本{がけ}土 lを MCMC 法によってサンプリングし、得られたモンテカルロ標本から事後分布に関する要約や推測を行う。マルコフ 連鎖には適当な初期値からはじめて、十分な推移の回数を重ねていくと、マルコフ連鎖からの標本が不変分 布に収束していくという性質がある。この不変分布が事後分布Jr( θ[ D )となるようにマルコフ連鎖を構成す ることで、マルコフ連鎖からの標本 { θ (r)} 土lを、事後分布Jrθ ([ D )からのモンテカルロ標本として扱うこと が出来る [ 5 ]。 2 . 2 ギブスサンプラー ギブスサンプラーはマルコフ連鎖の推移核を構築する一般的な方法としてよく知られており、 MCMCi 去に よるサンプリングを行うために WinB UGSに実装されているアルゴリズムである。 ‑ 7 8・

80.

目標とする事後分布 Z の確率密度関数を J T ( θID)とし、 θが θ=(θl'…, θ' p )のように、いくつかのブ、ロ ックに分割可能であるとする。また、 θ;=θ (l'…,夙ーl'伐 + 1,θ' p )と D が与えられたときの条件付き事後分 T ;の確率密度関数を J T (伐 │ θ ! ?ヲ D )とし、この条件付き分布からのサンプリングが容易であると仮定する。 布J このとき、ギブスサンプラーは以下の様なアルゴリズムとなる [ 5 ]。 (1)初期値 θ問 = ( θ J O ),…, W))を決め、 1=1とおく ( 2 ) i=I , . . . , pについて θ J r )z ( θ ' ;I θ ! ?, D) 1,θ' p ) θ ‑ ;=( θ 1 ' . . . '伐l'伐 + ( 3 ) 1=1+1として( 2 )に戻る σ)、(枕繰り返し、十分大きな数 N について t三N のとき θ(1) =( θ fヘ…, θ ; ) )を事後分布 zのモンテカノレ ロ標本とする。 3 .SAS‑WinBUGSを用いた MCMC法の実装 3 . 1 処理の流れ ここでは、 S ASプログラムを用いて WinBUGSを制御することにより、ベイズモデルの MCMC法による推 定を行う方法を紹介する。 . 1の様な流れで、 SASによってデータのハンドリング及び L o o pや条件分岐などのデータ解析全 以下の図 3 体の処理の制御を行い、 MCMC法による事後分布の計算部分だけを W inBUGSに行わせ、事後分布の計算結 果を S ASに返し、 SASを用いて計算結果をハンドリングする SASプログラムを用意する。本稿では WinBUGS をS ASプログラムの一部の様に扱うことで SASを用いてベイズモデルの推定を行う。 WinBUGS SAS 1統計モデルを記述 1 i ②モデリング ①データハンドリング i 、ーーーーーーーーー園田・・ー̲, 1 事 ③WinBUGS形式の データセット ( t e x t f i l e ) を作成 え } データをW inBUGS.'‑‑‑‑‑‑‑‑‑‑‑‑‑‑、. │④MCMC計算 へ受け渡し i ヌ 33 将Z !パラメータ推定 i行う 句、ーーー・・・・・ーーーーー‑‑' Jl MCMCによる結果を.'ーー・・・・ご圃・ーーーーーーー・問、 ⑥推測、グラフ化 で主主ー一一!⑤計算結果 ( t e x t f i l e l i l ta‑‑‑‑‑d を出力 1 、ーー・・・・・ーーーーーーーーー‑‑' 図3 . 1SASによる WinBUGSの制御フロー ‑ 7 9 ‑

81.

本稿で紹介する SASプログラムを用いて解析を行うためのフローを順に詳しく説明してし、く。例として、 S m i t h ( 2 0 0 6 ) [ 3 ]で用いられた NDLM(No r m a lD y n a m i cL i n e a rM o d e l )による用量反応曲線の推定を考える。 NDLM は状態空間モデルの特殊な場合で、単調性の仮定が必要なく、 S m i t h ( 2 0 0 6 ) [ 3 ]の他にも用量反応曲線の推定に 6 ] [ 7 ]。 用いられた実例がある [ 例3 . 1 単調性の仮定出来ない用量反応曲線の NDLMによる推定 Y j=1 , . . ., 8 )を投与群 jにおける D o s e叫 o n s e (平均値)とする。 j( = 1は P l a c e b o群 ( D o s er e s p o n s eなし)を表すこととする。 D o s er e s p o n s ec u r v eには また、投与群 j 以下の様な状態空間表現を考える。 再=θj +vj 観測方程式: システム方程式 V j j‑I j‑I ( 3 . 1 ) ω' j ~N(O, W σ2) θ=θ.,+δτ+ωr j ~N (O, σ2) } εj ~N(O, Wσ2) 51=δj‑l +ε j ( 3 . 2 ) また、ここでは、パラメータには事前情報を仮定しないこととし、事前分布がそれぞれ自然共役事前分布と なる様に、 θ lおよび δ lには正規分布、 σ2には逆ガンマ分布をそれぞれ用いることとした。また、 S m i t h ( 2 0 0 6 ) [ 3 ] より、 W には一様分布を仮定する。各パラメータに仮定する事前分布については ( 3 . 3 )に示す。 。 " " ' 。 θ N(O, l OO O O )、 δ" " ' N ( O, l OO O O )、 W " " ' U ( 0 . 0 1, 1 0 0 )、 σ2 " " ' I G ( O . l, 0 . 1 ) ( 3 . 3 ) 興味があるのは、投与群 jの D o s er e s p o n s e 叫の事後分布である。また、本例では再について 以下の様なデータが観測されているとし、データに基づいて NDLMのパラメータを推定する。 観拠された D o s er e s p o n s eの値 │投与群 I │毛 I P l a c e b oID o s e lI D o s e 2I D o s e 3I D o s e 4I D o s e 5I D o s e 6I D o s e 7I . o8 I . o2 I o .5 I 1 .0I 5 .0I 4 .0I 5 .5I 4 .5I 手l j 頂①データハンドリング SASプログラムを用いて解析対象データのハンドリングを行う。例えば、臨床試験のデータの場合であれば、 特定の解析対象集団に属する被験者のデータに絞り、臨床検査値の前値と後値の差を求めるなどのハンドリン グを行うことが考えられる。 手順②モデリング 統計モデルを記述する BUGSコードは非常に簡潔であり、尤度と事前分布を記述するだけで MCMC法に よる事後分布の導出を行える。 Wi nBUGSでは、 BUGSコードを t e x tファイルとして読み込むことでモデルに . 1の NDLMを BUGSコードでプログラミングし、 t e x tファイルとして SAS 沿った解析を行う。ここでは例 3 プログラムから読み取り可能な任意の場所へ保存する処理を行う。 NDLMの BUGSコードは S m i t h ( 2 0 0 6 ) [ 3 ] を参考にする。 ‑ 8 0・

82.
[beta]
BUGSコードで記載した統計モデ、ルを t
e
x
tファイノレとして保存
SASプログラム 3
.
1
ホモデルの格納をしておく;
data mode1;
input mode1 $80.;
cardsi
柑#
以下の BUGSコードで記載したモデルを t
e
x
tファイノレとして保存
榊#
mode1{
#尤度を記述する
#dnonnOには平均と分散の逆数を指定する
for(j in l:N){
]
, sigma2inv)
y[j] ‑ dnorm(mu[コ
mu[コ] <‑ theta[j]

l

for(k in 2:N){
theta[k]‑dnorm(mu.theta[k],prec.theta[k])
mu.theta[k]<‑ theta[k‑1] + de1ta[k‑1]
de1ta[k]‑dnorm(de1ta[k‑1],prec.de1ta[k])
prec.theta[k]<ーユ/(目安 sigma * sigma)
prec.de1ta[k]<‑ 1/(阿 合 Sl宇 田 合 sigma)
#事前分布を設定する
theta[1]‑dnorm(01.0E‑4)
de1ta[1]‑dnorm(01.0E‑4)
beta ‑ dnorm(01.0E‑4)
Sl伊 n
a2inv ‑ dgamma(O.
,
ユ 0.1)
si伊 na <ー 1/sqrt(sigma2inv)
刊 ‑ d
unif(O.01100)

"""'"''''''凸品川

鮮彬#桝緋#彬鮮併#岸#

BUGSコード L
こよる統計モデル

run
*モデノレを t
e
x
tファイノレとして保存;
data nu11;
set model;
ホフォノレダ f
WinBUGSJ は予め作成しておく,
file "C:刊 日 BUGS¥NDLMmode1.txt";
本左のパスに BUGSコードによる統計モデルを保存する,
put mode1;

run;

※WinBUGSの出力結果や統計モデル、解析データを保存するフォルダ iC:WinBUGSJ を予め作成しておく。

手 順 ③ WinB
UGS形式のデータセットを作成
WinB
UGSに解析対象となるデータを読み込むためには、 SASプログラムでハンドリングした SASデータ

セットを WinBUGSで読み込むことが可能なデータ形式で text ファイルとして任意の場所に保存する必要が

.
2の様に SASデ
ある。ここでは、本稿で作成した SASマクロ %DTRANS (AppendixA 参照)を用いて、図 3
ータセットを WinBUGSデータセットに変換する処理を行う。 SASプログラム 3
.
2の様 iこ%DTRANSのマク
ロヲ l
数に WinBUGSデータセットに変換する SASデータセット名、変換後のファイノレパス、変換する変数名
を記載すると、図 3
.
2の様にデータの変換が実行される。

SASプログラム 3
.
2

%DTRANSによる WinB
UGSデータへの変換

宅dtrans(data=data, outfユ1e=C:¥WinBUGS¥Data.txt, var=y);

8
1
‑

ー

83.

S A S データセットをWinBUGS データセットヘ 山 E酒 IEWTABLE:WOkDa司 ・ 圃 lm 旬 忽tーメモ帳 l " y QUndRu‑‑Run FDFb nununuRun 崎 フ7イ )~CÐ m 書式(Q) 表示(日 編集 Ii s t(N=8, y =c ( 0 . 8, 0 . 2, 0 . 5, 1, 5, 4, 5 . 5, 4 . 5 )) 仏守 1 2 3 4 5 6 7日 dose S A Sデータセット WinBUGSデータセット 図3 . 2SASデータセットの WinB UGSデータセットへの変換 手順(4)MCMCによるパラメータ推定 MCMC法によるパラメータ推定の処理を SASプログラムから WinB UGSに命令を与えることで、自動で行 nBUGSは通常、インターフェイスに用意されたタブやボタンを操作することで処理を行うが、パッチ う 。 Wi 処理で命令を与えれば、 SASプログラムからも処理手順の命令を与えることが出来る。ここでは、 SASプロ . 3を用いて SASプログラムからパッチ処理で Wi nBUGSに命令を与える。 グラム 3 以下では、 Wi nBUGSに統計モデルの推定を行わせるパッチファイルを作成する。 WinBUGSのコマンドは 8 Jを参考にパッチファイルの作成を行う。 Wi nBUGSマニュアル [ 8 Jに整理されており、 ここで、はマニュアル [ SASプログラム 3 . 3 WinBUGSを制御するパッチファイルの作成 data nu11; file "C:¥program fi1es¥日 inB口GS14¥NDLMBatch.txt"; put // 自 由 # 1 "dユsp1ay(, 1og')" 実行 l o gを保存する #2 "check('C:/日inBUGS¥NDL 陀n ode1 .txtI) 11 コード 3 . 1のモデノレの読み込み&構文チェック #3 "data( 'C :/WinBUGS¥Data.txt')" WinBUGSデータ 3 . 1のデータを読み込む 3 )" 統計モデルをコンパイノレする #4 "compi1e( #5 "gen.inits()" MCMCの初期値を乱数によって生成 #6 "update(lOOO)" Buminの 数 を 設 定 ーMCMCの系列の最初の 1 0 0 0個のデータは捨てるー #7 "thin.updater(20)" MCMCstepのサンプリング間隔を指定 .サンプリング間隔を 20に設定ー #8 "set(mu)" #9 "set(目)" S e tで事後分布を計算するパラメータを指定する ‑ wの事後分布を計算ー ーθの事後分布を推定ー #10"set(de1ta)" ‑ Oの事後分布を計算. # 1 1"set(sigma2inv)" a 'の事後分布を計算ー #12"dic.set()" DIC日ts t a t i s t i c sを出力 #13"update(1000)" MCMC法のサンプリング数を設定 ー1 0 0 0に指定ー #14"dic.stats()" 計算結果を MCMCoutというファイノレ名で出力 * , 'C:/WinB 口GS¥MCMCout')" #15"coda( WinBUGSの出力 o u t p u tを保存 #16"save(' C :/WinBUGS¥log.odc')1I WinBUGSを終了 #17"quit()" run; ‑ 8 2・

84.

念上記のスクリプトをパッチコード化して保存, data null; f i l e" C :¥WinBUGS¥NDLM.bat"; put " C DC :¥program files¥WinBUGS14"; put "WinBUGS14.exe !PAR NDLMBatch.txt"; put " e x i t r u n ; l l ; 上記コードのコマンドをいくつか補足で説明すると、#4では SASプログラム 3.1にて記述した統計モデ、ル をコンパイルし、 MCMCのチェーンの数を指定する。チェーンの数を増やせば処理が遅くなるが、チェーン の数を 2以上に設定すると、マルコフ連鎖が不変分布に収束しているかを Gelman‑Rubin統計量を用いてチェ ックすることが出来る。しかし、マシンスペックに不安がある場合や、同ーの設定でマルコフ連鎖が不変分 布に収束していることを確かめているなどの理由がある場合はチェーンの数を lにすることも検討して良い [ 2 ]。 WinBUGSにより初期条件が与えられ、マルコフ連鎖の生成が開始される。初期条件に依存していると考え られるモンテカルロ標本は推定に用いず、廃棄する。このことを Burni nというが、 #6では、 Bumi nで廃棄 するモンテカルロ標本の個数を決定する。一般に Burni nで廃棄されるサンプル数は大きいほど安全であるが、 具体的にサンプル数をいくつに設定するのが良いという基準はない。本例では 1000と設定している。 #7では、マルコフ連鎖からモンテカルロ標本をサンプリングするサンプリング間隔を決定している。マル コフ性による条件付き独立は仮定できるが、定常確率過程の自己相闘があるため、モンテカルロ標本は自己 相闘が弱まり独立なサンプルと考えられる程度のサンプリング間隔を設ける必要がある。 #13 では、マルコフ連鎖からモンテカルロ標本をサンプリングするサンプル数を決定する。ここでのサン プル数は #7で決定したサンプリング間隔を空けてサンプリングされるモンテカルロ標本のサンプル数である。 #15で、はマルコフ連鎖から採集したモンテカルロサンプルを t e x tファイルとして保存する。本例では、モ e x t ンテカルロ標本のファイル名を iMCMCoutJ としたため、#4で指定したチェーンの数が 3の場合、 3つの t ファイノレ (MCMCout1.txt、 MCMCout2.txt、MCMCout 3. t x t )それぞ、れに、 #13 で指定したサンプル数だけモンテ カルロ標本が保存される。 また #16では、 WinBUGSで出力した GelmanRubin統計量のグラフなどの o u t p u tを保存する。 手順⑤ MCMCによる計算結果を出力 SASプログラム 3 . 3で作成されたパッチファイルを実行することによって、 Wi nBUGSに一連の解析処理を 行わせることが出来る。パッチファイルを実行して得られたモンテカルロ標本は図 3 . 3右の様な形式で、 SAS プログラム 3 . 3の#15で指定したフォルダ パスに出力される。ここでは、 WinBUGSから出力されたモンテカ F ルロ標本を、 SASでハンドリングが行い易い様にパラメータごとに変数を作成し、 SASデータセット化する。 WinBUGSのモンテカルロ標本出力は、値がー列に出力されているのみで、この状態では、どのレコードが どのパラメータのモンテカルロ標本であるかを特定することが出来ない。 WinBUGSは#15で指定したフォル . 3左の様なモンテカルロ標本出力のレコードとパラメータとを紐づける町DEXファイルを出力 ダパスに図 3 するので、問DEX ファイルを用いてパラメータとモンテカルロ標本の関係を紐づける。また、別DEX ファ イルもモンテカルロ標本のファイルと同様に #15 で指定したフォルダノ fスに出力される。本例では、別 DEX ファイノレのファイル名は iMCMCoutindex.txtJ となる。 ‑ 8 3 ‑

85.

モンテカルロ:標本のレコードとパラメータを紐付ける ヨ ・ E : 置璽里璽里盟璽‑宮司・・・・・ ( D 編集(巳書式(Q)表示(辺ヘルブ(!::!) 1 2 0 0 0 3 0 0 0 4 0 0 0 5 0 0 0 6 0 0 0 7 0 0 0 1 m v l l 1 m 1 1 0 1 4 1 1 0 1 2 n h u 守 パラメータ INDEX(WinBUGS出力) 守 1 8 0 0 0 守 1 1 0 1 5 1 0 1 6 1 0 1 7 1 0 1 8 1 0 1 9 1 0 2 0 1 0 2 1 1 0 2 2 1 0 2 3 1 0 2 4 1 0 2 5 1 0 2 6 1 0 2 7 1 0 2 8 守 ・ ・ 日 日 日 日 日 日 日 日 守 m u[ 3 ] 1 1 0 0 1 m u[ 4 ] 1 2日 1 m u r 5 1 1 3 0 0 1 m u [ 6 J 1 4 0 0 1 m u [ 7 J 1 5 0 0 1 m u r 8 1 1 6 0 0 1 SlgmaZlnv 1 0 0 0 1 0 0 1 2 0 0 1 3 0 0 1 4 0 0 1 5 0 0 1 6 0 0 1 7 0 0 1 日 日 日1 1 0 0 0 0 1 1 0 0 0 1 2 0日 1 3 0 0 0 1 4 0 0 0 1 5 0 0 0 1 6 0 0 0 1 7 0 0 0 1 7 0 0 1 守 d e1 l a [ 2 d e1 l a [ 3 dellal4 della[5 della[6 della[7 della[8 m u[ 1 ] 9 0 0 1 qunbquη4 フ?イル W 1 0 0 1 1 0 0 2 1 0 0 3 1 0 0 4 1 0 0 5 1 0 0 6 1 0 0 7 1 0 0 8 h11009 1 1 0 1 0 ηι'lη400qunbnunbquau quaunununbn・ b1 fnboORdT1 fququoGRU ・‑司・t Fhdququnuqu 司 tnbqU71nbFhdau︐ quau 110uQuau︐ ‑‑nuqu nU f'loonu ﹃ B B ・0 ・ ・ ・5 ・9 7 ・ ・ 2‑ 8‑ B0 ・3 ・・ 3﹃ ・D ・B D ・ ・ 32 0 ‑O B ‑ I ‑1 ‑0 ‑B ‑・ B︐﹃ ・・ 1‑ 0‑ 9 nURURuoo‑‑ηι'IRdnu‑‑η 乙nuηιnuauηιoORd‑‑ηιnunuquηιququoo'l フ ? イJ ‑ l ( D 編集(() 書式(Q) 表 京' i ) へル Ejt t i jt t t f f l ! t S f le 璽# .3;: モンテカルロ標本 (WinBUGS出力) 図3 . 3 パラメータ別 DEXとモンテカルロ標本 上記の INDEXファイルの 1行 目 に は r v v 1 l O O O J と記載されている。これはモンテカルロ標 本ファイルの中で、 l行目から 1000行目まで、がパラメータ W のモンテカルロ標本であることを表している。 同様にパラメータ de1ta[l]のモンテカルロ標本は 1001行白から 2000行目までであることを表す。本稿ではこ の パ ラ メ ー タ 別DEX ファイルをもとにモンテカルロ標本ファイルをパラメータごとに変数を作成し、 SAS データセットに変換するマクロ %CODATRANS (AppendixB 参照)を用いる。 %CODATRANSは SASプログラム 3.4の様に、マクロ引数 codapathに Wi nBUGSによるモンテカルロ標本 、 prefixには SASプログラム 3 . 3の#15で指 ファイノレおよび INDEXファイルが保存されているフォルダノ ξス 定したファイル名、 outdataには SASデータ変換後のモンテカルロ標本の SASデータセット名を記載する。 . 3の#4で指定したマルコフ連鎖のチェーンの本数を記載する。本例の また、 outnumsには SASプログラム 3 . 3右のモンテカルロ標本ファイルが 3つ作成されるため、 %CODATRANS 様にチェーンの数が 3の場合、図 3 によって SASデータセット化されるモンテカルロ標本のサンプル数は 3つのファイルの合計となる。また、 事後分布のグラフを出力する場合は outgraphに Y を指定する。 SASプログラム 3. 4 %CODATRANSによる WinB UGSデータへの変換 , prefix=mcmcout, outcoda=coda, outstats=stat, outnums=3, 宅cOdatrans(codapath=C:¥WinBUGS outgraph=N); %CODATRANSを用いて SASデータ変換された結果は図 3.4の様になる。モンテカルロ標本ファイルを SAS データセット化し、パラメータごとに変数を作成した。このデータセットを用いることで SASによるデータ ハンドリングや解析結果の加工を行うことが出来る。 ‑84・

86.

│問時四 │ 1 田1 1 田2 1 田3 1 田4 1 0 0 5 1 06 1 0 0 7 18 1 9 1 0 1 1 0 1 1 1 0 1 2 1 0 1 3 11 4 1 0 1 5 1 0 1 6 1 0 1 7 11 自 1 0 1 9 1 1 0 2 1 1 2 1 0 2 3 1 0 2 4 1 0 2 5 1 0 2 6 1 n?7 日 ∞ 田 日 日 日 口 田 回 w 08129 5 1 5092 8318 1 9 25 6 1 5 9 8 5 9 3 6 6 13 ' 7 9 皿 ' 2 . 7 日 凹 7 . 日 百 8~' 2998 時 四6 4066 2356 8. 3 4 1 5137 1. 4 6 2618 019 喧3 0 1 2 6 384 8 7 9073 3119 日 田 百 d et ! aJ !申~晶~晶 Ita_4 1民 9 . 4 9 7 8 3 8 1 6 08263 4 1 7 1 0 . 4 8 1427 1m6 53 1 8 4 f i 3 8 η ‑ 7 7 4 4 0 5 7 5 4 04 ‑ 0朗自 7 4 3 1 4 6 2562 . 7 4 9 4 2 5 3 9 1 1 6 1 2 8 7 5 6 7 6 1 9 1 0 5 1 23 18 0 8 9 5 6 248 ‑ 2 1 8 6 7 2 6 1422 7 4 4 1 3 1 03 2378 ‑ 2 17 ‑33 1 4 1165 24 118 15JJ 2 2 8 5 12 09 ' 21 1 ' 3 ‑268 ‑ 2 9 4 8 . 1 7 7 2 . 7酷 3 1 0 8 4 4 6 1287 2 . 2 0 3 15 0 8 8 1 3 0 5 6 2046 0 2 0 2 5 0 . 7 5 9 6 1 5 2 8 2017 ‑ 1 12 ' 2 0 3 9 10 0 9 3 4 4 ‑ 1 4 9 1 7 5 2 0 0 5 6 4 2 ‑ 0 5 9 9 7 5 5弼 t4 1 6 2 0 9 6 8 1 0 2 0 9 3 02487 044 05 2 0 5 7 0493 ' 2 29 0 5 7 7 4 1597 102' 1317 1943 1359 313 35 1D96 5 1 9 7 35 1 17 4 1219 194 円4 14 ヲR つ q 7 4 ) 皿 田 血 ‑ 0 ‑ 0 ‑ 0 . 1 回 岨 田 4 ) 日 田 4 ) 田 日 田 4 ) 日 日 泊 田 日 伐 到 日 臼 4 )岨 日 曲 臼 ‑ 0 4 )口 田 日 日 B 4 3 ' l 岨 田 2 ' 日 回 目 日 血 日 田 目 白 1 企 h五 │ 晶lta̲ 7 I 岳J t a ̲ 8 4 )田 044 百 2 1酷 1m5 OB47 08589 1 . 4 9 2 4 ) 百 回 ‑ 1 3 0 6 O D 7 7 4 1 ‑ 4 1 7 4 4 )2767 3~ 2 1 0 ' 2 4. O B 1 6 7 ‑ 1 6 2 2 003~9 ‑ 0.4609 0. 7 2 6 4 ‑ 01552 ‑ 0 . 1274 一 日 フB7 。 血 判1 ‑lD97 日 5 8 4 4 日 ー.173 d e l t a ̲ 5 5 7 0192 四 日 23 届 凹 百3 018 羽 回 4 ) 田 園 笥 臼 国 日笥 田 。 盟 国 日 夜 沼 お 08 & 1 5 1 1 1 0 4 8 4 9 ‑ 1 6 4 9 25担 ' 6 4 6 6 7 2 0 5 6 9 1 7 3 1 0 . 7 2 1 5 8 7 苗 10 95 1 2 1 0 6 4 日 4 ) 4 ) 日 引 4 )国 町 3475 1656 04安調 日 1 5 6 1 ‑ 01995 ‑ 0513 日.2 78~ 1117 2678 ‑ 2身拍 2史認 ‑ 1 9 7 3 2679 5 4 ‑423 ‑ 1品 8 36 5 到1 7 6 1m9 1袋詰6 2 48 1B 3 布 4つ 町R ‑ 004649 12田 4 ) 目 指 1 . 4 田 百 ‑155 1 . 1 2 ‑ 0 9 4 6 6 7 5 9 7 6 3 6 2 3 2 2 0 . 7 3 ‑ 0 日 日 時 日 四 回 1252 1762 0 7 2 1 4 5 7 9 1 R 4 ‑ 2 4 田 竹 田 4 )2氏lS 25 笥 ‑25 珂 ‑ 1 . 4 2 2 1 3 5 1 ‑ 0 9 3 3 5 1842 06 1 9 07 話7 1D12 O D 4 6 1 9 引 沼 田 鶴 ‑ 1田 4 )岨 4 )由 日田 4 )回 百 田 日 血 │ 間J mu1 234 0 9 4 4 1 0 4 7 1 5 8 5 5 4 0 5 9 6 9 1046 3 ' 2 13 1146 1 6 1 1 6 1 05 1 3 1 5 1 9 3 2 . 7 3 5 0 . 4 6 1且3 0996 悶 9 1 2 5 1646 2 2 0 5 1 5 9 3 4 1 2 11JJ 0 2 1 6 9 1394 7 6 6 5 12 舌 。 師12 。 β田 2 07 由 日 57 田 ‑ 0 . 4 4 5 1 0 1 . 3 1 6 ,日7951 05 幻8 4 )0068JJ 皿 日48笥 日 曲47 凹40田 1 D l l ‑ 002'201 町 田7 0 . 4 9 田 凹 お 0 . 2 鍾 翌5 田 フ 日 4 ) 1 . 4 9 2 0 叩 拓η 1 訂 民 田 ‑ 0 . 7 4 回 0 . 4 0 2 3 00 銃犯7 0 2 8 3 1 02 6 割Je 06 7 062 日 日 拓 空 回 日 日 1~ 1042 0 6 0 8 1 0102 5 1 5 5 4 ) 4 ) 田 日 公 到 ‑ 0 ‑ 2. 2 9 1 日 2 ' 2 . 何 何 月 n 何 ヌ 羽 ‑14. 町 田 ワ 明 叩 ワ ヲ7 17 4 4 図 3. 4%CODATRANSによるモンテカルロ標本の SASデ ー タ セ ッ ト 化 日 n百 V笥 O~お2 刃 02" 叙 説6 03 ‑047 甘 0 5 1 4 6 05209 B117 4 1 4 2 0 9 1 0 6 2 4 6 届 034 1却 7 1424 0 1 1 6 1 4 日 日 日 4 )潟 市 ,日 。 曲 目 。 国19 no 4 l l つ 手1 ) 頃⑤推測、グラフ化 %CODATRANS によって作成された SASデータセット CODAの各変数に格納された値はパラメータの事 後分布からのモンテカルロ標本で・ある。すなわち、 SASデータセット CODAの各変数の度数グラフを作成す 数o u t s t a t sにデータセット名を指定す れば事後分布のグラフが得られる。また、 %CODATRANSではマクロヲ l ると、指定した SASデータセットに CODAの各変数の要約統計量を算出することが出来る(図 3 . 5参照)。 p o n s e印 問 の 推 定 で あ る か ら 、 叱 の 信 用 区 間 の グ ラ フ を 作 成 す る こ と 本例の目的は NDLMによる Dose問 s を考える。グラフは %CODATRANSによって算出された SASデータセットの平均およびパーセント点を用い て行える。ここでは、 GPLOTプロシジャを用いて Doser e s p o n s ec u r v eの事後分布からの推定値と 80% 信用区 . 6に図示する。 間を図 3 以上の様な流れで MCMC法によるモンテカルロ標本のサンプリング部分のみを WinBUGSに行わせ、デー タ解析全体の処理は SASプログラムで行う。本伊J では、 MCMC法によって計算された事後分布を図 3 . 6の様 ) 慎⑤の処理内容は変化する。手1 ) 慎⑤の処理については本稿で紹介す に図示したが、行う解析の内容次第で手1 る SASプログラムを利用する方々がそれぞれの目的にあった処理を行われたい。 d e l t a d e J t a d et !a d eJ ta d e l t a d e l t a d e l t a 間 ' 2 l ' W $喧 md M 1 3 0 0 0 2 6日 7 0 8 1 1 4 2 4 9 3 0 2 8 ' 羽67 1田 1 .1泊02 62 ' 15189 白 山 03467789804 3 0 0 0 ‑ 0血 8 日41 1578曲03826 ‑0057η04 24町2745712 5.2651凹 田41 羽 田 03百 £ 回218 1313日9田07 0 1 . 2 0 1泊 1 9 172 臼660155 397位 81即 日 羽 田 0893037103 12864剖 7354 ‑0周 布 団 9 1担 問2田26 22982日 田 岨7 目 耳o 1酷 40'6959 129広36249百 0.10100963 16蔚 7451531 2151475笥 珂 3 0 0 0 05 回 引 臼14 13'27田8担 76 0却 2671回 1 . 7 田499田58 67209786227 。 旬o 0民 話 。 百353 1幻 1岨 ' 2 6 : 口7 4 )1話.7976 17η71'28581 2 ' . 7 6 6 弱9 弱2 7 ま 旧 日 4 ).16210578 1585日413 ‑04300007 2514町361日 4 5胃袋1 9 7 引19 お 日 日 4 )2065明 白 2 ' . 4 6 9 6 4 9日 ' 2 3 4 ) 閃74644 609町6831回 3.181726広 間 田 由 073151田39 0554田8却 08 日 一8417992 '0307剖 61947 6811886日 旧2 初0 0 0 2 5 2 2 3 4 7 9 9 0 . 4 弼1 4 2 4 4 9 9 ‑01773653 0' 2 46 1 5 7 3 3 0 5 7 . 4 1 6 3 5 田79 日 日 05田 2 '1回 目 0.498担 75894 02725913' 0羽 田 町1893 4.7451164958 3 0 3日 0 0 1 2 α犯5 3 4 8 6 0533126 担6 8 12 お12418 0. 2 8 4 2 2 3 6 9 1 930645 ' 2439 旧 主o 467田9引67 05715701419 ‑11田1139 03'2面9'24271 2763774百51 3 0 0 0 4 1 3 3 9 3 1 7 6 7 0 4 7 8 6 9 3 1 6 0 5 004 市 ? 町7 0.229l47142 2買 23977加 2 耳 J O O 53; 895333 0541576明 暗 O史認4債 刃 ' 2 0293304日66 '242曲5由74 耳 J O O 4日 ' 2 9778 057918'24血3 0克渇693'25 0お 臼5笥 2 '977田 唱518734 日 目 447994677 7517苫 抱1195 174 0 6 1 : 沼 町 田 511139174 449'古5821抱 2 3 0 0 1 0. 1 9 7毘 1 8375 1509 7団ヨ 7 2 1 7 8 1 4 . 4 4 9 3 1 4 . 4 5 1 8 71 7 9 ' 2 6 . 6. 7 7 4 1 3 9 1 8918 6009 国 皿 7 . 図3 . 5%CODATRANSによる事後分布の要約統計量の算出 ‑ 8 5・ 一 日 百 ‑60 岨 沼 ‑6697 回 ‑72四 2 ' ‑')5日 039 布 08974 1& 5 05 1 0556 ‑ 0 1 3 5 1 ‑ 0 . 1 7 1 8 07628 0' 2 35 2 5 05124 14 5 1 . 4 . 7 百 4 . 1田 53 明 45565 6195 ‑ 1 6 . 4 7 ‑ 1 4剖 ‑ 4 2 ‑ 503 ‑ 27 9 ‑1019 08475 095 19 苗 2 4 0 . 1 5' ODl:抱33 血 7 . 国 ‑ 1 . 1 6 3 5 4田 副 町 田 4買 7 5 ‑ 1 7 5 ‑ 1 ‑307 04 4 2 ‑ O D 164 0 5 3 5 皿 四 回 1 .田 ‑ 0由 時 2 ' 。 出 田 ' 2 持団 百 万 4 4α14 1347 沼 田 5 2渓あ5 3219 204 2周 2 16 5 2団 7 5 1担 3 081495 1D765 18475 527 4 . 7 2 5 4 5166 183 お 田

87.

7 N D L Me s t i m a t e 8 0 唱 C I [ i m i t s 6 zoa ∞ω ﹂ ω∞OD 目的 I 5 ‑̲̲ . . . 、 、 .. . 、、、、 . . / ' 、 、』、、‑ . . ‑ . " . / " 、 、 、 ‑ 、 、 ....、 、 1 ,..._】~ 1/ ̲̲̲ 4 、 . . ~~... ノ/、~ // , . ‑ ー ‑ ー ー ー " 一 ‑ ー 1/I 1/I 3 1/ I 1/1 I/ 1 2 I / I . . . . / I / I . . . . ‑̲ ̲̲‑ ‑ ‑ ノ J 九 一 一 ̲ ̲ . ‑ ‑... 一 一 。 ι‑‑‑ 一 ー 一ー ← ‑ 『 P l a c e b o ・ D o s e l " D o s e 2 D o s e 3 D o s e 4 D o s e 5 D o s e 6 D o s e 7 A r m 図 3.6NDLMを用いた Doseresponsecurveの推定 4 .SAS‑WinB UGSを用いたモンテカルロシミュレーションの実行 3章の SASプログラムを反復して実行することでモンテカルロシミュレーションが実行可能となる。 では、 SAS プログラムを Loop によって反復実行し、モンテカルロシミュレーションを行うプログラムの例 を紹介する。 4 . 1SASマクロによるモンテカノレロシミュレーションの例 (AppendixD) モンテカルロシミュレーションを行う場合には、図 3 . 1の手順①③④⑤を Loopによって繰り返し、最後に シミュレーション結果をまとめる処理を行えばよい。 例えば 3章の例と同様のモデ、ルで、 Doseresponsecurveの推定シミュレーションを行し、たいとする。簡略化 2 . 1の Doser e s p o n s巴 c u r v eの周りに分布する分散 1 の正 のために、シミュレーションで発生させるデータは図 4 規分布とする。このデータを用いて 100回推定を繰り返すシミュレーションを行う場合、 SASプログラムは AppendixDの様になる。 AppendixDでは、 Loopを行う度にシードを変更し、乱数による解析データの作成を 行っている。また、 %CODATRANSによってモンテカルロ標本を要約統計量の形で SASデータセット化し、 1 0 0回計算された要約統計量 100オブザベーションをシミュレーションによる標本として保存しておく。最後 に要約統計量をシミュレーション実行回数で平均し、シミュレーションによる推定結果を得る。得られた結果 を GPLOTプロシジャで図示したものが図 4 . 2である。この様に、 SASプログラムを用いて WinB UGSを制御 去による計算が必要なモデ、ルについてもモンテカルロシミュレーションを行うことが可 することで、 MCMC i 能になる。 ‑ 8 6・

88.

8 D o s er e s p o n s e ‑ 一 一 一 一 y 邑 n un ︐ι oa 白 山 ﹂ 白 白 OC 白白戸﹄ PRUFhJvan 。 P l a c e b o D o s e l D o s e 2 D o s e 3 D o s e 4 D o s e 5 D o s e 6 D o s e 7 A r m 2 図 4.1モンテカルロシミュレーション用生成データ (実線の周りに分散 1 の正規分布を発生) 6 oa 白 白 ﹂ 白 白 OC 白白戸﹄ 5 4 3 2 ̲‑、・』 ー戸、 戸/〆、:: 。.... P l a c e b o D o s e l D o s e 2 D o s e 3 D o s e 4 D o s e 5 D o s e 6 D o s e 7 A r m 図4 . 2モンテカルロシミュレーションによる Doser e s p o n s ec u r v 巴の推定結果 5 . おわりに 本稿では、 WinBUGSを SASプログラムの一部の様に扱い、 MCMC法を用いたベイズ分析を行う SASプロ グラムの紹介を行った。本稿で紹介した SASプログラムを用いることで、 MCMC法によるベイズ分析にお いても、通常の SASでの解析と同様に、解析データのハンドリングから解析結果の加工までを SASを用いて 行うことが可能となる。また、本稿で紹介した SASプログラムを反復実行することでベイズ モテ、ルに対する モンテカルロシミュレーションも実行可能となることを示した。さらに、本稿で紹介したプログラムをマク ロ化して用いることで、層別解析の様に同 のモデ、ルを複数の解析データに対して適用する必要がある場合 にも対応が可能である。 紹介したプログラムはモンテカルロ標本を SASデータセット化し、要約統計量を算出するところまで対応 している。 その後の解析結果の加工については、統計解析の目的に合わせて自由に変更が可能である。 ‑ 8 7・

89.

参考文献 1 . 中妻照雄.入門ベイズ統計学.朝倉書庖;2 007 2 . 統計数理研究所 2008年公開講座配布資料.マルコフ連鎖モンテカルロ法の基礎と実践. 3 .M i c h a e lK .S m i t h ,I e u a nJ o n e s,MarkF .M o r r i s,AndrewP .G r i e v ea n dK e i t hTan,I m p l e m e n t a t i o no faB a y e s i a n , Pharmaceu. tS t a t i s. t2 0 0 6 ;5 :39‑50 a d a p t i v ed e s i g ni nap r o o fo fc o n c e p ts t u d y 4 . Z h i y o n gZhang, J o h nJ .McAr d l e, L i j u a nWang.F u m i a k iHamagam . i ASASI n t e r f a c ef o rB a y e s i a nA n a l y s i sW i t hWinBUGS. S t r u c t u r a lE q u a t i o nM o d e l i n g :A M u l t i d i s c i p l i n a r yJouma . l2 0 0 8 ; 1 5 : 4, 7 0 5‑728 5 .伊庭幸人,種村正美,大森裕浩, f 口合肇,佐藤整尚,高橋明彦. 計算統計 H マルコフ連鎖モンテカルロ法とその周辺.岩波書庖;2005 6 . BeπYDA,M u l l e r P,G r i e v eAP,S m i t hM K, P a r k eT, B l a z e kR, M i t c h a r dN, KramsM. a r l i nB,C a r r i q u i r yA, A d a p t i v eB a y e s i a nd e s i g n sf o rd o s e ‑ r a n g i n gt r i a l s .I nC a s es t u d i e si nB a y e s i a ns t a t i s t i c sV,C G a t s o n i sC,GelmanA,K a s sRE,V e r d i n e l l i1 ,WestM ( e d s ) .Sp巾 g e r :B e r l i n,2 0 0 2 ;p p .9 9 ‑ 1 8 1 . 7 . OrgogozoandGaryA .F o r dM i c h a e lKr ams, KennedyR .L e e s,WemerHacke, AndrewP .G r i e v e,J e a n ‑ M a r c, A c u t eS t r o k eT h e r a p ybyI n h i b i t i o no f N e u t r o p h i l s(AST別) AnA d a p t i v eD o s e ‑ R e s p o n s eS t u d yofUK‑279, 276i nA c u t eI s c h e m i cS t r o k e, S t r o k e2 0 0 3 ; 3 4 ; 2 5 4 3 ‑ 2 5 4 8 ; 8 . S p i e g e l h a l t e rD, ThomasA, B e s tN .WinBUGSv e r s i o n1 .4 . 1U s e rManua . lM e d i c a lR e s e a r c h t t p・ / / w w w . m r c ‑ b s u . c a m . a c . uk/bu g s lWi nBUGS/2004 C o u n c i lB i o s t a t i s t i c sU n i t,Cambridge,h 9 築谷千恩彦,大津泰介,清水玄彦,中妻照雄,高木康1 ) 慎,隅田和人 0 0 6 計量経済学のフロンティア.慶応義塾大学出版会;2 ‑ 8 8・

90.

AppendixA %DTRANS SASデータセットを WinBUGSデータへ変換するマクロ /*一一一一一一一一一一一一一一一一 ーーーーーーーーーーーーー ーーーーーーー SAS Version : Ver.9.1.3 :解析データ data var :分析変数(複数の変数を指定可能)例) var~x y z ; outfi1e : WinBUGS取り込み用 txtファイノレ名(パス含む) format :解析データの出力用フォー 7 ット rounddigit :四捨五入の桁 ls :指定したラインサイズ以内でカン 7 ごとに値を区切る (50以上を指定する) 一一 もmacro dtrans(data~ , も1et i~O; も do ー ーーーーーーーーーーーーーー一一一一一一一一一 var~ , outfi1e~ , format~best32 , ーーーーーーーー一一一一一一一台/ rounddigit~15 , ls~50); 合初期化; も unti1(&&var&i~); 主1et i~ も eva1(&i+1); 主let var&i斗 scan(&var1 , %str( ))i *var&i:varの各変数名; もendi 毛let varn=%eval(&i‑l); *var:変数の個数; 寸平析データのオブザベーション数を取得; も1et dsid ~も sysfunc(open(&data)); も1et nobs ~も sysfunc(attrn(&dsid , nobs)); も1et rc ~も sysfunc(c1ose(&dsid)); *解析データの出力用フォー 7 ット J proc format; value varf , . . a ‑ .2, • = "NA" ~ [晶 f ormat.. J other runi 合解析データを 7 クロ変数に格納; data nu11; set &datai array ̲var(*) &Vari do i~l to dim( var); ー &rounddigit)); if .z < ̲var(ユー) then var(i)~round(_var(i) , ユ0**( ca11 symputx("va1" [ [ trim(put( i,best.‑1)) [ [ " 一 "[ [ put( n ,best.‑1),put( var(i),varf.)); endi runi 叫す i nBUGS取り込み用 txtファイノレ保存; data nu11; file "&outfile" 1s=&1s; put "list(N=&nobs, " ; も do 工 ~1 毛 to 晶 varni put "晶 &var&i = c("; もif ユ く 晶 nobs 毛then もdo; もdo j~l もto 晶nobsー ユ ; put "&晶 va1&i. 品j, " @; もend; もend; put "&&val&i. 品nobs" ")" もif &エ= &varn もthen もd o; ")"も end; もe1se 毛do; 11 ,"も end; もend; run; もmend dtranSi ‑ 8 9・

91.

AppendixB %CODATRANS WinBUGS出力のモンテカルロ標本を SASデータセット化するマクロ I/合一一ーーーーー ーーーーーーーー ーーーーーーー 『 一一ーーーーーーーーー 一一一一一一ー一一一ー SAS Vers工on : Ver.9.1.3 codapath prefix outcoda outstats outnums outgraph : indexファイノレ、 outputファイノレ読み込みパス : BUGSコードで設定したファイル名 (論文 SASプログラム 3.3 れ 5で指定したファイノレ名) : WinBUGSで生成されたモンテカノレロ標本を格納する SASデータセット名 :パラメータの要約統計量を算出する SASデータセット名(指定した場合に算出) : outputファイノレの数を指定 :ヒストグラムを生成 (outgraph~Y の場合に出力) 一一一一一一一一ーーーーーー 一一一一一一一一一一一一ーーーーーー一一一一一一台/ ーー一一一一一一一ーーーーーーー 一一一一一一一一ーーーーー もmacro codatrans(codapath= ,prefix=,outcoda=,outstats=,outnumsニ 1,outgraph~N); *outputファイノレのファイノレ参照名設定; fi1ename in (も do i~l も to &outnums ; l ' "&codapathY&prefix.&i..txt もend; 合outputファイノレの SASデータセット化 J data sasouti infile io dlm='09'x end=eofi do unti1(eof); input number valuei outputi endi runi 合indexファイノレの SASデータセット化 J data parameteri 1ength parameter 宇100; infi1e "&codapath¥&prefix.index.txt" dlrn='09'x end eofi do unti1(eof); input parameter 宇 firstnurn lastnumi " , " [1")); prm=lowcase(translate(parameter, 11一 p r r n grp=lowcase(scan(pararneter,1," [ " ) ) ; if index(parameter," [ " ) > 0 then prm̲seq=input(scan(pararneter,2,"[1"),best.); else prrn̲seq=li output; end; runi ニ 日 ndexファイノレの値を 7 クロ変数に格納 J proc sql noprint; select count(prm) into :vnmcnt f r o r n parameteri se1ect parameter into :lb1 1‑:1b1 もtrim(&vnrncnt) from parameteri *グラフラベノレ用; select prm into :vnm̲l‑:vnm̲%trirn(&vnmcnt) f r o r n par回 eteri 合変数名を 7 クロ変数に格納 F se1ect count(firstnum) into :fstcnt from parameter; se1ect firstnum into :fst ト :fst もtrim(&fstcnt) from parameter; 合開始列番号を 7 クロ変数に格納 J se1ect count(lastnum) into :lstcnt from parameter; se1ect 1astnum into :lst 1‑:1st もtrim(&lstcnt) from parameter; qu~t; 合outputファイノレの値を加工 (outputの数を Loop) ; も1et lstnm~ も 1eft(&vnmcnt); もdo j~l も to &outnums; data &outcoda.ιj; merge もdo i~l も toιvnrncnt; 一 sasout(firstobs~ も eva1 ( &&lst ιlstnm • obs~ も eva1 (&&lstιlstnm • (&j‑1) +ιιfst̲&i) (&j‑1) + &&lstー&エ) renarne==(value==ι&vnrn 晶 i )) もendi runi %end; ‑ 9 0 ‑ 合終了列番号を 7 クロ変数に格納 J

92.

寸日工したデータを 1データセットに結合 J data &outcodai set もdo j~l も to &outnumsi &outcoda. &j もe ndi runi 合要約統計量の算出; もif &outstats ^~も then も do; もdo i~l も to &vnmcnti proc univariate noprint data=品outcodai var &晶 vnm &ii %if もupcase(&outgraph) ~ y 宅then もdo; 一品工 / k ernel; histogram &品 vnm もend; n=mェ n max=max output out~_stats 一品工 n=n mean=mean var=var std=std mェ range~range pctlpts~lO median~med ェ an pctlpts~90 kurtosis=kurtosis skewness=skewness pctlpre=pi label ι&vnm 品工="&品 lbl &i"i runi 合要約統計量におけるラベル名を 7 クロ変数に格納 J もif &i~l 毛 then も do; proc contents data= stats &i out= con noprinti runi data coni set coni label~left(kscan(label , 2," 。 コ " )); runi proc sql noprint; select count(name) into :statsvnmcnt from coni select name into :statsvnm l‑:statsvnm もtrim(&statsvnmcnt) from con; select label into :statslbl 1ー :statslbl もtrim(ιstatsvnmcnt) from coni qu斗 t; %end; %end; 合要約統計量を lデータセットに結合; data 品outstatsi set もdo i~l も to 品 vnmcnti stats 晶L もe ndi 台要約統計量ラベノレの付与; %do i~l も toιstatsvnmcnti label &品 statsvnmι i="&品statslblιi"i もe ndi runi *要約統計量にパラメータ情報を結合 J data ιoutstats; set parameter(keep~parameter prm grp prm seq); set 晶outstats; runi もend; 合workデータの削除 J proc datasets nolisti delete &outcoda: stats: sasout con parameter; run i qUlti 宅mend codatransi ‑ 9 1・

93.
[beta]
AppendixC NDLMの推定
*解析データ;
data data;
do dose~l to 8;
se1ect(dose);
when(l) y~0.8;
when(2) y~0.2;
when(
3
) y~O. 5;
when(4) y~l;
when(5) y~5;
when(
6
) y~4;
when(7) y~5. 5;
when(8) y~4.5;
otherwisei
end;
outputi
end;
runi
合モデノレの格納をしておく J
data mode1;
input mode1 $80.;
cardsi
mode1{
for(
j in ユ:
N
)(
y[j] ‑ dnorm{mu[j],sエgma2inv)
mu[
j
] くー theta[j]
for{k in 2:N)(
theta[k]‑dnorm(mu.theta[k],prec.theta[k])
mu.theta[k]く ‑ theta[k‑1] + de1ta[k‑1]
de1ta[k]‑dnorm(de1ta[k‑1],prec.de1ta[k])
prec.theta[k]<‑ 1/(日 . s工gma * sigma)
prec.delta[k]く ‑ 1/(日 * si宇 na * sigma)
1.0E‑4)
theta[1]‑dnorm(0,
ユ ]‑dnorm(O,1.0E‑4)
delta[
1.0E‑4)
beta ‑ dnorm(0,
nv ‑ dgamma(O.l,0.1)
sigma2ェ
sigma <‑ 1/sqrt(sigma2inv)
刊 ‑ dun
エf(0.01100)

runi
合モデルの保存 J
data nu11;
set modeli
r
nodel.txt"i
fi1e "C:¥WinBUGS¥NDLM
put mode1;
runi
data nu11;
fi1e "C:¥program fi1es¥刊 inBUGS14¥NDLMBatch.txt";
put // 日
目
持1 "disp1ay(,
1og')"2 "check(
'C:/WinBUGS¥NDLMmode1.txt')"3 "data(
'C:/
刊 inBUGS
官D
ata.txt')"
#4 "compi1e(3)"5 "
gen.inits()"6 "update(1000)"7 "thin.updater(20)"8 "set(
mu)"9 "set(
W)"10 "set(de1ta)"11 "set(sigma2inv)"1
2 "dic.set{)"13 "update(1000)"
非
ユ 4 "dic.stats(
)"
'C:/WinBUGS¥MCMCout')"
#15 "coda(*,
ユ
# 6 "save('C:/WinBUGS¥log.odc')"
体
ユ 7 "qu
エt()"
runi

‑
9
2
94.
[beta]
合ノ〈ッチファイノレ保存 J
data nu11;
f工 1e "C:¥
刊 inBUGS¥NDLM.bat";
put "CD C:¥program filesYWinBUGS14";
put "刊 inBUGS14.exe IPAR NDLMBatch.txt";
put "ex工t"i
runi
宅dtrans(data=data,outf
工1
e=C:YW工nBUGS¥Data.txt,var=y);

data null i
x "C:¥
刊 inBUGS¥NDLM.bat";
run;
data log;
t truncQver;
infile "c:¥winbugs¥log.txt'
工n
put 10g $80.;
"" "09"x);
log=translate(log,
run;
proc pr工nt data=log;run;
主codatrans(codapath=C:耳目工 nBUGS,prefix=mcmcout,outcoda=coda,outstats=stat,outnums=3,outgraph=N)i

A
p
p
e
n
d
i
xD
l

NDLMのモンテカノレロシミュレーション

合モデノレの格納をしておく;
data mode1;
工n
put mode1 $80.;
cardSi

mode1{
for(j in l:N){
y[j] ‑ dnorm(mu[j],sigma2工nv)
mu[コ] <‑ theta[コ]
for(k in 2:N)(
theta[k]‑dnorm(mu.theta[k],prec.theta[k])
mu.theta[k]く theta[k‑1] + de1ta[k‑1]
delta[k]‑dnorm(de1ta[k‑1],prec.de1ta[k])
1(
刊*s
igma
sigma)
prec.theta[k]く ‑ 1
prec.delta[k]く ‑ 1
1(
刊*s
igma
sigma)
合
合

1.0E‑4)
theta[l]‑dnorm(0,
delta[l]‑dnorm(O,1.0E‑4)
beta ‑ dnorm(0,
1.OE‑4)
S工 伊 国 2工nv ‑ d
gamma(O.l,0.1)
sigma <‑ 1/sqrt(sigma2工nv)
目 ‑ dun
工f
(0.01,
100)

run;
合モデノレの保存 J
data nu11;
set model;
f工1e "C:耳目工 nBUGSYNDLMmode1.txt";
put model;
runi

data null;
f工 1e "C:Yprogram fi1esYWinBUGS14¥NDLMBatch1.txt";
put 1
1日
目
非1 "display(
'10g')11
非2 "check('
C:/w工nBUGSYNDLMmode1.txt')"
#3 "data(
'C:IWinBUGS¥Data.txt')"
#4 "compi1e(3)"
非5 "
gen.工n工ts()"
非6 "update(1000)"
#7 "thin.updater(20)"
非8 "set(mu)"
非9 "set{
W
}11
非10 "set(de1ta)"
非11 "set(sigma2inv)"
#12 "dic.set()"
非13 "update(1000)"

‑
9
3
‑

95.

ユ # 4 "dェc.stats()" 非15 "coda(*, 'C:/目 inBUGS¥MCMCout')" #16 "save('C:/ 目 inBUGS¥log.odc')" 非17 "quit()" runi *ノ〈ッチファイノレ保存 F data nu11 i file "C:盲目 inBUGS¥NDLM.bat"; 目 inBUGS14"; put "CD C:¥program files¥ put "日 inBUGS14.exe /PAR NDLMBatch.txt"; put "exit"i runi もr nacro simulation(mc=)i *シミュレーションデータ生成; もdo z~l も to &mCi data data(keep~y); seed=&Zi n=8i do i~l to n; select(ユー); when(l) y~O + rannor(seed); when(2) y~l + rannor(seed); when(3) y~2 + rannor(seed); when(4) y~3 + rannor(seed); when(5) y~4 + rannor(seed); when(6) y~3 + rannor(seed); when(7) y~2 + rannor(seed); when(8) y~l + rannor(seed); otherwisei endi output; endi runi も dtrans(data~data , outfile~C: 耳目 inBUGS ¥ Data.txt , var~y); data null; x "C:耳目 inBUGS¥NDLM.bat"i runi data log; infile "c:¥WinBUGSYlog.txt" truncoveri input log $80.; ", ""09"X)i log=translate(log, runi proc print data~log;run; も codatrans(codapath~C: 耳目 inBUGS , prefix=mcmcout, outcoda=coda, outstats=stat, outgraph~N) ; もif &z~ ユも then 宅 do; data allstat; delete; run; もendi data allstat; set allstat stat; runi もe ndi proc contents data~allstat(drop~parameter prm̲grp prm̲seq) out~ con noprint; runi proc sort data= coni by varnumi runi proc sql noprinti select name into: varlist separated by , from coni quiti proc rneans data=allstat nway noprinti st; var &varlェ class parameter; output out mcmean mean=&varlist; *データセット mcmeanにシミュレーション結果を出力 F run; もmend 5工mulation; 1 ニ *Simulation実行; も simulation(mc~lOO); ‑ 9 4 ・ outnums=3,

96.

S A Sでベイズ推定を行う方法 ‑ p r o cM C M Cv sR & W in B U G S ‑ 武田薬品工業株式会社 0舟 尾 暢 男 医薬開発本部 日 本 開 発 セ ン タ 一 統 計 解 析 部 S o m ee x a m p l e so fB a y e s i a ni n f e r e n c eu s i n gS A Ss y s t e m ‑p r o cM C M Cv sR & W i n B U G S‑ F u n a oN o b u o T a k e d aP h a r m a c e u t i c a lC o m p a n y .L t d . SAS上 で 統 計 ソ フ ト f R J と fWinBUGSJ を 動 か し て ベ イ ズ 推 定 を 行 う 方 法 と , SAS9 . 2よ り 導 入 さ れ た MCMCプロシジャ ( E x p e r i m e n t al)でベイズ推定を行う方法 との比較を行う. キーワード:ベイズ推定. R . WinBUGS. MCMCプロシジャ. GENMODプ ロ シ ジ ャ 1.はじめに これまで,ベイズ推定を行う場合は. S A S上で、プログラムを組むよりも f W inBUGSJ という MCMC法に i b b ss a m p l e r( G i b b ss a m p l i n gという方法を用いて事後分布からのサンプリングを行うためのソフトウ よる G ェア)を用いる方が楽でSあった f W inBUGSJ を用いれば,簡単なパラメータ推定から,階層ベイズモデ ル等のある程度複雑なパラメータ推定まで,様々なベイズ推定を行うことが出来る.最近は,グラフを簡単 に作成することが出来る統計ソフトウェア f R Jと f W inBUGSJ を 組 み 合 わ せ て ベ イ ズ 推 定 を 行 う 方 法 f W inBU G S Jや f R J は SASに比べてデータハンドリ (R2W inBU G S ) が一般的になりつつある.しかし ングが苦手であるという欠点がある.本稿では,まず,いくつかの準備を整えてから,次に,解析用のデー ASのデータセットを用意し. S A S上で タとして S f W i n B U G S Jと f R J を動かしてベイズ推定を行う方法 ( E x p e r i m e n t a Ip r o c e d u r e ) を用いることで, AS9 . 2より導入された MCMCプロシジャ を紹介する.最後に. S SAS上で簡単にベイズ推定を行うことが出来るようになったので,本稿では MCMCプロシジャを用いたベ f W i nBU G S J で解析した場合との比較を行う. イズ推定の例を挙げ 2 . 本稿の解説の流れとベイズ推定を行う 2つの例 まず,本稿で解説を行う流れと,以下の方法① ⑤で用いるツールの一覧を以下に示す. ① 本項で紹介する例を W inBUGSで解析する場合の手順を紹介する ② 本項で紹介する例を S ASと WinBUGSで解析する場合の手順を紹介する ③ 本工頁で紹介する例を Rと W inBUGS (R2WinBU G S ) で解析する場合の手順を紹介する ④ 本項で紹介する例を S ASとR2WinBUGSを組み合わせた方法で解析する場合の手順を紹介する ⑤ 本項で紹介する例を S ASの MCMCプロシジャで解析する場合の手1 ) 慎を紹介する 表2 . 1:方法① ⑤で出てくるモデル式,データ,初期値,実行方法の形式 方法 モデル 用意するデータの形式 初期値を指定する方法 実行するソフト ① W i n B U G S上で記述 W i n B U G S上で指定 ② ③ ④ ⑤ テキストファイル W i n B U G S専用の形式 S A Sデータセット C S Vファイ J レ S A Sデータセット S A Sデータセット W i n B U G S S A S (+Wi n B U G S ) R( + W i n B U G S ) S A S( + R + W i n B U G S ) M C M Cプロシジャ テキストファイル テキストファイル S A Sプログラム テキストファイルの読込 R上で指定 S A S上で指定 S A S上で指定 9 5 ‑ ー

97.

次に,ベイズ推定を行う手1 ) 慎のイメージを示す. 推定結果 モデル t h e t as a m p l e :2 0 0 0 タ 一 ア 実行 I ノr',~,'--._ 、 f n o d e t h e t a 初期値 mean 0 . 5 4 6 2 図 2.1 :ベイズ推定を行う手順 ベイズ推定の手順を紹介するため, 2つの仮想例を挙げる. ( 例 1 ) はベルヌーイ試行における成功確率に ついてベイズ推定を行う例, ( 例 2 ) は単回帰分析モデルにおける回帰係数についてベイズ推定を行う例で p i e g e l h a l t 巴r ( 2 0 0 4 ) を参照のこと. ある.なお,ベイズ推定の基本的な事項は渡部 (1999) や S ) ( 例1 r 表」が 1枚のコインを投げて「表」か「裏」かを記録する試行を (n=) 20 回繰り返した結果 1 1 回出たとする.まず, r 表」が出る確率を e(パラメータ), r 表」が出る回数を X (データ)と 仮定した場合,試行を 20回繰り返して「表」が出る確率の尤度は二項分布に従う.さて, eの事前分 b ) とするのだが,一様分布に近い仮定を置くために B e t a ( I, I )とする.。の事後 布をベータ分布:Beta(a, 分布を求めるために,以下のベイズの定理を用いて計算する. p(x[B)/p(x) x p(B) p (B[x) o c p(x[B) X p(B) ( 例2 ) x=(1,2,3,4,5 ), y =(1,2,3, 4,5 . 1 )について,以下の回帰モデルを考える. Yj=βI+s2XXj+Cj cj‑N(0.I/r1) ( i = l .…. 5 ) 上記モデルから,以下の関係式を得る. Yj‑ N(μj. 1/τ1 ) μ = sl+ β2XXj また,パラメータ 5 ) ( i = l .…. 1 'と s j0=1,2 ),及び超パラメータ 2 'について,以下の事前分布を仮定する. βj ‑ N( O.τ2) ( j=1.2) τj ‑ Gamma(0.001. 0.001 ) ( j= I .2 ) σj= 1/(τj)1 / 2 ( j= I .2 ) 各パラメータの事後分布を求めるために,以下のベイズの定理を用いて計算する. p (s1 . s2 . τ1.τ 2[X. y) o c P(y[sl' ß 2 • τ1.τ2. x)X p (τ1) X P (s1 [τ2)X p (s2[τ2)X p (τ2) ‑ 9 6・

98.
[beta]
3
.W
i
n
B
U
G
Sでベイズ推定を行う手順
①(例 1
)の例を解析する手順
パラメータ 8 (
t
h
e
t
a
) の 事 前 分 布 を ベ ー タ 分 布 :B
e
t
a(
1
,I
) とする.また, 8に 関 す る 尤 度 は 二 項 分 布 :

B
i
n
o
m
i
a
l
(
8,n)に従う. Wi
n
BUGSでは,これらの条件(モテ手ル)を定義するために以下のように記述する I
theta ‑d
b
e
t
a(
1,1
)
x

‑dbin(theta, n
)

ここで f~J は「特定の確率分布に従う」ことを表し,

f
d
x
x
x
x
Jの f
d
J は「確率分布 (
d
i
s
t
r
i
b
u
t
i
o
n
) Jで

あることを表す( f
x
x
x
x
J に確率分布の名前を指定する) . WinBUGSで用意されている確率分布の一覧は,
]関数・コマンド一覧」や fWi
nBUGSU
s
e
rManual (PDF) J を参照されたいが,
本稿の最後の f[参考 1
この表記を用いて Oの事後分布を求めるために,ベイズの定理:
p(B[x) oc p(x[B) xp(B)

を用いて計算する場合は,以下の様な Wi
nBUGSのモデル式を定義する.

ι
t
l

プロクラム 3
.1:(
例 1
)に関する WinBUGSの モ デ ル 式 , デ ー タ , 初 期 値
プログラム
!
コメント
0
1
: :#m
o
d
e
l
U
昨
い
川μ
北
…
川一!
ω
…
は白
コ
U
叩ま
」
メ
担
モデル式の先頭
立
l
は r
m
円
叩
巾
1
o
口
凶
d
eI{Jとする
0
2
: im
o
d
eI{
t
h
e
t
a (e) がベータ分布 B
e
t
a(
1,1)に従っているとする
0
3
: ! t
h
e
t
a‑d
b
e
t
a(
1, 1
)
0
4・! x
‑d
bi
n(
t
h
e
t
a, n
)
n
o
mi
aI(
t
h
e
t
a
.n
)に従っているとする
データ xは二項分布 Bi
0
5・ i
}
モデル式の末尾は r}J とする
0
唱:非 d
a
t
a
‑
P
L
U
Sや Rで用いられている I
i
s
t文の形式
'非データに関する指定:S
i
s
t(
x
=
1
1
.n
=
2
0
)
X二 1
1
.n
=
2
0を入力する
0
7
: iI
唱 j非 i
n
i
t
O
非初期値に関する指定:S
‑
P
山 や Rで用いられている I
i
はの形式
s
t(
t
h
e
t
a
=
O
.2
)
もし初期値を指定する場合は指定する
0
9
: !Ii
行

i

nBUGSでベイズ推定を行えばよい. WinBUGS上の GUIで計算を行う手順は
モデル式を用意した後は, Wi
f[参考 3
] WinBUGSでベイズ推定を行う手j!頂」を参照されたい.計算結果は以下のようになり,図 3
.
1で
は「パラメータ 0の事後分布の平均:0
.
5
4
6
2,標準偏差:0
.
1
0
4
6,…」等の事後分布に関する要約統計量が

.
2ではパラメータ 0の事後分布に関する密度関数の推定結果が表示されている.
表示され,図 3
s

l持li liTi l軍司回開園圃圃圃圃圃圃圃圃圃圃圃圃園田喧櫨;It~~

n
o
d
e
t
h
e
t
a

m
e
.
l
I
l
0
.
5
4
6
2

s
d
0
.
1
0
4
6

M Ce
r
r
o
r2.5'~

指
舗

m
e
d
i
.
l
s 9
7
.
5
%
日5
4
7
5 0
.
7
4
1
8

0
2
日5
4 0
.
3
4
2
5
0,0

s
t
.
1
<
t

1

s
.
l
m
p
l
e
2
0
0
0

図3
.
1:パラメータ 9の 事 後 分 布 に 関 す る 統 計 量

t
h
e
t
as
a
m
p
l
e
:2000
6
.
0

¥

/

4
.
0
2
.
0
0
.
0

OD 02

OA Os Os

図3
.
2
:パラメータ 9の 事 後 分 布 の 密 度 関 数
IW
inBUGSのセットアップ方法は r[参考 2
1W
i
n
B
U
G
SとR2W
i
n
B
u
g
sのセットアップ」を参照のこと また. WinBUGSでは G
i
b
b
s
i
b
b
ss
a
m
p
l
i
n
gについては丹後 (
2
0
0
0
) を参照のこと.
s
a
m
p
l
i
n
gという方法を用いて事後分布からのサンプリングを行っているが, G

‑
9
7・

99.

WinBUGS上の GUIで、計算を行っても良いが, WinBUGSを実行するためのスクリプトを記述して計算する ことも出来る.まず,プログラム 3.1 の 1~5 行目(モデル式)を I modeI3- l.txtJ に,プログラム 3.1 の 6~ 7行自(データ)を I data3- l.txtJ に,プログラム 3 .1の 8~9 行自(初期値)を I i n it 3‑ I .t x t J に保存し, WinBUGS の 実 行 フ ァ イ ル が あ る デ ィ レ ク ト リ I C : ¥P r o g r a mF i l e s ¥Wi nBUGSI4J に格納する.次に, WinBUGS を実行するためのスクリプト I s c r i pt 3 ‑ l . t x t J を作成し,同じく I C : ¥P r o g r a mF i l e s ¥Wi nBUGS14J に保存する 2 プログラム 3.2: プログラム 3 . 1 を WinBUGSで解析するためのスクリプト r s c r i p t 3 ‑ 1 .t x t J 行 │ プログラム │ コメント 0 1 : Id i s p l a y ( 'l o g ' ) Iログウインドウを表示する 0 2 : Ic h e c k' (C :/ P r o g r a mFi 1 e s/ Wi n B U G S 1 4 / m o d e1 3 ‑ 1 .t x t ') Iモデル式を W i n B U G Sにチェックしてもらう 0 3 : Id a t a ( ' C : / P r o g r a mF il e s/ Wi 円B U G S 1 4 / d a t a 3 ‑ 1 .t x t ' ) Iデータを読み込む 0 4 : Ic o m pi 1 e( 1 ) Iコンパイルする 0 5 : Ig e円. i n i t s0 I初期値を W i n B U G Sに設定してもらう 0 6 : Is e t( t h e t a ) Ir t h e t a J をパラメータに設定する 0 7 : Iu p d a t e( 2 0 0 0 ) I事後分布からサンプリング ( 2 0 0 0個)する 0 8 : Is t a t s( 本 ) I事後分布の統計量を表示する 0 9・ Id e n si t y( 本 ) I事後分布の密度関数を表示する 1 0 : Is a v e ( 'C : / P r o g r a mF il e s/ Wi 円B U G S 1 4 / r e s u l t 3 ‑ 1 .t x t ' ) I結果をテキストに保存する モデル式 (modeI3‑l . t xt) modeI[ ) theta‑ dbeta( 1, 1 ) x ‑ dbin(theta,n 推定結果 t h e t as a m p l e :2 0 0 0 ノ 実行 Ii stCx=ll, n=20) パラメータの初期値 (init3‑l . txt) Ii stCtheta=O.2 ) 図 3.3:ベイズ推定を行う手順 WinBUGS を実行するためのコマンドについては I[参考 1 ]関数・コマンド一覧」を参照されたい.プロ グラム 3 . 2I s c r i pt 3 ‑ l . tx t J を作成した後は, WinBUGSの [ F i l e ]→[Ne w ]からエデ、ィタを表示して I s c r i p t 3・ 1 .t x t J をの内容をコピー&ベーストした後, [ M o d e l ]→ [ S c r i p t ]からスクリプトを実行するか,コマンドウ . 1及び図 3 . 2と同様なので省略する. インドウ上から以下の命令を実行する.実行結果は図 3 .2をコマンドウインドウ上で実行するためのコマンド プログラム 3.3: プログラム 3 行 ; プログラム ; コメント 0 1 : Ic dC : / P r o g r a mF il e s / W i n B U G S 1 4 ! w i n b u g s 1 4 .e x eがあるディレクトリに移動する 0 2 : iw i n b u g s 1 4 .e x e/ P A Rs c r i p t 3 ‑ 1 .t x t is c r i p t 3 ‑1 .t x tを W i n B U G Sで実行する W i n B U G Sに設定してもらっているが l i n i t 3 ‑1 .t x t J を使って初期値を設定することも出来る.その場合は I i n it s( 1,'C:/ P r o g r a mF il e s / W i n B G G S I 4 ! in it 3 ‑1 .t x t ') Jとする( I 1 Jは I c h a i n lの初期値Jであることを表す) • 2 以下では,初期値を ‑ 9 8・

100.
[beta]
(2
)の例を解析する手順
(2
)の例を解析するため,以下の様な WinBUGSのモデル式を定義し,計算する.

.
4
:(2
)に関する WinBUGSのモデル式,データ,初期値
プログラム 3
プログラム
行 1
0
1
: !mode1{
o
r(
ii
n1
:
n
) {
02! f
03:!
y
[
i
J
dnorm(
m
u[
iJ, t
a
u[
1J
)
04:!
m
u
[
i
J<
‑beta[1J + beta[2J*x[iJ
0
5・
f
o
r(
ii
n1
:
2
) {
0
6
dnorm(
0, t
a
u[
2
J
)
b
e
t
a
[
i
J
0
7
0
8・
t
a
u[
i
J
d
g
a
m
m
a
(
0
.
0
0
10
.
0
0
1
)
0
9
:
s
i
g
m
a
[
i
J<sqrt(1/tau[iJ)
1
0
:
1
1・

l
コメント
jモデル式の先頭 l
まr
m
o
d
e1 {J とする
コ f
o
r (i川初値:終値)
Y j ‑ 正 規 分 布 :N (/
1j , 1/τ)

勾

μ j ‑ s1+ s2XXj
sj ‑ 正 規 分 布 N (00
.
0
0
0
0
0
1)

勾

i

1
2
: 1
1i
州

勾

τ

ガンマ分布:G
a
m
m
a(
0
.
0
0
1, O
.0
0
1
)

データ :x
司 12345
),y
=
(
123,
瓦
,5
.1
)
, n‑5
(
↑S
‑
P
L
U
Sや Rで用いられている 1
i
s
t文の形式↓)
j初期値: (s1, s2)=(O, 0)("1, "2)=(11
)

=
c(
12345
),円(1.2345
.1),吋)

1
3
: i1
i
s
t(
b
e
t
a
=
c(
00
),tau=c(
11
)
)

計算結果は以下のようになり,図 3.41
土各ノ号ラメータの事後分布に関する要約統計量が,図 3
.
5では各パ
ラメータの事後分布の密度推定結果が表示される.

iTi司罰回一一一一一一一一一一一一一一一‑翌三キ

T
持 IU

node
b
e
t
a
[
1
]
b
e
t
a
[
2
]!
日m
a
[
1
]!
日m
a
[
2
]
t
a
u
[
1
]
t
a
u
f
2
1

n
l
e
a
n
‑
0
.
0
2
6
2
4
1
.
0
1
1
0
.
0
8
5
5
9
1
.
2
日
日
4
7
3
.
5
42
1
3.

$d
0
.
0
7
5
50
.
0
7
5
1
6
0
.
3
3
5
2
2
.
2
6
9
3
9
3
.
3
3
0
.
7
8

MCe
r
r
o
r 2.5~0
.
0
0
5
3
2
40
.
1
6
3
6
0
.
0
0
5
5
3
5 0
.
9
5
7
2
0
.
0
2
3
1
1 0
.
0
2
55
0
.
0
4
7
9
2 0
.
3
6
4
4
1
6
.
5
3
3
1
.
7
2
1.
47
2
0
.
0
4
5
6
3

‑
m

m
e
d
i
.
l
I
l
‑
0
.
0
3
1
4
1
1
.
0
1
7
0
.
0
5
1
7
4
0
.
8
5
9
9
3
7
3
.
6
1
.
3
5
4

4旦J
2
9~.._. _;.-~9
7
.
5
%
0
.
1
4
4
9
1
.
0
6
0
.
1
7
9
3
4
.
7
7
1
1
5
0
0
.
0
7
.
6
2
2

$
t
品目

S
c
l
n
刊)
I
e
2
0
0
0
2
0
0
0
2
0
0
0
2
0
0
0
2
0
0
0
2
0
0
03
.
4
:各パラメータの事後分布の推定結果

仰…同町山町山ーーーーーーーーーーーーーーーーーーー‑唾要

ヲη

l

b
e
t
.
(
1
1s
.
m
p
l
e
:2
0
0
0

b
e
t
.
(
2
1s
.
m
p
l
e
:2
0
0
0
3
0
.
0
2
0
.
0
106
.
0
4
.
0
2
.
0

。
。 -j~ー十
‑
0
.
50.
2
5

守、

0
.
0 025

日目

0
.
5

.
0
.
5

S日
明'
(
1
1s
.
m
p
l
e
:2
0
0
口

。。

0
.
5

1
.
0

s
i
g
m
a
l
2
]s
a
m
p
J
e
:2000
1
.
0
口7
5
0
.
5
0
.
2
5

1
0
.
0
5
.
0

。
。

日目

‑
2
.
5

0
.
0

2.
5

5
.
0

7
.
5

‑
2
0口

。
。

2
0口

4
0
.
0

t
.
叫1
1s
a
m
p
l
e
:2
0
口
0
.
0
0
2
0
.
0
0
1
5
0
.
0
0
1
.
4
5口 E

。。

‑
1口E+3

0
.
1
5
0
.
1
0
.
0
5

J¥,,‑‑一一一一
1
.
0
0
E
+
3

日日

+
3
3口 E

。
。

5
0
0
.
0

ゴ
図3
.
5
:各パラメータの事後分布の密度関数

9
9
‑

ー

こl

101.

③(例 2 )の例をスクリプトで解析する手順 プログラム 3.4 の 1~11 行目(モデ、ル式)を I m o d e l 3・2 . t x t J に,プログラム 3.4の 1 2行目(データ)を I d a t a 3 ‑ 2 . t x t J に,プログラム 3. 4 の 1 3行目(初期値)を l i n it 3‑ 2 . t x t J に保存し, WinBUGSの実行ファイル があるディレクトリ I C : ¥ProgramF i l e s ¥WinBUGS14J に格納する.また, WinBUGSを実行するためのスク リプト I s c r i pt 3‑ 2 . t x t J を作成し,同じく I C : ¥P r o g r a mF i l e s ¥WinBUGS14J に保存する. ( 例 2 )の例を解析す るための Wi nBUGSを実行するためのスクリプトを紹介する. s c r i p t 3 ‑ 2 .txtJ プログラム 3.5: プログラム 3.4を WinBUGSで解析するためのスクリプト① I 行 │ プログラム l コメント 0 1: I di s pI a y' (I o g ') iログウインドウを表示する 0 2 : ! c h e c k ( 'C : / P r o g r a mF il e s / W i n B U G S 1 4 / m o d e I 3 ‑ 2 .t x t ' ) iモデル式を W in B U G Sにチェックしてもらう 0 3 : 1d a t a ( 'C : / P r o g r a mF il e s / W i n B U G S 1 4 / d a t a 3 ‑ 2 .t x t ' ) :データを読み込む 0 4 : ! c o m pi I e( 1 ) コ ン パ イ ル す る 0 5 : 1i n i t s ( l, 'C : / P r o g r a mF iI e s / W i n B U G S 1 4 / i n i t 3 ‑ 2 .t xt ' ) i初期値を W in B U G Sに設定してもらう 0 6 : Is e t( b e t a ) Ir t h e t a J をパラメータに設定する 0 7 : Is e t( t a u ) ir t a u J をパラメータに設定する ω Is e t( si g m a ) !rsi g m a J をパラメータに設定する 0 9 : 1u p d a t e α 0 0 0 ) i事後分布からサンプリング ( 2 0 0 0個)する 1 0 : ! s t a t s( * ) !事後分布の統計量を表示する 1 1 : 1d e n s i t y ( * ) i事後分布の密度関数を表示する 1 2 : 1s a v e' (C: jP r o g r a mFi I e sj Wi n B U G S 1 4 / r e s uI t 3 ‑ 2 .t x t ') 結 果 を テ キ ス ト に 保 存 す る . 5で使用しているデータ I d a t a 3・2 .は t J の形式は, S‑PLUSや Rで用いられている l i s t文で記述 プログラム 3 されており, SASのデータセットや CSV形式とはかなり異なったものになっているが, Wi nBUGSでは以 d a ta 3‑ 3 . t x t J のような形式を用いることも出来る.この形式は「データの区切りはスペース J I 変数 下の I ファイルの最後に ENDを入れる」という制約があるのが特徴である. 名の最後は日をつける J I s c r i p t 3 ‑ 3 .t x t J プログラム 3.6: プログラム 3.4を WinBUGSで解析するためのスクリプト② I 行│ プログラム I d a t a 3 ‑ 3 .t x t Id a t a 3 ‑ 4 .t x tI i ni t 3 ‑ 2 .t x t 0 1 : 1d i s p l a y ( 'l o g ' ) 1 1 i 0 2 : 1c h e c k ( ' C : / P r o g r a mF i l e s / W i n B U G S 1 4 / m o d e I 3 ‑ 2 . t x t ' ) 1x [ ]y [ ] I l i s t ( n = 5 ) 1I i s t ( b e t a = c ( O,0 ), 0 3 : 1d a t a ( 'C : / P r o g r a mF il e sj Wi n B U G S 1 4 / d a t a 3 ‑ 3 .t x t ' ) 1 11 I I t a u= c ( l,1 ) ) 0 4 : 1d a t a ( 'C : / P r o g r a mF il e sj Wi n B U G S 1 4 / d a t a 3 ‑ 4 .t x t ' ) 122 1 1 0 5 : 1c o m pi I e( 1 ) 133 I I 'C : / P r o g r a mF il e s / W i n B U G S 1 4 / i n i t 3 ‑ 2 .t x t ' )/ 44 I I 0 6 : Ii n i t s ( l, 0 7 : 1s e t( b e t a ) I55 . 1 0 8 : 1s e t( t a u ) 1E N D 0 9 : 1s e t( si g m a ) 1 0 : 1u p d a t e( 2 0 0 0 ) 1 1 : Is t a t s( * ) I I I 1 2 : 1d e n s i t y ( * ) 1 1 1 1 3 : Is a v e ( 'C : / P r o g r a mF il e sj Wi n B U G S 1 4 / r e s u l t 3 ‑ 3 .t x t ' ) I I I I d a t a 3 ‑ 3 . t x t J より WinBUGSのデータ形式は若干癖があることが分かる.また, ( 例 2 ) の x,yのデータ 数が 5個 , nのデータ数が l個であり,変数によってデータ数が異なる場合は,データを格納するファイル を分ける必要がある等,データを読み込む際は一工夫が必要となる.以上のことを踏まえて,次項では 「 ③ SASと Wi nBUGSを組み合わせてベイズ推定を行う方法」を使ったベイズ推定方法を紹介する. 4 .S A Sと W i n B U G Sを組み合わせてベイズ推定を行う方法 前項の方法では, ( 例 1 ) のモデルをベイズ推定するスクリプト I s c r i pt 3 ‑ 1 .t x t J を実行するために,ベイズ 推定を行うモデル I m o d e 1 3 ‑1 .t x t J ,データ I d a t a 3 ‑1 .t x t J ,初期値 I i n it 3 ‑ 1 . はt J を用意した.本項では, I s c r i p t 3 ‑1 .t x t J I m o d e 1 3 ‑1 .t x t J l i n it 3 ‑ 1 .t x t J を用意し, SAS上でデータ I d a t a 3・ 1 .t x t J を作成し,スクリプ s c r i pt 3 ‑ 1 .t x t J を SASの xコマンドから実行することで, SASと WinBUGSを組み合わせてベイズ推定を トI 行う方法を紹介する. ‑ 1 0 0 ‑

102.

‑oah M ‑41alnH 対 +E‑+L ﹃ 3‑rk+L ・‑‑'白 t ・1I 白M UM nu‑‑'nu'nu M剛一 m‑dd P‑‑‑ 式一 一ア一引い問 Ita レ一 lJ‑+L m EG+LVA 三 ニ 司↓ー︑ ‑nuv SASフログラム Cdata3‑1.十けを生成〉 f iI e n回 eM Y T X T" c: l P r o g r a mF iI e s/Wi n B U G S 1 4 / d a t a 3 ‑1 .t x t ": d a t an u l l fi I eM Y T X T: ' 1i s t( x = l l .n = 2 0 )": p u t' r u n パラメータの初期値 (init3‑1 .tx十 ) o p ti o n sx s y n cn o x w a it : r o g r a mfi I e s 半 : w i n b u g s 1 4 , ¥ xc dc半p xw i n b u g s 1 4 . e x e/ P A R" C : / .. . / s c r i p t 3 ‑1 .t x t " : Ii s t( t h e t a = O .2 ) 実行 図4 . 1・ベイズ推定を行う手順 . 1を実行してベイズ、推定を行った結果は図 3.1と図 3 . 2と同様なので,害J I 愛する. 以下のプログラム 4 プログラム 4 .1:( 例 1 )を計算する S A Sプログラム iscri pt4‑1 .sasJ 行 i プログラム │ コメント 0 1・ I f il e n a m eM Y T X T" C : / P r o g r a mF il e s / W i n B U G S 1 4 / d a t a 3 ‑ 1 .t x t " Iデータセット fMYDATAJ を 0 2・ id a t a̲ n u1 1 ̲: Ifdata3‑1 .t x t J に書き込み 0 3: ! fi 1 eM Y T X T: i 0 4・ i put"1 i s t( x = l l .n = 2 0 )" i① f1 i s t( x = l l .n = 2 0 )Jを 0 5 : ! r u n iファイルに書き込む 0 6 : I o p ti o n sx s y n cn o x w ai t : I 0 7 : ! xc dC : / P r o g r a mF il e s / W i n B U G S 1 4¥ if s c r i p t 3 ‑ 1 .t x t J を xコマン 0 8 : ! xw i n b u g s 1 4 .e x e/ P A R" C : / P r o g r a mF il e s / W i n B U G S 1 4 / s c r i p t 3 ‑1 .t x t " :iドで実行する ( 例 2 ) についてベイズ推定を行う SAS プログラムを紹介する.まず, 次に, i s c r i p t 3 ‑ 2 . t x t J i m o d e l 3・ 2 . t x t J i i n i t 3 ‑ 2 . t x t J を用意し, SASデータセット iMYDATAJ からデータ i d a t a 3 ‑ 3 . t x t J ,別手順で i d a t a 3 ‑ 4 . t x t J を作成し,スクリプト i s c r i p t 3 ‑ 2 . t x t J を SASの xコ7 ンドから実行することでベイズ推定を行う.結 . 5と同様なので,ここでは割愛する. 果は図 3.4,図 3 プログラム 4.2: ( 例2 )を計算する S A Sプログラム i s c r i p t 4 ‑ 2 .s a s J 行 ; 0 1 : Id a t aM Y D A T A: プログラム ! コメント Iデータセット f M Y D A T A J 0 2 : I i n p u txy 0 3 : I c a r d s 0 4 : I 11 0 5 : 1 22 0 6 : I 33 0 7 : I 44 0 8 : I 55 . 1 0 9 : I x = l .2 .3 .4 .5 I y = l .2 .3 .4 .5 . 1 1 0 : Ir u n 1 1 : I f il e n a m eM Y T XT 1" C : / P r o g r a mF il e s/W川 B U G S 1 4 / d a t a 3 ‑ 3 .t x t " f il e n a m eM Y T X T 2" C : / P r o g r a mF il e s / W i n B U G S 1 4 / d a t a 3 ‑ 4 .t x t ": 1 2 : I ‑101・ ファイ lレ f d a t a 3 ‑ 3 .t x t J f d a t a 3 ‑ 3 .t x t J にデータを 書き込む準備

103.

コメント E ﹁ ‑nu データセット f M Y D A T A Jを fd a t a 3 ‑ 3 .t x tJ に 書 き 込 パu・ ' =nHH due‑14. nH Enur‑‑L e+Lnn AmTl J 1 1 4 X 一 ; 1︐ ; ・ ︑ TlVA‑‑﹁L n l一A T=xt 一 み: ①ファイルの 1行自に変数名 を書き込みする.その際,変 数名の末尾に口を追記する ︐ 11﹄h H U U V E ‑ H V A H U n u v HUUVEMM川Mm同 nMm +L+L. ︐ ertuue UHu 免 dur +LI‑‑nuFnvJucu・ ' a e ‑ ‑ 手I n ‑ ‑ み し P041110uaunH i‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑ 1l‑41414141414141ηζηζ ‑ け 一3 4 5 6 7 8 9 0 1 ヲ面ヲラム n u m ;1 ︐ . j n u 一 ︐ . TEE M ‑vann川M ltTl 引刊 1luTF HUHMmw nH ρ h v ll+L・ ' 免 u‑tlHU +LF+lnuFnH 免 UHu jnUVE ③ファイルの最終行に f E N D J を書き込みする . ﹄ n J ι 4 内u aaypkju ntntntnL ‑‑‑‑‑‑‑‑ ②ファイルの 2行目以降にデ ータの中身を書き込みする. FKIM ・ ' ︐ ︐ ︐ ) ‑ ‑ 一 一 一 一 e n H ηLrt 'Tl+L VAHeu ‑‑l?Et‑‑‑ liv‑‑‑ HUMM川H n H ﹄ ll+L ﹃ HU 免 U l LSInurnH UHU 免 ゐ ︐ r d n f ' ‑ n f ' ‑ n f ' ‑ n f ・‑‑‑‑‑‑‑ ﹃︐︐ nxunud F h v • 3 0 : I o p t i o n sx s y n cn o x w a i t : 3 1 : I xc dC : / P r o g r a mF i l e s / W i n B U G S 1 4 , 平 3 2 : I xw i n b u g s 1 4 .e x e/ P A R" C : / P r o g r a mF il e s / W i n B U G S 1 4 / s c r i p t 3 ‑ 2 .t x t ": ファイ J レf d a t a 3 ‑ 4 .t x t Jf こ データを書き込み: n = 5 J をファイルに書き ① f 込む f s c r i p t 3 ‑ 2 .t x t J を x コマ ンドで実行する 本工頁の方法を用いることで, SAS上で Wi nBUGSを動かしてベイズ推定を行うことが出来るようになったが, 事前に用意するファイルが多く,データを読み込む作業も煩雑である.そこで,次項で紹介する 「④R2WinBUGSでベイズ推定を行う方法」を用いることで,データを読み込む手順を簡素化した上で, Rと Wi nBUGS) を組み合わせてベイズ推定を行う方法」を使ったベイズ推定方 「 ⑤ SASとR2WinBUGS ( 法を紹介する. 5 .R 2 Wi n B U G Sでベイズ推定を行う方法 ベイズ推定を行う方法として,最近では I R J という統計ソフトウェアと IWinBUGSJ を組み合わせてベ イズ推定を行う方法(R2Wi n BUGS) が一般的になりつつあり,北海道大学の久保拓弥先生が作成された R2WinBUGS用のラッパ一関数 I R2WB 町 a p p e r . R J を使うことで,より簡潔なプログラムでベイズ推定を行 nBUGS) を組み合わせてベイズ推定を行う方 うことが出来る.本稿では「⑤ SASとR2WinBUGS (Rと Wi 法」を使ったベイズ推定方法を紹介する準備として, R と WinBUGS (R2WinBUGS) で解析する場合の手 順を紹介する 3 出力結果 E 司 R o u t p u . t p d f モテ:)~式M 白 出 間U s c r i p t 5 ‑ 1 .R 凪出 R上で実行 ー ヨ WinBUGSI こ下請け 持 口u t p ut . tx t W i n B U G S . e x巴 図5 . 1 :ベイズ推定を行う手i l 頂 3Rのセットアップ方法と f R2W B w r a p p 尻 町 の 導 入 方 法 は f[参考 2 ] WinBUGSとR2WinBugsのセットアップ」を参照のこと. ‑ 1 0 2 ‑

104.

( 例 1 ) のモデルをベイズ推定するために,ベイズ推定を行うモデル I m o d e l 3 ‑l .t x t Jと I R2WBwrappe r .RJ を I C・ / t e m p J フォルダに格納し, R 上で以下のプログラム I s c r i p t 5・ l .R J を実行することでベイズ推定を行 う. (例 2) に つ い て も ほ ぼ 同 様 の 手 順 で あ り , ベ イ ズ 推 定 を 行 う モ デ ル Im o d e l 3 ‑l .t x tJ と I R2W Bwrapper.RJ を I C : / t e m p J フォルダに格納し, R 上で以下のプログラム I s c r i p t 5 ‑ I . R J を実行するこ s c r i p t 5 ‑ I . R J I s c r i p t 5 ‑ 2 . R J の命令の意味は本稿の本筋から若干ずれる とでベイズ推定を行う.プログラム I ため劃愛するが,詳しくは本稿の最後の I[参考 1 ]関数・コマンド一覧」や久保拓弥先生のホームページ 「生態学のデータ解析」を参照されたい. プログラム 5 .1 ,5 .2: (例1)と(倒 2 ) のモデルについてベイズ推定を行う Rプログラム s cri p t 5 ‑1 .R j , ( 例2 ) に関する Rプログラム r s c r i p t 5 ‑ 2 . R j (例1)を計算する Rプログラム r s e t w d' (C :/ t e m p , /) is e t w d' (C :/ t e m p , /) s o u r c e' (R 2¥ ' 1B w r a p p e r .R ' ) ! s o u r c e' (R 2¥ ' 1B w r a p p e r .R ' ) c l e a r .d a t a .p a r a m O ! c l e a r .d a t a .p a r a m O 2 , 3, 4 , 5 ),•y = c( 1, 2 , 3, 4, 5 . 1 ) ) id( ‑d a t a .f r a m e( x = c( 1, ( 、 ‑ s e t d a t a ( ‑ x ‑, 1 1 ) 0 ) s e t .d a t a( " n ‑, 2 I s e t .d a t a d $ x ) I s e t .d a t a( " y ‑, d $ y ) s e t .p a r a m( " t h e t a ‑, 0 . 2, s a v e = T ) I s e t .p a r a m( 市u ‑, N A, s a v e = F ) !s e t .p a r a m( 、e t a ‑, c ( O, O ),s a v e = T ) I s e t .p a r a m( ‑ t a u ‑, c( 1, 1 ) , s a v e = T ) Is e t .d a t a( " n ‑, n r o w( d ) ) I s e t .p a r a m ( " s i g m a ‑ N A , p o s t .b u g s( ‑c a1 . 1b u g s( f il e = ' m o d e I 3 ‑ 1 .t x t ', d e b u g = F A L S E, n .i t e r = 2 0 0 0, n . b u r n i n = 1 0 0 0, n . t h i n = 1) p o s t .1 i s t( ‑t o .1 i s t( p o s t .b u g s ) ー t r a n s f o r m ( p o s t .b u g s $ s u m m a r y, r e s u l t く v a r = r o w n a m e s ( p o s t . b u g s $ s u m m a r y ) ) w r i t e . c s v ( r e s u l t, f il e = ' C : / t e m p / s u m m a r y . c s v ', q u o t e = F A L S E, r o w . n a m e s = F A L S E ) a p e r = 'a 4 ' ) p d f ( ' C : / t e m p / o u t p u t .p d f ', p J ,s m o o t h = F ) p1 o t( p o s t .1 i s t,[ , d e v .o f f0 s i n k ( f i l e = ' C : / t e m p / o u t p u t .t x t ' ) p r i n t ( p o s t . b u g s, d i g i t s . s u m m a r y = 3 ) si nkO s a v e = T ) , ! P Me='modeca1311‑.2.butxgts'( debug=FALSE ! fi1 附く , , In .i t e r=2 0 0 0, n .b u r n i n=1 0 0 0, n .t h i n=1) 1 i 山 s t .b u g s ) ipostlist山 r e s u l t ( ‑t r a n s f o r m ( p o s t .b u g s $ s u m m a r y, i v a r =「o w n a m e s ( p o s t . b u g s s s u m m a r y ) ) tw r i t e . c s v ( r e s u l t, f il e = 'C : / t e m p / s u m m a r y . c s v ', ¥ q u o t e = F A L S E, r o w .n a m e s = F A L S E ) 凶('C : / t e m的 u t p u t凶 p a阿 = 'a 4 ' ) !p1 o t( p o s t .1 i s t,[ , J ,s m o o t h二 F ) Id e v .o f f0 Is i n k ( f il e ニ' C : / t e m p / o u t p u t .t x t ' ) I p ri n t( p o s t .b u g s, di gi t s .s u m m a r y = 3 ) isi nkO i プログラム 5 . 1や 5 . 2を実行した結果は,次節で紹介する SASマクロを実行した結果と同じものが表示され るので,ここでは割愛する.さて IWinBUGSJ や I R J はデータハンドリングが苦手で3あるという欠点 があり,ベイズ推定を行うためのデータを作りこむのが大変である.この欠点を SASで補うために, SAS とR2Wi nBUGS (Rと WinBUGS) を組み合わせてベイズ推定を行う方法を次項で紹介する. 6 .S A Sと R 2 W i n B U G Sを組み合わせてベイズ推定を行う方法 本項では, I [参考 4 ] SAS と R 2WinBUGS を 組 み 合 わ せ て ベ イ ズ 推 定 を 行 う SAS マ ク ロ 」 で あ る I%BUGSJ の実行例を紹介する.まず, SASマクロ I%BUGSJ の書式を紹介する. . 1 :マクロ「私 B U G S0Jの 書 式 プログラム 6 プログラム i コメント 0 1 :! 覧B U G S ( v a r i a b l e !v a r i a b l e =変数名, d $データセット面支薮名…) 0 2 :i p a r a m e t e r !p a r a m e t e r =パラメータ名,初期値,推定するつ.…) 0 3 :! d a t a s e t =M Y D A T A !dataset =読み込むデータセット名 0 4 :i d e b a g =F A L S E, id e b a g =¥ ' 1i n B U G S上でデバッグを行う? 0 5 : w o r d k i n g d i r =' C : / t e m p / ', 1w o r d k i n g d ir=作業ディレクトリのパス' 0 6 : m o d e l p a t h =' m o d e l .t x t ', t h =叩フ山のパス 0 7 :i d a t a p a t h =' C : / t e m p / d a t a . c s v ', d a t a p a t h='データファイルの保存先のパス' 0 8 :! p d f p a t h =‑ C : / t e m p / o u t p u t .p df " , p d f p a t h =‑事後分布の推定結果の図の保存先のパス w 0 9 : o u t t e x t p a t h二 ‑ C: / t e m p / o u t p u t .t x t ‑, o u t t e x t p a t h=‑事後分布の要約統計量の保存先のパス w 1 0 :i p r o g r a m p a t h=‑ C : / t e m p / b u g s p r o g r a m . R ‑ ) ; ip r o g r a m p a t h=‑ Rプログラムのパスづ, 行 … ; ‑ 1 0 3・

105.

SASマクロ i%BUGSJ を実行すると,以下の流れでベイズ推定を行う. 出力結果 SAS上で実行 有 事 R s a s . e x e 〉 Rに下請け R e x e キ 手 モデル式 t x t W i n B U G S . e x e 図6 . 1:ベイズ推定を行う手順 ( 例 1 )について,ベイズ推定を行うモデ ル i m o d e 1 3・ l .t x t J のみを作成し i R2W B w r a p p e r . R J と共に作業 ディレクトリ i C :/ t e m p J に格納すれば,後は全て SAS上で(データ,パラメータの種類,初期値などを) 指定し,ベイズ推定を実行することが出来る(プログラム 6 . 2 ). j1: 一 2: 3 4: 5 6: 7 8; 90 ︐ . A 中身は r X = l1 J r N二 2 0 J ︐ nHUUM '﹁ト﹄ Evnk )︐ ') ︐ ︐ ︐ nHnι JHMTEE ︐ 'nHV るT﹄ 1 ﹄血し︾ ︐V︐ ︐ A' 命 ︑ ︐ ︐ V A Junu'+L ' + L︐ . 'efJti rt rt ‑‑nHnu﹁ ‑ VA+Lm川 内4 u ''e1l ︑ も ︑ M鴨川 M鴨 川 ' ' VEVl ︐︐︐︐ Enu +L+L‑‑nU FOponLvm川 r ・! ‑一一一== 伺 1 J ‑ ︐nu'nH ?EE‑‑. ︐ vl AH O M O M g b + L nυ4lnυIl+Lna uvB4EEn 胃 み Lxnnuuaaoo‑‑‑ aHunkuvnν 凶刊 m ‑ ι'nMOM‑‑lnup ﹁ ︑ ambn11 Mm ==‑‑nb ・ laJue ︒G n h u v l V I v ‑ ‑ U AurM ‑ ・ 44lrnHunHvnHvnHvnHvnHvnHvnHvnHV4ll 行 一 プログラム 6 . 2 : (例1)に関するベイズ推定を行う S A Sプログラム i s c r i p t 6 ‑ 1 .s a s J プログラム │ コメント iデータセット r M Y D A T A J • U G S J を実行: i. S A Sマクロ「目B !・データ r X Jは M Y D A T Aの変数 r X Jの値, 1.データ r n Jは M Y D A T Aの変数 r n Jの値を格納する t h e t a Jについて,初期値を r O .2 J. ;・パラメータ r ベイズ推定を行った結果を格納する ( T R U E ) ;・作業ディレクト J Iのパスを r C : / t e m p J とする C : / t e m p / m o d e I 3 ‑ 1 .t x t J =モデルファイルのパスは r プログラム 6 . 2を実行すると,ベイズ推定を行った結果として表 6 . 1や図 6 . 2が表示される. ( 例 1 )に関す . 1では「パラメータ Oの事後分布の平均:0 . 5 3 9,標準偏差:0 . 1 0 9, る推定結果は以下のようになり,表 6 …」等の事後分布に関する要約統計量が表示され,図 6 . 2で、はパラメータ 0の事後分布のサンプリングの過 程や密度推定結果が PDFファイルとして表示されている.本項の方法を適用するメリットとして, S ASの データセットをそのまま計算に使うことが出来る,モデル式を記述したファイルのみ作成すれば,後は SASのマクロを実行するだけでベイズ推定を行うことが出来る,全ノ号ラメータの事後分布に関するグラフ が lつの PDFファイルにまとめられる,といった点が挙げられる. 表6 . 1 : (例1)のパラメータ 8の事後分布に関する統計量 1 n f e r e n c ef o rB u g sm o d e1a t" C :j t e m p j m o d e1 3 ‑1 .t xt " . fi tu si n gWi n B U G S, 3c h a i n s .e a c hw i t h2 0 0 0i t e r a t i o n s( f i r s t1 0 0 0d i s c a r d e d ) n .s i m s=3 0 0 0i t e r a t i o n ss a v e d 5弘 5 0 首 7 5首 9 7 .5 首 R h a tn . e f f m e a n s d 2 . 5略 2 t h e t a 0 . 5 4 40.1060.3340.4710.5460.6200 . 7 4 51 . 0 0 1 3 0 0 0 d e v i a n c e4 . 4 3 51 . 3 8 03 . 4 6 43 . 5 6 73 . 9 0 54 . 7 2 98 . 4 4 91 . 0 0 3 2 3 0 0 F o re a c hp a r a m e t e r .n . e f fi sac r u d em e a s u r eo fe f f e c t i v es a m p l es i z e . a n dR h a ti st h ep o t e n t i a ls c a l er e d u c t i o nf a c t o r( a tc o n v e r g e n c e .R h a t = 1 ) . D=D b a r ‑ D h a t ) D I Ci n f o( u s i n gt h er u l e, p p D=1 . 0a n dD I C=5 . 4 DI Ci sa ne s t i m a t eo fe x p e c t e dp r e d i c t i v ee r r o r( I o w e rd e v i a n c ei sb e t t e r ) . 104・ ー

106.

二 心 l 加 L~' ! t e r a l!ùr.~ 図 6.2: (例1) のパラメータ Oの 事 後 分 布 の 推 定 結 果 ( 例 2 ) のモデ、ルについてベイズ推定を行う場合についても同様であり また, r m o d e I 3 ‑ 2 .収 t J 作成し, r R2WBwrapper.RJ と共に作業テ'ィレクトリ r C :/ te mpJ に格納した後,プログラム 6 . 3を実行すればよい. プログラム 6 .3・ ( 例2 ) に関するベイズ推定を行う SASプログラム r s c r i p t 6 ‑ 2 .sasJ プログラム i コメント M Y D A T A J ;データセット f 0 1 d a t aM Y D A T A IID:1. 2 .3 .4 .5 i n p u txy 0 2 IX :1 .2 .3 .4 .5 0 3 I c a r d s iY :1 .2 .3 .4 .5 .1 0 4 11 0 5 22 0 6 : 33 S A Sマクロ f % B U G S J を実行: 0 7・ 44 j・データ: 0 8 55 . 1 f X J :M Y D A T Aの変数 f X J. 0 9 y J. f yJ :M Y D A T Aの変数 f 1 0 : r u n f n J f 5 J を格納する i 首B U G S ( !‑パラメータ: iv a ri a bI e =% s t r' (x '. . d $ x '.γ.. d $ y '. . n '. . 5 ・ ) , j 「mLJJ:初期値なし.結果表示せず a m山 r=% s t r ( ' m u '. N A .' F A凶 E ' b e t a V(0.0)¥'TRUE¥ ; 「bdaJ:初期値 ( 0 . 0 ) !p....,. . , , . . . . . , 1 1 1 . . . . . '¥ JC(1,1 ),:TRUE¥:SIgma¥NA,' T R U E ' ),j h u」 初期値 ( 1 .1 ) ; 耐 n U「 = 1./temp/' ; 印 刷a J 初期値なし imodel附 h ='m哨 í3~2. i x t ' i・作業ディレクトリ f C : / t e m p J I.モデル rC:/temp/modeI3‑2.txtJ 行 ・ : 4E'nJι aayFhupnu 111u1 111 ︐ 守 ι 内︽ ; 阿 t SASプログラム r s c r i p t 6 ‑ 2 . s a s J を実行した場合も, SASプログラム r s c r i p t 6 ‑1 .s a s J を実行した結果と同様 の結果が表示されるので,実行結果は割愛する. 7 .S A Sの M C M Cプロシジャでベイズ推定を行う手順 SAS9 . 1 までは MCMCを実行するためのプロシジャが用意されていなかったため,前項までで紹介した方 法により SAS以外のソフトを使用するか, MCMCを実行するための SASマクロを自作するしかなかったが, SAS9 . 2より M e t r o p o l i sアルゴリズム 4により MCMCを実行するための rMCMCプロシジャ」が用意された ( E x p e r i m e n t a Ip r o c e d u r e ) .本項では(例 1 ) と(例 2 ) をたたき台として rMCMCプロシジャ」でベイ rMCMCプロシジャ」を使った更なるベイズ推定の例は SAS/STAT(R)9 . 2 ズ推定を行う方法を紹介する U s e r ' sG u i d eI T h eMCMCP r o c e d u r e( E x p e r i m e n t a I ) J を参照されたい. )の例を解析する手順を紹介する.パラメータ 0の事前分布をベータ分布:B e t a ( I, I ),初期値を まず, ( 例 1 4 M e t r o p o l i sアルゴリズムについては丹後 (2000) を参照のことー ‑ 1 0 5 ‑

107.

0ムモデ、ル式として xが二項分布:B i n o m i a l (n, 8 )に従うとする場合, MCMCプロシジャではこれらの条件 (モデ、ル)を定義するために以下のように記述する.書式は WinBUGSの書式に似ていることに注意された い(微妙に異なる点にも注意されたしつ. :p a r m t h e t a 初期値 0 . 2 事前分布:p ri o rt h e t a ‑b e t a( 1,1 ) モデル式:m odeIx ‑b i n o m i a l( N, t h e t a ) ここで I ~J は「特定の確率分布に従う」ことを表す. SASの MCMCプロシジャで使用することが出来る 確率分布については,本稿の最後の I[参考 1 ]関数・コマンド一覧」を参照されたいが,この表記を用い て Oの事後分布を求めるために,ベイズの定理: p (8jx) 民 p(xj8) xp(8) を用いて計算する場合は, MCMCプロシジャを使って以下のように記述すればよい. プログラム 7 .1:( 例 1 )に関する MCMCプロシジャのプログラム r s c r i p t 7 ‑ 1 .s a s J プログラム │ コメント :デ一タセツト「削T 0 2 : i i n p u tXN ; 中身ま l は 「 吋 X ニ 斗1 1 J 川 r N = 2 0 山」 0 3 : I c a r d s 12 0 0 4 : I 1 0 5 : i 0 6 : ! r u n; 立 」 ataMYDATA ; 0 1 : id n H V nυt 個 ︑ J+1 m︐ 個川蜘 ︽ 内 d ・ hnυnLa' 品 L M同 掛宮内L n υ ρ ︾r k hw nU ↑ト4 n n υ r k グヒ :BU ン山値:・m シ個のの布 リ蜘期布 m プ剖初分・h そ O ) )ザ の∞ 6 6配 もイパ((己 か nタタ‑‑ 布・寸一一 x 分 mメ メ タ 後加ララ一 事(パパデ ﹄ γll L Fド ﹃E H U M PO nk nv + L c u ‑ 一n u H u n u + L ﹄・' nJ n H v n H V n υ ・ ρ︾ 刊 'h 川 E d 内 ︐ ︑nIuJ nu+1 n u m川 ︑ nb' au‑‑‑ n ﹃︐︐品 ︐ ﹃ Au 一 一 JM ︐ ﹃ etlrk ・ aA・ '+1 句 Amrkm γ112unu n=nU n H U ρ ︾ ‑tl ︐ι1M .EMVBn 内E HU Mm‑sl "sl nU2unu 品目﹄ 4G4a eJU2U 品目﹄品目﹄ FO FUE伺 UOLvaunu ‑ ‑ i ﹂ 日 hH ・ i 'hHnu 品目﹄品目﹄ V A i n H nuFm川 nν ・ 4 d n u v ﹄ Ill・ 免 U VEm刷 m川 n u ρ u v s wと o v ‑ ‑ B E A u ‑ ‑ R E D n U d 内 vt u ︽ cununvnvm川 nHeu A U V﹄ H u︐ AU U ︽n ua inu ︐ nMunuJvnHV41﹄ nιn4u nυnunU41414141 ︐ ﹃ •• パラメータ Oの事後分布に関する統計量の推定結果は以下のようになり,図 7 . 1では「パラメータ Oの事後 . 5 4 6 2,標準備差:0 . 1 0 4 6,…」等の事後分布に関する要約統計量が表示され,図 7 . 2ではパ 分布の平均:0 ラメータ Oの事後分布の密度推定結果が表示されている.この結果は,前項までの WinBUGSを用いた方法 による推定結果とほぼ同様のものが再現されている.また,図 7 . 2で、はパラメータ Oの事後分布からサンプ リングした結果を診断 ( D i a g n o s t i c ) した結果も表示されており,図 7 . 2の上図に事後分布からのサンプリ ングの経緯が示されている.さらに,図 7 . 2の左下に自己相関の結果が表示されており,高次の相関の度合 いが小さくなっており,上手くサンプリング出来ていることが伺える. S A Sシステム T h eM C M CP r o c e d u r e P o s t e ri o rS u m m a ri e s N M e a n S l a n d a r d D e v i a l i口口 2 5 % 2 0 0 0 0 . 5 5 1 1 0 . 1 0 0 7 0 . 4 8 1 0 P a r a m e l e r l h e l a P er c e n li I e s 5 0 % 0 . 5 5 2 7 P o s l e r i o rl n l e r v a l s e r P a r a m巴l A l p h a E q u a l ‑ T a iIl n l e r v a l l h e l a 0 . 0 5 0 0 . 3 5 7 4 日. 7 4 7 2 H P Dl n l e r v a l 0 . 3 6 7 1 図7 .1:パラメータ 6の事後分布に関する統計量 ‑ 1 0 6・ 0 . 7 4 8 2 7 5 % 0 . 6 2 2 1

108.

Diagnosticsf o rtheta 0 . 8 市‑市山工‑ 0 . 6 0 . 4 2000 1500 1000 2500 3000 I t e r a t i o n h‑ 一 回 ω = 口﹄口一一由‑回口仏 U IS ー ﹁ 弓︾内 ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ 晶 団 団 岨 nunv ﹂ 2 DUD‑=︽ 一 ED‑‑m ill 1 . 0 ‑ 0 . 5 ‑ 1 . 0 10 30 20 40 50 0 . 2 0 . 4 0 . 6 0 . 8 t h e t a L a g 図 7.2:パラメータ 8の事後分布の密度関数など 次に, ( 例 2 )の例を解析する手順を紹介する.パラメータが s I (beta[IJ) ,s 2(beta[2J) ,…のように,配 列形式となっている場合は aπayステートメントで配列であることを宣言する.また,パラメータが配列形 式となっている場合は I:Jを使うことで事前分布や初期値をまとめて定義することが出来る. 初期値 e t a :0 :parms b 事前分布:prior b e t a : ‑n o r m a l( m e a n = O,var=1/tau2) また,超ノ号ラメータ (例えば τ 2:t au2)については, h y p e rステートメントで分布を定義する. hyper tau2 ‑g a m m a ( O .0 0 1, i s c aI e = O .0 0 1 ) ( 例2 )の例を MCMCプロシジャを使って計算する場合は以下のように記述すればよい. 行 0 1: 0 2 : 0 3 : 0 4 : 例2 )に関する M C M Cプロシジャのプログラム Iscript7‑2.sasJ プログラム 7.2: ( プログラム i コメント d a t aM Y D A T A データセット f M Y D A T A J i n p u tXY X :1 ,2 ,3,4,5 c a r d s ,2,3,4,5 .1 Y :1 1 11 22 0 5 : 0 6 : 33 44 0 7 : 08・ 0 9 1 0・ 55 . 1 r u n ‑ 1 0 7 ‑

109.

行 I --~己ヲラム コメント 事後分布からのサンプリング数は 2 0 0 0値 ( b u r n ‑ i n :1 0 0 0個を除いた 2 0 0 0個) 結果 i 立デフォルト ( b e t a .t a u )とs i g m aを表示 f立復数あるので配列にする 7 :; s;f立複数あるので配列にする σ;f立復数あるので配列にする σ1の初期値は 1(r :Jは t a u1 .t a u 2 . . . ) s;の初期値は o( r :Jは b e t a 1 .b e t a 2 . .ー) 女各 p r[ o rの設定7:2f 立超パラメータとする a m m a( 0 . 0 0 1 .O .0 0 1 ) 7:,‑ガンマ分布:G 7 :2‑ ガンマ分布:G a m m a( 0 . 0 0 1 .O .0 0 1 ) ム 正 規 分 布 :N (o . 1/0.000001 ) 1 1 : Io d sg r a p hi c so n : 1 2 : Ip r o cm c m cd a t a = M Y D A T As e e d = 7 7 7n m c = 2 0 0 0 1 3 : Io u t p o s t = R E S U L Tm o ni t o r =しp ar m s ̲si g m a ) 1 4 : I a r r a yt a u [ 2 ]: 1 5 : I a r r a yb e t aロ ] 1 6 : I a r r a ys i g m a [ 2 ] 1 7 : I p a r m st a u : 1 1 8・ I p a r m sb e t a :0 1 9 : I b e g i n p r i o r : ) 2 0 : I p ri o rt a u 1 ‑g a m m a( 0 .0 0 1 .i s c aI e = O .0 01 a m m a( 0 . 0 0 1 .i s c aI e = O .0 01 ) 2 1 : I h y p e rt a u 2 g 2 2 : I p r i o rb e t a : ‑n o r m a l( m e a n = O .v a r = 1 / t a u 2 ) 2 3 : I s i g m a 1 =s q r t ( l / t a u1 ) 2 4 : I s i g m a 2=s q r t ( 1 / t a u 2 ) 2 5 : I e n d p r i o r e t a 2 * X: 2 6 : I m u=b e t a 1+ b 2 7 : I m o d e lY n o r m aI ( m u .v a r = l / t a u1 ) 2 8 : Ir u n : 2 9 : Io d sg r a p hi c so f f 剛 σ iニ 1 /7 : ,' / 2 ' / 2 σ2 ニ 1 /7 :2 , + μ ;=s s2 X x Yj ‑正規分布:N (μ1・1 /, : 7 ) 内 各パラメータの事後分布に関する統計量の推定結果は以下のようになる. Fロ 主t 巴r i 1 コ r8 u r n m在 r i e s P a r a m e + ̲ e r + ̲ a u 1 + ̲ a u 2 b e + ̲ a 1 b e t a 2 s i g m a 1 s i g m a 2 N M e a n 8 + ‑在n d a r d D e v i a + ̲ i o n 2 5 % 2 0 0 0 2 0 0 0 2 0 0 0 2 0 0 0 2 0 0 0 2 0 0 0 4 41 .0 2 . 2 0 3 8 ‑ 0 . 0 4 0 8 1 . 0 2 0 8 0 . 0 8 2 8 1 .1 2 4 3 3 4 4 . 7 2 . 2 8 8 4 0 . 0 8 7 7 0 . 0 2 0 3 0 . 0 3 2 1 1 . 0 5 0 8 1 8 8 . 4 0 . 8 2 2 0 ‑ 0 . 0 7 7 8 1 .0 0 8 7 0 . 0 4 0 4 0 . 5 8 1 8 P er c e n + ̲iI e s 5 0 % 3 5 4 . 5 1 .5 7 8 8 ‑ 0 . 0 4 0 7 1 .0 1 8 5 0 . 0 5 3 1 0 . 7 8 5 8 7 5 % 8 1 2 . 0 2 . 8 5 7 0 ‑ 0 . 0 0 3 3 2 1 . 0 3 2 1 0 . 0 7 7 1 1 . 2 8 8 0 図7 . 3: 各 パ ラ メ ー タ の 事 後 分 布 に 関 す る 統 計 量 A S 9 . 2より GENMODプロシジャ, LIFEREGプロシジャ, PHREGプ ロ シ ジ ャ に ベ イ ズ 推 定 の 参考までに, S E x p e r i m e n t a lp r o c e d u r e ) が加わったので, 機能 ( ( 例2 ) におけるデータ X,Yに関する単回帰分析モデ、ルに ついて,回帰係数(パラメータ)のベイズ推定を GENMODプロシジャで実行する例を挙げる. . 3:(例1)に関する G E N M O Dプ ロ シ ジ ャ の プ ロ グ ラ ム f s c r i p t 7 ‑ 3 .s a s J プログラム 7 プログラム ! コメント 0 1 : Ip r o cg e n m o dd a t a = M Y D A T A: iデータ r M Y D A T A J について回帰分析を行う 0 2 : I m o d eIY=X/di s t = n o r m aI: Iモデル式:Y= X 0 3 : ib a y e ss e e d = 7 7 7n m c ニ2 0 0 0: Iベイズ推定のための乱数のシード ( 7 7 7 )と 0 4 : Ir u n: Iサンプル数 ( 2 0 0 0個)を指定する 行 ! 各パラメータの事後分布に関する統計量の推定結果は以下のようになる. 円在 I y s i s B a y e s i a nA 事f 主要約 )~ラメーゴヨ N 平均 標準偏差 I n t e r c e p t 2 0 0 0 2 0 0 0 2 0 0 0 ‑ 0 . 0 4 0 1 1 . 0 1 9 9 0 . 0 4 4 0 0 . 0 4 8 1 0 . 0 1 4 0 0 . 0 1 7 7 x S c a l e 2 5 % ・ 0 . 0 8 8 1 1 . 0 1 1 5 0 . 0 3 0 9 )'i ーセント,~ 5 0 % 7 5 % ‑ 0 . 0 3 9 2 1 . 0 1 9 9 0 . 0 4 0 1 ‑ 0 . 0 1 1 9 1 . 0 2 8 1 0 . 0 5 3 1 図7 . 4 各パラメータの事後分布に関する統計量 ‑ 1 0 8 ‑

110.

8 .おわりに 本稿では,ベイズ推定を行うための 5つの方法を紹介した.本稿で薦める方法は④と⑤である. ① ② ③ ④ ⑤ WinBUGSで解析する方法 SASと WinBUGSで解析する方法 Rと WinBUGS (R2WinBUGS) で解析する方法 SASとR2WinBUGSを組み合わせた方法で解析する方法 SASの MCMCプロシジャで解析する場合の手順を紹介する方法 SAS9 . 2が使用出来る環境が整っていない場合は, MCMCを実行するためのプロシジャが用意されていない ため,方法④を適用するのが良いと考えるが, I 環境整備の労力がかかる J I モデ、ル式を定義したファイル と SASマクロの 2種類を用意する必要がある」という意味で若干面倒で ある. しかし, SAS9 . 2が使用出来 x p e r i m e n t a lp r o c e d u r eではあるが,方法⑤である MCMCプロシジャを用いて る環境が整っている場合は, E 簡単にパラメータの事後分布の推定を行えることが分かつた.バリデーションの観点から,方法④と方法⑤ を併用するのも有用である.また,本稿では頁数の関係、でほとんど、扱えなかったが,事後分布からのサンプ リングが上手く行えているかをチェックする「収束判定 Jについても, Wi nBUGS と同様に MCMCプロシ ジャの実行結果からチェックすることが出来る.さらに, GENMODプロシジャ, LIFEREGプロシジャ, PHREGプロシジャ等で、各種モテールに対するベイズ推定を簡単に行うことが出来ることも分かつた. MCMC プロシジャ, GENMODプロシジャ, LIFEREGプロシジャ, PHREGプロシジャの今後の発展と,これらに 関する文献の充実に期待したい. 謝辞 同僚の高浪洋平さんには、 SASのプログラムの記述方法について、貴重な助言を幾度となく頂戴した。干 の場をお借りしてお礼申し上げあげる。 連絡先 F u n a oN o b u o @ t a k e d a . c o . j p ・ ・ 参考文献 舟尾暢男,高浪洋平 ( 2 0 0 5 ) I データ解析環境 WR J l (工学社) J 久保拓弥「生態学のデータ解析 J h t t p : / / h o s h o .e e s .h o k u d a i .a c .jp/~kubo/ce/FrontPage. h t m l R2Wi nBUGS用のラッパ一関数: h t t p : / / h o s h o . e e s . h o k u d a i . a c . j p /、k u b o / c e /r/R 2官B w r a p p e r . R 渡部洋 ( 1 9 9 9 ) I ベイズ統計学入門(福村出版) J 丹後俊郎 ( 2 0 0 0 ) I 統計モデル入門(朝倉書底) J 古谷知之 ( 2 0 0 8 ) I ベイズ統計データ分析(朝倉書底) J T h eBUGSP r o j e c tI W inBUGSU s e rM a n u a l( P D F )J m r c ‑ b s u . c a m . a c . u ν b u g s / w i n b u g s / m a n u a l I 4 . p d f h t t p : / / w附 . SAS/STAT(R)9 . 2U s e r ' sG u i d eI T h eMCMCP r o c e d u r e( E x p e r i m e n t a l ) J h t t p : / / s u p p o r t .s a s . c o m / d o c u m e n t a t i o n / c d l / e n / s t a t u g / 5 9 6 5 4 / H T M L / d e f a u l t / m c m c ̲ t o c . h t m D a v i d1 .S p i e g e l h a l t e r( 2 0 0 4 ) I B a y e s i a nA p p r o a c h e st oC l i n i c a lT r i a l sa n dH e a l t h ‑ C a r eE v a l u a t i o n( W i l e y )J SASI n s t i t u t eI n c .( 2 0 0 6 ) l y s i si nSAS/STATS o丘w a r e J I P r e l i m i n a r yC a p a b i l i t i e sf o rB a y e s i a nAna h t t p : / / s u p p o r t . s a s . c o m / r n d / a p p / p a p e r s / b a y e s i a n . p d f M i c h a e lK .S m i t h,e t .a . l( 2 0 0 7 ) I W inBU G S i o :ASASM a c r of o rt h eR e m o t eE x e c u t i o nofWinBUGS ( 1 0町 田l a r e )J o fS t a t i s t i c a lS o合w v 2 3! i09/paper h t t p : / / w w w .i s t a t s o f t .o r耳/ ・ ・ ・ ・ ・ ・ ・ ・ ‑ 1 0 9 ‑

111.

【参考 1 】関数・コマンド一覧 表A . l:確率分布に関する関数一覧 確率分布名 WinBUGSの関数 MCMCプロシジャの関数 dbern( p ) ベルヌーイ分布 bi nary( p ) dbin(p,n ) ) b i n o m i a [( n,p 一項分布 dcat( p[ ] ) 多項分布(ァーブル分布) dnegbin(p,r ) ) negbi n( p, r 負のー項分布 dpoi s( [a m b d a ) poi s s o n([ a m b d a ) ポアソン分布 dbeta( a,b ) ベータ分布 ) beta( a,b 2分布 dchi s q r( k ) c hi s q( k ) ddexp( m u,t a u ) sca[ e = t a u ) [ a p[ ace( m u, i 一重指数分布 dexp( [a m b d a ) expon(isca[e=[ambda) 指数分布 dgamma( a,b ) ガンマ分布 s c a[ e = b ) gamma( a, i d[ n o r m( m u,t a u ) 対数正規分布 r e c = t a u ) [ o g n o r m a [( m u,p d[ogis(a,b ) [ o gi s ti c( a,b ) ロジスァイツク分布 dnorm( m u,1 / si g m a2) n o r m a[ ( m u,s d = si g m a ) 正規分布 d t( m u,tau,k ) t(mu,prec=tau,V ) t分布 一様分布 duni f( a,b ) uniform(a,b ) x 絶対値 c o s( x ) exp( x ) [ o g( x ) ロジット関数: [ n( x /( 1 ‑ x )) 最大値 平均値 最小値 表 A.2:数学関数一覧 WinBUGSの関数 a b s( x ) c o s( x ) exp( x ) [ o g( x ) [ o g i t( x ) max( x,y ) mean( .. . ) min(x,y ) 標準正規分布の累積分布関数 p h i( x ) 機能 y 累乗 x si n( x ) 丸め関数 標準偏差 定義関数:X以上ならば 1, それ以外ならば O 総和 pow( x,y ) si n( x ) r o u n d( x ) s d( x ) SASの関数等 abs( x ) c o s( x ) exp( x ) [ o g( x ) max( x,y ) mean( ... ) mi n( x, y ) probnorm( x ), cdf( 'norma[ ', x, 0,1 ) x**y si n( x ) round( x ) std( x ) s t e p( x ) sum( x ) sum( x ) 表 A.3:W inBUGS用のコマンド一覧 機能 WinBUGS用のコマンド di s p[ a y( '[ o g ' ) ログウインドウを表示する check('モデルファイルのパス, ) モデルファイルを WinBUGSにチェックしてもらう データファイルを読み込む data('データファイルのパス) compi[ e( 1 ) chain 1のモデルをコンパイルする i ni t s( 1,'データファイルのパス, ) chain 1の初期値を設定する WinBUGS[=1¥フメータの初期値を設定してもらう g e n .i ni t s0 事後分布からのサンプ 1 )ング数を 2 000回とする u p d a t e ( 2 0 0 0 ) Ge[man‑Rubin diagonisticsの診断を行う g r( 1¥フメータ名) 最初の 1 0 0 0田を棄てる ( b u r n ‑i n ) beg( 10 0 1 ) set( x x x ) xxxをパフメータに設定する(例 t h e t a ) 金パフメータの事後分布の統計量を表示する s t a t s( * ) (r * J にパラメータの名前を指定することも可) 全パフメータの事後分布の密度分布を表示する d e n si t y( * ) (r * J にパラメータの名前を指定することも可) save('結果のパス(.t xt / .o d c ), ) 計算結果をファイル(ー t xt / .o d c )[=保存する WinBUGSを終了する quitO ‑ 1 1 0 ‑

112.
[beta]
表 A.4: f
R
2
W
B
w
r
a
p
p
e
r
.
R
J のコマンド一覧
機能
f
R
2
W
B
w
r
a
p
p
e
r
.
R
J のコマンド
I
i
b
r
a
r
y
(
"
R
2
W
i
n
B
U
G
S
"
R
2
W
i
n
B
U
G
Sパッケージを呼び出す
s
e
t
w
d
(
'
C
:
/
t
e
m
p
/
'
)
作業ディレクトリを f
C
:
/
t
e
m
p
Jf
:
:移動する
s
o
u
r
c
e
(
'R
2
W
B
w
r
a
p
p
e
r
.R
'
)
f
R
2
W
B
w
r
a
p
p
e
r
.
R
J を読み込む
c
l
e
a
r
.d
a
t
a
.paramO
データ,パフメータを初期化する
s
e
t
.
d
a
t
a
(
"
y
",d
$
y
)
変数 f
y
Jf
:
:,データフレーム dの変数 yの中身を代入する
s
e
t
.
d
a
t
a
(
"
n
",n
r
o
w
(
d
)
)
変数 f
n
Jf
:
:,データフレーム dの行数を代入する
s
a
v
e
=
F
)
s
e
t
.p
a
r
a
m(
市u
", N
A
パフメータ f
m
u
J の初期値を設定せず,結果も表示しない
s
e
t
.p
a
r
a
m(
、e
t
a
", c(
0,0
),s
a
v
e
=T
)
パフメータ f
b
e
t
a
J の初期値を (
0,
0
)とし,結果を表示する
p
o
s
t
.b
u
g
sく‑ c
a
l
l
.b
u
g
s
(
W
i
n
B
U
G
Sを呼び出して, W
i
n
B
U
G
Sでベイズ推定を行う
f
il
e= '
m
o
d
e
I
3
‑
1
.t
x
t
'
‑モデル式 f
m
o
d
e
I
3
‑
1
.t
x
t
J についてベイズ推定を行う
d
e
b
u
g
=
FA
L
S
E,
‑実行後, W
i
n
B
U
G
Sを閉じる(デバッグを行わない)
n
.i
t
e
r =2
0
0
0,
•b
u
r
n
‑
i
nも含めて 2
0
0
0個のサンプリングを行う
n
.
b
u
r
n
i
n= 1
0
0
0
‑最初の 1
0
0
0個を b
u
r
n
‑
i
nとして棄てる
n
.t
h
i
nニ 2)
•1
0
0
1個目からは 2個飛ばしで採用する
p
o
s
t
.I
i
s
tく‑ t
o
.I
i
s
t(
p
o
s
t
.b
u
g
s
)
ベイズ推定の結果をリストとして保存する
r
e
s
u
l
tく‑ t
r
a
n
s
f
o
r
m
(
p
o
s
t
.
b
u
g
s
$
s
u
m
m
a
r
y,
v
a
r二 r
o
w
n
a
m
e
s
(
p
o
s
t
.
b
u
g
s
$
s
u
m
m
a
r
y
)
)
‑ベイズ推定した各パラメータの要約統計量を変数
f
r
e
s
u
l
t
J に格納する
w
r
i
t
e
.c
s
v
(
r
e
s
u
l
t,
f
il
e
=
'C
:
/
t
e
m
p
/
s
u
m
m
a
r
y
.c
s
v
',
‑各パラメータの要約統計量 f
r
e
s
u
l
t
Jを f
s
u
m
m
a
r
y
.c
s
v
Jに
q
u
o
t
e
=
F
A
L
S
E,
格納する
r
o
w
.n
a
m
e
s
=
F
A
L
S
E
)
a
p
e
r
=
'a
4
'
)
p
d
f
(
'
C
:
/
t
e
m
p
/
o
u
t
p
u
t
.
p
d
f
',p
P
D
F ファイル f
o
u
t
p
u
t
.p
d
f
J にベイズ推定した各パラメータ
pI
o
t(
p
o
s
t
.I
i
s
t[
.,
,
] s
m
o
o
t
h
=
F
)
の事後分布の図を出力する
d
e
v
.o
f
f0
s
i
n
k
(
f
il
e
=
'
C
:
/
t
e
m
p
/
o
u
t
p
u
t
.t
x
t
'
)
テキストファイル f
o
u
t
p
u
t
.t
x
t
J にベイズ推定した
p
r
i
n
t
(
p
o
s
t
.
b
u
g
s,d
i
g
i
t
s
.
s
u
m
m
a
r
y
ニ3
)
各パラメータの事後分布の要約統計量を出力する
sinkO

【参考 2
】W
i
n
B
U
G
Sと R
2
W
i
n
B
U
G
Sのセットアップ
WinBUGS と R のインストール方法と, R の f
R2WinBUGSJ パッケージをインストールする方法を以下に
示す.

nBUGSのホームページから下記ファイルをダウンロードし WinBU
GSl4.exeをインストールする.
(
1
) Wi
.WinBUGSI4.exe
Vi
n
BじG
S
l
4
.
e
x
e
h
t
t
p
:
/
/
w
w
w
.
m
r
c
‑
b
s
u
.
c
a
m
.
a
c
.
u
k
/
b
u
g
s
/
w
i
n
b
u
g
s
/l
・キー f
W
inBUGS1
4
̲
i
m
m
o
r
t
a
l
i
t
y
̲k
e
y
.
t
x
t
J
http ・ //www.m_r(;~bsu.cam.ac.uk/bugs/winbugs/ lV inBUGSI4_immortalitv_k 巴 V. t
x
t

・ノ号ッチ (
v
ぽ s
i
o
n1
.4
.
3
) fWinBUGS14
一c
u
m
u
l
a
t
i
v
e
̲
patch̲No3̲06̲08̲07̲RELEASE.t
x
t
J
/
/
¥
V
¥
V
¥
V.
m
r
c
‑
b
s
u
.c
a
m
.a
c
.u
k
/
b
u
g
s
/¥
Vi
n
b
u
g
s
/
W
i
n
B
U
G
S
1
4
̲
c
u
m
u
l
a
t
i
v
e
̲
p
a
t
c
hN
o
30
60
80
7R
E
L
E
A
S
E
.t
x
t
h
t
t
p・

v
e
r
s
i
o
n1
.4
.
3
) を下記フォルダに保存する.
(
2
) パッチ (
くC
:
¥P
r
o
g
r
a
mF
i
l
e
s
¥Wi
nBUGSI4>
(
3
) WinBUGSを起動する. V
i
s
t
aの場合は,右クリックから「管理者権限として実行 J.
くC
:¥ProgramF
i
l
e
s
¥Wi
nBUGS1
4)IWi
nBUGS1
4
.
e
x
e
>
(
4
) [
F
i
l
e
]→ [
O
p
e
n
]からパッチ (
v
e
r
s
i
o
n1
.4
.
3
) を聞き, [
T
o
o
I
s
]→ [
D
e
c
o
d
e
]を選択し,
[
D
e
c
o
d
eALL]を選択する.同様に,キーについてもを行う.
(
5
) 下記フォルダに f
K
e
y
.
o
c
f
J が入っているか確認し,インストール完了.
くC
:¥ProgramFiles¥WinB UGS14¥BU l!s~ode>
(
6
) R (
v
e
r
s
i
o
n2
.
7
.
2
) を以下のホームページからダウンロードし,インストールする.
h1
:
̲
t
;p
:
/
/
c
r
a
n
.
m
d
.t
s
u
k
u
b
a
.a
c
.j
p
/
b
i
n
/
w
i
n
d
o
w
s
/
b
a
s巴/
o
l
d
/
2
.
7
.2
/
R
‑
2
.7
.2
‑
w
i
n
3
2
.
e
x
e
インストール手順は,例えば以下のホームページが参考になる.
http://ww~occn.zaq.ne. j
p
/
c
u
h
x
r
8
0
2
/
R一i
n
t
r
o一O
O
.
p
d
f

‑
1
1
1
‑

113.
[beta]
(
7
) Rを起動し以下を実行する (
V
i
s
t
aの場合は右クリックから「管理者権限として実行」で起動) .
>i
n
s
t
a
ll
.p
a
c
k
a
g
e
s
(喰 2WinBUGS")
>l
i
b
r
a
r
y
(
R2WinBUGS)
(
8
) 北海道大学の久保拓弥先生が作成された, R2Wi
nBUGS用のラッパ一関数をダウンロードする.
1
1
1t
p
:
/
/
h
o
s
h
o
.e
e
s
.h
o
k
u
d
a
i
.a
c
.jpFkubo/ce/r/R
2
I
V
B
w
r
a
p
p
er
.R
(
9
) 以下のファイルを I
C
:
¥P
rogramF
i
l
e
s
¥WinBUGSI4J に格納する.

d
a
t
a
3
‑l
.t
x
t, d
a
t
a
3
‑
2
.
t
x
t, d
a
t
a
3
‑
3
.
t
x
t, d
a
t
a
3‑
4.
t
x
t, i
n
it
3
・
l
.t
x
t, i
n
i
t
3・
2
.
t
x
t,m
o
d
e
I
3
‑l
.t
x
t,model3・
2
.
t
x
t,
s
c
r
i
p
t
3
‑l
.t
x
t,s
c
r
i
pt
3
・2
.
t
x
t,s
c
r
i
p
t
3・
3
.
t
x
t
)以下のファイノレを I
C
:
¥t
e
m
p
J に格納する.
(
10
R2WBwrapper.R,mode13・
l
.
tx
t,m
o
d
e
I
3
‑
2
.
t
x
t

【参考 3
】W
i
n
B
U
G
Sでベイズ推定を行う手順
1
2
.本稿の解説の流れとベイズ推定を行う 2つの例Jで紹介した(例 1
)について, WinBUGSを用いて解析を
行う手順を紹介する.
(
0
) Wi
nBUGSを起動し, [
H
e
l
p
]→ [
E
x
a
m
p
l
e
sVolI]または [
E
x
a
m
p
l
e
sVolII]を選択すると,様々な例が紹介さ
れているので,参考にされたい.

w
]を選択するとエディタが開くので,モデル式(例えば「プログラ
(
1
) WinBUGSを起動し, [
F
i
l
e
]→[Ne
ム3
.
1:(
例 1
)に関する Wi
nBUGSのモデル式,データ,初期値」の内容)を記述する.
(
2
) [
M
o
d
e
l
]→ [
S
p
e
c
i
f
i
c
a
t
i
o
n
.
.
.]を選択すると 1
S
p
e
c
i
f
i
c
a
t
i
o
nTooU のウインドウが表示される.もし,エラ
ーメッセージを確認したい場合は [
I
n
f
o
]→ [OpenLog]を選択してログウインドウを表示する.

l
閤
l
'
.
'
1
!
r
u
l
l
M
!
i
t
l

一一

古

副 劃 E釘 百 』 ・ 1
・圃圃圃

t

#m
o
d
e
l
m
o
d
e
l
{
t
h
e
t
a‑d
b
e
t
a
(
1,1
)
x ‑d
b
i
n
(
t
h
e
t
a,n
)

血一刻﹂

曹三町田町四国111<

i
b
u
t
e
s,
gf
o直面下 I
Q
f
e
r
e
n
c
e Qpt
i
o
n
s.
'Q
o
o
d
l
e M
a
"T
e
;
!
̲
t
.I
!
{
i
n
d
側 帥
.
島m

﹄

[
i
1
e1
0
0
l
s 臼t
i酔

S
e
y
eS
t
a
t
e

}

S!
l
̲
e
d
̲

d
a
t
a
i
I
s
t
(
x
=
1
1,n
=
2
0
)
帯

S
g
i
p
t

i
n
t
t

帯

i
I
s
t
(
t
h
e
t
a
=
O.
2
)

ラ

ょj

(
3
) モテゃル式全体,又は文字列 1
modeU のみをマウスで選択して [
C
h
e
c
km
o
d
e
l
]をクリックし, Wi
nBUGS
にモテ守ル式をチェックしてもらう.

l
持l
.
:
l
T
i
1
:
t
1t
閑
Zー
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

[
i
l
e1
0
0
l
sf
d
i
t 且t
t
r
i
b
u
t
e
s,
gf
oM
o
d
e
lI
Q
f
e
r
e
n
c
e"
.
Q
pt
i
o
n
s.Q
o
o
d
l
e M
a
且 T
e
;
!
̲
t.
i
1
i
i
n
d
o
w 出I
p
三i

斗

c
o
m
p
i

l
o
Jo
dI
n
l
t
:

n
u
m
o
f向 n
s

I
f a
i
n

‑
1
1
2・

吋

r

r目

114.

( 4 ) チェックした結果,問題がなければ, ( 3 )と同様の方法で d a t a ]をクリックする. I # d a t a J の部分をマウスで選択して [ l o a d ( 5 ) [ c o m p i l e ]をクリックして命令をコンパイルする. ( 6 ) コンパイルした結果,問題がなければ,初期値を設定する場合は, ( 3 )と同様の方法で, I # i n i t J の部 分をマウスで選択して [ l o a di n i t ] をクリックする.初期値設定を WinBUGSに任せる場合は, [ g e ni n i回 ] をクリックする(事前分布からの乱数が初期値に使われる) . ( 7 ) [ I n f e r e n c e ]→ [ S a m p l e s . . . ]をクリックして ISampleMonitorToolJのウインドウを表示する. ( 8 ) ISampleMonitorT o o l Jの [ n o d e ] にパラメータを指定して [ s e t ] をクリックする.パラメータが複数あ る場合は,パラメータ数だけ手順を繰り返す. l 長 ・ 降 初 司 直1 間前市..1TIiI̲圃園駅ム 三J [ 1t口 [ 1 percentiles n o d ea l T ヨ 出 向 b e g J1"一副而而o thin 1 1 " 一 」ュj一二三J ̲ t r 」 ニ ( 9 ) パラメータの指定が完了したら, [Model]→ [ U p d a t e . . . ] を選択すると IUpdateToolJのウインドウが表 示されるので,各種設定を行った後,事後分布からのサンプリングを行う. ・ │ 長 : l ! J ' ! I l . m 司 r . m̲ ̲E 子 三J u p d 鵡 画 百 一 一 同fresh 1100 u p d a t 三Jthin r roverrelax r o ‑ 一 一 江田t i o n radapting ( 1 0 )結果を確認する場合は I nodeJ で確認したいパラメータを選択してから, ISampleMonitorToolJの ウインドウから I d e n s iザ(事後分布の密度関数) J I s t a t s (事後分布の統計量) J などを表示する. I nodeJ に 1 *J を入力すれば,全パラメータの結果が表示される. [ 1to[ 1 percentiles c h a i n s w し 1 b e g 1 ヨ a t a 'h川 lt n u n E ︐ n u 持 寺 田 T : ' m 1r . . w~ rmtr糟 開E 圃 圃 圃 園 田 園 ~\五J e n d 而而o thin j1一 I~o I r . : . . . : . :.~.~.L.:]1 I I I 時 」 とJ I ~坐l 旦担ほo I 出 c 1e a r t r a c e h i s t o r y c o d a d e n s i t y c o r ‑ 1 1 3 ‑

115.
[beta]
【参考 4】S
A
Sと R
2
W
i
n
B
U
G
S を組み合わせてベイズ推定を行う S
A
Sマクロ
略
「B
U
G
S
J
0
1
: !材料材料材料材料材料****材料材料本神本材料材料*材料;
0
2
:1
*
一一 Rの実行ファイルのパス;
0
3
: 1唱l
e
tR
e
x
e
p
a
t
h
=
'
C
:半P
r
o
g
r
a
mFi
I
e
s平R
半R
‑
2
.
7
.
2半b
i
n
半R
.e
x
e
'
0
4
:i****料**料****料*料*******料*料**紳*柿*****材料柿;
0
5・
!%
m
a
c
r
oB
U
G
S(
v
a
ri
a
bI
e
0
6
:!
p
a
r
a
m
e
t
e
r 二,
0
7
:!
d
a
t
a
s
e
t
=M
Y
D
A
T
A,
0
8
:[
d
e
b
a
g
=F
A
L
S
E,
0
9
:i
w
o
r
d
k
i
n
g
d
i
r二, C
:/
t
e
m
p
,
/,
1
0
:i
m
o
d
eI
p
a
t
h
'
m
o
d
e1
.t
x
t
'1
1
:i
d
a
t
a
p
a
t
h ='
C
:/
t
e
m
p
/d
a
t
a
.c
s
v
'1
2
:!
p
d
f
p
a
t
h
="
C
:/
t
e
m
p
/
o
u
t
p
ut
.p
df
"1
3
:i
o
u
t
t
e
x
t
p
a
t
hニ "
C
:
/
t
e
m
p
/
o
u
t
p
u
t
.t
xt
"
.
1
4
:!
p
r
o
g
r
a
m
p
a
t
h="
C
:
/
t
e
m
p
/
b
u
g
s
p
r
o
g
r
a
m
.R
"
)
o
p
ti
o
n
sn
o
x
w
ai
tx
s
y
n
c
1
5
:I
プログラム

i
行

二

14
14l 唱

︐

︐
l
)
)
)
︐
︐
︐
︐
︐
︐
︐
︐

︐

n
M・
一
一
0U
F
b
'

)

a

‑
1
1
4・

︐.︐
]
l ︐ ︐︐
:
+︐
︐

E

守

也

‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑
6
789
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6一
l内正内ノ﹄内ノ﹄内ノ﹄内tntnL内ノ﹄内ノ﹄内tnJnJqdqdnJnJnJqdnJnJauマauマauマauマauマauマauマ一

︽

nLH︑sJ
;[')
VA︐︑︑︐︐
exH︑J
nuvAHH
qan
︐︐ ︐ ︐
︐
︐︐
︐
﹂ H
p'1
︐
二
'
q
L
ρ
u
'‑P;w
﹁
Mw・1lau
AYCUHH
uvuw
sqd︑J‑
c︐﹁L'hH
二円リvd'Fb+L
v
︐︑Ja
一
s
.
m川・ト'uy'=nuF
m
h
u
本
Aunt''na
.︐﹁}L・'H11J'fhVE
・︐Xn・‑hE
ATH4E目M・'nu
EnHHVAW'
+LHIIx‑‑f︑ηJ'・r
a︑JmrL‑nHO
nvTl︑J'︐︑JavJgb
︑J00
=Hruya'nJn
+LAU︑J‑︑Javdhunun‑'=
aaqLρtqdnvenu︑J・'VJ/¥
Aue/'a//・'Aunusn﹁
hH︑J+目︑︑J+LHoat‑gbH︑J.︐喧
=xavden=u︑JF﹁町
e'xdys=g=hu'二Mma
ll‑︐・V
‑puyHρu・'HU・凋斗﹂H︑JHucu
﹂Hrt︑JHrt︑MUVLUnH+Lau+LHeu‑‑'
fwt・'hNMh(ane‑‑s'0・・0
L
巴Sf︑﹂口nO二DLnS
刊w
宇
+L.︐︑ja‑‑+LW
u'nvMgbMgb+L'srhμrm+L+L一w・︐
HnkaH︑J;nf︑nSHE‑Hurt︑巴sa‑‑‑‑
︑j・4L︑J‑aueeanu‑LU+LnuFnuFσbLnH
..‑Lra・rH'l+L1lnuFLULn‑sa'ふLiE巴+LH
+ L h H ﹁ 巴 A u e e ︑ J r L s f ︑ 一 一 ' ・ + L n ・ l P 1﹂
XAura‑
巴+LlnUFoal‑+Lf︑ra﹁+L1JIlau‑‑'eonuFLn
dp(bemo
弔 ox‑‑p︐.︐︐t'tft
apgavamaotoe‑aIlnuOM﹁LtsSAua
+Lmnrslar‑‑xIl+L・iGenu+L・+LugbenvnV
aa‑‑WC﹁﹁azIeSIrt︑*﹂ロハULnsouroO+L
rLKnD‑aanuF・・+L‑‑enJ‑onL一ふL・I・'oaLU一MX
oagbAUM"Auvnv‑tl︐ltlS﹁L/¥m/¥allH・oe
ニ
nuF‑n二ふLne+L
=o﹁内49uoaoagueruyoa
aroDHer‑f︑+LnEnavJS+LZl+L︑J巴S・'一14+L
tpw'rccair‑‑pyg二rSAusf︑zlo‑‑lu
aaa(dM(U巴・lpof‑‑PHfo
d・'rLe‑‑一・・l'U・llb巴tlapsis‑()‑‑a
a;AUCノ¥ノ¥ノ¥rrLirt︑a・Il‑‑HrLof︑trk﹂H‑M
ta一wraav+L・I‑+Lf︑+L‑LMHnbnt
raila+Luxy巴﹁vressinsslovn・lnanAU
llaeoxvJIloeooDAUIle‑‑﹁・lnvea
peuaSSAuxycSIS‑pppPAuspsepp
VAm川nHMMHHHHHjHHMMHHHHHMMMVAnuou︐一
a‑eHeft‑
巳
.︐nil+L+L+L+L+L+L+Lト﹂+L+L+L+L+L+﹂+﹂+L+L+L+L+﹂'DHAUOAU一
cea‑‑uuuuuuu
川 uuuuuuuuuuuuapnE
o
間
一
vn
l‑
Hd
Uf
‑p
‑p
‑p
一pppppppppppppppppmwHH
nv﹁干IAHUrxxxw百一
.•

以上

116.

SASにおける微分方程式モデルのあてはめ 0 森 由 美 子 l ・田崎武信 2 住商情報システム(株) データサイエンス部ビジネスパートナー 1 2塩野義製薬(株) 解析センター E s t i m a t i o no f p a r a m e t e r si nd i f f e r e n t i a le q u a t i o nm o d e l su s i n gSAS TakenobuT a s a k i2 YumikoMori1 , 1D a t aS c i e n c eD i v .B u s i n e s sP a r t n e rSumishoComputerS y s t e m sC o r p . 2 B i o s t a t i s t i c sDep , . tS h i o n o g i& C o ., L td . 要旨 薬物速度論モデルは連立微分方程式を出発点とする。そのモデルに含まれるパラメタを推定するための 独立した SASプログラムを開発した。 NL 町 や MIXEDなどの限られた SASプロシジャでは d a t aステッ プの一部のステイトメントを利用することができる。この属性を利用することにより NL町プロ、ンジャ にルンゲ・クッタ法を組み入れて連立微分方程式モテ、/レをあてはめる SASプログラムを開発した。これ らのプログラムを紹介する。 キーワード:連立微分方程式ルンゲ・クッタ法 ブートストラップ法 1.はじめに 薬物動態解析ソフトウェアの事実標準になっている W i n ‑ N o n l i n lこは、微分方程式の解析解でなく、そ の微分方程式そのもののモデルをあてはめてパラメタを推定する機能が備わっている。実際には、前身 のNONL 町6 9やNONL別 74のときから備わっていた。しかし、 SASにはそのような機能がない。モデ ル を利用する薬物動態解析の出発点は微分方程式である。このことが今回のSASプログラム開発の動機で ある。 連立微分方程式の数値解をルンゲ・クッタ法で求め、その方程式に含まれるパラメタをシンプレック ス法で推定し、さらにパラメタ推定値の標準誤差をブートストラップ法で推定するための独立した SAS プログラムを開発した。このプログラムの構成と全体のマクロ・プログラムを 3節で紹介する。 限られた SAS プロ、ンジャ、具体的に W i n ‑ N o n l i n のカウンターパートと考えられる NL町、そして NLMIXED、GENMOD、PHREG、CALISのプロシジャでは、 d a t aステップの一部のステイトメントを利 用できる。この利点を活用することで、 NL 町プロ、ンジャを用いて微分方程式モデ、ルをあてはめるため の SASプログラムも開発した。これを 4節で紹介する。 ‑ 1 1 5 ‑

117.

2 . 例証のためのモデル 開発した SASプログラムの動作を例証するために、本稿では、以下の経口 1コンパートメントモデ、ル (パラメタが 2個のモデ、ル)を一貫して利用する。 dZ , ( t ) . . . . . ‑ 2ー =k Z1 ( t )‑k p J Z 2( t ) n h a t 体循環血中の薬物量変化 初期条件 :Z I ( O )=D ( 投与量)、 Z 2 ( 0 )=0 ab 1 パラメタ lr 投与部位での薬物量変化 1 ( ︐ ︑ dZ( t ) 古一一 k Z( t ) ( 2 ) :kab:一次吸収速度定数、ん:一次消失速度定数 なお、モデルにあてはめる観測値は薬物量ではなく血液中薬物濃度であることが多い。その場合、分布 容積のパラメタを導入し、薬物量変化の連立微分方程式を血液中薬物濃度変化の微分方程式へ変形する。 2 )の両辺を分布容積九(正確にはバイオアベイラピリティ F を加えた九 / F) で割れば、 具体的に、 ( dZ2( t ) / V d ka1 d t 九 t )‑keJZ2( t )/ Vd 一一一一‑4=」 ιZI( となる。 ロ ム A Z 2 ( t ) / V d を血液中の薬物濃度 C 2 ( t )とおいて、 dC t ) ka1 2( ι(t) t )一 一 一 一 ='~:b Z I( 九 d t 九 A ( 3 ) 口 ム を得る。これはパラメタが k k 九 の 3個のモデルになる。 a b, e l, 3 . 独立した SASプログラム 3 .1.微分方程式の数値解を求めるためのルンゲ・クッタ法 連立常微分方程式の数値解を求めるために古典的な 4次のルンゲ・クッタ法を採用した。いま、 m 個 の微分方産式を , d d t " ' i=1 m で 、 ぞ L て布斯↑直を Y m ( t ) ), ; ( t' ‑ ‑ ‑ ; ‑Y Y 1 ( t ) ' Y 2 ( t )" … ,, i的 =J , . . , m で表すと、微分方程式の数値解は以下の手順で与えられる。 Y i ( t YjQ' i=1 O)= t n + 1 = t n +h や +2k21+2k31叫 t J t n + J=九 ( Y 1( 1 ヤ 2k2 2k23 k24) t J t n + 1 )二 れ ( ん( 2 1+ + + ん(山 ・ ‑ 1 l6

118.
[beta]
kl=f
r(
t
n
'
Y
I(
t
J
'
Y
2(
t
,
J…'Ym(
t
J)
k2
2(
t
n
'
Y
I(
t
n
)
'
Y
2(
t
n
)…'
Y
m(
t
J)
1=f
t
,, '
Y
I
(
t
"
)
'
Y
2
(
tn
)
…,
Ym(
t
n
)
)
km
l=ん (
h̲
h
kl
t
n+
‑
;
:
:
‑
'
Y
I
(
t
,, )
+
‑
;
:
:
‑
k
2
,
t
(
+
‑
;
:
:
‑
k
Ym(
t
n
)
+
‑
;
:
:
‑
k
l
pY
2=fr(
2
1…,
m
l)
2
'
‑
1
1'/
<'")
1
'
2
,

h̲
h
k2
2
(
t
"+
‑
;
:
:
‑
'
Y
1
(
t
,, )
+
‑
;
:
:
‑
k
Y
2
(
t
n
)
+
‑
;
:
:
‑
k
・
,
‑Y
m
(
t
n
)
+
‑
;
:
:
‑
k
2=f
1'
2
1.
m
l)
2
.
:
.
'
‑
n
/
2
11 1 ,./

h̲
.,
h
km
t
"+ー '
Y
1(
t
J+
‑
;
:
:
‑
k
Y
2
(
t
,
J
‑
;
:
:
‑
k
",
Ym(
t
n
)+士
2=ん (
1'
2
1‑
m
l)
2
"
1
'/2
,
"
1+
'
2
乙k
h̲
h
k
1
3=fr(
tn+
‑
;
:
:
‑
'
Y
1
(
tn
)+
‑
;
:
:
‑
k
'
Y
2
(
t,
,
)
+
‑
;
:
:
‑
k2…,
Ym(
tn
)+士
I
2
m
2)
2
'
‑
1
Z
'
/
Z
""
1 • 2 2
乙k
h̲
.,
h
k2
‑
;
:
:
‑
'
Y
I
(
t
,
,
)+
‑
;
:
:
‑
k
'
Y
2
(
t
,
,
)
+
‑
;
:
:
‑
k2…,
Ym,
t
(J+τ
3=f2(t"+
I
2
m
2)
2
"
1
2
'
/
2,
"
1 ' 2 2
乙k

h̲
h
km
t
n+一 '
Y
1(
t,
,
)+‑
;
:
:
‑
k
,
y
(
t
n
)+
‑
;
:
:
‑
k
'
, Ym(
t
n
)+
.
;
:
.
k
3=ん (
I
2
2
2"
m
2)
2
.
.
.
.
.
'
"
.
2
ヲ

k1
r(tn+h'Y1(
t
n
)+hk
Y
2(
t,
,
)+hk
Y
m
(
t
4= f
1
3'
2
3…,
n)+hk
m
3)
k2
t
n+h
'
Y
1(
t
n
)+hk
Y
2
,
t
(J+hk
Ym(
t
n)+hk
4=五(
1
3'
2
3…,
m
3)
km
t
n+h'Y1(
t
n)+hk
Y
2(
t
n)+hk
Ym (
t
J+hkm3)
4=fm(
I
3'
2
3…,

,

上記アルゴリズムによる kab= 0
.
3,
ke = 0
.
1の経口 lコンパートメントモデルの数値解と解析解を図表 l
に示す。左図が数値解、右図が解析解であり、黒線が投与部位、赤線が体循環血中の薬物量変化である。
a
n
a
l
y
t
i
c
a
l solutlon
y
l
1
0,

n
四 e
r
j
C
e
l
l solutiOf
1
f
y
l
1
01

8
'

65

o
.
0

1
0

2
0

,

f

3
0

4
0

5
0

01.̲.̲̲̲̲̲..̲一一→
o
1
0

F

2
0

30

4
0

50

y
l =1
0 ・ ("p((‑0.3)・,))
, ・
・
y
2= 1
5 ・
(
e
x
p({‑Q 1
)*
x
)‑exp(
{
‑
Q
.3
)吋))
図表 l経口 lコンパートメントモデ、ル (k
=
0
.
3
,ん=
0
.
1
)
の数値解(左)と解析解(右)
ab
dydx(1
)=-Q• 3. y
!
2
)竺 (
0
.
3 yl)ー (
0
.
1y
2
)
dyd (

,

‑
1
1
7・

119.

3ユパラメタを推定するためのシンプレックス法 モデルをあてはめてパラメタを推定するために最小二乗法あるいは重み付き最小二乗法、そして残差 あるいは重み付き残差の平方和の最ノト化にはシンプレックス法を採用した。シンプレックス法について は 、 例えぱ l h 叫 t t t ω 配 n‑泊味 O耐 k i ロ 2 . s 引1 芭飢 u 山叩 nl 1 1 a 一U.UωC.I 凶 0 ν 礼 ヲ 1 / 凡 LaTeX/ I 似 s 引 i 叩 l 1 口 1111 口 0l 回 e 以X.O 吋d 「を参照されたい。 3 . 3 . パラメタ推定値の標準誤差を推定するためのブートストラップ法 推定したパラメタの標準誤差の推定ではブートストラップ法を採用した。データがパラメタ数に比し て小さいことが多く漸近正規性に依らないほうが望ましいであろうと考えたからである(矢船・石黒, 2004)。 そ の 手! J 慎は以下の通りである (Davison & 日 出l e y ,1997)。 な お 、 推 定 し た い パ ラ メ タ を P s, s=l . , ・ ,.qとする。 a ) あてはめたモデルからの予測値を求める:九 , j=l . , ・ ,.T b ) あてはめたモデ、ルからの残差を求める:弓 = Yj 九 , j=l . , ・ ,.T c ) それらの残差の負値を求める: ‑e j=1 ・ . ,, .T j, d ) 以下の手順を B 回繰り返す ( b= 1 ・ . ,, .B): d ‑ 1 ) … ["残差」色 , ‑e , j=1 , . . , T}から T個を復元抽出する:ぐ , j=l j T d ‑ 2 ) 擬似観測値を生成する:ガ=九+イ , j=l, . . ,T d ‑ 3 ) モデルを擬似観測値にあてはめ、パラメタを推定する e ) :t,s=lv・,.q B通りのパラメタ推定値の標準偏差をパラメタ推定値の標準誤差とする。 3.4.マクロ・プログラム 連立常微分方程式の数値解をルンゲ・クッタ法で求め、観測値にもっとも適合するパラメタの推定(モ デ、ルのあてはめ)をシンプレックス法で行い、推定されたパラメタの精度をブートストラップ法で推定 する。これらの機能を統合した一つのマクロ・プログラムを作成した。紙幅の関係でそのプログラム・ コードは割愛するが、必要に応じて著者から提供できる。なお、微分方程式は、たとえば今の例で dydxl=・p 1ホ y l[ dydx2=( pl 匂 1)劇(p2 * y 2 ) と記述する。 3、 4に示す。データとしては、 kab=0 . 5,ん =0. 2 このマクロ・プログラムからのアウトプットを図表 2、 の経口 1コンパートメントモデ、ルで体循環血中の薬物量のほうに誤差を加えて生成したものを利用し た。図表 2は生成したデー夕、およびそれにあてはめたモデルを描いている。図表 3はパラメタ推定値 とその標準誤差の推定値を与えている。真値に近い良好な推定値が得られていることがわかる。図表 4 はブートストラップ手順の結果を描いている。 ' 1 l8 ‑

120.

、 f2 6 0 あてはめに用いたデータ 実線パラメタ推定値での数値解 4 .一 1 0 1 0 : ! O 一 一 ・. 40 30 x 5 0 60 Pl=0.494i 759603 P : ! = 0 . 1 9 9 3 9 1 4 i : ! i 図表 2 データ (プロット点) とあてはめたモデール(赤の曲線) [ R Kパラメタ推定の結果の出力] P l 0. 49 4 7 8 P2 目的関数 シンプレックス繰り返し回数 0 . 1 9 9 3 9 2 . 1 4 2 4 6 3 0 [ B o o t S t r a pの結果] パラメタ推定値の標準偏差 B o o t S t r a p回数 P l Mean P l StdDev P2 Mean 5 0 49 6 9 0 0. 0 . 0 2 3 1 9 9 0 . 1 9 8 8 9 P2 StdDev . 0 0 4 1 4 0 4 5 1 図表 3 マクロ・プログラムのアウトプットウインドウ (,./" : < J o ; . 山・匂 O . 3L ‑ 一 一 一 一 ー 一 一 一 一 一 一 一 一 一 ← 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 図表 4 もとの推定値(・)と B=50個のブートストラップ推定値 (0) 4 . NLINプロシジャとの結合 NL 町プロシジャでは、 data ステップのステイトメントを利用できる。この利点を活かし、微分方程 式の数値解をルンゲ・クッタ法で求める手順を NL町プロシジャに組み入れたプログラムを開発した。 ‑ 1 1 9 ‑

121.

このプログラムでとくに注目すべきステイトメントは m o d e lyy&y.=ty[&y]; である。この文中で=記号の左辺はモデルからの値、右辺は観測値にあたる。微分方程式の記述のし かたは本質的に 3節のプログラムの場合と同様である。プログラム・コードを付録に与える。このプロ グラムでは NLINプロシジャのデフォウトを利用しているが、それら、たとえば推定法は随意に変更可 能である。 3.4節と同じデータを利用したときのこのプログラムからのアウトプットを図表 5に示す。結果は 3. 4 節のものと類似していることがわかる。 内 U ‑EnJιnHV VEnuv a u ‑ ‑ ' a︑ F杭階 A寸 WHM 畑 ' E ジ2 4 消 凶日 シ 4 司 H U 。 0 . 0 0 0 8 1 0 0 . 0 0 9 9 5 0 . 0 8 3 9 0 . 1 2 6 6 0 . 2 1 7 0 0 . 3 8 7 8 0 . 4 9 3 9 0 . 5 1 9 7 0 . 5 2 0 9 0 . 5 2 1 0 守︐︐内︽ 9 0u4 1 1 1 1 0 . 5 8 3 5 3 . 5 7 6 8 0 . 4 4 9 5 0 . 2 9 1 6 0 . 1 9 4 0 0 . 1 9 8 4 0 . 1 9 7 1 0 . 1 9 7 1 0 . 1 9 7 1 内u nHV M 内U M 内U M 円M nHV4EEFhun吋 ︾ 守 ︐ ︐ 守 ''Fnu M 平 T ‑n 日 n 日 7'Ru‑‑nvnv ‑3rhunL4lnunU 守I 4 l 守I 4 1 4 1 4 1 寸 J n o n O マーマ F n o n U T ﹄マーマーマーマー 平 れ敏匂計 1D 巾変:復 p 札従手 m R法 反 復︒ 反 2 3 4 5 6 7 8 9 1 0 N O T E : 収束基準は満たされました。 推定の要約 G a u s s ‑ N e w t o n 1 0 手法 反復回数 サブ反復回数 平均サブ反復回数 6 0 . 6 3 . 0 8 1 E ‑ 6 8 . 1 3 6 E ‑ 7 0 . 0 0 0 0 4 7 3 . 1 4 7 E ‑ 8 1 . 7 1 0 8 0 2 5 1 5 1 R p1 ) P P C( R P C( p1 ) O b j e c t 目的関数 読み込んだオブザベーション数 使用されたオブザベーション数 欠損値のオブザベーション数 N O T E : 切片はモデルに指定されていません。 自由度 変動因 平方和 平均平方 F値 1 8 3 . 3 1 . 7 1 0 8 1 8 5 . 0 9 1 . 6 5 2 7 0 . 0 3 4 9 2 6 2 5 . 0 8 2 M o d e l E r r o r U n c o r r e c t e dT o t a l 0 4 9 5 1 hf df ''nuFnuF 一フ ︐︑ !?﹄ 推定値 近似標準鼠差 0 . 5 2 1 0 0 . 1 9 7 1 0 . 0 1 9 9 0 . 0 0 3 4 8 9 5首近似信頼限界 0 . 4 8 0 9 0 . 5 6 1 0 0 . 1 9 0 1 0 . 2 0 4 0 白州 f 行 ntan守 nνauマ nu n J ι H ︽v nu ︐ nι 関1 0 周回 nvnV 4ゐ H ︽V 1 川弘山川 近∞ fc n u v ‑ 1 2 0・ >F 近 似P r く0 0 0 1

122.

p 2 ‑ 0 . 2 1 0 2 0 4 4 1 . 0 0 0 0 0 0 0 図表 5ルンゲ・クッタ法を組み入れた NL 凹プロシジャからのアウトプット 5 . まとめ 薬物動態解析などにおける速度論モデ、/レの基本は連立微分方程式である o その方程式の解析解が与え られているときは、その解析解によるモデ、ルのあてはめに SASでは NLINプロ、ンジャを利用できる。し かし、解析解が与えられていない場面も少なくない。このような場面で利用できる SASマクロ・プログ ラムを開発した。さらに、 NL 凹プロシジャで微分方程式モデルを直接あてはめる機能を開発した。こ れらのプログラムを紹介した。 NLINプ口、ンジャで、行った機能拡張と同様のものは NLMIXEDでも可能 である。 参考文献 1 )勝田啓子・落合俊充・田崎武信( 2 0 0 8 ) . ラグタイムとコンパートメント数.SASユーザー総会論文集, 5 6 ‑ 6 3 . 2 )矢船明史・石黒真木夫( 2 0 0 4 ) .母集団薬物データの解析.朝倉書庖. 3 )D a v i s o n, A . C .andH i n k l e y , D .Y .( 1 9 9 7 ) .B o o t s t r a pMethodsandt h e i rA p p l i c a t i o n .CambridgeU n i v e r s i t yP r e s s . Example3. 4( p . 7 8 ) 謝辞 ご指導をいただいた矢野義孝先生と矢船明史先生、ご助言をいただいた松尾裕美子さん、勝田啓子さ ん、落合俊充さんと山田忠明さんに深く感謝し、たします。 . 1 2 1・

123.

NL 町プロシジャによる微分方程式モデルのあてはめ 付録 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 数値解析プログラム(ルンゲクッタ法)を使った N L I Nプロシジャでのパラメタ推定 2 0 0 9 . 4 . 1 0s c sY . M O R I * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * ; 拍n a c r oR K ̲ N L I N ( I N D = I * i n p u tデータセット , y 1,y 2・・・に対応する XX,y y 1,y y 2・・・が存在すること * 1 微分方程式 x , f u n c =1 * 微分方程式 ( d y d x =から始まる微分方程 f( x,y ) を記入) x , y 1,y 2・・・であらわすこと,推定するパラメタは p 1,p 2,・・であらわすこと * 1 i n tx ニ 1 I * xの初期値* ,i n t ̲ y = 1 I * yの初期値* h = 1 1 *刻 み 幅 * ,o u t fo u t f I * o u t p u tファイル * 1 , p a r a = % s t r( 00 ) 1 * パラメタの初期設定 p 1,p 2・・・ * 1 , y = 2 ); 1 *モデルにあてはめる Y(微分方程式であらわした変数)* 1 二 *く前処理〉マクロ変数の分解マクロー 拍n a c r oM ̲ b u n k a i( M ̲ M V A R S, M 一D L M); 一 一一; 百l e tMI N D E X 2=0 目d 日 目u n t iI 唱 (n r b q u o t e ( & & M ̲ T E M P & M ̲ I N D E X 2 ) = % s t r ( ) ) 目l e tM ̲ I N D E X 2二目e v aI ( & M ̲ I N D E X 2+ 1 ) 目l e tM ̲ T E M P & M ̲ I N D E X 2=百 s y s f u n c ( k s c a n ( & & & M ̲ M V A R S, & M ̲ I N D E X 2, & M ̲ D L M ) ); 目i f目n r b q u o t e ( & & M ̲ T E M P & M ̲ I N D E X 2 ) ~= % s t r ( ) 唱t h e n制 o 目g l o b a l& MM V A R S . & M ̲ I N D E X 2; 百l e t& M ̲ M V A R S . & M ̲ I N D E X 2= 品M ̲ T E抑制一 I N D E X 2;1 * 各マクロ変数の内容の要素* 1 目e n d 目e n d 目g l o b a l& M ̲ M V A R S . N ; 引e t& M ̲ M V A R S . N=% e v a l(釧一 1 N D E X 2̲1 ) ;1 * 各マクロ変数の要素の個数* 1 拍n e n d : *与えられた微分方程式の分解, 目l I ̲bunkai(func, % s t r(1)): *与えられた yの初期値の分解, 目l I ̲bunkai( in t ̲ y,目s t r()) : *与えられたパラメタの初期設定の分解, 目/ Lbunkai(para, 出s t r( , )) : 百i f& f u n c N .~=品 int_yN. % t h e n目d o : u n c N .と初期値の数品 i n t ̲ y N .が不一致です; % p u t微分方程式の数品f 目g o t o̲ A B O R T : % e n d : * 一 一 一 一 一 一 一 一 一 一 一 一 ー 一 一 一 一 一 一 N L I N p r o cN L I Nd a t a = 品I N D . *1¥ラメタの初期値, p a r m s目d op = 1 弘t o& p a r a N . p & p . = & & p a r a & p 百e n d : * p 1 = 0 . 1p 2 = 0 .1 : *ルンゲ・クッタ法での計算; a r r a yy ( 品i n t ̲ y N . ) *求めたい数の y : 品i n t ̲ y N . )弘 (d om = 1 目t o& in t ̲ y N . 品i n t ̲ y & m% e n d : ) :刊の初期値, a r r a yi n t y ( a r r a yk 品 (i n t ̲ y N .,4): * k 1 ‑ 4 ; ‑ 1 2 2・

124.

a r r a yt y品 (i n t ̲ y N . ) ; * t y :y の数値解 t y( 1 )t y( 2 ); t x二 品i n tx .; d oj = 1t o& i n t ̲ y N . t y [ j J = i n t y[ jJ ; e n d ; 町の初期値の代入, 刊の初期値の代入, i fx x > Ot h e nd o ; h = & h k t 1=i n t( x x / h ); ニo t ok t 1 d oi * K 1の設定, x =t x ; % d oj = l% t o& i n t ̲ y N . y [品j J=t y品 [j J; % e n d ; o& i n t ̲ y N % d oj = 1 目t & & f u n c & j; ,1 ]= d y d x & j; k [品j % e n d ; * K 2の設定, x = t x+ ( h / 2 ) ニ1批 o& i n t ̲ y N . ;y 品 [j J= t y品 [j J+ ( h * k[ & j,1 ]/ 2 ) ;% e n d ; % d oj o&i n t ̲ y N .; % d oj = 1 目t & & f u n c & j ,2 J = d y d x & j ; k [品j % e n d ; * K 3の設定; X t x+ ( h / 2 ) ; ニ1目 t o& i n t ̲ y N . y [品j]= t y品 [j J+ ( h * k品 [j ,2 J / 2 ) ;% e n d ; % d oj o& i n t ̲ y N % d oj = 1 出t & & f u n c & j; ,3 J = d y d x & j ; k [品j % e n d ; 二 * K 4の設定, x = t x+ h ; % d oj = 1 批 o& i n t ̲ y N . ;y [品j]= t y[ 品 j ]+ ( h * k品 [j ,3 J ) ; % e n d ; 出d oj ニ1弘 t o& i n t ̲ y N & & f u n c & j k [品j , 4 J = d y d x & j ; % e n d : *次の x yの設定; i fi くk t 1t h e nd o ; t xニt x+ h ; d oj = 1t o& i n t ̲ y N .; ]= t y [j ]+ ( ( h / 6 ) * ( k[j,1] + ( 2 * k[ j ,2 J )+ ( 2 * k[ j ,3 J ) + k[ j ,4 J ) ) ; t y [j e n d ; y [ l J =t y [ 2 Jニ, * p u tt x t e n d ; 二 ‑ 1 2 3・

125.

e n d :* d oi = Ot ok t lの繰り返しおわり; e n d : トーモデル 一一一一一一一一一一一一一一一, m o d e ly y & yニt y [ & y ]: r u n : *エラー処理, 唱̲ A B O R T : 伽l e n d : / * <実行例>一一一一一一一一一一一一一一一一一一一一一一一 一一一一一一 d a t at e s t l : s=0.2: *誤差の S D : p l = 0 . 5 : p 2 = 0 . 2 : */~ ラメタ値 = Ot o5 0b y1 : d ox y 2ニ p1 *1 0 / ( p 1 ‑ p 2 ) 本 ( e x p( ( ‑ p 2 )* x )‑ e x p( ( ‑ p1 )* x )) C A L LS T R E A M I N I T ( 1 2 3 4 5 ) : y 2 二y 2+randCNORMAL',O,s ) : o u t p u t : k e e pxy 2 : e n d : r u n : d a t at e s t 1 : s e tt e s t 1 :(項目名はモデル式の項目名と対応要) r e n a m ex = x xy 1ニy y 1y 2 = y y 2 : r u n : 日正N Ll N ( I N D= t e s t 1 p 1 *y 1I d y d x 2 二 ( p 1 * y 1 )一 ( p 2本 y 2 )) ,f u n c= % s t r (d y d x 1ニ i n tx ニ1 0 ,i n t ̲ y = 出s t r( 1 00 ) h= 0 . 5 o u t f = o u t f ,p a r a ニ% s t r( 0 ,0 ) ,y = 2 一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一*/ ‑ 1 2 4・

126.

, コ 口ジスティックモデルと ROCAUC分析を組み合わ せた検査性能の評価と疫学基本モデル評価方法 古川 l 敏仁、杉本典子 株式会社バイオスタティステイカルリサーチ T e s tPerformanceE v a l u a t i o ni nE p i d e m i o l o g i c a l BasicModelUsingROCAUCw i t hl o g i s t i c r e g r e s s l o n T o s h i h i t o Furukawa,N o r i k oSugimoto LTD. B i o s t a t i s t i c a lResearchC o ., 要旨: 健常群、疾患群を診断する検査の性能評価のためには、両群 のリスク背景因子いわゆる基本モテ、ルを考慮、した、 ROC AUC 分析が必要であり、それは口ジスティック多変量解析における診 断能の定量的評価を可能とする方法である。 キーワード:検査診断能 ROC AUC 疫 学 基 本 モ デ ル l o g i s t i cmodel ‑ 1 2 5・

127.
[beta]
.~";r:.'-=.-;'

検査値 x の目的
‑例:診断
ある闇値cをもとに疾患 (Disease)と正常 (
H
e
a
l
t
h
)を区分する

>
cならば疾患と判定
も
し
、x
も
し
、 X壬c ならば正常と判定
‑例:予後の予測
v
a
l
)と不良 (
D
e
a
t
h
)を区
ある闇値cをもとに予後良好 (Su同 i
分する

>
cならば生存率が高いと判定
も
し
、x
も
し
、 X豆cならば生存率が低いと判定
2

シミヲ

!I

診断性能評価上の問題
‑ある闇値 c をもとにした性能判定の限界
感度 C
S
e
n
s
i
t
i
v
i
t
y
)、特異度 C
S
p
e
c
i
f
i
c
i
t
y
)、 正確度(
Accuracy)
・多変量鑑別モデル(例:ロジスティックモテ、ル)、有意な

項目の組み合わせばわかっても、その項目の診断性
能への寄与は分かりずらい
・疲学的な問題そもそも、他の予後因子(背景因子)で
説明される以上の臨床的な有用性がその検査には存
在するか
3

‑
1
2
6・

128.

ヨヨシヨン~-ン 問題解決 ‑今回はこれらの問題を ROCのAUCを用いて 解決します。 ・疫学的には基本モデルの説明をします。 ‑同様の問題を生存時間の予後判定や、 Cox 回帰を用いた場合の背景因子を考慮した予 後検査診断能の評価に拡張いたします。 4 とシシ三こン t 検査Xの性能指標の定義と ROCについて Contents ‑診断検査Xの評価指標 感度、特異度、正確度 .ROCとAUCの説明 .ROCの分散推定 . 2つの検査AUCの差の検定 5 ‑ 1 2 7 ‑

129.

回?イー給一幻ロジ二 シ ジ ム E 診断検査値 X の定義 闇値 IC FP:l‑特異度 低← 検査健 :X E r t t M r i 書面盤詣盛鑑 6 ー情 ヨシシ三ニン 検査値Xをある闇値c で、診断する場合 の検査性能指標の定義 疾患群 (Disease)の例数 m人 、 H e a l t h ) の例数 n人 、 健常群 ( 全体で N=m+n人 S e n s i t i v i t y ) ‑感度 ( 疾患群 m人中、検査Xがcを超える人の割合 エ テ I(Xi>c)=ρ(沼 >clDiω e m s e n s ( c )= 舵 g 児 王 了 7 ‑ 1 2 8 ・

130.
[beta]
Eでシシ乙=‑

検査値Xをある闇値 c
で診断する場合
の検査性能指標の定義
‑特異度 C
S
p
e
c
i
f
i
c
i
t
y
)
健常群 n人中、検査Xが c以下の人の割合

俳誌I伴 の 二 尚 三 伊 州

s
p
e

ノ¥

断
診

し
王

(
ん

C

¥
I
l
i
‑
‑ノ

一
<
刀

rl

す匂戸
n

>

+
c

rl

E

/ーー

l一
N

C
C
C
G

m
Z
H
l
t
¥

.正確度 CAccuracy)
検査を受けた N人が、疾患群は陽性、健常群は陰性と正しく
診断された割合

8

EE
霊=:.=茎蓋臨!

省‘~.

ν̲.シンミーシ

L二

,

,
;
̲
.

検査性能指標の問題
例:心血管疾患検査X
吊人

1
0
0
0
例
論文基準値
1
8以下
4
0以下
1
0
0以下
2
5
0以下

陽性

陰性

1
5
1
1
0
9
7
3
2
5

7
5
.
5
%
5
4
.
5
%
3
6
.
5
%
1
2
.
5
%

1
2
0
0
例

陰性率

6
3
3
8
5
1
9
6
0
9
9
3

Q
'
"
正卦

6
3
.
3
%
8
5
.
1
%
9
6
.
0
%
9
9
.
3
%

正診率

7
8
4
9
6
0
1
0
3
3
1
0
1
8

6
5
.
3
%
8
0
.
0
%
8
6
.
1
%
8
4
.
8弘

‑カットオフの設定により検査性能値は異なる
.=感度と特異度はトレードオフの関係
・疾患群と健常人の比により正診率は異なる
日

‑
1
2
9
‑

131.

己ン昼、'シ三:::‑ E 溢晶画面詰草画面醤盈盤単位: ROC曲線 ‑カットオフを連続的に変化 ・縦軸:感度 横軸 :1‑特異度 ・曲線が左上角に近いほど検査性能が高い .曲線が対角線上=診断能力はない 1 0 直直量園輩盤醤 ‑ :; .~シシ乙二, ROC曲線 低』 検査値:X ー惰 1 1 ‑ 1 3 0 ‑

132.

ヨヲ宅;ーコ 警 ROC曲線 図 1‑ ROC曲線 感度 100覧 01 0覧 特 異 度 100覧 1 2 A r e aU n d e rt h eC u r v e • AUC=1 完全な検査 図2 ROCのAUCと接線 感度 100 覧 • AUC=0.5 無意味な検査 • AUCは 1 . 0に近いほ ど良い検査 0" 100覧 0" 特 異 度 13 ‑ 1 3 1 ‑

133.
[beta]
匿直面孟置盈錨溢組
AUCの重要な性質

を!!=i'寸~.吾シ

• AUC 台 形 法

事
!

「
一
一
一

官臼

・健常人に着目

r‑‑‑r‑ーーー

一

「
ー
ー
ー
‑
‑
.
‑
‑
‑
‑
「
ー
ー
ー
ー

よ

rー
ー
ー
ー
「
四
ー
ー
ー
ー
ー

1
‑特異度:幅は 1/n

1
4

~:/シ-ン

AUC(台形法)の重要な性質:感度
・健常人に着目:健常人 n
人を検査X
jの小さい)
1直にならベ、個々
のX
jをカットオフとしたときの感度 s
e
n
s
(j)を台形法にて求めると

エ
ト
州

AUC=

j
)

(
1
)

=Lf(布 )sens(
j
)= E(sens)
j=1

となり、 AUCは感度の期待値となることがわかる。

ν

s
e
n
s(
j
)= {(m+R(H)j‑R(S)j m} であることから(1)式は
AUC=土│ず (m+R(H)j‑R(S)j)I

nm.
¥j=n

(
2
)

)

R(H)j:健常人 (
H
) 中のj
の順位

‑
1
3
2
‑

R
(
S
)
j :全例 (
S
)中のjの順位 15

134.

ーでシラ三シ AUC(台形法)の重要な性質:特異度 AUC=〉 1spec(i)=E(spec)(3) i = lm となり、 AUC は特異度の期待値でもあることがわかる。 spec( i )={ ( R ( S ) i‑R(D)i)/n } であることから ( 3 )式は ルヰ(ド (S)i‑R(D)i)) の順位 R(D)i:疾患群 (D) 中の i ( 4 ) R ( S ) i :全例 ( S )中の i の順位 1 6 E冨E画 面 画 歯 菌 量 芝 士 型 園 彊 翻 AUCの分散 • AUCの分散はAUCが感度、特異度の期待値である ことから経験的に以下に求めることができる。 AUC の分散 山 ーデ . , ず UC)= 1 ( s p e c( i )‑AUC)2+ 1 ( s e n s( j )‑AUC)2 m(m‑l)Tn(n‑l)T J 17 ‑ 1 3 3 ‑

135.

E函 置 盃 孟 置 量 踏 峰 ニ ー;t "~::,..シミ,:;.同 同一症例に対し同時に測定された検査 のAUC比較 ・今、検査X、検査Yが同一症例に対し同時に測定さ れたと仮定し、検査XのROC AUCをAUCx、検査Y のAUCをAUCyとする。 ‑臨床的には AUCx、AUCyの差がしばしば問題と なる。 • Dif(AUC)=AUCx‑AUCy 18 EifiAF 置置量盤詣醤醤 ー一三泊二ν" ' ;‑;.1シ乙ン ]ー一 AUCの比較の検定 =var(AUCx)+陥 r(AUCy)‑2cov(AUCx, AUCy) V訂 ( Dif(AUC)) 一 」 知 的(i)‑AUCx)(specx(i)‑AUCx) cov(AUCx, AUCy)= : = i ' m(m‑1)' L ナ わ れ ο(s仰e州 n s S n ( 付 n一り l )0 T 士 「 +一 また、 D e l o n g l )らは、この経験的分散に基づく下記の統計量が 自由度1 の χ2 分布に従うことを示している。 Dif(AUC) V訂 ( Dif(AUC)) 19 ‑134・

136.

ヨョンシ‑ン z ROC AUCの疫学データへの応用 Contents ‑基本モデルとは ‑基本モデルと検査性能 ‑ロジスティック変数選択と ROC AUC 2 0 置置量逼盈量 ~.レシ乙シ 基本モデルとは .近年の大規模データに基づく疫学研究の進展により 疾患ごとの被験者背景要因のリスクが明確になりつつある この疾患ごとの被験者リスクモデルを基本モデルとここでは呼ぶ )ツクシンドロームと成人病基本リスク ‑例:メタボ 1 ウエスト周囲径が男性で 85cm、女性で 90cm以上 かつ、下記が2つ以上該当 血清脂質異常(例:トリグリセリド値 150mg/dL以上、または HDL コレステロール値40mg/dL 未満) 血圧高値(例 :SBP130mmHg以上、 o r DBP85mmHg以上) 高血糖(例:空腹時血糖値 110mg/dL ) 2 1 ‑ 1 3 5・

137.

主ラシ乙シ 検査性能評価上の問題点 ‑検査性能は、疾患群の感度、健常群の特異度をも とに評価される ・もともと、健常群と疾患群では被験者背景が違う( 基本リスク)が違う可能性がある。 ・検査値が基本リスクと相関する場合、一見有効な 診断検査であっても、同じ基本リスク集団では、診 断能を持たない可能性がある。 22 , 三シラ三ν 2 ある検査の評価:心血管疾患の診断 000人、疾患 200人 健常 1 • L o g i s t i cR e g r e s s i o n ・統計的に有意 O dds比 1.117( 11 0 ) 検査値が 1 0高くなるとリスクは約 1 . 1倍 ・検査値が 1 0 0高くなると Odds比3 . 0 0・ .I Odds比 推 定 推定 9 5目下限 9 5見上限 Waldχ2 p値 1 .1 1 7 1 .1 4 0 1 .0 9 5 1 5 5 > 0 . 0 0 0 1 23 ‑ 1 3 6・

138.

. EE 圭T:T 4 ? 董盈言 ヨ 宅 , : ; ン ミ' . J ‑ ; ; 検査性能指標の問題 例:心血管疾患検査X ' 1 ) , 也 、 呂 吊 2 0 0例 論文基準値 1 8以 下 4 0以 下 1 0 0以 下 2 5 0以 下 陽性 1 0 0 0例 陽性率 1 5 1 1 0 9 7 3 2 5 陰性 7 5 . 5 % 5 4 . 5 % 3 6 . 5 % 1 2 . 5 出 1 2 0 0例 陰性率 6 3 3 8 5 1 9 6 0 9 9 3 正診 6 3 . 3 % 8 5 . 1 % 9 6 . 0 % 9 9 . 3 % 正診率 7 8 4 9 6 0 1 0 3 3 1 0 1 8 6 5 . 3 % 8 0 . 0 % 8 6 . 1 % 8 4 . 8 % ‑感度、特異度はこんな感じ ・良い検査なのか、それとも・・・・ 24 E置車置蓄量置輩歯箇色直二三哩璽塑幽 検査X のR O C 曲線 A U C = O . 7 7 5 S e n s i t i v i t y 1 .0 0 . 9 0 . 8 0 . 7 0 . 6 0 . 5 0 . 4 0 . 3 0 . 2 0 . 1 0 . 0 ‑ nHHU ‑ ‑ u ︽n u AHHM 内川川M ‑ 1 3 7 ‑ • 内MHU ‑ AHHM ︐n守 内川川M • a' 吋u AUNM AHHM •

139.

E冨‑置置量魁謡与 エーするンぎラシミレジ 集団の基本リスクを考えると ロジスティック多変量解析ーOdds推定 心血管疾患の基本リスク リスク因子 9 5弘下限 9 5 %上限 0 . 9 1 5 0 . 9 0 2 0 . 9 2 9 0 . 7 3 1 1 . 1 4 6 1 . 7 9 8 1 . 9 7 8 1 . 2 6 1 3 . 1 0 3 2 . 1 2 8 1 . 5 0 4 3 . 0 1 3 2 . 4 8 0 1 . 7 5 4 3 . 5 0 7 1 . 0 1 3 0 . 7 3 8 1 . 3 9 0 推定 年齢 性別 喫煙 高血圧 糖尿病 高コレスアロール血紫 2 6 ー 匝冨軍軍孟置髄誕議臨 基本リスクを検査Rとして考える '~ヨン三ン ‑多変量ロジスティック基本モテ、 jレ • L o g i t = l n t e r c e p t + b 1*年齢 +b2女性別 +b3安喫煙 +b4安 高 血 圧 +b5安糖尿病 +b6台高コレステロール血祭 • R = e x p ( l o g i t ) /C 1+expC l o g it ) ) 27 ‑ 1 3 8 ‑

140.

l 竺雪量塑幽 │竺ザ一位民ア テヲ渉前期時 , , : / f R O C 曲線のH 識 0 1 9876543210 ・ t‑‑‑‑‑‑‑‑‑s 1 1000000000o ' v ・ I t a u 内崎M ‑‑ s n u 1‑S p e c i f i c i t y ‑ 一 一 検査I ‑一一検査X + B a s i cM o d e l 主でシ B a s i cM od e 1 2 8 ν乙シ 検査Xの本当の性能? . 検 査XのAUC は0 . 7 7 5で、あった。 は0 . 8 5 0 ・しかし、患者集団の基本リスクによる診断でも AUC もあることがわかる ・基本モデル!こ検査Xを加えたときの AUC は0 . 8 5 5で、基本モ デルより、わず、か!こ 0 . 0 0 5大きいた、けで、あった。 C o n f i d e n c e I n t e r v a l s L o w e r U p p e r AUC 検査X 0 . 7 7 5 0 . 7 3 8 0 . 8 1 0 基本モデル 0 . 8 5 0 0 . 8 1 3 0 . 8 6 1 基本モデル+検査X 0 . 8 5 5 0 . 8 4 4 0 . 8 8 8 基本モデル との差 ‑ 0 . 0 7 5 0 . 0 0 5 2 9 139・ ー

141.
[beta]
どシ-~コ

検査診断能としての変数選択
ロジスティックモテ、 jレ
で
、l
i、直接的にどの程度診断能が向上したの
かは分からない
Wald X2のp値では、例数が多いと有益な情報は得られない。
AUC
AUCの差の検定

基本モデJ
レ+検査x
‑
基本モデル

9
5
%Con
宵d

I;t~'~;I~"--

差の推定

0
.
0
0
3

0
.
0
0
7

X2 p値
0
.
0
0
0
7

Odds
瓦苦言
95
首下限

95
品上限

Waldx2
p
f
直

0
.
0
0
5

ロジスティックモデル
推定

後査X
年齢

性別
喫煙
高血圧
糖尿病
高コレスチロール血媛

E}tSEfn
量量溢

0
.
2
0
1
0
.
9
4
5
1
.
1
9
0
1
.
8
4
2
2
.
1
4
6
2
.
6
6
2
1
.
1
3
2

0
.
1
4
4
0
.
9
3
0
0
.
7
5
0
1
.
1
5
9
497
1.
1
.
8
5
0
0
.
8
1
4

0.
279 <.0001
0
.
9
6
0 <
.
0
0
0
1
460
1
.
8
8
8 0.
2
.
9
2
7 0
.
0
1
0
3
.
0
7
9 <
.
0
0
0
1
3
.
8
3
0 <
.
0
0
0
1
46
1
1
.
5
7
5 0.

堂ヲシシ ,
‑
:
:
;
1

ROC AUCの疫学データへの応用結論 (
1)
.検査の性能を評価する場合、特定の感度、特異度に影響さ
れない ROCCAUC)の評価は重要である。
• AUCは検査の感度、特異度、有病率 50%時の正確度の期
待値なので、検査性能の理解しやすい指標である

特定の診断情報に検査Xの追加情報が臨床的に意味がある
かを判断する場合、ロジスティックモデルでは、統計的に追
加変数が有意かどうかは判定できても、どの程度診断能が
向上したのかは分からない
基本モデルと基本モデ jレ+検査XのAUCの差の評価が重要
である。
o
g
i
s
t
i
c
プロシジ
・この AUC比較機能は Ver9.2より、標準的!こ l
ャに採用される
3
1

‑
1
4
0
‑

142.

E * t e 6 " 孟盈 1: ン三シシミ; , ̲ J f ROC AUCの疫学データへの応用結論 ( 2 ) ‑検査の性能を評価する場合、健常群、疾患群聞で、集団聞の 疾患に対してリスク要因となる背景因子が違うことを考慮しな ければならない リスク要因と検査値が相関する場合、検査診断性能が正しく評 価されない場合がある。 ・上記を確認するためには、リスク要因のみによる診断能とリス ク要因+検査時の診断能をAUCで比較する必要がある。 ‑疫学研究が進展するにつれ、従来有用とされていた検査が、 実はリスク要因との単なる交絡を反映する事象であることが示 される可能性がある。統計担当者は充分そのことを理解する 必要がある。 32 ーす予言均一元戸悶暫│ 参考文献 1 ) Comparingt h eAreasUnderTwoo rMoreC o r r e l a t e dReceiver . OperatingC h a r a c t e r i s t i cC u r v e s :A NonparametricApproach.E l i z a b e t hR DeLong,DavidM.DeLong,DanierL .Clarke‑Pearson.,Biometrics 44, 837‑ 8 4 5,1988 2 )Usingt h eTimeDependentROCCurvet oB u i l dB e t t e rS u r v i v a lModeli n iLu,ChenweiL iu .NESUG2006 SAS.L 33 ‑ 1 4 1・

143.

_-ン~:,.. 時間依存性 ROC AUCとCox回帰 次回予告 C o n t e n t s ‑時間依存性 ROC の定義と臨床的意味 ・時間依存性 ROCの注意点 ‑多変量リスクの ROC 評価司 C o x回帰 .PGxlこおける遺伝子発現群の最大リスクの評価 34 ‑ 1 4 2・

144.

生存時間解析における L a k a t o sの症例数設計法の有用性の評価 0魚 住 龍 史 * 水 津 純 基 * * 浜 田 知 久 馬 * * *日本化薬株式会社医薬データセンタ‑ **東京理科大学工学部経営工学科 E v a l u a t i o nofa v a i l a b i l i t ya b o u ts a m p l es i z ef o r m u l abyL a k a t o sons u r v i v a la n a l y s i s R y u j iUozumi* J u n k iMizusawa* * ChikumaHamada* * *ClinicalDataManagementandBiostatistics,NipponKayakuCo.,Ltd * *DepartmentofManagementScience,TokyoUniversityofScience 要旨 生存時間解析における症例数設計法として, SASV . 9の POWERプ口、ンジャで用いられている L a k a t o s の方法の他に, Freedman,S c h o e n f e l d の方法も多くのソフトウェアで広く用いられている.水 j 宰,浜田 ( 2 0 0 8 ) により,これら 3つの方法の性能を比較した結果が報告されている.しかし,この先行研究では 比例ハザード性が成り立たない生存時間分布を想定した場合の評価はなされていない. そこで本稿では,生存時間分布に比例ハザード性が成り立たない分布として対数ロジスティック分布 を想定し,症例数設計法の性能をモンテカルロシミュレーションによって定量的に評価した. a k a t o s,対数ロジスティック分布 キーワード:症例数設計,生存時間解析, SASIPOWER,L 1 はじめに 生存時間解析における症例数設計法として, F r e e d m a nの方法 [2J,S c h o e n f e l dの方法 [5J,L a k a t o sの方法 [4J が多くのソフトウェアで広く用いられている[lJ 水津,浜田 ( 2 0 0 8 )により,これら 3つの症例数設計法の 性能を比較した結果が報告されている [ I O J しかし,比例ハザード性が成り立たない生存時間分布を想定した 場合の評価はなされていない.本稿では,生存時間分布に比例ハザード性の成り立たない分布として対数ロ ジスティック分布を想定し,それぞれの方法で求めた症例数で想定した検出力を保てているかを定量的に評 価する またその結果を基にして,症例数設計法の指針を述べる. 2 生存時間解析の統計モデ、ル 2 . 1 比例ハザードモデル(p r o p o r t i o n a lhazardmodel) 生存時間解析の代表的な統計モデルの lつで、ある.比例ハザード、モデ、ルで、は,ある患者集団のハザード関 ( t ) が基準患者集団のハザード関数 h o ( t ) の定数倍(以下,ハザード比 HR) になるモデ、ルで、ある.なお, 数h tは時間を表す. ‑ 1 4 3・

145.

h ( t )=h o ( t ) .HR ( 2 . 1) ここで,ハザードとは「時点 t の瞬間死亡率」を表す.比例ハザード性とは,時点に依らずノ、ザード比が一 定であるという性質で,指数分布はこの性質を持つ代表的な分布である. 2 . 2加速モデ、ル ( a c c e l e r a t e d ‑ f a i l u r et i m em o d e l ) 比例ハザードモテ守ル同様,生存時間解析の代表的な統計モデルである.加速モデルで、は,ある患者集団の 生存時間分布を表す確率変数 T が基準患者集団の生存時間分布を表す確率変数九の定数分の 1(以下,生存 時間比 A )になる. T=九/ A ( 2勾 このモデルの特徴として,生存時間を直接モデル化するので解釈しやすいという点と,基準患者集団の生存 時間分布に特定の分布を仮定する必要がある点が挙げられる. SASの LIFEREGプロシジャにより,加速モデ ルを用いた解析を実行することができる. LIFEREGプロシ ジャは,生存時間分布に分布型を仮定して,尤度原理に基づいた推測を行うためのプロシジャである [ 6 J 3生存時間解析における症例数設計の数理 3 . 1Freedman の方法 生存時間分布に指数分布を仮定した下で, IH o:各群のハザードが等しし、」とし、う帰無仮説を検定するため l群あたりのイベント数を算出する.これを 2群を併せたイベントの割合で除すことで I群あたりに必要な 症例数 N を ( 3 . 1 )式で算出することができる. 2 N =(Za/2+2z(pH)R2‑(1)H"R+l)2×一一一一一一 2‑ 2 司 ( 3 . 1) J l " [ ‑Jl" ただし ,Z a l 2を標準正規分布の上側 (α/2)%点 ,Zpを標準正規分布の上保IJβ% 点 ,Jちを j群の最終生存割合 とする. 3 . 2S c h o e n f e l dの方法 生存時間分布に指数分布を仮定した下で ,IH o・各群の対数ノ、ザードが等しし、」とし、う帰無仮説を検定する ため I群あたりのイベント数を算出する.これを 2群を併せたイベントの割合で除すことで l群あたりに必 3 . 2 ) 式で算出することができる. 要な症例数 N を ( N=2 ( z a ρ+ Zp)2̲ 2 { l og (HR)}2 2‑Jl"[ ‑Jl"2 ‑ 一 --~ ( 3 . 2 ) 3 . 3L a k a t o s の方法 生存時間分布に指数分布を拡張した区分指数分布を仮定した下で, IH o:区間 iにおける各群のハザード が等ししリという帰無仮説を検定するため,各区間ごとの 2群を併せた期待イベント数を算出する.これを 検定統計量に考慮して, 1群あたりに必要な症例数 N を ( 3勾式で算出することができる. N=H与~r ‑ 1 4 4 ‑ ( 3 . 3 )

146.

なお E'は必要イベント数で,定義式は ( 3.4)式で表される. zvl A E 」ーム l 1 1 +供HRi 1+供j E・ 同 ‑ i Z M d ・ ‑ 旦 2 ( 1 ) 同 ただし ,M =観察期間 i ( 3. 4 ) + 供 x 12, diを i番目の区間の 2群を併せた期待イベント数 , r Pi を I番目の区間のイ ベントが起きていない患者数の比 ,HRi を I 番目の区間におけるハザード比とする. 4 対数ロジスティック分布 生存時間解析の際に,生存時間分布として仮定される分布の Iつで‑ある.対数ロジスティック分布は加速 ) はそれぞれ次のよ モデ、ルで、よく用いられる分布であり,生存関数 S ( t ),確率密度関数 j ( t ),ノ、ザード関数 h {t うになる [J] S( t )= ̲1̲ ( 4 . 1 ) 1 + λl' . . 1 . . r ‑ l ( 4 . 2 ) h ( t )=ム ー で r 1 + λt f ( I ) = 4 4 7 ( 4 3 ) ム ) λt ' ( 1+ t ; J J 片 ノ fラメータ , yを形状パラメータとする ただし ,tを時間, λ を この分布の特徴として,比例ハザー ド性が成り立たない分布である点と , y>1 のときにハザード関数が一峰性になる点が挙げられる. 5 シミュレーション方法 シミュレーションでは,観察期間を 5年とした 2群(対照群,薬剤群)の並行群間比較試験を行うことを 想定する.また,海外で行われた臨床試験で得られたデータを想定して推定誤差を考慮した症例数設計を想 定する.このとき,海外の臨床試験データの生存時間分布に対数ロジスティック分布を想定する. シミュレーション手順は以下の通りである. 1 . 海外の臨床試験の存在を想定するために,対数ロジスティック分布の形状ノミラメータ%生存時間比ム I合 Jr 対照群の 5年生存害J 0 0例ずつ発 lを与え,対数ロジスティック分布に基づく生存時間乱数を l群 1 生させる.このとき,生存時間が 5年を越えた場合は打切りとする. プログラム 5 . 1 海外の臨床試験の存在を想定(生存時間分布:対数ロジスティック分布) 0通りの検出力を算出町 % I e tr =1 0 ;/本性能評価のために平均二乗誤差をするために 1 % l e tt i m e = 5 ;/本観察期間帯/ % I e ttO=O ぷ/本t= 0~1 における近似をよくするために追加で時点を設定事/ % I e tgamma=1 .0 ;/市対数ロジスティック分布の形状パラメータ γ*/ ‑ 1 4 5 ‑

147.

% l e tp i l= 0 . 3 0 ;/*対照群の 5年生存割合*/ % l e tA=O.7 5 ;/*生存時間比*/ % l e tNO=100;/*想定する海外の臨床試験の l群あたりに必要な症例数*/ d a t al l o g i s t i c ; l ・&pil .) / ( & p i1 .* & t i m e .**&gamma.);/*対数ロジスティック分布の切片パラメータ λ*/ lambda=( * ー1 0通りの生存時間乱数を発生‑‑*; dok = 1t o& r . ; *一対照群の生存時間乱数を発生 ( 1 0 0例)ー*; d o s e = O ;doj = 1t o&NO.; r a n d ( ' u n i f o r m ' ) ; U= ド((U/(l ‑ U ) ) / l a m b d a ) * * (1 /&gamma. ) ; c e n s or =1 ; = & t i m e . ; c e n s or =O ; e n d ; o u t p u t ; e n d ; i ft>& t i m e .t h e ndot *ー薬剤群の生存時間乱数を発生 ( 1 0 0例 ) ‑ ‑ * ; d o s e = l ;doj=1t o&NO.; r a n d ( ' 凹 i f o r m ' ) ; U= ド( 1 1&A.) * ( ( U / (l ‑ U ) ) / l a m b d a ) * * (1 /&gamma. ) ; c e n s or =1 ; = & t i m e . ; c e n s or =O ; e n d ; o u t p u t ; e n d ; ift>& t i m e .t h e ndot e n d ; r u n ; 2 . 想定した海外の臨床試験のデータに対して,生存時間分布に対数ロジスティック分布を仮定してパラ メータを推定する. . 2 パラメータ λ, yを推定 プログラム 5 *一生存時間分布に対数ロジスティック分布を仮定してパラメータ推定‑‑*; o d sl i s t i n gc l o s e ; o d so u t p u tP a r a m e t e r E s t i m a t e s = l i f e r e g ; p r o cl i f e r e gd a t a = l l o g i s t i c ; t =l l o g i s t i c ;byk ; modelt * c e n s o r ( O ) = d o s e/d i s r u n ; o d sl i s t i n g ; 件 *LIFEREGプロシジャのアウトプット*仲; d a t ai n t e r c e p t ; s e tl i f e r e g ; w h e r eP a r a m e t er =' I n t e r c e p t ' ; = e s t i m a t e ; k e e pkP a r a m e t e ri n t e r c e p t ; r u n ; i n t e r c e pt d a t as c a l e ; s e tl i f e r e g ; w h e r eP a r a m e t e r =' S c a l e ' ; s c a l e = e s t i m a t e ; k e e pkP a r a m e t e rs c a l e ; r u n ; ***実際の推定値に変換して算出***; d a t ae s t i m a t e ; m e r g ei n t e r c e p ts c a l e ; 一h at =e x p (‑ i n t e r c e p t l s c a l e);gamma ̲h at =1 /s c a l e ; d r o pP a r a m e t e r ; r u n ; lambda ‑ 1 4 6・

148.

3 . パラメータの推定値を与え. 2群の生存時間分布を想定する. プログラム 5 . 3 2群の生存時間分布を想定 d a t as u r v i v a l ; s e te s t i m a t e ; *ー t=0.3 における 2 群の生存割合(t=0~ 1における近似をよくするため)‑‑*; S O = I I ( I + l a m b d a ̲ h a t * & t O .帥 g a m m a ̲ h a t ) ; S S O = I / ( 1+lambda ̲h a t * ( & t O .*&A.)**gamma 一h a t ) ; *ー各年における 2 群の生存割合 (1 年生存害IJ 合 ~5 年生存割合)一六 %macros u r v i v a l ; %dot = l%to& t i m e . ; t=I I (1 +lambda ̲h a t *& 1 . 帥 gamma̲hat);/*対照群の生存時間分布*/ S&. SS&. t= I I ( 1+Iambda̲hat*(&. t*&A.)**gamma̲hat);/*薬剤群の生存時間分布*/ %end; %mend;%survival; F印 edman ,S c h o e n f e l d,L a k a t o s ) を用いて, 4 . 想定した 2群の生存時間分布を与え. 3つの症例数設計法 ( 有意水準を両側 5%. 検出力 80%を保つために必要な l群あたりの症例数 N を算出する. 4. 1 Lakatosの方法を用いた症例数設計 プログラム 5. % l e tpower = 0 . 8 0 ;/*検出力 : 8 0 % * / *ーマクロ前に空のデータセットを用意ーホ; d a t al a k a t o s ; d e l e t e ; r u n ; 帥 ホ POWERプロシジャを 1 0回実行した結果をデータセット l a k a t o sにアウトプット***・ %macrol a k a t o s ; r . ; %doi = 1%to& d a t al a k a t o s ̲ m a c r o ; s e ts u r v i v a l ; i f k ^ = & i .t h e nd e l e t e ; r u n ; r . ; %doj=1%to& d a t ad a t am a c r o ; s e tl a k a t o sm a c r o ; %dou=O%to& t i m e . ;/*各年の生存割合ホ/ c a I Is y r n p u t ( " S & u人S & u . ) ;/ホ対照群の生存時間分布*/ ヘ c a I Is y r n p u t ( " S S & u S S & u . ) ;/療薬剤群の生存時間分布*/ %end; %end; ホ ー POWERプロシジャによる症例数設計 ( L a k a t o sの方法)一六 o d sl i s t i n gc l o s e ; o d so u t p u tO u t p u t = l a k a t o s &i . ; p r o cp o w e r ; t w o s a m p l e s u r v i v a lt e st =l o g r a n k 仕0 1 " )=( & t O. ) : ( & S O . )( 1t o& t i m e .byI ) : ( & SI .&S2.&S3.&S4.&S5.) c u r v e ( " c o n c u r v e ( " t r e a t m e n t " )=( & t O . ) : ( & S S O . )( 1t o& t i m e .byI ) : ( & S SI .&SS2.&SS3.&SS4.&SS5.) g r o u p s u r v i v a l=" c o n t r o l "[ " t r e a t r n e n t " ‑147・

149.

a c c r u a l t i m e=0 . 0 0 0 1 t o t a l t i m e=& t i m e . n p e r g r o u p=. power=& p o w e r . ; 1 ; れ江 o d sl i s t i n g ; *ーマクロが実行される度に l a k a t o s & i .の内容が l a k a t o sにストックされる‑‑*; d a t al a k a t o s ; s e tl a k a t o sl a k a t o s & i . ; r u n ; %end; %mend;%lakatos; *ー必要症例数の結果のみデータセット l a k a t o sに残す‑‑*; d a t al a k a t o s ; s e tl a k a t o s ; N ̲Lakatos=NPerGroup;keepN̲L a k a t o s ; r u n ; プログラム 5 . 4 . 2 Freedman,S c h o e n f e l dの方法を用いた症例数設計 % l e ta l p h a = 0 . 0 5 ;/*有意水準:両側 5%*/ % l e tb e t a = % s y s e v a l f ( l‑ & p o w e r . ) ;/*検出力 80%*/ d a t as a m p l e ̲ f ̲ s ; s e ts u r v i v a l ; z a =pr o b i t 仰 ( ο I ト ‑&alp 加 h a . / 2 ) ;/ 戸 * 吋4 標票準 E 規分布の上側(付 α/ 危 / 勾 2 ) )%点*打/ 幼 Zb =pr ω o b i t 巾 ( ο l ト‑ &be 巴t a . ) ν ; /*標準 E 規分布の上側 s% 点 * 町/ HR=(log(SS&time.)/ lo g ( S & t i m e . ) ) ;/*指数分布を仮定して算出したハザード比*/ d ̲ F=(za+zb)*勺 *(HR+I)*勺/(2*(HR・1 ) 材2 ) ;/*イベント数 ( F r e e d m a n ) * / d ̲ S = 2 * ( z a + z b )材 2 /( log(HR))*勺;/*イベント数 ( S c h o e n f e l d ) * / ( 2 ‑ S & t i m e . ‑ S S & t i m e . ) ) ;/*症例数 ( F r e e d m a n ) * / N̲Freedman=1+ i n t ( d ̲ F勺/ ( 2・S & t i m e . ‑ S S & t i m e . ) ) ;/*症例数 ( S c h o e n f e l d )町 N̲S c h o e n f e l d =1 + i n t (d ̲S勺/ d r o pki n t e r c e p ts c a l ez az bd̲Fd ̲ S ; r u n ; プログラム 5 . 4 . 3 3つの症例数設計法の結果を出力 d a t as a m p l e ; m e r g es a m p l e ̲ f ̲ sl a k a ω s ;/勺つの症例数設計法の結果を統合したデータセット*/ t i t l e l" 1群あたりに必要な症例数"; t i t l e 2"ー有意水準:両側 % s y s e v a l f (& a l p h a .*1 00)%,検出力 : % s y s e v a l f (&powe r .*1 0 0 ) % ‑ " ; f o o t n o t e1j u s t i今=right"生存時間分布:対数ロジスティック分布 (γ=&gamma.)"; f o o t n o t e 2j u s t i今=rig h t "生存時間比 :&A"; f o o t n o 旬 3j u s t i か=rig h t "対照群の & t i m e .年 生 存 割 合 : % s y s e v a l f ( & p il .*1 00)%"; r u n ; o d sl i s t i n gc l o s e ; o d sh t m l ; p r o cp r i n tdata=sample(keep=N̲FreedmanN̲SchoenfeldN ̲ L a k a t o s ) ; r u n ; o d sh t m lc l o s e ; o d sl i s t i n g ; ‑ 1 4 8 司

150.

5 . 対数ロジスティック分布に基づく乱数を I群 N 例ずつ発生させる.このとき,生存時間が 5年を越え た場合は打切りとする. 6 . 発生させた乱数に基づいて,有意水準 5%でログランク検定を行い,両側 p値が 0 . 0 5以下であれば有 意とする. 7 . 5 . から 6 . の手順を 1 0 0 0 0回繰り返して,有意となった割合を検出力とする. 検出力が名義水準 80%付近になっているかどうかをモンテカルロシミュレーションによって定量的に評価 する. 6 シミュレーション結果と考察 6 . 1 想定した 2群 の 5年生存割合 生存時間乱数を発生させることにより想定した海外の臨床試験データに対して,生存時間分布に対数ロジ .1.1,表 6 .1.2,表 スティック分布を仮定して,パラメータを推定して,各群の生存時間分布を想定した.表 6 6 .1.3は,想定した生存時間分布から得た 2群の 5年生存割合を示す.形状パラメータ yが大きくなるに従い 2群の 5年生存割合の差は大きくなっている. .1 . 1 対数ロジスティック分布 (y=0 . 5 ) を想定した場合の 2群の 5年生存割合 表6 生存時間比 (A) 0 . 7 5 対照群の 5年生存割合同) 43% 65% 43% 薬剤群の 5年生存割合(同 47% 72% 51% 0 . 5 0 表6 .1 . 2 対数ロジスティック分布 (y=1 .0 ) を想定した場合の 2群の 5年生存割合 A ) 生存時間比 ( 0 . 5 0 対照群の 5年生存割合何) 65% 43% 薬剤群の 5年生存割合( . 1 Z ' 2 ) 77% 59% 表6 .1 . 3 対数ロジスティック分布 (y=2 . 0 ) を想定した場合の 2群の 5年生存割合 生存時間比 (A) 0 . 7 5 対照群の 5年生存割合併i ) 43% 66% 43% 薬剤群の 5年生存割合(局) 56% 85% 73% 0 . 5 0 6 . 2必要な症例数 表6 .1 .1 ,表 6 .1 .2,表 6 .1.3に示した 5年生存割合を用いて,各症例数設計法における l群あたりに必要な ,表 6ユ2,表 6ユ3より,ど、の症例数設計方法においても,生存時間比 A と対照群 症例数を示した.表 6ユ1 の 5年生存割合Jr j が小さいときは l 群あたりの症例数が少なくなっている.また,形状パラメータ yが大き くなるに従し、 l群あたりの症例数は少なくなっている. . 1 4 9・

151.

表 6ユl 対数ロジスティック分布 (r=0 . 5 ) を想定した場合に必要な症例数 生存時間比 (A) 0 . 7 5 0 . 5 0 対照群の 5年生存割合(1Z i ) 70ち も 50% 30% 70~も 50号 も 30ち も Freedmanの方法 4068 3402 3786 744 573 655 S c h o e n f e l dの方法 4060 3398 3782 736 568 6 5 1 Lakatosの方法 3970 3186 3084 725 536 540 表 6ユ2 対数ロジスティック分布 (r=1 .0 ) を想定した場合に必要な症例数 生存時間比 (A) 0 . 7 5 0 . 5 0 対照群の 5年生存割合併i ) 70呼 も 50% 30% 70~も 50~も 30~も Freedmanの方法 1 0 6 4 818 960 236 1 5 4 1 5 8 S c h o e n f e l dの方法 1 0 5 5 8 1 3 957 227 1 4 8 1 5 4 Lakatosの方法 1 0 4 3 7 6 1 759 230 1 4 2 1 3 1 表 6ユ3 対数ロジスティック分布 (r=2 . 0 ) を想定した場合に必要な症例数 生存時間比 (A) 0 . 7 5 0 . 5 0 対照群の 5年生存寄l 合(局) 70~も 50呼 も 30% 70号 も 50~も 30呼 も Freedmanの方法 325 217 230 77 45 4 1 S c h o e n f e l dの方法 316 212 226 66 39 36 Lakatosの方法 317 2 0 1 1 8 9 7 3 40 33 6 . 3 検出力の比較 次に,表 6ユ1 ,表 6 . 2ム 表 6 . 2 . 3に示した l群あたりに必要な症例数を用いて,モンテカルロシミュレー ションにより算出した検出力を示した.表 6 . 3 .1,表 6 . 3 . 2,表 6 . 3 . 3より, Freedman, S c h o e n f e l dの方法では検 出力が名義水準 80%に比べて過剰に評価されている場合や,名義水準 80%に到達していない場合があること が分かる.一方, L a k a t o sの方法ではどの条件においても他の方法に比べて検出力は名義水準 80%に近い値を とっている.検出力が名義水準以上になっているとしづ意味では F r e e出nan ,Scho印 刷dの方法も良いが,倫理 的かっ経済的な観点から検出力が名義水準に最も近い L a k a t o sの方法が有用であることが分かる. L a k a t o sの 方法では区間ごとにイベント数を算出する.このとき,対数ロジスティック分布は区分指数分布でよく近似 できるため, Freedman,S c h o e n f e l dの方法よりも適切に症例数を算出することができると考えられる. . 3 . 1 対数ロジスティック分布 (r=0 . 5 ) を想定した場合の検出力 表6 生存時間比 (A) 0 . 7 5 0 . 5 0 対照群の 5年生存割合(1Z i ) 70~も 50~も 30% 70号 も 50~も 30呼 も Freedmanの方法 81 . 7 % 83.6% 89.7% 81.6% 83.1% 4% 88. S c h o e n f e l dの方法 80.6% 83.9% 89.2% 80.8% 4% 8 3. 89.2% Lakatosの方法 80.1% 81 . 1 % 8 2. 4 % 81 . 1 % 81 . 2 % 8 2. 4% ‑ 1 5 0・

152.

表6 . 3 . 2 対数ロジスティック分布 (y=1 .0 ) を想定した場合の検出力 0 . 5 0 0 . 7 5 生存時間比 (A) 対照群の 5年生存寄j 合同) 70~も 50% 30% 70~も 50~も 30% Freedmanの方法 81 .5% 83.6% 89.4% 82.0% 83.7% 88.8% S c h o e n f e l dの方法 81.0% 8 3.4% 8 8.4% 81 .5% 82.5% 87.2% Lakatosの方法 80.0% 80.8% 80.3% 81 .4% 81 .0% 81 .4% 』ー 表6 . 3 . 3 対数ロジスティック分布 (y=2 . 0 ) を想定した場合の検出力 生存時間比 (A) 0 . 5 0 0 . 7 5 対照群の 5年生存寄j 合同) 70% 50~も 30% 70~も 50~も 30% Freedmanの方法 81 .8% 84.0% 88.9% 84.5% 86.3% 89.9% S c h o e n f e l dの方法 80.4% 82.4% 88.1% 75.7% 81 .1% 85.1% Lakatosの方法 80.8% 81 .4% 81.2% 81.6% 82.1% 82.3% 6 .4検出力の平均二乗誤差の比較 最後に,検出力の性能を評価するために算出した名義水準 80%に対する平均二乗誤差を示した. 4. 1,表 6. 4. 2,表 6. 4. 3より,生存時間分布に対数ロジスティック分布を想定すると, L a k a t o sの方法で 表 6. はどの条件においても他の方法に比べて平均二乗誤差は小さい値をとっている.特に,対照群の 5年生存害) 1 合Jr[が低い場合において, L a k a t o sの方法は他の方法に比べて大幅に小さい値をとっている.よって, L a k a t o s の方法は 3つの方法の中で、最も名義水準に近く検出力を制御できると考えられる. 4. 1 対数ロジスティック分布 (y=0 . 5 ) を想定した場合の平均二乗誤差 表 6. 生存時間比 (A) 0 . 5 0 0 . 7 5 対照群の 5年生存審J 合 併i ) 70~も 50% 30% 70% 50~も 30~も Freedmanの方法 5 . 7 9 7 5 . 3 8 5 4 0 . 9 6 1 4 . 3 4 78. 42 5 3 6 . 0 1 S c h o e n f e l dの方法 6 . 8 1 6 7 . 6 7 547. 10 41 4. 5 6 . 0 2 5 1 6 . 3 4 Lakatosの方法 7 . 8 2 3 . 0 7 1 8 . 6 4 3 . 7 5 2. 40 .57 21 表 6. 4. 2 対数ロジスティック分布 (y=1 .0 ) を想定した場合の平均二乗誤差 生存時間比 (A) 0 . 7 5 0 . 5 0 対照群の 5年生存割合同) 70~も 50% 30~も 70~も 50~も 30% Freedmanの方法 11 .0 2 8 8 . 8 8 4 7 4 . 0 5 4 2 . 0 4 1 2 0 . 5 5 4 3 0 . 2 2 S c h o e n f e l dの方法 1 .8 3 6 8. 46 461 .8 8 9 . 7 4 3 9 . 5 1 3 1 7 . 9 4 Lakatosの方法 5 . 1 1 5 . 5 9 9 . 0 5 8. 46 3 . 3 6 9 . 9 1 ‑151・

153.

表 6. 4. 3 対数ロジスティック分布 ( y = 2 . 0 ) を想定した場合の平均二乗誤差 0 . 7 5 A ) 生存時間比 ( 0 . 5 0 対照群の 5年生存割合同) 70% 50% 30% 70~も 50~も 30% F r e e d r n a nの方法 2 5 . 7 6 8 9 . 6 3 4 5 9 . 3 1 2 8 7 . 9 7 48 417. 8 2 3 . 9 0 S c h o e n f e l dの方法 3 . 5 3 31 .2 7 3 5 8 . 7 3 2 4 8 . 8 5 2 6 . 2 3 1 7 8. 14 Lakatosの方法 8 . 2 8 1 0 . 2 0 3 3 . 2 6 6 7 . 0 6 5 6 . 7 5 5 0 . 1 6 7 まとめ 本稿では海外で行われた臨床試験を想定して,生存時間分布に対数ロジスティック分布を,パラメータの 推定誤差を考慮、して想定した場合について,シミュレーションにより生存時間解析でよく用いられる症例数 設計法の性能評価を行った.結果, L a k a t o sの方法を用いると検出力が名義水準に近い値となった.すなわち, L a k a t o sの方法は 3つの方法の中で最も有用であると考えられる. L a k a t o sの方法では区間ごとにイベント数 を算出する.このとき,生存時間分布に想定した確率分布は区分指数分布でよく近似できるため, F r e e d r n a n, S c h o e n f e l dの方法よりも適切に症例数を算出することができると考えられる.よって,生存時間分布に対数 ロジスティック分布のような比例ハザード性が成り立たない分布を想定するとき,名義水準に近く検出力を 制御できる L a k a t o sの方法が推奨できる. 参考文献 [ 1J8 a r t h e l,F .M.S .& 8 a b i k e r ,A .& R o y s t o n,P .& P a r r n a r ,M.K .8 .( 2 0 0 6 ) .E v a l u a t i o no fs a r n p l es i z ea n dpowerf o r r n u l t i a r r ns u r v i v a lt r i a l sa l l o w i n gf o rn o n ‑ u n i f o r r na c c r u a l, n o n ‑ p r o p o 口i o n a lh a z a r d s, l o s st of o l l o w ‑ u pa n dc r o s s ‑ o v er . S t a t i s t i c si n品会d i c i n e ., 25, 2 5 2 1 ‑ 2 5 4 2 . [ 2 JFreedman, L .S .( 19 8 2 ) .T a b l e so f t h en u r n b巴ro fp a t i e n t sr e q u i r 巴di nc l i n i c a lt r i a l su s i n gt h el o g r a n kt e st .S t a t i s t i c si n M e d i c i n e ., 1 ,121‑129. [ 3 JKalbf 1e i s c h, J .D .& P r e n t i c e, R .L .( 1 9 8 0 ) .TheS t a t i s t i c a lA n a l y s i s01 F a i l u r eT i meD a t a .J o h nWileya n dS o n s . E .( 1 9 8 8 ) .S a r n p l es i z 巴b a s巴dont h 巴l o g ‑ r a n ks t a t i s t i ci nc o r n p l e xt r i a l su s i n gt h 巴l o g ‑ r a 叫(t e st .B i o m e t r i c s ., [ 4 JL a k a t o s, 44, 229‑241 . [ 5 JS c h o e n f l 巴I d,D .( 19 8 1 ) . Thea s y r n p t o t i cp r o p e r t i e so fn o n p a r a r n 巴t r i ct e s t sf o rc o r n p a r i n gs u r v i v a ld i s t r i b u t i o n . B i o m e t r i k a ., 68, 3 1 6 ‑ 3 1 9 . [ 6 J大橋靖雄・浜田知久馬 ( 2 0 0 5 ) .生存時間解析 SAS による生物統計.東京大学出版. 1ー 1 2 . [ 7 J浜田知久馬 ( 2 0 0 9 ) . 臨床試験計画書のレビュー.臨床薬理., 4 0, Noム 1 [ 8 J 浜田知久馬・安藤英一 ( 2 0 0 5 ) .POWERプロシジャによる症例数設計. SAS F o r u r nユーザー会論文集., 1 2 7 ‑ 1 5l . [ 9 J浜田知久馬・藤田陽介 ( 2 0 0 3 ) .生存時間解析の症例数設計.日本 SASユーザー会論文集., 7 3 ‑ 9 8 . [ 1 0 J水津純基・浜田知久馬 ( 2 0 0 8 ) .生存時間解析における症例数設計方法の性能比較.SASユ ー ザ ー 総 会 論 文集., 1 9 ‑ 2 8 . ‑ 1 5 2 ‑

154.

E&ta4 置置臨 努~ ~-ンシミーシ 生存時間データを扱う臨床試験における 試験終了時のイベント数の推定方法 西野美沙,堺伸也 イーピーエス株式会社臨床情報処理部門 P r e d i c t i n gt h enumbero feventsi nc l i n i c a l t r i a l sw i t ht i m e ‑ t o ‑ e v e n toutcomes. MisaN i s h i n o,ShinyaSakai B i o m e t r i c sD i v i s i o n, EPSCo., L td . E+t. 置置置歯菌盛語藍竺竺塑里堕璽幽 要旨: 生存時間データを扱う臨床試験において、試験終了時のイベント数 を試験途中で推定することは、観察期間等の再検討を行う為の有 用な資料となり得る。今回、その推定方法の比較と、実用化に向け ての検討を行った。 キーワード:生存時間解析、ベイズ、流、事後確率 ‑ 1 5 3 ‑

155.

I A S . : J . ‑ ' ! f ‑ 総 会 一 … ‑ 発表内容 1 . 目的 2 .推定方法 論文紹介 3 .SASプログラム&アウトプット 4 .考察 5 .まとめ 2 均 四 日 会 均7 目的 ‑生存時間解析において、検定の検出力はイベント数 に依存する ・目標イベント数が達成した時点を最終解析または中 問解析の時点とする計画も少なくない 特定の時点におけるイベント数 o r 特定のイベント数が集積される時点 3 ‑ 1 5 4・

156.

とシシ‑シ 推定方法 論文紹介① B a g i e l l aEandH e i t j a nDF Predictinganalysistimesi nrandomizedc l i n i c a l t r i a l s S t a t i s t i c si nmedicine2001;20‑14:2055‑2063 C u t o f fd a t e 。 4 三シシ三ジ 推定方法 論文紹介① ' E O { t O { t O " ) . +O { t t )+R ( 砕 け …(1) 川 =t o I , ‑ N o t a t i o n ‑ ‑E O ( t o, t ) :時点 t までに発生するイベント数 ‑t 。 :推定を実施する時点 ‑t : 推定したい時点 ‑O ( t 時 点 、t o fこおいて既に発生しているイベント数 o) : ‑Q ( t o, f ): 時 点 、t o fこおいて既に登録はされているがイベント が起きていない集団について、時点 t までに発生 するイベント数の期待値 ‑R ( t o, t ): 時点 t 。以降に登録される集団について、時点 t ま でに発生するイベント数の期待値 5 ‑ 1 5 5 ‑

157.
[beta]
.
=
!
‑
:
.
‑
シ
三
;
ン

推定方法

論文紹介①

‑単位時間 C
e
x
.
1日)当たりの登録症例数にポアソン
分布、イベント及び脱落発生までの時間に指数分
布を仮定
ーポアソン分布(母数 :μ)
》

μ の最尤推定量は 登録例数/登録期間(日) "

指数分布(母数

A
E
v
e
n
t'A白 n
s
o
r)

)A
n
t の最尤推定量!ま イベント発生例数/総観察人目"
νe
E
》らn町の最尤推定量は

脱落発生例数/総観察人目"

t

‑時点 。まで、のデータより μ、AEv側、もnsorの推定値
を求め、 Q
(
t
'
t
)と R
(
t
o,
t
)を算出
o
6

.
.

~'lミJ 三ン

推定方法

論文紹介①

"
[
1exp{‑ん
(vent+"伽sorX
t‑
o
t)
}
]

t
(
'
t
)=
N
(
t
)
o
o

・

N
(
t
o
J 時点 t
oで既に登録されていてイベントが起きていない症例の数)

J
T
L
o
r川 ・ 州A
r
:
;
;
:
;
f
i
t
‑
t
o
)
)
]

叫
んt
)
=A

.
1

A

・特定の時点におけるイベント数を求める場合
1)より直接求める
→式 (
‑特定のイベント数が集積される時点を求める場合

→式 (
1)を用いて逐次的に求める
1)を用いてニュートン法により求める
→式 (
7

‑
1
5
6
‑

158.

主シシミ"‑ン 推定方法 論文紹介① ‑ベイズ流アプローチによる95%信頼区間の算出 ‑各母数の事前分布に無情報事前分布を導入 一時点 t 。までのデータを用いて、各母数の事後分布を求め、そ の事後分布に従う乱数を発生させる 一得られた母数に基づ、くポアソン分布および、指数分布に従う乱 。以降の症例単位でのシミュレーション 数を発生させ、時点、 t 標本を得る ‑各シュミレーション標本から関心のある統計量(特定の時点 におけるイベント数または特定のイベント数が集積される時 点)を算出し、その 2.5%点を信頼下限値、 97.5%点を信頼上 限値として信頼区間を得る 8 ν。とシシミLニν 三 ー ニ 推定方法 ' 1 論文紹介② ‑イベント及び脱落発生までの時間にワイブル分布を仮 定した推定 YingGSandH e i t j a nDF W e i b u l lp r e d i c t i o nofe v e n tt i m e si nc l i n i c a lt r i a l s PharmaceuticalS t a t i s t i c s2007;7‑2:107‑120 ‑前述のベイズ、流アプローチと同様のシミュレーションによ り得られる50%点から点推定値、 2.5%点‑97.5%点か ら95%信頼区間を得る 9 ‑ 1 5 7・

159.

[;f~…一恰ぷ一ふ……ア折肝均… f伊判テ丹ヲ で ち み 牛 皐 l i l i i i i斗 ι」ι ι SASプログラム&アウトプット ))発表時にお示し致します 10 安F Ir!J--Pc;;~~:浩司守弱曙 当日こンヨンシ三ン 考察 ‑得られた結果は、以下の点で有用となり得る ‑解析実施時期の予測 ‑観察期間延長の検討 ‑症例登録進捗の調整 ただし、 ・仮定した分布の妥当性を確認する必要がある 1 1 ‑ 1 5 8 ‑ 4

160.

E * 1 . 孟畳屋 ヨ〉シ ιン まとめ • i 特定の時点におけるイベント数」及び「特定のイベント 数が集積される時点」を SASプログラムを用いて推定 一イベント及び脱落発生までの時間に指数分布を仮定 ーイベント及び脱落発生までの時間にワイブル分布を仮定 ‑実用化に際しては各臨床試験の状況に応じた検討が必 要となるが、イベントの発現状況を監視するモニタリング ツールとしては有用であると考えられる 1 2 EE霊~豆童話記 参考文献 Predictinganalysistimesi nrandomizedc l i n i c a lt r i a l s t a t i s t i c si nmedicine2001; 2 0・1 4 : B a g i e l l aEandH e i t j a n,S 2055‑2063 Weibullpredictionofeventtimesi nc l i n i c a lt r i a l sYing h a r m a c e u t i c a lS t a t i s t i c s2 0 0 7 ; 7 ‑ 2 : GSandH e i t j a nDF,P 107‑120 !E 淳" 8 # 1 動停が SASI ご' c t l ) ! E I O A 官房大橋靖雄浜田知久馬東 京大学出版会 2002 1 3 ‑ 1 5 9・

161.

2つの生存関数の差に対する同時信頼区間 0 平 井 健 太 I・吉田祐樹 2 ・田崎武信 2 1{主商情報システム(株) データサイエンス部ビジネスパートナー 2塩野義製薬(株) 解析センター S i m u l t a n e o u sc o n f i d e n c ei n t e r v a l sf o rt h ed i f f e r e n c eoftwos u r v i v a lf u n c t i o n su s i n gSAS o s h i d a2/TakenobuT a s a k i2 KentaH i r a i1/YuukiY , 1D ataS c i e n c eD i v .B u s i n e s sP a r t n e rSumishoComputerS y s t e m sC o r p . , . tS h i o n o g i& C o ., L t d . 2B i o s t a t i s t i c sDep 要旨 ひとつの生存関数に対する同時信頼区間は SASの最新の評価版で利用可能になった。しかし、群間比較 では差のほうがより直接的に解釈あるいは評価できる。 2つの生存関数の差に対するノンパラメトリッ クな同時信頼区聞が P a r z e n,WeiandY i n g (1 9 9 7 )で提案されていることを知った。その提案法に基づいて、 2つの生存曲線の差に対する同時信頼区間を、時点ごとの信頼区間と一緒に描く SASプログラムを開発 した。本稿ではそのプログラムを紹介する。そして、同時信頼区間と検定との関係について言及する。 さらに、同時信頼区間の広狭に影響する因子について考察する。 キーワード:生存関数の差、同時信頼区間 1.はじめに 最初に、 SAS9 .1 .3の L i f e t e s tプロシジャのヘルプの E x a m p l e4 0 . 2で紹介されている例を図 lに示す。ただ し 、 AItを除外し、 L o w ‑ r i s k群と H i g h ‑ r i s k群のみをとり上げていることに注意されたい。 2つの生存関数に は大きな差が見られる。しかし、この差の統計的有意性を解釈・評価するためには差の信頼区間を見るほう l .( 19 9 7 )にもとづいて 2つの生存関数の差に対する同時 がより直接的であろう。今回、私たちは、 P a r z e ne ta 信頼区間を算出し、それを時点ごとの信頼区間と一緒に描く SASプログラムを開発した。このプログラムか らのアウトプットを図 2に示す。 161‑ ー

162.

95' サ J~イ J~ ージヲ 1 1;::対する H.IトWellner の信組 J~ジ F 「ーロピ? f t │ OB 06 ー 体 制 0 . ' 02 " 咽 4 200 ・ , .・ ・ Tim R IP同 800 図 l 群ごとの生存関数の同時信頼区間 ‑‑‑‑‑‑‑‑‑ ウt ρ n v F h リ nリ ハ リ ハ リ ハ リ ハ リ ハ リ ハ リ ハ 4什A n ︿ り つ ム r 円り ハU ︒ 口 ウt 円り ハ リ 円U nり ρ o 円U ‑ h u nり f 円 円り lU ﹃け u 円 n u n u n u つh 1よ AU nり よ円り 1 Unり 1よ ハ リ T im e Lo R e l日 p s e 図 2 2つの生存関数の差に対する同時信頼区間 2 . 開発した SASプログラムの検証 P a r z e ne ta 1 .( 19 9 7 )の提案にもとづいて開発した SASプログラムを付録に示す。なお、 P a r z e ne ta 1.はマルチ 2 0 0 9 )はそれをブートストラップ理論におきかえた類似の同時信頼区 ンゲール理論を利用しているが、吉田他 ( a r z e ne ta . l( 19 9 7 )に掲載されていた図を再 間を提案している。開発したプログラムのバリデーションとして P 4 . 8 %になることを 現した。別に、小規模のシミュレーション研究で、名目 95%の同時信頼区間の被覆率が 9 確かめた。 ‑ 1 6 2・

163.

3 . 議論 3 .1 . 検定との関係 2つの生存曲線の差の検定で、はログランク検定と一般化 Wilcoxon検定が多用されている。これらの検定と 同時信頼区間の関係は興味深い。なお、生存曲線の差に関して比較検定で差が有意にならないもので信頼区 間を構成することは困難であろう。逆に、信頼区間の下限がゼロを超える(または信頼区間の上限がゼロを 超えなし、)場合に有意差と宣言するとし、う方法は直哉的である。ある小規模のシミュレーション研究で見ら れた関係を表 1に示す。 表 1 信頼区間と検定の関係 険定で有意 検定で有意 険定で、有意でない 検定で有意でな J かっ信頼区間下限 かっ信頼区間下限 かっ信頼区間下限 かっ信頼区間下 がゼロを超える 同時信頼区間 がゼロを超えない がゼロを超える がゼロを超えない 65.1% 15.3% 1.6% 18.0% 63.5% 11.8% 3.2% 21.5% ポイントワイズ信 80. 4% 0.0% 16.6% 3.0% 頼区間 75.3% 0.0% 21 .3% 3.0% 上段がログランク検定、下段が一般化 Wilcoxon検定 シミュレーション条件:生存時間をエンドポイン卜とする l 群 100例の 2群並行群間比較試験を想定した. 応答変数である生存時聞は指数分布を仮定し、群 lの5年生存率を 50%、群2の5年生 存率を 33.5%として発生させた 年以上生存の場合は打ち切りと扱った. なお, 8 このシミュレーション条件での検出力は約 80%である. 3ユ 同時信頼区間の広狭に影響する因子 P a r z e ne tal . (1 9 9 7 )の方法についての説明を割愛するが、その方法では同時信頼区聞がポイントワイズ信頼区間 の幅に比例する形で求められる。このときの比例係数に影響する因子を調べてみた。とりあげた因子(水準) は症例数 (100例と 200例)、中途打ち切り観測値の割合 (10%と 20%)、中途打ち切り観測値の集中時期(前 半と後半)である。セル内繰り返し数を 50としたときの分散分析で、 3因子はすべて有意、交互作用はいず れも有意性から遠かった。寄与率では症例数が抜きん出ていた。比例係数は、症例数が多いほど、中途打ち 切り観測値が少ないほど、そして中途打ち切り観測値が前半に集中するほうが、大きかった。これらは想定 外のことであったが、症例数と中途打ち切り率に関する結果は、ポイントワイズ信頼区間の幅が狭いほど比 例係数は大きくなる傾向にあることを示唆していた。 ‑ 1 6 3・

164.
[beta]
4
. 応用例
DerandE
v
e
r
i此(
2
0
0
1
)で紹介されている胃がんデータでは前半での差が注目される。この前半に焦点をあてた
a
r
z
e
ne
ta
l
.
(
l9
9
7
)の 2つめの例で、は後半で、の差が興味深い。この後半
同時信頼区間を図 3に示す。いっぽう、 P
についての同時信頼区間を図 4に示す。

cl
.0
0
。

ケL

守

.
.
.
u

Z

之O
.75
0

.
.

i
:O
.5
0
』

.
.
.

‑
<
I
l

回同

ロ0
.
2
5
c
〉

・同

〉

;0.00

Uコ

。

2
5
0

5
0
0

7
5
0

1
0
0
0

1
2
5
0

1
5
0
0

1
7
5
0

d日ys

.
'
.
CC'!lsorC'dgroup 1

S
T
R
A
T
A
:‑group=1
ニ
コ2
‑
g
r
o
u
J

三

.CC!ls
o
r
c
d group=2

O
.7
0
.
6
0
.
5
0
.
4
0
.
3
O
.2
O
.1
O.O~

0
.
1
1

0
.
2
0
.
3
0

2
5
0

5
0
0

7
5
0

1
0
0
0

1
2
5
0

d日ys

T
e
s
t

C
h
i
‑
S
q
u
a
r
e

・S
q
u
a
r
e
Pr>C
h
i

ログランク

5
.
7
6
2
9

0
.
0
1
6
4

Wilcoxon

8
.
5
7
7
9

0
.
0
0
3
4

v
e
r
i口(
2
0
0
1
)の胃がんデータ
図 3 DerandE

‑
1
6
41
5
0
0

1
7
5
0

165.

巳 1 .00 。 ~ " u 之O .7 5 C c o 一司剖 . E0 .50 ﹄判的 ロ0 .25 に﹀ 日U ハU n u ﹀﹄コ凹 。 1 0 5 1 5 日rHAT^・ g r口u p = 1 group=2 2 0 2 5 3 0 3 5 month 一仁川l s o rC'dgr口up=1 CC'l l s o rC'd group=2 40 4 5 1 .0 O .8 0.6 j? 0.4 0.2 r ‑ v 0.0 0.2 "y‑‑‑ 0.4 η ﹁ ︑ JP 2 0 2 5 month 1 5 ︐ ハ リ qd ー 5 ハ リ ‑0.6 0 40 4 5 図4 P a r z e ne ta l . (1 9 9 7 )の子宮がんデータ 1 .0 O .8 O .6 0.4 0.2 ~一一一一 0.2 0.4 。 ‑0.6 2 3 4 5 6 7 8 9 month T e s t ログランク Wilcoxon 1 0 1 1 1 2 1 : 3 1 4 1 5 1 6 Pr>C h i ‑ S q u a r e 誤判 0 . 0 2 1 0 0 . 0 7 9 6 図4 . 1 P a r z e ne ta 1. (1997) の子宮がんデータ (month=I~16 部分を拡大) ‑ 1 6 5・

166.

5 . まとめ P a r z e ne ta l . (1 9 9 7 )の方法にもとづいて 2つの生存関数の差に対する同時信頼区間を計算する SASプログラム を開発した。同時信頼区間は差を直接解釈・評価するのに有用である。さらに、同時信頼区間とポイントワ イズ信頼区間の特徴を理解したうえで、それらを一緒に表示することはより有意義であると考えられる。 参考文献 1 )吉田祐樹・平井健太・田崎武信 ( 2 0 0 9 ) .ブートストラップサンプリングによる生存関数の差の同時信頼区 間の構築. (日本計量生物学会年会に提出したが、新型インフルエンザの影響でこの年会の開催は中止され た.) 2 わ )P a ロE 回n n 白m c t i o n s .Scand . J .S t a t i s t .,2 4,3 0 9 ‑ 3 1 4 . 3 )D e r , Ga n dE v e r i 仕 ,S . ( 2 0 01 ) .Handbook01S t a t i s t i c a lA n a l y s e sU s i n gSAS ,SecondE d i t i o n,CHAPMAN& HAL L . ‑ 1 6 6・

167.
[beta]
付録: 2つの生存関数の差に対する同時信頼区間のための SASプログラム
/
ヨ
軍 事*
xS
i
m
u
l
t
a
n
e
o
u
sc
o
n
f
i
d
e
n
c
ei
n
t
e
r
v
a
l
sf
o
rt
h
ed
i
f
f
e
r
e
n
c
e

/之本本本 o
ft
w
os
u
r
vi
v
aIf
u
n
c
ti
o
n
s
/*本*本 P
a
r
z
e
n
.M
..
1 W
e
i
.L
.J
. a
n
dY
i門g
.Z
.(
1
9
9
7
)

本不本式/
*,*寓/

j
ff
i
r
s
t
.
&
g
r
o
u
p
.t
h
e
nd
o
:
s =
f

判院本. . /

抽闇 c
r
op
a
r
z
e
n
{

i
n
d
a
t
a
.
g
r
o
u
p
,t
i
m
e
c
e
n
s
o
r
.
t
i
m
e
̲
1
,t
i
m
e
̲
u
.
a
l
p
h
a
.l
o
o
p
̲
n
.
t
y
p
e
.
g
r
a
p
h
o
u
t
.
p
w
o
u
t

=

S8 =

内使用デーヲセット
/‑群(数値変数でrIl.[
2
]のデ

e
n
d

.
‑
r
.
/

ヲを作成しておく)キ

i
fS
u
r
v
i
v
a
ln
e then̲5
=S
u
r
v
i
v
a
l
:
e
[
s
eS
u
r
v
i
v
a
l= s
;
ま/
i
fF
a
il
u
r
en
e t
h
e
n f
=F
a
il
u
r
e
:
ザ
e
l
s
eF
a
i
l
u
r
e = f
:
=0
.
0
5/
, a
l
p
h
a
"
: i
fS
t
d
E
r
rn
e
=S
t
d
E
r
r
:
t
h
e
n̲
s
e
=1
0
0
0 /‑推定回数
本/
e
:
e
l
s
eS
t
d
E
r
r = s
= 1 /.生存関数の差の計算 (
[
1
] 群 1群 2
.[
2
] 群 2群 1
)*
!r
u
n
:
=Y /本グラフ出力の有無 C
Y
' 有 /O
t
h
e
r 無)
,
/
=Y /百円i
信頼区間の有無 CY 有 /O
t
h
e
r 無)
,/ /キ同一時間のデ ヲは重複削除*/
)
:
̲
Ii
f
e
t
e
s
t
2o
u
t=
̲
Ii
f
e
t
e
s
t
2n
o
d
u
p
k
e
y
:
p
r
o
cs
o
r
td
a
t
a=
b
y&
g
r
o
u
p
.&
t
i
m
e
.S
u
r
v
i
v
a
lF
a
il
u
r
eS
t
d
E
r
r
:
o
p
ti
o
n
sn
o
m
p
rj
n
tn
o
m[
o
g
icn
o
s
o
u
r
c
en
o
n
o
t
e
s
;
r
u
n
;
/平時聞

が

/キ打ち切り (
[
1
] イベント
[
0
] 打ち切り)
/本指定する場合[立、 [
ti
m
e
̲
u
]とベアで指定する
内指定する場合I
;
j
:
̲[
ti
m
e
̲
l
]とベアで指定する

恥

a
t
a
.o
u
t=̲
b
a
s
e
:b
y&~roup.: r
u
n
:
p
r
o
cs
o
r
td
a
t
a =品川 d

/不一一群 ~IJ に分割し、慣に結合一一*/

d
a
t
a̲
g
r
o
u
p
l̲
g
r
o
u
p
2
:
s
e
t Ii
f
e
t
e
s
t
2
:
i
f匂 r
o
u
p = 1t
h
e
no
u
t
p
u
t̲
gr
o
u
p
l
:
i
f品g
r
o
u
p =
2t
h
e
no
u
t
p
u
t̲
g
r
o
u
p
2
:
r
u
n
:

/ホ一一 P
R
O
CL
IF
E
T
E
S
Tーーす/

u
d
eaII
:
o
d
se
x
cI
i
f
e
t
e
s
td
a
t
a=
̲
b
a
s
e
:
p
r
o
cI
m
e 準品 c
e
n
s
o
r
.(
0
)
:
ti
m
e品tI
s
t
r
a
t
a品g
r
o
u
p
.;
一 Iifetest:
o
d
so
u
t
p
u
tP
r
o
d
u
c
t
L
i
m
i
t
E
s
t
i
m
a
t
e
s=
r
u
n
:
o
d
se
x
c
l
u
d
en
o
n
e
:

d
a
t
a Ii
f
e
t
e
s
t
3
:
S
u
r
v
I
v
a
l =S
u
r
v
i
v
a
l
l
m
e
r
g
e̲
g
r
o
u
p
l(
r
e
n
a
m
e= (
a
il
u
r
e
l
F
a
il
u
r
e =F
S
t
d
E
rr =S
t
d
E
r
r1
)
)
̲
g
r
o
u
p
2(
k
e
e
p =&
tI
m
e
.S
u
r
vi
v
aIF
ai
I
u
r
eS
t
d
E
r
r
r
e
n
a
m
e= (
S
u
r
vi
v
aI=Survi
v
aI
2
F
a
il
u
r
e =F
a
il
u
r
e
2
t
d
E
r
r
2
S
t
d
E
r
r =S
)
)

首i
f官u
p
c
a
s
e(
"
品g
r
a
p
h
o
ut
."
) ="
Y
"首t
h
e
n帖d
o
:

p
r
o
c Ii
f
e
t
e
s
td
a
t
a= b
a
s
e pJ
o
t
s= (
s
)n
o
p
ri
n
t
:
ti
m
e品ti
m
e 事品c
e
n
s
or
.(
0
):
s
t
r
a
t
a品group:
r
u
n
:
%
e
n
d
:
j. ̲̲̲ L
IF
E
T
E
S
Tの結果から、存在する時間を全て抽出
ザ
Ii
f
e
t
e
s
t(
k
e
e
p=品 t
i
m
e
.
)o
u
t =̲
t
e
m
p
l
a
t
en
o
d
u
p
k
e
y
:
p
r
o
cs
o
r
td
a
t
a =̲

i
m
e
.
b
y品t
r
u
n
:

/*イ (
t
)を計算キ/
̲
t
e
m
p=s
u
m
(S
t
d
E
r
r
l 梓 2.S
t
d
E
r
r
2*
*2)
:
h
e
n v=1/s
q
r
tしt
e
m
p
):
i
f̲
t
e
m
p>0t
e
l
s
e v=
r
u
n
:

d
a
t
a̲
t
e
m
p
l
a
t
e
:
s
e
t̲
t
e
m
p
l
a
t
e
:
r
o
u
p
. =1
.
2
:
d
o品g
o
u
t
p
u
t
:
e
n
d
:
r
u
n
:

/*一一興味のある時間が未指定の場合のデフォルト処理

目

h
e
no
u
t
p
u
t
:
i
f̲
f
l
g= 1t
r
u
n
;

興味のある時間 [
u
1 く= ti
m
e<
=u2]にフラグを立てる
d
a
t
a Ii
f
e
t
e
s
t
3
:
s
e
t Ii
f
e
t
e
s
t
3
:
i
f品t
i
m
e1
. <=品 t
i
m
e
. &品 t
i
m
e
. <=品 ti
m
e
̲
u
.t
h
e
nd
o
̲
t
i
m
e
̲
f
l
g= 1
:
e
n
d
:
r
u
n
:

/
文

‑
1
6
7・

))
))

‑‑

ρuρu

bb

t
t
ss

阿川阿川

nvnv
︐︐

e
e
mmmm
t
t
ohuea
(
(
t
ut
u

‑

叩叩

︐︐
i
u
ee
tt
t
ut
u

︐
({

L
戸
U︾ 戸 L
U︾

ys
y
s

白
u

S
u
r
vi
v
a.
1F
ai
I
u
r
e
.S
t
d
E
r
rが 欠 測 の 場 合 、 直 前 の 値 で 補 完 一 一 吋
Ii
f
e
t
e
s
t
2(
k
e
e
p=&
g
r
o
u
p 品t
i
m
e
.S
u
r
v
i
v
a
lF
a
il
u
r
eS
t
d
E
r
r
)
:
d
a
t
a̲
s
e
t Ii
f
e
t
e
s
t
:
r
o
u
p 品t
i
m
e
.;
b
y品g
r
e
t
a
i
n s f s
e
:

F
+
T
1 →
l l
﹃
aa

r
a
u
p 品ti
m
8
.
b
y品g
r
u
n
:

﹄

d
a
t
a I
i
f
e
t
e
s
t
:
Ii
f
e
t
e
s
t
m
e
r
g
e̲
t
e
m
pI
a
t
e

︒

=e
ne
n
d+
h
h
n
L+
・‑e
1
nv
Il
m=
l
ue
t‑f
n‑UNO
‑
‑‑e
t
aUF+IF+10J
ロ
tas
elinn

一本/

d
a
t
a̲
t
e
m
p
:
f
e
t
e
s
t
3
:
s
e
t Ii
i
f(
S
u
r
v
i
v
a
l
l >0品 S
u
r
v
i
v
a
l
2>0
)品
(
S
u
r
v
i
v
a
l
l <1o
rS
u
r
v
i
v
a
l
2 <1
)t
h
e
n̲
f
l
g= 1
:

ar
uz
e
d

p
r
o
cs
o
r
td
a
t
a =̲
t
e
m
p
l
a
t
eo
u
t=
ーtempIate
b
y&
g
r
o
u
p
.&
ti
m
e
.
r
u
n
;

/
準

ーキ/

覧i
f"
品t
i
m
e1
.
"=
… or "&timeu."=…也then首d
o
:

p
r
o
cs
o
r
td
a
t
a=
一 Iifetest out=
一 Iifetest:
b
y&
g
r
o
u
p
.&
t
i
m
e
.d
e
s
c
e
n
d
i
n
gS
u
r
v
i
v
a
l
:
r
u
n
;

/寧一一両群に同じ時間をもたせる

b
y品ti
m
e:

ザ

168.
[beta]
/ホホホネ U(
t
)を計算するマヴ口一一一一一一一一一一一一一一一一一
伽1
8
c
r
o̲
u
t(
g
r
p
):

/
.x
[
i
k
J>
=x[ijJ を計算ホ/
c
n
t=0
:
m
e
d
o k=品 kti
i
f̲
k>
=̲i then̲cnt=̲cnt+ 1
:
e
n
d
:

り

t
i
m
e
.&
c
e
n
s
o
r
.&
g
r
o
u
p
.
)
:
d
a
t
a̲
pi
c
k
u
p
(
k
e
e
p=&
s
e
t̲
b
a
s
e(
w
h
e
r
e= (
&
g
r
o
u
p
. =&
g
r
p
.
)
):
r
u
n
;
/ホ一一時間・打ち切りのデーヲを横結合=マヲロ変数に格納一

本/

/ホ標準正規分布に従う乱数本/

z= r
a
n
n
o
rー
(1
)
;

d
a
t
a n
u[
[
o
f
:
s
e
t̲
pi
c
k
u
pe
n
d= e
[
e
n
g
t
h̲
t
e
x
t̲
c
e
n
s
o
r$
2
0
0
0
.:
r
e
t
ai
n̲
t
e
x
t̲
c
e
n
s
o
r
;

d
ot=品 tt
r
m
e
/
ホ x
[
ij
J<
=t を計算ネ/
i
f し<=t
)t
h
e
n̲
f
[
g= 1
:
e
[
s
e̲
f
[
g=0
:

h
e
nd
o
:
i
f N = 1t
聞 p
r
e
s
s
(
p
u
t
(
&
t
i
m
e
. ,b
e
s
t
.
)
)
:
̲
t
e
x
t =c
c
e
n
s
o
r =c
o
m
p
r
e
s
s(
p
u
t(
&
c
e
n
s
o
r
.,b
e
s
t
.
)
):
e
n
d
:
e
[
s
ed
o
:
̲
t
e
x
t ;
:c
o
m
p
r
e
s
sしt
e
x
t1 ,
.
γ
.
. 1 put(&time,best)):
r
i
m
(
[
e
f
tしc
e
n
s
o
r
)
) 1 ""1
̲
c
e
n
s
o
r=t
c
o
m
p
r
e
s
s(
p
u
t(
&
c
e
n
s
o
r
.,b
e
s
t
.)
):
e
n
d
:

1 /̲
c
n
t
) ホ しf
[
gホ c
e
n
s
o
rし i
2
) ホ z):
t
e
m
p=(
/. ~.十算結果が日以外のデーヲのみ抽出歩/

i
f̲
t
e
m
pn
e 0t
h
e
no
u
t
p
u
t
:
e
n
d
:
e
n
d
:
e
n
d
:
r
u
n
;

n+ 1
;

̲
u
t
&
g
r
p
.o
u
t=
̲
u
t
&
g
r
p
. b
y̲
[
o
o
pt
:r
u
n
:
p
r
o
cs
o
r
td
a
t
a=

i
fe
o
ft
h
e
nd
o
:
'
(k̲time",̲text)
c
a[ s
y
m
p
u
t
x二
c
a[ s
y
m
p
u
t
xC
'̲
c
e
n
s
o
r
",̲
c
e
n
s
o
r
):
c
a[ s
y
m
p
u
t
xC
'̲
n
"
,p
u
tしn
,b
e
s
t
.
)
)
:
e
n
d
:
r
u
n
;

U
(
t
)を計算雲
d
a
t
a̲
u
t
&
g
r
p
s
e
t̲
u
t
&
g
r
p:
b
y̲
[
o
o
pt
:
r
e
t
ajn u
t
;

/
ネ

目

宇/

/率一̲̲ tに 該 当 す る 時 間 を 検 結 合 司 マ ヲ ロ 変 数 に 格 納

市/

i
ff
ir
s
t
.tt
h
e
nd
o
:
̲
u
t=0
:
e
n
d
:

p
r
o
cs
o
r
td
a
t
a=̲
p
i
c
k
u
p
(
k
e
e
p=&
t
i
m
e
.
)o
u
t=̲
t
e
m
pn
o
d
u
p
k
e
y
:
b
y&
t
i
m
e
.:
r
u
n
;

u
t= s
u
mしu
t,̲
t
e
m
p
):
d
a
t
a n
u[
[
s
e
t̲
t
e
m
pe
n
d=e
o
f
:
[
e
n
g
t
h̲
t
e
x
tS
2
0
0
0
.
r
e
t
ai
nt
e
x
t
;

i
f[
a
s
t
.tt
h
e
no
u
t
p
u
t
:
r
u
n
;
f
e
t
e
s
t
4o
u
t=ー I
i
f
e
t
e
s
t
4
:b
y̲
[
o
o
pt
:r
u
n
:
p
r
o
cs
o
r
td
a
t
a=一[i

i
f N = 1t
h
e
nd
o
:
o
m
p
r
e
s
s(
p
u
t(
&
ti
m
e
.,b
e
s
t
.)
):
̲
t
e
x
t= c
e
n
d
:
e
[
s
ed
o
:
o
m
p
r
e
s
sしt
e
x
t 1 ""1 p
u
t(
&
ti
m
e
.
.b
e
s
t
.)
):
̲
t
e
x
t= c
e
n
d
:

U
(
t
)を計算③ L
I
F
E
T
E
S
Tの結果と結合し、 U(
t
)を 求 め る 一 ̲ ~/
d
a
t
a̲
u
t
&
g
r
p(
k
e
e
p =&
g
r
o
u
p
.̲
[
o
o
pS
u
r
v
i
v
a
[
: tvU
r
e
n
a
m
e=(
t=
&
t
i
m
e
.
)
)
:
m
e
r
g
e̲
u
t
&
g
r
p
一[i
f
e
t
e
s
t
4

/
本

i
fe
o
ft
h
e
nd
o
:
c
a[ s
y
m
p
u
t
x二
'
(t̲time",̲text):
e
n
d
:
r
u
n
:

b
y̲
[
o
o
pt
:
r
e
t
a
i
nU
:
i
ff
ir
s
t
.̲
[
o
o
pt
h
e
nd
o
:
U=0
:

/
*̲
̲
̲LIFETESTの結果をループ回数分増幅させる

*
/

e
n
d
:
&
g
r
o
u
p =&
g
r
p
.
ホホ

))
t
ut
u

12
av
a
v
el‑‑

ru vru ‑ ‑

us
u
s
({

υ
日

‑
1
6
8・

υ
日

b
y̲
[
o
o
p&
t
i
m
e
.
:

==

d
a
t
a u
t
:
s
e
t u
t
l
u
t
2

+
l
‑

←

本/

﹄

o&
I
o
o
pn
.
d
o̲
[
o
o
p= 1t
i
2=0
:
d
o i=&kti
m
e
i
2+ 1
:

首u
t(
2
)
: /率一一群2

+
I

'
L
u
t(
1
)
: / 本 群 1̲
̲
̲.
/
/不打ち切りの情報を配列!こ格納本/
a
r
r
a
y̲
c
e
n
s
o
r晶
( n
.
)(
&
̲
c
e
n
s
o
r
.
)
:

nHnH
e
e
hHthH

伽e
n
d
:

配剤︑J

̲̲U(
t
)を計算①一一本/
d
a
t
a̲
u
t
&
g
r
p
.(
k
e
e
p=̲
[
o
o
pt̲
t
e
m
p
)
:

d

︑
ω
r
u
n
:

22

町 司 ︑J

w

岬
︑

r
u
n
:
/
・

0
= oロ=
AUJ

F

︑
岬
附
︑
川
川
問
w

d
nd
n
L ι
h耐

av
a
v

耐
恥
‑
︐
‑
.
2
1

︑a
︑

p
ouFu

pp

vv
r
ur
u

o
ro
T
d
d

w

d苅d克

12

t布t
w有

tt
n
u
n
u
ρw‑au‑
h
'
h
'
t
1t
2
苅l
a
U苅 l l w
a
a
1V
2
v
=r
v=
rv
u
u
n
pa
n﹁
v{
rv{
向
Ea
n.
E@
n︑
@
a.
亭
+ 1 !u s I Jロ
f
n
パ
li
e刊
lfe! n

nvw

n 一o o

onn
ai lh‑ uhρ M

to w

唱

OJOSIs‑

1
==
=
ptpp
o
u rgr
on
bgb
l
tv
aa
一
u
:

oe
nZ
ii
d

︒

d
a
t
a̲
[i
f
e
t
e
s
t
4
:
s
e
t̲
[i
f
e
t
e
s
t
3
(
k
e
e
p =S
u
r
v
i
v
a
[
:&
t
i
m
e
. vr
e
n
a
m
e=(
&
t
i
m
e
. =t
)
)
:

169.

1 /v ); P̲L=dif‑pw本 ( P ̲H= di f+ pw本 ( 1 /v ) ; r u n . i f 品t ( i m e I <=品ti m e .)品(品ti m e . <=品ti m e ̲ u . ) then d o ; o u t p u t ; e n d ; r u n . data graph( k e e p = categ v aI u e品ti m e) : s e t̲ graph: p r o c transposedata = ̲ u t o u t = ̲ut( w h e r e = (̲NAME̲ne…)) prefix = U ; v a rU : copy v ; by̲Ioop 品time i d品g r o u p ., format 品ti m e r u n ; / .キ . . U(t) 計算終了 一一_~____________________________ G を計算 不/ d a t a̲fi n aI( k e e p= 一 loopG seq Vt): s e t u te n d=e o f : b y̲ I o o p : す / x categ= 1 : value= d i f : output: 百i fもupcase( " 品p w o u t ." ) =' ' Y ' ' 首 then 唱d o ; categ= 4 : value = P ̲ L : output categ= 5 : value= P ̲ H : output: 首e n d : i f̲time̲flg= 1then d o : categ= 2 :v aI u e =日 L : output: categ= 3 : value =日 ̲H output: e n d : r u n . 目 ' 品graphout づ =' ' Y ' ' 世 then 唱d o : 百i f唱upcase( s y m b o l l c= black I= 1v = none i= j : symboI 2c= r e d I= 1v = none i= j : symboI 3 c= r e d = 1v = none i= j : 首i f首upcaseC 品p w o u t ." ) =' ' Y ' ' 明 then 唱d o : symbol4 c = blue I= 1v = none i= j I= 2 : symbol5 c = blue I= 1v = none = j I= 2 ; 唱e n d : r e t a i nG : i ff ir s t .ーl o o pthen G = /本降順の上位から n番目の値を取得 [ n lま i n t(推定田敏 xa l p h a )で計算 1./ d a t a n u lI 蜘e ndp a r z e n : c a= i n t品 (l o o p ̲ n キ品a l p h a . ) : /,小錦点以下の切り捨てを行うザ c a lIsymputC̲ca",compress(put(̲ca,b e s t .) ) ) : r u n : 百g l o b a lc a : d a t a n uI I set̲final; i f N =品 c a . then d o : c a l l symput("ca",c聞 press(put(G,b e s t .) ) ) : e n d : r u n ; 明p u t c( a ) =品ca * / o : 弘i f 品t y p e . = 1首then百d d i f = Survivall ̲ Survival2: 胃e n d ; 事e lse%if品t y p e . = 2首then唱do d i f = Survival2 ̲ Survivall: 冒e n d : 日 一 L= d i f ̲品目 本 ( 1 /v ) : BH=dif+ 品 目 本 ( 1 /v ) : /本ポイントワイズ信頼区間本/ pw = probit(1 ̲ 品a ( lpha /2)): ‑ 1 6 9 ‑ 1 s x QUlt; o p ti ons source n o t e s ; a ‑ a s = 一 x a v A u n e σ ‑ o n S1 D ‑・ r r ' vo n e e = ‑ rn ca 不要デ ヲセットの削除一̲̲ * / p r o c datasets I i b r a r y= workmemtype = data n o li s t : gro叩 delete̲base̲ f i n a l ̲graph ̲ Ii f e t e s t : ̲j)i c k u p̲temp: ̲ u t : / < /本一一 G を 降 順 に 並 び 替 え ー * / p r o c sort data = ̲ f i n a lo u t = ̲final: by descendi ngG ; r u n . /本一一グラフ用にデ ‑1セットを作成 data̲ graph: s e t Ii f e t e s t 3 : by品group 品t i m e . E一 一 e l t e auLU 匂 i fl a s t .̲Ioopthen d o : s e q+ 1 ; o u t p u t : e n d ; r u n : ﹂ H= ﹄ < nvm a c4 r e σ m l 5 =e t a= a + I﹄ 事 ﹂ H a t de E u n + I' le o ‑ ‑a vl nvet E t s ol'' cl x a‑ tn d o a n rp u p ru qe 百 i fn ( U , IU 2,v ) = 3 then d o : Vt = vキ ( U 2̲ U1 ) : b s( V t ) then G = abs( V t ): i fG a e n d :

170.

バイオマーカーと薬剤の交互作用の検出に対する 最大対比法の適用 0水津純基,浜田知久馬 東京理科大学大学院工学研究科経営工学専攻 A p p l i c a t i o nofmaximumc o n t r a s tm e t h o d st od e t e c ti n t e r a c t i o nb e t w e e nb i o m a r k e randd r u g ChikumaHamada J u n k iMi却 sawa, TokyoU n i v e r s i t yo f S c i e n c e F a c u l t yo f E n g i n e e r i n g, 要旨 近年の抗がん剤開発では,分子標的薬の登場により,効果のあるサブ、グループに絞った薬剤開発がお こなわれるようになった.従来の殺細胞薬では見られなかった分子標的薬とバイオマーカーとの交互作 用により新たな薬剤開発の方針が要求されるようになっている.本稿では,薬剤とバイオマーカーの交 互作用の検出に最大対比法を適用し,シミュレーションにより性能を評価した結果を紹介する. キーワード:最大対比法,交互作用,サブ グ、ループ,多重性,バイオマーカー 1.はじめに 近年の抗がん剤開発では,分子標的薬の開発が盛んに行われている.分子標的薬は,特定のサフ守グ ループ にのみ治療効果が現れることがあり,特定のサブグループは,遺伝子発現量や血液などに含まれる生体試料 から得られるバイオマーカーにより特定されることが多い.重要な予測因子であるバイオマーカーを特定し, それを利用することで,個別化治療の進展につながると考えられるが,実臨床の場で用いるには適切な第 E 相試験を行って検証的な評価を行う必要がある ( S i m o n, 2 0 0 5 ).バイオマーカーが連続値で得られるとき,臨 床的・統計学的判断により,あるカットオフ値で効果のあるサブ、グ、ループと効果のないサブ、グ、ループに分割 する.この場合,効果のあるサブグ、ループのみを対象とした試験を行えばよいと考えられるが,以下のよう な理由により,全症例を対象とした第皿相試験が行われることがある. ・ ‑ 開発段階でカットオフ値を完全に特定することは困難である ( J i a n g, 2 0 0 7 ). あるサプグループに効果がないと考えられる確信が弱し、場合,試験の対象から外すことは倫理的で はない. ‑ 1 7 1 ‑

171.

‑ 将来的に薬剤を投与される可能性のある被験者に対する有効性・安全性を検討するため ・ ・ (Grouin, 2005). 開発の遅れを防ぐため. 薬剤の適応を広くとるため. このような場合,検証的な第皿相試験の中でバイオマーカーと薬剤効果の交 E作用を定量的に評価する必 要が出てくる.そのためのデザイン・解析法が Simonを中心とした NCIのグループで提案されている. 五ang(2007)は,多重性を考慮、して尤度を最大にするカットオフ値を探索しながら,薬剤効果を検証する解 析法を提案した.この方法は,連続値で得られるバイオマーカーの値をカットオフ値で効果のあるサブ、グ、ル ープと効果のないサブグループに分割している.しかしながら,正確なカットオフ値が存在し,それが求め 0 0 8 ) . 通常,バイオマーカーが連続値で得られる場合,薬剤j 効果はバ られるかどうかはわからない (Hoering,2 イオマーカーの値と相関して変化すると考えるほうが自然である.つまり,ある闇値から連続的に薬剤効果 が増大することが考えられる. 上記のようにカットオフ値が存在することを前提とせず,薬剤とバイオマーカーの関係を統一的に検討す る方法として最大対比法を適用することを提案する.最大対比法とは,多重比較法を統一的に扱う方法であ り,複数の対比を当てはめ,多重性を考慮して最大の対比を検定統計量とする手法である. 本稿では,バイオマーカーと薬剤との交E作用の検出に最大対比法を適用し,その有用性を検討する. 2 章で最大対比法の定式化を示し, 3章では,シミュレーション実験による結果を示す.最後にまとめを述べ る. なお,本稿では「バイオマーカーにの値によって薬剤の反応の大きさが異なること」を「バイオマーカー と薬剤の交E作用」と呼ぶことにする. ( 図 1 ) 標準薬Tl 効果 ( l o g ( H R ) } 新薬 T2 l o g ( H R ) } 効果 ( ︑ ︑ ︑ ︑ ︑ 交互作用なし 交互作用あり ︑ 。 。 旬。 バイオマーカー 。 パィ与マーカー 図 1 バイオマーカーと薬剤の交互作用の概念図 ‑172・

172.

2 . 最大対比法 上に述べたように,最大対比法とは様々な多重比較法を統一的に表現して扱う方法である.一組の線形仮 説に対応する対比を複数当てはめ,それをスチューデント化した統計量のうち,多重性を考慮して最大の対 比を検定統計量とする.この手法は毒性試験や用量相関性の解析に提案されているものである. 2 . 1 試験デザインの想定 本稿では,通常のがんを対象とした第 E相試験で行われる状況を想定する.つまり,標準薬群 ( T 1 )と新薬 T 2 )の 2群のランダム化比較試験において,評価項目として対象とするイベントが起こるまでの時間 ( t )を 群( 用いる. 6 )に関して以下の仮定をおく. また,バイオマーカー ( ・ ・ ・ バイオマーカーは連続値で得られるものとする. 薬剤との交 E作用効果があると考えられるバイオマーカーの候補は lつに定まっているとする. 得られるバイオマーカーは経験分布関数のパーセント点を用いて区間 ( 0,1 )の値を取るように変数変換 を行う. ・ 区間 [ O, I Jの値を取るように変数変換した値を, T, l T2群ごとに K 個のカテゴリーに分割する. : < : ;0 . 2が l番目のカテゴリー, 0 . 2く θ : < : ; 0.4が 2番目のカテゴリーとなる. 例えば K=5の場合, 0く θ 2 . 2Coxの比例ハザード、モデル 解析は, Coxの比例ハザード、モデ、ルを用いて行う.モデル式は ( 1 )式のように表わされる. ( ) ‑ 的)=九叫 h ( t ): ハザード関数 h o( t ): 基準ノ、ザード関数 民: i番目のパラメータ d ;: i番目のダミー変数 iは 2群を通してのカテゴリ一番号を示す . i=l‑KはT1群, i= K +1‑2Kは T2群を表す. 2 . 3 最大対比法の定式化 以下の議論では,帰無仮説としてバイオマーカーと薬剤l の交互作用がないこと,すなわち , Ho: c's=O を想定する.ここで, cは対比ベクトル • ~2K c=(c],c ・ ‑ ‑ ,C 2 K ) ',〉t = l C z = O を表し, s は ( 1 )式のパラメータ 2, ベクトル s =(β],β2, . ・ ・ , β' 2K)'を表す. ( 1 )式により求めたパラメータベクトル Pの最尤推定値を s= (β],β2, . ・ ・ , β2K)'とすると,対比ベクトノレ cに対する対比統計量 zは( 2 )式のように表わされる. ‑ 1 7 3・

173.

辰五7 ( 2 ) V(P)は,共分散行列の推定値を表す. ( 2 )式のように定式化した対比統計量を m 組用意し, m 組の対比統計 量の最大値 z 耐を検定統計量とする.つまり, a x z, ロl a x= m . . . . . . . . . . . . . . ‑ , 1 = 1, 2, , …m ( 3 ) となる.帰無仮説のもとでの棄却限界値α Zを求め, Z m a xがその以上のときに帰無仮説を棄却する. 最大対比法では複数の対比ベクトルを用いる.これを mX2K行列の形式で表した ( 4 )式を最大対比法の定義 行列と呼ぶことにする. ' C=(C1,C2, . . . , Cm) ( 4 ) P1 1 直は,帰無仮説のもとでの検定統計量の確率分布において,検定統計量の実現値 z L a xより大きな値を取 r ( z m a x>z : a xI Ho)とする.また,対立仮説 HIの分布において棄却限界値α zよりも大きな値 る確率 p= P r ( Z m a x>Za I H1)を検出力とする. を取る確率 P 棄却限界値α Zを解析前に算出しておく必要がある.これには,対比統計量の同時確率分布を考え,その分 2 )式に基づく. 今回の算出には, 布の下での標本空間の棄却域の確率を計算する.対比統計量の同時分布は ( 帰無仮説の下での 1 0 0 0万回のシミュレーションによるもので算出した.参考として西山 ( 2 0 0 4 )で公開されて いる多変量 t分布に基づいた方法においても検討した. 3 . シミュレーション実験 3 . 1 解析法の手順 最大対比 J 去の性能をシミュレーションによって評価する.ここでは,最大対比法を含めた 3通りの解析方 法を比較することにする. 方法 1:全被験者を対象に, Cox回帰を用いて全集団での群間比較を有意水準 2.5%の片側検定を行う. 方法 2:① ④の手順で解析を行う. ① 全被験者を対象に, Cox回帰を用いて全集団での群間比較を有意水準 2.0%の片側検定で行う. ② ①で有意であれば, r 全被験者に対して有効である」と結論づける.①で、有意で なかった場合,有 意水準 0.5%で最大対比法を用いた検定を行う. ③ ②で宥意で、あった場合,適合度評価により,最も当てはまりのよい対比ベクトルを選択する.選択 された対比ベクトルが,バイオマーカーと薬剤の関連を最も説明しているものと結論づける. ④ ②,③ともに有意でなかった場合,治療効果がないと結論づける. 去を用いた検定を行う. 方法 3:全被験者を対象に,有意水準 2.5%で最大対比 f ‑174・

174.

方法 lは,通常の第皿相試験で行われる解析を同様の想定である.方法 2は,通常第田相試験を行う場合 全被験者に効果があれば十分な検出力を持って検出することを考慮しながら,特定のサブグ、ループに対して は,かなり大きな効果が見込めることを期待した場合の設定である.方法 3は,実際の試験で用いる可能性 は低いが,比較対象という意味で比較することにする.なお,方法 2で採用した有意水準の分害1 1 のアイデア はJ i a n g ( 2 0 0 7 )で紹介されていたものである. 本稿の最大対比法で定義した対比係数を表 lに示す.各群のバイオマーカーに関するカテゴリー数を K=5 とし,最大対比法の対比ベクトル cにおける対比係数は, c j‑ C5が標準薬群の対比係数, C6‑ Cj Oが新薬群 の対比係数を表すものとする.今固定義した対比では,標準薬はバイオマーカー値によらず,ある一定の効 果を示すものとし,新薬群では効果が一定ではないことを仮定した.最大対比法で指定する対比ベクトルは, バイオマーカー値がある値を超えたら一様に効果がある場合を考慮、したカットオフ型と,バイオマーカー値 がある値を超えたらバイオマーカーの値と相関して薬剤効果が上昇してし、く相関型を定義した.表 lより, C3 , C9) 'と表され,方法 3で用いた最大対比法の定義行 方法 2で用いた最大対比法の定義行列 CMZ =(CZ, ラ… CZ, . . . , C9) 'と表される.方法 lの通常の Cox回帰は,対比ベクトル C;のみを用いることに 列は CM3 =(Cj, 対応する. 表 1 最大対比法で設定した対比係数および対比ベクトル 新薬群 ( T 2 ) 標準薬群(Tl) Cj C z C3 C4 C5 ピ2 2 2 2 2 2 2 3 ‑3 3 3 C~3 3 3 3 3 3 3 3 ‑7 7 ‑7 C4 2 2 2 2 2 2 2 2 ‑8 8 C6 C7 C8 C9 Cj O C~ 9 C5 C: 6 3 3 3 3 3 C~7 。 ‑3 ‑5 7 2 ‑3 c ' 8 6 6 6 6 6 6 6 4 ‑14 24 c ' 9 3 3 3 3 3 3 3 3 ‑7 1 7 方法 2では,最大対比法で有意であった場合,最大の値をとった対比ベクトルの対比統計量の適合度評価 を行い,対比の当てはまりの度合いを検討する.推定するパラメータの数に対して,グローパルな帰無仮説 HO:~ =0に対する Wald型統計量を (5)式のように表す. xふ 二台 [ V ( 3 J) J j p ( 5 ) また,対比ベクトルの Wald型統計量を ( 6 )式のように表す. x~ =ZZ=~型2 ‑ cV(~)C' ‑ 1 7 5・ ( 6 )

175.

従って対比統計量の適合度は, ( 6 )式を ( 5 )式で除した以下の ( 7 )式のように表す.これは,自由度 pの統計量に 対して,対比統計量がどの程度データによく当てはまっているかの指標となる. X一Z 2C 一 2W 54rFJ 内 X 一 一 ( 7 ) 3 . 2 シミュレーション条件と手順 発生させる生存時間データは 2つの条件について発生させた. 条件 1 (カットオフ型):バイオマーカー値〉 θの被験者に対して, T2は Tlに対して効果 HRの効果がある. (闇値型):ノ〈イオマーカー値〉 θの被験者に対して, T2は Tlに対してバイオマーカー値に相関して 条件 2 g ( H R ) )のスケーノレで、線形的に効果が上昇するようにする. 効果が増加する.対数ノ、ザード比(Io 条件1,条件 2を図に示すと,それぞれ図 2の左図,右図のようなイメージになる.条件 2では,バイオ マーカーの値が最大になるときに設定した HRとなるようにデータの発生を行う.また,変動させたシミュ レーション条件であるハザード比 ( H R )と効果のあるバイオマーカー値 θについて表 2に示した. θ=0は , 全被験者に対して薬剤 T2の効果があることを示す. 条件 1,条件 2を以後,それぞれカットオフ型,相関型と呼ぶことにする. 新薬η 標準藁T1 撮準藁T1 効果 (log(HR)) 効 果( 1 0副HR)) 効果 (log(HR)) 新藁ロ ︑ ︑ ローーーーーー・ 10g(HR) 。 唱。 バイオマーカー ︑ ︑ ︑ 。』ーーーー一ーーーーー 効果 ( l o g (HR)) L̲̲̲・ 。 1 バイオマーカー * ~ー ハイ.~_ オマーカ 9 。パィキマーカー 図 2条 件 1 ,条件 2で発生させるデータのイメージ図 表 2 変動させたシミュレーション条件 変動する要因 値 H R :T2庁 1 ) ノ、ザード比 ( 0 . 8 0, 0 . 6 5, 0 . 5 0, 0 . 3 5 効果のあるバイオマーカーの値(θ) 0, 0 . 2 5, 0 . 5 0, 0 . 7 5 シミュレーション手順は以下の通りである. 1 . 1群 1 0 0例ずつ,条件1, 2に基づいた指数分布に従う生存時間データを発生させる.この際,両群合わ せた右側打切りの割合が約 15%になるように設定した. 2 . 標準一様分布に従うバイオマーカー値を発生させ,各群 5つのカテゴリーに分類する. 3 . 方法 2,方法 3に対応する最大対比法の棄却限界値を算出する. ‑176‑

176.

4 . 方法 l一方法 3で検定を行う. 5 . 1‑3を 1 0 0 0 0回繰り返し,有意になった割合を算出する. 有意になった割合を検出力の推定値として評価する.各カテゴリーに入る症例数が等しい場合,手順 3の . 0 3 1 2 5 (有意水準 0 . 5 % ),2. 49 2 1 9 (有意水準 2.5%)となった.また, 棄却限界値は,方法 2・方法 3でそれぞれ 3 解析には SASの TPHREGプロシジャを使用した. 3 . 3 シミュレーション結果 シミュレーション結果を表 3,表 4に示す.表 3は,発生させる生存時間データが条件 I (カットオフ型)に 従う場合における各方法の検出力の推定値である. なお,結果には示していないがαエラーは有意水準以下 に制御されていた. (カットオフ型)の場合に対する各方法の検出力の推定値 表 3 条件 I モデル HR(T2! T1 ) 方法 1 方法 2 方法 3 0 . 8 0 .8% 31 29.0% 21 .4% 0 . 6 5 79.9% 77.2% 67.2% 0 . 5 0 99.2% 99.0% 97. 44% 0 . 3 5 99.9% 100.0% 100.0% 0 . 8 0 20.3% 19.5% . 1 % 21 0 . 6 5 57.3% 5 8. 2% 62.8% 0 . 5 0 .2% 91 93.1% 95.8% 0 . 3 5 99.8% 99.9% 100.0% 0 . 8 0 .9% 11 1 2.4% 16.7% 0 . 6 5 30.2% 37.6% 50.0% 0 . 5 0 62.2% 78.6% 88.6% 0 . 3 5 .2% 91 98.6% 99.7% 0 . 8 0 6.2% 6.5% 9.7% 0 . 6 5 11 . 3 % 15.8% 26.6% 0 . 5 0 21 .4% 39.8% 60.3% 0 . 3 5 40.5% 78.1% 91 .1% θ>0に効果の被験者に効果あり θ>0 . 2 5に効果の被験者に効果あり θ>0 . 5 0に効果の被験者に効果あり θ>0 . 7 5に効果の被験者に効果あり θ>0に効果の被験者に効果ある場合は, HRによらず通常の Cox回帰を用いた方法 lの検出力が最も高く 程度であり,この程度であれば なっている.しかしながら,方法 lに対する方法 2の検出力の低下分は 2‑3% 十分許容できるものと考えられる.方法 3では,他の方法に比べてやや検出力が低下するため,全被験者を 対象とした場合には使用が推奨できない. ‑ 1 7 7 ‑

177.

θ>0 . 2 5, θ>0 . 5 0, θ>0 . 7 5と効果のある被験者の割合が小さくなるに従って,当然ながら方法ト方法 3 の検出力は低下する .HRが lに近いとき,方法 2,方去 3の検出力はわずかに方法 lよりも低くなっている. だが, HRが 0 . 5 0のように特定のサブグループに劇的な効果がある場合は,方法 2,3の検出力は方法 Iより も高くなり,効果のあるサブグ.ループの割合が小さくなると,その傾向は顕著になる. 表 4 条件 2の場合に対する各方法の検出力の推定値 モデ、/レ θ>0に効果の被験者に効果あり θ>0 . 2 5に効果の被験者に効果あり θ>0.50に効果の被験者に効果あり θ>0 . 7 5に効果の被験者に効果あり HR(T2 汀1 ) 方法 l 方法 2 方法 3 0 . 8 0 1 l .8% 1 l .3% 12.8% 0 . 6 5 30.3% 30.9% 36.0% 0 . 5 0 62.7% 66.4% 7 3.4% 0 . 3 5 9l .4% 94.3% 96.8% 0 . 8 0 8.8% 8.7% 10.9% 0 . 6 5 4% 1 9. 2l .9% 30.3% 0 . 5 0 40.9% .1% 5l 65.0% 0 . 3 5 72.2% 86.5% 93.7% 0 . 8 0 6.2% 6.3% 4% 8. 0 . 6 5 1 1 . 3 % 13.8% 2l .7% 0 . 5 0 .4% 2l 32.3% 49.0% 0 . 3 5 40.9% 67.7% 83.0% 0 . 8 0 4 % 4. 4.3% 5.2% 0 . 6 5 6.1% 10.3% 6.6% 0 . 5 0 8.9% 12.6% 22.36% 0 . 3 5 14.3% 27.9% 47.7% 表 4は,発生させる生存時間データが条件 2 ( 相関型)に従う場合における各方法の検出力の推定値である. これも表 3と同様の傾向を示している. . 2 5,θ>0 . 5 0,θ〉 結果には示してはいないが,方法 2の中で全被験者を対象として有意になる割合は, θ>0 0 . 7 5の場合でも方法 lから 3‑5% 程度劣るだけであり,試験実施側が目的とする全被験者への薬剤の適応が方 法 lと比較して大きく劣っているわけではないと考えられる.かっ,全被験者で有意にならなかった場合は 最大対比法で有意となる場合があるので,対比の適合度評価の結果,よく当てはまっているのなら,余分な 第 H相試験を行わずに次の治療開発につなげることができる可能性がある.もしカットオフ型の対比が選択 されれば,探索的にではあるが,効果のあるサプ、グ、ループのカットオフ値を特定したことにつながる可能性 もある.相関型の対比が選択されれば,今後の治療開発を進めていく上で一つの有用な情報になり得るので はなし、かと考えられる. 今回のシミュレーション条件で仮定していないが,バイオマーカー値の上昇による薬剤効果の大きさがど こかでプラトーに達するような場合も,最大対比法を用いれば検出することができる.そういった意味で, 対比を任意に設定しながら検証的に交互作用の評価を行うことができる最大対比法は有用な方法であると考 えられる. ‑ 1 7 8 ‑

178.

これらのことより,特定のサブ、グ?ループのみに HR=0.5程度の大きな効果が見込まれる場合は,方法 2は l つの選択肢になり得るかもしれない. 4 . まとめ 本稿では,バイオマーカーと薬剤j の交互作用の検出に最大対比法の適応を提案した.その結果,本シミュ レーションで想定した条件において,交互作用がない場合では全被験者のみを対象とした通常の検定より若 干検出力が低下するものの,許容できる範囲での検出力の低下であることが示唆された.また,交互作用が ある場合においては,最大対比法を用いることで検証的に交互作用の検出を行うことができることが示唆さ れた.すべての条件で有用であるわけではないが,条件によっては lつの選択肢となり得ると考えられる. さらに,今回の想定ではバイオマーカーが連続量であることを仮定したが,質的変数であるバイオマーカー に対しでも最大対比法は応用できるのではなし、かと考えている.この手法の使用により,臨床医が治療を選 択する際に考慮する情報を提供できることを著者は期待している. しかしながら,最大対比法で交互作用が検出され,適合度評価によって最適な対比によってカットオフ値 の候補が特定されたとしても,それはあくまで探索的な結果に過ぎない.より正確な情報を得るためには, 早期開発などの情報も含めてカットオフ値等を慎重に特定し,適切な第 E相試験を行うことが望まれる. 参考文献 1 . G r o u i nJ.M,C o s t eM,LewisJ .S u b g r o u pa n a l y s e si nr a n d o m i z e dc l i n i c a lt r i a l s :s t a t i s t i c a la n dr e g u l a t o r yi s s u e s . J o u r n a lofB i o p h a r m a c e u t i c a lS t a t i s t i c s1 5 ( 5 ) :8 6 9 ‑ 8 8 2, 2 0 0 5 . 2 . H o e r i n g,A,L e B l a n cM,C r o w l e yJJ .Randomizedp h a s eI I Ic l i n i c a lt r i a ld e s i g n sf o rt a r g e t e da g e n t s .C l i n i c a l c a n c e rr e s e a r c h1 4 ( 1 4 ) :4 3 5 8 ‑ 6 7, 2 0 0 8 . 3 . J i a n gW,F r e i d l i nB,SimonR .B i o m a r k e r ‑ a d a p t i v et h r e s h o l dd e s i g n :ap r o c e d u r ef o re v a l u a t i n gt r e a t m e n tw i t h p o s s i b l eb i o m a r k e r ‑ d e f i n e ds u b s e te f f e ct .J o u r n a lザ t h en a t i o n a lc a n c e ri n s t i t u t e99( 13 ) :1 0 3 6 ‑ 4 3, 2 0 0 7 . 4 . SimonR .Roadmapf o rd e v e l o p i n ga n dv aI id a t i n gt h e r a p e u t i c aI lyr e l e v a n tgenomicc l a s s i f i e r s .J o u r n a lofc / in i c a l 3 ( 2 9 ) :7 3 3 2‑ 41 , 2 0 0 5 . o n c o l o g y2 5 . 西山智.複合最大対比法とその毒性試験データ解析への応用.東京理科大学大学院学位論文,2 0 0 4 . ‑179・

180.

GA 乱fとその周辺 0田中祐輔・ 伊庭克拓 辻谷将明事日 ・大阪電気通信大学大学院工学研究科情報工学専攻 東京 C R O株式会社 D M統計本部統計解析部 日事大阪電気通信大学情報通信工学部情報工学科 GA Mand1 t sRelatedProblems Y u s u k eTanak ♂ K a t s u h i r oI b a . . T s u j i t a n i: r v l a s a a k i . . . 'Os叫也 E l e c t r c トC o m m u n i c a t i o nU n i v e r s i t y ,G r a d u a t eS c h o o lo fE n g i n e e r i n g "TOKYOCRO,I n c , . , . , .O s a k aE l e c t r o ‑ C o m m u n i c a t i o nUn i v e r s i t y 要旨 近年,一般化線形モデル ( G e n e r a l i z e dL i n e a rModels:GLM)を拡張した一般化加法モデl レ(GeneralizedAddi‑ t i v eModels:GAM)が広範に活用されつつある.データ解析の目的が予測にあるなら,母集団構造の非線形性を 摘出するだけでは不十分で,適切なモデルで記述しなければならない. GAMは , GLMにおける非線形項を予測 変数の平滑化関数の和として表現したモデルである.本報告では,平滑化スプラインによる判別モデルを取り上 げ,クロスバリデーションによる GAMの展適自由度選択法を提案する.また,実践の場での GAMの適用を念 頭におき,リサンプリング法を援用したモデル適合度の検証,診断としてモデルに不適合な影響銭測値や外れ値の 検出を試みる.更に,種々のサンプルサイズに関して,シミュレーション・データを用い, i )非線形性をもっデー タに対する平滑化スプラインの有効性を示し,日)サイズおよび 2因子交互作用効果が, GAMの構築と統計的推 測に与える影響について考察する.山)マシンラーニングを用いた他の手法として,ニューラルネットを適用して 性能評価を行う.従来のモデルと比較するために線形判別や(線形)ロジスティック判別モデ、ルも取り上げる. キーワード:平滑化スプライン,判別分析,逸脱度,クロスバリデーション.ブートストラッピング,影響分析, シミュレーション,交互作用,薄板平滑化スプライン 1 はじめに 近年のコンビュータ技術の飛躍的進歩や多様なデータの収集と蓄積によって,非線形性をもっ多変量データ解 析が脚光を浴びつつある.特に,平滑化スプライン,カーネルマシン,サポートベクターマシン (SupportVector Machine:SVM)などのマシンラーニング ( [ 5 ,][ 1 9 ] )が有力な武器になりつつある.本報告では, GAMの一種である [ 1 4 ] ) . 平滑化スプラインによる判別モデ、ルを取り上げ,シミュレーション研究を試みる ( 平滑化スプラインによるアプローチの利点は, i )予 i s l J変数の非線形性を摘出し, i i )グラフ化により非線形構造を i i )モデルの未知パラメータの最尤解が一意で,計算に要する時間が短い.更に 視覚的に把握でき, i i む)指数分布 族のデータに適用できる,などが挙げられる.しかし,平滑化スプラインは未知パラメータを推定するだけでは不十 分であり,予測精度の高い平滑化スプラインを得るためには,最適な平滑化パラメータを選択しなければならない. l l ‑ c o n d i t i o nに落込み,解が収束しない欠 局所評点化法を用いて,最適な平滑化パラメータをグリッド検索すると, i ,][ 2 6 ,][ 2 7 ] )は,新たなのアルゴリズム(詳細は, [ 1 9 ]を参照された 点がある.その難点を回避するため, Wood([24 し)を開発している.本報告では,自由度の最適値を決定する代替法として, 1{ 7 I J 消去(leaving‑one‑out)クロスバ リデーシヨン (CV)法による平滑化パラメータ決定の厳密解法について考察する. 2群判別の適用例として脊柱後湾症 ( k y p h o s i s )データ(表 1 )を取り上げる ( [ 8 ]の p.103)・同表は.椎弓切除術を ‑183‑

181.
[beta]
表 2 糖尿病網膜症データ

表 1 脊柱後湾症データ

1

7
1

5

3

2

1
5
8

1
4

3

。
。

3

128

5

4

1

患者番号

凡
tαr
t nur
αg
e s

82

42

6

7

83

36

1
3

4

l

1
0
.
3 1
3
.
7 2
3
.
8

2

9
.
9

1
3
.
5 2
3
.
5

。
。

353

9
.
8

1
6
.
7 2
0
.
3

1

6
6
9

1
0
.
1 1
0
.
1 2
6
.
3

患者番号

群

。

dur

g
l
y

bmi 群

1I

。

施した 8
3例について,脊柱後湾症が発症したか否かを調べたデータである本 1 予測変数として ,X
l αg
e
(手術時の

2:s
t
a
r
t
(何番目の脊椎から先を手術したか),および X3:num(手術した脊椎の個数)を考える.
月齢), X
更に,予測変数聞に交互作用効果があると考えられる糖尿病網膜症データ(表 2
)を 取 り 上 げ る

(
[
2
],
[
1
0
],
[
2
1
],
[
2
2
],
[
2
3
]
)ぺ予測変数としては,

Xl :d
u
r
(擢病期間),

X2:g
l
y
(糖化ヘモグ、ロビン:%), X
3:bmi(肥満

2
度 ;kgjm
)を考える.このデータに関して ,g
l
y,bmiが大きければ糖尿病網膜症に移行しやすい.糖尿病を発症後,
bmiが更に大きくなると増大したインスリン抵抗性に耐え切れず,騨臓が疲弊して糖利用が低下し痩せてくる.この
経過は d
urに依存するため,糖尿病発症の早期は bmiが大きく,その後,痩せに転じて bmiが低下する.よって,

d
u
r
)と肥満度 (
b
m
i
)に交互作用効果があると考えられる.
穣病期間 (

2 ロジスティック判別

2
.
1 平滑化スプライン
I個の予測変数 X
i=
=(
X
,
1
i Xめ・・・ ,
X川 と 2値 応 答 y
iから成る n組のデータを (
X
l,
yI
)
"
"
,(
XnY
n
)とする. 2
ヲ

、

ム
4E

12
,
.
.
.
,n
f
i
i全 l
n(~) = so+Sl(Xil)+句 (
X
i
2
)+… +SI(Xi
I
) i=,

)
(

値応答 Y
iにベルヌーイ分布 B(Lπ
)を仮定したとき,リンク関数としてロジット関数を用いた GAM([25])
1‑ 7
ri/

の局所評点化法は次の通りである (
[
3
]の 2
.
3節
, [
4
]の 6
.
3節).ただし ,S
(
)は,スプライン関数である.
[ステップ 1
(初期化)]:まず,
12
.
.
.
. n, j= ,
S
j
(
Xり)三 O
. i=,
12・・・守 I
ヲ

と設定し,

(
?
=
む

(
2
)

(
3
)

i
=
l jn
n
{
f
i
j
(
l
‑f
i
)
}
s
o=l

とおく.
‑
A
nリ

一
)
‑z

‑(

1 一却

‑4E
ム

一
e

︽

πz

九=s
、
口

一
+

[ステップ 2
]:(
3
)式を用い,

(
4
)

とする.

(u‑h

(反復)]:調整従属変数および重みを
[ステップ 3

:調整従属変数
zt 一円
+,一
一
一
‑
リ,
7
T
i
(
l一
‑一
7
Ti
)

ωi=升i
(
l一
介i
)

(
5
)

重み

とする. (Xl,
zI
)
, (X2,
Z
2
)ぃ ・ ぺ (
X
n,
Z
n
)に後退当てはめ法を適用し, j= ,
1 2,...,[についてむを算出する.そし
て,介zを推定する.
1このデータは. http;//~.xplore-stat.de/tutorials/xlghtmlnode137.html からダウンロードできる.
時 こ の デ ー タ は . WESDR(Wisconsin Epidemiological Study of Diabetic Retinopathy) と呼ばれており,
取

http;//ftp.stat.~isc.edu/pub/~ahba/soft~are/ より引用できる

‑184・

182.
[beta]
[ステップ 4
(収束判定)J:逸脱度

Dev(y,
合
)=

‑
2
2
二{Yiln1I"i+(1‑Yi)ln(l‑1I"i)}

(
6
)

i=l

が収束するまで[ステップ 3
]を繰り返す.
[ステップ 3
]で用いられている後退当てはめ法は .I= 2の場合,以下の通りである (
[
1
2
]の p
p
.
3
1
9
‑
3
2
1
)
.
[ステップ1):まず. Zi = s
O+51(Xil
)+52(Xο)について.52(X辺)三 Oとする.

]:Xi1に対して. Zi ‑ 52(X心 ‑soを平滑化する.すなわち,
[ステップ 2
(Xl1'Z
l‑52(X12)

品
),(X21,Z2‑5仇 2)‑A)

(znlzF S
仏 2
)一 応 ) に つ い て け 算 出 す る

]:Xi2に対して .Z
i‑ 5
1(
X
il
) 角を平滑化し. 5
2を算出する.
[ステップ 3
[ステップ 4
J:Xi
1に対して. Z
ι

52(X叫

soを平滑化し

5
1を算出する.

[ステップ5j:む (X i1), 52(Xi2) が収束するまで[ステップ 3J~[ステップ 4] を繰り返す.

なお. 3次の平滑化スプラインによる GAMを用いると局所評点化法は,ペナルティ付き対数尤度
I
r+∞
め1
n7ii+(
1一 山

E
{

(
7
)

の最大化と等価である.

2
.
2 薄板平滑化スプライン
I個の予測変数をもっ η 組のデータ (
X
i,
Y
i
)、i= 1....スについて,予測変数聞に交互作用がある場合

叶、
己云
ト L5s(Xi白旬), i 1,2,
.
=

a

/ 白 〈

(
8
)

η

β

を考える (
[
2
]
.[
2
1
J
.[
2
2
]
)
. 5白β (
X
i配 X
i
β) は薄い弾性体の板を曲げた形に似ていることに由来し,薄板スプライ
ン(
t
h
i
np
l
a
t
es
p
l
i
n
e
)と呼ばれている.

2値応答ベクトル y= (
Y
1、Y
2,
'
",
Yn/について. (
7
)式と同様のペナルティー付き対数尤度関数

2
二{Yi5(Xι
)一 同 +

eS(x;))} ̲

~入品I

(
9
)

が最大になる sを推定する.ここに.I: ~1 {
Y
バ(Xi
)一 l
n
(
l+eS(x,
)
)
}は対数尤度である叫 JmIは揺動(w
i
g
g
l
i
n
e
s
s)
を測るペナルティー関数,入は平滑化パラメータである.揺動のペナルティーは

r

r

ー
‑

~I

Jm != I.
.
.I

… J

(

¥2

;:)me

)
ι
‑
‑
;
‑I~ "
.
‑ ‑ "
. 1 dXl" .dx!
J1R 1 叶・ -Hr=mU11 ・ VI! げ X~'" 'Ox?ノ
ム

(
1
0
)

4

と定義する.揺動のペナルティに関する偏微分の階数 m は 2m>Iを満たす整数値である. このとき. (
9
)式が最
大になる関数は

)
(

j=l

i
=
1

と表せる.ここに. cと dは Ttc=O,
Ti
j

EL
唱
'EL

5
(
X
)=玄叶mI(
X
)
1
1
x‑x
i
l
l
l+玄内向 (

̲. .̲ .
̲

め(Xi)を満たす未知パフメータで .M =

.~.
t

Im+I‑1 ¥

')個の関数

X
)は線形独立な多項式である.更に
仇(

ー
( 1)m+l+I/2
m
T
m l)!(m‑m)1
汁
川
I
(
T
)
=
{
2
2
m
私
(
│

f

l
o
g
(
T
) I:偶数

(同

r
(
I
/
2‑m) .r2m-I
̲2m‑
1
~i")~\....L/':.I-,
,
I
n)~

1:奇数

l
22mπ I/2(m‑ 1)!

となる (
.1
.5節).
[
2
]の 4.4節. [
2
7
Jの 4

*3

(奇)+ln(1 町)}=ご:"1{YiS(Xi)‑ln(1+

n7ri+(
n
(
1‑7ri
n
(刊の第 l 項の対数尤度はI: ~=I {
1‑yi
)
}= I: ~=I {
Y
il
Y
il
)l
~)}と書ける.

‑
1
8
5
‑

183.
[beta]
,
例えば,m=I=2の場合, (
1
0
)式の JmIは

r
+
 r
+
 f(θ28(Z132)¥2/θ2S(Xl,
X2)¥2

i
¥

ょ ーん}̲=

+2¥~

ax.i ‑')

θ
, 2)
a
;
向 )+¥~ a~.~
, ( 2S(
Xl X2)¥

‑') (dXldX2

(
日)

となり, (
1
1
)式において ,Ttc=0より,ゆl
(
X
)= L仇 (X)=Xj・
向 (X)= X2を得, (
9
)式を最大にする解は
S(Xl,
X2) =+d1Xl+d2X2+Ci'Gi(XlXil,
X2Xi2)
>=

nunU

4ιιL

σb

0

ta

t‑‑8nu

2Lπ

〆
1lJ ik

つ
‑

︐
︑

Z

4

12

z

z
G

一
一

と表せる. (
1
2
)式より

(
日)

(
1
5
)

である.ただし,

+(X2Xi2)2

t
i= V
(XlXi1
)2

(
1
6
)

とする.データ数が nのとき, (
1
4
)式には ,n+3個の未知パラメータが含まれている. 3個の不足するデータは,

3つの条件

乞α = 0C;Xil = 0,
乞 C;Xi2= 0
i=l

(
1
7
)

i=l

i=l

に対応する (
[
1
3
]の 4
.
3節
)
.
ちなみに, m = 21= 1の場合, (
1
0
)式の JmIは

r
+

T
 /θ28(z)¥2L
J
2
1-\~) ax

(
1
8
)

となる. (
1
1
)式において ,Ttc=0よりゅl
(
X
)= 1
,
仇 (X)= Xを得, (
9
)式を最大にする解は

+

+乞 αJXーが

S(X) = do d1x

(
1
9
)

i=l

とする.データ数が nのとき, (
1
9
)式には, η+2個の未知パラメータが含まれている. 2個の不足するデータは,
2つの条件

乞α =0,
乞 CiXi= 0

(
2
0
)

に対応する (
[
1
1
]の 46節
)
.

2
.
3 最適自由度の選択
平滑化スプラインは未知パラメータを推定するだけでは不十分であり,予測精度の高い平滑化スプラインを得るた
めには,最適な平滑化パラメータ入を決定しなければならない.局所評点化法を用いて,最適な入をグリッド検索
すると,解が収束しないことが多々ある.本報告では,自由度の最適値を決定する代替法を推奨する.

λ を用いると yの予測値安は主 =Hλyと書ける.
まず, GAMの自由度について定義しておく.ハット行列 H
λ のトレースは,モデルの識別可能な未知パラメータの個数である.モデルの柔軟性を淑[Jるための
ハット行列 H
t
r(
)をモテルの実効自由度(
e
f
f
e
c
t
i
v
ed
e
g
r
e
e
so
ffreedomo
ft
h
emodel),あるいは有効パラメータ数(e
f
f
e
c
t
i
v
e

numbero
fp
a
r
a
m
e
t
e
r
s
)という.更に,実効自由度からパラメトリックな部分の自由度 1をヲ!いた自由度をノンパラ
メトリックな部分の等価自由度(
e
q
u
i
v
a
l
e
n
td
e
g
r
e
eo
ff
r
e
e
d
o
m
)という (
[
1
2
]の p
.
2
6
8,p
.
3
0
0
)
.
[
1
8日
.
1例消去クロスバリデーション (CV)規準に基づき,最適な入を決定する厳密解法は,次の通りである (
[ステップ 1
]初期標本 X = (X<1>,X<2>ぃ・ ,
.X<d>,.
.
.
, X <η
>
)から ,X<d>を除去した訓練標本 X[d] =
(X<l>,X<2>,
.
.
.
, X<d‑l>,X<d+l> ....X<η
>
)を構成する.
ヲ

[ステップ 2
]訓練標本 X[d]に基づいて,モデルを構築する.そして ,d番目の個体について,その予測値を算出す
る.それを升[
<d>と記す.
d
]

‑186
184.
[beta]
[ステップ 3
]除去された標本の平均予測対数尤度は

iz{Udlnq>十 (
1‑Y
d
)l
n
(
l‑fr~r)}

(
2
1
)

となる.このとき,クロスバリデーション規準

L{Ydlnfr~í> 十 (1 ‑Yd)ln(l‑fr[~í>)}

CV= ‑2

(
2
2
)

が最小になる入者E最適とする.

2.
4 リサンプリング法
ク"ループ化されていない 2値データ(すなわち,ベルヌーイ分布)の場合, (
6
)式の逸脱度に対する漸近カイ二乗性
は成り立たない (
[
1
]の 3
.
8
.
3節
, [
9
],[
1
5
],[
1
6
],[
1
7
]
)
. そこで,ブートストラップ法 (
[
7
]
)を援用し, (
6
)式の棄却
点、そ算出する:
]初期標本 X = (X<l>,X<2>,.
.
.
, X<η>)からリサンプリング(ペア・サンプリング)により ,B
[ステップ 1

個のブートストラップ標本
X¥=(X<l>*,X<2>*,.
.
.
, X<n>*)

を生成する.

l
ステップ 2
]b
(
=1
,.
.
.
, B
)番目のブートストラップ標本を X;とし,逸脱度
胸(め=‑21nL(
X
;
;
;
s
(
Xb)
)

お)
(

を計算する.ここに, β
(
X
;
;
)は b番目のブートストラップ標本 x
;から推定される回帰係数で,その推定値から算出

;の対数尤度が
される X

(
Xb;β(有))

lnL
である.

JDev三 D
e
v
'なら,有意水準 α でモデ、ルは妥当で、ないとみなす.ここに , Devは初期標本に対する
[ステップ 3
(
6
)式の逸脱度で,

D
e
v
*= D
e
v
(
b
)を小さい1
]
頃に並べたときの第 J番目の値, α =1‑j
/
(
B+1)
とする.

3 適用例

3
.
1 脊柱後湾症データ
2群判別問題の実際例として, 3個の予測変数からなる表 1の脊柱後湾症データを解析する.このデータについて
主効果スプラインモデル

ベ凸)

= 仰 )+s
t
a
r
t+

(
2
4
)

を当てはめる.すなわち , ageに平滑化スプラインを用いる. SASv
e
r
9
.1
.3の PROCGAMでは, MODEL文の
オプションで method=GCV~指定すると ,

GCV規準に基づいて自由度の最適化を行う.このモデルに SASの

GCV規準を採用すると収束しない.そこで,
p
r
o
cgamd
a
t
a
=
k
y
p
h
o
s
i
s
(where=(id^ =&d))
;
df=&df)
modelkyp= param(s
t
a
r
tnum)s
p
l
i
n
e
(a
g
e,
lmaxiter=100000m
a
x
i
t
s
c
o
r
e
=
1
0
0
0
0
0
;
/l
i
n
k
=
l
o
g
i
td
i
s
t
=
b
i
n
o凶 a
~m
acroに組み込み,

%DO文のループを用いて &dfの値(白g巴の自由度)を,例えば、 1から 1
0程度まで動かす.そ

2
2
)式の CVが最小になる自由度を決定すると,最適自由度は d
j
=
2
(
C
V
=
6
5
.
9
2,
して,データステップ計算した (
逸脱度 =
5
6
.
3
9
)となる.

‑187・

185.

/ ; 之 : : : : 一 . . . . ‑ ー ー ー ー ー ー ー 、 、 、 、 、 、 、 、 、 、 . 、 匂 、 、 、 ' 1 ' 50 1 田 1 5 0 200 2 田 .g固 図1 s (日g e )の予測値 , αg eに対する平滑化スプライン予測値(実線)である.縦軸は,発症率のロジ、ツト変換値を表している.ま 図 1は た,実線の周りの領域は予測値からその標準偏差の 2倍離れた位置を示している.同図では, αg eに対する非線形性 が顕著に現れており,手術時の月齢と共に発症率が高くなり. 1 0 0ヶ月前後でピークに達し,その後低くなる傾向が 見られる.平滑スプラインを適用した効果を調べるため, αg e (手術時の月齢)に関する尤度比検定を行なう.式 ( 2 4 ) のモデ、ルに関する逸脱度を D e v ( l ) . 残差自由度を1/1. 帰無仮説の下でのそれらを Dev(O)および1/0 とすると, 0‑ 1 /1= 8 0 . 0 0‑7 8=2 1 / Dev(O)‑Dev(l)= 6 6 . 2 4‑5 6 . 3 9= 9 . 8 5>9 . 2 1=χ2(2) を得, αg eは有意水準 1%で高度に有意である.また,他の予測変数(線形)も有意である.このように平滑化スプラ インを適用することによって,母集団構造の非線形性を摘出し,その非線形構造を視覚的に把握するグラフ表現が可能 になる.なお. GLMによる(線形)ロジスティック判別では αg eは有意にならない.ペア・サンプリングに基づく逸 脱度のブートストラッピングに対するヒストグラムを図 2に与えておく.同図より .Devホ =6 6 . 1 9>5 6 . 3 9= Dev を得,モデルは妥当と見なす. 次に. 1つの観測値を除去することによるモデ、ル適合度への影響を調べるため逸脱度に関する DIFDEV(Difference o fD e v i a n c e ) ムD e V [ d ]= Dev‑D e V [ d ] ( 2 5 ) を用いる ( [ 6 ]の 5 . 3節).ここに .Devと D e V [ d ]は,それぞれ初期標本および d番目の個体を除去したときの逸脱 度であり .D e V [ d ]には l例消去 cv法より副次的に得られる結果を利用できる .Devの自由度 d f= η ‑ P .D e V [ d ] の自由度 d f=π‑p‑1より,ム D e V [ d ]の自由度 d f=η ‑p‑(η p‑ 1 )= 1となる.よって,ム D e V [ d ]は自由 度 1のカイ二乗分布に従う.図 3に DIFDEVのインデ、ツクス・プロットを与えておく.同図から,有意水準 5%で No. 45と No.79が影響観測値であることが分かる.この 2例を除去後の cv値は. 6 5 . 9 2から 4 9 . 1 0へと大幅に減 少する. 更に,表 lに関する誤判別率の性能評価を行うため.従来,広範に活用されてきた線形判別および(線形)ロジス ティック判別を取り上げる.表 3より. GAMを用いると,誤判別率はかなり小さくなる. 表 3 誤判別率の性能比較 モデル │誤判別率 線形判別 0 . 1 9 3 GAM 0 . 1 3 3 ロジスティック判別 I0 . 2 0 5 ‑188 ・

186.
[beta]
。
1
2
'

。

。
。

h
b
o

﹀凶ロ

4

8
0

。

40

0

~

。。
。

。

。

0 0 ' "
0
0
u
0

ハ

ハ

0

O~

0

、
。

ov
。

' < J 、

oa
:
s
z
900∞
ゼ6lSぜ。も。己。。。説。知
1
0

1
9

2
8

37

・
.
s
5
5
D
e
v
i
a
nCd

6
4

7
3

1
0

8
2

50

30

10

9
0

I
nd
e
i
l

図 3 DIFDEV

図 2 ブートストラップされた逸脱度のヒストグラム

3
.
2 糖原病網膜症データ
表 2の糖尿病網膜症データについて,薄板平滑化スプラインに基づく 2因子交E作用スプラインモデル

ベ:
1

7 f ) = 伽 山mi)

を当てはめる.すなわち .d
ur と bmiとに交 E作用効果があると考える.このモデルに SASの GCV規準

(
m
e
t
h
o
d
=
G
C
V
)を採用すると収束し,最適 dj=8.3となる.ちなみに,脊柱後湾症データと同様に .CV規準に基
逸脱度 =
7
4
3
.
4
7
)を得る.
づき,自由度を動かして最適値を決定すると .dj=9(CV=763.49,
図4
(
a
)に.durと bmiに対する薄板平滑化スプラインの予測値(曲面)を示す.また図 4
(
b
)に,その等高線図を
示す.図 4
(
a
)より,薄板平滑化スプラインは予測変数が 2個の場合,滑らかな曲面をもってデータ構造を表現する.
次に,図 4
(
b
)は,白い部分に近づくほと、網膜症への移行率が高くなり,黒い部分に近づくほど低いことを表す.同

urに依存し,糖尿病の早期は bmiが大きいため,網膜症への移行率が高くなり,その後,痩せに
図より .bmiが d
転じて bmiが低下するため,移行率が低くなる傾向が見られる.薄板平滑化スプラインを適用した効果を調べるた

(
d
u
r,
b
m
i
)に関する尤度比検定を行なう.
め.s
Vo ‑ Vl = 6
6
7‑6
5
8= 9

D
e
v
(
O
)‑D
e
v
(
1
)= 7
91
.3
4‑7
4
3.
47= 4
7
.
8
7>21
.6
7=χ2(9)
より .s
(
d
u
r,
b
m
i
)は有意水準 1%で高度に有意である.また .g
l
y
(線形)も有意である.ペア・サンプリングに
基づく逸脱度のブートストラッピングに対するヒストグラムを図 5に与えておく.同図より .D
町 市 =7
6
6
.
3
2>

7
4
3.
47= D仰を得,モデルは妥当とみなす.
次に. 1つの観測値を除去することによるモデル適合度への影響を調べる.図 6に DIFDEVをプロットしてお

2例が影響観測値であることが分かる.これらを除去すると .CV値は 7
6
3.
49から
く.同図から,有意水準 5%で 1
6
8
6
.
7
3ヘ減少する.
更に,表 2のデータに関する性能評価を行うため,マシンラーニングの他手法としてニューラルネット,従来,広
範に活用されてきた線形判別およびロジスティック判別を取り上げる.表 4から GAMを用いると,誤判別率は小
さくなる.

4 シミュレーション
4
.
1 シミュレーション設計
本報告のシミュレーションでは,各観測値の予測変数を X = (Xl・X2)tの 2個とし,それぞれト 1
.+1
]区間の一
様乱数として生成する.そして,生成した X = (Xl. X2)tを

p = 1 ( 2 6 )
1+田 p{‑j(Xl X2)}
ヲ

‑189
・

187.

町 ヘ ¥ 口 . 、 同 守 生O 。 1 1 " , D . ‑ 2 mnon ‑ED 4 守 泊 N 。 N 前 F 10 40 20 50 dur ( b )等高線図 ( a )3次元プロット 図4 s ( d u r, b m i )の予測値 。 。 。 " 。 。 ﹀凶O 比 a噌 0) ‑ o 4 0 6伺 8旬 '0) 7 田 7 却 7 4 0 7創3 。 沼 t 田 8 岨 2 田 300 . 皿 民却 制lO 7回 I n d ・R 口町田園 図 6 DIFDEV 図 5 ブートストラップされた逸脱度のヒストグラム に代入して,各観測値を 2つの群に分ける .f (X1, X2) は任意の非線形関数を用いることができる .!(X1, X2) とし て. Vachモデ、ル ( [ 2 0 ] )を変型した f (X1, X2) = s i n ( 2口 1 )+ αX1X2+sin(21rX2 ) ( 2 7 ) を採用する. ( 2 7 )式の第 2項を予測変数閣の積による交E作用項と見なし, αでその大きさを調整する.ここでは, α=1. 5 とする .p は O~p~l となり,その 3 次元プロット (X1 ・ X2 , P) を図 7 に示す.同図より,交E作用効果が 大きくなると,データのねじれ構造が顕著になる. 1i 群群 ノ ︑ ー ー ︑ 11nU f1l 一 一円︒ p 9b 司自ム n ・ B 引 ud 第っ 第 各観測値は,ベルヌーイ乱数 に基づいて 2つの群に分割される.よって,シミュレーション・データは,予測変数 X ‑ 表 4 誤判別率の性能比較 モデル 誤判別率 交E作用スプライン 0 . 2 7 2 ニューラルネット 0 . 3 0 6 線形判別 0 . 3 1 8 ロジスティック判別 0 . 2 9 3 190・ ー ( 2 8 ) (X1, X2)t と 2値

188.

(a)α=1 (b)α=5 図 7 pに関する 3次元プロット 0505D 1 Goo‑ 0 . 5 X20} X1 X1 0 . 5 1 . 0 図 9 シミュレーション・データ (α=5 ) 図 8 等高線図 (α=5 ) 応答 uをもっ観測値から成る.本報告では,モデルへのサンプル・サイズの影響を調べるため,サイズを 1 0 0 . 2 0 0400, 6 0 0, 8 0 0,1 0 0 0例と変化させた訓練標本を生成する.次に,構築したモデルの未知の標本に対する 判日J I 精度を評価するため,同サイズの検証標本を生成する.図 8は,図 7 ( b )の 3次元プロットを確率 pに関する等 高線図に置き換えたものである.同図の白の部分は p値が大きい部分を,黒は小さい部分をそれぞれ表す.図 9に , α=5における 1000例のシミュレーション・データを示す.図 8の等高線図の自の部分,すなわち p値が大きい右 上と左下部分に第 1群に属する観測値が集まる.また ,p値が 0 . 5付近である灰色の部分では,群について各観測値 がぱらつく傾向が見られる. 4 . 2 性能評価 2つのモデル ‑主効果スプラインモデル ベ占) S(Xl)+S(X2) = ‑交互作用(薄板)スプラインモデル ベ古)=市町) について,非線形性をもっデータに対する有効性を比較・検討する.他のマシンラーニングの手法として,ニューラ I モデ、ルとロジスティック判別モデルを取り上げる. ルネットを取り上げる.また,従来手法として,線形判日J ‑ 1 9 1・

189.

0 . 6 0 . 4 5 二でさーーーー~--、、__."",""-K ' ¥ 1 '. ・. . . . . ‑ v 平 線 形 相l 別 ι : . : . : : . . : . ; ル一同小附 ラプ hぃ グ プスい γ 、 、 主交エ線止 ム、 ス周わ別・1 巣作ベ附切 ︐ 効互 r形 +仕立十 、 E J nU ︑ ︑ J 2 何 回 ﹂C ヒ 叫 口、 亡トニューラノレネット " . . " . . ー /メ て7 、 、 05 口 、 、 ¥ 長 0 . 40 ‑0‑・主効果スプライン f : : , ; 交互作用スプライン ー×ーロジスティック判別 ー、決ー』ー」口 / 一ー~.、 〆 / ー『六二受 / ω J ロ J 出 : ;0 . 4 ヒ 包J 03 030 ロ ム、、ム tJ.‑ーーーー口、 f::,;‑…ムローー・ー ‑G‑一・ー包 0 . 25 0 ∞ 2 ∞ 4 6 0 0 ∞ 8 川泊 02 0 匂n p l eS i z c ∞ 2 ∞ 4 ぽぬ 泊n p l cS i z e ∞ B l ( ) ( 泊 (b)α ニ 5 (a)α=1 図 10 検証標本に対する誤判別率の比較 シミュレーション・データは. 1000例の訓練標本と検証標本を 1組とし,各標本に対して.直前のサイズを含む 5について考察する. 形で 100例から 1000例までの 6サイズを設定する.そして,交E作用効果を調整した α =1, なお,スプラインモデルにおける最適な平滑化パラメータの決定には. 1例消去 cv規準を採用する.また,ニュー ラルネットの最適な隠れユニット数は ,cv規準に基づいて. 1 0 0 . 200例では 5個 , 400. 600. 800. 1000例では 6個となった.図 10に検証標本に対するサンプル・サイズを変えたときの,種々のモデルの下での誤判別率を示す. α = 1の場合,図lO( a )より,主効果スプライン,交E作用スプライン,およびニューラルネットの誤判別率は, 従来手法の線形判別とロジスティック判別に比べて小さい.よって,判別精度に関して,非線形性をもっデータに対 して,従来手法よりも有効であることが確認できる.また,サンプル・サイズについて. 100例から 400例にかけて, 誤判別率が大きく減少しており,サイズの増加と共に判別精度が向上する. 次に, α = 5の場合,図lO( b )より,交E作用スプライン,およひ、ニューラルネットの誤判別率が最小で,検証標 本に対する判別精度が最も良い.よって,この 2つのモデルは,交E作用効果を考慮したモデルを構築できることが 分かる.一方, 2因子交E作用効果が大きくなると,主効果スプラインの判別精度は悪くなる. 5 むすび 本報告では, 2群判別問題を例とし,平滑化スプラインを用いた GAMを取り上げ. 1例消去 cv法による最適自 由度の選択を試みた.また,シミュレーション研究により,従来の解析手法との比較から,非線形性をもっデータに 対して. G A Mが有効であることを示した.更に,薄板平滑化スプラインの適用による 2因子交E作用のモデル化が 有効であることを確認した. 参考文献 [ 1 ]D .C o l l e t t,M o d e l l i n gBinaryDα t α,2nde d ., ChapmanandH a l l,London,2 0 0 3 . moothingS p l i n eANOVAModels,S p r i n g e r,NewYork, 2 0 0 2 . [ 2 ]C .Gu,S .T i b s h i r a n i," G e n e r a l i z e da d d i t i v em o d e l s : Somea p p l i c a t i o n s, "J . Amer.S t a t .A s s o c ., Vo1 .82, [ 3 ] T.H a s t i eandR p p . 3 7 1 ‑ 3 8 6, 1 9 8 7 . 叫 G e n e r a l i z e dA d d i t i v eModels,ChapmanandH a l l,London,1 9 9 0 [ 4 ]T .H a s t i eandR.T i b s h i r a [ 5 ]T .H a s t i e,R .T i b s h i r a n iandJ .Freidman,TheElementso fS t a t i s t i c a lL e a r n i n g : DataMini時 , I n f e r e n c e,and P r e d i c t i o n,S p r i n g e r,NewYork,2001 . [ 6 ] D.W.Hosmer, andS .Lemeshow,AppliedL o g i s t i cR e g r e s s i o n,JohnWiley ,NewYork,2 0 0 0 . 均u r o, Y.S a k a r r 叫 oa ndG.Kitagawa,官o o t s t r a p p i碍 l o gl i k e l i h o o dandEIC,Ane x t e n s i o no fAIC, "Ann. [ 7 ] M.I s l I n s t .S t a t .Math.Vo. 149,pp. 41 1・434、1 9 9 7 . ‑ 1 9 2 ‑

190.

[ 8 J 小西貞則,北川源四郎,情報量規準.朝倉書庖. 2 0 0 4 . [ 9 J J.M.Landwehr,D.PregibonandA.C.Shoemaker,"Graphicalmethodsf o r出 s e s s i n gl o g i s t i cr e g r e s s i o nmodels, " J .Amer.S tαt .A s s o c .Vol .7 9,p p . 6 1 ‑ 7 1,1984 [ l OJX.Lin,"Smoothi珂 SplineAnalysisofVariancef o rPolyd 叫 o mousResponseData, "T e c h n i c a lReport1003,U n i v . WisconsinMedison, Dept.o fS t a t i s t i c s, 1 9 9 8 . 9 9 3 . [ 1 1 J 桜井明 . Cによるスプライン関数,東京電機大学出版局. 1 9 9 2 . [ 1 2 J 柴田里程(訳). Sと統計モデル,共立出版. 1 [ 1 3 JK .Takezawa,I n t r o d u c t i o nt oNonparametricR e g r e s s i o n,JohnWiley,2 0 0 6 . [ 1 4 J 田中祐輔,伊庭克拓.竹1 寧邦夫,辻谷将明. "GAMとその周辺. "2009信学総大情報・システム講演論文集 2 .n o . D ‑ 1 2 ‑ 1 4 . p p . 1 2 3 .l v l a r .2009 [ 1 5 J M.T s u j i t a n iandT .Koshimizu, "NeuralD i s c r i m i n a n tA n a l y s i s, "IEEETrans.NeuralNet凹 orksVoi . 11 . pp.1394 ‑ 1 4 0 1, 2 0 0 0 . [ 1 6 J 辻谷将明,外山信夫, "Rによる GAM入門"行動計量学. Vo . 13 4 .p p . 1 1 1 ‑ 1 31 . 2007 [ 1司 M.T s u j i t a n iandM.Sakon," A n a l y s i so fs u r v i v a ldatahavingtime‑dependentc o v a r i a t e s, " IEEETn 叩 s .N e u r a l Vo. 120, p p . 3 8 9 ‑ 3 9 4, 2 0 0 9 . N e t w o r k s, [ 1 8 J 辻谷将明,青木雅彦"ニューロ回帰モデ、ル,リサンプリング.そして診断"信学論 ( D ) .VoI . J8 8 ‑ D ‑ 2 .p p . 3 9 8 ‑ 4 0 5 .2 0 0 5 . [ 1 9 J 辻谷将明,竹津邦夫.マシンラーニング,共立出版. 2 0 0 9 . [ 2 0 J W.Vach,R .RoβnerandM.Schumacher, DαtαAπαl y ., Vo. 12 1, p p . 6 8 3 ‑ 7 0 1,1 9 9 6 . .Wa時 , G.Wahba ,C .Gu,R .K l e i nandB .K l e i n,"Usingsmoothings p l i n eANOVAt oexaminet h e凶 a t i o n [ 2 1 JY , "S tαt i s t .M e d i c i n e, Voi . 16,pp.1357‑1376, o fr i s kf a c t o r st ot h ei n c i d e n c eandp r o g r e s s i o no fd i a b e t i cr e t i n o p a t h y 1 9 9 7 . 珂, "GRKPAK: F i t t i n gsmoothings p l i n e ANOVA models f o re x p o n e n t i a lf a m i l i e s, " Commun. S tαt i s t . ‑ [ 2 2 JY . Wa Simulαt . Comput., Vo1 .26, p p . 7 6 5 ‑ 7 8 2, 1 9 9 7 . 珂 , C .Gu,R .叩 Kl e 目瓜 l andB .K l e i n," S r n o o t h i n gs p l i n eANOVAゐre x p o n e n t i a lf a m i l i e s,with [ 2 3 J G.Wahba,Y.Wa , " Aπ π.S t αt i s t .,Vo. 123,pp.1865‑1895, a p p l i c a t i o nt ot h eWisconsine p i d e m i o l p g i c a lstudyo fd i a b e t i cr e t i n o p a t h y 1 9 9 5 . "J .R o y .S t αt i s t . [ 2 4 JS . N .Wood. "Modellingandsmoothingparametere s t i m a t i o nwithm u l t i p l eq u a d r a t i cp e n a l t i e s, Vo. 162, pp. 41 3 ‑ 4 2 8, 2 0 0 0 . S o c .B, [ 2 5 JS . N . WoodandN且 A噌 国 i n,"GAMswith i n t e g r a t e dmodels l e c t i o nu s i n gp e n a l i z e dr e g r e s s i o ns p l i n e sand a p p l i c a t i o n st oenvironmentalmodelling, "E c o l o g i c a lM o d e l l i n g, Voi . 157,pp.157‑177,2 0 0 2 . S t a b l eande f l i .c i e n tm u l t i p l esmoothingparametere s t i m a t i o nf o rg e n e r a l i z e da d d i t i v emodels, "J . [ 2 6 JS . N .Wood," Amer.S t αt .A s o c ., Vo1 .99,pp.673‑686,2004 e n e r a l i z e dA d d i t i 凹 M odelsAπI n t r o d u c t i o nw i t hR, ChapmanandH a l l,NewYork,2 0 0 6 . [ 2 7 JS . N .Wood,G ‑ 1 9 3・

191.

経時測定データに対する一般化線型モデ、ルに基づいた 反応プロファイルの分類 0冨金原悟 l)2),菅波秀規制,山田大志 5),山口拓洋 1) 1 ) 東京大学医学部附属病院 臨床試験データ管理学 2 ) 小野薬品工業株式会社 臨床開発管理部統計解析課 3 ) 興和株式会社臨床解析部 4 ) 東京理科大学大学院工学研究科 5 ) アストラゼネカ株式会社 臨床統計・プログラミング部 C l a s s i f i c a t i o nofi n d i v i d u a lp r o f i l e sb a s e donG e n e r a l i z e dL i n e a rModelsf o rL o n g i t u d i n a lData 3 H i d e k iSuganamiペ 1 S a t o r uF u k i n b a r a 1 ) 2 ), トTaijiYamada5),TakuhiroYamaguchi) 1 )D epartmento f C l i n i c a lT r i a lDataManagement , G r a d u a t eS c h o o lofMedicine, U n i v e r s i t yofTokyo 2 )ONOP h a r m a c e u t i c a lC o ., LTD.S t a t i s t i c a lAna l y s i sC l i n i c a lDevelopmentManagement 3 )KowaC o ., L td .DataS c i e n c eDepartmen . t 4 )TokyoU n i v e r s i t yo fS c i e n c e .G r a d u a t eS c h o o lo f E n g i n e e r i n g 5 )S t a t i s t i c s& ProgrammingDepartment, A s t r a Z e n e c aK .K. 要旨 経時測定データ解析の一法である混合分布モデ、ルで、は,個体毎の経時的変動パターンの類似度 により個体を分類する.経時的変動パターンのモデリンク。に一般化線型モデ、ルを適用する方法を 示し,その SASプログラムを紹介する. キーワード:経時測定データ,反応プロファイル,混合分布,一般化線型モデル 1.緒言 臨床試験では,ある時点における薬剤の効果を評価するだけでなく,同一被験者に対して繰り返し て測定値を得ることがある.この繰り返し測定値の解析には,治療群別の「平均的 Jな治療効果を評価 する周辺モデ、ル(例えば, GEEなど)があり 反応プロファイルが治療群内では均 r 時点×群 J交 E作用に評価の焦点をあて,被験者ごとの であることを想定している. 一方で,治療に反応して検査値が改善方向へ動く被験者もいれば,変化があまり見られない被験者, さらには,悪化の方向へ動く被験者もいるというように,同じ治療を施しても被験者によって反応プ ‑ 1 9 5 ‑

192.

ロファイルが大きく異なることもある.臨床試験ではこの不均一性が,評価に与える影響を無視でき ない場合がある.この問題への対応として, r 時点 x個体」交 E作用を検討するために,検査値の変動ノ f ターンの類似度により個体を分類する方法が混合分布モデルの適用をはじめとして,数種,考案され ている 1)‑4) これらの方法では,投与開始時点からの検査値の経時変動ノ号ターンから,例えば「改善群 j, 「不変群 j, r 悪化群」などの分類群が各薬剤群に混在していると仮定した混合分布に基づき,個体が分 類される. 2 ) しかしながら臨床 丹後らが行った研究では,応答変数として連続量データのみを扱っている 1) ・ 試験では,例えば急性肺損傷の診断に用いる肺障害スコアなどの順序尺度の評価,疾患の正常化など の改善・非改善など 2値応答においても経時的に測定を行うことがある.そこで,本論文では連続量 を扱う一般線形モデルによる経時的変動ノ号ターンのモテゃル化を, Nelder,Wedderb町内こより提案された 一般化線型モデルに拡張する方法を紹介する.一般化線型モデルでは指数型分布族に属する広い範囲 の分布に従う確率変数を取り扱うことでき,連続量や 2値応答の評価指標についても反応プロファイ ルの分類が可能となる. また,一般線型モデルに基づいた反応プロファイルの分類において,被験者を分類するための分類 確率の計算では,低次の一般線型モデルに対するパラメータの推定も含んでいたため制約条件を伴っ た EMアルゴリズムによる収束演算が汎用的であり, SASでは品1 Lを用いた収束演算により対応して いた.今回,反応プロファイルを分類するための分類確率の収束演算を行うアルゴリズムを整理する ことによって,この計算は一般的なプロシジャにおいて, weight ステートメントを指定することで解 決できることがわかった. 本論文では, 2 章で臨床試験における繰り返し測定値の変動ノ fターンの類似度により個体を分類す る方法の既存の手法を紹介し, 3章で=は変動ノ号ターンの分類に対して一般化線型モデ、ルの適用方法, 4 章では S ASプログラムのアルゴリズム, 5章では計算事例を紹介する.最後に 6章では本論文の要約 を行一う. 2 . 繰り返し測定値の反応プロファイルによる分類 2. 1 臨床誌験における繰り返し測定値 今回検討する基本的な臨床研究のデザインを以下に示す. 目 的 :1種の治療に対してそれらの効果の比較を行う. 対象 :それぞれの処理(群) iに m個体ずつ ( i = l, …j ) をランダムに割付ける.また ,nl+ 測定方法 :各個体に対して決められた治療を施してから,実験期間中の効果を経時的に評価す … +n t = n . とする. るため,処理を施す前のベースラインと,処理後にあらかじめ設定された T個の測 定時点で反応(特性)を観察する(合計 T+1回測定する). このとき,開始時点を 0として,群 iのj番目の個体における時点 tでの測定値を { X i j ( t ) :i=l, . . . , J , j=l, ースバニ O , l , " ' , T,n, +ー +nJ= n . } ‑ 1 9 6 ・ ( 2 ‑ 1 )

193.

とする. 個体ごとの評価指標として,よく利用されるのはベースラインからの差,ベースラインに対する比 さらには変化量を%で表現した値がある. 今回の検討では,ベースラインからの差について示すが, ベースラインからの比や変化量の%値についても同様の議論が可能である. 2, 2 混合分布モデル 「個体×時点」交互作用に対する検討を試みた研究は,丹後のモデル り l ) , 以 ' ユ ベ 2 の手法などが提案されている.丹後のモデルと Skeneらのモデル 3)の類似点は,変化量の確率密度関数 悪化群」などの同時確率密度関数の和から構成される点である.また相違点は,次のと が「改善群j, I おりである. 1)個体毎の推移変動のパターンを丹後のモデルでは低次の多項式に隈定していたが, Skeneらの モデルでは,パターンに制限をつけていない. 2) Skene らのモデルでは,確率密度関数の構成までの検討であるのに対し,丹後のモデルでは, モデ、ルに準じた薬斉J I比較として,尤度比検定までの手順を考察している. 一方,広津の研究 4)は多重比較法を拡張して,検査値の変動パターンの類似度により個体を分類して おり,個体の分類基準としてクラスター分析の階層的方法のーっとして知られている Ward法と等価な 手続きを利用している. ここでは,丹後 1), 2 )らにより提案された混合分布モデルを基本に議論を進める.被験者の分類方法で は,治療の種類にかかわらず,被験者集団を効果の見られた「改善群j,効果のなし、「不変群 J,症状が 改善割合j, I 不変 悪くなった「悪化群」の混成であり,薬剤の種類によってその混成割合,すなわち, I 悪化割合」が異なると考える.また,このモデルでは,投薬に基づく症状の変動(改善,悪化 割合j, I など)は「指標とする検査値の変化」と等価であることが前提である. 以下では 2群比較を基本とし,記号は丹後らの書式に従い説明する. .基本モデル = 1, 2 ) を施された個体 j ( = 1, 2,. . "n ; ) の測定時点 1 ( = 0,1 , … , η の検査値を X i j tとする.こ 薬剤 i( i j t = X i j t ‑ X i j 。に対して,モデ、/レを想定する. こで,投与開始時点からの変化量 D D i j t=μ( t )+eijt't =1 , … ,T ここに, ( 2・1 ) { c i j t )は互いに独立で,平均値の経時的変動 μ( / )が,分類群 g (=0, 1 , … , G) に属するとすると 工βJK(g=O,lf,G) μg ( t )= ( 2 ‑ 2 ) k~O で示す低次の多項式とする.仮に I 不変群g=O J, I 改善群g=I J, I 悪化群g= 2 Jとすると,上記の多項 式は,ここに 。 μ 1( t )く μ ( t )く 的 ( t ) t (=1, … ,T ) ( 2 ‑ 3 ) の制約条件を課す.多項式の次数の決定には下記の ( 2 ‑ 6 )式に示す尤度を用いる. Iiを投与された群の個体 jの経時変動ノ ξターン Dゲ = ( D i j 1 '…, D i j T ), j=l, …, n i の確 したがって,薬剤J ‑197・

194.

率密度関数 h, {d i j )は,薬剤 Iによる「不変割合J. i 改善割合J, i 悪化害J I合」をそれぞれ, P , Q j P i l,P i 2( P i Q + Pn+Pi2=l)として,以下の混合分布で表現できる. =P ん( d i j ) +Pilflい i j ) +Pid2( d i j ) 仇θ│) hi 一 ー ここで, ( 2‑ 4 ) i O ん(・ , )1 1( ・),ん(・)はそれぞれ, i 不変群J. i 改善群J. i 悪化群」で の Dゲの同時確率密度 M ‑ ︑ ︑M か HH ︑1111P1llJ σ μ︒ LMr T寸 l一 M Ill1 ノ fdnL xρlu 刊円 /11111i¥ fj ︒ ︐ h v 関数であり,それらは次式で与えられる. ( 2 ‑ 5 ) ,g=0 ,1 ,2 したがって,パラメータ 8={ Pi g, ん , c1}の推定は尤度 L 2 、 N; L=I 1 I 1hiい I d i j ) ( 2・6 ) を最大にすることで推定される. また,本モデ、ルは,以下の個体 jが分類群 gへ帰属する事後確率(ここでは,相対的帰属確率と呼 ぶ) Q y . ( g )ニ pigfg( d i j ) /hi( d i j lθ) i (ニ 1 ,2 ;g=0 ,1 ,2 ;j=1 ,2 ,…, n ) i ( 2 ‑ 7 ) に基づく個体の分類確率を与える.それにより「改善群 J, i 悪化群」などに分類された個体の要因の検 I愛する. 討が可能となる.ここでは,検定に対する検討は害J 3 . 一般化線型モデルの適用 丹後らの方法は,一般線形モデルによって経時推移ノ 4ターンをモデ、ル化していたが,臨床試験では, 生存・死亡,改善・非改善のような 2値データ,姉障害スコアのように臨床的な観点により順序を付 帯したカテゴリカルスコアなどが利用される.経時的に測定されたこれらの評価指標に対して,反応 プロファイルにより個体を分類するため,混合分布モデルにおける個体毎の基本式に一般化線型モデ ルを適用する.ここでは,投与後に経時的 ( / = 1,… ,T ) に測定された 2値データ,カテゴリカルスコ アを評価指標として検討する. 一般化線型モデ、ル 7)では,指数型分布族に属する分布(ポアソン分布,正規分布, 2項分布,ガンマ分 布など)に対して, リンク関数を用いることによって,説明変数の線形結合によるモデル化を可能と 2 ‑ 2 )式を表現すると, している.一般化線形モデ、ルの枠組みで, ( d ( μg)=工 ん 〆 (g=0,1,…, G) ,・ ,T t=1 ( 32 ) ・ k=u となる.以下では,簡便のため l次項までで議論する.次に,密度関数については,一般化線型モデ ルの枠組みとして指数型分布族を適用するため, (2δ)は , t ん( d i j ; B i j )=e x p [{ a ( d i j 't ( B i j ' ) +c ( 凡) + d ( Y i j J ] ‑ 1 9 8 ‑ ( 3 ‑ 3 )

195.

となる.ここで,a( y i j t ) =Y i j tのとき,正準形であり,ポアソン分布,正規分布, 2項分布は,それぞれ l o g,↑亘等, l o g i tをリンク関数とした場合に正準形として記載される.指数型分布族として,ポアソン 分布,正規分布, 2項分布を示すための各パラメータを表 lに示す. 表 1 指数分布族としてのポアソン分布,正規分布, 2項分布 B 分布 C ポアソン分布 l o g ( θ ) 正規分布 μ l o g y ! 一θ ~ log(2π 7 . w ‑) 一一一一一 σ y 2 2σ2 nlog(l‑π) n l og(: 2 2σ2 2 σ, 一 ー 2項分布 S 吋1~. 1 ‑ π7r J J なお、パラメータ θ={ p ψ s i ,i f }の推定は, 2章の手1 ) 慎に従い尤度 L を用いて実施される. •l o g i s t i c回帰モデルの適用 一般化線型モデルの例として, リンク関数に l o g i tを用いた 2項分布について紹介する.臨床試験で は,臨床的な関値を設定し,改善/非改善,正常化/非正常化などの 2値応答の評価を経時的に測定 することがある. = 1,2 ) を施された個体 j ( = 1,2, … ,n ) の測定時点 I ( = 0,1 , … , η の検査値を X i j tとする.ここ 薬剤 i( i j tデータをある関値で 2値化して M i A正常=1,非正常 =OJとする.その際 で被験者毎の X 悪化群」ごとの正常化率を 「改善群J, I ( t )= g であり, とすると, 押収 +β t) gO I 不変群 J, I ( 3‑ 4 ) 1+切(ん + βg l t ) リンク関数は, の (t叶1~:J= ん +βl〆β(g =O,I,‑‑‑, G) g ( 3 ‑ 5 ) となる. 「不変群g=0 , J I 改善群g=I J, I 悪化群g= 2 Jとすると,上記のリンク関数は,ここで LM S ;L M t 2三 LMto: l t r ニl t~1 t (=1, ‑ ‑ ‑ , T ) ( 3・6 ) 1=1 の制約条件を課すことになる.薬剤J Iiを投与された群の個体 jの経時変動パターン M i j , j=l,… , nj の ‑ 1 9 9・

196.
[beta]
確率密度関数 h,
{
M
i
j
)は,薬剤 Iによる「不変割合 J,i
改善割合 J,i
悪化割合」それぞれの存在割合を ,
P山

P
i
]
>P
i
2(
Pi
O
+P
n
+
P
i
2
=
1
)とすると

h
θ
)
=PiOfo(Mijlθ
)
+PilJ
;(Mijlθ
)
+Pi2h(Mijlθ
)
(
M
i
jI
i

(
3
‑
7
)

となる .f
は
, i
不変割合 J, i
改善害J
I合 J
,i
悪化割合」の確率密度関数であり (
3
‑
3
)に表 lの 2項分布を
適用することにより
﹁Illi‑‑
﹂
︑
I
l
l
i
‑
‑
F
I
l
l
‑
‑
a
'
till‑‑︐
ノ

¥

目
︑

︐

σb

nvM

o

/11111¥

+

z

σb

n
u

+

M

/M
︑

Z

σb

n
u

M

r
f
i
l
‑
‑﹄ J t
︑
'
a
E
I

︐
︑
T
す
臼
︐ M

E

m
T

﹁
illll111llL

M

fhq

(
3
‑
8
)

となる.

4. 演算アルゴリズム
パラメータの最尤推定には, Newton‑Raphson法または E・M アルゴリズム 6)などの利用が可能である
E‑Mアルゴリズムが紹介されている.基本的には,

が,丹後らの論文では,

1回偏微分方程式を 0と

おいた連立方程式を解ことになり,それを整理すると E‑Mアルゴリズムの形式になる.従来の低次の
線型多項式型での計算過程を以下に示す.

J, 「改善群g=
StepO :薬剤群 i (
=
1,2
) の個体 j (
=
1,…,n
;
) が「不変群g=
O
J, 「悪化群g=I
2
Jに属する

g
) の初期値を与える.
相対的帰属確率合 (
S
t
e
p1 :[
M
‑
s
t
e
p
J

Q
i
j(
g
) が与えられたとの条件でパラメータの最尤推定値を次式で計算する.

ん
=
主
的
)
戸

(
4
ー1
)

VL1

¥11Illlj

Tす
ト
︼
.
出

口町

j

T

n

︑llLF111ノ

n
fkハ /

μE

T

+

YU

寸
臼

ト
︼
一
同
2す

N

T
す‑

E

︑
Jukq
g

Q

2
す‑‑H

2す
ト
︼
同

寸
n台

︽

σ

一
一

/tIlli‑‑t¥

一PA

l‑‑ 均
:‑4t

‑E・
‑P42

‑mM

44

(
4
・
2
)

(
4
‑
3
)

S
t
e
p2 :[
E
‑
s
t
e
p
J

この時点で、のパラメータ (
)
=
(
Pi
g
,s
g
k
,l)"2
}の推定量を利用して (
2・7
)式の相対的帰属確率 Q
i
j

(
g
) を計算する.
上記の M‑stepと E
‑
s
t
e
pを収束するまで繰り返せば,パラメータの最尤推定値が得られる.
Mのs
t
e
pを繰り返す計算を実施すればよい.
本手順を SASでコーディングするには, IMLを用いて E,

‑200・

197.
[beta]
アルゴリズムのフローチャートを図 lに示す.
本演算では βの推定が線形方程式の演算であるため比較的簡便に計算できる.ここで, 3章で示す一
般化線型モデルの拡張を行うと β の推定に,重み付き最小三乗法のような非線形の最適化演算を行う
必要がある. SASには,一般化線型モデ、ルのパラメータを推定するため Genmodプロシジャが用意さ
れているが,混合分布モデルの密度関数を解くためには, (
3・8
)で示すように密度関数の中に分類確率
P
i
gが含まれているため,単純には演算が行えない.そこで,一般化線型モデルへの拡張では, IMLの

E・M アルゴリズムのステップでの βの収束演算の部分を, Genmodプロシジャを用いて行い,その際分

類確率 Pigの調整には, w
e
i
g
h
tステートメントを用いて実施する.演算アルゴリズムとしては,図 lで
示す①初期値設定と② M‑Stepの修正が必要となる.②については,図 2に修正したフローを示す.

検査値

X
i
̲
i
r
・
1
'
=1
,
2

薬剤
被験者
i
J
{
j
l
定1
1
寺点
分類群

j
=
l,
…,nj
/
=
0,
1
,
,
.T
ー不変群g
=0,悪 化 群g=1,改善群g=2

変化量

:Y
i
j
t
=Y
i
j
t
‑
Y
i
j
O

↓
①

② Maximi出

lon

Step
θ=¥
P
;
g,
sg"a')の推定

初期値設定

Si
̲
f
=
L
.Y
i
j
t
i
f勾
壬 ‑100
i
fろ
と
・ 100
1
f‑
1O
O
<
S
i
j
<1
00

Q
i
j
{
l)
=
1
Q
i
j
{
2
)
=
1
Q
i
j
{
O
)
=
1

+

dろθ│)=P !o(九)+Pぷ(巳 )+p;,!,(η)
;
o

,
L

/
N
;

t,
g= Q
i
j
(
g
)

logL/ds=
0=>βの推定

正=詰お噌(ルバ1)市川
③ Expectation
Step
Qの算出

)
/
d
;
r
!
jθ) (i=は g=0,
1
,
2
;j=1
・, ぺ)

Q
i
j
(
g
)
=
P
;
g
!
g
(
ろ

1

図 l 連続量を評価指標とした反応プロファイル分類のためのパラメータ推定手順
(E‑Mアルゴリズム)

‑
2
0
1・

198.

生 ② MaximizationStep θ =仏.g, s .}の推定 白叩 r ﹄ mnu. σhV 可 ム 争し.︐ M LH+し μ庄町 W1i 司令し do 寸 E︐‑ig Ameo 3‑i 1i 例一;昨 る一ml よ 一 回 ・m '﹂‑ am pk ︐ d 一恥= 聞 ヤ 一‑ ‑ m ・/﹄'白 a= /+し+L 山 ︑ ‑ ︑K 一白h プ一対μ 白; nuvvd e 回目 l u + し p e ︑ 内 n 口 r L h ロ ニ; ; i 凶 一 n c o ou n r m pr キ ム: g ) / N ; 口 σ中 i ぇ g ; (│ θ ) =PiOf o ( ろ) + P i l万 ( 号 ) +p;, / ,( y J 図 2 2値応答を評価指標とした反応プロファイル分類のためのパラメータ推定手順 (Genmodプロシジャを用いた E‑Mアルゴリズム) 5. 結果 1 )修正アルゴリズムの確認 プログラムの検証のため,丹後らの論文でも号 l 用されている血中脂質低下薬 M の臨床試験における 総コレステローノレ量のデータを用いたの. プログラムとしては, 図 2に示した 3のみ SASのプロシジ ヤで算出するアノレゴリズムを多項式用とするため Regプロシジャを適用し,図 lで示した通常の E‑M アルゴリズムとの計算の比較を行った. 2つのプログラムを実行した結果, θ={ Pig,sg,r?}の推定値は ド f 11 4に示す. 一致した.収束確認するため,収束回数と最大尤度 ‑ 2 1 o g L, σの関係を図 3, →← E‑MAlgorism by I M L ‑ MAlgorism b yI M L 一 → ← ーE ー ‑ 1 0 3 8 . 0 E ‑ MAlgorism by Genmod 1 0 3 7 . 8 1 0 3 7 . 6 ー ‑ 9 . 2 8 E ‑ MAlgorism b y Genmod 9.26 9 . 2 4 ﹂出︒一N 9 . 2 2 1 0 3 7 . 2 9.20 1 0 3 7 . 0 9 . 1 8 1 0 3 6 . 8 9 . 1 6 1 0 3 6 . 6 武 1 0 3 7 . 4 9 . 1 4 0 3 6 9 1 2 0 3 i t e r a t i o nn u m b e r 6 i t e r a t i o nn u m b e r 図 4 収束回数と σの関係 図 3 収束回数と最大尤度の関係 図 3, 4より収束状況も二つのプログラムで異なることはなかった. ‑ 2 0 2・ 1 2

199.

2 )一般化線型モデル ( 2項分布)での計算結果 ここでは, 2項分布の経時測定データを一般化線型モデルに基づいた反応プロファイルに分類するた め,一般化線型モデ、ルへの拡張のために修正した E・M アルゴリズムに Genmodプロシジャを適用し, 解析を実施した. Genmod プロシジャでは l i北 関 数 と し て l i n k = l o g i t, 分 布 と し て d i st = binominal を用いた.解析データは,薬剤 i(実薬群 =1,プラセボ群 =2),個体 j ( = 1, 2, …,nF50) の測定時点 t( = 1 , … , 5:week) の Mi J " t [正常=1,非正常 =0]とし, r a n b i n関数により発生させた.ここで, r 不変群g=O J, 「改善群g=I J, r 悪化群g= 2 J毎に, ( 2・7 )式より表 2で示す設定条件にて π仰を算出した. j / を発生させたシミュレーションデータの設定条件 表 2 πi │不変群 改善群 悪化群 s0 ‑ 5 . 0 ‑ 2 5 . 0 ‑ 2 0 . 0 F1 2 . 0 20 2 . 5 25 5 . 0 5 I 15 I 0. 40 I 0.30 1 0 2 5 0 . 5 0 0. 10 0 . 2 0 0 . 5 0 分類群毎のパラメータ 係数 例数 存在割合 実薬群 プラセボ群 実薬群 プラセボ群 上記データを修正した EMアルゴリズムにより薬剤群毎に「不変群 J, r 改善群 J, r 悪化群 Jに分類し た結果を図 5に示し,計算で得られた各ノ号ラメータの推定値を表 3に示す. 実薬群(不変群 n = l l l プラセボ群(不変群 n = 6 l [ ~ R 0 . 5 ~ R 0 . 5 。 。 2 3 4 t i m e [ w e e k ] 5 2 3 4 t i m e[ w e e k ] 実薬群(改善群 n = 3 0 l プラセボ群(改善群 n = 1 6 l 。 EU R nU iJR ﹁ ム 0 . 5 。 2 3 4 5 2 3 4 t i m e [ w e e k ] t i m e [ w e e k ] ‑ 2 0 3 ‑ 5

200.

実薬群(悪化群 n=9) ~ R プラセボ群(悪化群 n=28) 0.5 ~ R 0.5 。 O 2 3 4 5 l 2 3 time[ w e e k l time[weekl 4 5 図 5 2項分布の経時測定データに対する分類結果 表3 2項分布の経時測定データに対する分類結果(モデルより得られた推定値) 事後分類群 不変群 改善群 悪化群 β ‑ 1 6 . 2 ‑ 1 4 . 2 s I 7 . 8 ‑ 1 . 7 1 .8 1 1 3 0 9 。 係数 実薬群 例数 プラセボ群 実薬群 プラセボ群 ‑ 2l o gL 相対帰属確率 3 . 8 6 1 6 2 8 0 . 2 7 0 . 5 4 0. l9 0 . 1 2 0 . 3 0 3 3 8 . 3 0 . 5 8 各治療群(実薬群,プラセボ群)における各分類群への相対帰属確率は, ranbin関数で発生させた各 分類群(不変群,改善群,悪化群)の割合とは異なり,実際に発生させたデータの状況に応じて分類 3・6 )式で示す制約条件としていたi:M (正常化した時点の合計)の分布を分類群 されていた.表 4 に( 毎に示す. 表 4 分類群毎のi:M (正常化した時点の合計)の分布 i : M 3 4 5 2 不変群 1 1 実薬群 改善群 1 8 1 2 悪化群 2 7 不変群 プフセボ群 6 改善群 9 6 悪化群 19 9 不変群,改善群,悪化群への分類は, i :M (正常化した時点の合計)に即して分類されていた.以 1 i 直応答の経時測定データの反応プロファイルに応じて症例を適切に「不変 J, 上より,本手法により, 2 悪化」などの分類群に分類できることが確認できた. 「改善 J, I ‑204‑

201.

6. まとめ 混合分布モデルは,確率密度関数を「改善群 J ,i 悪化群」などの同時確率密度関数の和から構成する ことにより,繰り返し測定値において「個体×時点」交互作用の解析が行える手法である.従来の計量値 を評価変数として被験者毎の反応プロファイルの低次の多項式で、の仮定に対して,一般化線型モテ守ル を適用することでカテゴリカルデータや 2値応答変数も評価変数として検討することが可能となった. パラメータの推定には, E‑Mアルゴリズムの手順に SASで提供されている Genmodや Regプロシジャ e i g h tステートメントを使用することで,対数尤度のパラメータによる偏微分式を明示的に求める のw 必要が無く,推定が可能となった.プロシジャを用いたパラメータの推定は,提示の多項式の計算に おいて想定通り通常の E‑Mアルゴリズムでの推定と同様の結果となった. 今回の事例確認では, 2値応答を想定した 2 項分布のみ確認したが, とすることで, リンク関数を l i n k = c u l m l o g i t 1 ) 慎序カテゴリデータへの拡張も可能である.また,今後 SASで提供されている w e i g h t ステートメント機能を有するプロシジャを使用することで,共変量を含めた線型モデルや混合効果モ デ、ルなど,複雑なモデルへの拡張も可能になると考える. 参考文献 6 ) Tango, 士、1 i x t u r emodelsf o rt h ea n a l y s i sofr e p e a t e dmeasurementsi nc l i n i c a lt r i a l s' J a p a n e s eJ o u r n a l of A p p l i e dS t a t i s t i c s,18,1 4 3 ‑ 1 6 1( 1 9 8 9 ) T .' Am i x t u r emodelt oc l a s s i f yi n d i v i d u a lp r o j i l e sofr 問 , p e a t e dm e a s u r e m e n t s ', DataS c i e n c e Tango, 247‑254( 19 9 8 ),S p r i n g e r ‑V e r l a gTokyo C l a s s i f i c a t i o nandR e l a t e dMethods, Skene, A.M.andWhite,S .A . L a t e n tc l a s smodelf o rr e p e a t e dmeasurementse x p e r i m e n t s ',S t a t i s t i c si n M e d i c i n e,1 1,2 1 1 1 ‑ 2 1 2 2( 1 9 9 2 ) 広津千尋 経時測定データ解析のためのモテ会ルとその応用,品質, 19,3,1 7 2・1 7 9( 1 9 8 9 ) , J . A .andWedderburn ,R .W.M.,G e n e r a l i z e dl i n e a rm o d e l s ', J o u r n a lo f t h eRoyalS t a t i s t i c a l N e l d e r , S e r i e sA,1 3 5, 370・384( 19 7 2 ) S o c i e t y 宮}1 雅巳 EMアルゴリズムとその周辺 1 応用統計学, 1 6,1 ,1 ‑ 2 1( 1 9 8 7 ) 7 ) 田中豊,森}1敏彦,他 一般化線型モテ、/レ入門,共立出版 ( 2 0 0 8 ) 1 ) 2 ) 3 ) 4 ) 5 ) ‑205・

202.

ゲノムワイド関連解析における薬物動態関連遺伝子同定のための 新しいスクリーニング法 3 長 島 健 悟 i, 佐 藤 泰 憲 2, 3, NanM.L a i r d l 城西大学薬学部薬科学科 2 千葉大学医学部 3 ハーバード大学公衆衛生大学院生物統計部門 Anews t a t i s t i c a ls c r e e n i n ga p p r o a c hf o rf i n d i n gp h a r r n a c o k 出e t i c s ‑ r e l a t e dg e n e si ngenome‑wides t u d i e s 3 KengoNagashimal,Y a s u n o r iS a t o2, 3, NanM.L a i r d , 1D e p a r t m e n to f P a r r n a c e u t i c a lT e c h n o c h e m i s仕y J o s a iU n i v e r s i t y 2S c h o o lofMedicine, C h i b aU n i v e r s i t y 3D e p a r t m e n to f B i o s t a t i s t i c s, H a r v a r dS c h o o lo f P u b l i cH e a l t h 要旨 本稿では,薬物動態パラメータと SNPsの遺伝子型の反応関係を考慮した統計学的スクリーニング法を 提案し,シミュレーションによる性能評価と,実データに対して提案法を適用した結果を示す. r o c e d u r e キーワード:薬物動態関連遺伝子;スクリーニング;対比統計量;不等標本数;MULTTESTP 1.ゲノムワイド関連解析における薬物動態関連遺伝子のスクリーニング 医薬品に対する患者の反応には,著しい個体差がみられる場合がある.この個体差の原因のーっとして, 薬剤の曝露量に影響する薬物動態関連分子や,薬剤の応答性に影響を与える薬効強度関連分子(例えば,薬 剤標的分子)の遺伝子多型が考えられる.多くの医薬品は投与されると循環血液中に吸収され,体内の各組 世とし、う過程をたどる.これら四つの過程は,被験者から血液中薬物濃度を測定 織に分布した後,代謝・排f することで薬物動態パラメータとして推定することができる.薬物動態のそれぞれの過程は,環境要因や遺 伝的要因によって影響を受けるため,近年では個別化医療の実現に向け,薬物動態に関連する薬物動態関連 TlAl遺伝子の遺伝子多型は,塩酸イリノテカン ( C P T ‑ l l ) 遺伝子の探索が行われるようになった.例えば, UG の副作用発現に関与しており, UGTIAl 遺伝子に特定の遺伝子型をもっ人はグ、ルクロン酸転移酵素 (UGT) の活性が低下し,好中球減少や重篤な下痢などの高J [ 作用の発現が高まることが I n n o c e n t i,e ta . l2 0 0 4[1]等によ り報告されている.このような予測に利用できる新規バイオマーカーの同定が期待されているものの,臨床 応用するには十分な情報が得られていない.現在は新たなバイオマーカーを同定するために,医薬品を投与 された集団の薬物動態と遺伝多型の情報を利用した,薬物動態関連遺伝子の探索研究が数多く行われている. ‑ 2 0 7 ‑

203.

薬物動態関連遺伝子に限らず,遺伝多型の探索研究において候補が絞られていない段階では,ゲノム全体 からの候補遺伝子多型をスクリーニングする必要がある.そのような研究の事を,ゲノム網羅的関連解析 (Genome‑widea s s o c i a t i o ns t u d y ) と呼ぶ.薬物動態関連遺伝子を同定するためのゲノム網羅的関連解析では, ある集団のある薬物ついての薬物動態ノ fラメータと,一塩基多型 ( S i n g l eN u c l e o t i d ePolymorphisms,SNPs) の 関連を調べる方法がよく用いられる.ここで,薬物動態ノ号ラメータと関連する SNPsを,以降では薬物動態 関連 SNPsと呼ぶことにする. SNPsは集団の中で頻度の高い対立遺伝子のホモ接合型 (AA),ヘテロ接合型 ( A a ),頻度の低いホモ接合型 ( a a ) の 3種類の遺伝子型として測定される.遺伝子型聞の頻度の違いは,マイナー対立遺伝子頻度 (Minor AUeleFrequency, MAF) と呼ばれる指標で表わされる .MAFは集団における aの頻度であり, [ 0 . 0 5,0 . 5 J の値 を取り,集団によって多少の差異が生じるものの,やや左に裾を引し、た分布である事が知られている [2] 薬物動態パラメータには,吸収過程を要約する薬物血中濃度一時間曲線下面積 (AU C ) , 最高血中濃度 (C 皿 ,ふ 代謝・排池を表わす消失速度定数 (K c l) などがある.これらのパラメータは,通常図 lに示したように右に 裾を引し、た分布であり,非負の計量値として測定される.生物学的には遺伝形質は,対立遺伝子頻度に比例 する(対立遺伝子モデル)か,劣性遺伝する(劣'性遺伝モデ、ル)か,優性遺伝する(優性遺伝モデル)の 3通 りが自然であり,薬物動態ノ fラメータと遺伝子型の聞には単調な反応関係を持つものが多いと考えられてい る.分子生物学的にも, 3通り以外の反応関係を示す遺伝子は,検出されたとしても真の薬物動態関連 SNP である可能性が低いといわれている [3] 図 2に薬物動態パラメータと遺伝子型の反応関係の例を示した. ( i ), ( i i ),( i i i ) の様な単調な反応関係、を示すものは薬物動態関連 SNPsである可能性が高く, ( i v ),( v ),( v i ) の様な 谷型の反応関係を示すものは薬物動態関連 SNPsである可能性が低いといえる. 司 九 民 、 、 o I~ F 。/ 、 組 下ヘ v N 、 ャ ょ ‑ 宮 ミ o 線 王 車 N ま説明 性当ー AA Aa a a ( i )対立遺伝子モデ、ル ‑ 、 o 、 下 •• a コ o I~ 。/ 1 2 3 Kel 図 I薬物動態パラメータ ( K e l ) の分布 4 ヘ 尚 、 i 持 者 ヤ 手 乞 = 宮 ミ z 〉 AA Aa ( i v )谷型 1 AA Aa a a ( i i )劣性遺伝モデル AA Aa a a ( i i i )優性遺伝モデ ル vv 司 九 v C → ←/ / / u AA Aa ( v )谷 型 I I u AA Aa ( v i )谷 型 I I I u 図 2 薬物動態ノミラメータと遺伝子型の反応関係 以上を踏まえると,薬物動態ノ汚メータと SNPsを用いたゲノム網羅的関連解析を行う上では,以下の 2 点に注意すべきである. 1 ) 多くの SNPで各遺伝子型の頻度が異なるため,不等標本数を前提とした手法の適用を検討すべき. 2 ) 生物学的には単調な反応関係を優先してスクリーニングした方がよい. ‑208・

204.
[beta]
2
. 統計的スクリーニング法
2
.1
. Kru
skal‑Wallis検 定 [
4
]
本稿で想定するデータ構造は,薬物動態関連 SNPs を探索するゲノム網羅的関連解析である.ここで,記
号 の 定 義 を 行 う . あ る SNP について,

i群 の j番 目 の 個 体 の 薬 物 動 態 パ ラ メ ー タ の 測 定 値 を

号(i=1
,
2,3
; j=1
,2,
…,
n
;
) とする. iは遺伝子型を表わす添え字で i=1
,2,3はそれぞれ,遺伝子型 AA,
Aa,
a
a
に対応する

jは遺伝子型聞の頻度が異なるため,それぞれ n となっている.多数の SNPs から薬物動態関

連 SNPsをスクリーニングする場合, SNPそれぞれについて「各遺伝子型における薬物動態パラメータの母
平均に差がない (μAA=μ担 =J1")
J という帰無仮説 H。の仮説検定が行われる.ここで,各遺伝子型における
薬物動態パラメータの母平均を μzとおくと,
)
‑
(

Ho:μ1=μ2‑μ3
と表わされる.

薬物動態ノミラメータの分布形状から,正規性の仮定を必要としないノンパラメトリック検定を用いたスク

1
) 式の帰無仮説 H。と,対立仮説 H1:
n
o
tH。のKrusk
a
l・W
a
l
l
i
s
リーニングがしばしば行われる.解析手法には, (
検定が用いられる.
)
慎に並べ,その順位を Ruとし,同順位がある場合は中間順位
ここで,全ての測定値号を値の小さい方から 1

s
k
a
l
・
W
a
l
l
i
s検定の検定統計量 H は
,
で置き換えるとする. Kru

l
1
/ エ(1,一川 +1~I

す

HJ
主
二1 ni
(
R
/ー (N+1)/2} I
1N t
i
' (N2 ‑1)/12 1
/1
‑
N:

エ
:
l
n
J
{=エ
:
l
h

全サンプルサイズ

,: タイの長さ .

,

N=

R
̲
,
: 第 i群 の 平 均 順 位
1

1

(N‑I)N(N+1
) 1

を第 m番目の順位とすると

R(m)

R
(
I
)=R(2)=…=R(")くR
(
I
,
+
I
)=…=R("‑")く…く…くがエ:11rf+I)=…=R
(
'
[
.
;
.,
"
)

である.統計量 H は帰無仮説 H。のもとで漸近的に自由度 2(群の数ー 1)の

x分布に従うことが知られてい
2

る.Kru
s
k
a
l
‑
W
a
l
l
i
s検定による P値は,ど分布で近似することで求めることができる.

s
k
a
l
‑W
a
l
l
i
s検定に基づいて有意差がついた SNPsを薬物動態関連 SNPsとして判定を行うと,対
しかし, Kru
i
v
),(
v
),(
v
i
) のような谷型の反応関係を表わす仮説が含まれるため,真の薬物動態関連 SNPsで
立仮説に (
ある可能性が低い SNPsも検出されてしまうことがある.そのため,実験家は検出された SNPsの遺伝子型と
薬物動態ノミラメータの反応関係を目視によりチェックし,遺伝子型と薬物動態パラメータが単調に変化する
図 2 の (i)~ (i ii) のような反応関係を持つ SNPs を選択する.検出される SNPs の数が少ない場合 lこは,実験
家が目視で確認することはそれほど困難ではない.しかし,近年では一度に 10 万 ~IOO 万の SNPs を調べる

ことが可能となったため,検出される SNPs も膨大になり,実験家が目視により反応関係、を一つずつ確認す

s
k
a
l・W
a
l
l
i
s検定は理論的にも効率
ることは困難になっている.本稿が対象とするようなデータに対して, Kru
が悪いため,ゲノム網羅的関連解析において,遺伝子型の反応関係を考慮した薬物動態関連 SNPs を検出す
るための統計学的スクリーニング法が必要であるといえる.

209‑

ー

205.
[beta]
2ユ 最 大 対 比 法 (MaximumC
o
n
t
r
a
s
tMethod)
Yo
s
h
i
m
u
r
a,e
ta
.
11997[5J は毒性試験において,用量反応関係を検出するために最大対比法を適用することを
提案している.ゲノム網羅的関連解析においても,最大対比法を適用することで,特定の反応関係をもっ薬
物動態関連 SNPsの検出に利用できると考えられる.
最大対比法について定式化を行う.最大対比法は,各群の測定値叫が独立であり,母平均 E()=J
L
i
'母
分散 V紅 (
Y
;
)=σ2の正規分布に従うことを仮定する.ここで,第 i群の標本平均を ,
;
Y 平均ベクトルを Y ,

¥11111J
ノ

l 一向

l 一円

間可

/'11111¥

l 一川

AU

D

︐

'
1
1
1
1
1
1
1
1
1
1
1
1
1
1
J
e J

f111111s¥

HF

uha一 V勺一 V勺

¥1IIlli‑‑tJj

/'illl111111t¥

Y
一

V
a

l一
n
t

す
んM
ー
上

一var

︑
︑角 川 町 内

母平均ベクトルを μ,各群の標本数の逆数を要素に持つ対角行列 D を

と定義する. d
i
a
gは対角行列,は行列またはベクトルの転置をあらわす. (
1
) 式の帰無仮説に対し,対立仮
1く ん く μ
3や μIμ2く μ
3といった特定の反応関係を指定した検定を行うことを考える.指定
説 HIとして, μ

2
k

ヲ‑

n
u

‑
‑c

k

p
l
ν

+

'k

p
l
ν

+

333

222

︑
︑

明

‑t

11111111111
ノ

2: ・
c1c
iCF

iz
‑‑j
mw
c
c‑c
/5411111111111111111

)一一n

LA

︐

︑
戸

︑
戸

ρ

ρ

2
︑

(︑

一
一
C

z‑‑‑
︑
町
︑i
pup‑νPLJ

を行いたい反応関係が m個あるならば,対比係数ベクトル Ckを要素として持つ,対比係数行列

を用いて,対立仮説は H1:Cμ>0と表現できる.本稿では, (
i
) に対応する対比係数ベクトル C1=ー
(1
,0
,1
)
'(
i
i
)に対応する C2=(211
)
',(
i
i
i
)に対応する C) =ー
(1
,
‑1,
2
)
'の三つの対比係数ベクトルを用いて最大対比法
を適用した.対比係数ベクトル Ckに対応する統計量(対比統計量と呼ぶ)を
中

c~Y

汁一言言宗7=
;
ェ
エ
ri~1 j~1

(
Y
i
j‑y
,
)2 ,

r=1
工
科13
J

¥ i~1

と定義する . T
c
;
μ >0に対して検定するための検
k は仮定から導かれ,帰無仮説 Ho:c~μ=0 を対立仮説 Ho :
定統計量である.最大対比法の検定統計量は,これら m個の対比統計量の最大値

で定義されている

T
T
m
a
x
{九九… ,
九
日=
k,
m}
…,

:
t

叫を最大対比統計量の観測値とすると,最大対比法による P値は
P
‑
v
a
l
u
e=Pr
>t~a, I
Ho)= 1‑Pr
(T
(Tma,
m
出

:
:
:
:
;

tm日

Ho)
I

;t~a , I
:
:
:
;
tm
Tm:
= 1‑P
Ho)
r
(
I
;:
壬 trnax …,
a九

(
2
)

'
"
)
'
である.統計量 T=(
が帰無仮説
H
Tm
。の下で多変量 t分布に従うことから,適切な領域を数値積分
九九日・ ,

することで P値を求めることができる [6J
しかし,多くの SNPでは各遺伝子型の頻度が異なるため,対比統計量 T
kは各群の標本数の相違が大きいほ
ど,分子の標準誤差の推定値にあたる分母

守十す)

同 五=
J
d
2
(

の値を過大推定してしまうことがある.例えば
較して極端に小さい場合を考えると ,

(
3
)

)が nJ,n2 と比
c
;
)*0の対比係数ベクトルを与えた仮説は n

c
:
)=0の対比係数ベクトルを与えた仮説よりも,分母が大きくなりや

すい事が分かる.

‑
2
1
0
206.
[beta]
2
.
3
. 修正最大対比法 (
M
o
d
i
f
i
e
dMaximumC
o
n
t
r
a
s
tM
e
t
h
o
d
)[7]
Kru
s
k
a
l
l
‑
Wa
l
l
i
s検定は不要な反応関係を持つ S
N
P
sを検出しやすく,最大対比法は不等標本数の場合に標準
誤差を過大推定することがあるという問題があった

そこで,我々は最大対比法をもとに,不等標本数の場

合に (
3
) 式について過大推定が起こらないように変更を加えた修正最大対比統計量

T~ax =max{~', T;,…"T:,...,T~} , 乙'=4L
~C:Ck

を提案した.最大対比法と同様に,対比係数ベクトルとして, C1=一
(1
,0
,1
)
', c
‑
2,1
,1
)
', c
(1
,
一1
,
2
)
'
2 =(
3 =一
を用いた.提案法では,標本再抽出に基づいて並べ替え検定の近似 P値求めた [8] 計算方法を以下に示す.

l

リサンプリング回数 NRESAMPを設定する.カウント用変数 COUNT=Oをセットする.標本の修正最
大対比統計量 t
;
:
a
xを求める.

2
. データ υ
y から復元抽出を行う.抽出した標本を y
;
)とする.
3
.

4
r
)から f訟を求め, t
i
;
;ミf二
x
て、あれば COUNT=COUNT+1とする.
即一山

P

∞
一
四

4
. 2
‑3を NRESAMP回反復する . P値は

である.

本稿では NRESAMP=1
0
,
000として適用した結果を示した.

3
. シミュレーションによる性能評価
3
.1
. 目的と方法
本シミュレーションの目的は, Kru
s
k
a
l羽 /
a
l
l
i
s検定,最大対比法,修正最大対比法の検出性能の評価である.
実データを参考に,各群のサンプルサイズ,図 2に対応する反応関係を持つような各群の薬物動態ノ fラメー
タを設定した上で測定値むを生成し,モンテカルロシミュレーションを行った.

0
0と固定し, MAFを 0
.
5,0
.
2
5,0
.
1
2の 3通り設定する
サンプルサイズについては,全サンプルサイズを 3
ことで,各群の標本数が近い状況から異なる状況までを検討した.薬物動態ノ ξラメータについては,一般に
非負で右に裾をヲ l
し、た分布であり,実データを考慮して次のパラメータを持つ対数正規分布,耳 ‑LN(μI' 1
2
),
f
.
l
i=L
l
.'CkiI
4に従う乱数をシミュレーションデータとして発生させた.条件Ll.=0は帰無仮説を表わし,第一

.
5,1
.0で、は検出性能の評価を行った . Ckiについては,検出すべき反応関
種の過誤の制御の評価を,条件Ll.=0
係である

(
i
) C1=(
ー
1
.
5
,0
,
1
.5
)
',(
i
i
)c
‑
2,1
,1
)
',(
i
i
i
)c
‑
1,‑1,2
)
'の場合と,検出する必要のない反応
3 =(
2 =(

i
v
) ら =(
3,0,
3
)
',(
v
) Cs=(
0,
‑
1,
2
)
',(
v
i
)c
2,‑1,0
)
' の場合を設定した.
関係である (
6=(
0,
000固とし,有意水準 α=0.05として各手法で 検定を行った.最大対比法,お
シミュレーション回数は 1
よび修正最大対比法では,統計量が最大となる対比係数ベクトルが観測値にもっとも適合する反応関係であ
ると判定する事ができる.そのため,シミュレーション条件で設定した反応関係を正しく判定できているか
どうかを評価する事ができる.これは R
T
Pという指標を用いて評価を行った.

‑
2
1
1・

207.

R T P一正しい反応関係を検出した上で有意と判定された回数 ー シミュレーション回数 R T Pが高いほど,真の関係を正しく判定し,検出する事が出来ている事を意味する.一般的な第一種の過誤 確率と検出力についてはんという指標を用いて評価を行った. Rn=有意と判定された回数 P シミュレーション回数 表1.単調な反応関係を指定した条件におけるんおよび R T P 判定 0 . 6 8 9 0 . 9 6 6 0 . 0 1 9 0 . 0 1 2 0 . 9 9 7 MCM 0 . 0 4 7 0. 40 8 0 . 1 3 8 0 . 1 4 4 0 . 6 9 0 0 . 9 6 8 0 . 0 1 8 0 . 0 1 1 0 . 9 9 7 K‑w' 0 . 0 4 9 ‑ MMCM 0 . 0 4 2 0 . 1 3 0 0 . 6 7 2 0 . 0 0 5 0 . 8 0 7 0 . 0 0 4 0 . 9 9 6 0 . 0 0 0 1 .0 0 0 MCM 0 . 0 4 2 0 . 1 2 8 0 . 6 7 4 0 . 0 0 5 0 . 8 0 7 0 . 0 0 4 0 . 9 9 6 0 . 0 0 0 1 .0 0 0 K‑W 0 . 0 4 5 MMCM 0 . 0 6 1 0 . 1 3 4 0 . 0 1 2 0 . 6 7 9 0 . 8 2 5 0 . 0 0 2 0 . 0 0 0 0 . 9 9 8 1 .0 0 0 MCM 0 . 0 6 2 0 . 1 3 3 0 . 0 1 1 0 . 6 8 2 0 . 8 2 6 0 . 0 0 2 0 . 0 0 0 0 . 9 9 8 1 .0 0 0 0 . 6 2 8 0 . 9 9 8 0 . 7 7 2 1 .0 0 0 K‑W 0 . 0 5 2 MMCM 0 . 0 5 3 0 . 2 1 1 0 . 0 4 1 0 . 1 3 9 0 . 3 9 1 0 . 7 6 9 0 . 7 6 4 0 . 1 3 3 0 . 0 5 3 0 . 9 5 0 MCM 0 . 0 5 4 0 . 1 3 5 0 . 3 7 3 0 . 0 3 0 0 . 5 3 8 0 . 3 9 5 0 . 5 9 2 0 . 0 0 1 0 . 9 8 8 1 .0 0 0 0. 45 2 K‑W 0 . 0 5 1 MMCM 0 . 0 5 3 0 . 1 7 3 0. 30 8 0 . 0 0 9 0. 49 0 . 0 5 2 0 . 9 4 4 0 . 0 0 0 0 . 9 9 6 MCM 0 . 0 6 1 0 . 0 0 9 0 . 7 4 7 0 . 0 0 1 0 . 7 5 7 0 . 0 0 0 1 .0 0 0 0 . 0 0 0 1 .0 0 0 0 . 9 8 0 0 . 7 8 9 0 . 0 4 8 0 . 0 5 7 0 . 0 6 3 o 0. 41 3 0. 4 7 6 0 . 0 4 2 0 . 0 0 0 0 . 9 3 4 0 . 9 7 6 J MCM 0 . 0 5 1 0 . 1 3 4 0 . 0 6 6 0 . 2 3 8 0. 43 8 0 . 1 9 5 0 . 0 4 1 0 . 7 2 4 0 . 9 6 0 K‑W 0 . 0 3 9 MMCM 0 . 0 3 6 0 . 0 3 6 0 . 0 0 2 0 . 1 0 6 O .日4 0 . 3 9 0 0 . 0 1 4 0 . 1 2 1 0 . 5 2 5 MCM 0 . 0 4 8 0 . 0 4 3 0 . 1 9 2 0 . 0 1 0 0 . 2 4 5 0 . 0 7 1 0 . 7 0 8 0 . 0 0 3 0 . 7 8 2 K‑W 0 . 0 5 0 ) 1 1 ( K‑W MMCM / )1 (1 0 . 1 2 O .凶 4 Rp )1 ( f 0 . 1 4 0 ( i i ) 1 ) ‑ 1 1 ( 0 . 2 5 0. 40 5 ( i i ) ・ 1 ( ) 1 ( / 0 . 0 4 7 J MMCM' ( i ) ) ) ‑ 1 ・ 1 1 ( J Rp Rp ) ) ‑ 1 ・ 1 ( f (1 ) ‑ t ( / 0 . 5 手法 真の関係 ) ‑ 1 1 ・ ・ 1 ( MAF1 6=1.0 6=0.5 6=0 0 . 3 8 1 0 . 9 2 0 0 . 2 6 7 0 . 8 1 8 MMCM 0 . 0 4 4 0 . 0 8 9 0 . 0 1 7 0 . 0 2 7 0 . 1 3 3 0 . 1 8 5 0. 48 5 0 . 0 0 1 0 . 6 7 1 MCM 0 . 0 4 4 0 . 0 0 4 0 . 4 4 3 0 . 0 0 1 0 . 4 4 8 0 . 0 0 0 0 . 9 6 4 0 . 0 0 0 0 . 9 6 4 K‑W 0 . 0 5 5 ) ‑ 1 1 (1 f 1 .0 0 0 MMCM 0 . 0 4 8 0 . 0 1 0 . 0 0 0 0 . 1 9 2 0 . 5 9 3 0 . 2 0 2 0 . 0 3 3 0 . 0 0 0 0 . 6 2 4 0 . 6 5 7 J MCM 0 . 0 5 1 0 . 0 5 8 0 . 0 5 8 0 . 0 7 2 0 . 1 8 8 0 . 1 7 5 0 . 1 5 1 0. 31 9 0 . 6 4 5 K‑W 0 . 0 4 3 0 . 1 6 5 0 . 9 9 4 0. 48 3 IM AF:Minora l l e l e企e q u e n c y .2MMCM: 修正最大対比法 .3MCM: 最大対比法 .4K‑W:Kru s k a l ‑ W a l l i s 検定.灰 色のセルは R T Pを示す. ‑ 2 1 2・

208.

3ユ 結 果 真の状態として(i) ~(iii) の単調な反応関係を設定した場合の結果を表 l に示した.表の左から 2 番目の列 にはシミュレーション条件として設定した真の反応関係を示しており,企=0 . 5, 1 .0の場合には真の反応関係 を正しく判定できているかどうか評価するため,表中の灰色のセルに R T Pを示した. Kruskal‑Wallis検定では R T P求める事ができないため表示していない.企 =0の場合,すべての条件・手法において,第一種の過誤確 率は名目の有意水準付近に保たれている事が分かる.次に o=0 . 5, 1 .0の場合は, MAF=0.5の場合,最大対 T Pはそれほど大きな差が見られなかった. Kruskal‑Wallis検 定 の ん は 他 比法・修正最大対比法の R p および R 二つの手法よりも小さい事が分かつた. MAF=0 . 2 5, 0. 12の場合,真の反応関係が ( i ) 対立遺伝子モデ ルの場 合は,修正最大対比法の RTP が最も高く,最大対比法と比較して 0.01~0.3 程度高いことが分かつた. ( i i )劣 性の場合は,最大対比法の RTP が最も高く,修正最大対比法と比較して 0.05~0.5 程度高いことが分かつた. (iii) 優性の場合は,修正最大対比法の RTP が最も高く,最大対比法と比較して最大で 0.1~0.3 程度高いこと が分かつた.また, MAFが小さくなり,群聞の標本数が異なるほど手法問の差が大きくなることが分かつた. 次に,真の状態として(i v)~(vi) の谷型の反応関係を設定した場合の結果を表 2 に示した.こちらは検出 する必要が無い反応関係であるため , Rpが低くなることが望ましい. MAF=0.5 の場合,対立仮説に (iv)~ ( v i ) の反応関係を含むため, K rus k a l ‑ W a l l i s検定のんは他の二つの手法よりも大きくなることが分かつた. MAF=0 . 2 5, 0 . 1 2の場合も同様に, K ru s k a l ‑ W a l l i s検定のんは他の二つの手法よりも大きくなることが分かつ た.真の反応関係が (v) の場合は,最大対比法のんがもっとも低く,修正最大対比法と比較して 0 .û2 ~0.05 程度小さいことが分かつた. ( i v )や ( v i )の場合は,修正最大対比法のんがもっとも低く,最大対比法と比較 して 0.1~0.5 程度小さいことが分かつた. 3 . 3 . 考察 シミュレーションの結果から,薬物動態関連 SNPs を探索するゲノム網羅的関連解析における適切なスク リーニング方法について考察する. 各群の標本数が均一になる SNPs については,ほぽ性能が変わらないため,最大対比法・修正最大対比の i ) 対立遺伝 どちらかを用いればよいと考えられる.各群の標本数が不均一な場合については,反応関係が ( i i i ) 優性遺伝モデルの場合は,修正最大対比法を用いた方が良いと考えられる.反応関係が ( i i ) 子モデ、ルと ( 劣性遺伝モデ、ルの場合は最大対比法を用いた方が良いと考えられる. Kru s k a l ‑ W a l l i s検定は検出力が他の二手 法と比較して低く,谷型の反応関係を検出してやすいため,適切な手法ではないと考えられる. シミュレーションでは l つの SNP の検出における性能を評価したが,実際には 10 万 ~100 万 SNPs から検 出を行う必要があり, α=0.05 で検出を行うと,単純計算で 5000~50000 SNPsが検出される.実際には,よ り有望な SNPsを優先的に検出したいため,有意水準を調整するが,多くの SNPsの反応関係、を目視でチェッ クする必要がある.したがって,上で述べたような,谷型の反応関係を検出しにくく , R T Pが高くなる最大 対比法および修正最大対比法を組み合わせて適用することが望ましいといえる. ‑ 2 1 3 ‑

209.

表2 . 谷型の反応関係を指定した条件におけるん MAF' 手法 真の関係 t : .= 0 . 5 0. 45 5 0 . 9 8 7 J MCM 0. 46 7 0 . 9 8 9 K‑w' 0 . 7 8 0 1 .0 0 0 h⑪ !CM 0 . 5 1 3 0 . 9 9 5 MCM 0 . 5 1 9 0 . 9 9 5 K‑W 0 . 6 1 7 0 . 9 9 9 MMCM 0 . 5 4 0 0 . 9 9 1 MCM 0 . 5 4 3 0 . 9 9 2 MMCM' ( i v ) v t : .= 1 .0 ( v ) 0 . 5 v ( v i ) ヘ J ( i v ) v ( v ) 0 . 2 5 v ( v i ) ヘ J ( i v ) v ( v ) 0 . 1 2 v K‑W 0 . 6 2 3 0 . 9 9 8 MMCM 0 . 1 7 7 0 . 7 7 4 MCM 0 . 3 0 4 0 . 9 3 7 K‑W 0 . 7 6 5 1 .0 0 0 MMCM 0 . 3 1 1 ー 。797 MCM 0 . 2 5 9 0 . 7 4 6 K‑W 0 . 3 5 5 0 . 9 2 4 MMCM 0 . 2 2 7 0 . 8 9 0 MCM 0 . 49 3 。 . 9 8 8 K‑W 0 . 7 1 3 1 .0 00 MMCM 0 . 0 8 7 0 . 2 4 3 MCM 0 . 1 8 4 0 . 5 7 9 K‑W 0 . 5 1 5 0 . 9 9 1 MMCM 0 . 1 4 9 0. 40 4 MCM 0 . 1 2 4 0. 346 K‑W 0 . 2 1 3 0 . 6 8 7 MMCM 0 . 0 7 1 。 . 2 9 8 MCM 0 . 2 7 2 0 . 8 0 0 K‑W 0 . 5 4 6 。 . 9 9 6 ( v i ) ヘ J ~一一一一一 1MAF:M inora I I e l ef r e q u e n c y .2MMCM: 修正最大対比法. K・W:KruskaI‑WaIIis検定. 3MCM: 最大対比法 4 4 . データ解析 ミレニアムゲノムプロジェクトとして国立がんセンターと医薬品食品衛生研究所と共同研究で実施した抗 ) に対して各手法を適用し,その結果を表 3に ta . I2 0 0 7[91 がん剤のゲノム網羅的研究の実データ (Sugiyamae 示した.探索的データ解析であるため,本来なら多重性の調整は必要がないが,有望な遺伝子多型を検出す るために α=5.0xl0‑6 (10万 SNPs問で相関の強し、連鎖不平衡ブロックが約 10, 000個あると仮定)とした. 本稿では一次の消失速度定数に対する薬物動態パラメータ Kdについて,スクリーニング.を行った結果を示し た. ‑ 2 1 4 ‑

210.

表3 . 実データの解析結果 J K̲W 遺伝子情報 MCM' MMCM' 対立 RSI I ' C h r ' 遺伝子名 P { I 直 P値 判定 P { I 直 判定 遺伝子 AlG AGT 0 . 0 1 1 1 . , 主 主 迫 . , ( i i i )優 性 L五三辺ご ( i i i )優 性 目 699 C汀 AGT O訓 2 1 . , 立 と 辺 土 ( i i i )優 性 Lまと辺三 ( i i i )優 性 目 1132979 C/G eIF2A 4 . 1x 1 0 ' " 2.7XI0'" ( i )対立遺伝子 1 .0X1 0" ( i i i )優 性 目2 148582 C/G NDST4 0 . 0 0 4 6 3. 4X 1 0 ' " ( i i i )優 性 1 .0X 10" ( i i i )優 性 AlG F I L I P l 0 . 0 0 7 3 2 . 7X1 0 ' " ( i i i )優 性 1 .0X 10" ( i i i )優 性 6 目 2223869 c π TFAP28 8.8X1 0 " 0. 25 ( i i )劣 性 0. 48 ( i i )劣 性 6 四2 703702 AlG F I L I P l 0 . 0 0 2 7 1 .0X1 0 ' " ( i i i )優 性 1 .0X10" ( i i i )優 性 7 四1 2667496 crr HIC 0 . 0 0 7 0 8 . 9X10" ( i i )劣 性 0 . 0 0 1 5 ( i i i )優 性 目2 938303 AlG OXRl 4.2X1 0‑4 1 .0X1 0 ' " ( i )対立遺伝子 1 .0X1 04 ( i )対立遺伝子 目4 149336 汀汀汀 A8CAI 0 . 0 0 4 9 3 . 3X 1 0 " ( i i i )優 性 0 " 2 . 8X 1 ( i i i )優 性 COL5Al 2.7X1 0 ,・ 5 . 2X1 0 " ( i i ) 劣性 0 . 0 0 3 2 ( i )対立遺伝子 COL5Al 8. 4X1 0 " 7 . 6X1 0 " ( i i )劣 性 0 . 0 0 2 3 ( i )対立遺伝子 9 ν i 目 1 1736926 r s 1 9 3 2 5 2 3 ﹁ 4 6 9 四4 842152 1 2 四4 763797 AlG LRP6 0 . 0 3 3 2. 4XW' ( i i i )優 性 1 .0X1 0 " ( i i i )優 性 1 4 目 1 243459 crr C140r f E 0 . 0 0 3 1 . 7X1 0 ' " ( i i i )優 性 1 .0X 10" ( i i i )優 性 1 5 目2 271714 AlG MFGE8 0 . 0 0 2 1 .0X1 0 " ( i i i )優 性 1 .0X 10" ( i i i )優 性 1 7 目2 233362 Al G GNGT2 3.5X1 0‑4 2.0X1 0 ' " ( i i i )優 性 1 .0X 10" ( i i i )優 性 METTL4 5.0X1 0 ・ 5 0 . 0 5 7 ( i i )劣 性 8 . 1XW' ( i )対立遺伝子 6 . 2X 1 0 " ( i )対立遺伝子 5 . 3X 1 が ( i )対立遺伝子 4. 3X 1 0 " ( i )対立遺伝子 1 8 目 1 2607882 ﹁ 目4 842151 ν i ν i ﹁ 9 crr 1 9 目3 848643 crr GLT25Dl 0 " 6 . 8X 1 1 9 目 6512201 C/G 8CNPl 0 " 5 . 2X 1 2 1 目9 647237 crr C21orfl2 0 . 0 4 2 0 . 2 8 ( i i ) 劣性 b立と旦.. ( i i i )優 性 4. 4X 1 0 " ( i i i )優 性 ( i i i )優 性 ( i i i )優 性 1008530 crr TFIPII 0 . 0 0 1 8 2.0x1 0 " ( i i i )優 位 1 .0X10" 22 rs1894704 AlC HPS4 4 . 9X 1 0‑4 1 .8X 1 0 " ( i i i )優 性 1 .0X1 0 " ' 22 目 1894705 crr HPS4 5.7X1 0 " l . 3XI0" ( i i ) 劣性 3 . 1X 1 0 " ( i i i )優 性 ( i i i )優 性 22 目 ,・ ,・ 四3 752589 Grr HPS4 5.7XI0‑4 1 . 4XI0 ( i i )劣性 3 . 1X 1 0‑4 22 目5 761557 AlG HPS4 5.7XI0" 1 .1XI0 ( i i )劣 性 1 .0X 1 0‑4 ( i i i )優 性 22 目7 13998 AlG HPS4 4 . 9X 1 0 " 2 . 2X W' ( i i i )優 性 l . lX 1 0 " ( i i i )優 性 22 目 737800 crr HPS4 3.9XI0‑4 3. 4XIO" ( i i i )優 性 1 .0X1 0‑4 ( i i i )優 性 22 1C h r 官 r 工 : ~染奈色体番号 2 RS扶 # :品 dbSNPbuild1 日3 0に基づく SNP固有の番号 3K 批:修正最大対比法.灰色のセルは P ‑ v a l u e~ 0 . 0 0 0 1で検出された SNPs. 比法 .5MMCM 表 3には , P ‑ v a l u e壬0 . 0 0 0 1で検出された SNPsを示した.有意水準を α = 5 . 0 x I 0 " ' ; ;としてスクリーニング を行ったところ,アンジオテンシン前駆体遺伝子中の 2SNPs( r s 2 1 4 8 5 8 2,r s 6 9 9 ) が,最大対比法および修正 i i i ) の優性遺伝モテツレとして検出された.上記の有意水準では, Kru s k a I ・ W a I I i s検定を用 最大対比法により, ( いて検出される SNPsは存在しなかった. s k a I‑ W a I I i s検定のみを用いたスクリーニング 実データによる一例ではあるが,一般的に用いられているKru では検出できない SNPsの存在を確認できた. ‑ 2 1 5・

211.

また,抗がん剤のゲノム網羅的研究で得られた 1 0万 SNPsに対して,各手法を適用した結果は, Genome M e d i c i n eD a t a b a s eo fJ a p a n(GeMDBJ:加 p s : / / g e m d b j . n i b i o . g o必/ d g d b / ) データベースに公開されている. 参考文献 [ 1 ] I n n o c e n t iF, UndeviaSD,I y e rL, ChenPX, DasS, K o c h e r g i n s k yM, K a r r i s o nT, J a n i s c hL, RamirezJ , RudinCM, VokesEE, R a t a i nMJ.G e n e t i cv a r i a n t si nt h eU D P ‑ g l u c u r o n o s y l t r a n s f e r a s elAlg e n ep r e d i c tt h er i s ko fs e v e r e 田 町o p e n i ao f l r i n o t e c a n .J O l l r n a lo f C l i 枕 a lO n c o l o g y2 0 0 4 ;2 2 ( 8 ) .1 3 8 2 ‑ 1 3 8 8 . [ 2 ] TheI n t e m a t i o n a lHapMapC o n s o r t i u m .Thei n t e m a t i o n a lHapMapp r o j e ct .N a t l l r e2 0 0 3 ;4 2 6 :7 8 9 ‑ 7 9 6 . [ 3 ] EvansW E, McLeodHL .P harmacogenomics‑ d r u gd i s p o s i t i o n,d r u gt a r g e t s,ands i d ee f f e c t s .TheNewEngland 0 0 3 ;3 4 8 ( 6 ) :5 3 8 ‑ 5 4 9 . J O l l r n a lofM e d i c i n e2 [ 4 ] K r u sk a lW H, Wal 1i sWA.Useo fr a n k si no n e ‑ c r i t e r i o nv a r i a n c ea n a l y s i s .J o u r n a loft h eAmericanS t a t i s t i c a lA s ‑ s o c i a t i o n1 9 5 2 ;2 6 0 ( 4 7 ) :583‑621 . [ 5 ] Yoshimura1 , WakanaA, HamadaC .Ap e r f o r m a n c ec o m p a r i s o nofmaximumc o n t r a s tmethodst od e t e c td o s e 1 :4 2 3 ‑ 4 3 2 . d e p e n d e n c y .DrugI n f o r m a t i o nJ O l l r n a 1 1 9 9 7 ;3 [ 6 ] 西山智,柳原宏和,吉村功.最大対比法を活用するための SAS/IMLプログラム.計量生物学 2 0 0 4 ;2 4 ( 2 ) : 5 7 ‑ 7 0 . [ 7 ] S a t oY,L a i r dN M, NagashimaK,K a t oR,HamanoH, YafuneA,KaniwaN,S a i t oY,SugiyamaE,K im S‑R,F u ‑ ,I s h i iH,UenoH,OkusakaT,S a i j oN,SawadaJ , Y o s h i d aT .Anews t a t i s t i c a ls c r e e n i n ga p p r o a c hf o rf i n d ‑ r u s eJ i n gp h a r m a c o k i n e t i c s ‑ r e l a t e dg e n e si ngenome‑wides t u d i e s .ThePharmacogenomicsJ o u r n a 1 2 0 0 9 ;9 :1 3 7 ‑ 1 4 6 . [ 8 ] W e s t f al 1PH, YoungS S .R e s a m p l i n g ‑ b a s e dm u l t i p l et ωt i n g :Examplesandm e t h o d s f o rp ‑ V a l u ea d j u s t m e n t( W i l e y k :J o h nWiley& S o n s,I n c .1 9 9 3 . s e r i e si np r o b a b i l i t yands t a t i s t i c s ) .NewYo r [ 9 ] SugiyamaE,KaniwaN,K im SR, Kik u r a ‑ H a n a j i r iR,HasegawaR,MaekawaK,S a i t oY,OzawaS,SawadaJ , KamataniN, F u r u s eJ ,I s h i iH, Y o s h i d aT,UenoH,OkusakaT, NS a i j o .P h a r m a c o k i n e t i c so f g e m c i t a b i n ei nJ a p ‑ a n e s ec a n c e rp a t i e n t s :t h ei m p a c to fac y t i d i n ed e a m i nぉ epolymo 中h i s m .J o u r n a lo f C l i n i c a lOncology2 0 0 7 ; 2 5 ( 1 ) :3 2‑4 2 . ‑216・

212.
[beta]
SASプログラム
恥a
cro凹 cm̲resamp(

data,var,class,
outd,
nrep = 20000
)
;
/柿本並べ替え分布からのリサンプリング特本/

︐
︐︐
r ︐
︐
r
︐
︐︐
f

命
品

ψT
品命 +晶守γψ T
命
品
ψT
品命 + 守
ψ T
命
品
ψT
品命 + 守 +
+晶守Tψ T

榊で榊

榊ま榊

材‑こ}榊

勾

柿甲こ﹂特

坤は紳

f

唱

味彦咋

糾玉紳

材場榊

帥ム口榊

喧
日材吋の功
榊

咋‑フ紳

榊を紳.;

叫料刊扱紳

︐

阿

m

M鴨川

*S

本一圭ヨロ
帥統榊目

*︑ノ*一
+晶守γηνψ T
品命

帥自帥耐

材独柿

古
舗
干

ψ
T
品命 + 晶 千
γ1
u
刊
ψT
品命 ψ T
品命
+
晶
守
γ
μ
円
***e

•

品命

fJ

ψT
品命 ψ

榊榊材

︐︐
︐
︐
r ︐
+晶千γψ T ψ
T

T

J

命
品

司

命
品

{ 4司

勾

暗 占 怯 怪Y 咋

梓玉柿

柿下料

喧功勾
料を紳

l

叫榊竹叫一榊引

ψ品命T

キ 1人 占 本宇

榊湯榊

勾
司
叫 ム 口 榊判
叫
榊

︐
︑
巴

ψ品命T

附叶附

+本守﹃ι令l ψ *命

帥を榊

榊量榊

品命T

J

叩

ψ
.
T
小 nυψ

叩
一
精
相
江

判自榊

品命

+晶千γ お
品白+
μ
u
* ι 加h *
品命T
ψT
品命 ψ
也
.
伊T
+守
ψ品命T
+晶千γψ T
品命
也
.
伊T

+晶守γψ T +
︐︐︐
︐
︐
r ︐
r

*毛昆*Dp
*去主*m
+本守﹃ι+l+本守 a

二

γ+晶守γ+晶守γm
︐
︐︐
r ︐︐
r ︐
r

proc multt
e
s
t noprint
data =&data permutation nsample =&nrep
outsamp =Resamp(
k
e
e
p sample̲̲class̲&var
.
);
class &class;
t
e
s
t mean(
&
v
a
r
)
;
r
u
n
;

'
;
i
f a = b& b = c then contrast = a, b, c
'
;
else i
f a = b then contrast = a, b
else i
f a: C then c
o
n
t
r
a
s
t
:
:
:
: a,c
'
;
else i
f b : c then contrast : '
b,c
'
;
else i
f p̲value = a then contrast ニ '
a
'
;
else i
f p̲value : b then contrast : '
b
';
else i
f p̲value : c then contrast : '
c
';
keep p̲value contrast;
r
u
n
;

1
*サンプノレデータの生成 *
1

data d
l
;
c
a
l
l streaminit(
5
4
3
6
9
8
4
);
;d
oi=1t
o1
8
0
; yニ r
a
n
d
(
'¥ormal
',2.30,0.1);output;
gニ 1
proc 5U凹 n
a
r
y data =&data;
Iend;
var&var; output out = Samp(keep= m &class) mean=m;
o 5
5
; y=r
a
n
d
(
'¥
i
ormal
',2.30,0.1);output;
b
y &class;
g=2
;d
oiニ 1t
proctransposedataニ Sampout Samp(dropニ name̲
lprefix守,; Iend;
I gニ 3;doi=1to 5;y=rand('Normal
',2.20,0.1);output;
varm
;i
d &class;
e
n
d
;
data S
a
m
p
;
drop i
;
set S
a
m
p
;
r
u
n
;
1
*修正最大対比統計量 *
1

1
*標本の統計量 *
1

二

T
l =abs((ml*(ー1
) +m2*(
0
) +m3*(
1
)
) Isqrt(
2
)
);
) + m2*(
1
) + m3*(
1
)
) Isqrt(
6
)
);
T2 = abs((ml*(ー2
T3 =abs((ml*(ー1
) +m
2キ (
‑
1
) +m3*(
2
)
) Isqrt(
6
)
);
T
l
, T2,T3);
Tmax =max(
keep T
m
a
x
;
r
u
n
.

1
* リサンプリングによる統計量の帰無分布の生成 *
1

1
*
*柿本*材料柿本*******材 *
*
*
*
*
*
*
*
*
*
1
*
1
1
* マクロ名 mmCffi̲resamp
1
*
一一一一一一一一一一一一一一一 *
1
1
* 定義
キ/
1
* 世田町lCffi̲resamp(
*
1
*
1
1
* data. var,class,
*
1
1
* outd,
*
1
1
* nrep = 20000
1
*)
*
1
IIキ
*
1
I1
* 変数
*
1
I1
* data 入力データセット名 *
1
I1
* var
解析対象変数名
*
1
1
* class 群変数名
*
1
1
1
* outd 出力データセット名 *
1
1
* nrep リサンプリング回数 *

proc r
n
e
a
n
s data : Resamp noprint;
var&var;
b
y ̲sample̲̲class̲;
output out = Resamp(
d
r
o
p =̲TYPE̲̲FREQ̲) mean =m
e
a
n
;
p
r田 transposedata : Resamp prefix : mean
o
ut= Resamp(
d
r
o
p=̲
i
i
A
l
!
E
̲̲
LABEL̲);
b
y ̲sample̲; i
d ̲class̲; var mean;
d
at
a Resamp;
s
e
tR
e
s
a
r
n
p
;
i
f ̲n̲=
1t
h
e
ns
e
t Samp;
l
e
a
n
2キ (
0
) +l
l
e
a
n
3
*(
1
)
) Isqrt(
2
)
)
; /紳紳*帥神神*梓**帥神神材料**林/
T
a=abs(
(
l
l
e
a
n
l
*(
‑
1
) +l
l
e
a
n
2キ (
1
) +l
l
e
a
n
3
*
(
I
)
) Isqrt(6));
Tb=a
b
s
(
(
l
l
e
a
n
l
*
(
‑
2
) +l
T
c=a
b
s
(
(
l
l
e
a
n
l
*
(
‑
I
) +l
l
e
a
n
2
*
(ー1
) +l
l
e
a
n
3
*(
2
)
) Is
q
r
t(
6
)
)
;I
伽u
n
c
f
f
i
̲
r
e
s
a
m
p(
i
fT
a>
= Tmax then a = 1
; else a = 0
;
I dl,y,g,
i
f Tb )
二 T
max then bニ 1
; else b 二 日
outd,
i
fT
c>
= Tmax then c = 1
; else c = 0
;
I nrep =20000
1
*P値の計算 *
1
I)
;
proc means data = Resamp noprint;
Iproc print data = outd; run;
var a b c
; output out = Resamp(where=(̲STAT̲=
'
l
I
EA
.
¥
')
);
data &outd;
set Resamp;
)
;
p̲value = min(a,b,c
contrast ニ 'J;

‑
2
1
7
‑

213.

。 ρ1dj;??均 LIFEREG70 ピジャによる 0 でもイズ や , 噌h 正規分布からの打ち切り標本に対する パラメータ推定と二標本有意差検定 棚橋昌也九丸尾和司¥菅波秀規人岸本淳司I 興和株式会社/臨床解析部¥九州大学/デジタルメディシン・イニシアティブ I P a r a m e t e rE s t i m a t i o nandt w o ‑ s a m p l et e s ti nc e n s o r e ds a m p l efromnormaId i s t r i b u t i o n u s i n gLIFEREGp r o c e d u r e a z u s h iMaruot,H i d e k iSuganamit,J u n j iK ishimoto1 MasayaT a n a h a s h it,K C l i n i c a IDataS c i e n c eDepνKOWACOMPANY ,LTDt, D i g i t a IMedicineI ni t i a t i v e /KyushuU n i v e r s i t yt 要旨 正規分布からの打ち切り標本は, LIFEREGプロシジャを用いることによって,そのパラメータ推定や二標本 検定を簡単に扱うことができる.本稿では,この LIFEREGプロシジャを用いた方法の紹介と,シミュレーシ ヨンによる,この方法と伝統的に用いられてきた補完法の比較を行った.その結果, LIFEREGプロシジャに よって,偏りのない解を得られることがわかったことに加えて,伝統的に用いられてきた補完法が,実用上, 問題がないということがわかった. キーワード:正規分布からの打ち切り標本, LIFEREGプロシジャ l.はじめに 実際に解析で取り扱われるデータは,完全な状態で得られることは少なく,そのデータの一部が何らかの理 由により欠測となって得られることが多い.観測値の欠損J Iがランダムに起こるような場合では,欠測を無視 した解析を行っても偏りを生じない.ここでは,欠測の発生に何らかのパターンがある場合,例えば,ある 値を下回るもの,または上回るもの,あるいはその両方のものはすべて欠測になるといった場合について考 c e n s o r e ds a m p l e ) という.このような場合に,その欠測を無視した解 える.このようなものを打ち切り標本 ( 析を行うと,解析結果に偏りをもたらすことは明らかである.本稿では,打ち切り標本,特に,正規分布か c e n s o r e ds a m p l ef r o man o r m a ld i s凶 b u t i o n ) に焦点を当て,そのパラメータ推定と,二標本 らの打ち切り標本 ( 検定を LIFEREGプロシジャによって行う方法を紹介する. まず 2節において,欠測を組み込んだ確率密度関数の定義と,その対数尤度関数を示す.次に, 3節と 4節 では, LIFEREG プロシジャによるパラメータ推定と二標本検定のプログラム例と,そのアウトプットを示 す.これらについて, 5節において,シミュレーションによる欠測へのいくつかの対処方法の比較を行う. ‑ 2 1 9・

214.
[beta]
最後に, 6節で本稿のまとめを述べる.

2
. 正規分布からの打ち切り標本
ある正規分布に従う母集団から抽出された標本において,ある値以下,または以上,あるいはその両方のも
のが,何らかの理由により計測できなかったとき,このような標本を正規分布からの打ち切り標本という.
このような打ち切り標本からパラメータを推定する場合,適切に欠測への対処を施さないとパラメータ推定
値に偏りをもたらすこととなる.ここでは,欠測を組み込んだ確率密度関数を定義し,最尤法によるパラメ
ータ推定を行うために,対数尤度関数を示す.

X2,
'
.
, Xj,
"
, Xnは互いに独立に平均 μ,標準偏差 σ の正規分布に従うとすると,各々,以
確率変数 X1,
下のような周辺密度関数をもっ.

>占のとき,

J

Xj

,̲

︑.︐
1i
〆︐.︑︑

}
叫(与l

州 司 = 訪7

Xjの値を正確に観測することができず欠測になるとしたとき(右側打ち切り ,s
i
n
g
lyr
i
g
h
t

c
e
n
s
o
r
e
d
),xjが観測されるときにし観測されず欠測となるときに 0をとるような確率変数 R
jを定義すると,

以下の Xj
jの同時密度関数によって,欠課1
をモデル化することができる.
とR

f
(
X
j川 μ
│,
σ,c
)
=f(Xjlμ, σ)g~jIXj , ç).
ここで,

(
2
)

g
H
x
p
c
)は, X が欠測か否かを規定するパラメータ c
'こ対して,
j

j
g
(
f
j
I
X
p
c
)
=p
r
(
R
j=円I
X
=
X
)
j

(
3
)

となるような条件付き確率度数関数である.例えば , x
jが欠測となるようなとき,

~

~I

1, x >占

P
r
(
R
.=
OIX=
x
.J
=~ ,
{

、

TT

l'

¥

"

j

[
0, x ~ç

(
4
)

j

となる.また , x
jが観測されるようなときは,

附 = 伴 x)=(::;;

(
5
)

となる.
得られた n個の実現値 X
X2,
n
‑
m
)個の実現
個 の 実 現 値 引 〆w …,
1,
nのうち ,m
"
,X
X
(
m
)は観測され ,(
値引 m+l),
"X(n)は欠測となっているとすると,その同時密度関数は,以下のように観測部分の確率密
x(m+2) ,
ラ・

I
部分の確率密度関数の積との積に分割することができる.
度関数の積と,欠浪J

'
2
2
0
・

215.

λ( X, X, ・ , x n l μ, σ, c ) =D f ( x i j μ, σ) g ( r j x , c ) i i I 2 位川 今, X ( i )i (= m+1,m+2,… n)は欠測であるので,その確率密度関数 f ( X ( i j ) μ, σ )は,適切に評価すること ができない.そこで , x iが欠測となるとき (R i=0) の周辺確率は, ン P r ( R i=0 ) =f ( X i jμ, σ) g ( ' fj x , c ) ゐ i = f ン(Xijμ,σ) + f s " ' f 判μ) 倣 = 凶 , f ; ' "f ( x i l μt =p r ( X i> ご ) ( 7 ) ︐ ︐ ︐ ︐ ︐ 冒 目 白 目a F d ︑ ︑ . .h ¥1112 ノ >円 vi n . y ︑vtノ 仇斗 p'u︑ vPA / 1 │ │トい n H叩ゆ σσ ¥けい川 lノ¥け引れつノ μμ ︑ z ' e a a ‑ ‑‑ z 且 xx rJrJ 一一一一 /Illl‑‑¥/I11111¥ F h d σ x μ x x rh m H M m H M となるので , x が欠測となるときの確率密度関数をこの周辺確率で置き換えると ,( 6 )式は, j ( 8 ) と表すことができる.このとき,対数尤度関数は, l ( μ, σ )= logL(μ, σ ) c ) =l o g λ( XI, X . . . , X! μ, σ, 2, I 1 吋 台 争 軒 ト ん f 爪 胤 b 仏) i 川針附吋 >c) = 斗l υ( 1 Pr 収 帆 伊 仇 仇 ( 仰 ) 芝lo以 g パ f ( f 仏 巧 x 川 川 i ) 仰 μ , u μ μ 寸 σ ) + ベ(n一刈 m) l o g ( 令 P収 r り ) > 寸 刈 c ) ) = 計 ( ο ωl 1 , グ ( 9 ) ( υ ω J となる.したがって,正規分布からの打ち切り標本に対する対数尤度関数は, ( 1 )式より,以下の通りである. r( X ( i )一μ ) 2 1 l ( μ ) =玄1 0 町 二 州 一 一 一;J ~ +( n‑m)log(pr(X(i) >c ) ) i = 1 ‑ , /2 π σ 2σ2 I . j 2 ;‑ml o g σ = ‑m l o g よか ) i μ ) 2+( n‑m) l o g ( p r ( X >c ) ) . 2σ21 左側打ち切り ( s i n g l yl e f tc e n s o r e d ),両側打ち切り 一 ( i ) ( 10 ) ( d o u b l yc e n s o r e d,生存時間解析における区間打ち切りと は異なる)の場合にも,同様に,対数尤度関数を得ることができる. LIFEREGプロシジャでは,この対数尤 度関数に対して, r i d g e ‑ s t a b i l i z e dNewton‑Raphsona l g o r i t h mを用いてパラメータ μ とσ の最尤推定量を得る. ‑ 2 2 1・

216.

3 . LIFEREGブロロシジャによるパラメータ推定 LIFEREGプロシジャでは,右側,左 J { l [ J ,区間打ち切りなどを伴うイベントまでの時間に対するパラメトリッ クなモデ、ルを扱うことができる.イベントまでの時間に対する解析で仮定される分布は,指数分布やワイブ ル分布などが一般的である,一方でー, LIFEREGプロシジャは,正規分布からの打ち切り標本に対する推測を 行うことも可能で、ある. LIFEREGプロシジャにて応答変数に仮定する分布は, MODELステートメントにお けるDlST オプションによって,指定することができる. DlSTオプションでは,生存時間解析で一般に用い られる指数分布,ワイブル分布,ガンマ分布のほかに,本稿で用いる正規分布や,ロジスティック分布,ロ 3 ] ) グロジスティック分布,対数正規分布を指定することができる.ここでは,表 lの肺活量データ(岩崎 [ を利用して, LIFEREGプロ、ンジャによるプログラム例を紹介する. 表 12500ccを超えるものが打ち切りとなった肺活量データ 番号 ( I D ) 肺活量 0人の身体測定における肺活量のデータである. 8番と 1 0番の生徒は,計測値が 2500ccを 表 lは,中学生 1 超えてしまったため,その正確な値を計測することができず,計測値が欠測となっている(使用された肺活 量の測定機器の測定上限が 2500ccであったと考えられる).このデータにおいて,欠測を無視したパラメー こ推定される.図 lに,打ち切り標本に対するパラメータ推定を行 タ推定を行うと,平均、分散ともに過小 l うためのプログラム例と,アウトプットの一部を示す. LIFEREGプロシジャでは,欠測(左側打ち切り,右側打ち切り,区間打ち切り)を表現するために,応答変 e f t,r i g h tの 2つの変数を用意する(変数名は l e f t,r i g h tでなくともかまわなし、).非打ち切り 数に対して, l データの場合, l e f t,r i g h tの両変数に計測値を入れる(つまり同じ値を両方の変数に入れる).左側打ち切り e f tに欠狽J I (.)を入れ,変数 r i g h tに計測の限界値を入れる.右側打ち切りの場合,変数 l e 貨に の場合,変数 l 計測の限界値を入れ,変数 r i g h tに欠浪J I (.)を入れる.また,本稿では取り上げないが,区間打ち切りの場合 e , 丘 r i g h tの両変数にその区間の下限と上限の値を入れる.ここでは右 であれば(両側打ち切りではなし、), l e丘i ご計測の上限値 2500,変数 r i g h tに欠測(.)を入れ 側打ち切りを扱うので,欠測となるものには,変数 l T a b l e l )に対して, LIFEREGプロシジャを用いたパラメータ推定を行う.ここで ている.このデータセット ( のパラメータ推定とは,肺活量データに対して正規分布を仮定した上で,その平均と標準偏差を推定するこ とである.MODELステートメントで独立変数を設定しなければ,切片の推定値のみを得ることができる(①). ここでの切片とは,仮定した正規分布の平均のことである.次に,仮定する分布に正規分布を用いるために, MODELステートメントにおいてDlST オプションで NORMALを指定する(②).応答変数が 2つであるこ とに注意し,このプログラムを実行すると,図 1 (右)のアウトプット(一部)を得ることができる.③を t e r c e p t ) と標準偏差 ( S c a l e ) の推定値として,それぞれ 2202.620,3 0 6 . 9 2 9 3を得ることが 見ると,平均(In できる.これは,岩崎 [ 3 ]において, E Mアルゴリズムを用いて算出されたものに一致する. '222・

217.

D A T AT a b l e 1 : I N P U Ti dl e f tr i g h t : lN E S : D A T AL 12 0 0 02 0 0 0 21 8 5 01 8 5 0 32 1 0 02 1 0 0 41 7 0 01 7 0 0 52 2 0 02 2 0 0 62 4 0 02 4 0 0 72 1 5 02 1 5 0 82 5 0 0 92 3 0 02 3 0 0 1 02 5 0 0 N u m b e ro fO b s e r v a ti o n sR e a d N u m b e ro fO b s e r v a t i o n sU s e d 1 0 1 0 A1 g o ri t h mc o n v e r g e d . A n a1 y si so fP a ra m e t e rE s ti m a t e s 見C o n fi d e n c e C hi S t a n d a r d 9 5 P a r a m e t e rD FE s t i m a t e E r r o r h i S q L i m i t s S q u a r eP r>C R U N : ③ ∞L1F E R E GD A T A = T a b l e 1 : ② P R 慨し ( 1e f t . ri ght~= /D I S T l = N O R M A q ¥.V R U N : I n t e r c e p t S c al e 9 9 . 8 4 8 32 0 0 6 . 9 2 12 3 9 8 . 3 1 9 4 8 6 . 6 3 8 0 . 9 7 1 01 8 3 . 0 1 3 55 1 4 . 7 4 6 8 < . 0 0 0 1 図 1LIFEREGプロシジャを使用したプログラム例(左)とアウトプットの一部(右) 4 . LIFEREGプロシジャによる二標本検定 3節では,一標本データに対するパラメータ推定を行ったので MODELステートメントの右辺に変数を指定 していなかった.ここでは,二標本データに対する検定を行う場合について示す.共変量の調整を行わない 場合には, MODELステートメントの右辺には群を表す変数を指定するだけでよい. ある臨床検査において,定量限界が存在し,定量限界未満のものはその正確な値を計測することができない とする. 2つの群においてこの臨床検査を行ったとき,群間で有意な差がなし、かどうか検討することを考え 群と,プラセボの投与を受けたプラセボ群の る.図 2,土,ある臨床試験において被験薬の投与を受けた薬剤l ある臨床検査値のヒストグラムである.この臨床検査では, 20が定量限界であるため, 20未満の計測値はす g r o u p = 薬剤群 g r o u p =プラセポ群 61 51 41 31 21 1 1 〉 ~ 凶 1 0 弓 9 凶 ' " 二 L 1 03 05 07 09 01 1 01 3 01 5 01 7 01 9 02 1 02 3 02 5 0 1 03 05 07 09 01 1 01 3 01 5 01 7 01 9 02 1 02 3 02 5 0 図 2 ある臨床検査値のプラセボ群(左)と薬剤群(右)のヒストグラム ‑223・

218.

べて欠測となっている.プラセボ群は, 63症例中, 23症例の計調J I 値が欠測,薬剤l 群は, 60症例中, 1 8症例 の計調Ij値が欠測である.このデータにおいて,プラセボ群と薬剤群に有意な差がなし、かを検討する. 一般に,多くの臨床検査値は右に裾をひくことが多く,また,台を(‑∞,∞)にする意味でも,対数変換する ことがある.図 2のデータに対して対数変換したものを薬剤群とプラセボ群で比較する.図 3にプログラム 例と,そのアウトプットの一部を示す. 2群聞の差について推測を行うので,右辺に群を表す変数である g r o u pを設定する(①).その他の指定につ いては,前節と同様である.このプログラムを実行すると,図 3 (右)のアウトプット(一部)を得ること ができる.②を見ると,プラセボ群 ( g r o u p = l ) と薬剤群 ( g r o u p = 2 ) の差が推定されていることがわかる. ③では,この差についての検定結果が示されている.これらを見ると,薬剤群はプラセボ群に比べて,その 計配値が 0.2297だけ大きいが,有意水準 5%では有意で、はないということがわかる. P R O CL I毘 R E GD A T A = T a b l e 2 ; C L A S Sg r o 昨 ① M O D E L( l e f t ̲ l n .r i g h t ̲ l n ) =g r o u p/ 0 1S T= N O R M A L ; R U N ; A n a1 y si so fP a r a m e t e rE s ti m a t e s o n fi d e n c e C hi ̲ S t a n d a r d 9 5目 C P a r a m e t e r D FE s t i m a t e E r r o r L i m i t s S q u a r eP r>C h i S q . 5 0 0 1 0 . 1 2 0 9 3 I n t e r c e p t 1② 3 . 2 6 3 1 3 .7 3 7 2 8 3 7 .7 7 g r o u p .8 6 互司 O .1 6 8 5 ‑ O .5 6 0 0 ー 1 1匡 。1 0 0 6 1 g r o u p 20 0 . 0 0 0 0 S c a le 0 . 8 8 8 9 0 . 0 7 4 8 O .7 5 3 7 1 .0 4 8 3 く. 0 0 0 1 ~ ③ 図 3 プログラム例(左)とそのアウトプットの一部(右) 5 . シミュレーション 5 .1.パラメータ推定値の偏りと精度 ここでは,前節と同様に対数変換を想定した(すなわち,応答変数は対数正規乱数に従い生成する)左側の 打ち切り標本に対するパラメータ推定値の偏りと精度について,シミュレーションによって考察を与える. 表 2のシミュレーション条件に従って生成されたデータに対して,①欠測を無視する,②欠測に打ち切り限 界の 1 / 2の値を代入する,③欠狽J I をモデル化する,の対処をとったとき,それぞ、れについてパラメータを推 定し,その平均をとったものについて比較を行う. 表 2 シミュレーション条件 シミュレーション回数 100000 N 50,200 対数変換後の平均 2 . 5 対数変換後の標準偏差 1 .0 打ち切り限界(対数変換前) 5 (18.7%が欠測), 10 (42.2%が欠測), 1 5 (58.2%が欠測), 20 (69.0%が欠測) ‑224・

219.

シミュレーションの結果を表 3に示す.各セルの上段に,そのパラメータ推定値の 100000回の平均,下段 にその標準誤差を示す.表 3を見ると,まず,①によってパラメータ推定したものは,平均,標準偏差とも に,偏りをもって推定されていることがわかる.平均は過大に,標準偏差は過小に評価されていることは明 らかである.これは欠測の割合が増加するにしたがって,より顕著となる.また,欠測の割合の増加に伴っ て,データの数自体が減少していくので,同時に精度も低下していく.以上のことから,このような打ち切 り標本に対して,欠測を無視してパラメータを推定することは,議論の余地なく誤りである.②も欠測の害IJ 合が増加するにしたがって,真のパラメータからの君離が大きくなっていくが,欠測が 50%以内であれば, 欠測に打ち切り限界の 1 / 2の値を代入した上で、パラメータ推定を行ったとしても,その推定値は十分に許容 できるものであると考えられる.対して,③は平均,標準偏差ともに偏りなくパラメータを推定することが できている.これらの方法によるパラメータ推定値の精度は,平均に関しては,②によるパラメータの推定 値が許容できる範囲では,両者にそれほど差はないが,②は標準偏差を過小に推定する傾向があるので注意 が必要である. 表 3 それぞれの対処におけるパラメータ推定値の平均 N 無視 打ち切り 限界 平均 5 1 0 5 0 1 5 20 5 1 0 200 1 5 20 1 / 2の値を代入 標準偏差 2 . 8 2 9 5 0 . 7 6 7 6 ( 0 . 1 2 1 4 ) 平均 47 2 5 2. 標準偏差 平均 標準偏差 2. 49 65 0 . 9 8 9 1 ( 0 . 0 8 7 8 ) ( 0 . 1 4 4 3 ) ( 0 . 0 8 9 4 ) ( 0 . 1 4 6 0 ) ( 0 . 1 1 6 3 ) 3 . 1 7 6 1 0 . 6 3 1 5 0 . 9 1 0 2 4936 2. 0 . 9 8 9 6 ( 0 . 1 1 9 5 ) ( 0 . 0 9 8 1 ) ( 0 . 1 2 9 2 ) ( 0 . 0 7 9 4 ) ( 0 . 1 6 5 2 ) ( 0 . 1 4 5 7 ) 0 . 5 5 5 0 0 . 7 8 5 3 4346 3. 2 . 5 1 5 3 2 . 6 0 7 5 1 .0 164 モデル化 49 09 2. 0 . 9 8 8 8 ( 0 . 1 7 9 3 ) ( 0 . 1 2 5 6 ) ( 0 . 1 1 0 4 ) ( 0 . 1 1 1 7 ) ( 0 . 0 8 4 3 ) ( 0 . 2 0 2 4 ) 3 . 6 3 7 6 0 . 5 0 3 6 0 . 6 7 5 5 2 . 7 1 6 3 ( 0 . 1 3 5 3 ) ( 0 . 1 2 3 5 ) ( 0 . 0 9 6 3 ) 2 . 8 2 9 8 0 . 7 7 1 7 ( 0 . 0 6 0 5 ) 3 . 1 7 6 6 ( 0 . 0 5 9 6 ) 43 49 3. ( 0 . 0 6 2 2 ) 3 . 6 3 8 1 ( 0 . 0 6 6 3 ) 47 2 5 2. 2. 48 8 8 0 . 9 8 6 9 ( 0 . 0 9 0 0 ) ( 0 . 2 5 6 7 ) ( 0 . 2 1 5 6 ) 1 .0 198 2. 4988 0 . 9 9 7 6 ( 0 . 0 4 3 7 ) ( 0 . 0 7 2 2 ) ( 0 . 0 4 4 2 ) ( 0 . 0 7 2 8 ) ( 0 . 0 5 7 9 ) 0 . 6 3 7 5 0 . 9 1 3 1 2. 4980 0 . 9 9 7 8 ( 0 . 0 4 8 5 ) ( 0 . 0 6 4 6 ) ( 0 . 0 3 9 5 ) ( 0 . 0 8 1 4 ) ( 0 . 0 7 2 4 ) 0 . 5 6 3 6 0 . 7 8 9 0 2 . 5 1 5 4 2 . 6 0 7 7 4974 2. 0 . 9 9 7 6 ( 0 . 0 5 4 4 ) ( 0 . 0 5 5 9 ) ( 0 . 0 4 1 8 ) ( 0 . 0 9 8 1 ) ( 0 . 0 8 8 1 ) 0 . 5 1 5 4 0 . 6 8 0 4 49 68 2. 0 . 9 9 7 2 ( 0 . 0 4 4 6 ) ( 0 . 1 2 1 6 ) ( 0 . 1 0 4 6 ) 2 . 7 1 6 4 ( 0 . 0 6 0 8 ) ( 0 . 0 4 8 2 ) 5ユ二標本検定における第一種の過誤確率の比較 ここでは前節と同様に,対数変換を想定した左側打ち切り標本に対する,二標本検定を有意水準 5%で、行った ときの第一種の過誤確率(%)の比較を行う.欠測への対処は, 5 . 1節と同じ①,②,③の 3つの方法をとる. シミュレーション条件を表 4に示す. ‑225・

220.

表 4 シミュレーション条件 シミュレーション回数 データ数 1 0 0 0 0 0 ( N ) 50,200 対数変換後の平均 対数変換後の標準偏差 群 l 群2 2 . 5 2 . 5 1 .0 打ち切り限界(対数変換前) 5, 1 0, 1 5,20 表 5にシミュレーションの結果を示す.表 5を見ると,②はデータ数に限らず,第一種の過誤確率を所望の 値(名義有意水準)に保つことができるが,③はデータ数が 50のとき,第一種の過誤確率が明らかに所望の 値を超える場合がある.これは,②では t分布のもとで仮説検定が行われ,③では正規分布のもとで仮説検 定が行われる (Wald検定)ことに起因すると考えられる.したがって,小標本では,③の Wald検定の結果 の解釈には注意が必要である.①も,②と同様,常に第一種の過誤確率を名義有意水準に保つことはできる が,前節での考察からも決して推奨はしない. 表 5 それぞれの対処における第一種の過誤確率 N 第一種の過誤確率 打ち切り限界 50 200 無視 1 / 2の値を代入 モデル化 5 4 . 9 2 5 . 0 5 5. 48 1 0 4 . 9 1 4 . 9 5 5 . 2 1 1 5 4 . 8 7 4 . 9 9 5 . 0 9 20 4 . 8 5 4 . 9 3 4 . 7 6 5 5 . 0 3 5 . 0 1 5 . 0 9 1 0 4 . 9 6 4 . 9 7 5 . 0 3 1 5 4 . 9 8 5 . 0 2 4 . 9 9 20 5 . 0 7 4 . 9 8 4 . 9 5 5 . 3 . 二標本検定の検出力の比較 ここでは,前節と同様のシチュエーションにおいて,第一種の過誤確率を名義有意水準に保つことができる, . 1節と同じ①,②,③の 3つの方法 データ数が 200の場合の検出力(%)の比較を行う.欠測への対処は, 5 をとる.表 6のシミュレーション条件における各群の対数変換後の平均は,真の状態(欠測が起こらない状 態)において,各群のデータ数が 200のとき,検出力が 80%となるように設定した.また,有意水準は 5% とした. ‑ 2 2 6 ‑

221.

表 6 シミュレーション条件 シミュレーション回数 データ数 ( N ) 1 0 0 0 0 0 各群 200 対数変換後の平均 対数変換後の標準偏差 打ち切り限界(対数変換前) 群 I 群2 2 . 5 2 . 7 8 1 1 .0 5, 1 0, 1 5,20 シミュレーションの結果を表 7に示す. 2群の差は,セルの上段に推定値の 100000回の平均,下段にその標 準誤差を示す.表 7を見ると,①によって検定を行ったものは,検出力において,事前に設定した 80%を明 らかに担保することができていなし、.これは,欠劃を無視したことによるデータ数の減少と、打ち切りによ って 2群の差が小さくなったことが原因として考えられる.パラメータ推定のシミュレーション結果と同様, これが誤った方法であることは明らかである.②と③を比較すると,検出力自体の差はほとんどない.両方 法とも,欠劃の割合が 18% 程度であれば,事前に想定した検出力を担保できそうであるが,欠損1 の割合が増 加するにしたがって両方法が同様に検出力が低下する傾向をみてとることができる. 2群の差の推定に関し . 1節と同様,欠測の割合が増加す ては,③の場合は,偏りのない推定値を得ることができる.②の場合は, 5 るにしたがって,偏りが顕著になっていく傾向にあるが,欠測割合が 50%以下では,欠測を打ち切り限界の 1 / 2の値で補完することに実用上の問題があるとは思えない. 表 7それぞれの対処における 2群の差の推定値と検出力 打ち切り 限界 無視 2群の差 5 1 0 1 5 20 ‑ 0 . 1 7 9 4 ( 0 . 0 8 6 9 ) ‑ 0 . 1 2 4 4 ( 0 . 0 8 3 9 ) ‑ 0 . 0 9 7 7 ( 0 . 0 8 6 5 ) ‑ 0 . 0 8 2 1 ( 0 . 0 9 0 8 ) 1 / 2の値を代入 検出力 5 3 . 5 5 3 0 . 9 8 1 9 . 8 7 1 4 . 0 6 2群の差 ‑ 0 . 2 8 4 0 ( 0. 10 2 7 ) ‑ 0 . 2 5 0 8 ( 0 . 0 9 4 5 ) ‑ 0 . 2 1 0 2 ( 0 . 0 8 3 6 ) ‑ 0 . 1 7 4 2 ( 0 . 0 7 3 7 ) 検出力 7 8 . 6 8 7 5 . 2 8 7 0 . 6 6 6 5. 42 モデル化 2群の差 ‑ 0 . 2 8 1 1 ( 0 . 1 0 1 7 ) ‑ 0 . 2 8 1 1 ( 0 . 1 0 6 4 ) ‑ 0 . 2 8 1 2 ( 0 . 1 1 2 7 ) ‑ 0 . 2 8 1 0 ( 0 . 1 1 9 9 ) 検出力 7 9 . 0 1 75. 47 7 0 . 8 3 6 5 . 6 0 6 . まとめ 本稿では,正規分布からの打ち切り標本に対して, LIFEREGプロシジャを用いて,欠測のモデル化によるパ ラメータ推定と二標本検定を行う方法を紹介した.打ち切り標本であれば, LIFEREGプロシジャを適用する ‑ 2 2 7 ‑

222.

ことによって,簡便に一つの解を導くことができる.打ち切り標本は,定量限界が存在する臨床検査などに / 2の値で補完するといった おいて生じ得るが,このような状況においては,伝統的に,欠測を定量限界の 1 方法をとることがある.本稿では,母集団の分布が既知のもとで,シミュレーションによって,欠測のモデ U のモデル化におけるパラメータの推定や,二標本検定が偏りなく行われ ル化とこの方法を比較したが,欠iJt ることを確認できたことに加えて,伝統的に用いられてきた方法が,実用上ほとんど問題がなく,欠測のモ テ、ル化と比べても遜色ないということがわかった.さらに,このシミュレーションからは,二標本検定にお J lを定量限界の 1 / 2の値で補完する方法では,データ数に限らず,第一種の過誤確率を名義の有意 いて,欠iJt 水準に保つことができるが,欠測をモデ、ル化する方法では,小標本の場合,必ずしも名義の有意水準に保つ ことができないことがわかった.したがって,欠測のモデ、ル化による方法では,小標本の場合,その結果の 解釈には注意が必要である.このことに対して LIFEREGプロシジャで実行することはできないが,検定統計 量の参照分布として,測定されたデータ数から求めた自由度にもとづく t分布を利用して小標本ノ〈イアスを 解消することもできる.欠測を定量限界の 1 / 2の値で補完する方法は,簡便な上に,非常に有効な方法であ るが,標準偏差が,過小に推定されることに対して問題を感じるかもしれない.その場合には,ランダム補 完 (randomi m p u t a t i o n ) を利用する方法が考えられる.ランダム補完によるパラメータ推定とは,欠測が生じ た場合に,その欠測を 0から打ち切り限界までの一様乱数で補完した上でパラメータを推定し,さらにこれ を任意の回数繰り返し,得られたそれぞ、れの推定値について,それらの平均をとることによって,その推定 / 2の値で補完する方法と同様の結果を与 値を得る方法である.この方法は,平均に関しては,定量隈界の 1 えると考えられるが,標準偏差に関しては,その過小推定が解消されることが期待される.ただし,これら は左側で打ち切りが起こるような場合に適用できる方法である.右側で打ち切りが起こるような場合では, これらの補完法は用いることはできない. 最後に,本稿では,母集団の分布の特定には言及していなし、. LIFEREGプロシジャを用いてパラメータを偏 りなく推定できるのは,母集団に対する分布の仮定が正しい場合のみである.実際上は,分布が既知で、ある ことはほとんどない.こういった状況における分布の仮定には,細心の注意を払わねばならない. 参考文献 [ 1 ]Cohen, A .C l i f f o r d,T r u n c a t e dandc e n s o r e ds a m p l e s :t h e o r ya n da p p l i c a t i o n,MARCELDEKKER,INC., 1 9 9 1 [ 2 ]R o d e r i c kJ . A .L i t t l e& DonaldB .Rubin,S t a t i s t i c a la n a l y s i sw i t hm i s s i n gd a t a,JohnWiley& Sons, I n c .,2002 [ 3 ]岩崎学,不完全データの統計解析,エコノミスト社, 2002 9 9 5 [ 4 ] 大橋靖雄・浜田知久馬,生存時間解析 SASによる生物統計,東京大学出版, 1 ‑228‑

224.

コンジョイント分析による官民連携地域ポータルサイトの住民評価 有馬昌宏 I,加藤優希 l,藤田昌弘 1, 2 l兵庫県立大学大学院応用情報科学研究科, 2大手前大学現代社会学部 AnE v a l u a t i o nofLocalP o r t a lS i t ei nTermsofContentsandP r o v i d e r sUsingConjointA n a l y s i s M a s a h i r oARIMA1,Y u k iKAT01,M a s a h i r oFUJITA2 U n i v e r s i t yofHyogo,20temaeU n i v e r s i t y l u r a d u a t eS c h o o lo fA p p l i e dI n f o r m a t i c s, 要旨 地域情報化施策のーっとして注目を集めている官民連携の地域ポータルサイトの開設・運営に関して, 住民はどのような内容をどの組織が提供することを望んでいるかについて,質問紙による住民意識調査 の中にコンジョイント分析が適用できる質問を組み込み, SAS と JMP を利用して,回答データに対し て,① 2項ロジット・モデル,②多項ロジット・モデル,③重回帰分析,④ランクロジット・モデ、ル, を適用した分析を行った.本稿では,調査と分析結果の概要を紹介するとともに, SASプログラムと九四 の JSLスクリプトを開示し, SASならびに JMPのユーザーへの情報提供も併せて行う. キーワード:住民意識調査,コンジョイント分析,ロジット・モデル, SASシステム,品。 1 . はじめに 近年のインターネットをはじめとする情報通信基盤の高度化と普及に伴い,地方自治体や地域の企業の問 で,自らの情報を「地域情報」として住民に発信することが地域の振興や住民生活の向上に役立つという認 識が広まりつつある.しかし,これまでの地方自治体の公式のウェブサイトからの情報提供や企業単位での 個別の情報発信では,住民が求める形式や内容で地域情報が提供されているとは言えず,また地域情報のー っとして住民の持つ情報を共有するための地域 SNSなどのコミュニケーション機能も求められている. このような状況の中,行財政改革が求められている地方自治体においては,業務のスリム化と共に,事業 の市場化や業務のアウトソーシングを積極的に進めており,情報化施策の一環として行政情報を民間企業に 提供し,民間情報と行政情報をセットにして地域住民や地域への観光客や訪問者に対して発信しようとする 新しい試みが生まれている.最終的には,①行政サイドはコスト削減と地域活性化を目的に情報発信業務を 民間企業に付託し,②付託された民間企業サイドは,官民連携の地域ポータルサイトを構築して行政情報と 民間情報を組み合わせて発信することでサイトの付加価値を高めてサイト訪問者を増加させ,広告収入を得 て事業を成立させ,③サイトを利用する住民や観光客には情報利活用の便益が提供される,というステイク ホルダーの全てに利益がもたらされることを狙う試みである. しかし,この試みには幾つかの疑問や課題が存在する.先ず,行政情報と民間情報を組み合わせて発信し ‑ 2 3 1・

225.

ょうという施策に対して,住民はその施策をどのように評価しているかが明確ではない.次に, i 行政情報は 公の資産である」という観点から「行政情報を提供して地域ポータルサイトの運営を付託する組織をどこに するか」の組織選択に関する問題がある.地域ポータルサイトの運営主体を行政や第 3セクター以外の民間 企業や NPOに委託する場合には,選定のプロセスの公平性と透明性に加えて,事業者選択の基準が明確にさ れていなければならないし,住民の選好も反映される必要がある.しかし,住民の選好構造は明確にはされ ていない.また,官民連携で行政情報と民間情報が組み合わせて提供されることに対して,住民の価値評価 がどの程度であるかも明らかではない.住民の評価が低ければ,新たな施策として取り組む根拠は得られな いことになる. 本研究は,これらの疑問や課題に対して,住民意識調査に基づいて検証を行おうとするものである.本稿 u j i t a [2]の研究成果をさらに展開し,官民連携の地域ポータルサイト では,藤田・有馬 [9]およびArimaandF が開設されたと想定して,①提供情報の内容と提供の方法,②地域ポータルサイトの運営組織,③手J I 用に際 してのコスト負担,という 3つの属性に対して 3から 4の水準を設定し,コンジョイント分析を適用して定 量評価を試みた結果を紹介する.併せて,付録として,分析に用いた SASプログラムならびに JMPの JSL スクリプトも開示する. 2. 伊丹市での住民意識調査とコンジョイント分析を適用する設問の概要 官民連携の地域ポータルサイトに対しての住民の選好構造を明らかにすることを目的として,民問委託の 地域ポータルサイト「し、たみん」が 2008年 1月に開設された伊丹市において住民意識調査を実施した.調査 は「いたみん」の本格稼動の 2008年 1月末に合わせ, 2008年 2月 1日発行の伊丹市の広報紙に調査票と回 収用封筒を挟み込む形式で全世帯に配布し,郵送で回収する方法で実施した.調査票は A 4版 8ページで, 大手前大学藤田研究室と兵庫県立大学有馬研究室が共同で実施することを明記し,調査内容として, ①回答者の属性:回答者の個人属性,地域情報の入手方法,自宅の情報通信環境,インターネットの利用状 況など. ②「し、たみん」の利用状況:利用頻度,手Ij用の理由,提供情報に関する関心度,現状に追加してほしい情報, 伊丹市以外に必要な地域情報など. ③地域ポータルの評価:AHP C An a l y t i cH i e r a r c h yP r o c e s s:階層化意思決定法)の重要度評価の手法を援用し た運営組織に対する必要要件と信用の源泉の定量的評価,およびコンジョイント分析の手法を応用した地 C o n t i n g e n t 域ポータルサイトの情報の提供内容・費用負担額・運営組織に関する選好構造,ならびに CVMC V a l u a t i o nMethod:仮想市場評価法)による地域ポータルサイトの経済的価値評価. の 3つの大きな質問群を組み込んだ. 本稿での分析の対象とする「官民連携地域ポータルサイトで提供される情報の内容と情報の提供方法」と 「サイトの運営主体」の評価,換言すれば住民の選好構造の把握については,コンジョイント分析の適用を 試みている. S t a t e d コンジョイント分析とは,評価対象に対する選好を回答者に直接訊ねて得られる表明選好データ C P r e f e r e n c e ) に基づいて分析する表明選好型のアプローチで,評価対象を構成する属性別に個々の属性の効果 (価値)およびその同時結合尺度 C C o n j o i n tS c a l e ) を同時に評価することができる分析手法であるために「コ ンジョイント分析」と呼ばれている.具体的には,①評価の対象となる製品やサービスを構成する属性を抽 出し,②各属性に対して水準と呼ばれる特性内容を設定し,③属性別の水準を組み合わせてプロファイルと ‑232‑

226.
[beta]
呼ばれる具体的な製品・サービスを構成し,④回答者に絵や写真や文章なと'で、プロファイルを提示して各プ
ロファイルに対する選好を表示してもらい,⑤選好に関するデータから回答者が各属性に対して持つ重要度
や水準の評価値を推定する,とし、う手順を経て実行される(栗山[7J,片平 [6J
)
. 主に企業のマーケティン
グ分野で活用されてきているが,自治体の行政施策の評価に活用することも可能で、ある(有馬他 [
3・4・5J
)
.
このコンジョイント分析を本研究での分析の対象となる「官民連携地域ポータルサイトで提供される情報
の内容と情報の提供方法」と「サイトの運営主体」の評価に適用するための設問を考えるにあたり,
① 情 報 の 提 供 内 容 (3水準):1) 行政情報のみが提供されて利用者が必要な情報をサイト内から一つずつ探
すことを前提に情報を提供,

2) 提供されるのは行政情報だけであるが,各利用者が年齢や性別や居住地

区などの基本的個人属性を入力することで当該利用者が必要とする行政情報をカスタマイズして絞り込み,
関連する行政情報をサイト内から自動検索して一括して提供する,

3) 各利用者が基本的個人属性を入力

することで当該利用者が必要とする行政情報をカスタマイズして絞り込み,さらに関連する民間情報も組
み合わせて,官民の関連情報を一括して提供する.
②地域ポータルサイトの運営組織 (4水準) :1) 行政(伊丹市),
共性のある団体・組合,

2) 財団法人や行政の外郭団体などの公

3) 非営利法人 (NPO), 4) 民間企業.

③地域ポータルサイトの 1ヶ 月 の 利 用 料 (3水準) :1) 無料,

2) 150円
,

3) 300円.

の 3つの属性を設け,各属性に 3から 4の水準を設けることにした.また, JMPのカスタム計画を利用して,
2のプロファイルを生成した.
調査票で提示する 1

ところで,コンジョイント分析は,大きく分けて選択型コンジョイント (
C
h
o
i
c
e
‑
b
a
s
e
dCo
吋o
i
n
t
) と評定型

R
a
t
i
n
g
‑
b
a
s
e
dCo
吋o
i
n
t
)の 2つの手法があり,評定型を細かく分類すると「順位付け評定法 J,
コンジョイント (
一対比較法」の 3つに分類される.本研究では,コンジョイント分析になじみのない一
「評点型評定法 J, r
般の市民を対象に質問紙調査でのコンジョイント分析を試みることから,提示されたプロファイルを受け入
れて利用するかどうかの可否を選択してもらう 2項型選択法と,

r
非常に良し、 Jから「良くなし、」までの 5段

(
a
)

(
c
)

。スゲマイズーして行政情報を一括提供
:
.
100円/月、 NPO

手I
j
)
1
1(T)可 否

否

(評価)

O
O

。
。 非常に良い
主あ主あ良い
どちらとも 2・えない
良くない
。あまり良;ない

行攻情報と民間情報在・セットで提供
無料、民間企業

υロJ U否

手I
J
H
lの 可 否
(詩句 j

。
。 非常に郎、
。ヱあ主主、如、
,'::-''!~) 、
,
;
:
.L‑dU門=ご《二ゆ
f
.
.
:
.
.
.、
E

あ主りn.くない

。良くない

カス fマ イ ズ し て 行 政 情 報 を 一 指 提 供
無料、行政(伊丹市)

利J
I
!の 可 否
(
;
;
'
干1
茄}

U可

o

てf
そ
し
。主あまあn.い
。 非常 l
どちらとし日えな L、
あ走りn.くない 。良くない

図 1 調査票の中で援示したプロファイル・カード(最初の 3枚を抜粋)
ケース
(a)

(b)
(
c
)
(d)

情事E
の費量供内容
カスタ".(スレナ行政情報を f
吉
弘
i
I
・

300円/月

行i
f
d
l
if!l'民間情報をt::1卜で提 l
i、
カスタマ fス,、プ IT政 情 報 を 指先{l

,
1
!
1
,
医
科

民間全業

I
l
,
u
,1
十

行政(伊巧市)

ヶ月の費用

運営組織

(g)

行政相干l
l
'民間情報活レピソト J 提 供
カスグ γ イズ】プ打政情報を 指先iI

(h)

現状の提供方法

(
i
)

現状の促 f
j
t方法

(
j
)

(
k
)

行政情報と民[前情報 '
c
't
:':1トピ促 i
件
カスタマイスザて η 政 情 報 を 指 先 1300円/月

民間Ïj~業

(
1
)

現状の l
t
f
i
J
・方法

.
'
!
'
,
¥
[
.
十

NPO

(
1
)

現状の提供方法
行 政 情 報 レ 民 明 的 却 を t"j卜u提供

館長料

順位

NPO

150円ノ月
150円/再
300円/月
150円/月
300円/耳
150円 周

(e)

行政(伊丹市)

NPO
伊丹市)
行政i
同体・組合
同体・組合
民R
F
d
己薬
同f
本・組合

国 2 調査票で提示した 1
2のプロファイルと i
圃位付け評定法による設問

‑
2
3
3・

u否

227.

階の評価を選択してもらう評点型評価法,さらに 1 2のプロファイルに好ましさの観点から順位をつけてもら う順位付け評定法の 3通りの方法で評価を求めることにした.これらの方法による調査票での質問は図 1と 2のプロファイルは図 2の (a) から (1)に示されている通りである. 図 2に示す通りであり,提示した 1 3 . 調査結果とその考察 3. 1 回答の偏り 2005年の国勢調査によれば,伊丹市の総人口は 1 9 2, 250人(性別構成比:男性 49.0%,女性 5l .0%),世帯 2, 9 8 3である.調査票は伊丹市の情報誌に付け加えられるかたちで配布され配布数は 7 8, 458で、あった. 数は 7 郵送で返送されてきた調査票は 2, 426票で,回答率は 3.09%で あった.郵送での回収の他に,一つの自治会 と伊丹市商工会議所を通じて 255票の調査票を回収しており,これを加えると回収された調査票は 2, 6 8 1票 で,総回収票数は 2, 6 8 1票で回収率は 3. 4 2%であった.サンプルの構造は表 1に示す通りである.回答者の 性別では,男性が 42.3% ( 1, 1 3 3票),女性が 55.6% ( 1, 492票)で,女性への若干の偏りが見られる.年齢で は,世帯を対象とする調査であることを反映して,男性は 20歳代以下の比率が低くて 60歳代以上の比率が 高いとし、う特徴があるのに対して,女性は男性と同様に 20歳代以下の比率は低いが, 30歳代と 40歳代で比 率が高いとし、う特徴が見られる. 2のプロファイルに対する 3つの方法による質問への有効回答サンプルの構造は,表 2に また,提示した 1 示す通りである.今回の分析では,年齢における 115~19 歳」と,職業における「学生」のサンプル数が少 なかったため,年齢では 1 3 0歳未満 J として一括りに,職業では「学生」と「その他」を一括りとして分析 2のプロファイルへの選好表明 を行っている.なお,全ての分析において,①地域ポータルサイトに関する 1 を求める質問に対して回答のあった回答者全ての回答データを用いた分析,②性別,年齢,職業,インター ネットの利用状況,およびインターネット上での商品購入経験と今後の購入希望の 5つの個人属性について, 情報の提 同じ属性値を持つ回答者からの回答データを用いた分析,の 2通りの方法を適用している.また, 1 供内容」は「現状」を, 1 月額利用料」は「無料」を 1 運営組織」は「民間企業」を基準に計測しており, 表 1 サンプルの構造 表 2 2項選択質問,評点型評価質問, J 順位付 i ナ評定質問の各質問に対するサンプルの構造 2項 選 択 ~ 伊丹市凋f 凶 答 歎 会社員 公続員 団体暗員 専門的取東 ~ 伊丹市調』 3 0成 未 満 30 織代 1 1 4 s : n 40議 f~ 445 5 0政 代 印政代 m 70級 以 上 n /, l 合計 571 556 54 2681 会社量常者 r 商工1'1常 I I由業 家事専業 2項 選 択 5段 階 評 価 凶符数 回答歎 1 0 9 395 327 93 67 324 28‑ 1 240 219 篠田 205 212 1 3 4 2 1 2 5 . 1 l i 2 180 1 1 1 1 990 n / a 千d 十 262 270 1 5 6 3 1 5 22 : 間凶休答付 g け 数 学生・その他 463 137 38 B I 40 69 5 1 565 680 4 7 9 7 B 2681 S段階評価 晒{す付け 凶客数 回答妻女 328 1 0 0 274 2 B 4 9 2 c 2 2 1 3 " 35 8 4 1 6 26 32 29 364 2 5 292 235 220 280 270 2 2 1522 1 8 し 円5 4 ‑234・ 221 66 1 5 " 1 9 213 20~ 166 1 5 990

228.
[beta]
基準となっている水準の係数は 0に固定されている.

3. 2 ロジット・モデ、ル
n個の選択肢がある質問に対して,住民 Iが j番目の選択肢を選ぶときの効用を U
i
jとすると ,U
i
jは次のよ
うに表すことができる.
Uij=~け eij

ただし,乃は j番目の選択肢を選択することで得られる確定効用

eは確率項である.

ここで,各選択肢の効用関数の確率項がガンベル分布に従うと仮定すると,住民 iが提示されたプロファ
イル jを選択する確率弓は,次式のような多項ロジット・モデ、ノレとして定式化することができる.

e
x
p
(V
,
;)

弓(j=l
,
.
.
,n
)=っ 一 ー ム ー

目
エ 九)
p
(

3. 3 2項ロジット・モデルによる地域ポータルサイトへの選好構造の推定
提示されたプロファイルの地域ポータルサイトを利用するかどうかの可否を問う 2項選択質問の場合は,
上述のロジット・モデルでは n=2 の場合に相当し,地域ポータルサイトを「利用する」確率 ~1 は,次式の

ような 2項ロジット・モデルとして定式化することができる.
n

ーー

勺 1‑

e
x
p
(凡)
e
x
p
(九)+exp(九)

本モテ、ノレを用いて推定を行った結果が表 3である.なお,推定するにあたっては, ~2 を 0 に基準化し,プ
ロファイルに示される 3 つの属性の各水準が ~1 を規定する要因であると考え,確定効用 ~1 を規定する要因

のパラメータ(係数)の推定に際しては線形の効用関数を仮定した.
表 3には,モデル全体の適合度を表す McFadden の自由度調整済み擬似決定係数を示しているが,全サン
.
3
5
1であり
プルを用いて推定を行ったケースの擬似決定係数は 0

表3

2項ロジット・モデルによる線形確定効用関数の係数の推定結果
月額制'!i持

f
J
'
i

全
体

自由度
調整済
│サンプル数
擬{以
決定係数

切片

2
2

;f~:rl)

年齢

1
6
0,;上
公拐

団
体
陪
員
聴軍

専 門 ずJ
級定
│会辻経営者
i
商::自営
│自由業
E専 輩

ロZi

‑その他
jHJT
る
目しなし
送験無し今後需し

l
且
‑
溜
上
量
'
"
で
.
取
会
の引
明

適合度が高いと判断される 0
.
2から 0.
4
ま

26I

。。

28I
49

29
3
6
4I

3
5
7
4
2
41
1
2
4I
8
4
7
50I

0
.
3
5
1
3
3
0
0
.
3
6
7
0.
45
:
44
1
0.
0
.
3
9
1
0
.
2
9
:
0
.
2
5,
1
0.36~

O.39~

0
.
3
2
9
0.
40

。

0
.
2
8
8
0.
4
4
7
0
.
3
6
4
0
.
2
6
:
0
.
3
8
8
0
.
3
9
3
0
.
2
4
2
0
.
2
3
0
0
.
3
3
5
0.
43
3
0
.
3
5
0

行政情報を
カスタマイズ

行政情報と
民間!情報を
セットで

1
.5
9
4••

0
.
2
1
4••

0
.
2
8
6••

う4
6
1
.638
l
1
0
7
5
7
5
4
3
4
1
.
2
7
5
.
.

0
.
1
7
6
0
.
2

.
12
4
9
0
.
3
1
5••
.
12
8
4••

・・
・・

・・

。
。
。
。

1
.
767••

0
.
1
6
8••
0
.
2
0
8
0
.
2
8
2
0
.
3
9
9
0
.
3
5
2
0
.
0
5
7
0
.
0
6
8
0
.
0
1
0
0
.
2
7
3••
0
.
1
6
9
0
.
2
0
1
0
.
2
6
0
0
.
1
3
1
0
.
1
3
5.
.
0
.
3
0
2••
0
.
3
0
6••

)
.
2
4
5
0
.
2
6
9••
)
.
2
9
42
7••
0.
1
.
3
2
3
1
.
1
6
8
1
.
1
6
0
‑
0
.
0
1
0
.
2
8
6
3
4
1••
2
3
2••
1
.
3
2
0
1
.
3
0
0
1
.
2
8
0
0
.
2
1
4
.
.
0
.
2
9
1••
0
.
3
5
5.
.

653

0
.
1
1
5

0
.
2
0
2

1
.6
5
0
4
7
0
0
.
8
9
2••
5
1
1 ••
3
2
4
5
:
2
.
1
2
9••
645
4
4
6
7
6
1
l
.6i
2.
.
1
.3
7
8••
1
.4
8
2••

・・
・・
・・

1
.254••

・・

・・
・・
・・

注)表中の帥I
土1
%
有意水準で,判土日有意水準で,係数推定値が有芯であることを示す.

‑
2
3
5
‑

1
5
0円

'且 ~ii.;

3
0
0円

NPO

1
.3
0
2••

1
.
796••

1
.2
5日
一
1
.3
4
4••
‑
1
.8
0
5••
‑
1
.6
4
3••
1
.5

1
.6
9
4
‑
1
.879••
2
.
2
1
5

0
.
0
1
8
)
.
0
0
4
0
.
0
3
3
0
.
0
6
6

・・

ー0
.
9
6
0
1
.4
:
‑
1
.3
9
6
1
.2
6
4••
一
1
.5
8
4
‑
1
.3
1
9
1
.096
1
.8
3
6••
1
.3
2
6
‑
0
.
9
9
5••
‑
1
.4
1
4••
‑
1
.4
0
.
9
0
4••
0
.
9
4
6••

.
*

1
.1
5
4u
1
.6
2
1 ••
1
.3
2
8••

勾

・・
・・

公共性のある

団
体
・
組
合
‑
0
.
1‑
1
7
0
.
1
7
0
‑
0
U
.
:
.
!
U
b

‑
0
.
2
4
2

1

行政

0
.
1
1
4••

。
0
.
0
5
:
0
.
0
2
0

".
一
1
.7
2
4••
2
.
1
2
7.
.
1
.800
‑
1
.6
2
.
0
4
1 ••
1
.8
7
4••
‑
1.
49i••
ー
1
.966
1
.9
8
2••
1
.3
7
5.
.
.

・・
・・

。
。
‑0

0
.
2
2
0
‑
0
.
0
3
5
0
.
0
2
0
.
0
3
2
0
.
0
5
‑0.
0
3
0
.
0
0
2
0
.
0
3
2

→

1
.3
1
0

o
.
o
m

1
.8
1
0
2
.
1
8
5
.
.
1
.
71
6••

0
.
0
1
5
0
.
0
2
1
0
.
0
2
0

0
.
1
1
4
‑
0
一0
.
01
‑
1
~.001

0
.
1
1
6
‑
0
.
l
i
3
0
.
2
1
6
0
.
1
6
1
2
2
0
.
1
6
2

。

0
0
1
1
6
7
6
1"
0
.
0
0
6

‑0.
1
0
0

2
2
0
)
.
0
.
1
9
1
.
148
0
.
2
0
9••
0
.
0
7
5
0
.
0
7
9
1
7
9
1
8
2
0
.
0
2
8
0
.
0
8
4
0
.
0
3
1

。
。

229.
[beta]
で、の水準に入っている.また,属性グループ別に推定した各ケースでも擬似決定係数は 0
.
2
3
0から 0.
45
3の範
囲にあり,適合度はまずまずであると言える.
ところで,表 3には各係数推定値が有意であるかどうかをアスタリスクを付けて示しているが,運営組織
では, NPOの係数で有意となっているケースは一つもない.運営組織としての行政は,性別の男女ともに,
職業では無職と家事専業で,年齢では 50歳代を除く 40歳以上の世代でプラスで有意に評価されている. 50
歳代で有意でないのは,年金問題などで年金受給を目前にしている世代で行政への信頼が低下していること
を示しているのかもしれない.一方で,公共性のある団体・組合の係数推定値は全てのケースで負であり,
5
0円と 300円のいず
民間企業と比較して低い評価となっている.月額利用料に関しては,全てのケースで 1

れの係数もマイナス,係数の絶対値は 1
5
0円よりも 300円の方が大きいという結果となっており,しかも係
数推定値は全て 1%
水準で高度に有意となっており,月額利用料が地域ポータルサイトを利用するかどうか
に大きく影響する要因となっていることが分かる.情報の提供内容については,一部のケースを除いて係数
はプラスであり,現状の提供内容と比較して,行政情報をカスタマイズして提供することや,さらに民間情
報とセットにして提供することはプラスで評価されていることがわかる.また,全てのケースで行政情報を
カスタマイズして提供することの係数よりもさらに民間情報とセットにして提供することの係数の方が大き
くなっている(Ari
r
n
aandF吋i
t
a
[2],藤田・有馬 [9]).

3. 4 ロ ジ ッ ト ・ モ デ ル と 重 回 帰 分 析 に よ る 選 好 構 造 の 推 定
地域ポータルサイトに関する提示されたプロファイルを住民 1が「良くなしリから「非常に良しリまでの

5段階で評価する場合,この評価を lから 5までの 5段階の順序尺度として考えると,住民 Iが提示された
プロファイルを jと評価する確率

I
tは,次式のような多項ロジット・モテソレとして定式化することができる.

e
x
p
(
,
VJ
弓(j=1,
.
吋5
)=
τ一一←ー

エ
回p(九)
k
=
1

この多項ロジット・モデルを推定するに当たっては,プロファイルを構成する 3つの属性の各水準が円を
規定する要因であると考え,確定効用 V
;
j を規定する要因のパラメータ(係数)の推定に際しては線形の効用

表 4 多項ロジット・モデルによる線形確定効用関数の係数の推定結果
}
l
M
I十l
J
H
i
f
十
w 討の f.s H~ I''] "
出記:コ グ
ル
サ
イ
ト
'
"'
i
!
!
>nt';:
d
自由度
行
政
情
領
と
公
共
性
の
あ
サ
ン
プ
ル
世 調整許
切片 1
切片 4 行
政
情
報
を
切片2
切片 3
間
情
銀
を 150円
行
政
挺似
300円
NPO
る
カ
ス
タ
マ
イ
ズ民
世
定
係
量
団体ー組合
セ
ノ
ト
で
p

全体

性別労

女
3
0
1
;
'
l
tf
謹代
3
0

,
曲
、

年齢

40j;~ 代

5
0前 代
6
0

立
以
上
公
出
員
団体品 1
¥
I
.
'
.
f
門0
'
,
輯
業
会
社
経
企
込
者
告子 U~

聴章

尚工 F
l
'
j
,
{

nE
旬

1
.
2
5
4
509
737
93
3
2
4
2
81
205
346
274
8
4

,

・

今一今
9

42
1
6
26
:
!
5
292
216
239
939
289
3
2
4
99
727
43

0
.
9
8
4.
.
0
.
3
1
0 ‑
0
.
6
9
5.
.
0
.
2
8
3 ‑
1
.
19
1••
0
.
3
3
7‑
0
.
9
4
4••
0.
426 ‑
0
.
3
8
6 0.885..
7
8
5
0
.
3
4
8 ‑0.
.033.'
0
.
2
7
1 1
1
.237*"
0
.
2
1
9‑
0
.
6
8
2
.
.
0
.
3
3
5 ‑
1
.
l22..
0
.
3
5
4‑
1
.4
09.
.
.
0
.
2
3
4‑
0
.
3
9
1 ‑0.
6
0
2‑
0
.
3
1
5 ‑0.
1
2
9
0
.
6
0
9
0
.
2
6
1 ‑
1
.
105..
0
.
3
6
8‑
1
.092..
0
.
3
5
4‑
1
.019..
0
.
2
1
9ー
.304..
0
.
3
1
1 1
0
.
9
0
5
.
.
0
.
3
4
1 ‑
.2
1
4u
0
.
2
2
6 1
1
.
l3
7
0
.
2
1
6ー
1
.254.'
0
.
3
4
8【
8
3
9.
.
0
.
3
6
4 ‑0.
.
3
4
9.
.
0
.
2
7
2 1

・

0
.
0
6
2
O.~B2 ••
0
.
0
7
1
0
.
3
6
6••
0
.
2
2
8••
0
.
2
7
4••
べ
0
.
0
3
0
‑
0
.
2
8
4.
.
0
.
3
7
5u
0
.
2
1
0
0
.
3
3
1
0
.
5
5
1
.
.
0
.
9
7
0
0.
49
6
0
.
2
0
6
0
.
0
0
3
‑
0
.
1
6
3
0
.
2
2
6••
0
.
2
0
0
‑
0
.
3
4
5••
0
.
1
8
1 ••
0
.
3
2
0
0
.
2
8
0
0
.
0
0
6

・・
・

1
.622"
1
.619.'
1
.6
6
3
2
.
1
7
7••
1
.9
97
1
.9
32••
1
.5
6
4••
1
.0
77.
.
1
.
8
3
9
.
.
1
.5
39
1
.040..
1
.990..
2
.
3
6
3••
1
.8
0
五"
1
.
5
3
3
.
.
1
.8
12.
.
.
1
.
3
3
:
:
!
.
47
0
1
1
.7
27••
1
.3
1
6
1
.
3
9
3
1
.2
7
8••

h
;事
専
業
謹
暗
学せその他
・・
イ
〉
ヲ
ネ
ッ
ト 吋.4!1‑る
・・
利
用 利
用
し
な
い
主
提
出
し
れ
ま
えし
叫
イ
ノ
タ
ネ
ァ
ト世
験
宣
告
し
今
後
め
り
・
上
で
の 桂
商品取引 枯
草
食
イ
{
り
午
後
も
机
統
・・ 1.835..
経
験
・
希
唱時
鞍
イ
[
り
暗
躍
繁L
1
.541.'
注}表中の帥は 1¥有
意
水
準
で
, *1:
l
:5¥有
意水準で,係数推定値が有意であることを示す

3
.
7
8
7
.
.
3
.
7
2
5.
.
3
.
8
8
2
4
.
6
3
6*
"
4
.
1
5
6••
3
.
9
7
6••
3
.
7
6
0
3
.
3
0
1
4
.
0
3
0.
.
3
.
5
8
i••
2
.
5
9
4.
.
.
4
.
1
8
9
3
.
8
8
2
.
.
3
.
9
5
9
.
"
3
.
8
7
6
.
.
3
.
9
5
5.
.
3684
3
.
7
:
:
5
.
.
3
.
9
3
4••
3
.
3
7
7••
3.
42
.
1
.
.
3.
‑
16
0.
.
4
.
0
9
4*
"
3
.
6
9
4

・・
・・
目

‑236‑

O
.
:
!
6
1••
O.~30 ・・

・・
・・
・・

0
.
2
8
6
0
.
3
1
2*
"
0
.
3
3
3
0
.
2
4
8
.
'
0
.
2
3
5
O.~18 ••
0
.
2
9
1.
.
0
.
3
1
3
0
.
3
1
3.
.
0
.
3
0
2

・・

o
.
o
n

0.282.
0.~89 ・

・・
・・
・・

0
.
:
.
!
9
i
0
.
1
8
8
0
.
2
5
0
0
.
2
9
2••
0
.
1
8
0
0
.
1
7
7••

0.375"
0
.
3
0
7
.
'
1
9
0

。

0
.
2
8
9
.
'
0
.
2
.
1
3
0
.
3
2
7
0
.
3
0
6
0
.
3
7
2
0
.
2
5
7••
0
.
2
8
0
0
.
2
5
5
.
.
0
.
:
.
!
9
2
.
.
0.
41
3.
.
0.
436..
0
.
1
9
6
0
.
0
6
2
0
.
3
0
9
0.
436..
0
.
3
1
4
.
.
0
.
1
9
3
0
.
3
2
7
.
.
0
.
3
0
4
.
.
0
.
2
6
7
0
.
2
3
0
0.
.
10
0
0
.
3
1
7••
0
.
2
2
5•

・・

・・
目

・・

・

・・
・・
・・

ー1
.
0
6
2
.
'
‑
1
.0
07
‑
1
.
120••
‑
1.
445'.
‑
1
.
3
0
9.
.
ー1
.
2
0
2
.
.
‑
0
.
9
3
6
‑
0
.
7
7
5
.
.
‑
1
.
175..
‑
1
.0
84.
.
‑0.
7
8
1.
.
‑
1
.3
48
-1. 2~3 ・・

・・

0
.
8
9
5
1
.
:
!
9
5
1
.
18
9
‑
0
.
7
9
6.
.
‑
1
.
0
3
3
.
.
‑
1
.
157"*
‑
0
.
7
9
0
‑
0
.
7
8
9••

・・

1
.
0
6
2
"
1
.
2
3
'
1'
.
0
.
9
8
7••

ー
1
.379‑‑
ー
1
.2
83*
"
ー1
.
47
6
ー1
.
8
2
5
‑
1
.
6
2
3.
.
‑
1
.531..
ー
1
.253..
ー1
.
0
8
3
.
.
‑
1
.4
6
1u
ー1
.
5
0
7
.
"
1
.
0
2
2
.
.
‑
1
.7
40
‑
1
.3
25.
.
1
.
1
5
7
‑
1
.4
42.
.
.
ー
1
.5
47
‑
1
.092..
ー
1
.384..
‑
1.
485."
‑
1
.1
0
2••
‑
1
.0
7
0
1
.523'.
1
.
5
6
3••
1
.
2
9
5••

・・

・・

O.O~l

0
.
0
0
3
0
.
0
3
5
0
.
1
3
6
0
.
0
5
8
‑
0
.
0
3
3
‑
0
.
0
0
9
0
.
0
4
5
0
.
0
3
2
0
.
0
0
3
0
.
0
4
6
0
.
0
9
0
0
.
2
2
0
0
.
0
4
8
0
.
0
3
5
0
.
0
5
4
0
.
0
8
7
0
.
0
4
5
0
.
0
3
1
0
.
0
1
1
0
.
0
0
5
0
.
0
1
7
0
.
0
4
0
‑
0
.
0
7
3

0
.
0
7
6.
.
‑
0
.
1
0
7••
0
.
0
5
9
0
.
0
9
2
‑
0
.
1
0
0
0
8
1
‑
0
.
0
9
7
0
.
0
3
8
‑0.092.
‑0.
0
2
1
0
.
0
2
2
‑
0
.
0
7
4
‑
0
.
2
1
6
0
.
2
4
1
0
.
0
5
6
0
.
0
8
3
0
.
0
9
2
‑
0
.
0
4
4
‑
0
.
0
7
1
‑
0
.
0
9
4•
‑
0
.
0
8
7
0
.
1
2
6
0
.
0
6
8

。

0
.
0
3
4
0
.
0
3
.
1

・ 0.027
0
.
0
3
8
・ ‑0.013

・
・

0
.
0
3
9

0
.
0
0
1

0
.
0
2
9
。
I
:
.
!
:
.
!
.
.
0
.
0
0
2
‑0.
0
1
1
0
.
0
9
4
0
.
0
6
8
0
.
0
2
0
0
.
0
7
3
0
.
0
3
5
0
.
0
3
8
0
.
1
2
9
0
.
0
0
9
0
.
0
1
4
0
.
0
9
0•
0.104.
0
.
0
6
7
0
.
0
0
1
0
.
0
4
6

・

230.
[beta]
関数を仮定した.推定結果は表 4に示す通りである.
また,地域ポータルサイトに関する提示されたプロファイルを住民 iが 15段階で評価すること」につい
て,各回答者の評価を 1から 5までの間隔尺度とみなし,間隔尺度で測定されたとみなした評価値を被説明
変数,インターネットの利用歴なども含めた回答者の個人的属性を説明変数として,重回帰分析を適用した
結果を要約したものが表 5である.
さらに,地域ポータルサイトに関する提示された 1
2のプロファイルを,住民 iが好ましさの観点から順位
付けした結果に対して,個々のサンプルに対して線形の効用関数を仮定し,ランクロジット・モデルを適用
すると,プロファイル j(j=1, 2,…, 1
2
) が選択される確率 ξの対数尤度関数が Coxの比例ハザード
モデ、ルで、用いられる部分尤度(偏尤度)と同じ形をしているという事実(栗山 [7J,小代 [8J
) を援用して,
ランクロジット・モテョルでの推定を行った.その結果は表 6に示す通りである.
表 5 重回帰分析による線形確定効用関数の係数の推定結果
f
i
i
H
!
,
f
のiJ
tt
円
谷
丹羽l l
片i
計
ナ
地ほポ タ
ノ
レ
サ
イ
ト
の
I
'
.
!
.
¥1自 説 珪
自
由
度
行
政
情
報
と
サンプル数 調整済
行政情植を 民
切片
公
共
性
の
あ
る
間情報を
1
5
0円
PO
日
3
0
0円
行
政
決定係世
団体組合
カ
ス
タ
マ
イ
ズ
セ
ッ
ト
で
叫

全
体

.
1
2
5
4

明 J

j
7
;
l

年齢

30勾史 f
禽
泊
、
3
0歳
代
4
0歳
代
5
0
歳
代
6
0
歳
以
上

509
737
9
3
3
2
4
2
8
.
1
205
1
3
4
2
7
.
1
8
4
22
1
2
1
6
2
6
2
5
292
235
220
939
289
3
2
4
99
7
2
7

0
.
3
1
1
0
.
2
8
8
0
.
3
3
6
0.
43
2
0
.
3
9
5
0
.
3
5
2
0
.
2
6
8
0
.
2
2
6
0
.
3
4
2
0
.
3
6
7
0
.
2
1
5
0
.
3
9
2
0
.
3
2
6
0
.
2
6
3
0
.
3
6
2
0
.
3
5
3
0
.
2
2
1
0
.
3
0
0
0
.
3
4
7
0
.
2
1
5
0
.
2
0
9
0
.
3
3
.
1
0
.
3
7
4

483・
・
3.
41
9・
・
3.
3
.
5
3
5.
.
3
.
6
9
5
3
.
5
5
1
3
.
5
.
1
9・
・
40
8・
・
3.
・
3
.
3
5
.
1・
3.
45
2・
・
・
3
.
1
9
2・
3.285..
・
3
.
6
7
9・
・
3
.
6
3
8・
3
.
3
2
1
3
.
6
1
3
・
3
.
5
6
5・
3
.
3
1
1 ••
3
.
5
6
5"*
3
.
5
1
4.
.
3
.
3
8
6・
・
3
.
3
3
8
.
.

0
.
2
8
6
0
.
2
6
4・
・
0.302..
0
.
3
0
7・
・
・
0
.
3
5
5・
0
.
2
6
4・
・
0
.
2
6
2・
・
0
.
1
8
2・
・
0
.
3
1
7"*
0
.
3
5
8・
・
0.
42
4・
0
.
3
3
7・
・
0
.
1
3
3
0
.
2
9
7
0
.
2
8
5
0.305..
0
.
2
3
1
0.257..
0
.
3
1
.
j
0
.
2
1
0・
・
0.206..

0
.
3
2
4••
O
.
:
!
9
2n
0
.
3
1
7
.
.
0
.
3
1
0・
・
0
.
3
9
7
0
.
2
7
3・
・
0
.
3
1
9
.
.
O.2~5 ••
0
.
3
3
3
.
.
0.
466..
0
.
5
6
7
.
.
O
.
:
:
!
I
I
0
.
1
1
7
0
.
3
6
4・
0
.
4
5
1 ••
0
.
3
2
1••
0.249..
0
.
3
4
0・
・
0.333..
0.308..
0
.
2
7
2"*
0.
423・
・
0
.
3
4
2**

昔
日I
I
公"h員
団体職員
専門的職聾
士社経営者
聴
業 商
工自営
自
由
業
家 J
<専
業
再
職
学
生
・
そ
の
他
J
Jす
る
イタ
ネ
ゾ
ト 判I
利
用 利
用
し
な
い
W
l
提
し
守 i交
慢
し
イ
ノ
タ
ー
ネ yトH!
3
.
5
i
6.
.
40
3
0.
上
で
の 経験無し今後あり
商
品
取
引 経験有り今後も継続
3.536..
0
.
3
2
5・
・
経
験
・
希
望 E験
イり
継
続
黒
し
・
3
.
5
4
9・
0
.
2
2
6・
4
3
0
.
2
5
4
0
.
1
9
7
注),喪中の帥は l私有芭水準で,判ま5%有意水宣告で,係数推定値が有意であることを示す
J

.
1190・
・
.
1
215..
.
1187・
・
‑
1・
t
3
6.
.
.
1
396・
・
.
1
328..
‑
1
.049・
・
0
.
8
6
0・
・
ー
1
.341••
.
1
2
4
4・
・
‑
0
.
9
6
1••

一
1
.489..
1
.
5
3
3
.
.

.
1121・
・

.
4
i
7"
.
I

.
1
2
5
1

0
.
9
5
1••
.
1
080・
・
.
1
294..
0.876..
0
.
9
0
0・
・
ー
1
.137**
.
1
365・
・

.
1
048・
・

l

1
.
5
7
0・
・
.
1
5
5
1・
・
1
.
5
9
7u

一
1
.846..
1
.
75
0・
・
1
.
718..

.
1
430・
・
.
1
3
3
4
.
1
6
7
1
一
1
.759.
.
.
.
1
2
9
4
.
1
930・
・
一
1
.692..
‑
1
.426・
・
一
1
.619..
‑
1
.658・
・
.
1
3
1
1
.
1
498..
.
1
677••
.
1
266"*
.
1
255.
.
.
1
679..
‑
1
.744
‑
1
.394

0
.
0
8
1••
0.128..

0
.
0
1
5
0
.
0
2
9
0
.
0
0
4
‑
0
.
0
9
7
0
.
0
2
7
0
.
0
1
6
0
.
0
1
6
0
.
1
0
2
0
.
0
1
5
0
.
0
3
6
‑
0
.
0
4
5
0
.
0
3
2
0
.
2
7
1
一
0
.
0
2
6
0
.
0
1
3
‑
0
.
0
1
7
0
.
1
1
2
0
.
0
0
8
0
.
0
1
2
0
.
0
3
3
0
.
0
2
8
0
.
0
8
1
0
.
0
0
4
0
.
0
3
9

0
.
0
5
4
0
.
0
8
2
0
.
1
0
0・
一
0
.
0
8
1
0
.
1
0
6
0
.
0
2
7
0
.
0
9
9
0
.
0
4
4
0
.
0
0
0
0
.
0
6
3
ー
0
.
2
5
0
0
.
2
4
4
0
.
0
9
3
‑
0
.
0
7
6
0
.
1
1
3・
0
.
0
2
7
0
.
0
6
9・
0
.
1
1
5・
0
.
1
0
8.
.

0
.
0
4
6
0
.
0
4
5
0
.
0
4
0
0
.
0
5
4
0
.
0
0
8
0
.
0
1
8
0
.
0
3
9
0.226..
0
.
0
0
6
0
.
0
0
0
0
.
1
6
7
ー
0
.
0
7
1
0
.
0
4
2
0
.
0
7
7
0
.
0
2
7
0
.
0
4
9
0
.
1
3
3・
0
.
0
3
8
0
.
0
2
2
0
.
1
1
4・
0.133..

0
.
1
3
1
0
.
0
6
6・
0
.
0
0
8

0
.
0
7
4
0
.
0
0
5
0
.
0
3
1

表 6 ランクロジット・モデルによる線形確定効用関数の係数の推定結果
{
!
'
T
Uの
;
ピ
兵
円
単
川拍 j
IJ
+
JH
地域ホ タ
ル
サ
イ
ト
の jili'g
‑
組
品
行
政
情
報
と
サンプル数 対数尤度 行政情報を 民
公
共
性
の
あ
る
J
J
l
J
t
持
報
を
300円
行
政
1
5
0円
NPO
カ
ス
タ
マ
イ
ズ
団
体
・
組
合
セ
ッ
ト
で
全
体

性
日1

3

年齢

百A
二1
1
.
1
j
3
0
1
1
穏
代
30
4
0
歳
代
50í~担 ft

6
0
歳代以上
よ1
1
:
(

9
9
0
433
552
6
7
240
219
1
7
2
2
9
1
2
2
1
6
6
1
3
35
1
5
2
3
1
9
2
1
3
1
8
9
1
8
1
750
228
264
9
5
5
5
9
3
0

1
0
1
7
3
.
1
3
4
0
1
9
7
.
7
52853.
.
1
4
7
1
9
.
7
2058.
11
1
8
5
3
9
.
3
1
4
0
6
.
1
9
2
5
6
2
7
.
5
1
8
7
3
2
.
8
4637.
4
6
6
0
.
0
2
1
9
2
.
8
7
8
7
.
3
1
3
2
5
.
1
.
1
‑
1
0
51
1
7
9
6
0
.
6
1
5
6
6
5
.
5
J
.
l9
0
8
.
8
7
.
1
5
7
0
.
6
1
9
4
1.
1
5
2
2
9
4
0
.
9
7
0
9
0
.
2
5
3
6
0
8
.
2
ー
1
8
2
4
.
0

←

縫
定f直

推
定
値

推
定
値

0
.
3
1
2.
.
0
.
2
7
1 ••
0.360..
0
.
3
1
9"*
0
.
4
4
3
.
.
0
.
2
9
7u
0
.
2
5
8
.
.
0
.
2
8
3
.
.
0.307..
0
.
2
4
9
0
.
3
9
2
・
0
.
3
8
0・
0
.
0
7
2
j
.
J
0
.
0.
0
.
2
.
1
1
0
.
1
6
2
.
.
0
.
2
8
1
0
.
3
1
2
.
.
0
.
3
0
5
.
.
0
.
3
1
1
0
.
2
8
3
.
.
0
.
3
8
5
.
.
0
.
3
2
5
.
.

433..
0.
444..
0.

0
.
7
8
7
.
.

0.
43
2
0
.
5
6
8
.
.
・
0
.
5
.
1
3・
0
.
.
1
3
6
.
.
483..
0.
・
0
.
3
7
5・
・
0
.
5
2
0・
0
.
5
4
1
49
3・
0.
0.
.
16
9**
0
.
0
8
3
‑
0
.
1
0
9
0
.
1
5
1
'
13
0・
・
0.
・
0
.
3
1
6・
0
.
5
1
.
1
0
.
.
!
1
9
‑8
8**
0
.1
0
.
3
8
3
.
.
0
.
6
2
7
.
.
0
.
.
j
6
8
.
.

0
.
6
4
5"*
0
.
9
5
0・
・
1
.
146..
1
.
196..
‑
0
.
9
1
8
.
.
0.707..
‑
0
.
5
2
0・
・
0
.
8
1
0・
・
0
.
6
7
8
.
.
0
.
7
9
8
.
.
0
.
9
5
3**
0.598..
0
.
8
3
3・
・
0
.
8
1
i
.
1
0
6
1••
0
.
6
1
2・
・
0
.
8
1
2
.
.
0
.
8
8
9
.
.
0
.
5
5
5
0
.
5
7
‑
1
0
.
6
6
6
0
.
9
8
9
.
.

公
務
員
団体職員
専門的職業
主社経営占
職
業 商
工自営
自
由
業
まl
'専
業
里
職
学
生
・
そ
の
他
J
)
有
す
る
イ
ン
タ
ネ トI
利
用 利
用
し
な
い
イ
,
タ
ー
ネ
ヅ
ト 世軒.~~し?泊'.'L上
で
の 経験里 L~ 桂あり
商取
引 経験有り今憧も継続
経
験
・
希
望 経験有り継続再し
‑
0
.
6
1
5
0
.
2
7
8・
O.lH
注)表中の帥は 1%有意水準で,叫土5%有意水準で,係数推定値が有意であることを示す
7

0"

→

日

u

‑237・

推
定
値
一
1
.697・・
‑
1
.
450・
・
.
1
969..
‑
2
.
1
0
0・
・
2.229..

.
1
979..
一
1
.5.18."
.
1
318..
.
1
663..
1
.
743..

.
1
519..
ー
1
.758"*
.
1
3
.
1
1
.
.
.
1
697..
‑
1
.787
u

2
.
1
3
3.
.
.

.
1
502..
1
.
76
2・
・
.
1
850・
・
.
1
335..
.
1
3
6
1
.
1
749..
.
1
970・
・
ー
1
.
6
3
9
u

推
定
値

推
定
値

0
.
0
1
6
0
.
0
0
3
0
.
0
3
1
0
.
2
3
5・
‑0.196..
0
.
0
5
2
0
.
0
2
7
0.137..
‑
0
.
1
7
4••
0
.
0
9
5
0
.
0
7
2
0
.
0
5
9
0
.
1
3
0
0
.
0
0
7
0
.
0
9
5
0
5
3
0.155..
‑
0
.
1
6
4**
0
.
0
0
7
0
.
0
1
7
0
.
0
3
2
0
.
1
0
5
0
.
0
8
0・
0
.
1
7
9

0
.
0
3
3
0
.
0
3
5
0
.
0
2
2
0
.
0
5
2
0.187..
0
.
0
0
8
0
.
0
4
2
0
.
0
4
0
0.146..
‑
0
.
1
3
7
0
.
2
0
2
1
5
7
0
.
0
5
5
0
.
2
1
1
0
.
0
2
0
0
.
0
3
5
0
.
0
1
0
0
.
0
2
4
0
.
0
6
1*
0
.
0
5
0
0
.
0
0
4
0
.
1
4
2
0
.
0
9
9
.
.

。

。

0
.
1
0
4

推
定
値
・
0
.
1
5
0・
0
.
1
1
1.
.
0
.
1
9
8
.
.
‑
0
.
1
2
9
038
0
.
1
2
5・
0
.
1
3
2・
0
.
3
2
8・
・
‑
O
.
O
O
j
0
.
2
4
0・
0
.
1
1
2
0
.
0
5
3
0
.
1
0
9
0
.
1
1
8
0
.
1
3
3
0.353..
0.
409..
0
.
1
1
3
0
.
1
1
4u
0.254..
0.263..
0.259..

。

0
.
0
3
4
0
.
2
3
0

231.

4. おわりに 本稿では,地域情報化の一環として官民連携の地域ポータルサイトを構築して行政情報に加えて民間情報 を利用者の属性に応じてカスタマイズして提供することや民間企業に地域ポータルサイトの運営を業務委託 する施策について,兵庫県伊丹市で実施した住民意識調査でコンジョイント分析を適用する設問を組み込み, 2項型選択法の質問への回答データに対しては 2項ロジット・モデル, 5段階評点型評価法の質問への回答 データに対しては重回帰分析と多項ロジット・モデル,順位付け評定法の質問への回答データに対してはラ ンクロジット・モテゃルを適用して線形効用関数を定量的に評価することを試みた.行政が情報提供すること や行政情報をカスタマイズして提供することが住民から評価されていることを示すことができたが,紙面の 都合上,各分析において深く考察することが出来なかった.分析結果の考察を深めていくことが今後の課題 である. 謝辞 本研究は,平成 1 9年度兵庫県立大学特別教育研究助成金ならびに平成 1 9年度大手前大学特別研究費の助 成を受けて実施したものであり,平成 21~ 平成 23 年度科学研究費補助金基盤研究 (C) I 住民評価に基づく 1 5 3 0 3 5 7 ) の研究の一環 地域ポータルサイトの信用の源泉と行政情報の持つ価値に関する研究 J (課題番号:2 を構成するものである.調査に際しては伊丹市民の皆様からのご協力をいただくとともに,伊丹市からは調 査票配布にあたって格別の配慮を頂いた.また,コンジョイント分析を適用する質問の作成にあたっては兵 庫県立農林水産技術総合センターの加藤雅宣氏から, SASプログラムの作成にあたっては兵庫県立大学神戸 学園都市学術情報館の周防節雄教授から,品1pの JSLスクリプトの作成にあたっては兵庫県立大学応用情報 科学研究科の川向肇准教授から貴重な示唆をいただいた.これらのご協力・ご支援に深く感謝申し上げます. 参考文献 [1] 合崎英男, ~農業・農村の計画評価一表明選好法による接近 -1 農林統計協会, 2 0 0 5 . [2]A r ima,M a s a h i r oa n dM a s a h i r oF u j i t a, Wh os h o u l dO p e r a t eL o c a lP u b l i cS i t e sa n dWhatC o n t e n tS h o u l dBe m p i r i c a lS t u d yBasedonaL o c a lQ u e s t i o n n a i r eS u r v e y ",J o u r n a lo fS o c i o ‑ I n f o r m a t i c s,Vo. 1 2,N o . l, P r o v i d e d:AnE f o r t h c o m i n g, 2 0 0 9 . [3] 有馬昌宏・川向肇, I 地方自治体における行政施策評価へのコンジョイント分析適応の可能性と課題 J, 『地域学研究~,第 38 巻第 3 号, p p . 6 2 9・ 6 4 8,2 0 0 8 . 1 1向肇, I コンジョイント分析による行政施策評価の試み J,SAS ユーザー会学術総会 2 0 0 7 [4] 有馬昌宏・ ) 発表論文, 2 0 0 7 . [5] 有馬昌宏・川│向肇・天津重伸, I 即1pによるコンジョイント分析と住民意識調査への応用 JSLスクリプ 259, 卜を利用したコンジョイント分析の実装化一 J,~SAS Forumユーザー会学術総会 2006論文集 1pp.245・ 2 0 0 6 . [6] 片平秀貴, ~マーケティング・サイエンス 1 東京大学出版会, 1 9 8 7 . [7]栗山浩一・庄子康, ~環境と観光の経済価値~,勤草書房, 2 0 0 5 . [8] 小代禎彦, IJMPによるコンジョイント分析 J,J M P e r ' sM e e t i n g2 0 0 6 ‑ 3 発表資料, 2 0 0 6 . [9]藤田昌弘・有馬昌宏・川│向肇, I 行政情報と民間情報の一体的発信の評価と発信主体の選択 J,~2008 年 日本社会情報学会 (JASI&JSIS) 合同研究大会論文集~, p p. 45 2‑ 45 7,2 0 0 8 . ‑238・

232.

付録 1 コンジョイント分析のための SASプログラム 1 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 1 A n a l y s i s . s a s 1 * 1 * プログラムを実行して分析を行う前に,以下のような変数!こ 1 .0 の値が入力された S A Sデータセット ( I o g i s t i c ̲ d a t a ) を" C :半S A S "下に作成しておく必要がある s e r v i c e 1 ‑ s e r v i c e 3 p r o v i d e r 1 ‑ p r o v i d e r 4 p r i c e 1 ‑ p r i c e 3 : s e x 1 ‑ s e x 2 a g e 1 ‑ a g e 6 j o b 1 ‑ j o b 1 0 :提供サービス 3水 準 :提供団体 4水準 :提供価格 3水準 ‑ 性 月 IJ 1男 2 .女 1 .3 0歳未満 2 . 3 0歳代 3 . 4 0歳代 4 . 5 0歳代 5 .6 0歳以上 :職業 1.会社員 2 .公務員 3 .団体職員 4 .専門的職業 5 .会社経営者 6 .商工自営 7 .自由業 8 .家事専業 9 .無職 1 0 .学生・その他 i n t e r n e t 1 ‑ i n t e r n e t 2 : イ ン9 ‑ * 1ト利用状況1.利用する 2 .利用しない e s h o p p i n g 1 ‑ e s h o p p i n g 4 :イントネット上での商品購入経験・希望1.経験無し今後も無し 2 .経験無し今後あり 3 .経験有り今後も継続 4 .経験有り継続無し k a h i b i t :2項選択質問有効回答者 .評価選択質問有効回答者 r a n k b i t 順位選択質問有効回答者 o r d e r b i t 年齢 1 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *材 料 材 料 材 料 材 料 材 料 材 料 材 料 材 料 材 料 材 料 材 料 材 料 材 料 材 料 材 料* 1 o p t i o n sn o c e n t e rn o d a t en o n u m b e rm p r i n t : 目l e tl o g i s t i c c l a s s = c l a s ss e r v i c e 1 ‑ s e r v i c e 3p r o v i d e r 1 ‑ p r o v i d e r 4p r i c e 1 ‑ p r i c e 3 : 1 i b n a m e f o l d e r" c半SAS": 拍n a c r oc1 e a n( t y p e ): d a t at e m p : s e tf o l d e r .l o g i s t i c ̲ d a t a : i f& t y p e .b i t 二 1t h e no u t p u t :1 *分析を行う質問に対する有効回答者だけを outputする * 1 r u n . 伽l e n dc l e a n : 知l a c r oa n a1 y si s( t y p e .c a1 c u1 a t e .c1 a s s .n a m e .o p ti o n .a t t ri b u t e .i ): d a t ap o o1 ; s e tt e m p ; i f" & a t t r i b u t e "ニ " a l1 "t h e no u t p u t : l * a t t r i b u t eが a1の場合は全体を o u t p u t * 1 e l s ei f& a t t r i b u t e & i= 1t h e no u t p u t : l *該当する属性のデータのみを o u t p u t * 1 r u n ; p r o c& c a l c u l a t ed a t a = p o o l : & c l a s s : m o d e l& t y p e . ̲ d a t a = s e r v i c e 2 ‑ s e r v i c e 3p r o v i d e r 3p r o v i d e r 2p r o v i d e r 1p r i c e 2 ‑ p r i c e 3 & o p t i o n :t i t l e" & t y p e .データを使って & n a m e .を実行 ( & a t t ri b u t e &i ) " ; r u n ;q u i t ; 蜘l e n da n a l y s i s : 知l a c r or e p e a t ( t y p e . c a l c u l a t e .c l a s s .n a m e . o p t i o n . a t t r i b u t e .c o u n t ) ; 弘D oi = l 目t o& c o u n t ; 目a n a / y s i s (品t y p e . & c a l c u l a t e . & c l a s s . & n a m e . & o p t i o n . & a t t r i b u t e .品i ) % e n d ; 知l e n dr e p e a t ; ‑ 2 3 9 ‑

233.

o d s[ i s t i n gc [ o s e ; o d sh t m [f i[e="C:~加藤優希半 out 半 [ogistic_kahi.x[s"; 弘c!ean(kahi ) 国repeat(kahi ,[ o gi s ti c , &[ o gi s ti c cI a s s,二項ロジスティック回帰分析, / r s qI a c k f i t,a[ , [1 ) 国repeat(kahi ,I o gi s ti c , &[ o gi s ti c c[ a s s,二項ロジスティック回帰分析, / r s q[ a c k f i t,s e x,2 ) 世repeat(kahi ,[ o g is ti c , & I o g is ti c c[ a s s,ニ項ロジスティック回帰分析, / r s q[ a c k f i t,a g e,5 ) 世repeat(kahi ,[ o gi s ti c , & [ o gi s ti c c[ a s s,二項ロジスティック回帰分析, / r s q[ a c k f i t,j o b,1 0 ) 国repeat(kahi ,[ o gi s ti c , &[ogi s ti c c[ a s s,二項ロジスティック回帰分析, / r s q[ a c k f i t,i n t e r n e t,2 ) 世repeat(kahi ,[ o g is ti c , &[ o g is ti c c[ a s s,二項ロジスティック回帰分析, / r s q[ a c k f i t,e s h o p p i n g,4 ) o d sh t m [f i[e="C: 半加藤優希 ~out半 [ogistic_rank_re~x[s"; 国c!ean(rank) 百repeat(rank,r e g,,重回帰分析 "a[[, 1 ) 国repeat(rank,r e g,,重回帰分析 "sex,2 ) 世repeat(rank,r e g,,重回帰分析 "age,5 ) 世repeat(rank,r e g,,重回帰分析, ,j o b,1 0 ) 百repeat(rank,r e g,,重回帰分析, ,i n t e r n e t,2 ) 国repeat(rank,r e g,,重回帰分析, ,e s h o p pi n g, 4 ) o d sh t m [c [ o s e ; o d s[ i s t i n g ; 付録 2 様々な分析を行うことの出来る JSLスクリプト 以下に示すのは,名義ロジスティック,順序ロジスティック,最ノj、二乗法,比例ハザードを実行するため の JSL スクリプトである.本 JSLスクリプトを実行するためには,プロファイルに対する順位が数値型で入 力されているデータテーブ';レと図 1に例示するような分析対象となるプロファイルがコードで定義されてい るデータテーブルを事前に用意しておく必要がある. 坦 F イル 11¥¥ 」!?F K: ‑ →f ‑i 器 片言づ十一一 1 ̲ ̲ . . . 戸温: 全 ~子三時13\二二 ト 1~ I →告すけ託 韮洋平守一一一 1‑‑ トー‑ 1 ート斗一一一一一一‑ k: 仁=ヰ‑ ー i ι ι i h f r i z z 1 二 二I ‑ ‑ . i ‑ ‑ ミ 5 1 2 弘行 1 ド=壮士 一一一 図 1 論文の図 2の 12のプロファイノレをコードで再現したもの //‑‑‑‑‑‑一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一 / *VariousAn a l y s i sS c r i p t 打 / /CodedbyY I 叫aK ato,H吋imeKawamukai 町 / /L a s tM o d i f i e d :2 0 0 9 J u l y 7 * / //一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一司 ‑ 2 4 0・

234.

t b I V a r i a b l e s = [ ] ; /*変数の初期化*/ S o u r c e D a t a T a b l e = [ ] ;作文字型の属性水準によるプロファイル定義行列(プロファイル数×属性数) * / A d d C o l = [ ] ; /*全オブザベーションのプロファイル順位付けデータ格納行列*/ P r o f i l e L I S T = [ ] ; TMPLIST=[]; /*各オブザベーションのプロファイル順位付けデータ格納列ベクトル*/ /*コード化された属性水準によるプロファイル定義行列*/ FINALLIST=[]; /*コード化された属性水準によるプロファイル定義行列の横にその順位データも保存す )* / るための行列(プロファイル数 X(属 性 数 +1) //一一一一‑一一一ー /*プロファイルとデータファイルの定義 * / / / ‑ ・ 司 ・ ・ ・ ・ //各プロファイルをコード化した属性水準で定義したプロファイル定義用 J M Pファイルの選択 を促すダイアログの表示 d l g S h ow= D i a l o g ( "コンジョイント分析で使う分析対象のプロファイルの入った 1M Pファイルを指定します. ヘButton("OK")); //プロファイル定義用 J M Pファイルを通常のファイルダイアログから選択 d l g S h ow= OpenO; b l V a 巾 b l e sに代入 H プロファイルが定義されたデータテープ、ルを t t b l V a r i a b l e s = C u r r e n tDataT a b l e O ; ) 慎位付けデータが入力されている J M Pファイルの選択を促す H 回答者のプロファイルに対する 1 ダイアログの表示 d l g S h ow= D i a l o g ( "コンジョイント分析で用いる回答者のプロファイルの順位付けデータが入った JMP ファイ u t t o n (ゆ K " ) ) ; ルを指定します.ヘ B //プロファイル順位データが記録された J M Pファイルをダイアログから選択 dlg0penTable=OpenO; //プロファイル順位付けデータ列の選択を促すダイアログの表示 d l g S h ow= D i a l o g ( "コンジョイント分析で使う回答者のプロファイル順位付けデータが保存された複数列を指 n ( " O K " ) ) ; 定します.ヘBu口o H プロファイル順位付けデータ列選択用のダイアログを表示の上で選択された複数列の変数名の l g 0 r d e r L i s tに保存.ダイアログのリストで選択された変数名は O r d e r sVar Names に代入~ 集合を d のリストは S o u r c e D a t a T a b l eにデータを代入する際にも利用. d l g O r d e r L i st =ColumnDi a l o g (OrdersVarNames=CoIL is t ( "順位の列",M i n C o l ( I ) )) ; //一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一 戸プロファイルの順位付けデータの読み込み * / //一一一一一一一一一一一一一一一一一一一一一一一一 ρOrderVarNames!こ取り込んだ列名に対応するデータを一つずつ S o u r c e D a t a T a b l eの後ろに追加 F o r ( i = l, i く= N l t e m s ( d l g O r d e r L i s t [ " O r d e r s V a r N a m e s " ] ), i + +, C o l umnDa t a b y N a m e = C o l u m n ( d l g O r d e r L i s t [ " O r d e r s V a r N a m e s " ] [ i ] )く くG e tAsM a t r i x ; S o u r c e D a t a Tabl e = C o n c a t ( S o u r c e D a t a T a bl e, C o lu mnDatabyName) ; C l o s e ( d l g O p e n T a b l e, NoS a v e ) ; //メモリの節約と処理速度の向上のために d l g O r d e r L i s tをクローズ P r o f i l e L I S T = t b l V a r i a b l e s く くG e t A s M a t r i x ;//函面に表示されているデータテープ、ルの内容を P r o f i l e L i s tに代入 //‑‑‑‑一一一一一一一一一一一一一司 /*生存時間分析によるランクロジット分析適用のためのデータテーブル作成*/ / /‑‑‑‑一一一一一一一一一一一一一一一一一一一一一一 H 全オブザベーションについて個々のプロファイル定義行ベクトルとそのプロファイルに対応す る順位データを縦方向に並べるループの開始 f o r ( i = l, i く= NRow(SourceData Tabl e , )i + +, ‑ 2 4 1 ‑

235.
[beta]
A
d
d
C
o
l
=
T
r
a
n
s
p
o
s
e
(
S
o
u
r
c
e
D
a
t
a
T
a
b
l
e
[
i,
O
]
)
;
TMPLIST2=Concat(ProfileLIST
,
A
d
d
C
o
l
)
;
FINALLIST=VConcat(FINALLIST
,
TMPLIST2);
H 全オブザベーションについて個々のプロファイル定義行ベクトルとそのプロファイルに対応す

る順位データを縦方向に並べるループの終了

//司一一一一一一一一一一ー一一一一一一一一一一一一一‑一一一一一
/*分析用データテーブルへの格納とテーブルの管理

*
/

//一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一
t
b
l
L
I
S
T
=
A
sT
a
b
l
e
(
F
I
N
A
L
L
I
S
T
)
;//作成された生存時間分析用のデータ行列をデータテープワレに格納
C
l
o
s
e
(
t
b
l
V
a
r
i
a
b
l
e
s,
NoS
a
v
e
)
;//コードで表現されたプロファイノレ定義用テーブルを保存せずにクローズ
Hダミー変数に使用するため列を増やす
t
b
l
L
I
S
T
くく n
ewc
o
l
u
m
n
(
"現状");
t
b
l
L
I
S
T
くく n
ewc
o
l
u
m
n
(
"カスタマイズ"); t
b
l
L
I
S
T
くく n
ewc
o
l
u
m
n
(
"セット");
t
b
l
L
I
S
T
くく n
ewc
o
l
u
m
n
(
"行政");
t
b
l
L
I
S
T
くく n
ewc
o
l
u
m
n
(
"公共の団体");
t
b
l
L
I
S
T
くく n
ewc
o
l
u
m
n
(
"
N
P
O
"
)
;
t
b
l
L
I
S
T
くく n
ewc
o
l
u
m
n
(
"民間企業");
t
b
l
L
I
S
T
くく n
ewc
o
l
u
m
n
(
"無料");
t
b
l
L
I
S
T
くく n
ewc
o
l
u
m
n
(
"百五十円fI);
t
b
lL
!ST
くく n
ewc
o
l
u
m
n
(
"三百円 1
1
)
;
H各列の初期化
f
o
r
(
i
=1
,
i
<
=
N
r
o
w
(
t
b
l
L
I
S
T
),
i
+
+,
現状 [
i
]
=
O
; カスタマイズ、 [
i
]
=
O
;セット [
i
]
=
O
;行 政 [
i
]
=
O
;公共の団体 [
i
]
=
O
;N
P
O
[
i
]
=
O
; 民間企業 [
i
]
=
O
;
無料 [
i
]
=
O
; 百五十円 [
i
]
=
O
; 三百円 [
i
]
=
O
;
f
o
r
(
i
=1
,
i<=Nrow(t
b
lL
!S
T),
i
+
+
,
H 第 l属性のコード表記された属性水準に相当するダミー変数に 1を代入
i
f
(列 l
[
i
]
=
=
1
0
1,現状旧 =
1,列 l
[
i
]
=
=
1
0
2,カスタマイズ [
i
]
=
I,列 1
[
i
]ー 1
0
3,セット [
i
]
=
l
)
;
H 第 2属性のコード表記された属性水準に相当するダミー変数に 1を代入
i
f
(列 2[i]=201,行政旧 =1,列 2
[
i
]ー202,公共の団体 [
i
]
=
I,列 2[i]=203,
NPO[i]=I,列 2[i]=204,民間企業 [
i
]
=
I
)
;
//第 3属性のコード表記された属性水準に相当するダミー変数に 1を代入
i
f
(列 3[i]=301,無料日 =1,列 3[i]=302,百五十円 [
i
]
=
l,
要J
[3
[i]=303,三百円凹 =
1
)
;
//モデルのあてはめで手法を名義ロジスティックまたは順序ロジスティックとする場合は,次の行
を使用してダミー変数を名義尺度に変換しておく必要がある.最小二乗法を実行するときは下の行
を削除する.
f
o
r
(
i
=
4,
i
く=
N
c
o
l
(
t
b
l
L
I
S
T
),
i
+
+,
c
o
l
u
m
n
(
i
)くくd
a
t
at
y
p
e
(c
h
a
r
a
c
t
e
r
)
;)
;
//手法()の括弧内を書き換えることで,名義ロジスティック,順序ロジスティック,最小二乗法,
比例ハザードといった分析に対応できる.
モデノレのあてはめ(
Y(:列 4,
)

効果(カスタマイズ,.セット,百五十円, .三百円, :NPO,:公共の団体, .行政),
手法(順序ロジスティック),モデルの実行(レポートへ送信(デ、イスパッチ({},
t
1ineBox,閉じる (
0
)
)
)
)
"反復の履歴", Ou

‑242・

236.

SASでの AHPによる重要度評価 官民連携地域ポータルサイトの運営主体の信用の源泉評価を事例に 加 藤 優 希 l,有馬昌宏 l,藤田昌弘 1, 2 l兵庫県立大学大学院応用情報科学研究科, 2大手前大学現代社会学部 Ana p p l i c a t i o no fA n a l y t i c a lH i e r a r c h yP r o c e s sUsingSASSystem Y u k iKAT01,M a s a h i r oARIMA1,M a s a h i r oFUJITA2 l G r a d u a t eS c h o o lofA p p l i e dI n f o r m a t i c s, U n i v e r s i t yofHyogo,20temaeU n i v e r s i t y 要旨 住民意識調査などで住民の意思や選好構造を明らかにするために AHP (An a l y t i c a lH i e r a r c h yP r o c e s s: 階層化意思決定法)が適用されることがある. AHPを適用する設聞が組み込まれた住民意識調査の回答 データを分析の対象とするとき,従来は SAS以外のシステムで重要度や代替案を評価するための計算を 実行し,その結果を改めて SASに読み込んで分析を行うとしづ手順を経る必要があった.そこで,本稿 では,我々が実施した住民意識調査の回答データの分析を事例に, SASによる AHPでの要因の重要度 評価のプログラムを紹介し,併せて分析結果を紹介する. キーワード:住民意識調査, AHP (階層化意思決定法),重回帰分析, SASシステム 1.はじめに 近年のインターネットをはじめとする情報通信基盤の高度化と普及に伴い,地方自治体や地域の企業の間 で,さらには地域住民の問で,自らが保有する情報を「地域情報」として発信し,地域の構成主体問で共有 することが,地域の振興や住民生活の向上に役立つと言う認識が広まりつつある. しかし,自治体からの情 報である行政情報は自治体のウェブサイトで,地域の企業や商底や飲食底やサービス業の民間情報は個別の サイトあるいは民間のウェブ運営会社の地域サイトで,住民の保有する情報は地域掲示板で,というように, 地域に関連する情報はこれまでは別々に発信されて流通してきており,域外の潜在的訪問者も含めて,利用 者の視点に基づいて地域情報が効果的かつ効率的に発信されて共有されてきているとは言い難い状況にある. しかし,行財政改革が求められている自治体,サイト訪問者を増やして広告料収入を増大させたいウェブ 運営事業者,ワンクリックで必要な生活情報を獲得したい地域住民のそれぞれは,思惑や動機は異なるにせ よ,地域に関連する官民の情報が l箇所で提供される「地域ポータルサイト」の開設・運営への期待は一致 しており,地域情報化に積極的に取り組んでいる先進的な自治体では,長野市や川崎市や伊丹市での事例の ように,行政情報の提供を民間のウェブ運営事業者に提供し,提供された民間のウェブ運営事業者が関連す る行政情報と民間情報をセットにして住民へと向けて発信する試みが生まれている. ‑243・

237.

しかし,この試みが全国的に広がっていく前に,答えられなければならない疑問が答えられないままにい くつか存在している.その一つは, I 地方自治体が発信する行政情報は公的なものである」という観点から の「地域ポータルサイトの運営事業者をどの組織にするか」の運営組織選択に関するものである.民間事業 者に委託するとすれば,選定のプロセスの公平性と透明性に加えて,事業者選択の基準が事前に明確にされ ていなければならないが,この基準は自明ではないし,明らかにもされていない.さらに,行政情報は公的 なもので無謬性が求められるために,事業者選択に際しては,組織の事業継続性やウェブから発信される情 報の信溶性など,組織の「信用」の観点からの評価が特に重要となると考えられる. このような疑問に答える先行研究が存在しないため,我々は,官民一体の地域ポータルサイト「し、たみん」 を開設した兵庫県伊丹市をフィールドに住民意識調査を実施し,その中で T .L .S a a t yによって提案されて広く 意思決定や社会的評価の分野で利用されている AHP (Ana l y t i c a lH i e r a r c h yP r o c e s s:階層化意思決定法)の重 要度評価の方法を適用し,地域ポータルサイトの運営事業者や提供情報についての定量的評価を試みた(藤 田・有馬 ( 2 0 0 8 ) ,有馬 ( 2 0 0 9 ) ,F吋i t aandAr ima ( 2 0 0 9 ) ,有馬・藤田 ( 2 0 0 9 ) ) .本稿では,官民一体 の地域ポータルサイトの運営事業者に求められる要件について,住民意識調査に基づく信用の観点からの SASを用いた基礎的分析結果を報告するとともに, SAS上で回答者からの回答データから固有値法を用いて AHPによる要因重要度を計算するプログラムを公開して,利用者の便に供する. 2 . 伊丹市での住民意識調査と AHPを適用する設問の概要 地方自治体が従来は自らの公式のウェブサイトでのみ公開していた行政情報を民間事業者へ提供して, ー の情報の提供を受けた民間事業者が地域の民間企業(商庖,飲食庖,サービス事業者,商工会・商工会議所, 観光協会などを含む)からの情報と組み合わせて提供するという官民一体型の地域ポータルサイトに対して, サービスのターゲットとなる住民がどのように評価しているかを検証することを目的として, 2 0 0 8年 1月に 民問委託の地域ポータルサイト「いたみん」が開設された伊丹市において,住民意識調査を実施した.調査 は , I し、たみん」の本格稼動の 2 008年 1月末に合わせ, 2008年 2月 1日発行の伊丹市の広報紙に調査票と回 収用封筒を挟み込む形式で全世帯に配布し,郵送で回収する方法で実施した.調査票は A 4版 8ベージで, 大手前大学藤田研究室と兵庫県立大学有馬研究室が共同で実施することを明記し,調査内容として以下の項 目を組み込んだ. ①回答者の基本属性:回答者の個人属性,地域情報の入手方法,自宅の情報通信環境,インターネットの利 用状況など. ②「いたみん」の利用状況:利用頻度,利用の理由,提供情報に関する関心度,現状に追加してほしい情報, 伊丹市以外に必要な地域情報など. ③運営組織に対する評価と信用の源泉:民間企業による地域行政情報の発信と提供される情報に対する AHP, CVM ( C o n t i n g e n tV a l u a t i o nMethod:仮想市場法),およびコンジョイント分析の手法を応用した住民評価. 本稿の目的である「地域ポータルサイトの運営組織に求められる要件」と「運営組織が信用されるための 要因」に関する住民評価については,文献調査の結果から,前者には, b. 人的資源や資金力などの組織力, 活動している公共性, うわさ c. 組織力, a. 組織の持っている情報技術力, c. 社会から信頼されている組織の信用, 巴.日頃活発に活動している活力,の 5要件を,後者には, d. 権威, 巴.認知度, f . 対応力, g. 過去の実績, d. 社会貢献などを目的に a. 信滋性, b. 評判・ h. 継続性,の 8要因を挙げ (藤田・有馬 ( 2 0 0 8 )),盛・鈴木 ( 2 0 0 1 ) が提案した「相対位置評価法」による AHPの評価要因のウェイト ‑ 2 4 4・

238.

a 組織が持ってしも情報技術力 b 人的資源や資金力などの組織力 c 社会から信頼されてしも組織の信用 d 社会貢献などを目的に活動している公共性 e 日頃活発に活動している活力 ) 即こ(高い評価から低い順に)並べてください。 上記 a から e のアルファベットで、重要と思う1 順位籍 ll位(1∞点) I 2位 I 3位 I │ I I 4位 I5 位 ( 0 点) I I 次に、回答例を参考にし、その順位に点数をつけた(相対的な)イ立置づけをして、下の棒線に ↑でマークしてください。その↑の下に項目 aから eのアルファベットを記述してください。 1 0 0点 高 90 80 70 l I I 1 60 50点 40 30 20 1 0 0点 1 I 1 1 I I I 図 1 地域ポータルサイトの運営組織に求められる要件の重要度に関する設問(一部抜粋) 付け手法を適用して,各要件および各要因の重要度評価を試みた.本研究では,図 1に示すような設問で, 質問紙法による調査でも回答者が回答しやすいような工夫を施して調査を実施している. 2 0 0 2 ) ). なお,相対位置評価法による AHPの重要度評価は,以下の手順で実施される(盛他 ( 1 )被験者の意識構造の整理のために,評価要因を 1 ) 頃序尺度で順位付けさせる. 2 )最小評価値 0から最大評価値 1 0までの,長さ 1 0の数直線上で,各評価要因の重要度を相対的に考慮しな がら,各評価要因を数直線上に位置づけることで評価させる. 3 )各評価要因 iの位置データ djを測定する. 4 )測定された位置データから一対比較行列 (Pi j ) を作成し,この一対比較行列の固有ベクトルを求めて対応 する各属性の重要度とする.ただし, Pi j = (dj ‑ d j) +1 (iの順位ミ jの順位) Pij=l/ (‑ (dj‑dj) +1) (上記以外). 2 0 0 2 ) は,位置データの差に 1を加えているのは,同順位の場合には対応する要素が 0と ここで,盛他 ( なって,その固有ベクトルが 0となるのを防ぐとともに,既存評価法の一対比較における評価尺度の「同じ くらい重要=1J と同義になるからであるとしている.また,有馬 ( 2 0 0 9 ) は,相対位置評価法の拡張とし て,一対比較行列を作成する際に位置データの差をそのまま利用するのではなく,一対比較の評価尺度の「絶 . 8 を乗じることや,最大評価と最小評価の要因問で一対評価を行 対的重要 =9J と同義になるように差に 0 い,その結果を重要度のウェイト計算に利用するなどの方法を提案している.本研究では,評価軸となる数 0までではなく, 0点から 1 0 0点までとして,最小評価項目を 0点に,最大評価項目を 直線の目盛は 0から 1 1 0 0 点とした上で残る項目の相対位置評価を行うように求めた.これは,評価軸上の絶対位置情報が活用さ 0 0 (または 1 0 ),最小を 0として相対評価を行う方が回答者は回答しや れないのであれば,数直線の最大を 1 すいのではなし、かとの考えに基づくものである.しかし,この方法では,全ての項目が同順位の場合には相 対位置評価が不可能となるという問題を内包しており,この問題への対応は今後の課題となっている. 3. 調査結果とその考察 3. 1 回答者の偏り 2 0 0 5年の国勢調査によれば,伊丹市の総人口は 1 9 2, 250人(性別構成比:男性 49.0%,女性 51 .0%),世帯 2, 9 8 3である.調査票は伊丹市の広報紙に挟み込まれる形式で配布され,配布数は 78, 458票であった. 数は 7 426票で,回答率は 3.09%であった.郵送での回収の他に 郵送で返送されてきた調査票は 2, ‑ 2 4 5 ‑ 1つの自治会

239.

表 1 サンプルの構造 男性 総数 伊丹市調査 回 答 率 国勢調査 伊丹市調査 回答率 国勢調査 . 1 7 676 5 4, . 7 0 . 1 3 8 0 . 9 15~19歳 9, 096 5 1 2 1 0. 46 0 . 6 . 2 7 2 5 6 1 . 9 0 2, 5 . 5 3 3 2 . 5 4 1 2 4, 1 8 8 1 . 9 9 0 4 . 9 1 3 1 4 2 0歳 代 . 7 4 7 4 0 21 6, 1 2 4 1 0 . 9 0 .5 6 1 .2 5 2 1 1 9 . 8 6 1 3 3, 306 2 0 . 5 3 0歳代 . 9 8 0 6 2 1 0. 4 0 2, 5 . 3 1 1 8 1 .8 8 1 6 . 9 3 1 4 4 4 1 2 3, 673 1 4 . 6 4 0歳 代 .2 0 969 1 1 5 5 1 3 . 7 1 2, 6. .5 4 1 4 5 . 8 2 1 2 7, 009 1 415 1 6 . 6 5 0歳代 7 . 9 2 . 7 2 . 3 4 1 1, 6 1 0 1 4 . 7 3 1 6 2 2 4, 082 1 563 21 .4 6 2 6 0歳代 4 . 8 3 7 9 3 3 . 5 4 . 3 8 650 11 .0 . 5 6 8, 0, 938 1 537 20. 47 2 2 . 9 7 0歳以上 2 .4 3 総数 1 .6 21 7 8, 9 6 3 1 4 8 . 7 1, 1 3 3 4 3 . 2 1 2 . 6 2 3レ / 1 6 2, 2 9 2 1. . . . . . . . . . . . . . ~ 女性 伊丹市調査 回答率 国勢調査 420 5 . 0 9 4, . 3 4 0 . 3 0 . 8 2 1 1, 9 3 2 1 . 6 0 4 . 3 98 6 566 1 9 . 9 6 . 6 2. 40 1 6, 397 2 . 8 1 6 1 1 1 1 1, 3 . 9 3 2 6 21 .9 2 1 4, 040 1 7. 4 6 . 8 260 1 .9 8 472 1 5 . 0 247 1 6 . 6 1 1 2, 1 2, 288 1 0 . 6 1 .291 4 . 7 1 5 8 1 329 51 .7 9I 8 3, .3 1 , 4 9 0 1 5 6 . 8 1 表 2 べき乗法と Q R法によって推定された,組織に求められる要素と組織の信用に対する要因 ‑ ‑ ‑ ‑ ‑ ‑ ‑ 全体 有効回答者数 , 、 . 、 情報技術力 組織カ き 運 乗 信用 営 法 公共性 主 活カ 体 情報技術力 要 件 Q 組織カ R 信用 法 公共性 活力 有効回答者数 信懇性 評判・うわさ 、 ‑組織カ J 信 用 き 権威 乗 認知度 法 対応力 過去の実旗 の 源 継続性 信憲性 泉 評判・うわさ Q 組織カ 権威 R 法 認知度 対応力 過去の実皇賞 継続性 1 ,7 9 5 0.2269 0.1223 0.2797 0 . 2 1 4 8 O .1 5 5 8 0.2273 0.1227 0.2797 0 . 2 1 4 1 0 . 1 5 5 6 , 17 1 1 0.2304 0 . 0 9 6 7 0 . 0 7 0 8 O .0 7 4 3 0 . 0 8 5 5 O .1 7 1 3 0.1456 0.1255 0.2308 0.0970 0.0710 0.0744 0.0856 0.1714 0.1449 0.1248 年齢 性別 男 7 5 5 0 . 2 2 2 3 0.1274 0.2734 0.2224 0.1544 0 . 2 2 2 4 0.1276 0.2736 0 . 2 2 2 2 0 . 1 5 4 1 7 1 7 O .2 3 2 0 0 . 0 8 6 9 0 . 0 7 8 6 0 . 0 8 9 2 0 . 0 8 6 7 O .1 6 1 0 0 . 1 3 4 3 0 . 1 3 1 4 0 . 2 3 1 8 0 . 0 8 7 2 0 . 0 7 8 8 0.0896 0 . 0 8 6 9 0.1609 O .1 3 3 7 O .1 3 1 0 30 歳未満 女 , 10 2 9 1 2 1 0 . 2 3 1 0 0 . 1 1 8 9 0 . 2 8 4 3 0 . 2 0 8 0 0 . 1 5 6 8 0 . 2 3 0 9 0 . 1 1 9 1 0 . 2 8 4 2 0 . 2 0 8 1 0 . 1 5 6 7 9 8 4 0 . 2 3 0 4 0 . 1 0 4 2 0 . 0 6 5 0 0 . 0 6 3 3 0 . 0 8 4 2 0 . 1 7 9 1 0 . 1 5 3 0 0 . 1 2 0 7 0 . 2 3 0 1 0 . 1 0 4 1 0 . 0 6 5 4 0 . 0 6 3 4 O .0 8 4 6 0 . 1 7 9 1 0 . 1 5 3 0 0 . 1 2 0 3 0 . 2 1 1 2 0.1170 0.2766 0 . 1 9 4 2 0 . 2 0 1 1 0 . 2 1 1 2 O .1 1 6 8 0 . 2 7 6 7 0 . 1 9 4 2 0 . 2 0 1 0 1 1 8 0 . 2 3 2 1 0 . 1 2 8 1 O .0 5 8 3 O .0 6 0 6 0 . 1 1 0 0 0 . 1 7 4 6 0 . 1 3 2 7 O .1 0 3 5 0 . 2 3 1 7 O .1 2 8 3 0 . 0 5 9 5 0 . 0 6 0 7 0.1106 0 . 1 7 4 2 0 . 1 3 1 9 0 . 1 0 3 1 30 歳代 4 3 2 O .2 2 7 9 0 . 1 2 4 5 0.2812 0.1925 0.1740 O .2 2 7 8 0 . 1 2 4 5 0 . 2 8 1 1 0 . 1 9 2 8 0.1738 423 0 . 2 4 2 1 0.1228 0.0563 0 . 0 5 4 9 0.0934 0.1697 0 . 1 4 3 8 0.1170 0.2419 0 . 1 2 2 8 0 . 0 5 6 5 0 . 0 5 5 1 0.0938 0.1697 0.1439 0.1163 40 歳代 377 0.2478 0.1176 0.2740 0.2018 0.1589 0 . 2 4 7 2 0.1178 O .2 7 2 7 0.2017 O .1 5 8 0 3 6 6 0.2319 0.1017 O .0 7 0 7 0 . 0 7 0 1 O .0 8 6 6 0 . 1 6 6 1 O .1 5 6 3 O .1 1 6 5 O .2 3 2 2 O .1 0 1 8 0.0710 O .0 7 0 3 O .0 8 6 7 0.1662 0.1558 0.1159 60 歳以上 50 歳代 309 554 0.2239 0.2168 0.1225 0.1268 O .2 7 9 5 O .2 8 3 5 0.2263 0.2388 0.1403 O .1 3 8 4 0 . 2 2 5 1 0 . 2 1 8 1 0.1275 O .1 2 3 3 O .2 8 3 5 0.2808 O .2 3 7 2 0.2258 0.1379 0.1408 2 9 1 5 1 1 0.2285 0.2213 0.0817 0 . 0 7 3 1 0.0763 0.0828 0.0792 0.0935 0.0822 0.0743 0.1740 0.1739 0.1426 0.1445 0.1337 0.1385 0.2277 O .2 2 2 3 0.0819 0.0734 0.0766 0.0830 0.0798 0 . 0 9 4 1 0.0817 0.0745 0.1740 O .1 7 3 9 0.1445 0.1409 0.1339 0.1379 と伊丹市商工会議所を通じて 2 5 5票の調査票を回収しており,これを加えると総回収票数は 2, 6 8 1票で回収 4 2%となり,そのうちの有効回答は 2, 6 2 3票であり,有効回答率は 3.34%で与あった. 率は 3. サンプルの構造は表 1に示す通りであり,回答者の性別では,男性が 43.2%,女性が 56.8%であり,回答 0歳未 者には女性への若干の偏りが見られる.また,年齢では,世帯を対象とした調査であるため,男性は 3 満の回答者の比率が低い一方で 60歳代以上の比率が高く,女性は男性と同様に 3 0歳未満の比率は低いが, 30歳代と 40歳代で回答者の比率が高いとしづ特徴が見られる. 3 . 2 AHPによる要件・要因の重要度のウェイトの推定結果の属性別平均値 「地域ポータルサイトの運営組織に求められる要件」に関する設問に対する回答数は 1 , 7 9 5 (有効回答数の 67.0%), I 運営組織が信用されるための要因」に関する設聞に対する回答は 1 , 7 1 1( 同 63.8%) であり,べき 乗法ならび QR法と逆反復法を用いて AHPの相対位置評価法による要件・要因の重要度のウェイトの推定結 果の属性別平均値をまとめたものが表 2である.べき乗法と QR法による要件・要因の重要度のウェイトの ‑ 2 4 6 ‑

240.
[beta]
推定結果の差は,運営主体要件における 7
0歳以上の「公共性」で最大の 0
.
0
0
1
6となる.このような推定結
果の差のために,男性の運営主体要件の推定結果において. 2つの推定方法の問で「情報技術力」と「公共

.
0
0
0
1から 0
.
0
0
0
2であり,推定結
性」の順位が入れ替わってしまうが[情報技術力」と「公共性」の差は 0
果は同値と考えて問題はないと思われる.

1
言用」が 1
表 2から,行政情報を提供する地域ポータルサイトの運営主体に対して住民が求める要件は. [
位で,次いで「情報技術力J.そして「公共性」となっており. [活力」や「組織力」はあまり重要視されて
いないことがわかる.この評価は性別では大きな差はないが,年齢では,年齢が若くなるほど「活力」を重
視し. 3
0歳未満では「公共性」よりも「活力」が重視視されており. 5
0歳代以上では「公共性」が「信用」
に次いで重要視されるなど,重要度の評価に若干の違いが現れている.一方,地域ポータルサイトの運営組
織に対する「信用」を形成する要因,すなわち「信用」の源泉については,性別・年齢別の全ての属性に亘
って. [そのウェブサイトから得られる情報に,間違いがなさそうである」という「信渡性」が最も重要な要
因であり. [問題が起こったときに対応が早そうである」という「対応力」が「信溶性」に次いで重要な要因
であると評価されている.何よりも提供される情報の正確性や精度が重要で,誤った情報提供の可能性に対
しては迅速な対応が図られることが「信用」の源泉であるといえよう.これら 2つに続く要因としては,現
. [評判・うわさ」が挙がっており. [認知度 J
.
在および将来の信用・保証の根拠となる「実績J. [継続'性 J

「権威 J
. [組織力」は他の要因と比較して「信用」の源泉としては評価されていないことが明らかとなった.

3
. 3 重回帰分析によるポータルサイト運営組織に求められる要件と組織の信用の推定
官民連携の地域ポータルサイトの運営組織に求められる要件ならびに組織の信用の源泉の評価の違いがど
のような要因によってもたらされているかを把握するために. AHPによって推定された各回答者の要件・要
因の重要度のウェイトを被説明変数,インターネットの利用歴なども含めた回答者の個人的属性を説明変数

. 推定結果は表 4と表 5に示す通りである.
とする重回帰分析を試みた.サンプルの構造は表 3
分析では,年齢における [15~19 歳」と職業における「学生」のサンプル数が少なかったため,年齢では

[
3
0歳未満」として一括りに,職業では「学生」と「その他」を一括りとしてパラメータの推定を行ってい
3
0歳未満」を,職業は「会社員」を,インターネ
る.なお,分析に際しては,性別は「女性」を,年齢は [
ット利用は「利用しなしリを,インターネット上での商品取引経験・希望は「経験なし・希望なし」を基準
に計測しており,基準となっている属性水準の係数は Oに固定されている.
表 4からは,年代が高くなるにつれて「活力」の重要度評価が有意に低くなり[公共性」の重要度評価は
逆に高くなる傾向 (
6
0歳代以上では 5 %水準で有意)があること. 4
0歳代は「情報技術力」を他の年代と比
較して高く評価する傾向のあること,職業では公務員が会社員と比較して活力の重要度評価が低い代わりに
信用の重要度評価が高いこと,商工自営業者と専門的職業従事者は組織力への評価が低いこと,インターネ
表 3 重回帰分析の適用対象となったサンプルの構造
同策
1̲̲̲̲I選 対 主 体 要 件 i 併 用 の 採 象
にご
l伊 丹 羽 焚
「
、、̲ 1
"'"-~ 1
.
.
"プル敏j(i!n
写""ザJ プ ル 歎 l
回答.
.
日 白

公務 R

1
3
7

団 体 面R

"
'
"

専門的機業
全社縄常喜

1
0

商工山常

Ii~

H山Ji
点事司手足

5
1

情聴・乍生

その他

0
/
.
1

5
6
5
680
1
7匂

"

2
.
6時i

Jl)~

.
1701

リ9

1~1

1
1自

時
ゎ l

I!
i:
!
5
1H
白3
16
8
.
1
~9 1 7
2
.
8
~S 1 7
1
1,
0
1
I
1 ;
;
9
.
1
35168.6
100170.8
3
回:>1.5
~Ô

3
2,168.3
2613:l
.
J
7
.
0

1
.
,
日5

。

247・

ー

23160.5
571.0.1
2716..5
36152.2
351 f
渇b
388168.;
3271.¥宵 I
:W51 6
3
.
7
2
5I :\~.1
I:
l討
,
7
1
1 i
1

241.
[beta]
ット上での商品取引の経験の有無と今後の取引の希望の有無では,経験も今後の希望もない回答者と比較し
て,経験はあるが今後の希望はない回答者は情報技術力の評価が低く,経験があって今後も取引を希望する
回答者は公共性への評価が低いとし、う特徴が明らかにされている.
一方,表 5からは,①男女で比較すると,男性は女性よりも「権威」と「認知度」を重要視し,逆に女性
は男性よりも「対応力 Jと「過去の実績 Jを重要視していること,②年齢では,年齢が高くなるにつれて「評
組織力J. I
権威 J
.I
過去の実績 J
.I
継続性」の
判・うわさ」と「認知度」の重要度評価が低くなる一方で. I
有意
評価が高くなる傾向があること,③職業では,会社員と比較して「権威」に対する公務員の評価が 1%
水準でプラスで有意であるのに対して,専門的職業従事者は 10%水準ではあるがマイナスで有意となってい
組織力」と「認知度」の評価が 5 %水準でプラスで有意であり. I
過去の実績」の
ること,自由業従事者は. I
評価が 1%
水準でマイナスで有意であること,④インターネットの利用状況別では,非利用者と比較して利
用者の「信想性」に対する評価が 1%
水準でプラスで有意であること,⑤インターネット上での商品取引経

表 4 運営主体要件に対する重回帰分析適用結果
山首i
法問ノJ
組織力
公共性
ぶ用
日由 l止調't'~ (
汗
決
定 f,{;坑
0
.
0
0
8
0
.
0
0
2
0
.
0
1
5
0
.
0
0
3
担
F
:
i
t
"W
'
I

項

位
百1
'
年齢

l
;E
Jどl
t
l
'
l
,

,

切
!
,

0
.
2
0
0•••

l4
・
.
.
0
.1

リ
j

0
.
0
1
0

3
0
i
主
,1¥
40
歳
代

0
.
0
1
6
0
.
0
3
5••

50
議
代
60
歳
以
上

0
.
0
1
4
0
.
0
0
6

j
内
包
;
三1
1
1
'
(

住逗削

活力

0
.
0
1
9

昇
長
,
竜
三 f[l[

0
.
2
6
2
・
・
・

0
.
2
2
2
・
・

0
.
0
0
3
0
.
0
0
7

‑
0
.
0
0
8

0
.
0
0
1

0
.
0
1
6・

0
.
0
0
7

0
.
0
0
6

0
.
0
2
4・

0
.
0
0
2

0
.
0
0
1

0
.
0
0
3

0
.
0
1
0
0
.
0
0
1

0
.
0
0
7
0
.
0
2
0

0
.
0
2
5
0
.
0
4
0・
・
‑
0
.
0
1
4

‑0.
0
4
0
0
.
0
6
0
・
.
.

0
.
2
0
2•••

…

‑0.
0
6
8

0
.
0
3
9
・
.
.
公
務d
0
.
0
0
2
0
.
0
1
6
0
.
0
3
6
団体議員
0
.
0
3
2
0
.
0
0
8
0
.
0
4
1
0
.
0
2
2
0
.
0
2
4
専門的職業
0
.
0
1
4
0
.
0
3
3・
・
0
.
0
1
5
0
.
0
0
1
0
.
0
1
4
会
干
上
経
営
者
0
.
0
1
1
0
.
0
0
2
0
.
0
2
8
0
.
0
1
0
0
.
0
0
9
1
r
百
工
自
世
0
.
0
0
4
‑
0
.
0
4
3・
・
0
.
0
2
6
0
.
0
0
3
0
.
0
1
1
職
業
自
由
業
0
.
0
2
5
0
.
0
3
3
0
.
0
1
0
0
.
0
1
0
0
.
0
1
1
京事専業
‑
0
.
0
1
3
‑
0
.
0
0
8
0
.
0
1
7
0
.
0
0
2
0
.
0
0
3
盤
職
0
.
0
1
8
0
.
0
0
1
0
.
0
2
0
0
.
0
0
6
0
.
0
0
9
0
.
0
2
1•
0
.
0
0
8
‑
0
.
0
0
8
学生・その他
0
.
0
1
3
0
.
0
0
8
0
.
0
1
2
0
.
0
0
7
0
.
0
1
0
I
I
I
J
‑
.
,
る
0
.
0
0
1
0
.
0
0
4
イ
ン
タ ネ
ッ
ト I
'
H] "
経験出し守後あり
イ
ン
タ ネ
ッ
ト
0
.
0
0
1
0
.
0
0
9
0
.
0
0
3
0
.
0
0
7
0
.
0
0
7
上
で
の
0
.
0
1
0
0
.
0
1
6・
0
.
0
0
1
0
.
0
0
6
0
.
0
0
2
商品取引 経験有り今後も継続
0
.
0
4
4••
0
.
0
0
9
0
.
0
1
1
0
.
0
2
5
0
.
0
0
2
経験・希望 経験有り継続盤し
注)表中の紳 *1立川有意水準で,林{立5略有意水準で, *1立10'偽有意水準で係数推定値が有意であることを示す.
→

自由度調忠清決定1守
主
.rl~

υ
'
J)
i
でt
g
'
l

~J

30斎~~定夜
f
t
年齢

職
業

40
50
歳
代
60
段以上

t
l頁
公
団
務
夜
夜
専門的職業
会社経営者
商工自営
自
由
業
:主'~専業

表 5 信用の源泉に対する重回帰分析適用結果
f
育
也
:
,tl 評
判
・
う
わ
さ 組織力
権威
認
知
度
対応力
0
.
0
1
8
t
.
K
i
E
f
u
'
[
0
.
2
0
2•••
0
.
0
0
0
0
.
0
1
0
0
.
0
0
3
0
.
0
0
4
0
.
0
0
1
0
.
0
0
6
0
.
0
2
8
0
.
0
0
9
0
.
0
3
0
0
.
0
3
5
0
.
0
0
2
0
.
0
1
0
0
.
0
0
1

0
.
0
6
2

0
.
0
2
8

0
.
0
4
5

推定制

推
定
制
括
主
定
印
"
0
.
0
6
1・
.
. 0.061・
.
.
1
2
3・
0
.
0
1
9
・
.
.
0
.
0
0
3
0
.
0
0
5

。

‑
0
.
0
0
3

‑
0
.
0
0
1

・
・
0
.
0
2
3・

0
.
0
1
2

0
.
0
0
9

0
.
0
1
4・
0
1
5・

0
.
0
1
2
0
.
0
2
0・
・
・
.
.
0
.
0
1
7

‑
0.
0
'
1
2日
・

0
.
0
5
3
・
・
・
0
.
0
0
9
0
.
0
2
2
0
.
0
0
6
0
.
0
0
7
0
.
0
2
0
‑0.
0
1
3
0
.
0
0
8
0
.
0
0
0
0
.
0
0
7

。

0
.
0
0
8
0
.
0
0
0
0
.
0
1
3
0
.
0
0
4
0
.
0
0
3
0
.
0
2
7••
‑
0.
0
0
5

0
.
0
0
7

0
.
0
1
3
0
.
0
2
0・
0
.
0
1
7
0
.
0
1
0
0
.
0
0
1
0
.
0
0
6

0
.
0
1
6
仇
推
定1
0
.
1
1
5
・
.
.
0
.
0
0
8・
0
.
0
1
7••

・
.
.
0
.
0
2
5
0
.
0
3
2
・
.
.
0
.
0
4
5
・
・
・
0
.
0
0
3
0
.
0
1
0
0
.
0
0
5
0
.
0
0
1
0
.
0
0
1
0
.
0
2
9••
0
.
0
0
2
0
.
0
0
3
ー0
.
0
0
2

0
.
0
1
1
十
1
E定1
,
(
[
0
.
1
8
6
・
.
.
‑
0
.
0
1
9
・
.
.
0
.
0
0
3
0
.
0
0
8

。

‑
2
4
8
‑

継続性

0
.
0
1
2

0
.
0
1
5

従
定i
直
│
位
定
直
0
.
1
3
6
・
.
.
1
1
7
・
.
.

。

‑0.
0
1
7•••

0
.
0
0
0

0
.
0
1
1
0
.
0
2
3••

0
.
0
1
0

0
.
0
0
2
0
.
0
1
1
0
.
0
1
1
0
.
0
0
7
0
.
0
1
6
0
.
0
0
4
0
.
0
2
1
0
.
0
1
7

0
.
0
0
6
0
.
0
1
6
0
.
0
2
2
0
.
0
1
3

0
.
0
0
4
‑0.
0
0
9

0
.
0
0
3
‑0.
0
0
6

無
職
0
.
0
1
0
0
.
0
0
3
0
.
0
0
5
学生・その他
0
.
0
1
2
0
.
0
0
6
0
.
0
0
6
0
.
0
3
4
・
.
.
インタ下付利 1
]
;
1和
│1!
l1
す
る
‑0.
0
0
8
0
.
0
0
1
0
.
0
0
5
0
.
0
0
5
0
.
0
0
4
経験鰐し守後あり
0
1
4・
イ
ン
タ 字
ッ
ト
0
.
0
0
4
0
.
0
0
4
0
.
0
0
4
0
.
0
0
3
0
.
0
1
4
上
で
の 経験有り今後も継続
0
.
0
0
0
0
.
0
0
8
0
.
0
0
8
0
.
0
0
6
‑
0.
0
0
7・
0
.
0
0
6
商品取引
0
1
6
0
.
0
1
7
‑
0
.
0
0
1
0
.
0
1
1
0
.
0
1
2
0
.
0
0
3
経
験
・
希
望 経験有り継続睡し
注)表中の輔叫土 l也有意水準で,柿{土5也有意水準で.判土 10司有意水準で係数推定値が有意であることを示す.

。

過去の実績

0
.
0
1
6
0
.
0
2
2••

l
0
.
01
0
.
0
4
5•••

0
.
0
1
0
0
.
0
2
6・
・

・
0
.
0
3
0・
‑
0.
0
0
2
0
.
0
0
1
0
.
0
1
5
0
.
0
1
9
0
.
0
1
0
0
.
0
1
9
‑0.
0
0
4
‑0.
0
0
1

0
.
0
0
3
‑0.
0
0
4
0
.
0
0
4

‑0.
0
1
1

0
.
0
0
6

0
.
0
0
2

‑
0
.
0
0
8

0
.
0
1
2

‑0.
0
0
9

0
.
0
1
1

242.

験と今後の希望に関しての分類では,経験も希望もない回答者と比較して,経験はないが今後の取引を希望 する回答者は「評判・うわさ」の評価が 10%水準でプラスで有意であり,経験ありで取引を継続したいとの 回答者は「組織力」の評価が 10%水準で、マイナスで有意であること,などの特徴的な結果が示されている. 4. おわりに 自治体の行政情報を民間情報とセットにして地域ポータルサイトを介して情報マーケットで提供するにあ たって,地域ポータルサイトの運営組織に求められる要件と信用の源泉を AHPの定量評価手法を援用して明 らかにし,求められた重要度を被説明変数,インターネットの利用歴なども含めた回答者の個人的属性を説 明変数として重回帰分析を適用した.また, AHPの定量評価法を適用するに際して, SAS上で一貫して分析 が行えるように,一対比較行列から固有ベクトルを求めるためのプログラムを開発した.本稿での AHPを適 用する分析例と付録で示す SASプログラムが, SASユーザーがマーケテイング調査や住民意識調査によるデ ータ解析から有効な情報を引き出そうとする際の参考になれば幸いである. 謝辞 本研究は,平成 1 9年度兵庫県立大学特別教育研究助成金ならびに平成 1 9年度大手前大学特別研究費の助 成を受けて実施したものである.また, SAS 上での AHP を適用した回答データの分析は,平成 21~ 平成 23 年度科学研究費補助金基盤研究 ( C ) I 住民評価に基づく地域ポータルサイトの信用の源泉と行政情報の持つ 価値に関する研究 J (課題番号:21530357) の研究の一環として行ったものである.調査の実施にあたっては 伊丹市民の皆様からのご協力をいただくとともに,調査票配布に際しては,伊丹市のご協力で広報紙と同時 配布の便宜を図っていただき,伊丹市内の全世帯に配布することができた.また, SASプログラムの作成に あたっては,兵庫県立大学神戸学園都市学術情報館の周防節雄教授から貴重な示唆をいただいた.これらの ご協力・ご支援に深く感謝申し上げます. 参考文献 有馬昌宏 ( 2 0 0 9 ), I 質問紙調査における相対位置評価法による AHPの適用 課題と可能性 J,~日本オベレー ションズ・リサーチ学会 2009年春季研究発表会アブストラク卜集Jl. pp.104 ・1 0 5 . 有馬昌宏・藤田昌弘 ( 2 0 0 9 ), I 官民情報を提供する地域ポータルサイトの運営組織に求められる要件 意識調査に基づく信用の観点からの基礎的分析 住民 J,~日本情報経営学会第 58 回全国大会予稿集(春号)j], p p . 9 5・9 8 . 藤田昌弘・有馬昌宏 ( 2 0 0 8 ), I 情報マーケットを通じた行政情報提供のあり方と提供機関の信用形成の源泉 一住民意識調査による評価 J, ~日本情報経営学会第 56 回全国大会予稿集j], p p . 1 5 7・ 1 6 0 . t a, MasahiroandAr imaMasahiro ( 2 0 0 9 ) ,R e s i d e n t s 'E v a 1 u a t i o no f C o n t e n t sandP r o v i d e r sofLoca1P o r t a 1S i t e ", F吋i P r o c e e d i n g sofAsiaP a c i f i cC o n f e r e n c eonI n f o r m a t i o nManagement2009, p p . 2 6 1・2 6 9 . 峯村吉泰 ( 2 0 0 6 ), ~Java で学ぶシミュレーションの基礎Jl.森北出版. 盛亜也子・鈴木聡士 ( 2 0 0 1 ) .I AHPにおける相対位置評価法に関する研究 J, ~土木計画学研究論文集Jl. Vo1 . l8,No.l,p p . 1 2 9・1 3 9 . 盛亜也子・鈴木聡士・鈴木克典・五十嵐日出夫 ( 2 0 0 2 ) ,I 相対位置評価法による商業地域の評価と地域特性 の比較分析 J, ~地域学研究Jl.第 32 巻第 1 号, p p . 3 2 33 3 6 . 暢 ‑249・

243.

付録 べき乗法と Q R法で最大固有値と固有ベクトルを求めるプログラム 以下に示すのは,べき乗法と QRI:去を用いて行列の最大固有値と固有ベクトルを求める S A Sプログラムである.プロ グラムの作成に当たっては峯村 ( 2 0 0 6 ) を参考にした.ヤコビJ 去を用いたプログラムの作成も行ったが,紙面の関係上, ASデータ 割愛する.本プログラムを実行するためには,付図 1に例示するような列ごとに各項目の評価が羅列された S セット ( a h p ̲ d a t a & n ) を,事前 i こ" C : ¥S A S "下に作成しておく必要がある. ( d a t a 4 )e ( d a t a 5 ) ( d a t a 2 )c ( d a t a 3 )d ( d a t a 1) b OBS a 2 0 1 0 0 6 0 4 0 8 0 4 0 5 0 1 0 0 2 0 2 。 1 0 0 付図, 2 0 3 0 5 0 1 0 0 。 1 I J ごとに各項目の評価が羅列されたデータテーブル 1 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 1 1 * 最大固有値を求めるべき乗法による計算 * 1 ファイル名 P o w e r .s a s * 1 1 * 材 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 1 1 * * o p t i o n sn o c e n t e rn o d a t en o n u m b e r : 1 * * 材 * 最大固有値を求めるべき乗法の副関数料材料材料*材*材料料材料材料材料 * 1 5 =収束せず 9 二異常 * 1 1 * status: 0ニ正常 1 * 入 力 : a[ nxn ]二係数行列. b[ n ]=右辺ベクトル * 1 x[ N ]ニ固有ベクトル * 1 1 * 出 力 : 1ambda=固 有 値 材*************材* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 1 1 * * * * * * * * * * * * * * * * * * * * 百l e tn = 5 : 1 *元数 * 1 百l e tm a x ニ1 0 0 : 1 *反 復 回 数* 1 百l e tT O L 斗. O e ‑ 1 0 : 1 i b n a m e folder"C平S A S " : d a t af o l d e r . e i g e n v a l u e & n : s e tf o l d e r . a h p ̲ d a t a & n : k e e py 1 ‑ y & nl a m b d a : a r r a ya( & n .& n ): a r r a yx ( & n ) : a rr a yy( & n ): a rr a yd a t a( & n ): 1 * * * * *入 力 デ ー タ か ら 一 対 比 較 行 列 を 作 成 す る 材 料* 1 D oi = lt o& n : t e m p ̲ x二d a t a{ i }: D oj = lt o& n : j }: t e m p ̲ y = d a t a{ a { i .j } = a b s ( t e m p ̲ x ‑ t e m p ̲ y ) * 8 / 1 0 0 + 1 : ‑ 2 5 0・

244.

1 *最大値と最小値の差が8になるよう調整するため 8 / 1 0 0をかける * 1 l f temp̲x‑temp̲y く othen a[i.j}= l I a [ i .j } ; e n d ; e n d ; 1 *材 料 最 大 固 有 値 と 固 有 ベ ク ト ル を 求 め る * 料* * 1 s t a t u s=9 ; k=0 ; m a x i二 0 ; maxmuニ 0 . 0 ; weight̲bunbo=O.O; ニ1t o& n ; x[ i }二 0 . 0 ;e n d ;x [ l } = 1 . 0 ; 0 0i e (k く& m a x& &s t a t u sニ9); 0 0w hiI k = k + 1; ニ1t o& n ; 0 0i sumニ 0 . 0 ; 0 0j = lt o& n ; sum+a [ i .j } * x [ j } ;e n d ; u m ; y [ i }ニ s e n d ; a x m u ; o l d m u二 m o l d i =m a x i ; m a x m uニ 0 . 0 ; 0 0i = lt o& n ; a b s ( m a x m u )t h e nd o maxmu = y [ i } ; m a x i=i ;e n d ; i fa b s ( y [ i } )> e n d ; s e x[ i } = y[ i } I m a x m u ; end; 0 0i = 1t o& n ; i fmaxmu=O t h e n x[ i } =. ' eI 二 a b s( m a x m u )* 品T O L& &m a x i =o l d i then status= 0 ; i fa b s ( m a x m u ‑ o l d m u )く e n d ; t a t u s =5 ; i f k=品maxthen s l a m b d a二 m a x m u ; 1 * * * * *ウェイトを求める * * * * * 1 0 0i = lt o& n ;w e i g h t ̲ b u n b o + x [ i } ;e n d ; E0 then y[i}=x[i}/weight̲bunbo; e n d ; 0 0i = lt o& n ;i f weight̲bunbo N r u n ; 1 *材料材料材料材料材料*料*****料* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 1 1 * OR法で最大固有値を算出し,逆反復法で最大固有値の固有ベクトルを求める計算 * 1 ファイ jレ名 O R .s a s * 1 1 * 材料材料材料材料材料材料材料材料柿* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 1 1 * * * * * * * * * * * * * * * * * * * * o p t i o n sn o c e n t e rn o d a t en o n u m b e r ; 1 * 材料最大固有値を求めるO R法の副関数柿*****************材料林材料材料材料材料材料* 1 戻り値(エラーコード) : 0 二正常 1 * 入力 a [ nxn ] =係数行列 1 * 出力 l a m b d a d =固有値, 5 ニ収束せず y[N]=固有ベクトル 9 = 異常 JJ'J/// * ** 1 * 1 * * * * * * * * * * * * * * * * 材料材料材料材料材料材料材料材料材料 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 1 百l e tn ニ5 ; 1 *元数 * 1 ‑ 2 5 1・

245.
[beta]
1
*元数の 2乗*
1
1
*反復回数*
1

協l
e
t nn
=
2
5
;

国l
e
tmax二 1
0
0
;
協l
e
tTOL
斗

O
e
‑
6
;

Iibname folder "
C
:平S
A
S
"
;
data folder.eigenvalue;
set folder.ahp̲data;
keep key2 y1‑y5 l
a
m
b
d
a
;
array a(品n
.
&
n
);

array b品
(n
.&
n
);

array v(品n
)
;

array p(品n
);

array order品
(n
);

array eigvec{&n.&n};

array pb(
&
n
);

array q品
(n
̲
n
);

array w(品n
);

array data(&n);

array y(品n
);

a
rr
a
yI
ambdad品n
( );

1
*
*
*
*
*入力データから一対比較行夢J
Iを 作 成 す る 材 料*
1
00 i
=
1 to &
n
; temp̲x=data{i};
00 j
二 1t
o&
n
;
temp̲y
ニd
ata{
j
};
a
{
i
.j}=abs(temp̲x‑temp̲y)*8/100+1;

1
*最大値と最小値の差が8になるよう調整するため 8
/
1
0
0をかける *
1
I
f temp̲x‑temp̲y

<0 then a{i.j} 1/a{i.j};
二

e
n
d
;
e
n
d
;

1
***オリジナルをコピー神神*
1
00 i
=
1 to &
n
; 00 j
=
1 to &
n
;b
{
i
.j
}
=
a
{
i
.j
}
;e
n
d
;e
n
d
;

1
*
*
*
*
*Householder変 換 材 料*
1
statusニ9
;c
t
=
O
; weight̲bunbo二 0.0;
00 k
=
1 to &n‑2;
00 i
=
1 to k
+
1
; v{i}=O.O; e
n
d
; 00 i
=
k
+
1 to &
n
; v{i}=a{i.k}; e
n
d
;

1
**変換行列 Hの構築*
*
*
*
1
sum=O.O; 00 i
=
k
+
1 to &
n
; sum+v{i}*v{i}; e
n
d
; sigma
ニs
qrt(
s
u
m
);
i
f abs(
s
u
m
) >ニ品TOLthen d
o
:
i
fv
{
k
+
1
}

<0 then sigma=sigm酔(一 1.0);

.
0
/
(
s
i
g
m
a判 {k+1});
v{k+1}=v{k+1}+sigma: alpha = 1

1
*
料 相 似 変 換 柿*
1
00 i
ニ1t
o&
n
; p{i}=O.O: pb{i}=O.O;
00 j
=
k
+
1 to &
n
;p
{
i
} +alpha旬 {
i
.j
}判{j}; pb{i}+alpha句{j.i
}判{j}; e
n
d
;
e
n
d
;
rb=O.O;
00 i
ニk
+
1 to &
n
;r
b
+
v
{
i
}叩 b
{
i
}
:e
n
d
:0
0i
=
1t
o&
n
: p{i}=p{i}‑alpha*rb判 {
i
}
:e
n
d
:
00 i
=
1 to &
n
: 00 j
=
1 to &
n
; a{i.j}=a{i.j}一(
v{
i
}
*pb{
j
}+p{i
}
*v{
j
})
; end; end;
e
n
d
;
e
n
d
;

‑252・

246.

/***料 Q Rメソッド*****/ D ok = Ot o& n ‑ 1 ;m ニ 品n ‑ k ; D ow hi I e(s t a t u s=9); i fa b s( a{ m .m ‑l})く=品T O Lt h e ns t a t u s = O ; m u=a{ m .m } ;D oi = 1t om ; a{ . ii }ニa{ i .i }‑ m u ;e n d ; *原点移動; /料** G i v e n s行列*柿本/ D o i1t om 町; q{ i }ニ0 . 0 ;e n d ;D oi = lt om ;q { m * ( i ‑ 1 ) + i } = 1 . 0 ;e n d ; D oi = lt om ‑ 1 ; 二 s u m = a{ . ii }* a{ . ii }+ a{ i + 1 .i }* a{ i + 1 .i } ;s u mニs q r t( s u m ); O Lt h e nd o ;s i n x = O . O ;c o s x = O . O ; 巴n d ; i fa b s( s u m ) く品 T { i + 1 .i } / s u m ;c o s x = a { i .i } / s u m ;e n d ; e l s ed o ;s i n xa /柿本Q Rd e c o m p o s i t i o n料*/ 二 D oj = i + 1t om ; { i .j } * c o s x + a { i + 1 .j }村 i n x ;a { i + 1 . j }ニ ー a{ i .j }村 i n x + a { i + 1 .j } * c o s x ; a aa 二 a{ i .j }= a a ; n d ; 巴 a { i .i } = s u m ;a { i + 1 .i } = O . O ; D ojot om ‑ 1 ; 二 a a = q{ m *j +i }c o s x + q { m吋+i + 1 }* si n x ;q{ m吋+ i + 1 } = ‑ q { mj +i }均 i n x + q { m吋+i + 1 }* c o s x ; 本 本 i } = a a ; q { m吋 + n d ;e n d ; 巴 D oi = lt om ; om ;w { j } = a { i .j } ;e n d ; D ojit 二 刊 { I }刊 { m * ( 1ー l ) + j } ;e n d ;a { i .j } = s u m ;e n d ; D oj = lt om ;s u m = O . O ;D oI = it om ;s u m = s u n e n d ; 巴n d ;c t + 1 ;i fc t= >& ma xt h e ns t a t u s = 5 ; D oi = 1t om ; a{ . ii }= a{ . ii }+ m u; n d ; k + 1 ;e n d ; 巴 /本材料対角成分を降i l 頂に並べ替え,固有値を l a m b d a dに保存材料*/ / 本 l a m b d a dには 5 つの固有ベクトルが降i l 頂に入力されている 本/ D oi = lt o& n ‑ 1 ;D oj = i + 1t o& n ; j .j }t h e nd o ;t 巴m p=a{ . ii } ; a{ . ii } =a{ j .j } ; a{ j .j } =t e m p;巴 n d ; i fa{ i .i } く a{ d ; e n d ; 巴n ニ1t o& n ;I a m b d a d{ iニ }a{ i .i }; 巴n d ; D oi D oi = lt o& n ;D oj = lt o& n ; 巴i g v e c{ i .j }ニ0 . 0 ; 巴n d ; 巴n d ; D oi n d e x = lt o& n ; O Lt h e nd o ; i fl a m b d a d { i n d e x } >品T /叫をオリジナルの状態に戻す*/ 2 5 3 ' ー

247.

Do i = l to & n : Do j = l to & n :a [ i,j }ニb[ i ,j } :e n d :e n d : /本入力対称行列の対角成分から固有値を減算する本/ Do i = 1 to & n : a[ i ,i }=a[ i ,i }‑ 1ambdad[i ndex}: e n d : /**柿 L U分 解 材 料 / Do i = l to & n : order[i} = i :e n d : Do i = l to &n‑1: d二 i : maxmニ abs( a[ i,i } ): < j [ i } ) thend o : d= j : maxm= abs(a, j [ i } ) :e n d :巴n d : Do j = i + 1 to& n :i fmaxm abs(a, i f d NE ithen d o : temp = order[ i } : order[ i } = order[ d } : order[ d } ニ temp: Do j = l to & n : temp = a [ i, j } :a [ i, j } = a[d, j ] : a[d, j ] 二 temp: e n d : e n d : 二 i + 1 to & n : Do j a[ j , i } ニ a, j [ i }/a[ i ,i }:Dok ニi + 1to& n : a, j [k } =a, j [ k}‑a[j,i}*a[i, k }: e n d : e n d : e n d : /本料対角成分のうち最小の値を求める林*/ valuemin=abs(a[l,1 } ) : mini=l: > Do i =2to& n ;i fva1uemi n abs( a[ i,i } ) thend o : va1uemi n=abs( a[ i,i } ):mi ni =i :e n d :e n d : dotproduct = 0.0: Do i = 品nto 1 by ‑ 1 : sum ニ0 .0; Do j= 品nto iby ‑ 1 : sumニsum+a[ i, j }*ei gvec[ j , i ndex}: e n d ; i fi = m i n i then d o ; ei gvec[ i,i n d e x }= 1 .0: dotproduct + eigvec[ i,i n d e x }拘 i gvec[i ,i n d e x }: e n d : else d o : ,i } )< 品 TOLthen ei gvec[ i,i n d e x }=ei gvec[i ,i n d e x }: i f abs( a[ i 巴I s e eigvec[i,index}=eigvec[i,index}‑sum/a[i,i } : dotproduct=dotproduct+ei gvec[ i,i n d e x }*ei gvec[ i,i n d e x }: e n d : e n d : ニ1t o& n ; ei gvec[ i,i n d e x } ニ ei gvec[ i,i n d e x }/sqrt(dotproduct): e n d : Do i e n d :e n d : /*柿巴 Igvecの 1列目にある最大固有値の固有ベクトルを抽出林*/ Do i = 1 to & n : y[ i }=ei gvec( i,1 ) : end: 1ambda=1ambdadl: /*****ウェイトを求める ***紳/ Do i ニ1t o& n ; weight̲bunbo+y[i}: e n d : Do i = l to 品n ; i f weight̲bunbo NE 0 then y [ i }ニy[i}/weight̲bunbo: e n d : r u n : ‑254・

248.

落語家の勢力分布の変遷 一師匠から弟子へ・親から子へー 坂部裕美子 財団法人 統計情報研究開発センター研究開発本部 AChangeo f t h ePowerD i s t r i b u t i o ni nt h eV a r i e t yT h e a t r eShow Y u r n i k oS a k a b e S t a t i s t i c a !I nf o r m a t i o nI n s t i t u t ef o rC o n s u ! t i n ga n dAna ! y s i s 要旨 寄席定席興行に登場する落語家の顔ぶれには偏りが大きく、しかもその偏りは近年増大している。この 顔付け登場傾向を「一門ごと」という視点から分析してみたところ、世代交代の上手くいっている一門 とそうでない一門で差があることが分かつた。 キーワード:落語、寡占、世代交代、回帰分析 はじめに 東京の寄席定席(上野鈴本演芸場・新宿末度亭・浅草演芸ホール・池袋演芸場)において、三つある業界 団体のうち「落語協会」が主催する通常興行(昼夜別で、1O ~20 名の落語家や色物が登場し、 「トリ」と呼 ばれる落語家の登場で終演する興行)での各演者の年間顔付け登場回数についてのこれまでの分析で、落語 家より色物の方が年間登場回数が多いこと、抜擢昇進者や初席出演者は非該当者より有意に登場回数が多い こと、登場回数とトリを取る回数には強し、相関があることなどが分かつた。さらに 1985年・ 2005年のデー タ比較からは、 2時点聞には 20年の開きがあるにもかかわらず、登場回数上位者の顔ぶれがほとんど変わっ ていないなど「長期にわたる顔付け登場者の偏り」が浮き彫りになっていたのだが、今般、さらに多くの年 度の顔付けデータを集めることができた。そこで、顔付け傾向について再度検証し、さらに個人単位ではな く「一門」という集合体で見た場合の傾向についても分析する。 顔付け登場傾向個人 1 . 対象とするデータおよび集計方法 ‑255・

249.

寄席の番組には落語と色物が登場するが、今回は「師匠一弟子」としづ関係性に注目し、これがデータか ら明確に分かる落語家のみについてデータを集計した。さらに、ゲスト扱いで度々登場する上方落語協会所 属の落語家については、集計対象から除外した。 そしてこれまで同様に、集計したのは直接の出演回数ではなく「顔付け」に何回登場したかである。顔付 けとは、 ix月×席の xx演芸場の興行に出演する予定の人の一覧表」であり、もし休みが一度もなければ、 登場回数の 10 倍が「年間出演回数」ということになる(実際は、 l 興行のうち 2~3 回は休みのことが多い ようである)。時折設けられる「交替出演 J については、その枠を受け持った人数で lを割った値をそれぞ れの登場回数とした。交替枠は、出演予定者の連名のみが記されている場合と、各日の出演者が事前に告知 されている場合とがあるが、後者でその実際の担当日数が同一でない場合も、その差は無視して単純に頭割 りにした。 2 . 定席興行全体について 長期間にわたるデータの入力を行った結果、現在定式化されている寄席奥行の構造は、ここに至るまでに 様々な変遷を経ていることが分かつた。これを度外視して単純に登場回数のみを比較したのでは全体像の把 握に歪みが出る可能性があるので、興行概況について触れておく。 9 8 0年当時、池袋は全興行を、鈴本・浅草・新宿は落語 まず開催場所である寄席側について見ていくと、 1 芸術協会(以下芸協)と交互で半々に受け持っていた落語協会が、 1984年からは鈴本についても全興行主催 となり(これについては芸協との聞に好余曲折がある)、さらに 90年 5月に池袋が改装のため一旦閉場し、 何年に再開した後は、毎月上席・中席については芸協と交互、下席は昼は落語協会の通常奥行、夜は「落語 協会特選会」という日替わりの貸館興行という変貝IJ営業になる。 また、落語家側の事情では、 80年 2月に、前年まで続いた落語協会分裂騒動の決着点として、三遊亭園生 に追従して落語協会を脱会した一門の弟子の大半が、香盤(落語家の序列評価)を下げた上で協会、つまり 寄席の顔付け候補に復帰する。そして 3年後の 8 3年には、寄席興行でも重要な位置を占めていた立川談志一 門が、落語協会を脱会し、寄席の顔付けから消える。 さらに、データの最初の年である 1980年としづ年そのものが、落語界にとって一つの節目に当たる年であ ったことも鑑みておくべきである。この年 5月に、期待の新鋭・春風亭小朝が 36人抜きで真打に昇進する。 そしてその 4ヵ月後の 9月には、「笑し、」の世界を長年支えてきた林家三平が 5 4歳の若さで他界する。(なお、 命日が 9月 20日であるため、顔付けには掲載されていた 9月興行には出演していない可能性が高いが、この 分析ではこういった実情は考慮しない。ちなみに顔付けが決まるのは興行の 1~2 ヶ月前である。) 興行関連のデータ変遷の概略を表にまとめると、以下のようになる。 表 l 寄席定席興行概要 1 9 8 0 1 9 8 5 1 9 9 0 1 9 9 5 2 0 0 0 2 0 0 5 対象落語家のベ枠数 2 0 2 6 2 0 3 1 1 8 9 7 1 9 3 0 1 8 7 7 1 6 6 1 トリ数( r 大喜利」等除く) 1 7 5 2 0 1 1 6 7 1 7 4 1 7 0 1 7 4 顔付け総量場者数 1 2 8 1 3 6 1 5 0 1 7 9 1 9 1 2 1 0 1 5 . 8 3 1 4 . 9 3 1 2 . 6 5 1 0 . 7 8 9 .8 3 7 . 9 1 一人当たり単純平均枠数 ‑ 2 5 6 ・

250.

本来であれば各年次ごとの「協会総在籍者数」を元に比較するのが望ましいのだが、古い年次の芸人名鑑 1年のうち l度でも顔付けに出たことのある人」の数(=顔付け が現時点では入手できていない。そこで 1 総登場者数)をそれに代わるものとして落語家に与えられた平均枠数を計算してみても、年々寄席に出るこ と自体が難しくなっていることがはっきり分かる。 3 . 顔付け登場回数 このような中にあって、これまでにも述べてきた「寡占」は、実は近年、より著しくなっている。各年次 における、落語家の年間登場回数のヒストグラムを図 lに示す。表 lからも分かるとおり、近年落語家の総 数は増加傾向にあるが、その増分は全階層に行きわたるわけではなく、「年 5回以下」層が激増の一途を辿っ 0 0 5年データでは、総登場者の半分以上の 1 2 0人がここに入っている。(ただし、落語家 ているのである。 2 数の増加には「若い新人が入ってくる」以外に「年をとっても辞めなしりという理由も大きく、「年 5回以下」 の中には、高齢になるに従って登場回数が減った落語家の例も含まれていることには注意が必要である。) 図 l 登場回数ヒストグラム (1980~2005) 吋 胃 帯 型 掃 車 轡Jj;o 一ーー←「ーーーー,ーーー‑‑ー・ 一一一ーーーーーーー・ー一̲. ‑ーーー̲. ← 一 一 Y 1 9 9 5 ‑51 ! 1‑1 顔付け登場傾向一一門ごと さて、落語の世界には「一門」という考え方がある。落語家として寄席に出るには、真打の誰かを師匠と 仰いで弟子入りし、前座見習い 前座の修行をして、三ツ目に上がるのが最低必須条件である。同じ落語家 を師匠とする兄弟弟子と、その師匠の師匠、つまり大師匠を同じくする人たちを総称して「一門」と呼んで いるが、 トリ担当者の一門(特に直弟子)はその芝居の顔付けに入れてもらいやすい、とし、う事実がある。 顔付けに際してはまずトリを決め、それから他の出演者を決めていくため、寄席に出るにはよくトリを取る 師匠のところに入門するのが早道である、という考え方が導き出されることになる(それ以前にまず本人の ‑257・

251.

力量が最重要視されるのは言うまでもないが)。この、寄席における 25年間の「一門ごとの勢力構図」を見 ていくことにする。 1 . 一円の定義 ここでは、通常用いられる定義と若干異なる格付けを行う。まず、 「寄席演芸年鑑 J掲載の「師匠」の情 報から師匠データを入力する。そして、一定年齢以下の師匠の弟子の場合は大師匠が誰になるかを考慮、して、 全員を「小さん J i 志ん生 J i 彦六 J i 園生 J i 金馬 J i 三平 J i 圏歌 J i 文楽 J i 園蔵 J i その他」の 1 0 のいずれかの一門に分ける。 9 5 0年以前の生まれを第 l 、1 9 7 0年以前の生まれを第 2、それ以降を第 3 そして、当人の生年によって、 1 とする 3つの世代に分割する。ここが「師匠一直弟子」の関係を中心に据える通常の区分とは異なるところ で、例えば同じ小さんの直弟子でも、さん喬は「小さん第 1世代」、市馬は「小さん第 2世代 J 、花緑は「小 さん第 3世代」、そして市馬から見ると「甥弟子」に当たる喬太郎は同じ「小さん第 2世代」となる。 図 2 区分の例(カッコ内は生まれ年) n J μ 自 n 太白 喬h ﹄ k o s a n1 晶同 n一 ん日 さh 小さん(1915) 市 馬 (1961) k o s a n2 花緑(1971) k o s a n3 この区分を用いた理由は、現在の寄席の世界を分析する上で重要になるのは、誰に教えを請うてきたかよ りも、当人がこの後どのくらい長くやれるかの方だと判断したからである。実際、現在の寄席で市馬のライ バルと見なすべきはさん喬ではなく喬太郎、さらに今後を担う期待がかかるのは「小さんの孫弟子世代」で ある喬太郎より、まだ 30代の花緑であろう。 2 . 一門別集計 この区分に則って、登場回数の一門別・時系列登場回数集計を行うと、驚くべき結果になった。登場する )。 落語家のほとんどが、実は「小さん一門」か「志ん生一門」という状態なのである(図 2 9 7 8年に勃発した、三遊亭園生一門の落語協会脱会を発端とするいわゆる「落 今回、この集計結果を見て、 1 語協会分裂騒動」の火種は、この「寄席の顔付け傾向」にもあったのではないか、という思いを強く持った。 現在に至つてなお、当事者が多くを語ることのない協会分裂騒動だが、通常は「小さんの大量真打昇進政策 に、芸至上主義の園生が業を煮やした」というような理由付けをされることが多い。しかし、今回は残念な がら 80年以前まで集計が及ばなかったが、この趨勢を見る限り、 7 0年代以前も園生一門の顔付け登場頻度 は小さん一門・志ん生一門に押され気味だ、ったに違いない。落語の興行がかなりの苦境に立たされていた、 というこの頃だったからこそ、寄席により多く出たい、なのに(別の一門の「し、つもの顔ぶれ」が居座って いるせいで)なかなか順番が回ってこない、という怪 陀たる思いが、園生にはあったので、はないか。これだ 4 ‑258・

252.

け明白な結果が出てくると、今までこういった切り口からこの騒動が語られることがなかったのが不思議で さえある。 図 2 一門別・登場回数の変遷 800 700 600 ー一←ー小さん 一司島一志ん生 500 一世一彦六 叫山由山山圃生 一『←ー金馬 400 一‑ー一三平 一‑ー圃歌 ーーー一文楽 300 一ー・ーー圃蔵 一一・ーーその他 200 1 0 0 。 1980 1985 1990 1 9 9 5 2000 2005 それはさておいて、分析に戻ろう。他の一門が束になってかかっても及ばないほどの圧倒的な勢力を持つ 小さん一円だが、実は人数も多い上に、個人別登場回数ランキング上位者にもこの一門が多い。さらに、長 い期間上位に君臨し続けている理由として、この 25年の聞に一円の中できれいな世代交代が出来ていること が挙げられる。これらについて詳細に見てして。 まず、全期間を通じての、世代ごとの各一円の人数は表 2の通りである。(新規入門や死去・長期休席な どの理由による人数の増減があり、実際に顔付けに登場する一門総数は各時点ごとでは若干違っている) 表 2 一門の世代別人数 世 代 第3 第1 世 代 第2 世 代 合計 小きん 志ん生 彦六 園生 金馬 =平 圃歌 文楽 圃意 その他 合計 2 7 1 8 6 8 4 4 6 5 6 8 9 2 2 7 2 0 1 4 7 3 1 4 6 2 4 5 1 0 2 ‑ 2 5 9 ‑ 7 5 2 2 。 。 。 3 2 1 6 1 4 3 2 2 1 7 7 1 8 1 5 7 1 1 1 4 2 1 5

253.

そして、個人別の各年度上位 20位までの登場回数をプロットし、同一人物について一門別に区分して表す と以下の通りである。太い実線が小さん一門、薄く太い線が志ん生一門で、太い破線が園生一門、品目し、線が その他の一円である。「小さん一門の何名かが長年上位に固定されている」構図が見える。 ところで、 1985年データを見ると、前後の年と比較して、飛びぬけて数が多くなっている人が多いのに気 がつく。実はこの年は一門ごとの「年間トリ占有率」も他年と異なっており、分裂騒動の後、寄席が新しい あり方を求めていろいろ模索している時期で あった、と推測できる。 図 3 登場回数上位 20名の年次別登場回数推移 6 5 60 5 5 50 4 5 4 0 3 5 3 0 2 5 2 0 1980 1 9 9 5 3 . 要因分析 では、「一円の人数が多し、」ことと「一円に寄席の常連がいる」ことは、どちらの方が一門の総登場 回数により強し、影響を及ぼすのだろうか。これを調べるために、各一門×世代ごとに、年間総登場回数 を従属変数とし、グ、ループ人数と、そのグ、ループ内に上記「各年度登場回数上位 20位以内」に一度で もランクインしたことがある人が何人いるか、の 2つを独立変数とする回帰分析を行った。 表 3 回帰分析におけるパラメータ推定値 R2乗 1980 1985 1990 1995 2000 2005 . o8440 0 . 9 1 6 3 0 . 9 4 7 4 0 . 9 6 5 9 O .9 7 6 1 0 . 9 3 4 8 1 . 0 7 5 9 1 5 . 6 5 7 1 2 0 . 3 3 1 0 1 ‑ ‑ 3 . 7 6 6 6 5 ‑ 1 1 . 6 7 8 1 4 I n t e r c e p t 11 .21152 人数 ‑ 2 . 6 9 8 2 2 ‑ 1 .6 6 4 3 1 1 . 3 8 5 9 7 4 . 5 0 6 3 5 5 . 6 4 7 6 8 7 . 3 0 3 7 8 上位者数 51 .02059 53.33507 3 5 . 8 7 6 8 2 4 . 9 9 1 8 8 1 7 . 1 1 2 4 5 6 .7 6 0 5 6 この結果からは、「上位者数」によるところの方が大きいと言えそうだ。しかし、近年はかつてほどその影 響力が強くなくなってきている。近年世代交代が進み、 80年頃の上位常連の登場回数が減少気味なところへ、 ‑ 2 6 0 ‑

254.

上位 20位までには食い込めないものの、登場回数を増やしてきた若手が多数存在している、ということの表 れと考えられる。 4 . 一門内での世代交代 ここで、代表的な一門の時系列推移の状況を個別にみてし、く。グラフは、登場回数合計が折れ線グラフで 左軸表示、人数が棒グラフで右軸表示である。 ( 1 ) 小さん一門 小さん門 畳場回数(固) 500 人数{人) 5 0 450 45 400 4 0 350 35 他一門と比較するために Y軸の目盛りをそろえ ると、登場回数の 8 0年代分は上方向に外れてしま うほどの小さん一門だが、そのほとんどが第 l世 代の落語家によるものであることが分かる。 そして、この第 I世代の勢いが次第に衰えてく 300 るのに伴って、第 2世代が、人数・登場回数共に 250 25 200 2 0 1 5 0 1 5 100 1 0 着実に伸びているのがこの一門の素晴らしいとこ ろである。 85年に上位ランキングに顔を出して以 降ずっと 5位以内を維持しているさん喬・権太楼 は第 I世代だが、 05年には第 2世代の市馬が急速 5 0 に回数を伸ばし、この 3人がベスト 3になってい 1980 1985 1990 1995 2000 2005 る 。 ちなみにこの一門は、 90年データから第 3世代が登場する唯一の一門になっているが、これは小さんの孫・ 花緑であり、何年データまでは彼単独の数値である。中学を卒業してすぐ入門した花結は、 89年に二ツ目昇 進するや否や頭角を表し、その後 5年で大抜擢されて真打に昇進している。 ( 2 ) 志ん生一門 志ん生一門 登場回数(回 1 500 人数(人) 50 450 45 400 40 350 35 300 30 250 25 200 20 150 1 5 一門の規模では小さん一門に次いでいるが、 趨勢としては劣勢気味である。 85年に回数が突 出したのは、志ん橋がこの年だけ 47回も登場し 0 たのが最大の要因と考えられるが(他の年は 1 回台)、 85年→ 90年は全般的に「登場機会の均 等化」が図られた年と考えられる(上記の小さ ん一門も大きく減らしている)。 また、この一門の第 2世代は、人数が順調に 100 ト陸1 回1 1 1 1 1 1 兇 岨r 増えているのに比べて、回数の上乗せが少ない I~~IIIIII t'~1I1I1I U I I I I I I 1 10 のが気にかかるところである。 50 第 2世代を牽引するのは志ん輔である。 85年 1980 1985 1990 1995 2000 に真打昇進した後も堅調に毎年トリを勤め続け 2005 (数多い落語家の中には、真打披露興行以外では全くトリを勤められない者も多し、)、 00年・ 05年に回数上 位にランクインしている。第 3世代には、着実に寄席での実績を上げつつある菊之丞がし、る。 ‑ 2 6 1・

255.

( 3 ) 園生一門 80年データでは 3番目に大きな勢力を誇る一門 圃生一門 量場回散(困) 500 人数{人} 5 0 だったが、その後は衰退の一方である。これまで 450 45 に再三述べてきた分裂騒動の影響を最も大きく受 400 40 けた一門なので、部外者が言うのも口幅ったいが 350 3 5 300 3 0 250 25 200 20 1 5 0 1 5 100 1 0 仕方のないことかも知れない。 登場回数で見ると、 2000年頃までは園弥・園窓・ 川柳が、そして園弥が亡くなり、園窓がかつてほ ど寄席に出なくなった昨今は川柳が、寄席の出番 を稼いで、いる。しかし、後継者育成の面で最も功 績があるのは園丈であろう。彼は新作志向だ、った 50 ため、師匠・園生の覚えは必ずしもめでたくはな 1980 1985 1990 1 9 9 5 2000 2005 かったとされるが、彼が切り開いた新作落語の道 は、数多くの自らの弟子のみならず、他の一円である喬太郎や彦いちなどにも光明を与えている。 ( 4 ) 彦六一円 園生一門と対照的なのが彦六 ( 8 代正蔵)一円 車六一門 壷場回数{回 1 500 人蹟(人) 50 である。 80年代に入ってまもなく彦六が亡くなり、 450 45 さらに「落語四天王」にも数えられた 5代柳朝が 400 40 病に倒れてしまったが、その柳朝の弟子に 2人の 350 35 300 30 250 25 200 20 実力者が現れる。その l人は小朝なのだ、が、以前 報告したとおり、「寄席への登場回数」という視点 だけから見た場合、彼自身はあまり大きな貢献は していない。その代わりに、小朝の一番弟子・園 1 5 0 1 0 0 1 0 太郎が現在寄席で大活躍しており、 00年・ 05年は 上位にランクインしている。ちなみに小朝と園太 50 郎は 7歳違いで、どちらも第 2世代に入っている。 1 9 8 0 1985 1990 1 9 9 5 2000 2005 そして、真打昇進を弟弟子の小朝に先んじられ、 不遇の時代も経験した一朝が、現在の寄席では重要な一角を占めている。安定した実力を買われて、自身の 登場回数も伸ばしているが (05年は小さん一門の 3名に次ぐ第 4位にまで躍進)、近年は弟子の育成にも力 を入れており、一番弟子が先年、亡き師匠の名・柳朝を継いで真打に昇進した。 これらを見ていく中で、「弟子をなるべく早く取ること」の重要さが感じられる。回帰分析において「人数」 パラメータ推定値が近年大きくなっているのもさることながら、見えないところで香盤が意外に大きく効い ている落語界では、「一歩でも先んじた者」が何かと有利になる場合が多し、からである。さらに、年齢が若い 師匠に弟子入りすると、旺盛な師匠の活動(若くて弟子を取る余裕がある落語家は、相当の売れっ子である) に随時随行し、引き立ててもらえる可能性が高い。弟子を取る側にも「弟子を取るのは自らの勉強になる」 としづ高言があるが、若い師匠一若い弟子の組み合わせば、実利的な部分も相当大きいのではないだろうか。 ‑ 2 6 2・

256.

そして、これらのことを誰かに教わったのか自ら学んだのかは分からないが、現在 4 0代の若手の中で、率 0代であるにもかかわらず、この 5人に 先して弟子を取った落語家 5人の l人が市馬、さらに、自らはまだ 3 さらに先駆けて弟子を取ったのが花緑である。ノトさん 門の磐石ぶりが窺える。 親から子への継承 ところで、近年「こぶ平の正蔵襲名 J I きくおの木久蔵襲名 J I し、っ平の三平襲名」が続き、落語界も歌 舞伎のように世襲が当然の世界であるかのごとく言われることがある。そこで最後に、顔付けにおいて「世 襲」があったのかどうか、 25年間のデータ変遷から見てみる。 対象とするデータ 2 5年間に、実の親子で落語協会に在籍した落語家は以下の 7組である。なお、定義から外れるので、小さん 花緑は除外する。 ・三平一正蔵/いっ平 ‑園菊一菊生 ・木久蔵一きくお ・園窓窓輝 ・金馬金時 '、きん ・つば女一 J ・小さん一三語楼 この各組に、「親側の落語家の惣領弟子(または二番弟子)Jを加えた上で、登場回数の変遷を見てみよう。 4 0 25 1 3 5 20 30 ¥ 25 1 5 20 l D 1 5 1 0 1 9 8 0 1985 1990 1 9 9 5 2000 2005 1 9 8 0 1 9 8 5 レ 曲 、 、』 、 9""" 。 r 、 30 」 1990 1995 2日日目 ¥ / ¥ 2 0日5 4 0 30 20 20 1 0 l D 1980 1985 1990 1995 2000 ヒヰι(~ 1 9 8 0 20日5 ‑263・ 1 9 8 5 1990 1995 2目。 2005

257.

170 1 /ft 40 / / <i>‑ーー ・ 唱 I , , I 150 匡 ヨ ¥ / / 20 │田 140 ¥ / ¥/ 1 0 2 0 ~んて二 1980 1 9 8 5 1 9 9 0 1 9 9 5 2000 110 1980 2005 1985 1990 1995 200C 口 20 5 いずれも、点線が親、実線が子、薄い線が弟子で 7 0 . / ある。 l 二 二 = ー E 吋つば女の吋叩カなように親世 代の回数減少の穴を埋める動きをするのは、血の繋 40 l がった息子ではなく、手塩にかけて育てた弟子のよ うである。これには、息子は親に弟子入りするケー 3 D 宮戸・ 、 . 、 、 司 . ""'"̲『 ¥ / スが多いこと、そしてその時点で既に「兄弟子 J (= 惣領弟子)がし、て、香盤ではその下扱いになること 11 が関係している可能性があるが、データから分かる のは、寄席の顔付けにおいては、「親から子へ勢力の 口 " ' 1985 1990 1 9 9 5 200Q 2005 委譲が行われる」ということはない、ということで ある。 謝辞 本研究は科研費(課題番号:2 0 5 2 0 1 5 1 ) の助成を受けたものである。 ‑ 2 6 4 ‑

258.

医療圏分析と医薬品マーケティング 表 ob 争︑ ︐ dl C3 n 猛一山 藤一∞ 武 UU v ト に T kρ a M H e a l t h c a r eAr e aA n a l y s i sandP h a r m a c e u t i c a lMarketing T a k e s h iMuto MarkeTechC o n s u l t i n g P r e s i d e n t, 要旨 医療サーピスは、医療連携の進展とともに、単独の医療機関だけではなく一定の地域の医療圏の中で ネットワークとして完結することが多くなっている。このため、医薬品マーケティングにも医療圏の視 点を導入することが重要となっている。本論文では、医療圏分析の具体例として、都道府県単位の医薬 品売上高と人口要因との関係、二次医療圏聞の患者移動、二次医療圏への「重力モデル」の適用の各事 例を取り上げ、それらの医薬品マーケティングへの応用について考察する。 キーワード:医療圏分析、医薬品売上高、患者フロー、重力モデ.ル、医療機関の患者吸引距離 1.医療圏分析の考え方 医療サービスは、一部の特殊な疾患を除いて、ある地域内で完結することが多い。つまり日常的な医療は かかりつけ医を中心とした比較的狭い「一次医療圏」で、救急医療や入院を伴う医療は比較的広範囲な「二 次医療圏」で、さらに先進的な技術や特殊な医療や、発生頻度が低い疾患に関しては都府県を単位とする「三 次医療圏」で完結することが多い(例外として、面積が広い北海道は 6つの三次医療圏で構成される)。第五 次医療法改正に伴い、 2008年 4月からスタートした新たな医療計画では、医療連携をベースにした「ネット ワーク型医療」の導入が制度化されたが、二次医療圏を中心とした医療圏の考え方は、医療資源の配置など に関して号 l き続き有効である。 従来、医薬品マーケティングにおいては、医療機関への医薬品売上高に基づく「点」のマーケティングが 主流で・あった。今後、医療サービスにおいて医療連携を中心としたネットワークが重要になることを考える と、医薬品マーケティングの視点からも医療圏は基本的な分析単位となる。特に二次および三次医療圏は、 営業資源、の最適配置の観点からも重要である。本論文では、厚生労働省を始めとする公開データが豊富な、 三次および三次医療匿分析と医薬品マーケティングへの応用について考察する。 図表 Iは医療圏分析の目的と医薬品マーケティングにおける応用例をまとめたものである。内容を具体的 にするために、分析レベルを三次、二次、および一次医療圏に分けている。 まず、三次医療圏(都道府県単位)の分析目的は、都道府県単位の患者数、および医療機関や医師数の構 造を分析することである。本論文ではその例として、医薬品の売上高と各種の変数との相関を分析し、相関 ‑265・

259.

係数の高い変数について考察する。 図表 1 医療圏分析の目的と応用例 デ ‑ 9頚の例 応用の例 分析の目的 分析レベル 2 0 0 5年) ‑厚生労働省医師・歯科医師・薬剤師調査 ( ‑医療施設散の充足率分析 ‑医師数の充足率分析 都道府県単位の患者 数、および医療施設や ‑新薬の販売ポテンシャル分析 医師数の構造を分析す 'MR数の最適配置分析 る ‑大規模病院のマーケティング分析 三次医療圏分析 (都道府県 ~Il 分析) 二次医療圏 ~Il 分析 ‑厚生労働省医療施設調査 ( 2 0 0 5年) 008 ‑矢野恒太記念会デー舎で見る県努 2 2 0 0 5年) ‑厚生労働省患者調査 ( 2 0 0 0年) ‑園努調査 ( ‑医療施設数の充足率分析 2 0 0 5年) ‑厚生労働省医師・歯科医師・薬剤師調査 ( 医師数の充足率分析 ‑厚生労働省医療施設調査 ( 2 0 0 5年) ‑患者フロー分析 二次医療圏単位の患者 数、および医療施設や 'MR数の最適配置分析 医師散の構造を分析す ‑中規模病院のマーケティング分析 る ‑医療連慎分析 2 0 0 5年) ‑厚生労働省患者調査 ( ‑厚生労働省診療報酬調査専門組織・ DPC評価分科会資料 デ一望活用ブッヲ(じ i ま う 、 2∞ 6年) ‑伏見清秀編著 :DPC ‑ デ‑ 9マップ' 0 6 ( r医療経営情報 J 2 0 0 5年 1 1月増刊号) ‑国努翻査 ( 2 0 ∞年) ‑小規模病院のマーケナイング分析 個別の医療施設(病院、 ‑診療所のマーケティング分析 一次医療圏 ~Il 分析 診療所、薬局)のエリア ‑誤剤薬局のマーケティング分析 マーケティングを行う ‑医療連機分析 2 0 0 5年) ‑厚生労働省患者調査 ( ‑園努調査 ( 2 0 0 0年) ‑個別医療施設の患者調査(レセプト、アンケート等) 次に、二次医療圏の分析目的は、二次医療圏単位の患者数、および医療機関や医師数の構造を分析するこ とである。本論文では、群馬県を例に、二次医療圏聞の患者移動について考察する。また、二次医療圏に対 して「重力モデル」を適用し、医療資源の中で患者を吸引する要因と距離の効果を分析する。 最後に、三次医療圏の分析目的は、個別の医療機関(病院、診療所、薬局)のエリアマーケティングを行 うことである。三次医療圏の分析については、別の機会に取り上げることとし、本論文では取り上げない。 2 . 都道府県単位の医療圏分析 医薬品マーケティングにおいて、特定の医薬品がある地域でどれだけ販売可能かは重要な関心事である。 この販売ポテンシヤルの要因を把握することで、営業資源の中長期的な配置計画が可能になる。従来は、市 販の市場データにより、医療機関(診療所・病院・調剤薬局)別・薬剤別売上高を用いることが多い。しか しこの売上データは、ある時点での医薬品の売上高を知るためには最適であるが、 5 年 ~10 年単位での人口 構成や疾患構造の変化に伴う医薬品への影響を予測するためには不向きである。 ここでは、三次医療圏、つまり都道府県単位での医薬品の販売ポテンシャルの分析を行う。対象となる医 薬品は、生活習慣病系の医薬品 ( 2 0 0 5年)である。人口、病院・診療所数などについては、「データでみる 5 ! ]の患者数については厚生労働省の患者調査 ( 2 0 0 5年 )ω を用いた。各データの年次が 県勢 2007J (1)、疾患 5 異なっているが、データの変化がそれほど大きくないこと、および相関関係だけを議論すること、により大 きな問題はないと判断した。 生活習慣病系医薬品との相関係数を分析した変数は次の通りである: ①年齢別人口 ②人口密度 ③ l人当たり所得 ④医療費 266 ー ・

260.

⑤医療機関数(診療所・病院) ⑤疾患別死亡数 ⑦疾患別患者数 生活習慣病系医薬品との相関関係を分析した結果、上記のほとんどの変数と高い相関係数 (0.85~0.97) が 得られた。例外は、診療所数(相関係数 0. 47 9 )、男性の寿命 ( 0 . 1 5 3 )、および女性の寿命(ー0 . 3 3 6 ) である。 一例として、医薬品売上高と総人口との散布図を図表 2に示す。 図表 2 都道府県別医薬品(生活習慣病系)売上高対総人口 8, 000 000 7, 圃 東京 6,000 y=0 . 4476x 0 . 9 4 5 R2= 000 5, 相E 斗 ~F: うた阪 日 i : i4, 000 軍 基 幽 圃 3, 000 神奈川 • , 000 2 1 , 000 。 。 2000 4000 6000 8000 10000 12000 14000 総人口 図表 2によれば、各都道府県における生活習慣病系と総人口とは非常に高い相関がある(決定係数 0 . 9 4 5、 . 9 7 2 )。一方、高血圧症患者数との相関係数は 0 . 9 5 2で、むしろ総人口との相関係数よりも小さい。 相関係数 0 このことは、高血圧症に代表される生活習慣病には、様々な合併症があり、医薬品はそれらの合併症の場合 も処方される場合があることによると考えられる。なお、図表 2で、東京が回帰直線から上方に外れているが、 理由としては年齢構成比の違いや東京都以外からの患者の流入などの理由が考えられる。 以上のように、医薬品マーケティングの重要な関心事である特定の医薬品の販売ポテンシャルは、当該都 道府県の人口で代表可能であることが確認された。この結論は、製薬企業の営業資源の配分(将来計画を含 めて)を見直す際に有効と考えられる。 3 . 二次医療圏の患者フロー分析 [ l J 二次医療圏聞の患者フロー 二次医療圏の分析例として、患者フロー分析を取り上げる。二次医療圏は、北海道を除く都府県では 3 ( 島 3 (東京都)配置され、入院を要する疾患が大部分完結する範囲を想定している(面積が広大 根県)ないし 1 な北海道の二次医療圏は 2 1 )。各都道府県の二次医療圏の平均数は 7 . 6である。二次医療圏は、高度な医療を 267・ ー

261.

必要とする疾患を除き、入院を要する医療サービスにおいては最も重要な医療圏であり、医療機関や医師な どの適正配置のために、各都道府県の医療計画においても定期的な見直しの対象となっている。 図表 3は二医療圏聞の患者フローと医療機関の「充足率」の定義を示す。一般に患者は、疾患の種類に応 じて、居住地から通院または入院するために最適の医療サービスを期待できる医療機関を選定する。このた めに、結果として二次医療圏聞の患者フローが発生する。充足率が低ければ、当該の二次医療圏内で必要な 医療サービスを十分提供できていないことを意味する。厚生労働省の患者調査 ( 2 0 0 5年) (2)を用いて、入院 に関する二次医療圏の充足率を求めた結果を図表 4に示す。 図表 3 二次医療圏聞の患者フローと「充足率」の定義 ー ー ー ー ー ー ー ー ー 砂 二次医療圏 聞の患者移動 ま (県外との移動 l 図示していない) 充足率=(当該医療圏に居住する患者が当該医療圏で受療した患者数) 7(当該医療圏に居住する患者数) 。 図表 4 充足率別の二次医療圏の数 2 0 4 0 80 6 0 100 1 2 0 二次医担襲圏の総Il=369 日 首 ‑10% 1 0 10%‑20 也 O 首‑30% 1 1 1 2 0 首‑4 日 目 3 0 時 4 0 百‑50 首 a I 骨~ 口 3 50 也‑60% 首‑70% 6 0 7日 目 ‑80 也 l68 1 1~ 7 80 首‑90% ∞ 1 1 2 2 覧‑1 H 90 ー2 68‑ 1 4 0

262.

図表 4の結果によれば、充足率 70%以下の二次医療圏が 6 2 (全二次医療圏 3 6 9の 1 7 % ) 存在する。このこ とは、各都道府県内においても「医療格差」が存在し、個別の対策が必要なことを意味する。 [ 2 J 群馬県の二次医療圏の患者フロー分析 二次医療圏の患者フローは各都道府県単位で分析する必要がある。一例としてここでは群馬県を取り上げ る。園表 5に群馬県の二次医療圏を示す( 3 ) 。群馬県には、前橋、高崎・安中、渋川、藤岡、富岡、吾妻、沼 0の三次医療圏が存在する。このうち、南部に位置する前橋、 田、伊勢崎、桐生、および太田・館林という 1 高崎・安中、および太田・館林の 3つの医療圏は面積が県全体の 21%にもかかわらず、人口の 56% が集中し ている。 図表 5 群馬県二次医療圏の概要 l 二次侵包 ~R空間思巴 10問主, 1 園表 6は、入院と外来とに分け、患者調査のデータ (3)から患者移動のデータをまとめたものである。図表 7 は入院に関する患者移動をグラフで表したものである。園表 8は入院に関する各二次医療圏の充足率を示し ている。 図表 6~8 から分かることは、二次医療圏問ではかなりの患者フローが存在し、特に入院に関しては県全体 での医療機関配置の最適化や医療機関過疎地への対策が欠かせないことである。最近問題になっている医師 不足問題は、都道府県単位でも生じており、県庁所在地などの人口集中地域に医療機関や医師が集中する傾 向がある。当面の対策としては、疾患毎の医療連携ネットワークを構築し、貴重な医療資源を県内で共有化 することが重要と考えられる。このような動きは、医薬品マーケティングの観点からも注目に値する。従来、 医療機関単位が主体であった販促活動は、医療連携ネットワークに対応した活動へと移行することが不可欠 と考えられる。 ‑ 2 6 9・

263.

図表6 群馬県二次医療圏聞の患者移動 (j)入院患者 次医療圏医療機関所在地 入院患者会計 藤岡 吾妻 前 橋 高 崎 ・ 安 中 桐生 伊野崎 困・鱈 渋川 沼図 冨間 57 1 1 258 3 1 5 3 . 2 8 1 2. 403 328 1 6 9 8 29 340 3 4 1 2 1 1 4 5 7 4, 512 2, 705 1 0 0 297 1 7 7 35 3 1 2 1 1 6 8 25 1 , 682 1 0 6 28 3 10 2,1 4 6 4 1 0 250 53 1 , 394 55 67 2 1 1 1 , 932 86 2 . 4 1 3 5 87 147 294 26 4 2, 9 9 1 1 2 2 1 293 1 2 8 5 7 812 2 59 28 1 . 3 3 8 3 4 1 1 4 76 1 7 4 7 23 49 517 5 3 972 1 1 8 36 7 3 33 29 24 812 7 2 1 . 0 3 5 1 1 2 4 1 658 932 62 38 7 1 2 2 2 2 1 1 8 1 4 1 834 1 . 17 1 72 32 3 3 4 . 1 0 4 2 . 4 5 5 2 . 3 0 9 3 . 1 4 8 1 . 9 8 0 9 1 1 1 . 1 4 7 9 6 1 992 20,1 3 8 3 . 7 2 9 二次医膚圏患者居住 前橋 高崎・安中 桐生 伊努蝿 主因・館梓 渋川 藤岡 富岡 吾妻 沼田 群馬県主体 ②外来患者 。 。 。 次軍療圏一医癒援問所在地 入院患者合計 前 橋 高 崎 ・ 安 中 桐生 伊努暗 回・館 渋J I [ 藤岡 富岡 沼田 吾妻 1 3 . 7 8 7 874 96 33 333 1 3 9 7 445 5 1 5 . 6 0 2 7 1 , 328 6 1 6 8 25 202 262 3 0 8 1 7 . 8 4 3 1 2 20,1 6 1 9 299 8 . 0 4 1 286 23 2 35 3 8, 905 4 615 1 4 4 9 . 2 1 2 229 43 37 5 373 3 1 0 . 6 6 5 833 1 2 4 3 5 1 4 6 7 [ 1 4, 1 5 2 44 2 1 5 . 8 5 6 4 2 五543 836 375 1 6 4 . 2 1 8 3 2 59 28 s 3 . 1 5 0 2 1 1 8 1 6 5 4, 210 1 0 7 7 0 8 3 5 0 1 1 2 5 1 3, 703 6 1 287 1 3 2 8 78 3, 1 1 1 1 7 60 5 2 1 1 409 1 . 9 6 8 46 2, 1 1 5 53 2 8 1 0 2 s 4 44 4 . 1 4 6 4. 8 , 4 5 5 , 1 4 8 9 1 1 2 3 2, 1 . 9 8 0 1 .1 4 7 9 6 1 99 9 1, 4 . 1 0 4 3 . 7 2 9 3 0 9 508 二次医療圏患者居住 前揖 高揖・安中 鋼生 伊努蝿 。 。 。 22 皇 L 一 一 一 一 一 一 一 一 一 一 ‑ 主 一旦 豊 富 ニ里 岡 主一 主 。 吾妻 沼田 群馬県全体 。 。 図表 7 群馬県二次医療圏聞の入院患者移動 Z 写昆.の二次医僅圏聞の!!者移劃{入院) ~~ーー一 患者が居住する竃彊置 図表8 群馬県二次医療圏の充足率(入院) ヨ ヨ 屯 入院に関する各医檀圏白充足率 7 5 7 0 内 s c 内 、 ・ 、 65 ' 、 > 2 , 高咽・安中 鋼生 7 8 」 1 7 2主主 伊'時崎 主因・個持 関 高岡 、 ー j 7 8 i i 層圏醜全偉 、 7 0 ' 吾妻 沼図 、 7 6 0,7 i ! I 川 箆 . 、 8 5 7J m I :1 7 !2¥ 、 7 0 7 ‑ 2 7 0・ 、

264.

4. 医療圏に対する重力モデ、ルの適用 [ l J 医療版重力モデ、ルの考え方 ある医療機関の患者が、どの範囲(距離)から移動して入院または外来通院しているのかは、その医療機 関にとってはもちろん、医薬品マーケティングの観点からも重要である。患者の移動範囲は、医療機関にと っては、医療連携すべき診療所を選定する上での重要なヒントとなる。一方、製薬企業にとっては、患者の 移動範囲は、その医療機関が影響を及ぼす範囲そのものであり、医療連携を考慮した販促活動の計画に役立 つ。本論文では、特定の医療機関ではなく、二次医療圏問での患者移動を分析し、特定医療圏が患者を吸ヲ l する要因を明らかにする。適用するモデルは、「重力モデル」と呼ばれるモテ ルを医療分野に改良した「医療 f 版重力モデル」である。 重力モデルは、ニュートンの万有引力の法則を模倣して、社会科学の様々な分野に適用するもので、地域 間人口移動などへの応用が報告されている付)。特に有名な応用は、小売庖の商圏分析で、あり、その場合の重 力モデ、ルは、特にハフモデルと呼ばれている ( 5 ) 。医療分野への応用については、大場らが北海道二次医療圏 に対して重力モデ ルを適用している。本論文では、大場らの研究を参考にしつつ、群馬県の二次医療圏に重 力モデルを適用し、得られたパラメータを北海道と比較して、その特性について検討する。 重力モデルの基本は、地域聞の人口移動に関する下記の式である (5)。 o s 4 f ミ α M , , =k よ二ム ゲ (1) Mu =地 域i から地域/への移動数 ~:地域iの人口(地域i を出発地とする総移動数) Q j :地域/の人口(地域/を到着地とする総移動数) d i j :地 域iと地域/聞の距離 k:比例定数 α, s,y:パラメータ 医療圏分析では、(1)式の移動人口は患者数に、地域間の患者移動を引き起こす吸引要因白は、地域の人 口の代わりに病院数などを用いる。 上式から具体的な計算を行うためには、制約を加える必要がある。よく用いられるのが、「発生量制約モデ ノレ」であり、それぞれの地域からの移動数(患者数)総量は所与(一定)とし、患者数は最も魅力的と考え る地域(の病院)を選ぶと仮定する。この仮定に基づいた「医療版重力モデ、/レ」は下記の式で表せる(針。 M=~Qf ‑ U で (2) Q td [ . . . . . AY keNUjk M i j :医 療 圏 i か ら 医 療 圏jへ の 移 動 患 者 数 S i :医 療 圏 i か ら 医 療 圏jへ の 移 動 患 者 数 の 総 数 Q j :医 療 圏jの 病 院 数 d e医 療 圏 iと 医 療 圏 / へ の 移 動 距 離 β, y :パラメータ ‑ 2 7 1・

265.

重力モデ ルの数値計算を行うために、 Nakanishi‑Cooperが最小二乗法を用いたパラメータ推定法を提案して いる (7)。この方法を用いると、吸引要因に関するパラメータ 3および距離に関するパラメータ γ は、次式か ら求めることができる。 惜J = s l 胡 (3) ここで、 : M/ Mi. J=1,2, ' .ザ)の幾何平均 S i :S/J=1 , 2, . ・ ザ ) の 幾 何 平 均 ( し た が っ てS i 'こ等しし、) Q :Q/ J=1 , 2 , .・ザ)の幾何平均 . :d d / J=1 , 2, ' .ザ)の幾何平均 i 図表 9は 、 (3)式に基づきパラメータ 3および γ を最小二乗法で、算出するためのデータベースを示す。図 表9 ( 1 )の左側に示すように、分析に必要なデータは、患者数の移動に関するマトリックス、患者の吸号│要因、 および医療圏聞の距離に関するマトリックスである。二次医療圏を表すサフィックス iは医療機関の所在地、 jは患者の居住地を表す。図表 9 ( 1 )の右側は、幾何平均を算出したものである。図表 9 ( 2 )は回帰分析用のデー タベースの構成である。 図表 9 重力モデルによる分析用データベース i / j i / j > . 11 1 1> . 12 1 1 ・. 1> . 1 , 1I0 1 1d 1 1 1d 2川・・ー 1d ,l1且L I・ ・ ・ 1M 旦 l且 品 l出品│・・・│血晶 > . 11 21> . 12 2 1 ・・ 1> . 1n 2 1 02 1d 1 21d 2 21・ ・ 1d , 21ML1・・ 1M n .1! l . 1! t l .1...lm (1)分析用データ の構成 M 2 nI・ .IM n nIQn Id t nId 2 nI・ ・ ・ 1d"1ML1・ ・ ・ 1M n .I且 晶 l豆L 1 ...1 血晶 M l nI i = 2の回帰分析用データ i = lの回帰分析用データ 1 0g (Mll/ 担 )I 1 0g (QlI♀) I l og (d l l / 単)I l og (M21/ 盟 Jい。副 1 位 ) I1 0 g (d 21/ 卓J ( 2 )回帰分析用 1 0g (M12/ 阻 )I 1 0g (Q2/Q) I1 0g ( d 1 2 1 単 )I l og (M22/ 也 )I 1 0副 2 1 Q) I1 0 耳d 2 2 也) データの構成 , 1 0g (Mln/ 也 )I 1 0g (Qn/: ♀) Il og (dln/ 単 )I l og (M2n/ 陛 )I 1 0g (Qn/ Q) I1 0g (d2nlm [ 2 J群馬県の二次医療圏への医療版重力モデルの適用結果 [ I Jで説明した手順に基づき、群馬県の二次医療圏聞の患者移動に関して、医療版重力モデ、ルを適用した。 群馬県については、群馬県患者調査のデータ仰を用いた。分析方法の検証のために、北海道の二次医療圏に 6 )のデータを用いて、比較検討したロなお、吸引要因としては、先行研究仰が採用している病 関する先行研究 ( 0に示す。 院数以外に、病床数と医師数についても対象とした。結果を図表 1 図表 1 0の北海道についての結果は、先行研究 ( 6 )( 吸 ヲl 要因は病院数のみ)と非常に良く一致している(差 は最大約 2%)。これにより、今回の計算手法は妥当であると考えられる。パラメータについて、入院患者に 関して北海道と群馬県とを比較すると、吸引要因に関するパラメータ 3の平均値は、北海道が群馬県の約 2 ‑272・

266.

倍、距離に関するパラメータ γ はほぼ同じである。このことは、地域の医療資源の状況により、入院患者の 吸引効果は大きく異なるが、距離の効果はそれほど違わないことを示唆している。一方、外来患者の場合は 3および γ ともに、北海道と群馬県とで大きく異なっている。群馬県の場合、距離ノ fラメータの γ の絶対値 が北海道に比べて非常に大きく、外来患者はより近距離の医療機関(のある医療圏)を選ぶことが分かる。 図表 1 0の分析結果のうち、吸引要因(病院数、病床数、および医師数)別のパラメータ 3の大きさは、患 者が医療機関のどの要因に魅力を感じて入院または通院するかを意味する。ほとんどの場合、病院数の多寡 が最大の吸引要因となっている。ただし、群馬県の外来患者の場合は医師数が最大の吸引要因である。 図表 10 北海道・群馬県の医療圏に対する重力モデル適用結果 入院患者 道・県 群馬県 ( N = 1 0 0 ) 北海道 ( N = 4 4 1 ) 吸引要因 外来患者 日 Y 自由度回整済 み 決定罷数 病院数 0 . 7 1 2 . 9 2 0. 477 0 . 7 3 ‑ 4 . 1 8 0 . 5 5 2 病床数 0 . 41 ‑ 2 . 9 5 0. 454 0 . 7 1 ‑ 4 . 2 2 0 . 5 5 4 0. 46 3 0 . 5 6 9 医師数 0. 44 ‑ 2 . 9 6 (平均) 0 . 5 2 ‑2.94 病院数 日 Y 自由度調聾済 み 決定係敬 0 . 7 5 一4 . 2 2 0 . 7 3 ‑ 4 . 2 1 ‑ 2 . 8 8 0 . 7 9 8 1 .2 4 2 . 6 5 0 . 7 4 1 1 .4 1 病床数 1 . 0 8 ‑ 2 . 6 6 0 . 7 4 9 1 . 2 3 ‑ 2 . 9 0 0 . 8 0 5 医師数 0 . 9 4 ‑ 2 . 6 2 0 . 7 4 6 1 .0 7 ‑ 2 . 8 4 0 . 8 0 2 (平均) 1 . 0 8 ‑2.64 ー 1 . 2 4 ‑2.87 図表 1 1 重力モデルにおける距離の効果 100 ‑十外来患者 mg押圏 相 ao} 醐京自担叫同時士伯尚己一 {司寂E G申書ど﹂日吉 OF山E 00 9 80 70 60 50 40 30 20 1 →一入院患者 ト ¥ 、‑ h 。 。 0 . 5 1 .0 下 ー. 一 守 ・ ・ ー・. . 1 . 5 2 . 0 2 . 5 3 . 0 3 . 5 医療樋聞から患者居住地までの距種 (km) 4 . 0 4 . 5 5 . 0 医療機関から見て患者がどの範聞から来院しているかは、病院マーケテイングの観点からも非常に重要で ある。図表 1 1は、群馬県に対する計算結果から距離の効果を図示したものである。大多数の患者が 2km以 内から通院または入院していることが分かる(入院患者の 96%、外来患者の 97%)。このことから、地域に根 ざした医療サービスの重要性が改めて確認できる。 この結果は、医薬品マーケティングにおいである病院の ‑273・

267.

影響範囲を想定する上で有用と考えられる。なお、診療所の典型的な患者吸引距離 ( 1次診療圏)に関して は、内科・小児科は 0 . 5 k m、婦人科は1.0km、呼吸器科・皮膚科などは1.5km、神経科・心臓血管外科・産婦 人科などは 2 . 0 k mとされているベ今回の重力モデルで得られた病院に関する患者吸号 l 距離 2 . 0 k mと併せる と、医薬品マーケティングにおける距離の指標として有用と考えられる(当然のことながら、個別の診療所・ 病院の患者吸引距離は、ブランドカなどの要因で異なる。前記の指標はあくまで平均的なものである)。 5 . まとめと今後の課題 医療圏は、医薬品マーケティングの基本的な分析単位であり、特に二次および三次医療圏は、営業資源の 最適配置の観点からも重要である。本論文では、厚生労働省を始めとする公開データが豊富な、二次および 三次医療圏分析と医薬品マーケティングへの応用について考察した。 まず三次医療圏(都道府県単位)の分析では、医薬品の売上高と各種の変数との相関を分析し、相関係数 の高い変数について考察した。少なくとも生活習慣病関連の医薬品では、人口に関する変数との相関係数が 高く、人口の推移を予測ながら、営業資源の配置を行うことの重要性が確認された。 次に、三次医療圏聞の分析では、群馬県を例に、二次医療圏聞の患者移動について考察した。二次医療圏 聞においては、医療機関の充実度に大きな差があり、患者フローを把握することは都道府県県単位のエリア マーケティングにおいて重要であることが確認された。 最後に二次医療圏に対して「重力モデ、ル」を適用した。医療資源の中で患者を吸劃する要因(病院数、病 床数、医師数)別に分析を行い、これらの中で最も強い要因について考察した。また、北海道の二次医療圏 に関する先行研究を参考にしながら、北海道と群馬県との比較を行った。 医療圏分析の結果は、医薬品マーケティングの視点を点、から面に拡大し、より効果的・効率的な営業資源 配置や販促活動のために有用である。 今後の課題としては、医療圏分析の結果を地理情報システム ( G I S ) により可視化して、分析結果の活用を 促進することが有効と考えられる。 参考文献 ( 1 )(財)矢野恒太記念会編集:データでみる県勢 2 0 0 7 ( 2 0 0 7年) ( 2 )厚生労働省:患者調査 ( 2 0 0 5年) ( 3 )群馬県健康福祉部医務課:群馬県患者調査 ( 2 0 0 7年) ( 4 ) 大山達雄:最適化モデル分析、日科技連(19 9 3年) ( 5 ) 佐藤栄作:商圏モデ ル分析の現状と課題、オベレーションズ・リサーチ ( 1 9 9 7年 3月) ( 6 ) 大場久照、他 3名:空間的相 E作用モテツレと地理情報システム ( G I S ) を用いた受療行動モデルの構築と 空間的分析一北海道における遠隔医療整備のために 6巻 5号( 2 0 0 6年) 、医療情報学、 2 ( 7 )MasaoN a k a n i s h iandLeeG .Cooper:P a r a m e t e rE s t i m a t i o nf o rM u l t i p l i c a t i v eC o m p e t i t i v eI n t e r a c t i o nModel‑ L e a s tS q u a r e sApproach、 J o u r n a lo f M a r k e t i n g( A u g u s t1 9 7 4 ) 2 0 0 6年) ( 8 )TKC全国会医業・会計システム研究会編:病医院の経営・会計・税務(改訂新版)、 TKC出版 ( ‑ 2 7 4 ‑

269.

I r !1.‑Jie:w=総会均デミlJmJ期期問自由ムー必涯を1 基本的な集計による信用リスク判別精度 の改善手法 福本信吾 ( s f u k u m o t o @ d f v . c o . j p ) データ・フォアビジョン(株)数理分析本部 一千ーザー給一一ー探踊場担色ムI 之. . 要旨: 最新の数学を使った難しい手法ではなく、業務の知 識と単純な集計を組み合わせることにより、企業の 信用リスクの判別精度を向上させる手法、「異常値 モデル」と「限度額推計」について考え方を紹介する。 キーワード:信用リスク、企業融資、与信管理 ‑ 2 7 7・

270.
[beta]
7
ま
竺
ー;
.
t
E話量孟昌記邑国自画轟轟鑑誼記留

ミ
与
こ;
,
t.
;
:
:
ν三
J三ヨ

全体の概要
信用リスク評価について
.異常値モデルについて
たまに他の企業とは大きく異なる、異常な財務諸表(貸借対照表・ BS
、損益計算書 'PL等)が見られ、このような財務諸表を持つ先はデフ
ォルトしやすいといわれる。そこで、この 異常さ"を統計的に評価し、
企業評価に利用する方法を提案する。

・限度額推計について
財務分析では、過去の財務諸表を元に企業を評価するが、この場合
どの程度融資していいか判断がつかない。そこで、融資することで増
大する債務の返済負担を評価することにより、融資の限度額を推計
する方法について提案する。

‑まとめ
2

E
}
t
$
'
冨置藍鎧磁区

'
Z
‑
:
‑
:
:
シ三ン

信用リスク評価についてい)
・近年の信用リスクに関する話題
統計的なスコアリングモデルの導入
1¥ー
ゼ
、 jレI
I(銀行に対する新しい自己資本比率規制)の実施に
より、統計的な手法によって構築したモデルを用いて格付を付
加する金融機関が増加
すべての顧客に対して、審査マンによるエキスパートジャッジを
行うことが難しいため、小口先を中心!こ審査の効率化や規格化
のためにモデルを活用する金融機関が増加
デフォルト(債務不雇行)の増加
景気悪化により、全体のデフォルト件数、特に突然死が増加
3

‑
2
7
8
‑

271.

2 シヨシ~ヨ' 信用リスク評価について ( 2 ) 一般的なスコアリングモデルについて 長所 人手による評価と比べても、遜色のない判別力を実現 効率的で迅速な評価と、統一的な評価が可能 短所 高スコアのデフォルト先に、人手による評価ならば比較的判別し やすい先が散見 一般的な過去の財務諸表を用いた評価では、融資実行前後で 評価が不変 4 2 宝 信用リスク評価について ( 3 ) ・モデルの短所に関する人手評価の特徴 高スコアのデフォルト 極端に大きな値や小さな値など、他の財務諸表と傾向が大きく異な っている場合に怪しい財務諸表として評価を下げる、といった対応 がされている 融資実行後の評価 融資実行後の財務諸表を想定して評価する、といった対応がされ ている 5 ‑279・

272.

EltFS 置置量箇詣単語孟 沼 町 守 山 ヱ シ シ Lノ ニ 信用リスク評価について( 4 ) .スコアリングモ子、ルの強化 入手による評価の長所を、統計的な事実に基づいて評価に取り込むこ とにより、スコアリングモデルの機能を強化 高スコアのデフォルト→異常値分析 極端に大きな値や小さな値といった異常な財務諸表とデフォルト率 の関係をデータから洗い上げ、客観的な評価としてまとめる。 /融資実行後の評価→限度額推計 融資実行前後の借入金残高の変化から、債務返済負担増加によ る信用リスクの増加幅を推計する。 6 圏直置置孟置極量鐘溢盃 . . . ̲ ̲ , = 号 、 ・ . ::;.-~~...- 異常値モデルについてい) y ω ¥ .外れ値の分析での取り扱い 通常の分析 回帰分析などでモデル化する場合、大 きすぎる値や小さすぎる値は全体の傾 向を捉える上でノイズになる。 外れ値として分析の対象外とすることが 多い。 ¥日/ 財務指標値 の箱ひ I f図 ‑ 2 8 0 ‑ 7

273.

去三ンヨシ三〉 異常値モデルについて ( 2 ) ・対象外としていたデータを評価に利用 今回紹介する異常値モデル 外れ値の存在する財務諸表は通常で は考えにくい怪しい情報である データ上滅多に見られない外れ値が、 デフォルトとし巧異常な状態を表してい る可能性がある、と考えて積極的に利 用 財務指標値 の箱ひげ図 8 '!!'=‑予三シ 異常値モデルについて ( 3 ) .方法の概要 分析方法 i 立、単純な集計を組み合わせた、以下の手順となる。 二三竺~ 自己資本比率など財務指標の%点ごとにデータ件数とデ フォルト率を集計する。 ( p r o cu n i v a r i a t eとp r o cf r e qで処理可能) 一山凶一 一抽一 一の一 一況一 一状一 瓦弘一 一常一 一異一 デフォルト率が非常に高く、全体の傾向とも異なる状況を 抽出する。 (基準を決めて集計結果を目で確認) E ν 時一 一 市巴一 一ナ一 モ一 常一 一 異 一 一 の 一一 ! ! 抽出した状況を組み合わせて、信用リスクを評価する異 常値モデルを構築する。 (簡単な回帰分析等で処理可能) 9 ‑ 2 8 1 ‑

274.

置置置童量盈鐘畠量 三J ンとシシ三ン 異常値モデルについて ( 4 ) データの集計と異常な状況の抽出 財務指標の%点ごとにデータ件数とデフォルト率を集計する。また、集計結果から、異常 な(全体の傾向と異なる)状況を列挙する。 下例:売上高営業利益率(営業利益÷売上高)の集計イメージ 墨盟主主選 売上高営業利益率が大きくなればデ フォルト率が下がる、という単調性が 崩れ、デフォルト率が上昇している。 E1tM 置置箇醤越鑑 異常値モデルについて ( 5 ) .異常値モデルの構築 財務指標値の大きさそのものが問題でなく、条件に該当するかどう かが問題 →異常な状況に該当する、しないの区別をフラグ化 /個別の財務指標で見た場合、異常な状況に該当する割合が低く、 統計的に有意になりにくいため効果が限定的 →回帰分析などの手法で、複数の異常値条件を 1つにまとめてモデ l レ化 1 1 ‑282・

275.

旦吃Jシ己シ 異常値モデルについて ( 6 ) .異常値モデルの特徴 これまでの分析では、以下の特徴を確認。 異常値モデルのスコアの違いにより、デフォルトの発生頻度に差が 見られる。 異常値モデルのスコアは、単独でもデフォルトの判別に利用でき る(ただし、一般的な財務モデルよりは判別力が低い) 一般的な財務モデルで高スコアとなる先ほど、異常値モデルでデフ ォルト先を判別しやすい。 一般的な財務モデルとは異なる角度からの評価と解釈できる 1 2 ~~シ乙=シ 異常値モデルについて ( 7 ) 異常値モデルの活用例(イメージ) ︑ ︑ ︐ ︑ ︐ ︑ ︐ ︑ ︐ 一般的な財務モデルや格付との組み合わせ 異常度の高い先 をノッチダウン 異常度の高い先 の申込を棄却 J J これまでの分析では 財務モデルで高スコ アのデフォルト先を排 除する効果が見られ T こ 。 J J J' 1 3 ‑ 2 8 3・

276.

EltEF 置置魁詣盗 哩短径生子づF 三 i : : /' : ; : : ‑ : . シ 三 ン 限度額推計についてい) ・融資実行(予定)額を評価に利用 一般の財務分析 決算時の財務諸表の値を利用(融資 の実行額は評価に影響しない) 今回紹介する方法 融資実行による債務返済の負担増を 評価に取り込み(右の例は保守的に 純資産だけを減少させた場合) 14 函置面孟置量鐙詣醤函藍 喚主ヲ伊ン三ジシ己ン R 限度額推計について ( 2 ) .方法の概要 分析方法は、単純な集計を組み合わせた、以下の手順となる。 己竺士竺と」 顧客ごとに推計されるデフォルト率について、許容できる よ隈値(隈界デフォルト率)を設定する。 (前提条件なので分析不要) 己 竺 土 竺ι 」(procunivariate procfreq 財務指標の%点ごとにデフォルト率を算出する。 と で、処理可能) 仁 ヨ 空 t t J J 集計結果から限界デフォルト率に対応する借入額の上限 値(限度額)を求める。 (線形補間など簡単な補間方法で処理可能) 15 ‑284・

277.

置置置置置歯菌量盛Z 士主璽璽璽塑塑 限度額推計について ( 3 ) 指標別デフォルト率集計 借入金を定義式に含む財務指標について指標値別にデフォルト 率を集計(下図参照) 、 、 、 → !‑PD大 規 檀 デ → ι P D個 別 デ → l 7 . 0 6 . 0 5 骨 5 . 0 t 主 n 特 ト 4 .0'; 3 .0 ¥ 2 . 0 ・ 、 。 、。 1 .0 1 2 3 4 5 6 7 8 9 1 0 指 揮A 1 6 U. ンシ三ジ 笥 限度額推計について ( 4 ) .限度額算出 デフォルト率の集計結果と限界デフォルト率から、指標値の上限 (または下限)値と借入金の上限(隈度額)を算出 |ー← PD 大規樺データ ~PD 個別データ| 7 .0¥ 6凹 直亙日 指標の定義式か ら限界指標値に 対応する借入金 の上限(限度額) を算出 17 ‑ 2 8 5 ‑

278.

草笛国画畠孟直面歯謡詣歯髄孟 限度額推計について ( 5 ) 限度額推計の活用例 一般的な財務モデルや格付との組み合わせ 融資の規格化やデフォルト発生の低減を実現 里日時⑪時里⑪時⑪時厚日 毎 ザ 申 歩 易 里 担 1 8 EAS:L‑tf‑ ‑ l ! f i7 邑 艦 詣 鑑 己 記 号J 三 , j .~シシ三ン まとめ • 2つの手法の特徴 簡単な集計のみ(業務知識は必要) 一般的な財務モデルを強化 異常値モデル 高スコアのデフォルトを判別 限度額推計 :融資後の状態を評価 /新たに情報を収集する必要がない データ件数をやや多く必要とする 異常値モデル :該当率が低い 限度額推計 :デフォルト率と指標値の関係が不安定 19 ‑286・

280.

貧困度マッピング イランの事例研究 ピーダーパックト二アアルマン 東京国際大学・経済学研究科 (イラン統計局) P o v e r t yMapping:CaseStudyo fI r a n ArmanB i d a r b a k h tNia G r a d u a t eS c h o o lofEconomics, TokyoI n t e m a t i o n a lU n i v e r s i t y ( S t a t i s t i c a lC e n t e ro fI r a n ) 要旨 T h i ss t u d yt r i e st op r o v i d eap o v e r t yandi n e q u a ! i t yp r o f i ! ewhichc o u ! dbeu s e f u !t o r e c o g n i z et h ed i s c r e p a n c y~ザ any) o f p o v e r t yamongdi f J e r e n ts m a l la r e a sofI r a n .E ! b e r s e ta !( 2 0 0 2 ,2 0 0 3 )i n t r o d u c e dap a r t i c u ! a rmethodf o rw e l f i α r ee s t i m a t i o ni ns m a l la r e α s c a l l e dELLmethodT h i smethodu s e sap r e d i c t i v emode! f o rperα cr p i t ae x p e n d i t u r e .A f t e r e s t i mα t i n g mode!pα r αmeters, weα cn simu! α t eper α cr p i t αe x p e n d i t u r efor c e n s u s h O l l s e h o ! d sandf i n a l l ye s t i mα t ew e l f i α r ei n d i c α t o r s . Them e t h o d o ! o g yusedf o rw e l f i α ' r e e s t i m α t i o ni nsmα I Iα r e α sc o m b i n e st h em i c r odα t α fromtwosources,Househo!dIncome α ndE x p e n d i t l l r eSu門 句 ( H I E S )2007α ndα s αmp!eofhouseho!dsfromt h ePopu! α t i o n andHousingC e n s u s2006( 1 0p e r c e n t ) .Anα b s o ! u t epover , ち1! i n ef o rα echprovincehα s c a ! c u ! a t e du s i n gC o s tof B a s i cNeeds(CBN)methodDat αc l e α n i . r 思 d a t αprocessingα nd α c! c u ! α t i n gr e g i o nα !poverty! i n e sa ! o n gw i t ht h e i rs a m p ! i n gv a r i a t i o n sh a v eb e e ndone f u l l yi nSAS .Moreover ,t h i ss t u d yb e n e f i t sPovMap2andArcViewGIS3.2f o rm o d e ! i n g , s i m u ! a t i o nα nd mapping t h er e s u ! t s .U s i n g di f J e r e n tp o v e r t yl i n e s ,some w e l f i α r e i n d i c a t o r sh a v eb e e nc a ! c l l ! α t e di ns m a l lα r e α! e v e ! s( U r b α n / n t r a !a r e a si ne a c hc o u n t y ) . P o v e r t ymapsshowt h ed i s c r e pα n c yamongc o u n t i e si n s i d eα echp r o v i n c e . , , キーワード:s m a l la r e ae s t i m a t i o n, p o v e r t y, i n e q u a l i t y ,SASMacro, m i c r od a t a ‑289・

281.

1 .ITRODUCTION Economica n ds o c i a lw e l f a r eh a sa l w a y sb e e no n eo ft h ef o c a lma 抗e r sf o rt h eI r a n ' s h t h gove ロr m e n t si nt h el a s tt h r e ed e c a d e s .S t a t i s t i c sshowt h a tt h ei ( 1989・1 9 9 6 )and8 ( 1997‑ 2 0 0 4 )g o v e r n m e n t sa f t e rr e v o l u t i o nh a v eb e e nsomewhats u c c e s s白 1i na l l e v i a t i n g t h epove 口ya n di n e q u a l i t y .C u r r e n t l y,S a l e h i ‑ I s f a h a n i( 2 0 0 7 )h a sa n a l y z e dincomeand e x p e n d i 印r eo fI r a n i a nh o u s e h o l d sf o rt h el a s tt h r e ed e c a d e sa n dh a sf o u n dt h a tI r a n ' s s i t u a t i o nh a sb e e na l m o s ts t a b l ei nt h ec a s eo fi n e q u a l i t yi nt h el a s tf i f t e e ny e a r sb e f o r e p r e s i d e n t i a le l e c t i o n2005a n di t sp o v e r t yl e v e lh a ss i g n i f i c a n t l yf a l l e n .I nt h ec a s eof I n t e r n a t i o n a lc o m p a r i s o nh eh a si l l u s t r a t e dt h a tI r a ni si nar e l a t i v e l yr e a s o n a b l es i t u a t i o n . t h Yet ,economicd i s s a t i s f a c t i o ni st h em a j o rc o n c e r no ft h e9 governmentandi ti sg o i n g 口ya ndi n e q u a l i t yi so n eo f t oe n f o r c et h eeconomicr e f o r mi nwhicht h ee r a d i c a t i n gpove t h emaino b j e c t i v e s .F u n d a m e n t a lc h a n g e sa r es u p p o s e dt ohappeni nb a n k i n gs y s t e m, t a x a t i o nandr e d i s t r i b u t i o np o l i c i e swhicht h el a t t e ri so b v i o u s l yt a r g e t i n gt h epove 口yand i n e q u a l i t yi nI r a n .D e s p i t es u c he f f o r t sonp o v e 口yr e d u c t i o nande q u i t a b l er e d i s t r i b u t i o n, t h e r ea r en o tc o n s i d e r a b l es t u d i e sonw e l f a r es t a t i s t i c sbyt h eg o v e r n m e n t a lo r g a n i z a t i o n s s u c ha sS t a t i s t i c a lC e n t e rof I r a n( S C I ), C e n t r a lBanka n dM i n i s t r yofWelfareandS o c i a l S e c u r i t yo ri ft h e r ea r esomefews t u d i e s,t h e ya r ei nt h ecoun 仕yo rr e g i o n a ll e v e lwhich mayn o tbev e r ye f f i c i e n te s p e c i a l l yf o rr e d i s t r i b u t i o np o l i c i e s . T h i ss t u d yt r i e st op r o v i d eap o v e r t ya n di n e q u a l i t yp r o f i l ewhichc o u l dteu s e f u lf o r fa n y,o fpove 口yamongd i f f e r e n ts m a l l d e c i s i o nmakerst or e c o g n i z et h ed i s c r e p a n c y,i a r e a so ft h e coun 仕y a n di t would c e r t a i n l yb ei n s t r u m e n t a lt oe c o n o m i z et h e g o v e r n m e n t ' sw e l f a r ep o l i c i e s . 1 1 .民 1 : ETHODOLOGY E x i s t i n gl i t e r a t u r e sonp o v e r t ya n di n e q u a l i t yi nI r a nu s u a l l yt r yt oe s t i m a t ew e l f a r e i n d i c a t o r si nt h ed i f f e r e n tl e v e l sa n ds u b p o p u l a t i o n s .Aswec a ns e ei nAssadzadeha n d h e yp r e s e n t e dt h ei n f o r m a t i o ni nd i f f e r e n t P a u l( 2 0 0 4 )anda l s oSRTC's2003r e p o r t,t r e g i o n so ro c c u p a t i o n s .However ,t h e yc o u l do n l ye s t i m a t epove 口yi nt h ea r e a sa ss m a l l a sh a v i n g enough s a m p l eu n i t s 企omt h es u r v e yi n s i d et h ea r e at op r o v i d er e l i a b l e e s t i m a t e s,s ot h a tnoneo ft h es u r v e y sm e n t i o n e de a r l i e rc o u l dgol o w e rt h a nfewl a r g e g e o g r a p h i c a lr e g i o n s .Thea r e ai nwhicht h e r ea r en o tenoughs a m p l e st or e l i a b l ye s t i m a t e t h ep o p u l a t i o np a r a m e t e rd i r e c t l y企omt h eo n l ys a m p l eo b s e r v a t i o n si sc a l l e ds m a l la r e a . E l b e r se ta l( 2 0 0 2, 2 0 0 3 )i n t r o d u c e dap a r t i c u l a rmethodf o rw e l f a r ee s t i m a t i o ni ns m a l l a r e a sc a l l e dELLm e t h o d .Them a j o rd i f f e r e n c eb e t w e e ns m a l la r e ae s t i m a t i o n(SAE) modelsi nRao( 2 0 0 3 )andELLmethodi st h a tt h el a t t e ru s e se s t i m a t e dmodelp a r a m e t e r e s t i m a t i o n st op r e d i c tt h ed e s i r e dc h a r a c t e r i s t i cf o rs t a t i s t i c a lu n i t si n s i d et h ea r e a si nt h e c e n s u s,w h i l ei nt h eSAEm e t h o d si nRao( 2 0 0 3 )e s t i m a t e dmodelp a r a m e t e r sd i r e c t l y e s t i m a t et h es m a l la r e ap a r a m e t e r s .I no t h e rwords,i nR a o ' sSAEmodelsweu s u a l l yu s e c e n s u sa g g r e g a t e sa sa u x i l i a r yv a r i a b l e si na r e al e v e l,w h i l ei nt h eELLmethodwec a n b e n e f i t企omt h ec e n s u si n f o r m a t i o ni nu n i tl e v e l( h e r eh o u s e h o l d )t op r e d i c tt h esame u n it 'sd e s i r ec h a r a c t e r i s t i c( h e r ep e rc a p i t ae x p e n d i t u r e ) .I na d d i t i o n ,t h eELLmethod e n a b l e su st os i m u l a t et h er e s i d u a l st og e ts i m u l a t e de s t i m a t o r sb e s i d e st h e i rs a m p l i n g e η o r s . Ourr e s e a r c hf o l l o w st h eELLmethodf o rpove 口ya n di n e q u a l i t yi ns m a l la r e a si n ‑ 2 9 0・

282.

I r a n,b e c a u s et h ec e n s u sd a t aa r ea v a i l a b l ea n da l s ob e c a u s et h e r ea r eenougha u x i l i a r y v a r i a b l e s cornmonb e t w e e nH o u s e h o l d Income andE x p e n d i印 r eS u r v e y( H I E S )a n d c e n s u sw i t ht h esamed e f i n i t i o n s .F o l l o w i n gi sab r i e fd e s c r i p t i o nofELLm e t h o d : C o n s i d e r Yill a sp e rc a p i t ae x p e n d i t u r eo fh o u s e h o l dh ( h=1 , 2, … , ni) i na r e ai ( i=1 , 2, …, A) w hereni i st h enumbero fs a m p l eu n i t si na r e ai,andA i st h et o t a l numbero fs m a l la r e a s .Ourf i r s tc o n c e r ni st oc o n s t r u c ta na c c u r a t ee m p i r i c a lmodelo f Y i l l・T hef o l l o w i n gi sal i n e a ra p p r o x i m a t i o nt ot h ec o n d i t i o n a ld i s t r i b u t i o no fYill・ lnYih ニ E [ l nYih ; β + lIih I Xi~] +Uih ニ x ( 1 ) Whe r et h ev e c t o rXih i sana u x i l i a r yv a r i a b l ev e c t o rf o rh o u s e h o l dhi nt h ei t ha r e a I ) .Thed i s t u r b a n c eUih c o n t a i n sa l le f f e c t sn o t a n dt h ev e c t o rofd i s t u r b a n c e s1I~ F(O, e x p l a i n e dbyt h ea u x i l i a r yv a r i a b l e s .A l l o w i n gf o ra r e ae f f e c t s,t h ef o l l o w i n gmodeli s s u g g e s t e df o rd i s t u r b a n c et e r m : l Ii i+Cih h =η I nt h i smodel' J ii sana r e arandome f f e c twhichi si n d e p e n d e n tt oc ndb o t ho fthem i ha a r eu n c o r r e l a t e dt oXih An i n i t i a le s t i m a t eo fβine q u a t i o n( 1 )i so b t a i n e df r o m OLS o rw e i g h t e dl e a s t andt h e nLIih d e n o t e st h ee s t i m a t e dv a l u e so fd i s t u r b a n c e s .Weassume s q u a r e se s t i m a t i o n, no h e t e r o s k e d a s t i c i t y f o r t h e a r e a random e f f e c t . However , we a l l o w f o r h e t e r o s k e d a s t i c i t yf o rv a r i a n c eo fc F r o mt h e f o l l o w i n g d e c o m p o s i t i o n w e c a n g e t t h e ・ i h ・ e s t i m a t e dv a l u e so f η 。 C i ha n da l s ov a r i a n c eo fc i h: ' ! i '. . i h =U. +(、U.ln,‑u. )ニ η. + e " l . f l n U. , l n 1 1I Wh e r eLIi. i st h emeano fe s t i m a t e dd i s t u r b a n c e s,Uil1,o v e rh o u s e h o l d si nt h ea r e ai whiche s t i m a t e s' J i , a n de I i h‑ L I i .e s t i m a t e sCih・ Assumingal o g i s t i cf o ロn,wec a n i h =L e s t i m a t et h ev a r i a n c eo fら: σ?=rAe4α 土B ] ー 1 +eZihα Whe r eA andB a r eu p p e ra n dl o w e rb o u n d sr e s p e c t i v e l yt oa v o i de x t r e m ev a l u e sf o r t h ev a r i a n c e .T h i sf u n c t i o n a lf o r ma l s od o e s n ' ta l l o wf o rn e g a t i v ev a l u e so fv a r i a n c e .Zjh i sav e c t o ro fe x p l a n a t o r yv a r i a b l e so fs q u a r e de η o rt e r mf o rh o u s e h o l dhi nt h ei t ha r e a, a n dαisav e c t o rofmodelp a r a m e t e r s .V a r i a b l e si n c l u d e di nt h eXih c a na l s obei n c l u d e d I I I Zjh σ ; Theo t h e rcomponento fv a r i a n c ei sav a r i a n c eo fa r e arandome f f e c t s, ,whichi s e s t i m a t e dn o n ‑ p a r a m e t r i c a l l y , a l l o w i n gf o rh e t e r o s k e d a s t i c i t yi nCih • A f t e ro b t a i n i n gIw i t hs u b s t i t u t i n gð~ ,δ ‑ ;a n ds a r 叩 l i n gw e i g h t so fh o u s e h o l d s, wec a n g e tt h eGLSe s t i m a t eo fv e c t o ro fp a r a m e t e r si ne q u a t i o n( 1) ; βGLS andi t sv a r i a n c e, V( β'GLS). ‑ 2 9 1 ‑

283.

Thel a s ts t e pi st os i m u l a t er e s i d u a l sT / ja n de . T h ee s t i m a t e so ft h ew e l f a r es t a t i s t i c s i h a r et h emeano fw e l f a r em e a s u r e m e n t so v e ra l ls i m u l a t i o n s . I .DATA I I Them e t h o d o l o g yu s e df o rw e l f a r ee s t i m a t i o ni ns m a l la r e a sc o m b i n e st h ed a t a企om t h es u r v e y( H I E S )a n dt h ec e n s u s, s ot h e s etwod a t as e t sa r eu s e di nt h i ss t u d y : 1 . Surveyd a t a :H o u s e h o l dIncomea n dE x p e n d i t u r eS u r v e y( H I E S )i so n eo ft h emost i m p o r t a n ts u r v e y sc o n d u c t e da n n u a l l ybySC I .t h el a t e s td a t aa v a i l a b l ea r eHIES 2007whichi sf o r t u n a t e l yo n l yo n ey e a ra 丘e rt h ep o p u l a t i o nandh o u s i n gc e n s u s 2 0 0 6 .TheHIESc o l l e c t sd a t aont h eh o u s e h o l d s 'e x p e n d i t u r e sd u r i n gt h el a s tmonth o rt h el a s t1 2months, d e p e n d i n gont h eザpeo fe x p e n d i t u r e .A l t h o u g ht h e r ea r esome q u e s t i o n sonincomea n di n v e s t m e n t ,weu s eo n l yh o u s e h o l d ' se x p e n d i t u r e sf o ro u r pu 叩o s e .T h i sd a t as e ti n v o l v e sa b o u t1 5, 0 0 0s a m p l e dh o u s e h o l d si nu r b a na n d 1 4000s a m p l e dh o u s e h o l d si nr u r a la r e a s . T h e r ea r et h r e ed a t as t r u c t u r e s,d e p e n d i n gont h eq u e s t i o n n a i r es e c t i o n s : ‑ Householdc h a r a c t e r i s t i c s Householdmembers' c h a r a c t e r i s t i c s E x p e n d i t u r e( i n c o m e )i t e m s え C ensusd a t a :Thep o p u l a t i o na n dh o u s i n gc e n s u s2006h a sam a j o rd i f f e r e n c e企om t h ep r e v i o u sc e n s u s e si nI r a n .T h i sc e n s u sh a sb e e nc o n d u c t e da l o n gw i t hs a m p l i n g . T h e r e f o r e,t h e r ea r et w ok i n d so fq u e s t i o n n a i r ef o r m s ;s h o r tf o r mwhichc o n t a i n s q u e s t i o n st owhicha l lh o u s e h o l d sa r es u p p o s e dt oa n s w e r ,andl o n gf o r mwhich c o n t a i n sq u e s t i o n so n l yf o rs a m p l e dh o u s e h o l d s .T h i sr e s e a r c hb e n e f i t sfromc e n s u s i n f o r m a t i o no f1 0p e r c e n to ft o t a lh o u s e h o l dp o p u l a t i o n( a l m o s t1 .7 m i l l i o n h o u s e h o l d s ) . ‑ Householdd a t a s e t ‑ / n d i v i d u a ld a t a s e t A l ld a t ab a s e sa r ei nSASf o r m a ta n di ti se a s yt oc o n v e r tthemt od b ff o r m a t ,s ot h a t t h e yc a nbes i m p l yi m p o r t e di no t h e rs o 丘w a r e .D a t ac l e a n i n gandd a t ap r o c e s s i n ga r e d o n ef u l l yi nSAS. ヲ I V .POVERTYLINES Tom e a s u r ep o v e r t yi n d i c a t o r si nas o c i e t ywen e e dac r i t e r i o nbywhichi n d i v i d u a l s . tP o v e r t yl i n ei sam o n e t a r yc o s tt oag i v e n c a nbed i s t i n g u i s h e db e t w e e nb e i n gp o o ro rno p e r s o n, a tag i v e np l a c ea n dt i m e, o far e f e r e n c el e v e lo f w e l f a r e( R a v a l l i o n1 9 9 8 ) .Tot h e b e s to fmyknowledget h e r ei sn o ta no f f i c i a lp o v e r t yl i n ef o rt h er e c e n ty e a r si nI r a n .The l a s ts t u d yd o n ebySCI( 2 0 0 4 )comparedp o v e r t yl i n e sf o r1 9 9 1 ‑ 2 0 0 1b a s e donf o u r d i f f e r e n tm e t h o d s, b u td i dn o to f f e rp a r t i c u l a rm e a s u r e sa so f f i c i a lp o v e r t yl i n e s .Theo n l y measurementwec a nr e l yona sa no f f i c i a lp o v e r t yl i n eh a sb e e nr e p o r t e dbyManagement a n dP l a n n i n gO r g a n i z a t i o no fI r a n .However , t h e s ep o v e r t yl i n e sa r ei nt h en a t i o n a l l e v e l, s oi no r d e rt ou s et h e s ep o v e r t yl i n e si nr e g i o n a ls t u d i e s,wen e e dv e r yr e s t r i c t i v ea n d ‑292・

284.
[beta]
r
e
a
l
i
s
t
i
ca
s
s
u
m
p
t
i
o
nonconsumptionpa
抗e
m.D
i
f
f
e
r
e
n
c
e
sbetweenr
e
l
a
t
i
v
ep
r
i
c
e
s,t
a
s
t
e
s,
l
i
f
es
t
y
l
e
s,
e
t
c
.c
a
nh
i
g
h
l
ya
f
f
e
c
tt
h
ec
o
n
s
u
m
p
t
i
o
npa
抗ema
ndc
o
n
s
u
m
e
r
'
sp
r
e
f
e
r
e
n
c
e
s
.For
t
h
e
s
er
e
a
s
o
n
s,wet
r
i
e
dt
os
e
tana
b
s
o
l
u
t
ep
o
v
e
r
t
yl
i
n
ef
o
re
a
c
hp
r
o
v
i
n
c
eu
s
i
n
gC
o
s
tof
19
9
8
)w
i
t
hs
l
i
g
h
tm
o
d
i
f
i
c
a
t
i
o
n
s
.
B
a
s
i
cNeeds(CBN)m
e
t
h
o
d
.Wef
o
l
l
o
w
e
dt
h
eR
a
v
a
l
l
i
o
n(
Table1
.RegionalpovertyI
inesandt
h
e
i
rC
o
e
f
f
i
c
i
e
n
to
fv
a
r
i
a
t
i
o
n(
p
e
rpersonper

P
r
o
v
i
n
c
e

Ar
d
e
b
i
l
B
u
s
h
e
h
r
C
h
a
h
a
rMaha1
E
a
s
tA
z
e
r
b
a
y
j
a
n
F
a
r
s
G
h
a
z
v
i
n
Ghom
G
i
l
a
n
G
0
1
e
s
t
a
n
!
H
amadan
!
H
ormozgan
I
lam
I
s
f
a
h
a
n
l
K
erman
陸 rmanshah
1
K
h
0
r
a
s
a
nR
a
z
a
v
i
同lU
z
e
s
t
a
n
1
I
<
0
h
g
i
l
o
o
y
e&Boyrahmad
区ordestan
ルo
r
e
s
t
a
n
l
Markazi
l
Mazandaran
~o口h Kh
o
r
a
s
a
n
Semnan
S
i
s
t
a
n&B
a
1
u
c
h
e
s
t
a
n
r
a
s
a
n
S
o
u
t
hKho
~ehran

l
WestAzerbayjan
同
{
a
z
d
~anjan

空型型り「

Urban
RuraI
PovLine CV(%) PovLine CV(%)
3
.
2
6586510
3847055 3
.
6
5432302
2
.
9
4426987 2
.
2
5771219
3
.
9
4095855 2
.
8
2
.
5
5574455
4609946 2
.
9
2
.
7
7408872
5262260 1
.
1
7630200
3
.
6
4586505 4
.
3
6159308
5
.
5
4870896 3
.
3
7
3
8
2
5
4
1
5
.
7
4
9
9
5
6
7
1 3
.
3
6114496
6
3359145
1
.2
5
9
0
0
5
6
1
3
3804405
1
.
7
2
.
3
7388464
4301612 2
.
2
2
.
8
6
7
3
1
6
9
3
4287403 2
.
8
8
4
6
4
7
2
3
6
6050008
6
2
.
8
5823059
3232462 4
.
3
4982818
3
.
5
3784013 2
.
9
5572260
3
.
5
3671578 4
.
2
3
4413418
6611886
1
.4
7700862
3
.
5
4283196 4
.
2
4728583
3
.
8
4230092 2
.
5
4
.
8
4276567 3
6500878
.
2
4507994 2
6669308
3
.
3
.
1
7025060
5
.
3
5682180 2
.
9
6181904
5
.
9
3442060 2
.
3
7517644
2
.
8
4079845 3
.
2
4533028
3
.
7
3042966 1
.9
5096149
3.
2
3374438
1
.
7
9603834
3
.
2
7062776 0
.
9
2
.
6
5775083
4625370 4
.
2
6
7971198
5466020 4
.
2
4
.
1
6530138
3376293 5
.
9
6
3
6
8
8
2
0
4
2
0
4
6
9
7

L
;= C 2200.

Foodl
i
n
ei
叩 r
o
v
i
n
c
ei
:

X

i

Cj : Averagec
o
s
to
f
C
a
l
o
r
i
ei
nr
e
f
e
r
e
n
c
eg
r
o
u
p日
(r
s
tq
u
a
r
t
i
l
e
)i
np
r
o
v
i
n
c
e.
i

ぐ
二
子

TF

Upperpove
町 l
i
n
ei
n戸 o
v
i
n
c
ei
:

‑
2
9
3
‑

285.

兵:Averagefood‑sharei nr e f e r e n c eg r o u piηrovince. i 町 l i n eiηmimei : L fニ L ;x(2‑S Lowerp o v e j) u L~ +L Po刊 v e 町 l i n e伽 i f O 町r 戸 p r 仰o v 泊 悶 n m 1 wh 児 e r 閃e L f F, L印 a n dLLN a r ef o o dc o m p o n e n to fp o v e 口yl i n e, u p p e ra n dl o w e rb o u n d sf o r ,r e s p e c t i v e l y .T a b l e1s h o w st h er e g i o n a lpove 吋yl i n e sa n dt h e i r n o n ‑ f o o dcomponent C o e f f i c i e n to fV a r i a t i o n( C V ) .A MonteC a r l os i m u l a t i o np r o g r a mh a sb e e nw r i t t e nby SASMacrol a n g u a g e( a p p e n d i x l )u s i n gb o o t s t r a pmethodt oc a l c u l a t eCVs. V . RESULTS 口yl i n e sa n dp r e d i c t e dh o u s e h o l de x p e n d i t u r ei nc e n s u s,pove 口y U s i n gr e g i o n a lp o v e .F i g u r e s1a n d h e a dc o u n tr a t i oa n dG i n ii n d e x( a p p e n d i x 2 )a r ec a l c u l a t e di nc o u n t yl e v el 2d e p i c tt h ep o v e 口yr a t i oi nu r b a na n dr u r a la r e a sr e s p e c t i v e l y .Fromt h e s ef i 思l r e swec a n o b s e r v et h ed i s p a r i t yo fp o v e 吋yr a t ea c r o s sc o u n t i e si ne a c hp r o v i n c e .I ti sv e r yc o s t e f f e c t i v ei np r o ‑ p o o rp o l i c i e st ou s et h i si n f o r m a t i o nf o rb u d g e ta l l o c a t i o na n da l s o i n f r a s t r u c t u r ei n v e s t m e n t s .Thesames t o r yi st r u ef o ri n e q u a l i t ym e a s u r e si n目別r e s3a n d 4 .F i g u r e s5a n d6d e p i c tt h er e s u l t sf o r同 l o ‑ s a m p l et ‑ t e s tb e t w e e np o v e 吋yr a t i o so f c o u n t i e sa n dt h e i rc o r r e s p o n d i n gp r o v i n c e .I nt h e s ef i g u r e sd a r ks h a d e da r e a sshowt h a t p o v e 吋yr a t i oi nt h ec o u n t i e sa r es i g n i f i c a n t l yh i g h e rt h a ng e n e r a ll e v e lo fpove 口yi n p r o v i n c e, a n dl i g h ts h a d e da r e a sshowt h a tt h i sm e a s u r ei ss i g n i f i c a n t l yl e s st h a np r o v i n c e l e v e l . F i g u r e1 .HeadCountR a t i oi nCountyl e v e l( u r b a na r e a s ) Headcount田 t i o 亡 コ <0.06 仁 二 コ 0.06・0.12 E二 コ 0.12・ 0.18 ̲0.18・ 0.25 ̲ 0.25> 来 w ‑ 2 9 4 ‑ E

286.

F i g u r e2 .HeadCountR a t i oi nCountyl e v e l( r u r a la r e a s ) Headc o u n tr a t i o E <0.06 仁 二 コ 0.06・0.12 亡 二 コ 0.12・ 0.18 . 2 5 ̲0.18・ 0 ̲ 0.25> コ キ w E F i g u r e3 .G i n iI n d e xi nCountyl e v e l( u r b a na r e a s ) G i n iindex c コ0.25 0.37 ・ 亡 コ 0.37‑0.39 . 4 2 ̲0.39・0 ̲0.42・0 . 5 3 キ w ‑ 2 9 5 ‑ E

287.

F i g u r e4 .G i n iI n d e xi nCountyl e v e l( r u r a la r e a s ) 目 。0.2325 00..3375 G i n iindex ・ ・ EO3M伺 ぉ 必 ず s 0 . 4 0‑0 . 5 0 F i g u r e5 .T ‑ t e s tR e s u l t s( u r b a na r e a s ) 口口[] キ w ‑296・ E

288.
[beta]
F
i
g
u
r
e6
.T
‑
t
e
s
tR
e
s
u
l
t
s(
r
u
r
a
la
r
e
a
s
)

亡コ梅田

E21l

キ

E

Acknowledgements:
Iamg
r
a
t
e白 1t
oP
r
o
f
.A
t
s
u
s
h
iMakif
o
rh
i
sc
o
n
t
i
n
u
o
u
sa
d
v
i
c
e
st
oimprovet
h
i
sr
e
s
e
a
r
c
h
.
u
g
g
e
s
t
i
o
n
sandf
r
u
i
t
f
u
l
Iwoulda
l
s
ol
i
k
et
ot
h
a
n
kP
r
o
f
.S
e
t
s
u
oSuohf
o
rh
i
sh
e
l
p白 1s
a
r
e
.
c
o
u
r
s
e
sonSASs
o丘w
訟renc
白
Rej

(
1
)A~sadzacieh, A
.a
.
9S
.p
a
u
l(
2
0
Q
4
), P
o
v
e
r
t
y
,g
r
o
w
t
h,a
n
dr
e
d
i
s
t
r
i
b
u
t
i
o
n
:as
t
u
d
yo
f
I
l
Review0
1
DevelopmentEconomics
I
r
a
n
"
,

(
2
)Q
j
a
v
a
d
.S~)~hi品fahani (
2
0
0
7
), P
o
y
e
r
t
y
.
,I
n
e
q
u
a
l
i
t
y,andP
o
p
u
l
i
s
tP
o
l
i
t
i
c
si
nI
r
a
n
",
J
o
u
r
n
a
l0
1
Economicl
n
e
q
u
a
l
i
t
y
,f
o
r
t
h
c
o
i
n
i
n
g
(
3
)Elb~rs, ~C~s,_Je_an Q
.Lanjo_u~t a
I
]
.dP
e
!
e
rLa吋ou~_(20~) ,“Micro-Level E
s
t
i
m
a
t
i
o
n
P
o
l
i
c
yRese
a
i
‑
c
hWorkingPaperN
o.2
9
1
1,
TheWorldBank
,
O
c
t
o
b
e
r
o
f
W
e
l
f
a
r
e
",
2002
(
4
)E
!
b
e
r
s,C
h
r
i
s,
̲
J
e
a
nO
.L
a
n
j
(
)
u
w
,andP
e
t
e
ILanjouw~(_2003) ,“Micro-level E
s
t
i
m
a
t
i
o
n
ofP
o
v
e
r
t
yandI
n
e
q
u
a
l
i
t
y
"
E
c
o
n
o
m
e
t
r
i
c
a7
1
:1
,
t
p
.355364
(
5
)Rao,
J
.
N
.
K
.(
2
0
0
3
),
S
m
a
l
lAreaE
s
t
i
m
a
t
i
o
,
.NewY
o
r
k
:JohnWiley& Sons,
I
n
c
a
!
}
:
i
n
.(
1
̲
2
9
.
8
)"P~verty LjI].e~_ j
n_rh~ory a
̲
I
]
.
<
f:
r
:
'
r
̲
a
c
t
i
c
e
"
̲
L
l
v
i
n
gS
t
a
n
d
a
r
d
s
(
6
)R
a
v
a
l
l
i
o
n,M
MeasurementS
t
u
d
yW
o
r
k
i
n
gPapa133,WorldBank,WashingtonDC

(
7
)S
t
a
t
i
s
t
i
c
a
lR
e
s
e
a
r
c
handT
r
a
i
n
i
n
gC
e
n
t
e
r(
2
0
0
3
),C
a
l
c
u
l
a
t
i
o
nofP
o
v
e
r
t
yL
i
n
ei
nI
r
a
n
"
a
t
伊t
i
c
a
lR
e
s
e
a
r
c
handT
r
a
i
n
i
n
gC
e
n
t
e
r(
2
0
0
2
), MeasuringP
o
v
e
r
t
yI
n
d
i
c
a
t
o
r
si
n
(
8
)戸t
uan'

~297~

289.
[beta]
APPENDIX1
:
A SASMacroprogramhasb巴巴nu
s巴df
o
rc
a
l
c
u
l
a
t
i
n
gsamplingeπorsf
o
rpov巴r
t
yl
i
n
e
s
.I
nt
h
i
s
program%
povlinei
samacropackag巴 whichc
a
l
c
u
l
a
t
巴sr
巴g
i
o
n
a
lpov巴r
t
yl
i
n
巴sb
yu
s
i
n
gCBN
method.T
h
i
spackages
h
o
u
l
db巴 s
a
v巴di
nl
i
b
r
a
r
y"
h
i巴s
"
.
OPTIONSMSTOREDSASMSTORE=hies;
%po仰 e

p
r
o
c什eadata=samplen
o
p
r
i
n
t
;
t
a
b
l
ep
r
o
v
i
n
c
e
/
o
u
t
=
s
a
m
̲s
i
z
e
(rename=(count=̲
n
s
i
z
e
̲
)
)
;
礼m
;
d
a
t
asample;
s
e
th
i
e
s
.
s
u
r
v
e
y
;
s
i
z
e
O
=
1
;
r
u
n
;

%
i
f&
j
=
1%then%do;
d
a
t
ap
o
v
l
i
n
e
;
s
e
tp
o
v
l
i
n
e
O
;
r
u
n
;
%end;
%else%do;
d
a
t
ap
o
v
l
i
n
e
;
s
e
tp
o
v
l
i
n
ep
o
v
l
i
n
e
O
;
r
u
n
;
%end;
%end;
%mend;

%macrob
o
o
t
s
t
r
p(
n
)
;
%doj
=
1%to&
n
;
p
r
o
cs
u
r
v
e
y
s
e
l
e
c
tdata=sample
method=pps̲wrn=sam̲size out=sample1
t
n
o
p
r
i
n;
s
t
r
a
t
ao
s
t
a
n
;
s
i
z
es
i
z
e
O
;
r
u
n
;

%bootstrp(
n
=
10
0
)
;

d
a
t
asample1;
s
e
tsample1;
i
fNumberHits>1t
h
e
nd
o
;
doi
=
1t
o(
N
u
m
b
e
r
H
i
t
s
‑
1
)
;
o
u
t
p
u
t
;
e
n
d
;
e
n
d
;
t
outpu;
dropi
;
r
u
n
;

p
r
o
cs
o
r
td
a
t
a
=
p
o
v
l
i
n
e;byo
s
t
a
n
;r
u
n
;
p
r
o
cmeansd
a
t
a
=
p
o
v
l
i
n
ecvn
o
p
r
i
n
t
;
v
a
rm
i
d
̲
l
i
n
e
;
byo
s
t
a
n
;
o
u
t
p
u
tout=hies.CV(
d
r
o
p
=̲
t
y
p
e
一
)cv=cv̲mid̲line;
f
r
e
q
r
u
n
;

APPENDIX2:
Twow
e
l
f
a
r
巴i
n
d
i
c
a
t
o
r
shavebeenu
s
e
di
no
u
rr
e
s
e
a
r
c
ht
ocompares
m
a
l
la
r
e
a
s,p
o
v
e
r
t
yhead
c
o
u
n
tr
a
t
i
oandG
i
n
ii
n
d
e
x
.Thef
o
r
m
e
ri
sas
p
e
c
i
a
lformo
faf
a
m
i
l
yo
fp
o
v
e
r
t
yi
n
d
i
c
e
sknowna
s
F
o
s
t
e
r
‑
G
r
e
e
r
・T
horbecke(
F
G
T
)
.
Foster‑Greer
・T
horbecke(FGT):

ぇ
=
玲 wJ子L
t (Yi<Z , W ニト)
p
a=Heαdcountrαtio ,p
r=Povertygap,~二 Poverty severity
WhereZ i
sp
o
v
e
r
t
yl
i
n
e,Y
ii
sincome(
e
x
p
e
n
d
i
t
u
r
e
)f
o
ri
t
hpoori
n
d
i
v
i
d
u
a
l,npnumberof
st
h
esamplingweightf
o
ri
t
hsamplingu
n
it
.
poori
n
d
i
v
i
d
u
a
l
sandwii

Giniind
α
,J

̲,
̲
̲,
̲
̲

~
W+l
三~WiYJPi +O.5(w
‑
1
)
] 一一一
W(W‑
1
)
"
V
‑
"
'
7
"
'.
.
,
.
.
,
"i
' " W‑l
Piニ ρ'i‑l+町
一1(
i>1
) , ρ
'
1=1

Gini二

2
9
8

ー

・

290.

T a b l eI I I .B a s e l i n ev a r i a b l e sb yt r e a t m e n lg r o u pi n5 0c l i n i c a ll r i a lr e p o r t s N u m b e ro ft r i a l s N u m b e ro fb a s e l i n ev a r i a b l e sc o m p a r e d N o n e O n et of o u r F i v et on i n e 工 s 日 1 l L l 2 2 0t o2 9 rm o r e 3 0o 4 1 4 2 1 2 S i g n i f i c a n c et e ぉ f o rb a s e l i n ed i f f e r e n c ep e r f o n n e d Y e s N o 2 4 2 6 B a s e l i n ei m b a l a n c e sn o t e d Y e s N o 1 7 3 3 7 用語分散分析と共分散分析 ANOVA: 企凶a l y i s i sOfVAriance 分散分析(群間比較) ANCOVA:企N a l y I s i so fCOVAriance 共分散分析 反応変数に相聞にある変数 C(共変量)を 考慮した分散分析ANOVA(群間比較) B ‑ 3 0 4 ‑

291.

Table 1 .Subgroup nnal)'叫~S i n50c l i n i c a lt r i u l r~port、. Num~r 0 ' 1t r i a l s \V~rc 凶 ubg: roup a n a l y s c : : : .r e p o r tlZJ? ベ ー 1 5 ~、 No ιUT33525 NUl1lb c rofb 出 d incf~lC to日 induJcJ 甲 手 。 Four FI ¥ ‑ et os i x S c ¥ ' c no r11l0 r c 666 848‑ ‑42 7 日一ド c rofoutcomcs品o rsubgroupanalyメ i~ NUl1lb Two ' 0 Thrcct o日¥ S i xo rmorc T o t a l nU Ill ~r 0' 1s u bt!r o l l Da n a l v s c s ︒ Onc T ¥ ¥ " o Thrcct o品 、c Is j xt oe h ; b t 1 1t o24 UnじI c a r 、 S t a t i s t i c a l I11c t h o JlI S~J f o rsubgroupa n a l y s i s D e s c r i p t i co n l y 占出話量 lu 白 SubgroupJ i t f c r cl 1c c sdaimcd No I~ No a I fv c s : Subgroupじl a iI11 f c ‑a t u r c ui na b s t r a c tanuo rc o n c l u s i o n s Tablc 1 . 1 Co¥"uriatcudjllstmcnt i nu n u l y s i s ofp a t i c n t responscby trcanncnt . Nllmber0' 1t r i a l s 川 L工~一一 勺広石平 cha n a J y s c sr c c e i ¥ 吋 morcempl 凶 S Covari 広I t oa d j u s t c J Equalcl 1 Ip h a s i s One Two T I l n : c 61C24 、 N山 nberofco an川 e si nc 1udcJ 陸出血 早 川 司 1 f3 ?む 、 Onlyu n a J j u s t e Jg i en 心ustedgI ¥" e n Onlya 、 Rcasons1 ' O rc h o i c eofco a r i a t c s 、 。 、 。 ‑ 3 0 3・ 1 5 ‑54321 、 i en No陪 出 回1g ι a r i a t e swere( o re x :pectcdt obc)p r o g n o s t l c C o ¥ ' a r i a t c s imbaktnceJb c t ¥ ¥出 ngroups rcounh y "a d j u s t c J1 f 町 Cent問 o B a s c l i n e¥ ' a l u eofq u a n t i t a t i ¥ ' eoutcomc Oth e rt r e a t m e n tf a c t o ri na t a c t o r i a lt r i a l c ariatcsusedinstrati自cdr国 ldomization b DiJc o ¥ " a口a t ea J j u s t e da n a l y s i s. d t e r t h et r i a lcondusions 、comparcdt o u n a J j u s t e da n a ! y s c s ' ? 辺 M 司け l J : : !o ̲u n n d i u s t e donlv ¥ V e r e primaryoutcomea n a l y s c sdonc l Ismg印 v a r i a t cadjustment?

292.

医学論文における サブグループ解析圃共変量調整の現状 STATISTICSINMEDICINE2002;21:2917‑ 2930 c o v a r i a t eadjustment Subgroupa n a l y s i s, andb a s e l i n e comparisonsi nc 1i n i c a lt r i a l n g :c u r r e n tp r a c t i c e and repo代 i problems S t u a r tJ .Pocock, SusanE .Assmann, LauraE .EnosandL indaE .Kasten 3 対象ジャーナル 1群当たり 50例以上の無作為化臨床試験 1997年 7月 9月に公表された計 50報 "'‑J B r i t i s hM e d i c a lJ o u r n a l(BMJ)5報 NewEnglandJ o u r n a lo fMedicine(NEJM)24 報 J o u r n a lo ftheAmericanM e d i c a lA s s o c i a t i o n (JAMA)6報 Lancet 15幸~ 4 ‑ 3 0 2 ‑

293.

E}iE Ft置置置箇箇盛室二三三璽璽翠醤盟 SASによる共分散分析 浜田知久馬 東京理科大学 ANCOVAusingSAS ChikumaHamada TokyoU n i v e r s i t yo fScience 発表構成 ・医薬研究における現 ‑共変量調整の役割 .交絡とは ・共変量調整の原理 ‑共分散分析のモデルと数理 .SASによる解析と解釈 冒共分散分析の適用例 ‑ 3 0 1・

295.

分散分析 ANOVA: 企N a l y i s i sOfV企r l a n c e 分散 ( v a r i a n c e ):ぱらつきを表す統計用語 分散分析:データのばらつきを構成する要因が複数 存在するときに個々の要素に分解 二元配置 ( t w o ‑ w a y )分散分析 要 因 の 例 ) 薬 剤 (A,8,C) 用量 ( 6, 7, 8 ) 9 薬剤 C B A V 90 . 80 ド コ T ド 〉 主 車 " ' ヰ ヤ , 、 傘 牢 : 主 ヰ 50r ド 〉 斗 、 ホ 4 4 0 1 本 ‑ * 4 ド 〉 十 ' ド コ 〈 十 三 斗 ' 日 ー 私 ? 30~ A6 8 A7 A8 B6 B7 B8 C6 C7 C8 7 6 8 7 6 8 7 品 用量 ‑ 3 0 5 ‑

296.

共変量調整の役割 共変量:c o v a r i a t e s 調整:a d j u s t 1)群聞の共変量の分布の偏りの除去 交絡の調整 群聞の平均値の差を偏りなく推定 2)共変量に由来する誤差変動の除去 解析の精度,検出力の向上, 群聞の平均値の差の分散の低下, 信頼区間幅の減少 1 1 ダーツ投げの 偏り C b i a s )と精度 ( p r e c i s i o n ) & 、 1 2 ‑ 3 0 6 ‑

297.

。 i E ダーツ投げの偏りと精度 不偏で精度がよい 偏りあるけど精度はよい 。 。 ‑ 日 ‑ 0 不偏だけど精度が悪い • • • • • 偏りありかつ精度が悪い • • ・• • • • 1 3 交絡 ( c o n f o u n d i n g )とは 反応 ( r e s p o n s e ) 交絡因子 交絡因子( c o n f o u n d i n gf a c t o r )の必要条件 1)薬剤投与と関連する. 2 )反応と関連する. 3 )薬剤投与と反応の中間媒介変数ではない. ‑307・

298.

交絡 ( c o n f o u n d i n g ) IJ;l ・血圧と給料の聞には正の相闘がある 一 一 ・給料を上げるためには塩辛いものを食べれ ばよいのか? ・年功序列的に給料は上がる(正の相関)• ・年齢が上がれば血圧も上がる(正の相関)• .年齢という第 3の因子が交って絡んで, 見かけ上の相聞が生じる.年齢だ交絡因子 ヰ摺¥よ ‑ 3 0 8 ‑ 1 6

299.

交絡の例 通愛知 年齢 1)血圧と給料には正の相聞がある 2 )年齢と血圧は正の相聞がある じP 3 )年齢と給料には正の相聞がある 一 年齢が,交絡して,血圧と給料に見かけ上 の正の相聞を生じさせる. L 「新入社員は給料も血圧も低い.部長は給料も血圧も高い.J17 交絡に対する対処 1)デザインの工夫 無作為化,層別割付,最小化割付 2 )解析法の工夫 a )共変量の群聞の偏り, 共変量の反応変数との関連の解析 b )デザインベースドの解析 層別,層を併合した MH流の調整解析 c )モデルベースドの調整解析 重回帰,ロジスティック回帰, COX回帰 ‑ 3 0 9 ‑ 18

300.

交絡への対処 交絡因子 ( C ) Cの群聞の偏りの解析 Cと反応変数 無作為化割付 の関連評価 デザインベースドの解析 モデルによる 調整解析 1 9 調整した解析 ( a d j u s t e da n a l y s i s ) 複数の交絡因子の影響を同時に考慮した解析 ‑目的:交絡因子の偏りの除去,精度の増大 調整しない解析の妥当性を保証 ・方法:1)デザインベースドの調整解析 交絡因子の値が近い個体間で比較 層別,層を併合した重み付き平均を算出, 2 )モデルベースドの調整解析 共変量の影響のモデル化と除去 重回帰, Cox回帰,口シゃスティック回帰 2 0 司 3 1 0 ‑

301.

収縮期血圧の例(単位:mmHg) 薬剤 P( ブラセボ群) 生データ 平均 年齢 39 41 42 43 43 44 45 46 47 49 43.9 血圧 95 99 106 111 115 116 101 117 104 119 108.3 薬剤 A( 実薬群) 生データ 平均 36 37 38 39 39 40 41 42 44 47 40.3 血圧 88 94 96 92 98 89 103 97 110 105 97.2 年齢 血圧の t検定:p=O.0051料 * 年齢の t検定:p=O.0200 有意な結果は年齢の交絡のためか? 2 1 収縮期血圧のプロット 平均: 108.3 平均: 9 7 . 2 血 . 圃 圧 p • • E E 置 E 薬剤 P 2 1 血圧の t検定:p=O.0051 林 311・ ー 薬剤A ‑ 22

302.

GLMによる調整しない解析 ・ l n u nue 41gb 凋斗円d an34l onuununuunu nL+L+L1It‑ H u ︐ . a n u ‑ ‑ nド ﹁ 7'41 4l 0 4L4L 二 n ・ ' 凋 斗 凋 斗 qu 凋 斗 ・ ︐ ‑ a u ‑ I l ‑ ‑ l︐ AU lnU4E n H ・'戸 n u =oeSRu‑‑nHunud 庁 Au a 6 ・'Aunud‑‑nHunHU 4LAur aonanudA ・戸 OnU d 円 A ・ 円φ 凋 斗 JGAueG nド +L H u +L H U O nド ぬ脚 ν ぬ脚 v 31 1 1 4 31 1 5 4 21 0 64 71 0 44 91 1 9 4 61 1 74 99 23 99 8 3 89 63 41 1 04 71 0 5 4 29 74 procglm: class g ; model b p = g ; I s m e ans g/pdiff tdiff; 23 調 整 前 分 散 分 析( t検定)の結果 Source I DFI SumofSquaresI MeanSquare Model 616.050000 616.050000 Error 1091.700000 60.650000 CorrectedTotal 1707.750000 gI bpLSMEAN 95%ConfidenceL imits 1 1108.300000 1103.126013 1113. 473987 92.026013 最小 2乗平均 I102.373987 平均値の差と信頼区間 LeastSquaresMeansf o rE仔'ectg 1I J σ 行denceL imitsforLSMean(i ) ー DifferenceBetween 95%Con ) LSMeanu Means 112 11 .100000 3.782877 ‑ 3 1 2・ 24

303.

年齢のプロット 平均: 4 3 . 9 平均: 4 0.3 • 4 8 l • 4 6 j . . . ..................................• • 年仲 • • 齢 42 • 4 0 l • 3 8 l • • . . E E . . . . . . . . . . 圃 • • 3 6 l 薬剤 P c 1 . 薬剤A E 年齢の t検定 : p二 0 . 0 2 0 0 . . i * 2 5 po 圧 血 bE 年齢と血圧の散布図 + 白 十 + + ± + 目 。 十 + + + + + r = 0 . 7 8,p < 0 . 0 0 0 1 , ̲T T ‑‑‑T ,-,.--一一ーマーァー守~マ「戸寸~~一ーマ 36 37 38 39 40 41 42 43 44 45 46 47 48 49 age 年齢 g ++十 1+++ 2 薬剤 P 薬斉!JA ‑ 3 1 3・ 2 6

304.

' 薬剤と血圧と年齢 tぬ 薬斉U I ~血圧 │哩型ミ b AP R ‑ 手齢 1)薬剤群には年齢が若い人が多い. 2 )年齢と血圧は正の相関がある. 3 )年齢が,交絡して,薬剤と血圧に見かけ上の関連を 生じさせる. 27 共変量調整の原理 1)共変量の値が似ている個体同士で比較 マッチング 層別解析 句者"'‑ 2 )数学モデルによる共変量の影響の除去 共分散分析 28 ‑ 3 1 4 ‑

305.

年齢の影響の調整 1 )マッチング 薬剤 P 生データ 平均 年 齢 39 41 42 43 43 45 46 47 49 43.9 血圧 95 99 106 111 115 116 101 117 104 119 108.3 生データ 薬剤 A 平均 年 齢 36 37 38 39 3旦 40 担 金2 47 40.3 血圧 88 94 96 92 98 89 103 97 110 105 97.2 年齢が同じ個体を集めて比較. 年齢分布が強制的にそろえられる E マッチしない個体が多くなる. 29 年齢の影響の調整 2 )層別 薬剤 P 平均 生データ 年 齢 39 41 42 43 43 44 45 43.9 ω生 薬剤 A タ 95 o‑ア 血圧 95 99 106 111 115 116 101 117 104 119 108.3 113.3 平均 36 37 38 39 39 40 41 42 44 40.3 血圧 88 94 96 92 98 89 103 97 110 105 97.2 93.6 99.75 105 年齢 年齢の層ごとに平均値の差 → 、 N3吋 付 け 汽 併 貴u重 均 値 の 差.r 司司、 t・, rt・ 司 V[μi2‑μ i 1 Jニ ニ ー + ニ ー ラ Wi= ‑11 ni2 ni 1 ‑ 3 1 5・ L ni 2 1 +ni 30

306.

年齢の影響の調整 2 )層別 avF 免 l 1 F 十 F 十 10 + L g b F十l 十I nhvquouou nU2uAUm 川 VEt‑Bnucu n v n u m 川 ﹃ l' RS ・' G i l augbouAU =σbnv a斗 F 十 lnsn l ・ is‑‑a ノ¥ F U 2 u / f f ︐e = g ro ‑ m g p EEE UInuqu datadata;setd a t a ; i f ageく= 39 then a g e c = l ; i f40く=ageく=44then agec=2; then a g e c = 3 ; 3 1 年齢の影響の調整 2 )層別 年齢層 薬剤 P 薬剤 A 差 ( N ) 9 5 . 0 ( 1) 0 8 . 0 4 0代 前 1 ( 6 ) 1 3 . 3 40代 後 1 ( 3 ) 1 0 8 . 3 併合 ( 1 0 ) 3 0代 重 みW ( N ) 9 3 . 6 ( 5 ) 9 9 . 7 5 ( 4 ) 1 0 5 ( 1) 9 7 . 2 ( 1 0 ) ‑ 3 1 6・ ‑ 1 . 4 一 1 ・ 一 5 0 . 8 3 3 一二 1 + 5 ‑ 8 . 2 5 一 6 ・ 一4 一=2 . 4 6+4 ‑ 8 . 3 一 3 一 ・ ! ̲=0 . 7 5 3 + 1 ‑ 6 . 9 5 p=O.069 32

307.

年齢の影響の調整 3 )共分散分析 薬剤 P 生データ 平均 年 齢 39 41 42 43 43 44 45 46 47 49 43.9 血圧 95 99 106 111 115 116 101 117 104 119 108.3 修正血圧 1 0 0 . 3 1 0 0 . 91 0 6 . 21 0 9 . 51 1 3 . 51 1 2 . 89 6 . 01 1 0.4 9 5 . 71 0 7 . 3 105.2 生データ 薬剤A 平均 年 齢 36 37 38 39 39 40 41 42 44 47 40.3 血圧 88 94 96 92 98 89 103 97 110 105 97.2 修正血圧 9 8. 41 0 2 . 7 1 0 3 . 09 7 . 3 1 0 3 . 3 9 2 . 61 0 4 . 99 7 . 2 血圧 =a+bX年齢+誤差 1 0 0 . 3 b = 1 . 7 年齢を平均 4 2 . 1歳に調整 修正平均の差 1 0 5 . 2 ‑ 1 0 0 . 3 = 4 . 9( p = 0 . 1 1 9 2 ) 33 年齢の影響の調整 3 )共分散分析 血圧 2 U E ‑ L 1 7×年齢│ 1 J O ] 1 0 0 1 。 。。 〉 十 /ノf 。 。 。 A ←?寸← 36 37 38 39 40 41 42 43 44 45 46 ~~ 4? 。 σ α g e 年齢 1 2 薬剤 P 薬剤A 000 3 1 7 ー ・

308.

年齢の影響の調整 3 )共分散分析 proc glm; class g ; model bp=age g ; Ismeans gjpdiff tdiff; 3 5 調整しない平均値の差と分散と L ( C o n f i d e n c eL i m i t ) 信頼区間 C μ l二 町 μ2二五 Y :血 圧 八 ー 一 一 八 一 一 一 1 μ2μ1=~-~、 八 八 庁 2 庁 2 ,Y V[μ2μ1]=‑=‑ ー + ι ‑ n2 八 八 n1 I2 . I ' T ' 2 . I ' T ' CL=μ2μ1+t D F' ¥I 二一+ニー n2 n1 Z:年齢 3 6 ‑ 3 1 8・

309.

調整前の平均値の差 μ2‑μ1=ζ 一 斉 =97.2‑108.3= ‑11 .1 ^ ^ σ 2 σ 2 60.65 60.65 V[μ2 ‑μr]=一一+一一二一一一一+一一一一 ~ n n 10 10 L ‑ • r 2 一向 一向 σ 2+ ︿ 一 + μ ︿ん L C 一 一 σ 2 = 12.13= 3.482= SE[μ2一μr]2 =‑11 .1士 2.101 3.48=‑18.42 ‑3.78 ・ ラ p = 0.0051 37 共分散分析の 1役 割 血圧と年齢 が高い IL ‑vvhi y血 圧 / 血圧と年齢 A群 平均 z年齢 ‑ 3 1 9 ‑ が低い 4 3 . 9 38

310.

共分散分析のモデル y =μ1+β 'z+& y =μ2+β .z+ε y μ1 β 汁項き μ2 0 z 39 共分散分析のモデル 九=μi+βzu+5u 私事 i :群 , j:個体 三フ Y:反応変数, z :共変量 σ2) 5u:N(O, 独立に等分散の正規分布 40 ‑ 3 2 0 .

311.

最小二乗推定 ニ エ エ q‑μi‑β‑zu)2 SS 害=ヱヰ哨 dSS ‑μi‑s.Zij) 回 │ 8 つ?=‑Lq‑μi‑β .Zij)=U 七 …. 2 2 回 μi=ξ‑β.Zi 4 1 最小2乗法の模式図 。 y==β +β1Z Y 。 42 z ‑ 3 2 1 ‑

312.

共通の傾きの最小二乗推定 SS=エ エ (ζ‑μiβ .Zij))2 =エエ(為一死一 β.(Zij‑Zi))2 5 7 =江 ‑ 叶(丸一死一 … 一 一 ( Z i j ‑ = 0 β( Z i j ‑ Z i ) ) エエ ‑(zuL)(九‑Z)+エエ β・(Zij三 一i)2=O エエ (Zij‑Zi)(為 一 死 ) S̲,+S 一̲ β= エ エ (Zij‑~i.)2 +S z yl 今 zy.L SZZl 43 共通の傾きの最小二乗推定 三 S 曹三~+S 曹 ら I szyI+SZY2 . ‑z z iszzIzzis Szzl + Szz2 Szzl + S ^ I 一一そ‑β1十 V[ β1 ] 1 I 二 ^ β2 V[β2] 1 一 一 一 一 一 一 + V[β 1 ] V[β2] 1 Wi y1 = 一 一 一 つτ 一 一 V[β i ] . 3 2 2 ‑ ^ ^ w1β 1 +W 2 β2 W 1+ W 2

313.

調整後の平均値の差と分散 μl=町 一 β.Z l μ2=ζ‑β 'Z2 μ2μl=ζ-~-β . (Z2‑ Zl) 八 八 ( " ) 2月 J ‑ r T 2月ぷ・ ー ー ゥ 〈 V[μ2μ1]=一ーニ+ーーニ +(Z2‑Z1 ) ' : : V [β] n2 n1 4 5 調整前と調整後の比較 調整前 μ 2μl= r;-~ 竺 : + 竺 : VId2‑dl]= n2 調整後 n1 ι-dl=ξ-~~bd2-31)l σ ,. σ , . 1 ‑ ‑ . 一 一 │ 月 V[μ2μ1] ニ 」 三 一 + ‑ ‑ ‑ ‑ . : : 三 一+ I ( Z 2‑Zl)'::V[β]I n2 n1 ‑ 3 2 3 ‑ 46

314.

調整前と調整後の比較 1 )Z2 =Zlで、あれば調整前後の平均値の差は 等しくなる. 無作為化で偏りの除去が期待できる. 2 ) zが重要な共変量であればo2〉 Cadj2 Z2 =Zl であれば調整後の平均値の差の方 が分散は小さくなる. 偏りがなくても共分散分析により,精度, 検出力が向上. 47 調整前と調整後の分散 b 込 二二軍E 主主脊票当圭工E 主見舌 L委~ (p=O.8) ~号発[Q)妻女= 5.0001 Q l y 4 ー ' ー ‑二ー‑ーι ー ー 一 一 一 σ 2 ‑ ‑‑ 1 11 X ‑1 ‑4 ‑4 ' ‑ ' 一 一 ' ‑ ' ーー ι. ‑1 11 1 「 ← . ' ‑ ' . 4 48 司 324‑

315.

調 整 前 分 散 分 析( t検定)の結果 Source Model 6 1 6 . 0 5 0 0 0 0 E r r o r 1 0 91 . 700000 C o r r e c t e dTo t a l 1 7 0 7 . 7 5 0 0 0 0 g 1bpLSMEAN 195%C o n f i d e n c eL im i t s 11 1 0 8 . 3 0 0 0 0 0 1 1 0 3 . 1 2 6 0 1 3 1113. 473987 2 19 7 . 2 0 0 0 0 0 9 2 . 0 2 6 0 1 3 最 小 2乗平均 D i f f e r e n c eBetween195%C o n f i d e n c eL im i t sf o rLSMean(i ) ‑ Means 1LSMean( j ) 1 8. 417123 49 調整後共分散分析の結果 Source fSquares DF Sumo MeanSquare FValue Pr>F Model 2 5 6 7 . 3 6 0 4 4 7 1 6 . 8 3 E r r o r 1 7 5 7 3 . 0 2 9 1 0 6 C o r r e c t e dTo t a l 1 9 1 7 0 7 . 7 5 0 0 0 0 1 1 3 4 . 7 2 0 8 9 4 E1bpLSM日 N 195%C州 den札 01 11105.235978 11 .02附 , . 、 i m i t s 0 9. 11 445515 1 9 6 . 0 5 4 4 8 5 1104. 473560 く. 0 0 0 1 2 日 叫 最 小 2乗平均 σ2=60.65 LeastSquar 芭 5M eans干o rE f f e c tg I D i f f e r e n c eBetweenI 95%C o n f i d e n c eL im i t sf o rLSMean( i ) 一LSMean( j ) Means 4 . 9 7 1 9 5 5 . 421177 1 ‑325・ 1 1 . 3 6 5 0 8 8 5 0

316.

調整後の平均値の差 β =1 . 7, Z l= 43.9, Z2=40.3 μ2μ1=Y2-~- β・ (Z2 ‑ Zl) =‑11.1‑1.7(40.3‑43.9)=‑5.0 庁 庁 ‑ V[μ2μ1]二」生一+‑a土 +(Z2‑ Zl)2V[β] n2 n1 33.72 33.72 , • ̲ ̲ • ̲ ‑, ' " ) ̲ ‑‑ ~ =一一一一+一一一一+(40.3‑43.9)2V[β] 10 10 =9.18=3.032 5 1 調整前と調整後の比較 調整前 μ2‑μ1‑ζ 一 斉 =97.2‑108.3=‑11.1 CL=‑11 .1+2.101・3.48=‑18.42,‑3.78 p =0.0051 三 工 調整後 μ2‑μ1=‑5.0 CL=‑5.0+2.110・3.03=‑11 .$7, 1 .42 ト 唱 p =0.1192 ‑ ‑ " . . o ‑326・ 52

317.

傾きの異なるモデル Y 「μ iキs i・ Z i jキ ε 甘 j :群 , j:個体 士ホ旦 Y:反応変数, z:‑ノ、タζ~Æ主 & i j : N ( Oσ2) ラ 53 最小二乗推定 エ q‑μ 2 i‑ si.Zi j)) ss= dSS ~ ゴ十二ーとJq‑A‑m‑zu))=O .~. . ・ . I μi=冥‑si.Zi 54 ‑327・

318.

最小二乗推定 ss=L L (1 ' ; j ‑μ iーかろ ) ) 2 =L L ( 1 ' ; j ‑1 ' ;一 久 ・( Z i j‑Z i) ) 2 号手‑ ( Z i j‑Z i ) (九‑K‑β ( Z i j ‑ Z i ) ) = O … 一 一 一 三i ) ( 九‑1';)+L β・( Z i j‑ Z i ) 2= 0 L‑ ( Z i j一 L(Zij‑Zi)(九‑1 ' ; ) ^ βi=j エ ( Z i j‑Z i ) 2 S z y i S z z i 5 5 傾きの分散 エ Zi)(号-~) エ βi= エ ( Z i j‑Zi)(~) ( Z i j‑ L(Zij‑Zi)2 ( Z i j‑Z i ) 2 ^ L(Zij‑Zi)2σ2 ( ェ ; ,i ' アー V [ s i ]=~曹、フ=て「 ) 2 ( Z i j‑Zi)2 σ S z z i I L(Z[j‑ Zi)2 I 5 6 ‑ 3 2 8 ‑

319.

P 1 2 0 1 1 0 目 。 9 0 8 0 3 63 73 83 94 04 14 24 34 44 54 64 74 84 9 a g e g ̲ , . . 1‑2 共分散分析 (ANCOVA) 調整後の 平均値の差 調整前 〉喝 】 n 也 < : > d 〕 n 也 ~ aT C on.t̲rol G r o u p . ‑ l ¥ ; l ̲ X C 1 ¥ " lX ̲T Prctcst (X) 58 ‑ 3 2 9 ‑

320.
[beta]
調整によって平均値の差がなくなる例

調整前の
平均値の差

Cont:‑ol Gro叩

,、.....c

I

>
‑

.
.
n
"

ザ
】

o
'
"

E・IVEY
Trcattt1cnt G r
‑
oup

T

ac
Prctcst (X)

5
9

共分散分析の仮定
1)
2つの群で共に,年齢の血圧との聞には直線
的な関係がある.
2)2つの群間で,傾きが等しい.

群×血圧の交互作用が存在しない.
3
)誤差の分布に等分散性と正規性

};==μi+β‑zu+Eu, Eu:N(O,
σ2)

60

‑
3
3
0
‑

321.

傾きが異なる例 Control c . : iroup 1 ¥ ‑ 1 ・ 、.c ー 司 . ‑ " ' ι .r 、 b π U 】 o ly "'c T[" C'~掴 tmcnt Group "T Prctc: st (X) 6 1 共分散分析の適用例 1)経時測定データ解析における投与前値を 共変量とした共分散分析 2)臓器重量の解析における体重を 共変量とした共分散分析 62 ‑ 3 3 1・

322.

経時データの共分散分析 投与前値Y 1の扱い 1)投与後の値 ( p o s t :Y 2 )と同様に単純に モデルに含めて解析. 2 )投与後の値だけで解析. 3)投与前値の差をとって解析. 4)投与前値との比をとって解析. 5)独立変数(共変量)としてモデルに含めて 解析.ANCOVA). 6 3 投与後値,差,共分散分析の比較 統計量 分散 p o s t ( Y 2 ) Y ‑ Y1) 差( 2 02 2+02̲2pσ2 母相関係数p p=O p=0.5 p=1.0 p o s t ( Y ) 2 σ2 。 。 。 2̲p2σ2 ) 。 ANCOVA(Y2‑sY1 σ2 差( Y 2一Y1) 2σ2 σ2 ANCOVA σ2 0.75σ2 ' 3 3 2 ‑ σ2 64

323.

投与後差,共分散分析の比較 分散 l Post(Y2) ANCOVA 。 1 0 . 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 10 r 母相関係数 P 6 5 共分散分析の利点 ANCOVA(Y2‑sY1 ) 1)p=O→ s=O p o s t ( Y 2 )と等価 2)p. . 1→ 1=0 差 (Y2‑ Y1)と等価 3 ) 0 < p < 1 精度が高い ( Y > 0 . 5以上ないと 1)はp 2‑ Y より精度が悪い p o s t ( Y 2) ‑333‑ 6 6

324.

ラットの体重(単位 :g)と肝臓重量(単位:g) 用量 (mg ) 項目 日体重 肝臓 3 3 6 . 2 3 6 0 . 4 3 2 9 . 6 3 4 0 . 7 3 5 8 . 2 3 2 5 . 5 1 . 0 5 1 0 . 3 2 1 1 . 4 7 1 0 . 5 4 1 0 . 4 6 1 4 6 . 4 3 7 3 . 5 3 3 6 1 1 . 2 1 9 . 7 4 11 . 18 1 1 . 7 2 1 1 1 . 1 2 1 体重 3 6 5 . 4 3 6 0 . 5 3 3 6 . 1 319 321 .1 351 . 4 肝臓 1 2 . 3 9 1 0 . 7 2 1 0 . 6 1 9 . 7 3 体重 肝臓 1 0 体重 肝臓 9 . 0 9 3 5 1 4 0 . 6 341 . 2 343 3 6 9 . 8 3 1 0 . 9 1 0 . 9 9 1 1 . 3 5 9 . 9 6 1 0 . 2 8 1 6 . 9 3 1 0 . 7 3 3 2 . 5 3 2 2 . 7 3 0 7 . 7 3 1 0 . 9 2 9 9 . 4 3 1 8 . 9 301 .8 3 1 2 . 0 6 11 . 79 2 6 1 1 0 . 8 1 0 . 9 3 .8 8 11 . 28 11 . 12 9 . 9 8 11 . 07 11 288 2 0 3 . 9 2 8 5 . 3 2 6 9 . 2 8 7 . 9 3 266 2 3 9 . 7 3 1 9 . 8 7 9 . 2 2 .6 8 1 2 . 8 6 1 2 . 6 2L一一一1 . 15 11 . 12 1 0 . 4 4 11 一 1 一5 8 11 11 .35 9 . 9 7 1 3 . 5 2 67 共分散分析の結果 肝臓 調整前 体重 群 。 平均 so 平均 3 4 8 . 3 1 5 . 4 3 4 4 . 8 1 7 . 2 33 1 3 . 5 林 1 0 . 4 8 0 . 0 林 1 02 2 2 . 6 1 0 . 8 8 1 0 . 6 1 1 . 2 1 1 1 . 6 3 肝臓 調整後│ so 0 . 6 0 . 9 2 0 . 6 4 1 . 1 平均 9 . 7 1 9 . 5 8 1 1 . 5 8 1 3 . 4 8 68 ‑334・

325.

l : LIVER 肝臓重量 1 2 1 ' 出 回 l 9~ 220 240 260 280 300 320 340 360 380 B W 体重 d o s e ‑. 0 . . . . . . . 1 開 3‑' 旧 69 調整前後の解析プログラム proc glm data=ow: class dose; model Iiver=dose/ss2; Ismeans dose/tdiff pdiff a d j二 dunnett; r u n ; proc glm data=ow: class dose; modeI Ii ver二 bwdose/ss2; Ismeans dose/tdiff pdiff adj=dunnett; 70 r u n ; ‑ 3 3 5 ‑

326.

調整前の解析結果 MeanSquare 1 .96020174 dose UVERLSMEAN HO:LSMean=Control 。 tValue Pr>I t l 1 0 . 5 9 9 0 0 0 0 ‑ 0 . 7 5 0 . 7 9 9 0 3 1 1 . 2 1 2 2 2 2 2 0 . 8 5 0 . 7 3 0 7 1 0 .6 290000 11 1 .9 8 0 . 1 3 7 1 1 0 . 8 8 1 0 0 0 0 7 1 調整後の解析結果 Source I DFI Type1SS I MeanSquare I FValue BW 1 1 120.08176532 120.08176532 1139.39 dose I3 I25.89666101 I8.63222034 I59.92 dose UVERLSMEAN HO:LSMean=Control 。 tValue Pr>I t l 9 . 5 8 4 1 5 3 8 ‑ 0 . 7 6 0 . 7 7 6 1 3 .5 8 1 2 2 0 1 11 8 . 5 8 く. 0 0 0 1 1 0 4786359 1 3. 1 2 . 2 7 く. 0 0 0 1 9 . 7 1 4 1 1 2 2 司 336‑ 72

327.

共変量選択方針 薬剤を投与する前に測定 1 )反応変数に関連(予後因子) 2 )群間で偏り(交絡可能性因子) 3 )割り付け調整因子 4)施設・国 5 )投与前値 薬剤を投与後に測定される結果系変数で調整 する場合は結果の解釈は困難 73 ‑337・

328.

SASユ ー ザ ー 会 世 話 人 会 代表世話人 世話人 (氏名 50 音順) 大橋靖雄 東京大学 岩崎学 成媛大学 小野潔 株式会社三菱東京 UFJ 銀行 北田祐幸 総務省政策統括官(統計基準担当)付 堺伸也 イーピーエス株式会社 周防節雄 兵庫県立大学 菅波秀規 興和株式会社 八木章 近畿大学 山之内直樹 第一三共株式会社 SASユーザー総会事務局 SASI n s t i t u t eJ a p a n株式会社内 干1 0 6 ‑ 6 1 1 1 東京都港区六本木6 ‑ 1 0・1六本木ヒルズ森タワー 1 1階 T E L :0 3 ‑ 6 4 3 4 ‑ 3 7 0 2 F A ) < :0 3 ‑ 6 4 3 4・3 7 0 1 E ‑ m a i l :j p n s a s w g @ s a s . c o m ・‑ 豆ー‑ザー総会 l 阻E 論文集 2 0 0 9年7月2 1日初版第1 刷発行 発行: S A Sユーザー会 SASI n s t i t u t eJ a p a n株式会社